| At line 265 added 33 lines |
|
| Poikkeamien neliösumma on kovin altis poikkeaville datapisteille |
| (outlierit,) joita on poikkeuksetta biologispohjaisessa aineistossa |
| joko vahemmän tai enemmän. Tässä joudun nojaamaan Helsingin Yliopiston |
| biometrian apulaisporofessorin lausuntoihin, joita meikäläisellä ei |
| tietenkään ole kirjallisena -- ellei sellaiseksi lasketa sitä |
| luentomonistetta, jota hänelle vuosikymmenen ajan taitoin. Pikemminkin |
| kuvittelisin jonkin maximum likelihood -mallin (ML) antavan |
| järkevähköjä tuloksia erilaisten luokitusten sovittamisesta |
| turnaustuloksiin, vaikka sekin olettaa jotain aineistosta |
| (muistaakseni log-normaaliutta, mutta eipä ole tuo moniste käsillä |
| juuri nyt.) |
|
| Olenpa jopa sitä mieltä, että tuon professorin näkemys siitä, että |
| aineiston ominaisuudet on tunnettava ennen kuin valitaan |
| analyysimenetelmä ja malli jota yritetään käyttää, on aivan |
| epäilemättä tällaisessa kriittistä. Jos aineiston ominaisuuksia ei |
| tunneta eikä ehkä edes haluta tutkia, mallin antama järjestys on |
| helposti uskottavuudeltaan liki sekoitetun korttipakan luokkaa. |
|
| Sinänsä, nyt kun kuvaan tuli mukaan vahvalla tunnelatauksella varattu |
| termi "reiluus," pesen välittömästi käteni keskustelusta. Reiluudella |
| ei ole mitään tekemistä oikeellisuuden tai matemaattisen |
| luotettavuuden/uskottavuuden kanssa. Pikemminkin päinvastoin, |
| matemaattinen malli on pahimmillaan erityisen epäreilu, koska se ei |
| voi ottaa huomioon mitään muuta kuin määrämuotoisen datan. Sen sijaan |
| se sitten on oikeellisempi ja sen uskottavuus on tutkittavissa ja |
| välillä jopa ymmärrettävissä. |
|
| Esitänpä siis jälleen pahoitteluni siitä että osallistuin keskusteuun, |
| ja yritän välttää sitä jatkossa. |
|
| -- DonOlli |