!Mitä paremman luokitusjärjestelmän pitäisi ottaa huomioon

* Pelaajat taskuuntuvat kahdella tavalla: maan sisäisesti, ja maiden välisesti
** Maan sisäisesti taskuuntuminen lienee vähäisempää, ja koskee enemmän alhaisia luokituksia (jotka kehittyvät nopeasti)
** Maiden välinen taskuuntuminen on pääasiallisesti tärkeämpi tekijä (? - tarkistettava)
* Toisin kuten shakissa, luokitusten tulee myös antaa ns. "oikeat tasoitukset"
* Toiset pelaajat kehittyvät hyvinkin nopeasti, toiset hitaammin
* Osa pelaajista käy turnauksissa harvemmin, toiset useammin.
* Internet-pelaaminen vähentänee kerholuokittajien tuntumaa pelaajien todelliseen tasoon (?)
* Järjestelmän toimivuudesta ei tarvitse tapella jokaikinen päivä eikä siitä keskustelu aloita sähköistä sodankäyntiä.
* Jos pelaaja on pelaamatta, hänen luokituksensa ei saisi muuttua.
* Järjestelmässä kaikilla pelaajilla tulisi olla symmetrinen asema toisiinsa nähden ja tasapuolinen mahdollisuus sijoituksiin ei-pelillisistä ominaisuuksista riippumatta.
* Järjestelmän tuottaman järjestyksen tulisi lähentyä kuvitteellisen kaikkien pelaajien täyden sarjan tilastollisesti tuottamaa järjestystä.
* Järjestelmän pitäisi osata arvioida antamiensa luokitusten luotettavuutta.
* Pelaajista voidaan tarvita ainakin kahdenlaista informaatiota: absoluuttinen tasoero (tasoituksia tms. varten) ja keskinäinen järjestys. Nämä eivät ole keskenään samassa avaruudessa.
* Luokitusten tulisi toimia siten, että ylemmäksi sijoittunella on suurempi todennäköisyys voittaa keskinäinen peli kuin alemmalla.
* Järjestelmän pitäisi jollakin järkevällä tavalla keskiarvoistaa sen yli, etteivät pelaajien pelitaidot ole keskenään verrattavissa yksiulotteisesti (A > B, B > C mutta C > A -tapaus)
* Voitettujen pelien tulisi nostaa luokitusta.
* Hävittyjen pelien tulisi alentaa luokitusta.
Sopii jatkaa.

----

Ai niin, unohdin sanoa: nyt kerätään vaatimuksia parannetulle järjestelmälle: mitä asioita pitäisi ottaa huomioon, eikä vielä ensimmäistäkään parannusehdotusta.  Vasta, kun meillä on olemassa lista, johon kenelläkään ei ole lisättävää, otetaan konkreettisia ehdotuksia vastaan.

Homma on syytä tehdä kunnolla, tai sitten ei ollenkaan.  Hötkyilemisen aika on ohi.

-- [Janne Jalkanen]

Anteeksi pessimismini, mutta en usko että täydellistä järjestelmää on edes teoriassa mahdollista tehdä. Noita vaatimuksia voisi esittämisen lisäksi priorisoida ja miettiä mistä voidaan tinkiä ja mistä ei voida.

-- [Antti Virtanen|lokori]

Kuka tässä nyt on mitään täydellistä tekemässäkään?  Kunhan nyt ensin katsotaan, riittääkö tässä porukassa edes kykyä listata ne asiat, jotka pitäisi ottaa huomioon.  Priorisointi ja tarkemin tutkiskelu myöhemmin.

-- [Janne Jalkanen]

Minulle jäi epäselväksi että mitä tarkoitetaan mahdollisuudella pärjätä? Pärjätä peleissä toisiaan vastaan, pärjätä oikeilla tasoituksilla? luokituksen pitää olla kohdallaan maantieteellisistä eroista huolimatta? Pelaajan pitäisi pärjätä turnauksissa? Minulle ei oikein auennut tämä kohta. 

-- [Mikael|Falla]

Tuo tasoituskivien päättely luokituksesta sisältää mielestäni sellaisen ongelman, että
tasoituskivet eivät käyttäydy täysin lineaarisesti vaan niiden arvo kasvaa kivien lisääntyessä (oma havaintoni tasoituspeleistä ja lisäksi kokeiluun perustuva intuitio, että 17 tasoituskivellä on hyvin lähellä tappaa kaikki valkoisen kivet optimaalisella pelillä, mutta (361-17)/17)=20 >> 2*6,5). On myös vaikea sanoa, onko 4 ja 5 tasoituskiven välillä yhtäsuuri ero kuin esim. 5 ja 6 kiven. On myös muistettava, että yhden kiven tasoitus vastaa oikeasti vain puolen kiven tasoitusta, kahden kiven tasoitus 1 1/2 kiven tasoitusta jne.

-- Kari

Vaatimukset ovat keskenään sen verran ristiriitaiset, että jonkinlainen kompromissi täytyy tehdä. Mielestäni pelaajien asettaminen järjestykseen on tärkeintä luokitusten yläpäässä. Tein ratkaisuehdotuksen tämän ajatuksen pohjalta. Siirsin sen sivulle [Luokitusten paranteluehdotuksia], koska se ei tälle sivulle kuulunut.

[Antti Tarvainen]

"Luokitusten tulisi toimia siten, että ylemmäksi sijoittunella on suurempi todennäköisyys voittaa keskinäinen peli kuin alemmalla." ei voi toimia yleisesti juurikin noiden silmukoiden takia.

-- Kari

Kommentoin kommenttia sivulla [LuokitustenParanteluehdotuksia]: "Reiluudella ei ole mitään tekemistä oikeellisuuden tai matemaattisen luotettavuuden/uskottavuuden kanssa. Pikemminkin päinvastoin, matemaattinen malli on pahimmillaan erityisen epäreilu, koska se ei voi ottaa huomioon mitään muuta kuin määrämuotoisen datan. Sen sijaan se sitten on oikeellisempi ja sen uskottavuus on tutkittavissa ja välillä jopa ymmärrettävissä." 

Olen yhtä mieltä siitä, että reiluus ja matemaattinen luotettavuus/uskottavuus ovat kaksi erillistä ulottuvuutta, jotka eivät ole toistensa kanssa sinänsä ristiriidassa eivätkä sopusoinnussa. Reiluuden ytimessä mielestäni on, että kenenkään mahdollisuudet (luokitus, joka esimerkiksi määrää McMahon-ryhmän) missään turnauksessa eivät riipu ei-pelillisistä ominaisuuksista 1. kaikki kilpailevat niistä samoilla ehdoilla. On esimerkiksi teoriassa täysin mahdollista, että luokittaminen hoidetaan täysin ihmisvoimin ja silti saavutetaan reiluuden aste, johon kenelläkään ei ole mitään huomauttamista. Ongelma on vain siinä, että se vaatisi huomattavan paljon nykyistä enemmän ihmisresursseja ja luokittajilta täydellistä intressittömyyttä luokittamisasioissa. Mielestäni tilanne, jossa pelaaja esimerkiksi on kehittynyt nopeasti lyhyessä ajassa ilman, että se näkyy vielä määrämuotoisessa datassa luokittamisjärjestelmän näkökulmasta tarpeeksi selvästi ja jää siten ilman voittamistodennäköisyyksien kannalta oikeutettua paikkaansa turnauksessa, ei ole yllä antamani reiluuden määritelmän kannalta kovinkaan hyvä esimerkki epäreiluudesta, koska sellaisessa tilanteessa ao. pelaajaa kohdeltaisiin samoilla ehdoilla kuin muitakin. Sen sijaan tuollainen tilanne olisi tapaus, jossa oikeellisuudesta (ainakin joidenkin ihmisten, mahdollisesti useimpien ihmisten subjektiivisten mielipiteiden mukaan) tingittäisiin reiluuden hyväksi.

Käytännössä kaikki luokitusmenetelmät sisältävät jonkinlaisen trade-offin reiluuden ja oikeellisuuden välillä. Paras on varmaan kaikkien mielestä sellainen, joka on sekä täysin reilu että täysin oikeellinen. Käytännössä molemmista on pakko tinkiä jonkin verran. Mielipide-eroja on siitä, kumpaa painotetaan ja kuinka paljon.

(Täsmennys: tarkoitan "ei-pelillisillä ominaisuuksilla" esimerkiksi sitä, kuinka paljon pelaaja on tekemisissä hänen luokituksistaan päättävien kanssa, millä on merkitystä mm. siihen kuinka täsmällistä ja ajankohtaista informaatiota näillä on hänen pelikunnostaan. Koska ihmiset ovat inhimillisiä, joskus myös luokittajan ja luokitettavan henkilökohtaisilla väleillä voi olla vaikutusta luokittamispäätösten taustalla oleviin intuitiivisiin käsityksiin (olen pahoillani, että tuo oli sanottava, en viittaa keneenkään henkilökohtaisesti, esitys vain ei olisi ollut riittävä ilman tuota huomautusta). Lisäksi, jos luokitusta käytetään moniin eri tarkoituksiin, joiden vaatimukset ovat osittain ristiriitaiset, niiden tarkkuus ja reiluus kärsivät. Mielestäni kuitenkaan se, että turnausvastustajat ja heidän kunkihetkinen pelikuntonsa sekä siten luokittamiseen käytetty aineisto ovat jossain rajoissa sattumanvaraisia, ei kuulu ei-pelillisiin tekijöihin. Tuo sattumanvaraisuus on yleisesti käytettävien turnaussysteemien ominaisuus eikä ole ristiriidassa reiluuden kanssa, koska siitä on haittaa pitkällä aikälillä pelaajille melko tasaisesti ja on erittäin vaikeasti ennustettavissa ja hyväksikäytettävissä.)

-- Markku, 26.4.

Allekirjoitan Markun kommentin reiluudesta täysin. Henkilökohtaisesti olen ollut näissä luokituskeskusteluissa
mukana siitä syystä, että mielestäni reiluutta tai tunnetta reiluudesta järjestelmässä tulisi lisätä ja siksi ottaa numeerinen järjestelmä käyttöön.

-- Kari

Seuraavassa "vahvuusluku" tarkoittaa minkä hyvänsä tarkasteltavan luokitusjärjestelmän
pelaajalle antamaa arvoa. Oletan, että "luokitusjärjestelmä" on estimointifunktio, joka antaa estimaatin "vahvuudelle" annetun aineiston perusteella.

Ehdotan, että tästä eteenpäin teoreettinen käsite ''reiluus'' määritellään seuraavasti: Järjestelmä on ''reilu'', jos kahden pelaajan täsmälleen samanlainen turnausmenestys johtaa täsmälleen samaan vahvuuslukuun. \\
Tämän reiluuden määritelmän ongelma on se, että reiluuden toteeamiseksi pitäisi saada täsmälleen identtiset vastustajat, mikä tapahtuu harvoin. Toteamisen sijaan voidaan kuitenkin tehdä tilastollisia testejä siitä, kuinka suurella todennäköisyydellä reiluushypoteesi on väärä. 

Voidaan esimerkiksi todeta, että jos kahdella pelaajalla on samoja pelaajia (a1, a2, .. ,an) vastaan samanlainen voittorivi, niin kasvattamalla n:n arvoa, saadaan yhä pienempi todennäköisyys sille, että pelaajien vahvuusluvut voisivat poiketa toisistaan enempää kuin jokin sopivasti valittu vakio, vaikkapa vahvuuslukujen keskihajonnan sopivasti valittu monikerta.

Jotta aineistosta voisi olettaa jotain, täytyy olettaa pelituloksille jonkinlainen jakauma. Tämän jakauman ominaisuuksien selvittämiseksi mielestäni on dataa enemmän kuin tarpeeksi: EGF:n tulostilastot. En tiedä kuinka paljon on syytä olettaa, että eri maiden välillä on eroja pelitulosten jakaumassa. McMahon + perinteiset luokitukset on herkkä luokitusjakauman ominaisuuksille. Tätäkin voidaan kuitenkin estimoida. Ja haluttaessa voidaan ottaa jokin maa mittapuuksi. 

Nämä asiat eivät ole vaikeita, ainoastaan työläitä. En ole vapaaehtoinen tekemään tuollaista analyysiä. --[H|Henri Hansen]

"Se, että kahden pelaajan täsmälleen samanlainen turnausmenestys johtaa täsmälleen samaan vahvuuslukuun", on kevyempi
ehto reiluudelle kuin itse tarkoitin. Itse hain jotain sen suuntaista, että kukin pelaaja voi ennalta tietää kuinka pelitulokset tulevat vaikuttamaan luokitukseensa ja järjestelmä ei sisällä piilokomponentteja, jotka voivat suosia pelaajia eri tavoilla, esim. korotusperuste päätetään vasta tulosten jälkeen jne.. On myös huomattava, että järjestelmän varsinainen reiluus ja pelaajille syntyvä reiluuden tunne ovat kaksi eri asiaa, joskin riippuvaisia. Itselleni on tärkeää myös reiluuden tunne, siitä vaatimus automaattiselle luokittamiselle.

-- Kari

Mitä tarkoitat "varsinaisella reiluudella"? Tarkoitatko sillä kenties oikeellisuutta, siis luokitusten tarkkuutta eli kykyä ennustaa tulevia tuloksia oikein eli "matemaattista tarkkuutta/oikeellisuutta", josta Olli puhui?

-- Markku

"Varsinaisella reiluudella" tarkoitan luokittamisen riippumattomuutta pelaajan henkilöllisyydestä. Kyllähän esim.
luokituskomiteakin voisi toimia täysin reilusti, mutta sitä on vain mahdoton todistaa, niin kauan kuin korotuskriteerit ovat jonkun pään sisällä, ts. reiluuden tunne voi olla alhainen reilussakin järjestelmässä.

-- Kari