Minusta kehitystyön lähtökohdaksi voisi aivan hyvin ottaa automaatin, joka korottaisi jokaisen pelaajan, jonka tasa-alkuturnaussuoritukset tietyllä luokituksella kuuluisivat vähintään parhaaseen 5 prosenttiin Antti Lehtisen aiemmin tässä keskustelussa julkaiseman algoritmin mukaan. Vastaavasti automaatti alentaisi jokaisen, jonka tasa- alkuturnaustulokset jollakin tietyllä luokituksella kuuluisivat enintään heikoimpaan 5 prosenttiin. Lisäehtona olisi, että maksimitodennäköisyysestimaatti uudelle luokitukselle (tulosten perusteella) olisi riittävän lähellä uutta luokitusta. 

Mainittakoon, että korotukseen oikeuttava tulos noilla rajoilla näyttäisi olevan varsin vaikeasti ansaittavissa verrattuna siihen, millaisilla ansioilla nykytilanteessa useimmiten de facto annetaan korotuksia. Tuota automaattia on jo kokeiltu jonkin verran. Taustaoletuksena ovat olleet voittamistodennäköisyydet luokitusten välillä EGF:n voittamistodennäköisyystilastosta, johon olen jo laittanut linkin aiemmin tässä keskustelussa. Lisäksi emme ole olettaneet mitään varjoluokituksia vaan laskeneet todennäköisyydet virallisten luokitusten mukaan. (Jos laskenta hajoaa luokituskomitean mielestä tuohon viimeiseen kohtaan, kuulisin erittäin mielelläni kuinka monen suomalaisen pelaajan "päänahka-arvo" todella poikkeaa heidän virallisista luokituksistaan ja nimenomaan alaspäin. Pelkkä lukumäärä riittää vastaukseksi, henkilökohtainen erittely ei ole tarpeen. Lisäkysymys: kuinka monen päänahka-arvo arvioidaan korkeammaksi kuin heidän virallinen luokituksensa?)

En muuten näe, että GoR-systeemiä kannattaisi ottaa kovinkaan vakavamielisen tilastollisen tarkastelun kohteeksi. Ainakin Suomen osalta GoR on pahasti korruptoitunut, koska suomalaiset luokittajat ovat viimeiset pari-kolme vuotta tehneet voitavansa Suomen GoR-pistepotin maksimoimiseksi sekä antamalla kahden pykälän korotuksia pelaajan pisteiden resetoimiseksi että ilmoittamalla joissakin tapauksissa pelaajan luokituksen turnaustuloksissa väärin systeemin ylläpitäjille. Olen itsekin antanut muutamissa tapauksissa tuplakorotuksen kahden erillisen yhden luokan korotuksen asemesta, jotta Suomen pistepottiin saataisiin lisää pisteitä. Nykyisellään ei ole syytä uskoa GoR:n antavan kuin hyvin karkean arvion pelaajan vahvuudesta, koska resettikorotuksessa tms. siunaantuvien pisteiden osuminen kohdalle on paljolti pelkkää tuuria.)

Mitä mieltä muuten olet Olli siitä, että korotukset pitäisi perustella julkisesti? 
Mutulla tuo ehdottamani systeemi toimisi edelleenkin valtaosasta korotustapauksia. 

-- [Markku Jantunen], 11.4. 2003

Mielestäni on melko tervettä että ihmisten luokituksia voi myös alentaa, mikäli joku ei selvästi pysty pelaamaan luokituksensa mukaisella tasolla. Jos ajatellaan luokitukset "arvonimiksi" joita ei voi viedä pois niin sekin on ihan ok, mutta tällöin voisi ottaa käyttöön erillisen "vahvuusluvun" jolla turnauksissa arvioidaan pelaajan taidot ja joka voi muuttua myös alaspäin. Minusta on perin hassua että on olemassa luokitus, jonka mukaan paritetaan ja asetetaan tasoituskivet, mutta silti osa pelaajista arvioidaan eri vahvuiseksi korotuksia päätettäessä. 

Olli sanoi että korotuksia annetaan kun joku osoittaa pystyvänsä pelaamaan korotettavan tason mukaista peliä. Tarkoittaako tämä että jos joku on n. 1,1kyu tulosten perusteella niin hänet korotetaan 1 kyuksi vasta kun hän on 1kyu "oikeasti"? Näin ainakin itse ymmärrän tuon. En tiedä onko tämä hyvä vai huono asia, mutta ainakin tämä estää inflaatioautomaatin syntymisen. Toisaalta tästä voi seurata tilanne jossa henkilö pelaa lähes kiven verran paremmin kuin hänen luokituksensa on, jos henkilö on juuri rajalla. 

-- [Antti Virtanen|lokori], 12.4.2003 

Toi vahvuus 1,1 Kyu on aika teoreettinen. Ei vahvuuksia voi edes arvioida tuolla tarkuudella. Vaan pelaaja on 1 kyu kun hän on suurinpiirtein sillä tasolla - se, että onko auringontarkka vahvuus 0,9 vai 1,1 ei ole luokittajan tiedossa. 

Jollain tilastollisislla AGA/IGS/KGS/ELO/GOR systeemeillä saadaan tietysti desimaaliosien tarkuudella olevia vahvuuslukuja, mutta järjestelmissä oleva pohjakohina on kyllä yli 0,1 kiveä. Ainakin kehittyvät pelaajat aiheuttavat ympäristössään reilusti sitä suuremman kohinan. Lisäksi useimmilla systeemeillä tuntuu olevan deflatorisia taipumuksia. ELO systeemissä siitä on jo ihan tutkimustuloksia, jotka tämän deflatorisen vaikutuksen osoittavat. Ja deflaatio/inflaatio lisäävät myös järjestelmän kohinaa (ilmiö ei etene kaikilla samaa vauhtia)

Pelaajan vahvuus voi vaihdella usemman kiven vireystilan mukaan. Tietysti mitä korkeammista luokituksista on kyse niin sen tarkemmin voidaan arvioida, jos halutaan. 

[PetriP]

Hainkin tässä sitä että korotetaanko pelaaja kun hän tekee jonkin verran parempaa tulosta kuin hänen nykyisen luokituksensa perusteella pitäisi tehdä, vai pitääkö tuloksen olla sellainen, että pelaaja on uuden luokituksensa sisällä n. keskitasoa. Jos siis henkilö on vahva pelaaja (parhaassa viidenneksessä) nykyisen luokituksensa sisällä ja olisi korotettuna heikko pelaaja (heikoimmassa viidenneksessä) uudessa luokituksessaan, koretaanko? Onko tällainen kysymys edes mielekäs - ts. voidaanko sanoa että joku 1 kyu on 1kyuksi luokitettujen vahvimmassa viidenneksessä? 

Otin nyt tuon viidenneksen tuohon hatusta, mutta se ei ole oleellista. Miten hyvin pitää pärjätä tulosten perusteella uudella/nykyisellä luokituksella että voidaan korottaa? Tämä kysymys on mielestäni kiinnostava lähinnä siellä luokitusten yläpäässä (1kuy ja siitä ylöspäin) missä kehitystä ei  tapahdu kovin nopeasti (tai ollenkaan). 

Jos aina lähdetään siitä että pelaajan pitää olla uuden luokituksensa mukaisesti n. keskitasoa ko. luokituksen sisällä tämä on helposti deflatorinen järjestelmä. Parempi sekin kaiketi kuin inflatorinen järjestelmä. Heikoksi 1 daniksi ei ymmärrettävästi haluta korottaa, mielummin annetaan henkilön olla vahva 1kyu. 

Jos koko jutun voi kuitata sanomalla "luokituskomitean mutu" niin onhan sekin vastaus.

[Antti V|lokori]

Kuten Petri aiemmin mainitsikin, valitettavasti ei ole olemassa
sellaista matemaattista mallia, joka antaisi luotettavia
luokitusarvoja. Kaikkien niiden normaali hajonta on selvästi enemmän
kuin kolmasosa kivestä, joillain enemmänkin. Tämä siis sen lisäksi
että pelaajan taso voi vaihdella jopa joitakin kiviä, olosuhteista
riippuen.

Näin ollen matemaattista mallia ei ole käytössä; tyhjästä on paha
nyhjäistä. Ikävä kyllä, kukaan wikisijöistäkään ei ole sormeaan
heilauttanut siirtyäkseen omasta mutustaan matemaattisen analysoinnin,
teoretisoinnin ja mallintamisen suuntaan, joten on kovin vaikea uskoa
että mitään kunnon työkalua edes saataisi. Ilmeisesti tuo on niin iso
ja vaikea homma, ettei siihen vain pystytä.

Historiallisesti, Suomen luokitukset olivat aikoinaan selvästi
heikkoja Eurooppaan nähden, jonka seurauksena on annettu tapahtua
hienoista deflaatiota. Nykyään suomalainen luokitus ei enään
Euroopassa aiheuta tietäviä hymyjä ja hiljaista hekottelua, joten tätä
voi pitää onnistuneena.

Ikävä kyllä, koko Euroopan luokitus "kärsii" hitaasta deflaatiosta,
jonka voi arvioida johtuvan siitä, että Euroopan huippu on niin kovaa
tasoa. 5 danit eivät korottaudu 6 daneiksi ennen kuin pärjäävät
vanhoille, ja sama alempana. Tällä välin vanhatkin vahvistuvat pikku
hiljaa, hups. Tämän deflaation eräs ulkomainen, luotettu 6 dan on
arvioinut noin kiveksi kymmenessä vuodessa, vaikkakin siinä
(näkemykseni mukaan) tuli lyhytaikainen laskuvaihe kun joukko 6 daneja
korotettiin 7 daneiksi. Tämäkin sitten kompensoitui kerralla
Romanialaisten tullessa ulos kolostaan.

Mainittakoon tässä välissä, että 7 dan on perinteisesti ollut jotain
aivan poikkeuksellista; diplomin Nihon Ki-iniltä on saanut WAGC:n
voitosta ja suuresta amatöörimenestyksestä kotimaassa (en muista
tarkkaan, mutta olikosta se useampi voitto Japanin kansallisissa
huipputurnauksissa,) joten onkin ymmärrettävää että pelaajat jotka
eivät näissä pärjäisi, ovat epäröineet korotusta 7 daniin.

Nyt tuo poikkeuksellisuus onkin noussut 8 daniin, ja syynä aivan
ilmeisesti on, että 7 daneja tuntuu olevan pilvin pimein. Melkoinen
ero siihen, että aikoinaan 7 danin diplomin arvioitiin olevan
ammattilaistasolla 4 tai 5 danin arvoinen. Tästä huolimatta Eurooppa
ei ole inflatoitunut, ja syynä on epäilemättä ollut vahvimpien
pelaajien haluttomuus olla pilipalidaneja ulkomaalaisten silmissä.

Suomen luokituskomitean nimetty tehtävä on kuitenkin huolehtia siitä,
etteivät kansalliset luokitukset ajelehdi summamutikassa minne sattuu,
joten vertailukohdaksi on joka tapauksessa otettava Keski-Eurooppa.
Näin ollen deflaatiota on kontrolloitu tutkimalla huolellisesti
suomalaisten turnausmenestyksiä eurooppalaisissa turnauksissa,
erityisesti EGC:ssä. Tulokset ovat olleet varsin rohkaisevia: Suomi ei
ole viime EGC:n perusteella erityisen aliluokitettu, mutta ei millään
tavoin selvästi heikkokaan.

Pelaajien korotuksesta, se on aina riippuvainen tasosta jolta/jolle
korotetaan. Korkeamman tason korotusten kanssa ollaan aina oltu
tarkempia, alemmantasoiset kun eivät yleensä juuri Euroopassa liiku.
Itse asiassa melkoisen harvat ovat liikkuneet kotimaassakaan, ehkä
viime vuoteen saakka, joten on melkoisen kyseealaista että voiko
luokituskomitea paikallisten kerhotulosten perusteella ketään korottaa
ilman että homma tulisi hajoamaan.

Turnaustuloksista oppii kohtuullisen nopeasti näkemään kuka pärjäsi
hyvin muihin verrattuna. Vastustaja-analyysi (keitä vastaan pärjäsi ja
keille hävisi, mikä tasoitus/tasoero) antaa vahvempaa osviittaa siihen
että kuka on pelannut tasoansa paremmin. Turnaustulosanalyysi (miten
useammassa turnauksessa on käynyt) kertoo että oliko tämä sattumaa vai
systemaattista, ja että voiko nyt luotettavasti korottaa.

Ikävä kyllä, suomalaiset turnaukset ovat olleet liki käyttökelvotonta
luokitusmateriaalia ylemmille pelaajille, ja ylemmälle keskitasollekin
sen jälkeen kun vahvimpien pelaajien kiinnostus osallistumiseen
onnistuttiin liki tappamaan, mutta luokituskomitea on silti tehnyt
parhaansa.

Perinteisesti,

* dan-tason korotuksiin on Suomessa aina edellytetty turnausmeriitti, jolla pelaaja osoittaa sekä olevansa tasoa jolle korotetaan että saavuttaneensa henkisesti riittävän tason kestääkseen turnausten paineita. Tämä dan-tasosta riippumatta, mutta ylempien kanssa ollaan tarkempia kuin alempien.

* ylemmät kyut on korotettu kun huomataan tarve, ja todistusaineisto on riittävä. Tilaisuus on tyypillisesti ollut turnaus, ylempänä mainituista syistä. Todistusaineiston vertailukelpoisuus Euroopan tasoon on tärkeä, joten on turha urputtaa tässä esmes IGS-peleistä joiden vertailukelpoisuus mihinkään, edes itseensä, on heikolla pohjalla.

* alemmat kyut on delegoitu kerholuokittajille, mutta luokituskomitean jäsenet korottavat aina tarpeen tullen, antaen sitten palautetta kerholuokittajille ("*keles, hoitakaa homma paremmin.") Kaikki luokituskomitean, ohi kerholuokittajien tekemät korotukset tulisikin mieltää moitteeksi kerholuokittajille.

Yhtä kaikki, korotus perustuu arvioon siitä, että pärjäisikö uudella
tasolla vai ei, eikä siihen että onko vahvempi kuin nominaalitason
muut pelaajat. Jälkimmäinen sisältää inflaatioautomaatin kun kuitenkin
turnauksen osallistujat vaihtelevat rajusti, edellisen deflaatioriski
kontrolloidaan kansainvälisillä turnausmenestyksillä.

Korotustarvetta arvioitaessa katsotaan __kohdetason suhteen__ 

#menestystä heikompia vastaan (pitää voittaa selvä valtaosa,)
#menestystä samantasoisia (noin puolet) ja 
#menestystä vahvempia vastaan (ei saa hävitä aivan kaikkia.) 

Näistä, käyttäen siis sekä vastustaja- että turnausanalyysiä, arvioidaan että pärjäisikö pelaaja kohdetasolla.

Perusteluna deflaation riskin hyväksymiselle on Euroopan go-pelaajien
ja -instituutioiden asennoituminen; olla selvästi nominaalitasoa
heikompi pidetään paljon pahana kuin tilapäistä ongelmaa toiseen
suuntaan. Tämä taas perustuu siihen, että alentaminen on
japanilaisperustaisen ajattelumallin mukaan hyvin vaikeaa, kun taas
korotuksia voidaan kyllä antaa.

Näistä syistä kaikille pelaajille on vahvasti suositeltu käymistä
kansainvälisissä turnauksissa, etenkin niille jotka haluavat dan-tason
korotuksia. Kaikenlainen urputtaminen siitä, kuinka tämä on epäreilua
tai ettei se saisi mitään vaikuttaa, on aivan merkityksetöntä sen
rinnalla että vertailupiste on kuitenkin ulkomaat eikä kotimaa.
Kotimaasta saatu ylätason korotusmeriitti on kuitenkin aina
epäluotettavmpi, koska vertailupiste ulkomaihin tulee mutkan kautta
eikä suoraan.

Kaikki ylläoleva näkyy koko ajan luokituskomitean toiminnassa, nämä
ovat helppoja huomata jos vain malttaa tarkkailla asiaa.

Antti, vastasiko tämä kysymyksiisi?

-- DonOlli, 14.4.