Jatkoa sivulta [Luokituskeskustelu IV].  Seuraava osa:  [Luokituskeskustelu VI].

----

Minusta kehitystyön lähtökohdaksi voisi aivan hyvin ottaa automaatin, joka korottaisi jokaisen pelaajan, jonka tasa-alkuturnaussuoritukset tietyllä luokituksella kuuluisivat vähintään parhaaseen 5 prosenttiin Antti Lehtisen aiemmin tässä keskustelussa julkaiseman algoritmin mukaan. Vastaavasti automaatti alentaisi jokaisen, jonka tasa- alkuturnaustulokset jollakin tietyllä luokituksella kuuluisivat enintään heikoimpaan 5 prosenttiin. Lisäehtona olisi, että maksimitodennäköisyysestimaatti uudelle luokitukselle (tulosten perusteella) olisi riittävän lähellä uutta luokitusta. 

Mainittakoon, että korotukseen oikeuttava tulos noilla rajoilla näyttäisi olevan varsin vaikeasti ansaittavissa verrattuna siihen, millaisilla ansioilla nykytilanteessa useimmiten de facto annetaan korotuksia. Tuota automaattia on jo kokeiltu jonkin verran. Taustaoletuksena ovat olleet voittamistodennäköisyydet luokitusten välillä EGF:n voittamistodennäköisyystilastosta, johon olen jo laittanut linkin aiemmin tässä keskustelussa. Lisäksi emme ole olettaneet mitään varjoluokituksia vaan laskeneet todennäköisyydet virallisten luokitusten mukaan. (Jos laskenta hajoaa luokituskomitean mielestä tuohon viimeiseen kohtaan, kuulisin erittäin mielelläni kuinka monen suomalaisen pelaajan "päänahka-arvo" todella poikkeaa heidän virallisista luokituksistaan ja nimenomaan alaspäin. Pelkkä lukumäärä riittää vastaukseksi, henkilökohtainen erittely ei ole tarpeen. Lisäkysymys: kuinka monen päänahka-arvo arvioidaan korkeammaksi kuin heidän virallinen luokituksensa?)

En muuten näe, että GoR-systeemiä kannattaisi ottaa kovinkaan vakavamielisen tilastollisen tarkastelun kohteeksi. Ainakin Suomen osalta GoR on pahasti korruptoitunut, koska suomalaiset luokittajat ovat viimeiset pari-kolme vuotta tehneet voitavansa Suomen GoR-pistepotin maksimoimiseksi sekä antamalla kahden pykälän korotuksia pelaajan pisteiden resetoimiseksi että ilmoittamalla joissakin tapauksissa pelaajan luokituksen turnaustuloksissa väärin systeemin ylläpitäjille. Olen itsekin antanut muutamissa tapauksissa tuplakorotuksen kahden erillisen yhden luokan korotuksen asemesta, jotta Suomen pistepottiin saataisiin lisää pisteitä. Nykyisellään ei ole syytä uskoa GoR:n antavan kuin hyvin karkean arvion pelaajan vahvuudesta, koska resettikorotuksessa tms. siunaantuvien pisteiden osuminen kohdalle on paljolti pelkkää tuuria.)

Mitä mieltä muuten olet Olli siitä, että korotukset pitäisi perustella julkisesti? 
Mutulla tuo ehdottamani systeemi toimisi edelleenkin valtaosasta korotustapauksia. 

-- [Markku Jantunen], 11.4. 2003

Mielestäni on melko tervettä että ihmisten luokituksia voi myös alentaa, mikäli joku ei selvästi pysty pelaamaan luokituksensa mukaisella tasolla. Jos ajatellaan luokitukset "arvonimiksi" joita ei voi viedä pois niin sekin on ihan ok, mutta tällöin voisi ottaa käyttöön erillisen "vahvuusluvun" jolla turnauksissa arvioidaan pelaajan taidot ja joka voi muuttua myös alaspäin. Minusta on perin hassua että on olemassa luokitus, jonka mukaan paritetaan ja asetetaan tasoituskivet, mutta silti osa pelaajista arvioidaan eri vahvuiseksi korotuksia päätettäessä. 

Olli sanoi että korotuksia annetaan kun joku osoittaa pystyvänsä pelaamaan korotettavan tason mukaista peliä. Tarkoittaako tämä että jos joku on n. 1,1kyu tulosten perusteella niin hänet korotetaan 1 kyuksi vasta kun hän on 1kyu "oikeasti"? Näin ainakin itse ymmärrän tuon. En tiedä onko tämä hyvä vai huono asia, mutta ainakin tämä estää inflaatioautomaatin syntymisen. Toisaalta tästä voi seurata tilanne jossa henkilö pelaa lähes kiven verran paremmin kuin hänen luokituksensa on, jos henkilö on juuri rajalla. 

-- [Antti Virtanen|lokori], 12.4.2003 

Toi vahvuus 1,1 Kyu on aika teoreettinen. Ei vahvuuksia voi edes arvioida tuolla tarkuudella. Vaan pelaaja on 1 kyu kun hän on suurinpiirtein sillä tasolla - se, että onko auringontarkka vahvuus 0,9 vai 1,1 ei ole luokittajan tiedossa. 

Jollain tilastollisislla AGA/IGS/KGS/ELO/GOR systeemeillä saadaan tietysti desimaaliosien tarkuudella olevia vahvuuslukuja, mutta järjestelmissä oleva pohjakohina on kyllä yli 0,1 kiveä. Ainakin kehittyvät pelaajat aiheuttavat ympäristössään reilusti sitä suuremman kohinan. Lisäksi useimmilla systeemeillä tuntuu olevan deflatorisia taipumuksia. ELO systeemissä siitä on jo ihan tutkimustuloksia, jotka tämän deflatorisen vaikutuksen osoittavat. Ja deflaatio/inflaatio lisäävät myös järjestelmän kohinaa (ilmiö ei etene kaikilla samaa vauhtia)

Pelaajan vahvuus voi vaihdella usemman kiven vireystilan mukaan. Tietysti mitä korkeammista luokituksista on kyse niin sen tarkemmin voidaan arvioida, jos halutaan. 

[PetriP]

Hainkin tässä sitä että korotetaanko pelaaja kun hän tekee jonkin verran parempaa tulosta kuin hänen nykyisen luokituksensa perusteella pitäisi tehdä, vai pitääkö tuloksen olla sellainen, että pelaaja on uuden luokituksensa sisällä n. keskitasoa. Jos siis henkilö on vahva pelaaja (parhaassa viidenneksessä) nykyisen luokituksensa sisällä ja olisi korotettuna heikko pelaaja (heikoimmassa viidenneksessä) uudessa luokituksessaan, koretaanko? Onko tällainen kysymys edes mielekäs - ts. voidaanko sanoa että joku 1 kyu on 1kyuksi luokitettujen vahvimmassa viidenneksessä? 

Otin nyt tuon viidenneksen tuohon hatusta, mutta se ei ole oleellista. Miten hyvin pitää pärjätä tulosten perusteella uudella/nykyisellä luokituksella että voidaan korottaa? Tämä kysymys on mielestäni kiinnostava lähinnä siellä luokitusten yläpäässä (1kuy ja siitä ylöspäin) missä kehitystä ei  tapahdu kovin nopeasti (tai ollenkaan). 

Jos aina lähdetään siitä että pelaajan pitää olla uuden luokituksensa mukaisesti n. keskitasoa ko. luokituksen sisällä tämä on helposti deflatorinen järjestelmä. Parempi sekin kaiketi kuin inflatorinen järjestelmä. Heikoksi 1 daniksi ei ymmärrettävästi haluta korottaa, mielummin annetaan henkilön olla vahva 1kyu. 

Jos koko jutun voi kuitata sanomalla "luokituskomitean mutu" niin onhan sekin vastaus.

[Antti V|lokori]

Kuten Petri aiemmin mainitsikin, valitettavasti ei ole olemassa
sellaista matemaattista mallia, joka antaisi luotettavia
luokitusarvoja. Kaikkien niiden normaali hajonta on selvästi enemmän
kuin kolmasosa kivestä, joillain enemmänkin. Tämä siis sen lisäksi
että pelaajan taso voi vaihdella jopa joitakin kiviä, olosuhteista
riippuen.

Näin ollen matemaattista mallia ei ole käytössä; tyhjästä on paha
nyhjäistä. Ikävä kyllä, kukaan wikisijöistäkään ei ole sormeaan
heilauttanut siirtyäkseen omasta mutustaan matemaattisen analysoinnin,
teoretisoinnin ja mallintamisen suuntaan, joten on kovin vaikea uskoa
että mitään kunnon työkalua edes saataisi. Ilmeisesti tuo on niin iso
ja vaikea homma, ettei siihen vain pystytä.

Historiallisesti, Suomen luokitukset olivat aikoinaan selvästi
heikkoja Eurooppaan nähden, jonka seurauksena on annettu tapahtua
hienoista deflaatiota. Nykyään suomalainen luokitus ei enään
Euroopassa aiheuta tietäviä hymyjä ja hiljaista hekottelua, joten tätä
voi pitää onnistuneena.

Ikävä kyllä, koko Euroopan luokitus "kärsii" hitaasta deflaatiosta,
jonka voi arvioida johtuvan siitä, että Euroopan huippu on niin kovaa
tasoa. 5 danit eivät korottaudu 6 daneiksi ennen kuin pärjäävät
vanhoille, ja sama alempana. Tällä välin vanhatkin vahvistuvat pikku
hiljaa, hups. Tämän deflaation eräs ulkomainen, luotettu 6 dan on
arvioinut noin kiveksi kymmenessä vuodessa, vaikkakin siinä
(näkemykseni mukaan) tuli lyhytaikainen laskuvaihe kun joukko 6 daneja
korotettiin 7 daneiksi. Tämäkin sitten kompensoitui kerralla
Romanialaisten tullessa ulos kolostaan.

Mainittakoon tässä välissä, että 7 dan on perinteisesti ollut jotain
aivan poikkeuksellista; diplomin Nihon Ki-iniltä on saanut WAGC:n
voitosta ja suuresta amatöörimenestyksestä kotimaassa (en muista
tarkkaan, mutta olikosta se useampi voitto Japanin kansallisissa
huipputurnauksissa,) joten onkin ymmärrettävää että pelaajat jotka
eivät näissä pärjäisi, ovat epäröineet korotusta 7 daniin.

Nyt tuo poikkeuksellisuus onkin noussut 8 daniin, ja syynä aivan
ilmeisesti on, että 7 daneja tuntuu olevan pilvin pimein. Melkoinen
ero siihen, että aikoinaan 7 danin diplomin arvioitiin olevan
ammattilaistasolla 4 tai 5 danin arvoinen. Tästä huolimatta Eurooppa
ei ole inflatoitunut, ja syynä on epäilemättä ollut vahvimpien
pelaajien haluttomuus olla pilipalidaneja ulkomaalaisten silmissä.

Suomen luokituskomitean nimetty tehtävä on kuitenkin huolehtia siitä,
etteivät kansalliset luokitukset ajelehdi summamutikassa minne sattuu,
joten vertailukohdaksi on joka tapauksessa otettava Keski-Eurooppa.
Näin ollen deflaatiota on kontrolloitu tutkimalla huolellisesti
suomalaisten turnausmenestyksiä eurooppalaisissa turnauksissa,
erityisesti EGC:ssä. Tulokset ovat olleet varsin rohkaisevia: Suomi ei
ole viime EGC:n perusteella erityisen aliluokitettu, mutta ei millään
tavoin selvästi heikkokaan.

Pelaajien korotuksesta, se on aina riippuvainen tasosta jolta/jolle
korotetaan. Korkeamman tason korotusten kanssa ollaan aina oltu
tarkempia, alemmantasoiset kun eivät yleensä juuri Euroopassa liiku.
Itse asiassa melkoisen harvat ovat liikkuneet kotimaassakaan, ehkä
viime vuoteen saakka, joten on melkoisen kyseealaista että voiko
luokituskomitea paikallisten kerhotulosten perusteella ketään korottaa
ilman että homma tulisi hajoamaan.

Turnaustuloksista oppii kohtuullisen nopeasti näkemään kuka pärjäsi
hyvin muihin verrattuna. Vastustaja-analyysi (keitä vastaan pärjäsi ja
keille hävisi, mikä tasoitus/tasoero) antaa vahvempaa osviittaa siihen
että kuka on pelannut tasoansa paremmin. Turnaustulosanalyysi (miten
useammassa turnauksessa on käynyt) kertoo että oliko tämä sattumaa vai
systemaattista, ja että voiko nyt luotettavasti korottaa.

Ikävä kyllä, suomalaiset turnaukset ovat olleet liki käyttökelvotonta
luokitusmateriaalia ylemmille pelaajille, ja ylemmälle keskitasollekin
sen jälkeen kun vahvimpien pelaajien kiinnostus osallistumiseen
onnistuttiin liki tappamaan, mutta luokituskomitea on silti tehnyt
parhaansa.

Perinteisesti,

* dan-tason korotuksiin on Suomessa aina edellytetty turnausmeriitti, jolla pelaaja osoittaa sekä olevansa tasoa jolle korotetaan että saavuttaneensa henkisesti riittävän tason kestääkseen turnausten paineita. Tämä dan-tasosta riippumatta, mutta ylempien kanssa ollaan tarkempia kuin alempien.

* ylemmät kyut on korotettu kun huomataan tarve, ja todistusaineisto on riittävä. Tilaisuus on tyypillisesti ollut turnaus, ylempänä mainituista syistä. Todistusaineiston vertailukelpoisuus Euroopan tasoon on tärkeä, joten on turha urputtaa tässä esmes IGS-peleistä joiden vertailukelpoisuus mihinkään, edes itseensä, on heikolla pohjalla.

* alemmat kyut on delegoitu kerholuokittajille, mutta luokituskomitean jäsenet korottavat aina tarpeen tullen, antaen sitten palautetta kerholuokittajille ("*keles, hoitakaa homma paremmin.") Kaikki luokituskomitean, ohi kerholuokittajien tekemät korotukset tulisikin mieltää moitteeksi kerholuokittajille.

Yhtä kaikki, korotus perustuu arvioon siitä, että pärjäisikö uudella
tasolla vai ei, eikä siihen että onko vahvempi kuin nominaalitason
muut pelaajat. Jälkimmäinen sisältää inflaatioautomaatin kun kuitenkin
turnauksen osallistujat vaihtelevat rajusti, edellisen deflaatioriski
kontrolloidaan kansainvälisillä turnausmenestyksillä.

Korotustarvetta arvioitaessa katsotaan __kohdetason suhteen__ 

#menestystä heikompia vastaan (pitää voittaa selvä valtaosa,)
#menestystä samantasoisia (noin puolet) ja 
#menestystä vahvempia vastaan (ei saa hävitä aivan kaikkia.) 

Näistä, käyttäen siis sekä vastustaja- että turnausanalyysiä, arvioidaan että pärjäisikö pelaaja kohdetasolla.

Perusteluna deflaation riskin hyväksymiselle on Euroopan go-pelaajien
ja -instituutioiden asennoituminen; olla selvästi nominaalitasoa
heikompi pidetään paljon pahana kuin tilapäistä ongelmaa toiseen
suuntaan. Tämä taas perustuu siihen, että alentaminen on
japanilaisperustaisen ajattelumallin mukaan hyvin vaikeaa, kun taas
korotuksia voidaan kyllä antaa.

Näistä syistä kaikille pelaajille on vahvasti suositeltu käymistä
kansainvälisissä turnauksissa, etenkin niille jotka haluavat dan-tason
korotuksia. Kaikenlainen urputtaminen siitä, kuinka tämä on epäreilua
tai ettei se saisi mitään vaikuttaa, on aivan merkityksetöntä sen
rinnalla että vertailupiste on kuitenkin ulkomaat eikä kotimaa.
Kotimaasta saatu ylätason korotusmeriitti on kuitenkin aina
epäluotettavmpi, koska vertailupiste ulkomaihin tulee mutkan kautta
eikä suoraan.

Kaikki ylläoleva näkyy koko ajan luokituskomitean toiminnassa, nämä
ovat helppoja huomata jos vain malttaa tarkkailla asiaa.

Antti, vastasiko tämä kysymyksiisi?

-- DonOlli, 14.4.

Pitkässä kirjoituksessasi oli onneksi vähän lisää valoitusta luokituskomitean
korotusperiaatteista. Kirjoitit: 
;:''Korotustarvetta arvioitaessa katsotaan __kohdetason suhteen__ menestystä heikompia vastaan (pitää voittaa selvä valtaosa,) menestystä samantasoisia (noin puolet) ja menestystä vahvempia vastaan (ei saa hävitä aivan kaikkia.) ''
Otetaanpa nyt esimerkiksi Paavon Pullauttimesta Joosen tasa-avaustulokset viime vuoden alusta lähtien
ja tarkasteltavaksi kohdetasoksi 1 dan. Tulokset:
# parempia vastaan (2d-5d): 2/8, joka menee ilmeisestikin kategoriaan "ei saa hävitä aivan kaikkia" varsinkin kun pari peliä on 5 dania vastaan. 
#kohdetaso (1d) 2/4 joka sanojesi mukaan "noin puolet" ja 
# heikompia vastaan (1k-3k) 6/7 eli "pitää voittaa selvä valtaosa". 
Koska Joose olisi pitänyt käsittääkseni 
korottaa näillä tuloksilla shodaniksi, täytyy ilmeisesti joidenkin Joosen vastustajien olla
päänahka-analyysissä (jonka olemassaolo on merkki nykyisen järjestelmän toimimattomuudesta, sillä
jos osa pelaajista tunnustetaan luokituskomiteankin puolesta pelaavan väärällä luokituksella, on aika
mielenkiintoista kuinka voidaan puhua esim. jostain sm-karsintojen McMahon-ryhmäjaoista tasapuolisena
urheiluna) heikompia kuin heidän luokituksensa. Voisitko kertoa, keitä nämä pelaajat ovat?

-- Kari 14.4

Jos lasket noista ulos meikäläisen, Markun ja Gunnarin, onko näyttö annettu? Perusteluna uloslaskentaan on Markun silminnähden väärä luokitus, meikäläisen tuntematon sekä rajusti heilahteleva pelitaso (mm. alennus 3 daniin, jonka alennuksen riittävyys on vielä epävarma) ja Gunnarin osalta etteivät tulokset erityisesti näytä vastaavan 2 dania edes Ruotsissa.

Olisiko sitten parempi jos luokituskomitea väenväkisin alentaa pelaajia vasten heidän tahtoaan, kuin että katsotaan päänahkoja? Alennuksia on kyllä pohdittukin, mutta on toivottu että pelaajat tekisivät sen itse vapaaehtoisesti.

-- DonOlli

Ketään Gunnaria vastaan Joose ei ole pelannut, mutta jos Markku lasketaan 1 dan ja sinut 2 dan, on 
tulos seuraava:
#vahvempia vastaan  1/7
#shodaneita vastaan 3/5
#heikompia vastaan  6/7

-- Kari

Nyt olet sortumassa siihen mistä toisia moitit: olettamaan liikoja historiatietojen perusteella. Markku ei tunnu pärjäävän edes 1 danina ilman selittelyä, ja oma tasoni turnauspeleissä (sic!) on täysin tuntematon ennen kuin saadaan lisätietoa. Näin niiden laskeminen mukaan ollenkaan on varsin kyseenalaista.

Ollaan siis joka tapauksessa odottamassa PM:n tuloksia, siitä saanee lisätietoa. Ja hups, von Arnold onkin Gunnarin veli Dag, joka on jo alentanut itsensä takaisin 1 kyuksi. Hmm...

Mutta ilmeisesti ajatus pelaajien väkisin alentamisesta on se mitä halutaan, eli pitänee ottaa asia esille luokituskomiteassa.

-- DonOlli

Dag von Arnold pelasi Jusan Danissa 1 kyuna. Jos pitää paikkansa, että hän on joskus pelannut vahvemmalla luokituksella ei liittyne asiaan. Mitä minun pärjäämiseeni 1 danina tulee, en kommentoi asiaa itse. Alla yhteenveto tuloksistani tasa-avaus turnauksissa vuoden 2002 alusta laskien. (Vuoden 2001 pidin taukoa turnaustoiminnasta). Kaksi 2 danin luokituksella minua vastaan pelanneista on laskettu 1 kyuksi (yksi kotimainen pelaaja ja yksi japanilainen). Jaakko Munkki -turnauksessa 2003 tasoituksin 1 danina tulos 2/6, joka tuskin lienee normaalijakauman virherajojen ulkopuolella tai lähelläkään niitä.

3d   0.00% (0/1) \\
2d  20.00% (2/10) \\
1d  40.00% (4/10) \\
1k  77.78% (7/9) \\
2k  50.00% (1/2) \\
4k 100.00% (1/1) \\
9k 100.00% (1/1) \\

Tulkinnat jätän muille. 

Alla viitteenä kaikki pelit tasoitusturnauksista 1 danina ja 2 danina ilman mahdollisten varjoluokitusten huomioonottamista.

5d   0.00% (0/9) \\
4d  20.00% (1/5) \\
3d  44.44% (4/9) \\
2d  52.94% (9/17) \\
1d  47.06% (8/17) \\
1k  62.50% (15/24) \\
2k  71.43% (5/7) \\
3k 100.00% (6/6) \\
4k 100.00% (3/3) \\
5k 100.00% (3/3) \\
6k 100.00% (2/2) \\
9k 100.00% (1/1) \\
12k 100.00% (1/1) \\

Tasoituspelit 2 danina vuoden 2002 aikana: 13/26. Alitasoitusvoitot poistettuna 10/26.

-- [Markku Jantunen], 16.4. 2003

Sain vastauksen kysymyksiini (olli tuolla aiemmin kyseli tätä). 

--[Antti|lokori]

Väkisinalentaminen on samalla muiden ylentämistä, eli periaatteessa järjestelmä ei voi toimia kunnolla
ilman alentamisia ellei haluta inflaatiota käyntiin. 

Ongelmana tässä vain on se, että alentamiselle pitäisi saada samanlaiset julkiset periaatteet kuin yllä
korottamiselle tai muuten pelaajilla on oikeutettu epäilys luokituskomitean puolueettomuudesta kaikissa
tilanteissa. Esimerkiksi tällä hetkellä täsmälleen ne pelaajat, jotka ovat Suomessa vähintään 3 dan, kuuluvat
luokituskomiteaan. On vielä lisäksi niin, että kaikki luokituskomitean jäsenet ovat pääkaupunkiseudulta. Kaikista
paras tilanne olisi silloin, kun luokituskomitea ei koostuisi ollenkaan go:n pelaajista, niin mitään ikäviä
riippuvuussuhteita ei voisi syntyä. Käytännössä tasapuolisuus voi toteutua vain sillä, että eri kerhot saavat
tasaisen edustuksen luokituskomiteaan.

-- Kari

Tuntuu siltä, että oikeasti tässä keskustelussa on kyse siitä, että luokituskomitean toiminta on edelleen epäselvää useimmille pelaajille - mitä en ihmettele. Omalta osaltani olen saanut tietoa ja perusteluja luokituskomitean päätöksiä, mutta se on tapahtunut vetämällä luokituskomitean jäseniä hihasta tyyliin --Hei, milloin mä saan sen dan-korotuksen????!--

Ratkaisuna olisi tietysti lisätä tiedotusta. Ikävä kyllä luokituskomitean jäsenyys on jälleen yksi nakkitehtävä vahvoille dan-pelaajille,  ja kyseisillä henkilöillä noita nakkitehtäviä riittää. Joten toinen ratkaisu olisi ottaa luokituskomiteaan mukaan yksi edustaja kustakin maan go-keskuksesta. Tällöin jokaisen go-palaajan luulisi tuntevan ainakin yhden luokituskomitean jäsenen, jolle sitten voisi vuodattaa valituksensa ja miksei kehunsakin.

Kannatan siis Karin ehdotusta luokituskomitean muuttamisesta maata tasapuolisemmin edustavaksi. Vastustan tarkkojen ohjesääntöjen laatimista korotuksille. Nähdäkseni mutu-systeemin vahvuus on juuri siinä, että Suomen go-piirit ovat niin pienet, että luokituskomitea pystyy aivan oikeasti käyttämään monipuolista informaatiota luokituksia miettiessään. (Onko se siinä onnistunut, on eri kysymys. Nähdäkseni siedettävän hyvin ainakin. Joose pelaa muuten mielestäni shodanin tasolla ... :)

-- [Otso Alanko]

Ennustan että keskustelu luokituskomitean sijainnista räjähtää käsistä, loinpa siis [luokituskomiteakeskustelun|Luokituskomiteakeskustelu] -- [Mikael Runonen|Falla] 14.4.2003

[Luokituskeskustelu VI]