Keskustelua#

Tietokannassaon nyt koko Euroopan gotietokanta ja elosta on laskettu ensimmäinen luonnosversio. Seuraavaan versioon tulen korjaamaan useita puutteita.

  • Tein systeemistä aluksi liian dynaamisen koska pelkäsin deflaatiopeikkoa, mikä oli kuitenkin aiheeton pelko. Tämä aiheutti aika paljon ylimäärästä epävakautta joidenkin pelaajien elokäppyrässä. Deflaatiota ei kuitenkaan tarvitse erityisemmin torjua, koska saksalainen gopopulaatio ei ole kovin altis ole deflaatiolle ja käytän saksalaisia referenssinä, jonka mukaan synkronoin muiden maiden elot. Näin ollen kaikkien muiden maiden elot tarkoittavat aina samaa kuin saksalaisten elot. Tässä versiossa aloitin synkronoinnin vasta vuodesta 2004 joten sillä kohtaa voi olla kummallinen parinsadan pisteen yht’äkkinen hyppäys suomalaisten elokäppyröissä.
  • Seuraavaan versioon määritän vielä täsmällisemmät tasoituskivivastaavuudet. Lisäksi kokeillessa tuli muutamia virheitä, puutteita ja tuplasyötteitä, joten ne korjaan myös. Yritän tehdä jonkinlaisen varmistuksen, että ne turnaukset jotka aion syöttää tulee kanssa syötettyä, koska ainakin Leksandin toinen viikko on kadonnut jossain vaiheessa johonkin ja on ilmeistä että siellä saattaa olla muitakin ei niin ilmeisesti havaittavia puutteita.
  • Tein käyttöliittymään joitain kiireellisimpiä uudistuksia, mutta uusi tietokantarakenne kaipaa vielä paljon enemmän muutoksia käyttöliittymään. Pelien syöttäminen ei vielä onnistu muutoin kuin sähköpostilla minulle, ja suomisarjapelit ylipäänsä puuttuvat tietokannasta toistaiseksi.
  • Ensimmäinen ilmeinen huomio lienee että 200 pistettä per 75 % on hiukan liian lavea skaala goelolle, mutta nähdäkseni kiinteä skaala toimii riittävän hyvin aina purotasolle saakka. Näyttäisi kuitenkin siltä että huippu amatööri goon pelaaja on suunnilleen yhtä vahva kuin maailman vahvimmat shakinpelaajat. Purot puolestaan ovat vielä vahvempia kuin vahvimmat shakkitietokoneet.
  • Siemenlukuja en enää edes yrittänyt iteroida koska se on liian työlästä näin heterogeeniselle gopopulaatiolle. Sen sijaan valitsin vuosina 1996-98 yli kymmenen peliä pelanneilta heidän silloiset Egf luokitukset heidän siemenluvuikseen. Muille systeemi määrittää itse alkuluvut.

-- Jouni, 12.6.2009

Hiukan paranneltu versio kyllä ja tällä kertaa myös sarjapelein. Tässä versiossa ainakin on eliminoitu ensimmäisen version ilmeinen ja koko systeemin kattava kaaos. Hyvä se ei missään tapauksessa vielä ole, koska deflaation torjumiseni aiheuttaa nykyisellään uuden ja huomattavan kaaoksen lähteen, mikä pitää korjata jotenkin. Koska suomalaisten deflaatio on ollut Euroopan suurinta, on myös oletettavaa että suomalaisten elot ovat systeemin epäluotettavimpia. Mutta jotain numerologiaa siitä voi jo päätellä. Eli voittotodennäköisyys näyttäisi edelleen koko euroopan mittakaavassa olevan varsin vakioinen 3k:n ja 7d:n välillä noin 27% ± 2 ja prosenttiosuus on suurimmillaan kun 5d voittaa 6d:n. Tämä ainakin pitäisi viitata siihen että oletus vakioisesta skaalasta on parempi kuin Gorrin lineaarisesti muuttuva skaala.

-- Jouni, 17.6.2009


Taas suuri päivitys, joka tosin on vielä kesken. Tietokannassa on nyt liki kaikki tasa-avauspelit EGD:stä, mutta huomasin että järjestelmän säätäminen on vaikeampaa kuin oletin. Näin suoria johtopäätöksiä ei vahvuusluvuista voi tehdä. 7 vuoden takaisiin lukuihin verrattuna deflaatio on syönyt noin 500-600 pistettä, mikä ilmenee hyvin vanhojen danien elon kehityksestä joten tämä pitää ottaa huomioon.

Julkaisin uuden version siis pahasti keskeneräisenä, mutta onlinessa kehitystä vain on hiukkasen helpompi tehdä (ja tokihan se lisää työmotivaatiota =). Joten jos joku ei tykkää keskeneräisyyksistä, niin ... jokatapauksessa olen toistaiseksi sorkkinut systeemiä minimaalisesti. Iteroin 90 luvun datasta vain hyvin karkeat lähtöarvot 26 eniten pelanneelle pelaajalla ja kaikki muu siis on systeemin itsensä luomaa.

-- Jouni, 25.5.2009

Nähtävästi ilman monimutkaista algoritmia ei voida deflaatiota korjata koska parametrin oikea arvo riippuu pelaajapopulaation rakenteesta ja suomen oloissa sen pitäisi olla vähintään 0,084, mikä on liian suuri. Vertailuna Gorrin antideflaatioparametri on 0,016 ja sitä sovelletaan valikoidusti. Näin ollen nähdäkseni ainoaksi ratkaisuksi jää tehdä elorappusista dynaamisempi. Siis jos osoittaa 200 pistettä eloaan korkeampaa suoritustasoa, niin systeemi resetoi elon uudelle suoritustasolle. Tämä itsessään jo melkein pystyy pitämään systeemin stabiilina.

Ainakin kun tämän ottaa huomioon, Gor systeemi muuttuu entistäkin mystisemmäksi. Kuinka ihmeessä gorrisysteemi pystyy mitenkään olemaan stabiili? Erityisesti nyt kun ei ole enää matteja "väärin" lähettämässä tuloksia Cieplylle? Tekemässä siis resettitesujeja, antamalla perusteettomia tuplakorotuksia ja lähettämällä tulokset korotetuilla luokituksilla. Ilman muuta gorsysteemi ei voi olla riittävän dynaaminen jotta voisi mitenkään vastata deflaatiolle, erityisesti jos Hikaru no Go näytetään Teemalla.

-- Jouni, 27.5.2009

Ensimmäinen kokeiluversio eloskaalan säädöstä näyttäisi olevan valmis. Tuossa taulukossa on suuripiirteiset Egf luokitusvastaavuudet. Prosentti kertoo millä todennäköisyydellä voittaa yhtä kiveä vahvemman pelaajan. Vertailun vuoksi laitoin mitä oletuksia Gorri käyttää "todennäköisyyksille".

Egf Elo Erotus Prosentti Gorrin %
6d 2450
5d 2200 250 19 21
4d 2000 200 24 22
3d 1875 125 33 24
2d 1750 125 33 25
1d 1625 125 33 26
1k 1500 125 33 27
2k 1400 100 36 28
3k 1300 100 36 29
4k 1200 100 36 30
5k 1100 100 36 31

-- Jouni, 28.5.2009

Poistin resetin mahdollisuudet yli 2000 pisteen pelaajilta, koska resetin ekstrapolointi ei voi olla luotettavaa tai edes järkevää. 5d ja 6d vastaavuudet ovat tietenkin edelleen vain hyvin karkeita arvauksi.

-- Jouni, 31.5.2009



Mietiskelin hiukan elon ja luokituksen vastaavuuksia ja päädyin tuollaiseen taulukkoon. En keksinyt laskennallista tapaa laskea vastaavuuksia gorrin perusteella, joten tyydyin silmämääräiseen arviointiin, joten kyse on varsin karkeasta, mutta toivottavasti suuntaa antavasta arviosta. Kuten pystyy olettamaan 4k heikompiin luokitukseen ei data riitä oikein määrittämään järkevää vertailuarvoa. Yleinen huomio kuitenkin on että hajonta luokituksissa on todella suurta ja erot samalla luokituksella pelaavien välillä saattavat olla helposti parikin kiveä. Tämä suuri hajonta ei ainakaan helpottanut arvioimista. Olisi selkeyttävää jos saisi laskennallisesti verrattua eloa ja gorria.

Elo Egf Gor*
2500 6d 2620
2350 5d 2554
2200 4d 2486
2050 3d 2416
1900 2d 2344
1750 1d 2266
1600 1k 2184
1500 2k 2128
1400 3k 2070
1300 4-5k 2012

-- Jouni, 7.4.2009

Oivalsin sitten kuinka gorvastaavuuden voi laskea, mutta parempi olisi varmaan ollut jättää oivaltamatta, koska gorrin skaala on nähtävästi paljon suppeampi kuin osasin arvatakaan. Gorrin(*) laskennassa käytin oletusta, että 2700 olisi sekä elossa ja gorrissa samanarvoisia. Egf:n omat tilastotkinnäyttäisivät poikkeavan melkoisesti gorrin skaalasta (TableII: SE(100):n arvo pitäisi olla sama kuin tuon tilaston G+1 %-arvo). Näin yhteys luokituksen ja gorrin välillä näyttäisi katoavan likipitäen kokonaan. Eikä oma datanikaan ole sopusoinnussa gorrin kanssa, vaan päinvastoin lähtöarvaukseni tuntuvat olevan luvun 1700 paikkeilla vielä liian löyhällä skaalalla. Toisin sanoen näyttäisi että gorrin oletus lineaarisesta skaalanmuutoksesta on mennyt metsään.

-- Jouni, 8.4.2009


Varmaan moni on huomannut niin suomisarja.netissä on ollut käynnissä rakenteellinen uudistus. Nyt suomisarjaan lasketaan sekä turnauspelit että erilliset sarjapelit. Tämän mahdollistaa se että suomisarja.net ylläpitää Suoman varjovahvuuslukulistaa, johon sisällytetään suomalaisten pelaamat turnauspelit sekä suomisarjapelit. Kotimaisissa turnauksissa pelatut pelit ylläpitäjä lisää tietokantaan. Tämä ei tarkoita sitä että kaikki turnauspelit olisivat suomisarjapelejä, vaan suomisarjapelejä ovat vain suomisarjan pelaajien pelaamat turnauspelit.

Pelaajille ei määritetä enää erillistä lähtölukua, vaan serveri arvioi parhaaksi katsomansa alkuluvun ensimmäisten 24 pelin perusteella. Systeemin käynnistämiseksi arvioin vuonna 2007 aktiivisille henkilöille, alkuluvun silloisen luokituksen perusteella siten että shodan sai 1800 pistettä ja siitä sadan pisteen välein alaspäin. Ylöspäin siten että kiinnitin godanin 2400 pisteeseen. Tämän jälkeen tarkastin arvion syöttämällä pelidatan ja jos näytti siltä että luokituksen perusteella tehty arvio osoittautui vääräksi, korjasin lähtölukuarvioita. Näin lähtöluvun arviointi pitäisi perustua mahdollisimman vähän ennakko-oletuksiin ja mahdollisimman paljon pelillisiin ansioihin viimeisen kahden vuoden ajalta.

Koska monen turnauksen tuloksista puuttuu väri-informaatio, on voittaja merkitty listauksissa ensimmäisenä, mutta sikäli kuin väri-informaatio on saatavilla, on musta merkitty lihavoituna. Käppyrätulosteeseen on piirretty neliöin elokäppyrän ohella myös performanssikäppyrä, joka tarkoittaa viimeisen 16 pelin suorituseloa. Jos performanssin ja elon erotus kasvaa riittävän suureksi (n.400 pistettä) serveri arvioi uuden lähtöluvun viimeisten 16 luokitetun pelin perusteella. Kysymysmerkillisiä pelaajia vastaan pelatut pelit eivät ole luokitettuja eivätkä siis vaikuta eloon, joskin vaikuttavat toki performanssiin sitten kun vastuksen kysymysmerkki on kadonnut. Serveri ei myöskään huomioi lähtöluvun arvioinnissa yli vuoden vanhoja pelejä.

Edelleen olisi toivottavaa tarkistaa omien pelien oikeellisuus ainakin silmämääräisesti ja muistinvaraisesti. Vaikka suurin osa tuloksista on haettu koneellisesti 2900+ pelin joukossa on myös käsinsyötettyjä joukossa, joten siellä voi olla puuttuvia pelejä tai muita virheitä.

-- Jouni, 10.3.2009



Add new attachment

In order to upload a new attachment to this page, please use the following box to find the file, then click on “Upload”.
« This page (revision-2) was last changed on 17-Jun-2009 20:09 by 130.232.143.167