Rating beregning

I Politikens Skakbog, skrevet af Thorbjørn Rosenlund, er der et kapitel, som diskuterer skakcomputere, og det kommer også lidt ind på ratingtal. Et par af de spørgsmål, der stilles, kan formuleres som "Hvilket ratingtal har Gud" (i bogen benyttes en "perfekt" computer i spørgsmålet), og "Er der en øvre grænse for, hvad mennesker og computere kan nå, eller vil vi i al fremtid blive ved med at se nye ratingrekorder". Bogen refererer til to synspunkter: Nogle mener, at der er en øvre grænse på godt 2900, som svarer til perfekt spil, andre mener, at skakcomputere kan nå næsten vilkårligt højere.

Som diskussionen fremstilles i bogen, og som spørgsmålene er stillet, mener jeg ikke, at de giver meget mening, fordi de bygger på den antagelse, at ratingsystemet er stabilt. Det er den antagelse, jeg gerne vil anfægte, og vise, at man i stedet skal stille ovenstående spørgsmål i relation til ratingsystemet, ikke i relation til Guds eller andre skakspilleres egentlige spillestyrke.

Der står blandt andet, at hvis der er et maksimum på 2900, og Gud og Kasparov spillede en match over 10 partier, ville scoren blive noget i retning af 6½-3½. Dette er en meget flot antagelse, som formentligt ikke er korrekt! Lad os først se på, hvorfor en sådan påstand ikke giver så meget mening.

Når vi i denne sammenhæng inddrager Gud, er det fordi vi skal bruge et billede på den perfekte skakspiller, der aldrig begår fejl. Da skak er et deterministisk spil, betyder det med andre ord, at den perfekte spiller er i stand til at overskue hele spilletræet fra udgangspositionen, og kender det endelige bedste resultat af ethvert træk i enhver stilling. Med den antagelse er Gud sikret 5 af de 10 points, uden diskussion! Hvis skak er "remis-død", så vil Gud altså få MINDST remis i hvert parti, altså mindst 5 points, hvis hvid (eller sort) altid vinder med bedste spil, så vil Gud altså mindst vinde de 5 partier, hvor han spiller hvid (eller sort). Tilbage er de resterende 5 point, som i udgangspunktet er Kasparovs, men som det vil kræve perfekt spil af ham ikke at tabe, og at antage, at Kasparov kan holde sig til den smalle sti igennem 3½/5 eller 7/10 partier, det er i mine øjne at SKAMROSE Kasparov - eller at sige, at den smalle sti, måske ikke er så smal endda, og DET synspunkt vil jeg gerne se nogle gode argumenter for! Der har været en tendens til, at flere og flere mesterpartier ender remis op igennem skakhistorien, men det er stadig en noget vovet påstand at sige, at moderne skakspillere har "fundet" flere og flere "sikre veje" til remis - endda i en sådan grad, at Kasparov vil kunne holde remis i 7 af 10 partier, hvor man jo må formode, at han _aldrig_ har SET nogle af de 10 partier før!

Kort sagt, min tiltro til, at skak er "stort nok", får mig til at mene, at end ikke Kasparov vil kunne fravriste Gud et eneste sølle lille halvt point! Rosenlund giver selv et eksempel i bogen, som understøtter denne teori. Han viser et slutspil med ret begrænset materiel mellem to mesterspillere og kommenteret af endnu en mesterspiller - og som tilbagevises af retrogradanalyser som værende fuld af fejl, der gang på gang sætter det vundne over styr, uden at hverken spillere eller kommentator kan se det. Hvordan skulle nogen, andre end Gud, så kunne spille et helt parti korrekt?

Derfor er det ikke interessant at spørge, hvad Guds ratingtal er - han har ikke engang nogen tætte konkurrenter, det kan måles imod - og det er heller ikke interessant, hvor højt et ratingtal mennesker eller computere kan opnå - fordi vi slet ikke har et stabilt ratingsystem. Et stabilt ratingsystem, og spillere af nogenlunde samme styrke er to forudsætninger, som skal være til stede, for at kunne bruge ratingsystemet til sådan argumentation, i hvert fald med de ratingmodeller, som vi bruger i dag.

Hvad mener jeg egentligt med, at ratingsystemet ikke er stabilt? Jeg mener kort sagt, at de ratingtal, som folk opnår, ikke bare afhænger af deres spillestyrke, men simpelthen af, hvor mange points, der er i omløb i systemet, hvilket igen afhænger af, hvor meget der spilles!

Begrundelse: Hvis man ser på det ratingsystem, som anvendes i Danmark (kan ses på DSU's hjemmeside i Skakhåndbogen, afsnit 4.5), så skal man først bemærke, at der er flere systemer, alt efter hvor mange, der deltager i ratingberegningen, men det er klart, at en beregning mellem 2 personer over et enkelt parti eller to er den simpleste model, og alle andre beregninger er blot generaliseringer af denne situation. Derefter kan man se, at der gælder en slags energiligning. Ved ratingjusteringer er nedjustering lig med opjustering, altså summen og dermed spillernes gennemsnit er konstant. Der er dog 3 undtagelser fra denne regel:

  1. Hvis en spillers rating kommer under 1000, rundes den op til 1000. At 0-punktet er sat ved 1000 må tilskrives psykologiske grunde - man kan jo ikke være bekendt at give nye/dårlige spillere 0 i rating, men i praksis er der blot tale om en linær forskydning på aksen.
  2. Hvis man vinder en turnering "tilstrækkeligt overbevisende" (efter bestemte formler), så tildeles man en ekstra lille bonus.
  3. Når en ny spiller kommer til, starter han ikke altid på 1000, men tildeles et ratingtal, som menes at svare nogenlunde til hans styrke. Tilsvarende vil de ratingtal, som en spiller har erobret ikke blive "genbrugt", men gå til spilde, når spilleren ophører med at være aktiv.

Det er klart, at 2 ikke har den store betydning, men hvis den har, så forstærker den bare argumentet om, at ratingniveauet bestemmes af antallet af partier, der spilles. Det må også være klart, at 3 ikke har nogen betydning. Hvis spille-hastigheden sættes i vejret, vil til- og afgang svinde ind i forhold til spillevolumen. Dog gemmer vi lige punkt 3 til senere - det er nemlig punkt 3, der skal forklare, hvorfor man TROR at have et stabilt ratingsystem.

Tilbage er punkt 1. Den største og vigtigste og i praksis eneste brugbare kilde til nye points i systemet er oprunding til 1000, når en spiller kommer under! Kort sagt, Kasparovs, Guds, og alle andres ratingtal afhænger af, hvor mange spillere der ligger tæt på 1000, og hvor tit de taber! Det der sker, er en "opsivning" gennem systemet fra bunden til toppen. Kasparov kan ikke selv hæve sin rating - det skarpe øje vil have set, at en spiller ifølge ratingsystemet ikke kan hæve sit ratingtal yderligere ved at spille mod spillere der ligger mere end 735 points under ham selv. Derover forventes han at vinde samtlige partier, og kan altså ikke score bedre end forventet. Fair nok, det beviser jo ikke noget at slå markant dårligere spillere. Hvis dårlige spillere ikke blev rundet op, ville spillere under gennemsnittet med andre ord blive skubbet nedad under 1000, og Kasparov og spillere over gennemsnittet ville blive skubbet opad, indtil differencen blev så stor, at 735-reglen begyndte at gøre sig gældende - men inden ville man have mistet en masse spillere, som ikke gider at spille videre med et negativt ratingtal! Et sådant system vil endnu mindre være stabilt. Med oprundingen bliver de nederste spillere pludselig "fast grund" under fødderne på Kasparov. Hvis de blot spiller tilstrækkeligt meget og bliver rundet op hele tiden, så hæves deres ratingniveau, dermed hæves næste niveau også, indtil Kasparov til sidst kan hæve sit niveau, også udover 2900 - og Gud kan hæve sit til 735 over Kasparovs, og ikke mere! Konklusion: Kasparov kan for altid hæve sit, så længe der spilles i bunden og hele vejen op af stigen, men Gud kan aldrig hæve sit tilstrækkeligt (under antagelse af, at han altså spiller "uendeligt meget bedre" end Kasparov, hvilket jo nok må antages ref. deres match over 10 partier ovenfor).

Jamen, jeg har jo glemt, at udviklingskoefficienten mindskes for højere ratingtal. Korrekt, men den mindskes ikke til mindre end 10, og dermed bliver den (stort set) blot til trinvist linære transformationer af rating-aksen! Sådanne har ingen indflydelse på betragtninger omkring voksende ratingtal, og "placeringen" af uendeligt på aksen.

Tilbage til punkt 3: Jo, niveauet i bunden hæves hele tiden, men spille-hastigheden er jo i praksis ikke større end, at naturlig afgang nulstiller nogle af ratingtallene med en passende hastighed. Nyere skakmestre har en tendens til at få større ratingtal end tidligere, og det KUNNE jo tilskrives, at der spilles mere og af flere på alle niveauer. Kampen om ratingtallet er et kapløb med tiden, som den stærke spiller ikke kan løbe alene, og dermed bliver systemet TILSYNELADENDE nogenlunde stabilt, hjulpet af et tilpas vægtet design.

En anden af Rosenlunds konklusioner er, at forskellen mellem 2 spilleres styrke i virkeligheden er den måde, hvorpå de begår fejl! Det er efter min mening, det tætteste man kommer på en objektiv vurdering af en spillers styrke. Set fra Guds synsvinkel er alle spillere lige svage - de begår alle fejl, der gør ham i stand til at slå dem alle sammen. Om fejlen sker i 3. eller 57. træk er ligegyldigt for ham, men ikke for spillerne indbyrdes. Når vi skal vurdere andre spilleres indbyrdes styrke, bør vi altså se på frekvensen af fejl i deres spil, men så er vi tilbage igen: Kun Gud ved, om et givet træk er en fejl eller ej, retrogradanalyser rækker slet ikke langt nok til at kunne bruges, og kommer aldrig til det. Vi kan kun lade spillerne spille mod hinanden og konkludere, at taberen nok lavede flere og formentligt også tidligere fejl end vinderen, og derefter tildele dem et erfaringsmæssigt styrketal, med de ulemper i beregningsmetoden, som jeg allerede har beskrevet.

Jeg har ikke selv kendskab til andre tilsvarende behandlinger af dette emne. Hvis der er nogen, der kender til argumenter for eller imod ovenstående argumentation, vil jeg meget gerne høre dem. Jeg håber jo naturligvis, at mit skak-site vil kunne være med til at eftervise nogle af tingene - hvis nogle af spillerne overhaler Kasparov, vil det jo i hvert fald være interessant, hvis ratingsystemet er tilstrækkeligt identisk med det, der bruges i det virkelige liv.

Jeg har desværre ikke noget bud på et alternativt stabilt ratingsystem! Det eneste, jeg kan komme på, er at måle sig imod traditionelle computerprogrammer på forskellige niveauer, som jo vides at have konstant rating. Et matematisk set objektivt og stabilt ratingtal på baggrund af spil mod andre spillere tror jeg ikke på...

Home

Last revised: 2006-10-07
·