Glück im Scrabble - statistisch

    This site uses cookies. By continuing to browse this site, you are agreeing to our Cookie Policy.

    • Glück im Scrabble - statistisch

      Liebe Scrabbler, hier mal wieder ein etwas ausführlicherer Denkanstoß in diesem relativ inaktiven Forum, in das aber vermutlich viele Leute noch öfter mal reinschauen.

      Neben Scrabble gibt es noch ein anderes Gebiet, das mich ähnlich obsessiv interessiert (und das ich zum Beruf gemacht habe): Statistik. Kein Wunder also, dass ich über die Verbindung aus beidem ganze Bücher schreiben könnte, zumal beides auch nah beieinander liegt - um gut zu scrabbeln, muss man vor allem statistisch denken können.
      Wenn ich deshalb andere Spieler über das Glück oder Pech reden höre, das sie in diesem oder jenem Spiel hatten (und insbesondere, wenn mir andere Spieler während (!) des Turnierspiels erklären, dass ich ja auch das ganze Glück auf meiner Seite hätte - salopp gemeint in Ordnung, oft aber ernst gemeint und dann ein Unding!), denkt der Statistiker in mir oft: wenn man das nur mal in Zahlen ausdrücken könnte... insbesondere geht es mir so, weil ich nach Turnieren immer gerne wissen will, wie das Ergebnis einzuordnen ist - Glück oder Können, Pech oder Unvermögen? Nur wenn man das weiß, kann man ja die richtigen Schlüsse ziehen; außerdem mag ich einfach keine Ungewissheit in solchen Dingen ?(
      Vielen Scrabblern geht es ähnlich - viele Gespräche zwischen den einzelnen Runden bei Turnieren drehen sich um die ewige Frage Glück/Können bzw. Pech/Unvermögen.
      Deshalb teile ich hier mit euch die Lösung, die ich dafür gefunden habe, das Ganze statistisch auszuwerten. Schon klar, dass das in einem solchen Detail vielleicht nur wenige interessiert und sich auch nicht viele den Aufwand für eine solche Auswertung machen würden, aber das Prinzip ist vielleicht schon interessant - allein schon, zu wissen, dass es eine ziemlich objektive Möglichkeit gibt, Glück in einem Spiel recht präzise in Zahlen auszudrücken.

      Die Idee ist eigentlich ganz einfach:
      Um einen Zahlenwert für das Glück beim Nachziehen (denn um nichts anderes geht es ja) zu bekommen, vergleicht man einfach die Situation, in die man durch das Nachziehen gekommen ist, mit der, die durchschnittlich zu erwarten war, bevor das Nachziehen geschah.
      Konkret:
      Man wertet die Spielsituation unmittelbar vorm Nachziehen aus - d.h. ich habe eine bestimmte Restbank, mein Gegner hat einen bestimmten Zug gespielt, und jetzt fehlen nur noch die neuen Buchstaben, die meine Restbank komplettieren. Was darf ich im Durchschnitt erwarten?
      Wenn ich auf einem offenen Brett ENST behalten habe und noch beide Blankos ungespielt sind, kann ich vielleicht mit 50 Punkten im Durchschnitt rechnen (durch hohe Bingowahrscheinlichkeit). Wenn ich dann NSS nachziehe, ist das Pech, weil ich so deutlich weniger als 50 Punkte machen werden (deshalb reicht es nicht, einfach nur die Buchstaben auszuzählen, denn N und S sind ja eigentlich gute Buchstaben - aber in diesem Kontext stellen sie Pech dar; noch ein Grund für meinen Wunsch nach einer statistischen Lösung, denn ich rege mich oft innerlich über die Kommentare von Leuten auf "ich hatte ja auch das Q" oder "du hattest ja auch beide Blankos"; daraus kann man einfach nicht pauschal auf Pech oder Glück schließen!).
      Und diese Idee kann man perfekt mit dem Programm Quackle umsetzen - sofern man die eigenen Bänke vollständig mitgeschrieben hat (aber ohne diese Voraussetzung ist ja klar, dass keine präzise Auswertung möglich ist). Folgendermaßen: Man geht zum Zug des Gegners und simuliert seinen Zug (mit der unvollständigen Bank, da man seine übrigen Buchstaben ja nicht kennt). Dabei gibt man unten unter "specify partial opponent rack" (so heißt es im englischen Menü, die deutschsprachige Version habe ich nicht) die eigene Restbank ein, noch ohne die neuen Buchstaben.
      Damit sieht man unter "Valuation" dann einen Wert dafür, welchen weiteren Spielverlauf Quackle im Durchschnitt vieler Simulationen erwartet. Hier ein Beispiel: Ich habe gegen Ben in Mannheim gerade nach langer Überlegung HÜF gespielt und dabei DEERV behalten; Ben spielt UFO; jetzt geht Quackle davon aus, dass in den folgenden 5 Zügen (wie weit man hier schaut, ist unwichtig) der Punkteabstand sich um 37 Punkte zu Bens Ungunsten, also zu meinen Gunsten, entwickelt - wobei dieser Wert dadurch ermittelt wird, dass ich in Hunderten Simulationen jedes Mal zwei zufällige Buchstaben zu meinen DEERV dazuziehe:



      Jetzt wiederholt man das Ganze, legt jetzt aber die Bank fest, die ich nach dem Nachziehen tatsächlich erwischte - ich zog MN nach und hatte also DEEMNRV.



      Ergebnis: Statt -37 steht bei Ben nur noch -24 als "Vorschau" für die nächsten fünf Züge. Das sieht also 13 Punkte besser für ihn, und damit schlechter für mich, aus als bei durchschnittlichem Glück zu erwarten. Für diese Zug würde ich für meine Glücksmetrik also -13 notieren. Ich habe diesen Zug als Beispiel gewählt, weil ich hier im Spiel sehr schwer einzuschätzen fand, ob ich da jetzt Pech gehabt hatte oder ob ich die Restbank überschätzt hatte. Diese Auswertung zeigt mir, dass Ersteres der Fall war.

      Mein Statistikerherz lässt diese Lösung deshalb höherschlagen, weil sie genau den Faktor isoliert, der von Interesse ist - wie haben sich die zufällig nachgezogenen Buchstaben ausgewirkt? Spielweise, Gegner, Spielstand usw. können das Ergebnis hier nicht verfälschen. Alle Kontextvariablen sind ja schon in der ersten Auswertung enthalten - die zweite fügt dann nur die neu dazugezogenen Buchstaben hinzu.

      Einziger (größerer) Nachteil ist, dass das eigene Glück natürlich nur eine Seite der Medaille ist - die andere ist das des Gegners. Aber da man dessen Bänke nicht kennt, ist von vorneherein klar, dass dieses bestenfalls in Ansätzen ausgewertet werden kann. Wenn man das eigene Nachziehglück kennt, kann man damit schon mal die eigene Punktzahl sehr präzise so korrigieren, dass sie eine "echte" Repräsentation der Spielqualität in diesem Spiel darstellt.

      Über ein ganzes Spiel gesehen, kann das dann beispielsweise so aussehen:



      Das ist der Verlauf, den mein "Nachziehglück" in einem anderen Turnierspiel genommen hat - in Nürnberg gegen Nikolaus. Da erwischte ich einen neunfachen Bingo, der hier natürlich mit dem mit Abstand größten Satz nach oben sichtbar ist. Natürlich ist da nach dem Spiel völlig klar, dass ich hier Glück hatte. Aber interessant ist, dass unser beider Eindruck, dass hier das Glück in einem Zug nach dem anderen lawinenartig in meine Richtung rutschte, nur bedingt stimmt - die übrigen Züge waren größtenteils recht normal, und ich habe so einen konkreten Wert, um wie viele Punkte ich vom Glück "gepusht" wurde: 133. Da ich 620 Punkte erzielte, würde man meine "wahre" Spielstärke hier mit 487 beziffern. Ich habe also wohl neben dem Glück auch gut gespielt. Hätte sich ein Glückswert von +190 ergeben und meine "wahre" Punktzahl wäre nur bei 430 - also unter meinem Durchschnitt - würde ich das Spiel jetzt also anders sehen.
      Gerade so ein Turnier wie in Nürnberg hat bei mir den Wunsch hervorgerufen, eine solche Auswertung vornehmen zu können, denn das dortige Ergebnis ließ mich hinsichtlich der Frage "Glück/Können?" ziemlich unschlüssig zurück. Der Versuch, das zu beantworten, indem ich meine Züge an sich mit Quackle oder Elise analysiere, hilft nur bedingt weiter, da Quackle hier oft nur sehr begrenzt sinnvolle Ergebnisse liefert und es mit Elise verdammt lange dauert - und auch Elise kann manche Situationen nicht brauchbar lösen. Das hier ist natürlich auch kleinteiliger Aufwand, aber mit etwas Übung ist ein Spiel in 5-10 Minuten ausgewertet - so lange hängt Elise teilweise an einem Zug; Kosten/Nutzen sind so einfach viel besser.

      Soviel dazu! Man merkt sicherlich, was ich oben schon angemerkt habe: Ich könnte Bücher darüber schreiben...
      Normalerweise behalte ich dieses "Spezialinteresse" für mich, da ich weiß, dass es für die meisten Spieler uninteressante Überlegungen sind oder es manche sogar befremdlich finden (analytische Denkweise und Freude am Spiel scheint für viele ein Widerspruch zu sein - kann ich nicht nachvollziehen!); das wollte ich jetzt aber mal teilen, denn wer ähnlich mathefreudig an Scrabble herangeht, hat bestimmt Interesse daran. ^^ Meine zukünftigen Turnierrückblicke werden diese Statistiken anführen (manchmal habe ich mich schon auf eine Auswertung bezogen, die in Elise verfügbar ist; diese krankt aber daran, dass zwar ein relatives Maß angegeben wird - "in dieser Situation hattest du mit diesen Buchstaben eher Glück / Pech" - aber kein absolutes; hier stünde also der zufällig nachgezogene neunfache Bingo genauso da wie ideales Ziehglück im Endspiel, das faktisch aber nur vier Pünktchen mehr bedeutet).

      PS: Bleibt gesund!

      The post was edited 10 times, last by Anno ().

    • Nachtrag: Ich habe die 14 Spiele aus Nürnberg ausgewertet und die Korrelation zu meiner Punktzahl, wenn man beides berücksichtigt, ist ca. 0,7 - siehe Bild. (Korrelationen können einen Betrag zwischen 0 und 1 annehmen; 0,7 ist für so einen komplexen Sachverhalt unverschämt hoch; zum Vergleich: wer die Blankos in einem Spiel hatte, korreliert nur zu 0,25 mit dem Ergebnis.) Das wird bei mehr Daten sicherlich noch etwas sinken. Es bedeutet im Übrigen auch, dass ich ziemlich konstant gespielt habe, denn die Korrelation könnte nicht so hoch sein, wenn Schwankungen in meiner Spielstärke sie verwässern würden.



      In Nürnberg hatte ich nominell im Durchschnitt sogar eher Pech (-8 pro Spiel). Aber das liegt erstens an einem einzelnen absolut verflixten Spiel gegen Stephan mit -213 - der Punkt ganz links in der Grafik - und zweitens werde ich erst mit mehr Daten wissen, ob sich hier überhaupt ein Durchschnitt von +-0 ergeben sollte. Schließlich nimmt Quackle an, dass man vollkommen zufällig aus den Restbuchstaben zieht; diese sind aber insbesondere bei starken Spielern nicht perfekt zufällig. Dass der andere seit mehreren Zügen einen Blanko auf seiner Bank versteckt hält, ist schließlich wahrscheinlicher, als dass er dort das Q hortet. Das schadet der Statistik an sich nur sehr begrenzt, aber es könnte bedeuten, dass man den zu erwartenden Wert nicht bei 0 ansetzen muss, sondern bei -5 oder so.

      Noch eine Ergänzung: Eine zweite, schnellere, aber auch gröbere Möglichkeit der Auswertung ist, einfach die Buchstaben, die man gezogen hat, ohne Beachtung der Situation zu bewerten. Ein Q gilt als Pech, ein Blanko als Glück. Ich muss also nur aus Quackle abschreiben, welche Buchstaben ich gespielt (und getauscht / am Ende behalten!) habe, das dauert kaum eine Minute, schon kriege mit einer entsprechenden Excel-Vorlage einen Durchschnittswert. (Die Bewertungen habe ich dem Programm Elise entnommen, wo sie eingebaut sind, ermittelt aus zigtausenden computergenerierten Spielen; sie reichen vom Blanko mit +24 bis zum Q mit -1).

      Das berücksichtigt die Situation nicht, deshalb ist die obige Metrik präziser, aber beide ergänzen sich interessanterweise sehr gut, auch weil in der Buchstabenbewertung indirekt ja ganz grob das *gegnerische* Glück erfasst ist - wenn ich das Q nicht hatte, muss er es gehabt haben.
      Mit beiden Maßen *zusammen* (pauschal: welche Buchstaben habe ich bekommen, und spezifisch: wie hilfreich waren die in der jeweiligen Situation?) kann man Glück / Pech erstaunlich gut festnageln. Laut dieser Auswertung habe ich in Nürnberg eher nette Buchstaben erwischt (und meine Mitspieler somit schlechte), aber insgesamt liegt der Wert nahm am Durchschnitt.

      Mein Glück war also insgesamt recht normal. Das bedeutet allerdings noch lange nicht, dass das 14-0 verdient war, sondern nur, dass die *Differenz* von etwa 80 Punkten Vorsprung pro Spiel verdient war. Wenn man im Durchschnitt mit 80 Punkten Vorsprung gewinnt, wird man auf Dauer etwa vier von fünf Spielen gewinnen - ich hatte also Glück, dass die Abstände so fielen, wie sie fielen, etwa durch haarscharfe Siege gegen Inessa und Agnes.

      Dadurch, dass ich durch die Glücks-Statistik meine "korrigierten" Vorsprünge kenne, kann ich mein Ergebnis insgesamt recht präzise in eine Elozahl umrechnen: ein Punkt Vorsprung entspricht 4,5 Elo-Punkten, wie man aus früheren Turnierstatistiken ermitteln kann; die Elozahl des Gegenspielers plus die 4,5fache Differenz in diesem Spiel gibt also die eigene Spielstärke an. Ohne Glückskorrektur schwankt diese Zahl dramatisch und ist nicht wirklich für bare Münze zu nehmen. Mit Korrektur wird sie annehmbar präzise. Für dieses Turnier ergibt sich für mich eine Elozahl von 1663 (wobei der statistische Fehlerbereich bei plus/minus 90 liegt). (Was allerdings vorläufig ist, da ich, siehe oben, noch nicht genau weiß, wo man den Durchschnitt bei der Glückswertung ansetzen muss.)

      Habe ich schon erwähnt, dass mir Statistik Spaß macht? :D

      The post was edited 1 time, last by Anno ().

    • Das muss ich noch erforschen :whistling:
      Als Lerneffekt hat man davon schon, dass man sozusagen eine bessere Rückmeldung bekommt als im Spiel, wo es nur einen Ausgang gibt, entweder "hat funktioniert" oder "hat nicht funktioniert"... hier sieht man dann schon eher "ok, es hat funktioniert, aber das war ein Glückstreffer" oder umgekehrt ;)
    • New

      Lieber Anno, das Lesen deiner Statistik-Posts hier war tatsächlich der End-Auslöser mich wieder hier rumzutreiben ( gibt´s so nicht, gell!? ). Ja: Provokation ist ein starker Trigger, und nicht viel treibt mich derart um derzeit, wie die Statistiken - die Alles und Nichts sagen.
      Ihnen zugrunde liegend, sind wir gerade da wo wir sind. Und keine noch so plausible Argumentation scheint dem reinen Ratio dieser Tage, das Wasser reichen zu können;
      Statistisch betrachtet selbstverständlich, gehörst du zu den absoluten Top 5 Spielern dieser Garde!!

      Nun, das Glück, der Zufall und die Statistik - sie sind doch eindeutig 2 Seiten 1 Münze!? In jedem Fall sind sie sich diametral: absolute Berechnung vs. dem Zufall
      Meiner Meinung nach ist sowohl das eine wie das andre, manipulierbar - man muß nur wissen wie:-
      Leider bin ich hierin noch keine Meisterin, aber was nicht ist kann immerhin noch werden;

      Zum ´Zufall´ gibt es eine , wie ich finde , sehr gut gemachte Wanderausstellung, die zuletzt hier in HD im Carl-Bosch-Museum zu sehen war.
      carl-bosch-museum.de/sonderaus…gen/rueckblick_Zufall.php
      Für mich als ´Spielerin´ war das mega interessant, weil mein Ergebnis bei der Frage : "Gibt es Zufall-ist alles berechenbar? , mit klarem ´Ja+Nein´ zu beantworten war.
      Und so lieb ich das:eine sozusagene (gibt es auch nicht!?) bewiesene ´Grund-Ambivalenz in allem das ist´ ´.

      Es grüßt dich sehr herzlich - included deine Spieler Community
      S.
      " ALLES IST (IN) ÜBUNG "