Bingo-Training

    Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

    • Mixy hat mich dankenswerterweise darauf aufmerksam gemacht, dass ich die MostProb-Listen wieder einmal updaten sollte.

      Hier zunächst die neu hinzugekommen Wörter:

      ANSENGE
      ANSENGT
      CASTERN
      EINBRAT
      EMSERIN
      EOSINEN
      GENAHTE
      GESENNT
      KASEINE
      MAILERN
      RATETEN
      RENAULT
      RIESTRE
      SCREENE
      SCREENT
      SEDIERE
      SEDIERT
      SENNEST
      SENNTET
      SERPENT
      STREAME
      SUDERNS
      SUDERTE
      TAURINS
      UNEHREN

      AGIERTES
      ANSENGET
      ANSENGTE
      CASTERIN
      EINBRATE
      EISBADEN
      ESTROGEN
      GENAHTER
      GENAHTES
      GESUDERT
      MASTERIN
      RENAULTS
      SAMTNERE
      SANIERER
      SCREENET
      SCREENTE
      SEDIEREN
      SEDIERET
      SEDIERST
      SEDIERTE
      SEEGRUND
      STREAMEN
      SUDERTEN
      TARSERIN
      TERMINES
      TRANSGEN
      UMTRETEN
    • Und hier kommen die neuen vollständigen Listen der wahrscheinlichsten 7- und 8-buchstabigen Wörter. Die ersten beiden Files sind wieder für den Gebrauch mit Zyzzyva gedacht. Sie enthalten zu jedem 7- oder 8-Buchstabenset jeweils nur ein Wort, weil Zyzzyva die Anagramme automatisch ergänzt.

      Die anderen beiden Files sind zum direkten Gebrauch gedacht, insbesondere auch zum Ausdrucken.

      Die Wörter sind nach ihrer Wahrscheinlichkeit geordnet, die wahrscheinlichsten zuerst.

      Bezüglich der Änderungen verweise ich auf die beiden vorhergehenden Postings.
      Dateien

      Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von linhart ()

    • Jetzt gibt es wieder ein Update meiner Listen der wahrscheinlichsten 7- und 8-buchstabigen Wörter.

      Die Listen sind so aufgebaut, dass in jeder Zeile am Anfang 7 oder 8 Buchstaben in alphabetischer Reihenfolge stehen und anschließend alle Wörter, die man aus diesen Buchstaben bilden kann. Die erste Zeile der 7-er-Liste sieht z.B. so aus:

      EEINRST EITERNS INERTES NIETERS REINSTE REISTEN REITENS RIESTEN SINTERE STERINE STIEREN

      (Nach dem "Alphagramm" EEINRST ist eigentlich ein größerer Zwischenraum, der hier aber nicht wiedergegeben werden kann.)

      Außerdem sind die Zeilen nach abnehmender Wahrscheinlichkeit geordnet. Der Buchstaben-Set EEINRST gehört also zu denen mit der größten Wahrscheinlichkeit.

      Jede der beiden Listen enthält 1000 solche Zeilen, das sind abgesehen von den Alphagrammen am Zeilenanfang jeweils mehr als 2000 Wörter.

      Die 2018 neu hinzugekommen Wörter sind durch Fettdruck hervorgehoben.

      Ich wünsch euch viel Spaß und Erfolg damit!
      Dateien
    • Für diejenigen, die gerne mit Zyzzyva trainieren, habe ich die beiden soeben beschriebenen Listen auch in einer dafür geeigneten Form. Das sind Textfiles, die für jedes Alphagramm nur ein zugehöriges Wort enthalten, da Zyzzyva bei einem "Quiz" die übrigen automatisch ergänzt
      Dateien
    • Jetzt habe ich von Martin L. eine Liste aller Wörter bekommen, die der Computer in 1 Million Spielen gelegt hat, zusammen mit den Anzahlen, wie oft jedes dieser Wörter gelegt wurde. Ich hab daraus Listen der 1000 am häufigsten gelegten 7- bzw. 8-buchstabigen Wörter für den Gebrauch mit Zyzzyva angefertigt, siehe Beilage.

      Vielen Dank an Martin!

      Und viel Spaß beim Üben!
      Dateien
    • Interessant und ziemlich Q-lastig. Ob das wohl auch daran liegt, dass 7-buchstabige Q-Wörter auch dann recht sinnvoll legbar sein können, wenn sie keinen Bingo darstellen?
      Dafür spricht, dass die Übermacht bei der 8-ern deutlich weniger ausgeprägt ist.

      Und sie haben wohl recht selten gültige Anagramme, so dass bei einer Buchstabenkombination nicht "geteilt" werden muss.
    • Bei der Erstellung dieser Listen wurden sämtliche Wörter gezählt, also nicht nur die Bingos und außerdem auch die Querwörter. Inzwischen gibt es auch Listen ohne Querwörter, und es wurden schon 20 Millionen Spiele gespielt. Darüber hinaus wurde jetzt nicht immer der Zug mit den meisten Punkten genommen: der Blanko wurde nur verwendet, wenn er 20 zusätzliche Punkte brachte.

      Es ist aber noch nicht klar, ob das für die Lernlisten nennenswerte Vorteile bringt. Jedenfalls habe ich eine Menge Listen, und ich glaube nicht, dass es sinnvoll ist, die hier alle einzustellen. Wenn sich jemand intensiver für diese Listen interessiert, bitte ich um eine private Konversation hier im Forum oder als E-Mail.

      Über die Details des verwendeten Computers bin ich nicht informiert. Ich weiß nur, dass er jeweils 4 Spiele gleichzeitig spielen kann.
    • Zur Q-Dominanz:

      Das E ist 15 mal häufiger als Q im Buchstabensatz, aber Wörter mit E kommen ca. 180 mal häufiger vor als Wörter mit Q. Jedes Q-Wort kommt also viel häufiger zum Einsatz als ein E -Wort, da es viel weniger davon gibt.
      Nach dem Q werden die Wörter mit X, J, oder Y oft verwendet, dann kommen D und U. Das unterstreicht die Wichtigkeit der Kenntnis von Wörtern mit diesen schwierigen Buchstaben. Für den Mangel an Einsatzmöglichkeiten sind D und U sehr unterbewertet, wie ja schon öfter festgestellt wurde.


      Häufigkeit einzelner Wörter durch Buchstabenverteilung/Wort-Häufigkeit
      Häufigkeit in WortlisteBuchstabenverteilungVorkommen einzelner Wörter
      Q0,09111,1111111
      X0,1715,88235294
      J0,1915,26315789
      Y0,215
      D2,3941,67364017
      U3,6361,65289256
      Ö0,6711,49253731
      V0,6711,49253731
      M2,7941,43369176
      Ü0,7911,26582278
      N7,3891,2195122
      I5,0561,18811881
      H3,4341,16618076
      O2,8331,06007067
      W0,9811,02040816
      C2,0220,99009901
      E16,08150,93283582
      F2,1820,91743119
      S7,6770,91264668
      G3,4430,87209302
      Ä1,1510,86956522
      R7,3760,81411126
      A6,1850,80906149
      K2,6320,76045627
      Z1,3510,74074074
      T8,4960,70671378
      B2,9820,67114094
      L5,0830,59055118
      P2,110,47619048




      Bei den 8-buchstabigen Wörtern ist die Q- Dominanz viel weniger ausgeprägt, vermutlich weil die 7 Buchstaben auf der Bank alle zum Einsatz kommen müssen und noch dazu mit der Situation auf dem Brett harmonieren müssen. Oder gibt es noch andere Gründe?

      Es fällt aber eine starke Dominanz des U auf, auch das D ist überproportional häufig.
      So haben alle der 16 häufigsten 8-buchstabigen Wörter ein U, 8 davon haben sogar 2 U.
      URSULINE war schon vor Jahren bei einer ähnlichen Berechnung der Spitzenreiter.

      Liste aus der Häufigkeit bei 20 Mill Spielen ohne Querwörter (mit Blanko ab +20 Punkten):

      URSULINE
      EUMENIDE
      NEURIESE
      UNRUNDES
      RESIDUUM
      EISENHUT
      EINHAUSE
      UNDERCUT
      UNRUHIGE
      HINDEUTE
      UNTREUES
      UNDULIER
      INDUSIEN
      CRUISEND
      NUTEISEN
      AUSDEUTE

      Dieser Beitrag wurde bereits 2 mal editiert, zuletzt von SONNENJAHR ()

    • Noch ein Grund dürfte sein, dass in der Liste Wörter ja offenbar auch dann erfasst werden, wenn sie nur als Hooks oder pure Verlängerungen gespielt werden. Es kommen also die vielen Gelegenheiten dazu, bei denen es im Endspiel noch die meisten Punkte bringt, z. B. an QUESEN noch ein -D anzuhängen.
      Bei den Bingos kommt es ja außerdem darauf an, wie oft ein Bingo "alternativlos" ist (um einen politisch aufgeladenen Begriff zu benutzen :P ). URSULINE ist so wertvoll, weil darin trotz der sehr wahrscheinlichen Buchstaben kein einziger 7er enthalten ist und auch nur wenige andere 8er mit den Buchstaben möglich sind.
      Spannend wäre es deshalb, eine Liste zu haben, bei der Bingos nur dann gezählt werden, wenn sie in der gegebenen Spielsituation die einzige Lösung waren. Das käme ein bisschen näher an die Idee heran, nach der im englischen Zyzzyva die Wörter geordnet sind, nämlich danach, wie "teuer" es über viele Spiele hinweg ist, ein Wort nicht zu kennen. Das ist eben nicht dasselbe wie seine Häufigkeit... Aber für Häufigkeitslisten bin ich auch schon sehr dankbar :thumbsup:
    • Frage(n) zum wichtigen Beitrag # 34:

      Was ist die genaue Definition der 'Bezeichnungen'. Bei Häufigkeit im Buchstabensatz erübrigt sich das, da selbsterklärend. Bei 'Häufigkeit in Wortliste': Ist das Summe aller 'Einzelbuchstaben' geteilt durch Gesamtzahl der Buchstaben der Wortliste? Und wie ist dann 'Vorkommen einzelner Wörter' im Bezug zum Einzelbuchstaben zu verstehen? Ist das konkrete Wort über der Summe aller Wörter zunächst die Grundlage? und wie sind dann mehrfach vorkommende Buchstaben dort eingebracht?

      Besonders hilfreich dazu wären Beispiele.

      Etwa so: Anagram EEQRU liefert die beiden Wörter QUERE und QUEER (neben kürzeren, die ich der Einfachheit weglasse). In der 'Häufigkeit in Wortliste' zählt das 2x für Q, R und U und 4x für E. Und bei 'Vorkommen einzelner Wörter' ??
    • Die Bezeichnung "Häufigkeit einzelner Wörter" ist etwas unklar.

      Es müsste heißen: "Verhältnis der "Häufigkeit des Buchstabens in der Wortliste" zu der "Häufigkeit des Buchstabens im Buchstabensatz".

      Damit kann man sehen, welche Buchstaben im Buchstabensatz überrepräsentiert sind (allen voran Q, aber man kann auch nicht weniger als ein Q haben) und welche unterrepräsentiert sind (insbesondere P, L und B).

      Das bestätigt diverse Vorschläge für eine neuen Häufigkeitsverteilung: z.B.:

      T: 6 + 1 = 7
      A: 5 + 1 = 6
      N: 9 - 2 = 7
      L: 3 + 1 = 4
      U: 6 - 1 = 5
      B: 2 + 1 = 3
      M: 4 - 1 = 3
      D: 4 - 1 = 3
      P: 1 + 1 = 2



      Die Häufigkeit in der Wortliste:

      geht auf Linharts Berechnungen vom 24.9. 2009 zurück:
      Neuer Buchstabensatz?
      Ich nutze die Häufigkeiten ohne Wichtung, Spalte c.

      Es sind die prozentuale Häufigkeiten der Wörter, die einen bestimmten Buchstaben enthalten.
      QUERE zählt also für alle Kategorien Q, U, E, und R. Die Summe alle Zählungen ist 100%.

      Erklärt:

      in jedem Spiel wird das Q einmal gezogen und das E 15 mal.
      Beim Legen des Q bedienen wir uns aus einem Pool von ca.1186 Wörtern (Wörter bis 9 Buchstaben) .
      Beim Legen der 15 Es bedienen wir uns aus einem Pool von ca. 150407 Wörtern (Wörter bis 9 Buchstaben).

      Die Q-Wörter werden also nach dieser Rechnung 8,5 mal so oft verwendet wie E -Wörter, oben in der Tabelle ist der Faktor noch höher. Insgesamt werden zwar weniger Q-Wörter als E-Wörter gelegt, aber die gelegten Q-Wörter schöpfen aus einem viel kleineren Pool.
      Das ist natürliche nur eine Abschätzung, es gibt viele weitere Faktoren. Die Es kann man ja auch mehrfach in einem Wort verbraten, was die Quote noch verschärft.

      Die Q-Dominanz sinkt stark, wenn man nur die Bingos zählt, wie in dieser Liste:

      7-buchstabige Bingos
      zusammen mit ihrer Häufigkeit bei 100000 Computerspielen:
      (Stand 14. 11. 2010)
      EINSAUE 70
      EIRUNDS 64
      SAUNIER 52
      INHOUSE 52
      EIRUNDE 52
      UNTREUE 49
      STUDIEN 48
      NEUHEIT 48
      EINSAUT 42
      EINHAUE 42
      NEURIES 41
      SUTUREN 40
      NEUERES 40
      TRIDUEN 38
      NEUROSE 38
      RUNDENS 37
      HEUETEN 37
      SAUEREI 36
      NUNTIUS 35




      Hier spielt die Legbarkeit der Buchstaben mit rein, die das Zusammenspiel der Buchstaben mit in Betracht zieht, Die Legbarkeit von E ist 24 mal höher als von Q.
      Die Legbarkeit wurde auch 2009 in dem erwähnten Thread besprochen.

      Der häufigste 7er Bingo mit Q ist ENQUETE mit 29 pro 100.000 Spielen.

      Manche Ergebisse der Computeranalysen sind mir noch nicht klar. So wurde bei 20 Mill Spielen das Wort

      XI ca 1,2 Mio mal, aber
      IX nur ca. 1 Mio mal gelegt.

      Warum ist XI häufiger als IX, ist das durch die Geometrie auf dem Brett bedingt oder nur ein Artefakt der Spielsoftware?