Site icon Blog ARC Optimizer

C'est le meilleur mot pour commencer Wordle, selon la science


Si vous avez été sur n'importe quelle plate-forme de médias sociaux au cours des deux dernières semaines, vous avez probablement vu une grille de carrés verts, jaunes et noirs. Il s'agit du dernier phénomène pandémique appelé Wordle – un jeu en ligne gratuit qui offre aux utilisateurs un nouveau puzzle de mots chaque jour. Il a été créé par Josh Wardle pour son partenaire amoureux des mots croisés. Au 10 janvierle jeu comptait 2,7 millions de joueurs.

Dans Wordle, les joueurs ont six tentatives pour deviner un mot cible de cinq lettres. Chaque fois qu'ils font une supposition, on leur dit quelles lettres dans leur supposition sont dans le mot et dans la bonne position (vert), et quelles lettres y sont mais dans une position différente (jaune). C'est un peu comme le jeu de société Mastermind mais avec une différence essentielle. Dans Mastermind, les six couleurs étaient également susceptibles d'apparaître dans la cible. Dans Wordle, parce que les suppositions et les cibles doivent toutes être de vrais mots, certaines lettres sont plus susceptibles d'apparaître, ce qui rend certaines suppositions meilleures que d'autres.  : quel est le meilleur premier mot à deviner ?

Comment trouver le meilleur premier mot à deviner ?

Pour l'instant, définissons le "meilleur premier mot à deviner" comme celui qui est le plus susceptible de partager le plus de lettres avec le mot cible. Ce que nous devons savoir, c'est : quelle est la fréquence de chacune des 26 lettres dans les mots anglais de cinq lettres. Et pas n'importe quels mots de cinq lettres, ceux qui ont une chance d'apparaître comme des cibles. niveaux d'une mine) n'ont pas besoin de s'appliquer.

J'ai trouvé une étude récente qui a examiné plus de 60 000 mots anglais et leur notoriété. Ce type de statistique est intéressant pour les chercheurs en langues comme moi, car il reflète la facilité avec laquelle un mot peut être traité : en moyenne, les mots les plus connus sont lus plus rapidement.

J'ai pris tous les mots de cinq lettres qui étaient connus par au moins 50 % des personnes étudiées (si vous connaissiez « nisus » ou « winze » – je ne le savais certainement pas – vous partagez cet exploit avec seulement 7 % de l'échantillon). Ensuite, j'ai compté le nombre de fois où chaque lettre est apparue au moins une fois dans un mot.

Fréquences des lettres

La lettre la plus courante était le "e", apparaissant dans 46 % des mots. Il s'agit d'un modèle bien connu qui s'applique à la langue anglaise en général. Une exception notable est le roman de George Perec A Voidqui a été délibérément écrit sans la lettre « e ». Ce schéma a même été utilisé par Sherlock Holmes dans L'aventure des danseurs pour décoder un chiffre composé de figures de bâtons dansants en estimant que le symbole le plus courant serait « e ».

La mystérieuse séquence de figures de bâtons de danse que Holmes déchiffre dans L'aventure des hommes qui dansent. Crédit : l'auteur a fourni

L'une des raisons pour lesquelles le "e" est si courant est l'avènement des e silencieux à la fin des mots au XVIe siècleutilisés pour signaler quelque chose à propos des sons précédents. Par exemple, "tone" se prononce différemment de "ton".

Les lettres suivantes les plus courantes étaient : "a" (39 %), "r" (34 %), "o" (29 %) et " i » et « s » à égalité au cinquième rang (28 %). Sur ces six lettres, un mot est immédiatement « apparu » comme la meilleure option ! Vous voulez une première estimation particulièrement mauvaise ? Essayez "whump" (un bruit sourd sourd). C'est à peu près le pire selon cette métrique.

Mais alors que "surgi" est le plus susceptible de vous faire entrer des lettres dans la cible, elles peuvent ne pas être dans les bonnes positions.

Les lettres les plus fréquentes, par position, dans mots courants de cinq lettres.

Si nous voulons un mot qui est le plus susceptible d'obtenir des lettres dans leurs positions correctes, la meilleure option est "samey" (monotone, répétitif, invariable). Mais ne nous arrêtons pas là. Si nous rassemblons ces approches en une seule partition finale, nous obtenons un mot qui semble étrangement familier : "soare" (un jeune faucon) – "s'est levé" mais dans un ordre plus stratégique.

Une dernière chose à noter. En écrivant cet article, j'ai découvert que les gens avaient pénétré dans le code source du site Web Wordle et trouvé la liste réelle des mots pouvant apparaître comme cibles. J'ai décidé de ne pas utiliser cette liste parce que je trouvais plus amusant d'essayer de répondre à la question avec les ressources linguistiques disponibles. De plus, cette liste pourrait changer et je voulais trouver une réponse plus générale.

Mais, juste pour vous rassurer, quand je fais tout ce qui précède avec cette liste de cibles Wordle "officielles", "soare" se termine jusqu'à être le meilleur une fois de plus. Alors voilà. Maintenant, ce que vous faites avec les suppositions deux à six dépend de vous. ]UCL est republié à partir de The Conversation sous une licence Creative Commons. Lisez l'article original.




Source link
Quitter la version mobile