Il y a quelques temps a eu lieu un événement renversant pour tous les adeptes d’orthographes et de jeux de mots. Un système d’IA a battu près de 1 300 concurrents humains dans le cadre de l’American Crossword Puzzle Tournament (ACPT), un tournoi annuel de mots croisés américain et a obtenu le meilleur score.
L’ordinateur, baptisé Dr Fill, est le fruit du travail de l’informaticien Matt Ginsberg, sorti d’Oxford, qui a conçu le logiciel pour remplir automatiquement les mots croisés en utilisant un mélange d’IA et de techniques apprentissage automatique. Il a été capable de résoudre rapidement des énigmes à mots multiples avec moins d’erreurs que ses adversaires.
Cette année, en raison de la conjoncture sanitaire, des changements ont été opérés au niveau du tournoi de mots croisés. Si, d’habitude, celui-ci est organisé dans une salle énorme remplie de joueurs, cette fois-ci, tout s’est fait à distance. Plus de crayons et surtout, bonjour les claviers. Contre toute attente, un programme informatique est arrivé en tête du classement. Une première dans l’histoire du mot-croisé, mais aussi de l’intelligence artificielle. « J’étais nul avec les mots croisés, et ça m’a tout simplement énervé.» dira Matt Ginsberg tout en ajoutant que son rêve était de sortir vainqueur d’une salle de tournoi, son laptop sur la tête. Et aujourd’hui, c’est devenu une réalité grâce à Dr. Fill, son invention.
Le déroulement du championnat de mots-croisés
Organisé depuis 1978, l’ACPT (American Crossword Puzzle Tournament) est un lot d’énigmes réalisé par Will Shortz, fondateur du puzzle. Conçu par les meilleurs dans ce domaine, sa complexité est telle qu’il faut deux jours d’affilée pour le résoudre. Les trois meilleurs solveurs devront, par la suite, démêler un puzzle pour la victoire du championnat qui, en temps normal, se complète sur des grandes grilles effaçables. Tout au long de la compétition, les participants sont classés selon une formule qui équilibre précision et rapidité. Les meilleurs concurrents humains sont toujours parfaits et peuvent résoudre l’équivalent d’une énigme très difficile en trois minutes. Dr Fill n’était pas parfait.Il a terminé le tournoi avec trois erreurs. Mais sa vitesse fulgurante l’a aidé à battre tous les concurrents, devançant le meilleur humain de 15 points. La plupart des énigmes ont été résolues par Dr Fill en moins d’une minute.
Pour pouvoir battre ses concurrents, Dr Fill a intégré le contenu entier de Wikipédia et une base de données géante d’indices et de réponses de mots croisés glanés sur le web. ce n’est pas la première fois que ce programme fait ce concours. Il a fait ses débuts à l’ACPT en 2012, où il a terminé à la 141e place. Et il faudra attendre 2017 pour qu’il atteigne la 11e place aprés enormement d’amélioration.
Il y a eu deux choses qui ont permis cet exploit. Tout d’abord la Covid-19 qui a bloqué tout le monde à la maison. Ce qui a fait que Daniel Klein, un informaticien américain et professeur d’informatique à l’Université de Californie à Berkeley et ses étudiants ont intégré le projet Dr Fill. Klein et son equipe travaille sur le traitement du langage naturel et l’intelligence artificielle. Le groupe de Klein s’est attelé à la création du Berkeley Crossword Solver, qui se présente sous la forme d’un système de réponse aux questions, un peu comme Siri ou Alexa. La de»uxieme chose est l’ordinateur. Cette fois çi, c’est sur un ordinateur de bureau personnalisé doté d’un processeur à 64 cœurs et de deux processeurs graphiques, une boîte lourde que Ginsberg ne transporterait pas habituellement, qu’a tourné le Dr Fill. La version qui a gagné le tournoi est le système de Berkeleyqui est basé sur un réseau neuronal entraîné sur 6 millions d’indices et de réponses et des systèmes d’apprentissage automatique un peu comme le système AlphaGo de DeepMind qui a conquis l’ancien jeu chinois Go.
« Notre connaissance du langage est basée sur le fait que nous parlons beaucoup, que nous entendons les gens parler et que nous lisons beaucoup de choses. Tout ce langage que nous utilisons et auquel nous avons été exposés, il laisse une trace. Et ces systèmes [d’intelligence artificielle] ne sont pas vraiment différents », a déclaré Klein. « Le programme de Berkeley est comme quelqu’un qui aurait été élevé non pas par des loups, mais par des mots croisés dotés de sensibilité. Il apprend en faisant des mots croisés et ce système a fait beaucoup de mots croisés. Les gens ont joué moins de mots croisés, mais ont vécu dans le monde », dit Klein.
L’alliance s’est faite naturellement. Ginsberg et l’équipe de Berkeley ont commencé à travailler ensemble deux semaines avant le tournoi, en branchant le second système sur le premier, et le programme a finalement été lancé quelques jours avant le tournoi. Le résultat, bien que construit à la hâte, était une merveille, ses pièces travaillant de concert pour résoudre des mots croisés. Le système de Ginsberg s’occupait de la grille et du côté froid et mathématique des choses, de la recherche et du placement des réponses, tandis que le système de l’équipe de Berkeley s’occupait du côté plus flou et « humain » du langage des indices, la musique des mots croisés.
Enfin, Dr Fill n’était pas éligible pour le premier prix de 3 000 dollars, mais il a tenté de résoudre le puzzle du championnat. Le champion humain, Tyler Hinman, l’a résolu en trois minutes, un temps incroyablement rapide. Dr Fill l’a parfaitement résolu en 49 secondes.