9 décembre 2024

Après les jeux d’échecs et le Go
DeepMind apprend à jouer au football

IA par ci. IA par là. C’est la décennie de l’IA. L’IA est partout : dans les jeux (comme le go ou les jeux d’échecs), dans la recherche, dans les voitures autonomes, dans le décryptage des textes anciens, dans la création d’œuvres artistiques de qualité, dans les fakenews, mais aussi dans la création de texte pour des articles de journaux et tant d’autres choses à venir…
DeepMind, qui appartient à Google, et qui a réussi à gagner le plus grand joueur de Go coréen fait encore parler de lui en s’attaquant cette fois-ci au football.
L’entreprise spécialisée en intelligence artificielle DeepMind fait partie des références mondiales dans ce domaine, avec tout un tas de contributions exceptionnelles à son actif.

DeepMind vient de lancer un nouveau système capable d’apprendre à jouer au football en équipe en seulement 3 semaines en utilisant cette fois le Deep Learning associé au NPMP — Probabilités motrices neurales primitives —. Il s’agit d’un véritable exploit dans le domaine de l’IA, car combiner l’apprentissage du contrôle des mouvements des articulations au fait d’anticiper un comportement censé servir un objectif collectif à long terme est un défi de longue date.
Pour cela, l’IA a dû apprendre l’équivalent de 20 à 30 ans de matchs en simulation pour imiter parfaitement les mouvements de vrais joueurs et maîtriser des jeux d’équipe complexes, grâce au modèle d’apprentissage NPMP. L’algorithme de DeepMind décortique ces données afin d’apprendre à imiter certains mouvements complexes dans un simulateur physique, par l’intermédiaire d’un avatar virtuel. Une nouvelle étude, décrite dans la revue Science Robotics, expose comment le système NPMP est capable résoudre les incohérences ou inconvénients, en mettant en place un apprentissage automatique drivé par des modèles de mouvements naturels d’humains et d’animaux.

L’apprentissage en phase

La première phase de la conception du programme a été de pouvoir apprendre aux humanoïdes à courir avec les mouvements les plus naturels possible, en imitant ceux de footballeurs filmés au préalable. La seconde étape a été d’apprendre à dribbler et passer le ballon, ou marquer un but. Au total, ces deux premières étapes représentent un an et demi de formation sportive, et l’IA l’a appris en seulement 24 heures.
Les premières simulations ont été effectuées avec un modèle d’humanoïde portant et déplaçant un objet. Les tests d’application pour le contrôle robotique dans le monde réel ont été simulés avec un robot driblant une balle. Ces apprentissages ont ensuite permis à l’IA d’apprendre à jouer (virtuellement) au football, un jeu nécessitant des compétences individuelles et un jeu d’équipe coordonné. C’est grâce à ces derniers que l’IA gagne en efficacité et apprend au fur et à mesure à comprendre puis à interpréter les mouvements des joueurs, tant par rapport à la balle qu’à partir des différentes situations auxquelles ils sont confrontés lors d’un match.

Exploitation de l’apprentissage

Tels des enfants grandissant en accéléré, « ils apprennent d’abord à marcher, puis ils apprennent à dribler, puis à faire jouer en un contre un ou deux contre deux », explique Guy Lever, co-auteur principal de la nouvelle étude et chercheur chez DeepMind.
La troisième étape consistait à apprendre aux humanoïdes à marquer des buts dans le cadre de matchs à deux contre deux. Cette phase nécessite une coordination de groupe, une anticipation de l’endroit d’où proviennent les passes, un partage des tâches, des prises de décision rapides, etc. Ces compétences ont été acquises par l’IA en seulement deux à trois semaines, et seraient équivalentes à 20 à 30 ans de matchs.
L’ensemble de ces apprentissages a permis de faire passer les humanoïdes de simples « poursuiveurs de ballons » à des équipes complexes et coordonnées. Selon les chercheurs, les comportements coordonnés apparaissent progressivement quand les équipes (virtuelles) sont amenées à entrer en compétition.
Le premier pas vers la première équipe de football entièrement composée de robots humanoïdes ? Plus vite qu’on le pense…

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *