Yann LeCun lève 1 milliard pour «humaniser» l’IA Le pari risqué…

L’ex-patron de l’IA chez Meta secoue la Silicon Valley avec AMI Labs avec pour objectif d’inventer une nouvelle génération d’intelligence artificielle capable de raisonner comme l’humain, loin des simples « autocomplete géants ».

C’est l’une des levées de fonds les plus importantes de l’histoire de l’IA. Yann LeCun, figure tutélaire du deep learning et ex-directeur scientifique de Meta, vient de boucler 1,03 milliard de dollars pour sa startup AMI Labs (Advanced Machine Intelligence). Valorisée 3,5 milliards de dollars avant même de commercialiser un produit, la jeune pousse entend révolutionner le domaine en s’attaquant au talon d’Achille des modèles actuels à savoir leur incapacité à raisonner. Son arme ? Les « world models ». Explications sur un pari technologique qui pourrait redessiner le paysage de l’intelligence artificielle.

De Meta à l’aventure entrepreneuriale
Yann LeCun n’est pas un inconnu. Prix Turing 2018 (l’équivalent du Nobel de l’informatique), il est l’un des «pères fondateurs» du deep learning moderne. Depuis 2013, il dirigeait la recherche en intelligence artificielle chez Meta (ex-Facebook), où il a supervisé le développement des systèmes de vision par ordinateur et des premiers grands modèles de langage.

La décision de LeCun de quitter Meta en 2025 pour lancer AMI Labs illustre une tension croissante dans la Silicon Valley. Les chercheurs fondateurs des technologies dominantes, ici les réseaux de neurones profonds, estiment de plus en plus que les grandes entreprises tech privilégient l’échelle (plus de données, plus de puissance de calcul) à l’innovation algorithmique fondamentale. Ils choisissent alors l’entrepreneuriat pour explorer des voies alternatives.

Sa démarche rappelle celle de Geoffrey Hinton, autre «parrain» du deep learning, qui a quitté Google en 2023 pour dénoncer les risques de l’IA, ou celle d’Ilya Sutskever, co-fondateur d’OpenAI, parti créer Safe Superintelligence fin 2024.

Les « perroquets stochastiques »
Pour comprendre le pari d’AMI Labs, il faut saisir la critique radicale que LeCun formule à l’encontre des modèles de langage actuels (LLM). Un LLM (Large Language Model) est un système d’IA entraîné sur d’immenses quantités de texte pour prédire le mot suivant dans une séquence. GPT-4, Claude, Gemini ou Llama sont des LLM. Ils fonctionnent par « auto-complétion statistique avancée », sans compréhension réelle du monde. Et oui, c’est des statistiques

Par contre, LeCun ne mâche pas ses mots. Il qualifie les LLM de « perroquets stochastiques » c’est a dire qu’ils répètent des formes linguistiques apprises par cœur, sans raisonnement causal, sans planification, sans modèle interne de la réalité. Leur « intelligence » est une illusion de surface, fondée sur la corrélation statistique plutôt que sur la compréhension.
Les symptômes de cette faiblesse sont désormais bien documentés. Premièrement, les hallucinations qui sont des inventions factuelles énoncées avec une confiance totale. Deuxièmement, l’incapacité à planifier des actions sur le long terme, contrairement à l’humain qui anticipe les conséquences de ses choix. Troisièmement, la difficulté à apprendre à partir de peu d’exemples, alors qu’un enfant peut généraliser à partir d’une seule observation. Quatrièmement, et peut-être plus fondamentalement, l’absence de compréhension physique du monde. Un chatbot peut « savoir » qu’une balle tombe vers le bas, mais il ne le « comprend » pas car il n’a aucune intuition de la gravité, de la masse ou de l’espace.

Et pour bien comprendre ses choix, voila ce que Yann LeCun disait en 2024 lors d’une conference UE « Les LLM sont une impasse. Ils consomment des quantités astronomiques d’énergie et de données pour produire des résultats limités. Nous avons besoin d’une architecture fondamentalement différente. ». Coïncidence ou rupture stratégique ? LeCun ne le dit pas explicitement.

Les « world models »
C’est ici qu’intervient le concept de « world model » (modèle du monde), le cœur de la stratégie d’AMI Labs. Un world model est un système d’IA capable de construire une représentation interne de la réalité physique et sociale, de simuler mentalement les conséquences d’actions possibles, et de planifier en conséquence. Contrairement aux LLM qui traitent des symboles linguistiques, les world models visent à modéliser les causes et effets du monde réel.

L’idée n’est pas nouvelle. Elle puise dans les travaux de la psychologie cognitive (la « simulation mentale » humaine) et dans l’apprentissage par renforcement profond. Ce qui change, c’est l’ambition de LeCun celle de créer des architectures neuronales capables d’apprendre ces modèles du monde de manière autonome, par observation et interaction, comme le fait un enfant.

Les promesses des world models sont considérables. Premièrement, le raisonnement causal car au lieu de se contenter de décrire ce qui se passe, le système comprend pourquoi cela se produit, établissant des liens de cause à effet. Deuxièmement, la planification. Il devient capable d’anticiper les conséquences de ses actions sur plusieurs étapes futures, comme un joueur d’échecs qui simule mentalement les coups à venir. Troisièmement, l’apprentissage efficace. En effet, il peut apprendre à partir de très peu d’exemples, à l’instar de l’humain qui généralise rapidement. Quatrièmement, la robustesse car il sait s’adapter à des situations nouvelles, jamais rencontrées pendant son entraînement, plutôt que de se figer face à l’inconnu.

Le concept de world model est au cœur des systèmes d’IA les plus performants dans les jeux vidéo. AlphaGo de DeepMind utilisait une forme de modèle du monde pour simuler des parties futures. Mais ces systèmes restaient limités à des domaines étroits (le go, les échecs). Le défi d’AMI Labs est de généraliser cette capacité à l’ensemble de la réalité.

La confiance des investisseurs malgré l’absence de produit
La levée de fonds d’AMI Labs est remarquable à plus d’un titre. 1,03 milliard de dollars pour une startup sans produit commercial, sans revenus, sans même de démonstration publique. Une valorisation de 3,5 milliards de dollars qui place directement AMI Labs parmi les licornes de l’IA.

Qui investit ? Si les noms des investisseurs n’ont pas été officiellement dévoilés, plusieurs profils peuvent être supposés. Premièrement, des fonds de capital-risque spécialisés en deep tech, tels que Sequoia, Andreessen Horowitz ou Index Ventures, qui cherchent à positionner tôt sur les ruptures technologiques majeures. Deuxièmement, des investisseurs souverains à la recherche de souveraineté technologique, comme les fonds souverains du Moyen-Orient ou de Singapour, désireux de diversifier leurs portefeuilles dans l’IA de pointe. Troisièmement, des anciens employeurs ou collègues de LeCun, sachant que Meta a par le passé soutenu financièrement des spin-offs créés par ses propres chercheurs.

Cette confiance massive s’explique par le statut unique de LeCun. En tant qu’inventeur des réseaux de neurones convolutifs (CNN), pierre angulaire de la vision par ordinateur moderne, il a déjà prouvé sa capacité à identifier et développer des paradigmes fondamentaux. Les investisseurs parient que, si quelqu’un peut inventir « l’après-LLM », c’est bien lui.

À titre de comparaison, OpenAI a été valorisée 157 milliards de dollars en octobre 2024, mais avec des revenus estimés à 3,4 milliards de dollars annuels. Anthropic (Claude) a levé 4 milliards de dollars en 2024 pour une valorisation de 18 milliards. La valorisation d’AMI Labs, bien que plus modeste, est exceptionnelle pour une entreprise en phase pure de recherche.

De la théorie à la pratique
Le pari d’AMI Labs est audacieux, mais les obstacles sont immenses. Les world models ont été « le prochain grand truc » de l’IA pendant des années, sans véritable percée commerciale.
Plusieurs défis majeurs se dressent devant AMI Labs. Premièrement, la complexité computationnelle car simuler le monde physique avec précision nécessite une puissance de calcul colossale, et les premiers prototypes de world models développés par DeepMind pour les jeux vidéo consomment autant d’énergie que des LLM, voire davantage.
Deuxièmement, l’acquisition des données car contrairement aux LLM qui se nourrissent de textes disponibles en ligne, les world models nécessitent des données d’interaction avec le monde physique ou des simulations extrêmement réalistes, or il n’existe pas de « corpus internet » de la causalité physique.
Troisièmement, la génération de contenu car si les LLM ont conquis le monde par leur capacité à produire du texte fluide, les world models , axés sur le raisonnement et la planification; pourraient exceller dans des tâches complexes comme la robotique, la conduite autonome ou la recherche scientifique, mais peiner à produire des interactions conversationnelles directes, ce qui soulève la question de savoir comment créer un produit grand public.
Quatrièmement, la concurrence des géants. En efft, OpenAI, Google DeepMind et Meta investissent massivement dans des approches hybrides combinant LLM et raisonnement, et LeCun doit démontrer que son approche « from scratch » est supérieure à ces améliorations incrémentales.

Le lancement d’AMI Labs pourrait marquer un tournant dans l’histoire de l’intelligence artificielle avec la fragmentation du paradigme dominant. Depuis 2022 et l’explosion de ChatGPT, le monde de l’IA convergeait vers une seule architecture car les transformers (base des LLM), toujours plus grands, toujours plus gourmands. Avec AMI Labs, une voie alternative émerge, remettant en cause l’« hypothèse d’échelle » (scaling laws) qui prévalait jusqu’ici.

Scénarios possibles
Plusieurs scénarios se dessinent à l’horizon pour AMI Labs. Dans le premier, celui du succès technique, la startup parvient à produire des systèmes supérieurs aux LLM pour certaines tâches critiques, une probabilité estimée comme moyenne par les observateurs.
Dans le second, celui de l’intégration hybride, jugé le plus probable, les world models ne remplacent pas les architectures existantes mais y sont intégrés comme modules spécialisés, enrichissant les capacités des LLM sans les abolir.
Dans le troisième, celui de l’échec commercial, la technologie demeure confinée à la recherche académique sans trouver de débouché industriel, une éventualité considérée comme peu probable à moyennement probable selon les experts.

Si LeCun réussit, ce n’est pas seulement OpenAI qu’il menace, c’est l’ensemble de l’industrie qui doit repenser ses fondamentaux. Mais l’histoire de l’intelligence artificielle est parsemée de promesses non tenues, de paradigmes annoncés comme révolutionnaires avant de sombrer dans l’oubli. En définitive, seuls le temps et l’adoption par les clients et non les communiqués de presse ou les levées de fonds qui trancheront de la validité de ce pari technologique.

Une lueur d’espoir pour une IA plus sobre et plus intelligente
La levée historique d’AMI Labs envoie un signal fort. La quête de l’intelligence artificielle « vraie », celle qui raisonne et comprend, n’est pas terminée. Elle pourrait même commencer.
Pour l’Algérie et les pays en développement, cette évolution est à surveiller de près. Si les world models tenaient leurs promesses, ils pourraient en effet ouvrir des voies d’accès à l’intelligence artificielle plus sobres en données et en calcul, des ressources précieuses et rares dans le Sud global, contrairement aux LLM actuellement dominants, réputés pour leur appétit dévorant en ressources de calcul et en corpus d’entraînement massifs. À condition de suivre de près ces développements et d’investir dès maintenant dans la formation aux nouvelles architectures.
Le pari de Yann LeCun est risqué, mais il incarne la vitalité d’un champ de recherche qui refuse de s’endormir sur ses lauriers. Dans trois à cinq ans, nous saurons si les 1,03 milliard investis ont acheté une révolution ou un rappel amer que, en IA, les promesses fondamentales mettent des décennies à se concrétiser.

A Savoir

Définition du world model
Un world model (modèle du monde) est un système d’intelligence artificielle capable de construire une représentation interne de la réalité, physique, sociale ou mécanique, et d’utiliser cette représentation pour prédire, planifier et raisonner, exactement comme le fait un cerveau humain. Les world models représentent une rupture philosophique dans l’IA qui est de passer de systèmes qui « parlent » le monde (LLM) à des systèmes qui le « comprennent ».
Analogie. Imaginez un conducteur expérimenté qui approche d’un feu rouge. Il ne réagit pas seulement à ce qu’il voit (le feu rouge), il anticipe : « Si je freine maintenant, la voiture s’arrêtera à temps. Si je continue, je risque de heurter le véhicule de devant. » Cette simulation mentale, cette capacité à imaginer les conséquences futures d’actions possibles, c’est ce qu’un world model tente de reproduire artificiellement.

Les world models existent déjà, mais de manière limitée.
DeepMind (Google) : Ses algorithmes de jeux (AlphaGo, AlphaStar) utilisent des modèles du monde pour simuler des parties futures. Mais ils sont confinés à des règles strictes (go, échecs, StarCraft).
Voitures autonomes (Tesla, Waymo) : Elles utilisent des formes rudimentaires de world models pour prédire les trajectoires des autres véhicules.
Robots industriels : Certains apprennent à manipuler des objets en simulant mentalement les conséquences de leurs mouvements.

Yann LeCun lève 1 milliard pour «humaniser» l’IA <BR> Le pari risqué des «world models»

Abderrafiq Khenifsa

Laisser un commentaire Annuler la réponse

Abderrafiq Khenifsa

Vous pourriez aussi aimer

Fruit de la collaboration entre Google et NXP Semiconductors : La plate-forme Android s’enrichit d’une « pile logicielle »

Bourse

Une mauvaise affaire ?

Laisser un commentaire Annuler la réponse