Aujourd'hui, l'IA impressionne déjà. Alors pourquoi Yann LeCun estime-t-il qu'elle est encore loin du compte ?

« L’IA actuelle impressionne car elle maîtrise le langage. Elle écrit, résume, répond avec fluidité, parfois mieux qu’un humain sur certaines tâches. Mais cette performance repose sur une logique statistique profonde : le modèle apprend à prédire quel mot vient ensuite dans une séquence. Il a été entraîné sur des quantités massives de texte humain, et les résultats sont remarquables. Pourtant, ce fonctionnement a une limite structurelle que LeCun martèle depuis des années.

Un modèle de langage (LLMs) n’a jamais vu le monde. Il n’a jamais tenu un objet, observé la chute d’une balle, ou fait l’expérience de la gravité. Il a uniquement lu des descriptions de ces phénomènes. Ce n’est pas la même chose. Un enfant de deux ans comprend intuitivement qu’un verre posé au bord d’une table va tomber. Un grand modèle de langage, lui, peut rédiger un essai sur la gravité sans avoir jamais « compris » ce principe dans un sens fonctionnel.

Cette dépendance au texte entraîne deux fragilités majeures. D’abord, les hallucinations : le système produit la réponse statistiquement la plus plausible, même si elle est fausse, car il n’a aucun repère externe pour vérifier ce qu’il avance. Ensuite, l’incapacité à s’adapter à des situations réellement nouvelles ou physiques, là où le contexte ne peut pas être réduit à du texte. Pour LeCun, les modèles actuels donnent l’illusion de l’intelligence, mais restent fragiles dès qu’il faut raisonner de façon fiable dans le monde réel. » – Claude AI

Concrètement, qu'est-ce que Yann LeCun veut construire de différent avec son milliard de dollars ?

« AMI mise tout sur une approche radicalement différente : les world models, ou modèles du monde. L’idée centrale est que pour qu’une machine soit véritablement intelligente, elle doit d’abord se construire une représentation interne de la réalité, une sorte de simulateur mental du monde physique, avant de pouvoir agir dessus. LeCun décrit ce modèle du monde comme un « jumeau numérique abstrait de la réalité que l’IA peut utiliser pour comprendre le monde, prédire les conséquences de ses actions, et planifier en conséquence”.

L’architecture technique au cœur de ce projet s’appelle JEPA : Joint Embedding Predictive Architecture. Elle fonctionne de façon fondamentalement différente des LLMs. Au lieu de prédire chaque mot ou pixel suivant, JEPA apprend à prédire des représentations abstraites : elle encode les entrées dans un espace conceptuel, puis prédit comment cet espace évolue. Cela lui permet de se concentrer sur les informations essentielles et d’ignorer les détails non pertinents.

Concrètement, imaginons un robot qui observe une scène. Un LLM classique essaierait de reconstituer chaque pixel de l’image suivante. JEPA, elle, va abstraire la scène : « il y a un objet instable sur le bord d’une surface » ; et prédire ce qui va se passer au niveau conceptuel, sans se noyer dans les détails. AMI prévoit notamment de développer un modèle vidéo baptisé AMI Video, entraîné sur des flux visuels réels, pour apprendre ces représentations du monde directement depuis la réalité en mouvement. » – Claude AI

Si son pari fonctionne, qu'est-ce que ça changera concrètement ?

« AMI cible explicitement des secteurs où la fiabilité et la sécurité sont critiques : la robotique, l’automatisation, les dispositifs médicaux portables, les hôpitaux, et les processus de contrôle en temps réel. Dans ces environnements, une erreur de prédiction n’est pas un inconvénient, c’est un risque humain. Le CEO d’AMI, Alexandre LeBrun, qui a fondé la startup médicale Nabla, a évoqué cet impératif de fiabilité comme l’une des raisons principales qui l’a poussé à rejoindre le projet. 

Un robot équipé d’un world model pourrait naviguer dans un entrepôt qu’il n’a jamais vu, anticiper qu’une caisse mal empilée va tomber, et ajuster ses actions en temps réel, sans instruction explicite. Ce basculement déplacerait aussi la valeur économique. Les entreprises capables de maîtriser ces systèmes prendraient l’avantage dans des secteurs industriels très concrets, bien au-delà du numérique.

Il faut néanmoins tempérer l’enthousiasme : AMI n’a aujourd’hui aucun produit, aucun revenu, et aucune perspective commerciale à court terme. LeCun lui-même a reconnu que la première année sera consacrée entièrement à la recherche fondamentale. Les modèles du monde restent un projet scientifique de long terme. Ce que le milliard de dollars démontre surtout, c’est que les investisseurs sont prêts à attendre, parce que la cohérence et la crédibilité scientifique de LeCun rendent de moins en moins sûr de le rejeter. » – Claude AI

Nom d'auteur Juliette Lamy
Juliette Lamy a fait ses armes dans l’audiovisuel puis à la rédaction de Gala.fr et Webedia. Au sein de The New Siècle, elle orchestre les formats exclusifs : Interview, 1 Min Chrono, Le Versus et Entretien avec l’IA. Quelle que soit la thématique, intelligence artificielle, innovations, gaming, elle traque toujours l’intention. Ce que cela change, pour qui... et surtout pourquoi.
bloc pub

Laisser un commentaire

Inscrivez-vous !

INSCRIVEZ-VOUS À
NOTRE NEWSLETTER !

Renseignez votre adresse mail
pour recevoir nos nouveautés
et rester informé de nos actualités.