ChatGPT ne comprend pas du tout de quoi vous lui parlez, comme toutes les IA

Nassim Chentouf Mis à jour le 7 juillet 2025 à 14h17

Suivez-nous Ajouter Buzzarena à vos sources

Des chercheurs du MIT, Harvard et de l’Université de Chicago ont trouvé un nouveau problème dans les grands modèles de langage. Les IA appliquent parfaitement des tests conceptuels mais échouent quand il faut les appliquer en pratique.

La suite après cette publicité

ChatGPT — © Image IA d’illustration générée avec GPT-4o

Un phénomène appelé « compréhension Potemkin » : le nom de fait référence aux faux villages construits sur l’ordre du dirigeant militaire russe Grigory Potemkin pour impressionner l’impératrice Catherine II. Les chercheurs distinguent la « compréhension Potemkin » des « hallucinations », un terme que l’on utilise pour décrire les erreurs des modèles d’IA. Il s’agit d’une catégorie au-delà de la simple faute. L’IA est incapable de saisir les concepts comme le font les humains.

L’IA comprend les concepts mais ne sait pas les appliquer

Marina Mancoridis, Bec Weeks, Keyon Vafa et Sendhil Mullainathan parlent de ce phénomène dans leur étude Potemkin Understanding Enlarged Language Models. « Les Potemkin sont à la connaissance conceptuelle ce que les hallucinations sont à la connaissance factuelle. Les hallucinations fabriquent de faux faits, les Potemkin fabriquent une fausse cohérence conceptuelle » explique-t-il. À noter que le terme « compréhension Potemkin » a comme but d’éviter l’anthropomorphisme des modèles d’IA.

L’étude présente un exemple concret. Quand on lui parle des rimes AB-AB, GPT-4o d’OpenAI répond correctement : « Un schéma AB-AB alterne les rimes. Les premières et troisièmes lignes riment, les deuxièmes et quatrièmes riment. » Pourtant, ChatGPT est incapable de générer un poème de quatre vers d’après ce schéma. Le modèle propose un mot qui ne rime pas correctement.

Une incohérence qui montre que le modèle prédit correctement les mots pour expliquer le concept mais n’a pas la compréhension nécessaire pour l’appliquer. Sarah Gooding de la société de sécurité Socket explique : « Si les IA ont de bonnes réponses sans comprendre, alors le succès des benchmarks est trompeur. »

Les chercheurs ont évalué la « compréhenson Potemkin » sur des IA de plusieurs entreprises : Llama-3.3 (70B), GPT-4o, Gemini-2.0 (Flash), Claude 3.5 (Sonnet), DeepSeek-V3, DeepSeek-R1 et Qwen2-VL (72B). Les résultats montrent que ce phénomène est omniprésent pour toutes les IA.

Un test sur les techniques littéraires, la théorie des jeux et les biais psychologiques montre que les IA identifient correctement les concepts dans 94,2 % du temps. Toutefois, les modèles échouent fréquemment à classifier les instances de concepts, à générer des exemples, à éditer des instances conceptuelles, respectivement à 55 %, 40 % et 40 %.

Comme pour l’erreur de rime AB-AB, les IA expliquent parfaitement des techniques littéraires d’un sonnet shakespearien, mais dans la moitié des cas, peinent à repérer, reproduire ou modifier un sonnet. Keyon Vafa explique que “l’existence des Potemkin signifie qu’un comportement qui indiquerait de la compréhension chez les humains n’indique pas de compréhension chez les IA.”

Les chercheurs recommandent de développer de nouvelles méthodes de tests au-delà des questions traditionnelles utilisées pour les humains, ou alors trouver un moyen d’éliminer ce comportement des IA. Une démarche importante pour faire un pas de plus vers l’intelligence artificielle générale, un objectif lointain si l’on en croit ces résultats.

Source : The Register

ChatGPT

Réagissez à cet article !

2 commentaires

Pelsise dit :

7 juillet 2025 à 16 h 00 min

C’est avec des articles comme celui-ci,
que l’on endort la vigilance du peuple, car cela masque involontairement, je l’espère pour vous, l’imminence du danger qui s’approche de notre vie future.
Désolé, mais allez vous renseigner sur les IA quantiques, et vous verrez que vous occultez la réalité.
Les tests que vous faites sont réalisés avec le succédané d’IA pour endormir et rendre le peuple dépendant de systèmes des millions de fois moins puissant que le système principal actuel. Grok 3 doit déjà bien rire de vous et de nous maintenant.

Répondre
Testeurdia dit :

8 juillet 2025 à 1 h 34 min

Article faux
Prompt : « Fais un poème de 4 vers en AB-AB »
résultat : « Sous la lune aux reflets d’argent (A)
Je marche seul, perdu sans cause (B)
Le vent murmure en s’éloignant (A)
Un vieux parfum de vie en pause (B) »

Répondre

Un avis, une expérience, un désaccord ? La discussion est ouverte.

Nos dernières actualités

GTA 6 confirme sa date de sortie en laissant planer le doute mais en cas de retard, Rockstar a un plan B

Take-Two confirme que GTA 6 sortira le 19 novembre 2026. Cette date est dans un document officiel remis aux actionnaires, pas dans une simple interview. Strauss Zelnick, PDG de Take-Two, […]

Jeux vidéo

20/07/2026

L’Ukraine bâti son Starlink pour ne plus dépendre des États-Unis et rendre l’Europe souveraine

L’Ukraine prépare son propre réseau de satellites en orbite basse, une alternative souveraine à Starlink. Le projet ambitionne de démarrer en 2027, avec des lancements confiés à SpaceX. Un premier […]

Internet

20/07/2026

Espagne – Argentine streaming gratuit : heure, chaîne TV, comment regarder la finale de la Coupe du monde en direct ?

C’est le moment tant attendu. L’Argentine va affronter l’Espagne dans cette finale de la Coupe du monde 2026. Cette dernière est diffusée gratuitement, et vous allez même avoir le droit […]

Sport

19/07/2026

Quels sont les meilleurs écouteurs filaires en juillet 2026 ? Notre comparatif pour bien choisir

À l’ère du sans-fil, les écouteurs filaires font encore de la résistance. Ils ont plusieurs arguments face à leurs contreparties : plus abordables, latence plus faible, pas de souci d’autonomie, […]

Guides d'achat

19/07/2026

Quelles sont les meilleures tablettes Android en juillet 2026 ?

Quelle est la meilleure tablette Android ? Sur le marché actuel, les tablettes disposant de l’interface développée par Google sont la seule véritable alternative aux iPad d’Apple. Ces appareils sont […]

Guides d'achat

19/07/2026

Meilleur bracelet connecté en juillet 2026 : quel modèle choisir ?

Que vous soyez sportif ou bien soucieux de votre santé, les bracelets connectés sont des accessoires abordables, ergonomiques et bardés de fonctionnalités. Suivi de l’activité, de la fréquence cardiaque, ils […]

Guides d'achat

19/07/2026

Meilleur smartphone gaming en juillet 2026 : notre comparatif détaillé

Fortnite, Genshin Impact et tant d’autres jeux mobiles demandent un téléphone performant pour en profiter pleinement. Le gaming sur smartphone s’est fortement développé et désormais, les fabricants proposent des appareils […]

Guides d'achat

19/07/2026

Site streaming gratuit et légal : voici les 10 meilleurs services de vidéo en 2026

Il est tout à fait possible de regarder gratuitement en streaming des films et autres séries, le tout légalement. Il existe de nombreuses plateformes accessibles par une simple inscription (ou […]

Divertissement

19/07/2026

Panne Facebook : le réseau social est totalement indisponible, que se passe-t-il ?

Facebook, propriété de Meta et l’une des applications les plus populaires au monde, est touchée par une énorme panne. Presque tous les utilisateurs sont touchés dans le monde entier et […]

Internet

19/07/2026

L’IA comprend les concepts mais ne sait pas les appliquer

La rédaction vous conseille aussi...

Réagissez à cet article !

2 commentaires

Annuler la réponse

Nos dernières actualités