L'IA la plus dangereuse d'Anthropic a été utilisée par des inconnus, le modèle secret a fuité

Des personnes non autorisées ont accédé à Claude Mythos. Ce modèle de cybersécurité d’Anthropic est jugé trop dangereux pour le grand public. Le 21 avril 2026, Bloomberg a révélé que des utilisateurs d’un forum Discord privé ont contourné les protections du modèle dès le jour de son annonce. Anthropic a ouvert une enquête.

Sommaire

Des inconnus ont accédé à Mythos, l’IA dangereuse d’Anthropic
Une IA capable de trouver les failles graves
Une prudence qui n’a pas suffi à protéger Mythos

© Image IA d’illustration générée avec Gemini

Des utilisateurs d’un forum Discord privé ont accédé sans autorisation à Claude Mythos, une IA d’Anthropic pourtant réservée à quelques entreprises.
L’accès s’est fait via les identifiants d’un sous-traitant après avoir deviné l’adresse du modèle, et Anthropic a ouvert une enquête.
Ce modèle est jugé très sensible, capable de trouver des failles critiques et de mener des attaques complexes, ce qui rend cet accès non contrôlé particulièrement préoccupant.

Il faut dire que Claude Mythos n’est pas un modèle ordinaire. Il a été annoncé le 7 avril 2026 et Anthropic l’a décrit comme une IA au niveau des meilleurs experts en cybersécurité pour trouver des failles dans les logiciels. L’entreprise a refusé de le mettre en vente. À la place, elle a créé Project Glasswing.

Des inconnus ont accédé à Mythos, l’IA dangereuse d’Anthropic

Il s’agit d’un accès limité à une quarantaine d’entreprises triées sur le volet. On parle d’Apple, Amazon, Microsoft, Google, Cisco, CrowdStrike et même la NSA. Le but est de permettre à ces acteurs de scanner leurs systèmes pour corriger leurs failles avant que des pirates ne les exploitent.

Sauf que voilà, un groupe d’inconnus n’a pas attendu d’être invité. Selon Bloomberg, ces utilisateurs communiquaient sur un forum Discord privé. Ils ont deviné l’adresse en ligne du modèle. Ils ont ensuite utilisé les identifiants d’un sous-traitant d’Anthropic pour entrer.

Bloomberg précise que ces personnes auraient utilisé Mythos régulièrement depuis. Elles n’auraient pas eu d’intentions malveillantes. Elles voulaient surtout tester le modèle avant tout le monde.

Anthropic a reconnu l’incident. Un porte-parole a confirmé à TechCrunch qu’une enquête était ouverte. L’accès non autorisé est passé par l’environnement d’un sous-traitant externe. Anthropic affirme n’avoir trouvé aucune preuve que quelqu’un ait accédé à ses serveurs

Mais ce n’est pas tout puisque cette intrusion survient au pire moment. Mozilla a publié un compte rendu de ses tests sur Claude Mythos. En gros, la fondation a analysé le code de Firefox avec le modèle. Elle a trouvé 271 failles de sécurité. Toutes ont été corrigées dans Firefox 150.

Une IA capable de trouver les failles graves

Pour rappel, Claude Opus 4.6 n’a trouvé que 22 failles sur Firefox 148 lors d’un test comparable. Bobby Holley, directeur technique de Mozilla, a dit que les résultats donnaient le « vertige » à son équipe. Il a précisé que Mythos n’avait trouvé aucune faille qu’un expert humain ne peut pas trouver avec suffisamment de temps.

On parle d’un modèle dont les capacités ont aussi été testées par l’Institut de sécurité de l’IA du Royaume-Uni. Les conclusions montrent que Mythos mène des attaques multi-étapes sur des réseaux d’entreprise sans aide humaine. En clair, en autonomie complète.

Lors d’une évaluation interne, le modèle aurait réussi à sortir d’un environnement sécurisé, à accéder à internet seul et à envoyer un message à un chercheur. Personne ne le lui avait demandé.

Résultat, le vrai problème n’est pas ce groupe de curieux. C’est qu’on ne sait pas si d’autres personnes ont fait la même chose sans le révéler. Le vecteur est classique. Un sous-traitant avec un accès aux systèmes d’une cible sensible est toujours le maillon le plus faible. Et pour une IA aux capacités jugées trop dangereuses pour une sortie publique, chaque accès non contrôlé est un problème sérieux.

Une prudence qui n’a pas suffi à protéger Mythos

Bref, ce type d’incident n’est pas propre à Anthropic. En France, plusieurs attaques récentes contre des administrations et des opérateurs sont passées par des prestataires externes. La différence ici, c’est la nature du modèle ciblé.

Claude Mythos n’est pas une base de données de clients. C’est un outil dont les concepteurs eux-mêmes ont jugé qu’il ne fallait pas le mettre entre toutes les mains. Cette prudence n’a pas suffi. Anthropic va devoir expliquer comment un groupe de curieux sur Discord a pu accéder à un modèle présenté comme l’un des plus sensibles qu’elle ait jamais créé.

Source : Bloomberg

L’IA la plus dangereuse d’Anthropic a été utilisée par des inconnus, le modèle secret a fuité

Des inconnus ont accédé à Mythos, l’IA dangereuse d’Anthropic

Une IA capable de trouver les failles graves

Une prudence qui n’a pas suffi à protéger Mythos

Réagissez à cet article !

Annuler la réponse