Claude Fable 5 bride ses réponses, Anthropic assume malgré la colère des chercheurs en IA

Anthropic est accusée de « sabotage secret » par la communauté de l’IA. Claude Fable 5, le nouveau modèle vedette de l’entreprise, dégrade silencieusement ses réponses lorsqu’il détecte des travaux de recherche sur les grands modèles de langage. Face à la fronde des chercheurs, la start-up défend sa méthode et promet des ajustements.

Sommaire
Fable 5 Claude Anthropic
© Image IA d’illustration générée avec ChatGPT / BuzzArena
  • Anthropic est accusée de brider Claude Fable 5 en silence lorsqu’il détecte des recherches avancées sur les grands modèles de langage.
  • Des chercheurs dénoncent un « sabotage secret », car les utilisateurs paient le plein tarif pour des réponses volontairement dégradées.
  • La polémique tombe mal pour Anthropic, déjà sous pression avec son IPO, ses garde-fous trop sensibles et la confiance fragile autour de Claude.

Anthropic a lancé Claude Fable 5, son premier modèle de classe Mythos accessible au grand public. Une semaine avant, l’entreprise a déposé confidentiellement son dossier d’introduction en Bourse. Le lancement était scruté de près, alors que la firme préparait une sortie jugée très risquée à cause des capacités du modèle en cybersécurité. Sauf que voilà, quelques heures après la mise en ligne, la polémique a éclaté sur les réseaux sociaux.

Les chercheurs en IA remontés contre Anthropic et le bridage de Fable 5

Tout part d’un paragraphe enfoui dans le rapport de sécurité du modèle, un document de 319 pages. Dedans, Anthropic explique que Fable 5 dégrade ses réponses en silence lorsqu’il détecte des travaux de pointe sur les grands modèles de langage.

On parle de la création de chaînes de pré-entraînement, d’infrastructures d’entraînement distribuées ou de processeurs dédiés à l’IA. Le document évoque des interventions pour « limiter l’efficacité de Claude » sans prévenir la personne concernée.

En clair, le chatbot répond toujours, mais bride volontairement sa qualité. Cette approche tranche avec les autres restrictions du modèle. Pour les requêtes sur la biologie ou la cybersécurité, Fable 5 bascule vers Claude Opus 4.8, un modèle moins avancé, avec une notification visible à l’écran. Anthropic estime que la mesure touche environ 0,03 % du trafic.

La réaction de la communauté a été immédiate et violente. Dean Ball, chercheur à la Foundation for American Innovation, parle de « sabotage secret » et estime que cette politique renforce l’idée d’une sécurité de l’IA brandie pour justifier des comportements monopolistiques.

Nathan Lambert, chercheur spécialisé dans les modèles ouverts, juge scandaleux de perdre l’accès aux meilleurs modèles en douce et qualifie Anthropic d’entreprise anti-science. Jeremy Howard, dirigeant du groupe de recherche Fast AI, pointe une asymétrie gênante.

Les équipes externes n’ont pas Fable 5 dans sa version complète

Et pour cause, Anthropic garde toutes les capacités de Fable 5 pour ses propres chercheurs alors que les équipes externes sont bridées. Le cabinet SemiAnalysis affirme que ses travaux sont déjà touchés et certains utilisateurs dénoncent une facturation au prix fort pour des réponses volontairement dégradées.

Face au tollé, Anthropic assume. L’entreprise défend sa mesure et explique que ce verrou évite d’accélérer les acteurs les plus disposés à ne pas respecter ses conditions d’utilisation. Dianne Na Penn, responsable produit, recherche et laboratoires chez Anthropic, revendique la volonté de « repousser la frontière de manière sûre ».

La dirigeante reconnaît que des requêtes parfaitement légitimes sont bloquées à tort et promet une amélioration de la précision de la détection après le lancement. Selon les chiffres de la start-up, 95 % des sessions profitent des pleines capacités de Fable 5.

Mais ce n’est pas tout puisque d’autres griefs s’accumulent. Des testeurs ont vu des questions banales sur les mitochondries ou les vaccins basculer vers Opus 4.8 à cause de garde-fous trop sensibles. La conservation obligatoire des données pendant 30 jours fait aussi grincer des dents les entreprises.

Andrej Karpathy, nouvelle recrue de poids chez Anthropic, salue un lancement réussi mais reconnaît des protections trop nerveuses. Il faut dire que la start-up marche sur un fil. La société veut ralentir les IA les plus avancées au nom de la sécurité, alors qu’elle vend justement le modèle le plus capable du marché.

Une polémique tendue pour Anthropic

Cette polémique tombe au pire moment. Anthropic prépare son introduction en Bourse et la société est même en passe de détrôner OpenAI en valorisation. Chaque faux pas pèse donc lourd auprès des investisseurs, mais aussi des chercheurs, soit le public qui a bâti la réputation de Claude.

Au début du mois de juin, une panne géante a déjà privé les professionnels de Claude. La confiance est donc un capital fragile pour Anthropic. Fable 5 est facturé 10 dollars le million de jetons en entrée et 50 dollars en sortie. À ce tarif, les clients attendent le meilleur du modèle, pas une version bridée en cachette.

Source : WIRED

Réagissez à cet article !