ChatGPT lance une IA que plus personne n’attendait, pourquoi est-elle très différente ?

OpenAI publie ses premiers modèles dits à « poids ouvert » depuis GPT-2 en 2019. Il s’agit d’un tournant pour l’entreprise, qui est accusée constamment d’avoir abandonné sa mission de « garantir que l’IA générale profite à toute l’humanité ».

ChatGPT
© Image IA d’illustration générée avec GPT-4o

OpenAI est un mastodonte, et l’entreprise parle toujours en milliards de dollars avec ses innovations IA comme l’agent ChatGPT. Après plusieurs retards à cause de tests de sécurité supplémentaires, gpt-oss-120b et gpt-oss-20b sont disponibles en téléchargement sur Hugging Face.

À lire : Voici trois conseils indispensables pour utiliser ChatGPT

OpenAI lance ses modèles à poids ouverts, voici ce que ça change

ChatGPT
© Envato

Mais alors quelle différence ? OpenAI ne propose pas de modèles open source avec le code source et les données d’entraînement, mais uniquement les poids, c’est-à-dire les valeurs numériques que les modèles ont apprises pendant leur formation. Benjamin C. Lee, professeur d’ingénierie informatique à l’université de Pennsylvanie, explique la différence entre les deux.

Pour faire simple : les modèles à poids ouvert permettent d’utiliser directement le système ou de l’adapter à des applications précises en ajustant les paramètres. Les modèles open source comme DeepSeek offrent une totale transparence, notamment au niveau du processus d’entraînement.

La stratégie d’OpenAI est claire : il s’agit de démocratiser l’accès à ces technologies tout en protégeant sa propriété intellectuelle. Il est impossible pour un concurrent d’utiliser ces données pour rétro-ingénier totalement les systèmes propriétaires de la start-up de Sam Altman, qui est effrayé lui-même par ChatGPT-5.

La différence entre gpt-oss-120b et gpt-oss-20b est dans leur nombre de paramètres. Le premier en a 117 milliards contre 21 milliards pour le plus petit. L’exigence matérielle n’est donc pas la même d’un modèle à l’autre. OpenAI recommande un GPU de 80 Go pour faire fonctionner efficacement gpt-oss-120b, et gpt-oss-20b peut tourner sur n’importe quel PC avec 16 Go de RAM.

Quels sont les avantages de cette nouvelle IA ?

Les développeurs ont donc la possibilité de programmer localement sans connexion internet et d’être coupés dans leur travail par de possibles pannes comme ce fut le cas dans le passé pour ChatGPT. La licence Apache 2.0 donne une flexibilité pour modifier ses systèmes selon les besoins de chacun.

Même si ces modèles sont expérimentaux, ils rivalisent avec les systèmes propriétaires d’OpenAI. Leur principale limitation est au niveau des capacités multimodales, puisqu’il leur est impossible de générer des images ou des vidéos. Ces fonctionnalités restent exclusives aux modèles sur le cloud, la méthode la plus utilisée par les internautes.

Les deux modèles intègrent toutefois le raisonnement par chaîne de pensée et l’utilisation d’outils. Il leur est possible de décomposer des problèmes complexes en étapes plus simples et d’utiliser le web ou des langages comme Python pour obtenir de l’aide. OpenAI a appliqué les techniques d’entraînement conçues pour o3 et ses autres modèles récents. En programmation compétitive, gpt-oss-120b a des scores un chouïa inférieurs à o3, qui est le modèle de raisonnement le plus avancé de la startup. Le modèle gpt-oss-20b se trouve entre o3-mini et o4-mini.

Selon le professeur Benjamin C. Lee, les modèles à poids ouvert démocratisent l’accès à des systèmes plus puissants sans investir lourdement dans des infrastructures. L’un de leurs avantages est de permettre d’accéder à des mois d’entraînement sur des centres de données hyperscale sans être propriétaire soi-même de ses équipements.

  • OpenAI publie gpt-oss-120b et gpt-oss-20b, ses premiers modèles à « poids ouvert » depuis 2019, permettant aux développeurs de les utiliser localement tout en conservant le secret sur les données d’entraînement.
  • Ces modèles offrent un accès flexible sous licence Apache 2.0, avec des performances proches des versions propriétaires mais sans capacités multimodales (pas d’image ou de vidéo).
  • OpenAI vise à démocratiser l’IA tout en protégeant sa propriété intellectuelle, une stratégie saluée pour son équilibre entre ouverture contrôlée et avancée technologique.

Réagissez à cet article !