DeepSeek prépare son nouveau modèle : R2. Et les améliorations proposées seront vraiment innovantes si l’on en croit les premières informations disponibles en ligne. Et si la Chine dépassait les États-Unis sur le marché de l’IA ? Heureusement, OpenAI a de solides atouts.

En plus de son modèle GPT-4.5, OpenAI a lancé o3 et o4-mini-high dont les performances sont impressionnantes. Mais DeepSeek a tout de même été un raz-de-marée à son lancement, faisant s’écraser les cours en bourse des géants de la tech. L’IA chinoise a aussi prouvé que le développement de modèles ne demande pas les investissements colossaux annoncés par des entreprises comme OpenAI même si elle accuse DeepSeek de pillage.
À lire : Tout savoir sur DeepSeek, l’IA chinoise qui fait trembler le monde
La Chine prépare la riposte avec le modèle DeepSeek R2
Aujourd’hui, des médias chinois commencent à relayer des rumeurs à propos du modèle R2 de DeepSeek dont les études montrent que son IA censure les réponses. Toutefois, l’entreprise n’a encore rien confirmé. Mais selon les sources, le modèle R2 aurait une architecture hybride MoE (Mixture of Experts), version perfectionnée de l’implémentation existante. On parle de mécanismes de contrôle avancés ou d’une combinaison de couches MoE et denses pour optimiser les charges de travail complexes.
En utilisant cette architecture, DeepSeek R2 doublerait le nombre de paramètres du modèle R1 pour atteindre 1,2 billion. Ainsi, l’IA rivaliserait avec GPT-4 Turbo et Gemini 2.0 Pro de Google. Les informations parlent de coûts unitaires par token du DeepSeek R2 qui seraient inférieurs de 97,4 % à ceux de GPT-4.
En termes de tarification par rapport à OpenAI, le modèle R2 de DeepSeek, dans le viseur des États-Unis, serait une aubaine pour les entreprises. L’IA serait la plus économique du marché et son lancement pourrait constituer un moment décisif pour l’économie de cette technologie.
Autre fait notable de DeepSeek R2 : le modèle atteindrait 82 % d’utilisation du cluster de puces Ascend 910B de Huawei, avec une puissance de calcul mesurée à 512 PétaFLOPS en précision FP16. L’information confirme que l’entreprise chinoise aurait utilisé des ressources locales pour son prochain IA.
Réagissez à cet article !