DeepSeek échoue à entraîner son modèle R2 sur les puces Huawei

Published 15 août 2025

Last updated: 15 août 2025

C’est un revers que DeepSeek n’avait pas anticipé. L’entreprise chinoise, en pleine ascension dans le secteur de l’intelligence artificielle, a été contrainte de suspendre le lancement de son modèle R2 après avoir échoué à le former sur les puces Ascend de Huawei. Derrière ce contretemps, une tentative stratégique, imposée ou fortement suggérée par Pékin , visant à substituer les GPU Nvidia par du matériel local.

Après le succès remarqué du modèle R1 en janvier, DeepSeek devait confirmer sa place parmi les leaders avec une version améliorée, le R2. Seulement voilà, la pression politique a pesé lourdement sur les choix techniques. Trois sources proches du dossier ont confirmé que l’entreprise a tenté pendant plusieurs mois d’effectuer l’entraînement de son nouveau modèle sur les puces IA conçues par Huawei. Résultat : des échecs répétés, des performances instables et aucun cycle d’apprentissage complet réussi.

Le problème n’est pas que symbolique. En matière d’IA, la phase d’entraînement est critique puisqu’elle mobilise une puissance de calcul massive et exige une stabilité sans faille. Les puces Ascend B et ses variantes récentes se sont révélées insuffisantes pour ce niveau d’exigence. Elles restent adaptées aux tâches dites d’inférence (lorsqu’un modèle déjà entraîné répond à des requêtes), mais peinent face aux contraintes extrêmes du processus initial d’apprentissage.

Même l’intervention directe des ingénieurs de Huawei n’a rien changé au constat technique : impossible de finaliser l’entraînement du modèle R2 avec leur matériel. Face à l’impasse, DeepSeek a fini par revenir vers Nvidia pour reprendre le développement avec ses GPU H20, pourtant soumis à des restrictions d’exportation américaines.

Cette marche arrière retarde considérablement le roadmap initial. Le lancement prévu en mai a été annulé sans nouvelle date communiquée officiellement. Visiblement agacé par cette déconvenue, Liang Wenfeng, fondateur de DeepSeek, aurait exprimé sa frustration face au manque de progrès et exigerait désormais que ses équipes rehaussent leurs ambitions.

L’épisode met aussi en évidence la tension entre volonté politique et contraintes techniques. Pékin pousse activement ses champions nationaux comme DeepSeek à adopter des composants locaux dans un effort assumé vers l’autonomie technologique face aux sanctions américaines. Or ici, forcer la main a produit l’effet inverse, c’est à dire une perte de temps critique dans un marché où chaque trimestre creuse davantage l’écart entre leaders mondiaux et suiveurs.

Même Ren Zhengfei, PDG emblématique de Huawei, reconnaissait récemment que ses meilleures puces restaient « encore une génération derrière ». Une lucidité rare alors que le secteur est saturé par les discours triomphalistes.

La startup chinoise continue malgré tout à chercher comment intégrer les puces Huawei pour certaines tâches secondaires liées à l’inférence, mais pour ce qui est du cœur même du développement IA moderne, Nvidia conserve encore une avance difficilement contournable.

L’incident rappelle que si la souveraineté technologique est un objectif stratégique légitime pour la Chine, elle ne peut se décréter ni s’improviser au détriment des exigences concrètes du terrain scientifique et industriel.

Sources :Financial Times Artificial Intelligence News

Partager cet article

DeepSeek échoue à entraîner son modèle R2 sur les puces Huawei

Derniers articles

DeepSeek V4 : la Chine relance la course à l’IA open-source avec un modèle de 1 600 milliards de paramètres

Microsoft refond l’arrêt et le redémarrage de Windows 11 pour 1 milliard de PC : la fin d’une décennie d’agacement

Google prêt à injecter jusqu’à 40 milliards de dollars dans Anthropic : le pari le plus cher de la course à l’IA

20 000 licenciements chez Meta et Microsoft : la crise de l’emploi liée à l’IA est-elle déjà là ?

Tendance

Claude poussé à la paresse ? Le leak qui révèle comment Anthropic bride son service aux utilisateurs

Siri/Apple Intelligence : John Giannandrea, ancien patron IA quitte Apple la tête basse après huit ans

iOS 26.5 arrive en bêta avec Maps, chiffrement RCS et pression réglementaire en Europe

One Piece saison 3 sur Netflix : tournage lancé, arc Arabasta en ligne de mire

iOS 26.4 : la mise à jour iPhone qui corrige enfin le clavier et muscle sécurité, batterie, Apple Music

Vous allez aussi aimer

Google Search US intègre l’appel par IA pour téléphoner aux entreprises a votre place

Xiaomi frappe fort avec le MiMo-V2 Pro ex-Hunter Alpha un monstre d’IA à 1 000 milliards de paramètres

OpenAI lance o3 et o4-mini et nous fait rentrer pleinement dans l’ère de l’IA agentique

OpenAI lance GPT 4 pour les utilisateurs de ChatGPT Plus

DeepSeek lance sa version 3.1 avec 685 milliards de paramètres et fait disparaitre R1

Tubi lance une app native dans ChatGPT : le streaming gratuit entre dans l’ère de la découverte conversationnelle

Openai lance o1, son nouveau modèle d’IA « capable de raisonner »

Robotique : d’après Musk, le robot Tesla Optimus remplacera les médecins d’ici 3 ans

Infos légales

Maj récentes

GPT-5.5 est là : OpenAI répond à Anthropic et Claude Opus 4.7 avec un modèle ultra-puissant

Moonshot AI lance Kimi k2.6 qui rivalise avec GPT-5.4 et Claude Opus 4.6

Claude Mythos : l’IA trop dangereuse d’Anthropic déjà tombée entre des mains non autorisées

Alibaba lance Qwen 3.6 Max, son dernier modèle IA spécialement taillé pour l’agentique

Qui sommes nous ?

A lire également

Derniers articles

Tendance

Vous allez aussi aimer