JDWJDW
Font ResizerAa
  • Tech & Innovations
  • Mobiles & Apps
  • IA & Robotique
  • Consoles & Jeux Vidéo
  • Films & Séries
  • Animes & Mangas
  • Blockchain & Crypto
  • Plus
    • Web & Internet
    • Geek & Gadgets
    • Informatique & Cybersécurité
    • Réseaux Sociaux & Influence
    • e-Business & Webmarketing
    • Fintech & Néobanques
    • Streaming & P2P
Font ResizerAa
JDWJDW
Rechercher
  • Web & Internet
  • Tech & Innovations
  • Mobiles & Apps
  • Consoles & Jeux Vidéo
  • Films & Séries
  • Animes & Mangas
  • Blockchain & Crypto
  • Geek & Gadgets
  • Informatique & Cybersécurité
  • Streaming & P2P
Avez-vous déjà un compte ? Sign In
Suivez-nous
Tech & Innovations

DeepSeek échoue à entraîner son modèle R2 sur les puces Huawei

Raphael Gelin
Published 15 août 2025
Last updated: 15 août 2025
Partager
deepseek

C’est un revers que DeepSeek n’avait pas anticipé. L’entreprise chinoise, en pleine ascension dans le secteur de l’intelligence artificielle, a été contrainte de suspendre le lancement de son modèle R2 après avoir échoué à le former sur les puces Ascend de Huawei. Derrière ce contretemps, une tentative stratégique, imposée ou fortement suggérée par Pékin , visant à substituer les GPU Nvidia par du matériel local.

Après le succès remarqué du modèle R1 en janvier, DeepSeek devait confirmer sa place parmi les leaders avec une version améliorée, le R2. Seulement voilà, la pression politique a pesé lourdement sur les choix techniques. Trois sources proches du dossier ont confirmé que l’entreprise a tenté pendant plusieurs mois d’effectuer l’entraînement de son nouveau modèle sur les puces IA conçues par Huawei. Résultat : des échecs répétés, des performances instables et aucun cycle d’apprentissage complet réussi.

Le problème n’est pas que symbolique. En matière d’IA, la phase d’entraînement est critique puisqu’elle mobilise une puissance de calcul massive et exige une stabilité sans faille. Les puces Ascend B et ses variantes récentes se sont révélées insuffisantes pour ce niveau d’exigence. Elles restent adaptées aux tâches dites d’inférence (lorsqu’un modèle déjà entraîné répond à des requêtes), mais peinent face aux contraintes extrêmes du processus initial d’apprentissage.

Même l’intervention directe des ingénieurs de Huawei n’a rien changé au constat technique : impossible de finaliser l’entraînement du modèle R2 avec leur matériel. Face à l’impasse, DeepSeek a fini par revenir vers Nvidia pour reprendre le développement avec ses GPU H20, pourtant soumis à des restrictions d’exportation américaines.

Cette marche arrière retarde considérablement le roadmap initial. Le lancement prévu en mai a été annulé sans nouvelle date communiquée officiellement. Visiblement agacé par cette déconvenue, Liang Wenfeng, fondateur de DeepSeek, aurait exprimé sa frustration face au manque de progrès et exigerait désormais que ses équipes rehaussent leurs ambitions.

A lire également

gpt-5.4 vs opus 4.7
GPT-5.4 vs Claude Opus 4.7 : le duel des titans de l’IA décrypté benchmark par benchmark
robot humanoide marathon
Un robot humanoïde pulvérise le record du semi-marathon
Claude AI
Anthropic (Claude) et Amazon scellent un pacte titanesque de 100 milliards de dollars

L’épisode met aussi en évidence la tension entre volonté politique et contraintes techniques. Pékin pousse activement ses champions nationaux comme DeepSeek à adopter des composants locaux dans un effort assumé vers l’autonomie technologique face aux sanctions américaines. Or ici, forcer la main a produit l’effet inverse, c’est à dire une perte de temps critique dans un marché où chaque trimestre creuse davantage l’écart entre leaders mondiaux et suiveurs.

Même Ren Zhengfei, PDG emblématique de Huawei, reconnaissait récemment que ses meilleures puces restaient « encore une génération derrière ». Une lucidité rare alors que le secteur est saturé par les discours triomphalistes.

La startup chinoise continue malgré tout à chercher comment intégrer les puces Huawei pour certaines tâches secondaires liées à l’inférence, mais pour ce qui est du cœur même du développement IA moderne, Nvidia conserve encore une avance difficilement contournable.

L’incident rappelle que si la souveraineté technologique est un objectif stratégique légitime pour la Chine, elle ne peut se décréter ni s’improviser au détriment des exigences concrètes du terrain scientifique et industriel.

Sources :Financial TimesArtificial Intelligence News
Partager cet article
Facebook Whatsapp Whatsapp LinkedIn Reddit Telegram Copy Link

Derniers articles

deepseek
DeepSeek V4 : la Chine relance la course à l’IA open-source avec un modèle de 1 600 milliards de paramètres
IA & Robotique
Windows 11
Microsoft refond l’arrêt et le redémarrage de Windows 11 pour 1 milliard de PC : la fin d’une décennie d’agacement
Informatique & Cybersécurité
google ai
Google prêt à injecter jusqu’à 40 milliards de dollars dans Anthropic : le pari le plus cher de la course à l’IA
IA & Robotique
Meta AI
20 000 licenciements chez Meta et Microsoft : la crise de l’emploi liée à l’IA est-elle déjà là ?
IA & Robotique

Tendance

claude anthropic paresseux
Claude poussé à la paresse ? Le leak qui révèle comment Anthropic bride son service aux utilisateurs
Tech & Innovations
apple intelligence
Siri/Apple Intelligence : John Giannandrea, ancien patron IA quitte Apple la tête basse après huit ans
Mobiles & Apps Tech & Innovations
ios 26.5
iOS 26.5 arrive en bêta avec Maps, chiffrement RCS et pression réglementaire en Europe
Mobiles & Apps
One Piece Live action - Netflix
One Piece saison 3 sur Netflix : tournage lancé, arc Arabasta en ligne de mire
Animes & Mangas
ios 26.4
iOS 26.4 : la mise à jour iPhone qui corrige enfin le clavier et muscle sécurité, batterie, Apple Music
Mobiles & Apps

Vous allez aussi aimer

Google AI check pricing
Tech & InnovationsWeb & Internet

Google Search US intègre l’appel par IA pour téléphoner aux entreprises a votre place

18 juillet 2025
xiaomi mimo pro
Tech & Innovations

Xiaomi frappe fort avec le MiMo-V2 Pro ex-Hunter Alpha un monstre d’IA à 1 000 milliards de paramètres

19 mars 2026
openai o3
Tech & Innovations

OpenAI lance o3 et o4-mini et nous fait rentrer pleinement dans l’ère de l’IA agentique

17 avril 2025
GPT 4 - OpenAI
Tech & Innovations

OpenAI lance GPT 4 pour les utilisateurs de ChatGPT Plus

15 mars 2023
deepseek
Tech & Innovations

DeepSeek lance sa version 3.1 avec 685 milliards de paramètres et fait disparaitre R1

21 août 2025
tubi
Streaming & P2PTech & Innovations

Tubi lance une app native dans ChatGPT : le streaming gratuit entre dans l’ère de la découverte conversationnelle

13 avril 2026
Openai o1
Tech & Innovations

Openai lance o1, son nouveau modèle d’IA « capable de raisonner »

13 septembre 2024
tesla-optimus gen 2
Tech & Innovations

Robotique : d’après Musk, le robot Tesla Optimus remplacera les médecins d’ici 3 ans

11 janvier 2026

Infos légales

  • Mentions légales
  • Politique de confidentialité
  • Nous contacter
  • Partenaires

Maj récentes

gpt-5.5
GPT-5.5 est là : OpenAI répond à Anthropic et Claude Opus 4.7 avec un modèle ultra-puissant
IA & Robotique
kimi k moonshot ai
Moonshot AI lance Kimi k2.6 qui rivalise avec GPT-5.4 et Claude Opus 4.6
Tech & Innovations
claude mythos
Claude Mythos : l’IA trop dangereuse d’Anthropic déjà tombée entre des mains non autorisées
IA & Robotique Informatique & Cybersécurité
qwen
Alibaba lance Qwen 3.6 Max, son dernier modèle IA spécialement taillé pour l’agentique
IA & Robotique

Qui sommes nous ?

Le Journal du Web alias JDW a été fondé et est édité par des passionnés par l’univers web, nouvelles technologies et de la culture populaire.

Newsletter
Inscrivez-vous à notre newsletter pour recevoir nos derniers articles!
Suivez-nous
adbanner
Welcome Back!

Sign in to your account

Username or Email Address
Password

Mot de passe oublié ?