Google Cloud dévoile deux nouvelles puces IA pour concurrencer Nvidia

Published 24 avril 2026

Last updated: 24 avril 2026

Google a frappé fort mercredi lors de sa conférence Cloud Next 2026 à Las Vegas en présentant deux processeurs dédiés à l’intelligence artificielle. La huitième génération de TPU (tensor processing units) se scinde désormais en deux lignes distinctes, le TPU 8t pour l’entraînement des modèles et le TPU 8i pour l’inférence, cette phase où les modèles répondent aux requêtes des utilisateurs.

Cette spécialisation rompt avec des années de puces polyvalentes. « Avec l’essor des agents IA, nous avons estimé que la communauté bénéficierait de processeurs individuellement spécialisés pour l’entraînement et le service », a écrit Amin Vahdat, vice-président senior et directeur technologique IA et infrastructure chez Google. Le TPU 8t promet ainsi de réduire les cycles de développement de modèles « de plusieurs mois à quelques semaines » et affiche un rapport performance-prix 2,8 fois supérieur à celui de la génération Ironwood, dévoilée en novembre dernier.

Le TPU 8i mise quant à lui sur la mémoire SRAM embarquée, avec 384 mégaoctets par puce, soit le triple d’Ironwood. Sundar Pichai, PDG d’Alphabet, a décrit une architecture conçue « pour offrir le débit massif et la faible latence nécessaires à l’exécution simultanée de millions d’agents de manière rentable ». Les deux puces seront disponibles dans le courant de l’année.

Les clients, eux, n’ont pas attendu. Anthropic s’est déjà engagé sur plusieurs gigawatts de capacité TPU. Meta aurait signé un contrat pluriannuel de plusieurs milliards de dollars pour accéder à ces processeurs, selon The Information. OpenAI négocie également de la capacité TPU pour alimenter ses propres services. Et les 17 laboratoires nationaux du département américain de l’Énergie utilisent d’ores et déjà des logiciels d’IA co-scientifique bâtis sur ces puces.

Faut-il pour autant y voir la fin de la domination de Nvidia ? Pas encore… Google ne compare même pas frontalement ses nouvelles puces à celles du géant aux GPU. L’entreprise a d’ailleurs confirmé que Vera Rubin, le dernier processeur de Nvidia, sera bien proposé sur son cloud cette année. Les deux groupes travaillent ensemble au renforcement de Falcon, une technologie réseau logicielle que Google a créée puis versée à l’Open Compute Project en 2023.

Les analystes de DA Davidson estimaient en septembre la valeur combinée de l’activité TPU et de Google DeepMind à environ 900 milliards de dollars. Patrick Moorhead, analyste réputé du marché des semi-conducteurs, a rappelé avec ironie sur X qu’il avait prédit dès 2016 que les TPU seraient une mauvaise nouvelle pour Nvidia. Le fabricant de GPU pèse aujourd’hui près de 5 000 milliards de dollars en capitalisation boursière.

Amazon, Microsoft, Meta et Google investissent tous massivement dans leurs propres accélérateurs IA, grignotant un territoire longtemps réservé à Nvidia et AMD. Les hyperscalers représentent désormais un peu plus de 50 % du chiffre d’affaires data center de Nvidia, qui a généré 193,7 milliards de dollars sur ce segment lors de son exercice fiscal 2026 (clos en janvier). Le paradoxe reste entier, du moins pour l’instant. Plus Google grandit comme fournisseur cloud IA, plus Nvidia vend de puces à Google.

Partager cet article

Google Cloud dévoile deux nouvelles puces IA pour concurrencer Nvidia

Derniers articles

Microsoft refond l’arrêt et le redémarrage de Windows 11 pour 1 milliard de PC : la fin d’une décennie d’agacement

Scooby-Doo : Origins, la série live-action Netflix enfin officialisée avec un casting dévoilé

La Momie 4 avancé à 2027 : ce que l’on sait sur le retour de Brendan Fraser dans le film d’aventure horrifique

Chrome transformé en collègue IA : Google passe à la vitesse supérieure avec Gemini et l’auto browse

Tendance

Claude poussé à la paresse ? Le leak qui révèle comment Anthropic bride son service aux utilisateurs

Siri/Apple Intelligence : John Giannandrea, ancien patron IA quitte Apple la tête basse après huit ans

iOS 26.5 arrive en bêta avec Maps, chiffrement RCS et pression réglementaire en Europe

One Piece saison 3 sur Netflix : tournage lancé, arc Arabasta en ligne de mire

Overwatch saison 2 : reworks de héros, nouvelle recrue et refonte compétitive

Vous allez aussi aimer

GPT-5.5 est là : OpenAI répond à Anthropic et Claude Opus 4.7 avec un modèle ultra-puissant

Claude Mythos : l’IA trop dangereuse d’Anthropic déjà tombée entre des mains non autorisées

Maîtriser PixVerse AI : prompts, mouvements de caméra et astuces de pro

Le robot humanoïde Unitree R1 débarque en Europe à moins de 5 000 euros

Un robot humanoïde pulvérise le record du semi-marathon

GPT-5.4 vs Claude Opus 4.7 : le duel des titans de l’IA décrypté benchmark par benchmark

Alibaba lance Qwen 3.6 Max, son dernier modèle IA spécialement taillé pour l’agentique

Infos légales

Maj récentes

Windows 11 n’a pas besoin d’antivirus tiers, selon Microsoft

Anthropic (Claude) et Amazon scellent un pacte titanesque de 100 milliards de dollars

La bêta 3 iOS 26.5 est là ! Le chiffrement des messages iPhone-Android arrive enfin

PS6 : trois fois plus puissante que la PS5, rétrocompatible et déjà prête à enflammer le jeu vidéo

Qui sommes nous ?

A lire également

Derniers articles

Tendance

Vous allez aussi aimer