Le vrai goulot d’étranglement de l’IA en entreprise n’est pas le GPU, c’est la donnée

Les quatre géants du cloud américain ont collectivement porté leurs investissements 2026 à 725 milliards de dollars, soit 77 % de plus que le record établi l’année précédente. Microsoft a guidé seul vers 190 milliards, Amazon vers 200, Alphabet vers 185, Meta entre 115 et 135. La réaction des marchés s’est aussitôt tournée vers Nvidia, vers les puces, vers la puissance de calcul. Et c’est précisément sur ce point que le raisonnement déraille.

Car la puissance de calcul, aussi colossale soit-elle, ne produit rien si les données qu’on lui soumet sont fragmentées, mal gouvernées, dépourvues de contexte. Un rapport Gartner anticipe que 60 % des organisations abandonneront leurs projets d’IA en 2026 pour des problèmes de qualité de données. Le chiffre est d’autant plus frappant qu’il concerne des entreprises déjà engagées, déjà équipées, déjà dotées de GPU par milliers. L’infrastructure de calcul existe. Ce qui manque, c’est la matière première exploitable.

Ric Lewis, Senior Vice President Infrastructure chez IBM, a résumé le paradoxe lors de la conférence Think 2026 avec une image efficace : « L’IA repose sur la donnée, et cette donnée est partout, elle est par essence hybride. Cette donnée est soit une mine d’or, soit une décharge. L’architecture que vous choisissez peut faire pencher la balance. » L’image de la décharge n’est pas gratuite. Elle décrit assez fidèlement l’état des lacs de données dans la plupart des grandes entreprises, où des années d’ingestion sans gouvernance ont produit des volumes considérables et largement inutilisables.

Le problème se lit aussi dans la vitesse de décision, qui reste étrangement stable malgré des pipelines toujours plus rapides. Une VP Data d’une entreprise de taille intermédiaire le formulait récemment avec perplexité : « Nous avons des pipelines plus rapides que jamais, et pourtant les décisions prennent toujours une semaine. » La latence ne se situe plus dans le transfert technique. Elle s’est déplacée vers l’interprétation, la réconciliation sémantique, la confiance dans ce que les chiffres désignent réellement. Un directeur des opérations décrivait quatorze systèmes internes proposant chacun une définition légèrement différente du revenu, et des analystes passant la moitié de leur temps à déterminer laquelle méritait d’être crue avant même de répondre à la moindre question.

Cette fragmentation sémantique constitue en réalité le verrou le plus tenace de l’IA d’entreprise, bien davantage que le manque de GPU ou la bande passante réseau. Les outils ETL ont centralisé les flux de données sans jamais résoudre les divergences de définition entre CRM, plateformes de facturation, télémétrie produit et systèmes comptables. Ils ont déplacé le chaos en aval, dans l’entrepôt de données, où il devient le problème quotidien de l’analyste. L’analyste se retrouve alors transformé en interprète permanent du système, un rôle que personne n’avait anticipé et qu’aucun éditeur de logiciel ne mentionne dans ses présentations commerciales.

Sam Werner, General Manager d’IBM Storage, posait le diagnostic en ces termes : « C’est cette fondation de données qui fait la différence entre une organisation qui met son IA en production et une organisation qui reste coincée dans une boucle infinie de pilotes. » Le mot « pilote » revient avec une régularité troublante dans les conversations sur l’IA d’entreprise. Et pour cause. Selon une étude de l’IBM Institute for Business Value, 70 % des dirigeants estiment que leur stratégie hybride a permis d’optimiser coûts et performances, mais 8 % seulement considèrent que leur infrastructure actuelle répond à l’ensemble de leurs besoins en IA. L’écart entre ces deux chiffres dessine très exactement l’espace où les projets s’enlisent.

Le phénomène des GPU inactifs illustre bien ce décalage entre investissement matériel et rendement effectif. Des organisations dépensent des fortunes en accélérateurs graphiques qui tournent ensuite à vide, faute d’un stockage capable d’alimenter les puces assez vite pour les maintenir en activité permanente. Le goulot n’est alors ni le processeur, ni le réseau, ni même la connectivité entre les racks… C’est le débit de données exploitables vers le point de calcul. La donnée, encore.

Que l’infrastructure physique progresse, personne n’en doute. Les 725 milliards injectés dans les centres de données en 2026 produiront des clusters de 576 GPU synchronisés sur des racks entiers, avec des débits en térabits par seconde et des latences inférieures à la microseconde. Astera Labs, Marvell, Broadcom et d’autres fournisseurs de silicium de connectivité verront bien sûr leurs carnets de commandes gonfler (Amazon a d’ores et déjà accordé à Astera Labs un warrant lié à 6,5 milliards de dollars d’achats cumulés). Mais toute cette tuyauterie, aussi sophistiquée soit-elle, ne fera que transporter plus vite des données dont la qualité, la cohérence et la gouvernance restent, en tout cas pour la majorité des entreprises, très en deçà de ce que l’IA exige pour fonctionner en production.

Hillery Hunter, General Manager d’IBM Power et CTO d’IBM Infrastructure, rappelait que « l’IA doit tourner 24 heures sur 24, sept jours sur sept, c’est vital pour nos opérations ». Cette exigence de disponibilité permanente suppose une résilience qui ne se limite pas aux serveurs, et englobe la souveraineté des données, la conformité réglementaire, la reprise après sinistre. Autant de dimensions que les architectures fragmentées peinent à garantir simultanément.

L’industrie mesure aujourd’hui la performance de ses infrastructures de données à travers des métriques d’ingénieur, notamment la fiabilité des pipelines, la latence des requêtes, le débit de l’entrepôt. Ces indicateurs sont nécessaires. Ils sont aussi profondément insuffisants. Le seul chiffre qui compte du point de vue du métier, c’est le délai entre l’apparition d’un signal dans les données et le moment où quelqu’un agit. Un VP racontait avoir découvert un risque de perte d’un client stratégique trois semaines après que les premiers signaux avaient émergé dans les données d’usage et les tickets de support. Tout était là. Personne n’avait regardé.

La question que les investisseurs et les dirigeants devraient se poser n’est donc pas de savoir combien de puces Nvidia les hyperscalers achèteront cette année. Cette histoire est déjà largement intégrée dans les cours. La question pertinente porte sur la capacité des entreprises à transformer leurs données dispersées, incohérentes et mal contextualisées en une fondation sur laquelle l’IA peut effectivement produire des résultats fiables, à l’échelle, en continu. Les 725 milliards financeront des routes toujours plus larges. Reste à savoir si ce qu’on y fera circuler vaudra le voyage.

Le vrai goulot d’étranglement de l’IA en entreprise n’est pas le GPU, c’est la donnée

Derniers articles

L’iPhone 18 Pro à 1 399 dollars : pourquoi le prochain smartphone d’Apple va coûter si cher

GTA 6 dévoile sa jaquette officielle et la date de précommande

RTX 5090 AORUS Infinity : Gigabyte affiche sa carte anniversaire à 4 431 euros

La comédie du personal branding : quand LinkedIn transforme le travail en spectacle

Tendance

Claude Fable 5 et Mythos 5 c’est fini ! Anthropic débranche ses deux modèles sur ordre de Washington

Windows 11 KB5094126 : la mise à jour de juin 2026 plante des milliers de PC HP et Dell

GPT-5.6 : OpenAI prépare déjà son prochain modèle phare, et ça sent la poudre

Claude Fable 5 de retour sous 48h ? Anthropic tente de ramener son modèle phare coûte que coûte

PS6 : Sony joue la montre pendant que Microsoft fonce tête baissée

Vous allez aussi aimer

Chrome transformé en collègue IA : Google passe à la vitesse supérieure avec Gemini et l’auto browse

Claude Fable 5 : Anthropic libère sa bête de course et parie sur des garde-fous inédits

Faut-il interdire ChatGPT et les chatbots IA aux mineurs ?

Nvidia mise sur Unitree pour accélérer la robotique humanoïde

OpenAI visée par une enquête de plusieurs États américains autour de ChatGPT

Google Cloud dévoile deux nouvelles puces IA pour concurrencer Nvidia

L’intelligence artificielle a-t-elle volé les créateurs ? Le procès du copyright s’enflamme

Alibaba lance Qwen 3.6 Max, son dernier modèle IA spécialement taillé pour l’agentique

Infos légales

Maj récentes

GTA 6 en précommande dès le 25 juin : Rockstar lance le compte à rebours final

GTA 5 devient gratuit en mise à niveau PS5/Xbox : Rockstar prépare le terrain avant GTA 6

Onimusha Way of the Sword arrive sur Nintendo Switch 2 : Capcom confirme une version stratégique

Netflix : trois thrillers à regarder cette semaine, dont un inspiré d’une histoire vraie

Qui sommes nous ?

A lire également

Derniers articles

Tendance

Vous allez aussi aimer