Les quatre géants du cloud américain ont collectivement porté leurs investissements 2026 à 725 milliards de dollars, soit 77 % de plus que le record établi l’année précédente. Microsoft a guidé seul vers 190 milliards, Amazon vers 200, Alphabet vers 185, Meta entre 115 et 135. La réaction des marchés s’est aussitôt tournée vers Nvidia, vers les puces, vers la puissance de calcul. Et c’est précisément sur ce point que le raisonnement déraille.
Car la puissance de calcul, aussi colossale soit-elle, ne produit rien si les données qu’on lui soumet sont fragmentées, mal gouvernées, dépourvues de contexte. Un rapport Gartner anticipe que 60 % des organisations abandonneront leurs projets d’IA en 2026 pour des problèmes de qualité de données. Le chiffre est d’autant plus frappant qu’il concerne des entreprises déjà engagées, déjà équipées, déjà dotées de GPU par milliers. L’infrastructure de calcul existe. Ce qui manque, c’est la matière première exploitable.
Ric Lewis, Senior Vice President Infrastructure chez IBM, a résumé le paradoxe lors de la conférence Think 2026 avec une image efficace : « L’IA repose sur la donnée, et cette donnée est partout, elle est par essence hybride. Cette donnée est soit une mine d’or, soit une décharge. L’architecture que vous choisissez peut faire pencher la balance. » L’image de la décharge n’est pas gratuite. Elle décrit assez fidèlement l’état des lacs de données dans la plupart des grandes entreprises, où des années d’ingestion sans gouvernance ont produit des volumes considérables et largement inutilisables.
Le problème se lit aussi dans la vitesse de décision, qui reste étrangement stable malgré des pipelines toujours plus rapides. Une VP Data d’une entreprise de taille intermédiaire le formulait récemment avec perplexité : « Nous avons des pipelines plus rapides que jamais, et pourtant les décisions prennent toujours une semaine. » La latence ne se situe plus dans le transfert technique. Elle s’est déplacée vers l’interprétation, la réconciliation sémantique, la confiance dans ce que les chiffres désignent réellement. Un directeur des opérations décrivait quatorze systèmes internes proposant chacun une définition légèrement différente du revenu, et des analystes passant la moitié de leur temps à déterminer laquelle méritait d’être crue avant même de répondre à la moindre question.
Cette fragmentation sémantique constitue en réalité le verrou le plus tenace de l’IA d’entreprise, bien davantage que le manque de GPU ou la bande passante réseau. Les outils ETL ont centralisé les flux de données sans jamais résoudre les divergences de définition entre CRM, plateformes de facturation, télémétrie produit et systèmes comptables. Ils ont déplacé le chaos en aval, dans l’entrepôt de données, où il devient le problème quotidien de l’analyste. L’analyste se retrouve alors transformé en interprète permanent du système, un rôle que personne n’avait anticipé et qu’aucun éditeur de logiciel ne mentionne dans ses présentations commerciales.
Sam Werner, General Manager d’IBM Storage, posait le diagnostic en ces termes : « C’est cette fondation de données qui fait la différence entre une organisation qui met son IA en production et une organisation qui reste coincée dans une boucle infinie de pilotes. » Le mot « pilote » revient avec une régularité troublante dans les conversations sur l’IA d’entreprise. Et pour cause. Selon une étude de l’IBM Institute for Business Value, 70 % des dirigeants estiment que leur stratégie hybride a permis d’optimiser coûts et performances, mais 8 % seulement considèrent que leur infrastructure actuelle répond à l’ensemble de leurs besoins en IA. L’écart entre ces deux chiffres dessine très exactement l’espace où les projets s’enlisent.
Le phénomène des GPU inactifs illustre bien ce décalage entre investissement matériel et rendement effectif. Des organisations dépensent des fortunes en accélérateurs graphiques qui tournent ensuite à vide, faute d’un stockage capable d’alimenter les puces assez vite pour les maintenir en activité permanente. Le goulot n’est alors ni le processeur, ni le réseau, ni même la connectivité entre les racks… C’est le débit de données exploitables vers le point de calcul. La donnée, encore.
Que l’infrastructure physique progresse, personne n’en doute. Les 725 milliards injectés dans les centres de données en 2026 produiront des clusters de 576 GPU synchronisés sur des racks entiers, avec des débits en térabits par seconde et des latences inférieures à la microseconde. Astera Labs, Marvell, Broadcom et d’autres fournisseurs de silicium de connectivité verront bien sûr leurs carnets de commandes gonfler (Amazon a d’ores et déjà accordé à Astera Labs un warrant lié à 6,5 milliards de dollars d’achats cumulés). Mais toute cette tuyauterie, aussi sophistiquée soit-elle, ne fera que transporter plus vite des données dont la qualité, la cohérence et la gouvernance restent, en tout cas pour la majorité des entreprises, très en deçà de ce que l’IA exige pour fonctionner en production.
Hillery Hunter, General Manager d’IBM Power et CTO d’IBM Infrastructure, rappelait que « l’IA doit tourner 24 heures sur 24, sept jours sur sept, c’est vital pour nos opérations ». Cette exigence de disponibilité permanente suppose une résilience qui ne se limite pas aux serveurs, et englobe la souveraineté des données, la conformité réglementaire, la reprise après sinistre. Autant de dimensions que les architectures fragmentées peinent à garantir simultanément.
L’industrie mesure aujourd’hui la performance de ses infrastructures de données à travers des métriques d’ingénieur, notamment la fiabilité des pipelines, la latence des requêtes, le débit de l’entrepôt. Ces indicateurs sont nécessaires. Ils sont aussi profondément insuffisants. Le seul chiffre qui compte du point de vue du métier, c’est le délai entre l’apparition d’un signal dans les données et le moment où quelqu’un agit. Un VP racontait avoir découvert un risque de perte d’un client stratégique trois semaines après que les premiers signaux avaient émergé dans les données d’usage et les tickets de support. Tout était là. Personne n’avait regardé.
La question que les investisseurs et les dirigeants devraient se poser n’est donc pas de savoir combien de puces Nvidia les hyperscalers achèteront cette année. Cette histoire est déjà largement intégrée dans les cours. La question pertinente porte sur la capacité des entreprises à transformer leurs données dispersées, incohérentes et mal contextualisées en une fondation sur laquelle l’IA peut effectivement produire des résultats fiables, à l’échelle, en continu. Les 725 milliards financeront des routes toujours plus larges. Reste à savoir si ce qu’on y fera circuler vaudra le voyage.

