Amazon face à OpenAI et Anthropic : pourquoi AWS refuse de courir comme les laboratoires frontier

Sommaire

AWS a vu ses marges opérationnelles progresser de 213 points de base en un seul trimestre début 2026, pendant que Microsoft Azure, Google Cloud et Oracle voyaient les leurs stagner ou reculer. Le paradoxe tient en une phrase que personne à Seattle ne prononce tout haut mais que les chiffres hurlent. Amazon n’a jamais voulu fabriquer le meilleur modèle d’intelligence artificielle du monde, et c’est précisément ce qui lui rapporte le plus d’argent.

La stratégie d’Andy Jassy s’est déployée à contre-courant du récit dominant. Tandis qu’OpenAI empilait les milliards pour entraîner GPT-5.5, tandis qu’Anthropic poussait Claude à des sommets sur les benchmarks de code, AWS construisait un péage. Bedrock, sa plateforme de distribution de modèles tiers, est aujourd’hui un business estimé à 5,5 milliards de dollars en rythme annualisé. Ce chiffre a bondi de 170 % entre le quatrième trimestre 2025 et le premier trimestre 2026, porté essentiellement par la consommation de tokens Claude. Le service représente désormais 37 % du chiffre d’affaires IA d’AWS, contre 9 % un an plus tôt.

OpenAI a rejoint officiellement le catalogue Bedrock le 28 avril 2026, avec GPT-5.5 en accès limité et une disponibilité générale annoncée sous quelques semaines. L’accord repose sur un engagement de calcul de 38 milliards de dollars sur sept ans, signé en novembre 2025, qui donne à OpenAI l’accès à des centaines de milliers de GPU NVIDIA GB200 et GB300 hébergés sur l’infrastructure Amazon. AWS devient ainsi le seul distributeur tiers autorisé de la plateforme entreprise d’OpenAI, baptisée OpenAI Frontier. Anthropic, de son côté, reste ancré dans l’écosystème avec 13,8 milliards de dollars d’investissements cumulés et une dépendance croissante aux puces maison Trainium.

Le modèle du péagiste, pas du pilote

Amazon a bien compris que la course aux modèles frontier est un sport ruineux. OpenAI brûle des milliards en entraînement, affiche des marges d’inférence qui ne sont devenues positives que récemment, et doit négocier avec trois hyperscalers pour obtenir assez de puissance de calcul. Anthropic, malgré une trajectoire fulgurante vers 30 milliards de dollars de revenus annualisés au premier trimestre 2026, n’a atteint la rentabilité opérationnelle ajustée qu’au deuxième trimestre de cette même année. AWS, pendant ce temps, empoche une commission d’infrastructure et un pourcentage sur chaque token vendu via Bedrock, sans jamais supporter le coût d’entraînement des modèles.

L’économie du « Token-as-a-Service » (TaaS) s’avère bien plus flatteuse que celle du IaaS traditionnel. Quand un client achète des tokens Claude sur Bedrock, Anthropic reste le vendeur officiel et comptabilise l’intégralité du revenu. AWS facture en parallèle des frais d’infrastructure et une commission de distribution. Les marges EBIT de Bedrock avoisinent les 55 % selon certaines estimations, un niveau très supérieur à celui d’un contrat classique de location de GPU sur cinq ans. « Nos puces Trainium, conçues en interne pour les charges IA, alimentent désormais plus de 50 % de l’utilisation de tokens sur Bedrock », rappelait Matt Garman, PDG d’AWS, dès novembre 2025. L’abstraction du matériel permet à Amazon de glisser ses propres accélérateurs sous le capot sans que le client ne voie autre chose qu’un flux de tokens.

L’intégration verticale comme arme de marge

Là où Microsoft dépend encore largement de NVIDIA pour servir Azure OpenAI, et où Google partage ses TPU entre DeepMind, Gemini et les clients Cloud, Amazon a bâti une pile matérielle complète. Trainium pour l’inférence IA, Graviton (cinquième génération) pour les CPU, le tout assemblé dans des centres de données dont le rythme de construction dépasse celui de tous les concurrents en 2025, 2026 et 2027. Cette intégration verticale produit un avantage de coût par token qui se répercute directement dans les marges, d’autant que les modèles open-weight distribués sur Bedrock, comme les variantes gpt-oss d’OpenAI, sont facturés 30 à 40 % moins cher lorsqu’ils tournent sur Trainium plutôt que sur GPU NVIDIA.

Microsoft, en comparaison, a traversé une pause d’environ un an dans la construction de ses centres de données, ce qui réduit sensiblement ses prévisions de capacité pour 2027. Son plan de rattrapage passe par la sous-traitance à des neoclouds, une option nettement plus coûteuse. Azure tire encore plus de 80 % de son chiffre d’affaires IA de contrats IaaS classiques, un modèle certes prévisible mais aux marges bien inférieures à celles du TaaS. Google Cloud affiche de son côté des marges record, mais cette performance est en partie un trompe-l’œil. Les coûts d’entraînement de DeepMind et Gemini, estimés à plus de 10 milliards de dollars en rythme annualisé, sont comptabilisés dans une ligne « Alphabet-Level Activities » qui n’apparaît pas dans les résultats de GCP.

L’inconfort d’Anthropic, le divorce de Microsoft

L’arrivée d’OpenAI sur Bedrock crée une situation délicate pour Anthropic. Le laboratoire fondé par Dario Amodei représentait entre 80 et 90 % de la consommation sur la plateforme et détenait environ 38 % du volume total de tokens au premier trimestre 2026. Les analystes anticipent une compression vers 25 à 30 % d’ici la fin de l’année, à mesure que les entreprises testeront GPT-5.5 en parallèle de Claude sur la même facture AWS. « La question pour Anthropic n’est plus de savoir comment battre GPT, mais comment conserver sa part de consommation quand un client peut comparer les deux modèles sur une seule facture », résumait Ritu Jyoti, directrice de recherche chez IDC.

La fin de l’exclusivité Microsoft-OpenAI, effective le 27 avril 2026 après sept ans de verrouillage, redistribue quant à elle les cartes du marché cloud. Azure conserve le statut de « partenaire cloud principal » d’OpenAI jusqu’en 2032, et garde ses intégrations profondes avec Microsoft 365 Copilot, GitHub Copilot et Dynamics 365. Mais le monopole de distribution qui avait fait d’Azure la porte d’entrée obligatoire pour tout client GPT en entreprise n’existe plus. Microsoft a d’ailleurs lancé son propre programme de modèles maison, baptisé MAI, et élargi son partenariat avec Anthropic pour intégrer Claude dans plusieurs surfaces Copilot. « La diversification des fournisseurs de modèles, y compris les nôtres, est une priorité stratégique pour l’exercice 2026 », admettait Satya Nadella lors de la présentation des résultats de janvier 2026.

Le pari de l’exécution plutôt que de l’innovation fondamentale

AWS n’a jamais produit un modèle capable de rivaliser avec GPT-5.5 ou Claude Opus 4.7 sur les benchmarks de raisonnement. Sa famille Nova, développée en interne, reste cantonnée à des usages de second rang. Amazon a été, de l’aveu même des observateurs les plus précoces, en retard sur l’opportunité IA en 2023. Mais le retard portait sur la recherche fondamentale, pas sur l’infrastructure. Et dans un marché où les laboratoires frontier ont désespérément besoin de puissance de calcul, où les entreprises veulent un catalogue unifié de modèles avec facturation consolidée, et où les marges se font sur la distribution plutôt que sur l’entraînement… le péagiste gagne plus que le pilote.

Le co-développement d’un « Stateful Runtime Environment » avec OpenAI, un environnement d’exécution agentique capable de maintenir le contexte entre les appels et de s’intégrer à Bedrock AgentCore, illustre bien cette logique. AWS ne construit pas l’agent, il construit la piste sur laquelle l’agent court. Et il facture au kilomètre.

Bedrock héberge désormais tous les modèles frontier du marché, à l’exception de Gemini. Plus de 100 modèles fondamentaux y cohabitent, issus de six laboratoires différents, accessibles à plus de deux millions de développeurs via une API unique. Le catalogue d’AWS ressemble de plus en plus à celui d’un supermarché de l’intelligence artificielle, avec cette particularité très amazonienne que le propriétaire du supermarché encaisse une commission sur chaque article vendu, tout en plaçant ses marques distributeur (Nova, Trainium) sur les étagères les mieux éclairées.

La question qui reste en suspens est celle de la durabilité de ce modèle. Si les laboratoires frontier finissent par distribuer eux-mêmes leurs modèles à moindre coût, ou si un concurrent parvient à répliquer l’étendue du catalogue Bedrock, l’avantage d’AWS pourrait s’éroder. Mais pour l’heure, Amazon a sécurisé plus de capacité énergétique que n’importe quel autre fournisseur cloud hormis Google, signé des contrats d’infrastructure avec les trois plus grands laboratoires IA de la planète, et transformé chaque token généré par un modèle rival en source de profit. Jeff Bezos avait coutume de dire que la marge de l’un est l’opportunité de l’autre. AWS a pris cette maxime au pied de la lettre, en faisant de la marge d’OpenAI et d’Anthropic la sienne.

Amazon face à OpenAI et Anthropic : pourquoi AWS refuse de courir comme les laboratoires frontier

Le modèle du péagiste, pas du pilote

L’intégration verticale comme arme de marge

L’inconfort d’Anthropic, le divorce de Microsoft

Le pari de l’exécution plutôt que de l’innovation fondamentale

Derniers articles

Apple préparerait trois nouveaux iPhone pour le printemps 2027 : changement de calendrier historique ?

DragonForce détournerait Microsoft Teams pour cacher ses communications malveillantes

CrowdStrike et AWS poussent la sécurité cloud dopée à l’IA : vers des SOC plus automatisés ?

GTA 6 en précommande dès le 25 juin : Rockstar lance le compte à rebours final

Tendance

Claude Fable 5 et Mythos 5 c’est fini ! Anthropic débranche ses deux modèles sur ordre de Washington

Windows 11 KB5094126 : la mise à jour de juin 2026 plante des milliers de PC HP et Dell

GPT-5.6 : OpenAI prépare déjà son prochain modèle phare, et ça sent la poudre

PS6 : Sony joue la montre pendant que Microsoft fonce tête baissée

Claude Fable 5 de retour sous 48h ? Anthropic tente de ramener son modèle phare coûte que coûte

Vous allez aussi aimer

GPT-5.5 est là : OpenAI répond à Anthropic et Claude Opus 4.7 avec un modèle ultra-puissant

Avis Gain Generator Pro : Arnaque ou robot de trading fiable ?

AMD Ryzen AI Halo : le mini PC à 3 999 dollars qui veut détrôner NVIDIA sur le terrain de l’IA locale

France Travail déploie l’IA : ChatFT, MatchFT et la nouvelle mécanique du recrutement assisté

Claude Mythos : l’IA trop dangereuse d’Anthropic déjà tombée entre des mains non autorisées

Le robot humanoïde Unitree R1 débarque en Europe à moins de 5 000 euros

Maîtriser PixVerse AI : prompts, mouvements de caméra et astuces de pro

Avis Bit GPT App : véritable arnaque ou service légitime ?

Infos légales

Maj récentes

Kodak victime de ShinyHunters : 2,2 millions de données ont potentiellement fuité

Les ETF Solana attirent l’argent quand Bitcoin et Ethereum reculent : rotation ou simple respiration ?

Android 17 vs iOS 27 : les fonctions que Google déploie déjà et qu’Apple devra rattraper

iPhone Air 2 : trois améliorations attendues pour corriger le point faible du modèle ultra-fin

Qui sommes nous ?

Le modèle du péagiste, pas du pilote

A lire également

L’intégration verticale comme arme de marge

L’inconfort d’Anthropic, le divorce de Microsoft

Le pari de l’exécution plutôt que de l’innovation fondamentale

Derniers articles

Tendance

Vous allez aussi aimer