AWS a vu ses marges opérationnelles progresser de 213 points de base en un seul trimestre début 2026, pendant que Microsoft Azure, Google Cloud et Oracle voyaient les leurs stagner ou reculer. Le paradoxe tient en une phrase que personne à Seattle ne prononce tout haut mais que les chiffres hurlent. Amazon n’a jamais voulu fabriquer le meilleur modèle d’intelligence artificielle du monde, et c’est précisément ce qui lui rapporte le plus d’argent.
La stratégie d’Andy Jassy s’est déployée à contre-courant du récit dominant. Tandis qu’OpenAI empilait les milliards pour entraîner GPT-5.5, tandis qu’Anthropic poussait Claude à des sommets sur les benchmarks de code, AWS construisait un péage. Bedrock, sa plateforme de distribution de modèles tiers, est aujourd’hui un business estimé à 5,5 milliards de dollars en rythme annualisé. Ce chiffre a bondi de 170 % entre le quatrième trimestre 2025 et le premier trimestre 2026, porté essentiellement par la consommation de tokens Claude. Le service représente désormais 37 % du chiffre d’affaires IA d’AWS, contre 9 % un an plus tôt.
OpenAI a rejoint officiellement le catalogue Bedrock le 28 avril 2026, avec GPT-5.5 en accès limité et une disponibilité générale annoncée sous quelques semaines. L’accord repose sur un engagement de calcul de 38 milliards de dollars sur sept ans, signé en novembre 2025, qui donne à OpenAI l’accès à des centaines de milliers de GPU NVIDIA GB200 et GB300 hébergés sur l’infrastructure Amazon. AWS devient ainsi le seul distributeur tiers autorisé de la plateforme entreprise d’OpenAI, baptisée OpenAI Frontier. Anthropic, de son côté, reste ancré dans l’écosystème avec 13,8 milliards de dollars d’investissements cumulés et une dépendance croissante aux puces maison Trainium.
Le modèle du péagiste, pas du pilote
Amazon a bien compris que la course aux modèles frontier est un sport ruineux. OpenAI brûle des milliards en entraînement, affiche des marges d’inférence qui ne sont devenues positives que récemment, et doit négocier avec trois hyperscalers pour obtenir assez de puissance de calcul. Anthropic, malgré une trajectoire fulgurante vers 30 milliards de dollars de revenus annualisés au premier trimestre 2026, n’a atteint la rentabilité opérationnelle ajustée qu’au deuxième trimestre de cette même année. AWS, pendant ce temps, empoche une commission d’infrastructure et un pourcentage sur chaque token vendu via Bedrock, sans jamais supporter le coût d’entraînement des modèles.
L’économie du « Token-as-a-Service » (TaaS) s’avère bien plus flatteuse que celle du IaaS traditionnel. Quand un client achète des tokens Claude sur Bedrock, Anthropic reste le vendeur officiel et comptabilise l’intégralité du revenu. AWS facture en parallèle des frais d’infrastructure et une commission de distribution. Les marges EBIT de Bedrock avoisinent les 55 % selon certaines estimations, un niveau très supérieur à celui d’un contrat classique de location de GPU sur cinq ans. « Nos puces Trainium, conçues en interne pour les charges IA, alimentent désormais plus de 50 % de l’utilisation de tokens sur Bedrock », rappelait Matt Garman, PDG d’AWS, dès novembre 2025. L’abstraction du matériel permet à Amazon de glisser ses propres accélérateurs sous le capot sans que le client ne voie autre chose qu’un flux de tokens.
L’intégration verticale comme arme de marge
Là où Microsoft dépend encore largement de NVIDIA pour servir Azure OpenAI, et où Google partage ses TPU entre DeepMind, Gemini et les clients Cloud, Amazon a bâti une pile matérielle complète. Trainium pour l’inférence IA, Graviton (cinquième génération) pour les CPU, le tout assemblé dans des centres de données dont le rythme de construction dépasse celui de tous les concurrents en 2025, 2026 et 2027. Cette intégration verticale produit un avantage de coût par token qui se répercute directement dans les marges, d’autant que les modèles open-weight distribués sur Bedrock, comme les variantes gpt-oss d’OpenAI, sont facturés 30 à 40 % moins cher lorsqu’ils tournent sur Trainium plutôt que sur GPU NVIDIA.
Microsoft, en comparaison, a traversé une pause d’environ un an dans la construction de ses centres de données, ce qui réduit sensiblement ses prévisions de capacité pour 2027. Son plan de rattrapage passe par la sous-traitance à des neoclouds, une option nettement plus coûteuse. Azure tire encore plus de 80 % de son chiffre d’affaires IA de contrats IaaS classiques, un modèle certes prévisible mais aux marges bien inférieures à celles du TaaS. Google Cloud affiche de son côté des marges record, mais cette performance est en partie un trompe-l’œil. Les coûts d’entraînement de DeepMind et Gemini, estimés à plus de 10 milliards de dollars en rythme annualisé, sont comptabilisés dans une ligne « Alphabet-Level Activities » qui n’apparaît pas dans les résultats de GCP.
L’inconfort d’Anthropic, le divorce de Microsoft
L’arrivée d’OpenAI sur Bedrock crée une situation délicate pour Anthropic. Le laboratoire fondé par Dario Amodei représentait entre 80 et 90 % de la consommation sur la plateforme et détenait environ 38 % du volume total de tokens au premier trimestre 2026. Les analystes anticipent une compression vers 25 à 30 % d’ici la fin de l’année, à mesure que les entreprises testeront GPT-5.5 en parallèle de Claude sur la même facture AWS. « La question pour Anthropic n’est plus de savoir comment battre GPT, mais comment conserver sa part de consommation quand un client peut comparer les deux modèles sur une seule facture », résumait Ritu Jyoti, directrice de recherche chez IDC.
La fin de l’exclusivité Microsoft-OpenAI, effective le 27 avril 2026 après sept ans de verrouillage, redistribue quant à elle les cartes du marché cloud. Azure conserve le statut de « partenaire cloud principal » d’OpenAI jusqu’en 2032, et garde ses intégrations profondes avec Microsoft 365 Copilot, GitHub Copilot et Dynamics 365. Mais le monopole de distribution qui avait fait d’Azure la porte d’entrée obligatoire pour tout client GPT en entreprise n’existe plus. Microsoft a d’ailleurs lancé son propre programme de modèles maison, baptisé MAI, et élargi son partenariat avec Anthropic pour intégrer Claude dans plusieurs surfaces Copilot. « La diversification des fournisseurs de modèles, y compris les nôtres, est une priorité stratégique pour l’exercice 2026 », admettait Satya Nadella lors de la présentation des résultats de janvier 2026.
Le pari de l’exécution plutôt que de l’innovation fondamentale
AWS n’a jamais produit un modèle capable de rivaliser avec GPT-5.5 ou Claude Opus 4.7 sur les benchmarks de raisonnement. Sa famille Nova, développée en interne, reste cantonnée à des usages de second rang. Amazon a été, de l’aveu même des observateurs les plus précoces, en retard sur l’opportunité IA en 2023. Mais le retard portait sur la recherche fondamentale, pas sur l’infrastructure. Et dans un marché où les laboratoires frontier ont désespérément besoin de puissance de calcul, où les entreprises veulent un catalogue unifié de modèles avec facturation consolidée, et où les marges se font sur la distribution plutôt que sur l’entraînement… le péagiste gagne plus que le pilote.
Le co-développement d’un « Stateful Runtime Environment » avec OpenAI, un environnement d’exécution agentique capable de maintenir le contexte entre les appels et de s’intégrer à Bedrock AgentCore, illustre bien cette logique. AWS ne construit pas l’agent, il construit la piste sur laquelle l’agent court. Et il facture au kilomètre.
Bedrock héberge désormais tous les modèles frontier du marché, à l’exception de Gemini. Plus de 100 modèles fondamentaux y cohabitent, issus de six laboratoires différents, accessibles à plus de deux millions de développeurs via une API unique. Le catalogue d’AWS ressemble de plus en plus à celui d’un supermarché de l’intelligence artificielle, avec cette particularité très amazonienne que le propriétaire du supermarché encaisse une commission sur chaque article vendu, tout en plaçant ses marques distributeur (Nova, Trainium) sur les étagères les mieux éclairées.
La question qui reste en suspens est celle de la durabilité de ce modèle. Si les laboratoires frontier finissent par distribuer eux-mêmes leurs modèles à moindre coût, ou si un concurrent parvient à répliquer l’étendue du catalogue Bedrock, l’avantage d’AWS pourrait s’éroder. Mais pour l’heure, Amazon a sécurisé plus de capacité énergétique que n’importe quel autre fournisseur cloud hormis Google, signé des contrats d’infrastructure avec les trois plus grands laboratoires IA de la planète, et transformé chaque token généré par un modèle rival en source de profit. Jeff Bezos avait coutume de dire que la marge de l’un est l’opportunité de l’autre. AWS a pris cette maxime au pied de la lettre, en faisant de la marge d’OpenAI et d’Anthropic la sienne.

