Le bras de fer aura duré dix-huit jours. Anthropic a obtenu mardi soir la levée des contrôles à l’exportation imposés par l’administration Trump sur ses deux modèles phares, Claude Fable 5 et Mythos 5, et prévoit de rétablir l’accès mondial dans la soirée de mercredi à jeudi pour ce qui concerne la France. Dix-huit jours pendant lesquels des centaines de millions d’utilisateurs ont été privés de l’IA la plus performante jamais produite par la firme californienne.
Le secrétaire au Commerce Howard Lutnick a confirmé la nouvelle sur X, affirmant que son département avait « travaillé étroitement avec Anthropic pour analyser et approuver Fable 5, afin d’assurer un alignement au sein du gouvernement américain et de renforcer le leadership de l’Amérique dans l’IA ». Une formulation très trumpienne, très « America First », qui traduit bien la philosophie du moment à Washington. Susie Wiles, cheffe de cabinet de la Maison-Blanche, y est allée de son propre commentaire, saluant une collaboration « sans précédent » entre secteur public et privé.
Tout avait basculé le 12 juin, un vendredi soir, quand l’administration Trump avait adressé un ultimatum à Anthropic. Des chercheurs d’Amazon avaient identifié une méthode de jailbreak sur Fable 5 et Mythos 5, ces deux modèles construits sur la même architecture mais destinés à des publics différents (le grand public pour Fable, les entreprises et experts en cybersécurité pour Mythos). Le gouvernement avait alors dégainé une directive de contrôle à l’exportation interdisant à tout ressortissant étranger, y compris les propres employés non américains d’Anthropic, d’accéder aux modèles. Un timing désastreux pour une entreprise qui préparait activement son introduction en bourse et venait tout juste de finaliser une semaine entière de promotion.
Anthropic a désormais déployé un classificateur de sécurité entraîné pour bloquer la technique de jailbreak incriminée dans plus de 99 % des cas. Les requêtes interceptées seront redirigées vers Opus 4.8, le modèle précédent, et l’utilisateur en sera notifié. La contrepartie est assumée par l’entreprise elle-même, qui reconnaît que ce filtre supplémentaire risque de bloquer davantage de requêtes parfaitement anodines. Le Center for AI Standards and Innovation du département du Commerce a par ailleurs testé les anciens et nouveaux garde-fous avant de valider le retour en ligne.
Le contexte dépasse largement le cas Anthropic. OpenAI a dû se plier à des contraintes similaires la semaine dernière lors du lancement de GPT-5.6, déployé uniquement auprès d’une liste restreinte d’organisations approuvées par Washington. Mythos 5 suit d’ailleurs encore ce régime de diffusion contrôlée, réservé à un cercle de partenaires validés par le gouvernement. L’ensemble de l’industrie de l’IA évolue dans un environnement réglementaire improvisé, où chaque lancement de modèle frontier ressemble à une négociation diplomatique.
Anthropic a aussi révélé un arsenal de nouvelles mesures pour apaiser Washington, notamment un accès gouvernemental pré-lancement aux futurs modèles touchant à la sécurité nationale, un partage d’informations accéléré en cas de faille détectée, et la création d’équipes dédiées aux priorités fédérales avec une allocation substantielle de puissance de calcul. L’entreprise travaille en parallèle avec Amazon, Microsoft, Google et d’autres acteurs de son programme Project Glasswing pour établir un cadre d’évaluation des jailbreaks fondé sur quatre critères, dont le gain de capacité pour l’attaquant et la facilité de reproduction de la faille.
L’entreprise a eu l’honnêteté d’admettre dans son billet de blog qu’il est « probablement impossible de rendre un modèle d’IA totalement imperméable aux jailbreaks », ajoutant que des failles de gravité variable continueront d’être découvertes. Un programme HackerOne sera bientôt lancé pour canaliser les signalements des chercheurs en sécurité, et une équipe de surveillance fonctionnera en continu, 24 heures sur 24.
L’administration Trump fait face à une échéance fixée en août par un récent décret exécutif pour créer des benchmarks standardisés d’évaluation des risques de sécurité des nouveaux modèles. La Chine, pendant ce temps, se rapproche de la production de son propre concurrent à Mythos tout en continuant de publier des modèles open-weight rivalisant avec Opus 4.8… La course est lancée, et le terrain de jeu réglementaire reste, en tout cas, encore à dessiner.

