Le modèle d’intelligence artificielle le plus puissant d’Anthropic est resté hors ligne tout le week-end, et les négociations entamées lundi au département du Commerce américain n’ont pour l’instant rien débloqué, même si la direction se montre confiante quant à un retour rapide, que beaucoup attendent désormais sous 48 heures. Claude Fable 5, fierté technologique de la firme, a été frappé par des restrictions à l’exportation imposées par l’administration Trump après que des inquiétudes liées au jailbreaking ont été remontées jusqu’à la Maison-Blanche. On pourrait croire à un scénario de thriller bureaucratique, sauf que personne ne joue.
Tom Brown, cofondateur et responsable du calcul chez Anthropic, pilote les discussions avec Sarah Heck, directrice des affaires extérieures, et s’est déjà entouré de Logan Graham, chef du red-teaming, ainsi que du chercheur en sécurité Nicholas Carlini, tous deux dépêchés à Washington pour l’occasion. En face, le secrétaire au Commerce Howard Lutnick participait par téléconférence depuis le G7 à Évian, tandis que des chercheurs du Center for AI Standards and Innovation examinaient les vulnérabilités présumées. Le directeur national de la cybersécurité, Sean Cairncross, n’a même pas daigné se joindre aux réunions. Voilà qui en dit long sur la température ambiante.
L’affaire a pris un tour particulièrement acide quand on a appris que c’est Andy Jassy, patron d’Amazon et accessoirement l’un des plus gros investisseurs d’Anthropic, qui avait directement alerté le gouvernement américain sur les failles supposées de Fable 5. Appeler le gouvernement pour signaler les fragilités d’un modèle développé par une entreprise dans laquelle on a injecté des milliards… il faut bien reconnaître que le geste possède une élégance toute particulière. Amazon s’est contenté de déclarer, par la voix d’un porte-parole « il n’est pas inhabituel que des gouvernements sollicitent nos conseils sur des risques potentiels de sécurité ». On appréciera le flegme.
La NSA, sollicitée dans la foulée par des responsables de la Maison-Blanche visiblement affolés, a estimé qu’il était bien possible de désactiver les garde-fous de Fable 5 pour accéder aux capacités cybernétiques avancées du modèle Mythos sous-jacent. Anthropic maintient fermement que cette analyse est exagérée et qualifie la méthode de jailbreaking en question de « limitée » et « non universelle ». Un porte-parole de l’entreprise a sobrement déclaré à Wired « les deux parties travaillent rapidement pour résoudre la situation », une formule qui alimente, là encore, l’hypothèse d’un retour imminent dans les deux jours.
Des chercheurs en cybersécurité ont adressé une lettre ouverte aux autorités lundi, et le texte ne mâche pas ses mots : « les modèles de classe Mythos d’Anthropic sont performants pour détecter des failles et développer des exploits, mais ils ne sont pas les seuls à exceller dans ces tâches ». La lettre enfonce le clou en affirmant que cette décision a « retiré les meilleurs modèles aux défenseurs, créé de l’incertitude sur le marché et mis en danger le leadership américain en IA sans risque réel pour la justifier ». Quand vos propres experts en sécurité vous disent que vous avez surréagi, la position devient inconfortable.
Le département du Commerce s’est toutefois montré disposé à trouver un chemin de retour pour Fable 5 auprès du grand public, à condition qu’Anthropic résolve intégralement les problèmes de jailbreaking identifiés. Cette ouverture nourrit d’ailleurs l’idée d’un rétablissement très prochain, possiblement dès les prochaines 48 heures. En attendant, les utilisateurs sont rétrogradés sur Opus 4.8, un modèle fonctionnel mais qui ne joue évidemment pas dans la même catégorie. Le premier ministre canadien Mark Carney a lui-même évoqué le « danger d’une dépendance excessive à certains modèles », rappelant qu’il serait irresponsable de ne pas « tirer la leçon et diversifier ».
Sur les réseaux, les rumeurs vont bon train, et toutes convergent vers la même échéance : les spécialistes tablent sur un retour de Claude Fable 5 dans les prochaines 48 heures. Reste à savoir si ce retour sera assorti d’une limitation stricte aux citoyens américains ou si le retour sera généralisé.
Anthropic se retrouve pris dans un étau assez singulier, déjà engagé dans un bras de fer avec le Pentagone sur l’utilisation militaire de ses modèles, et désormais sommé de prouver au gouvernement que sa technologie la plus avancée ne peut pas être retournée contre les intérêts américains. Des rumeurs circulent sur une possible fuite des modèles vers des groupes en Chine, ce qui n’arrange rien au problème…

