Un petit groupe d’individus a réussi à accéder à Claude Mythos Preview, le modèle d’intelligence artificielle qu’Anthropic jugeait trop puissant pour être rendu public. L’entreprise a confirmé aujourd’hui avoir ouvert une enquête.
Mythos. Le nom revient sans cesse ces derniers jours et inquiète sérieusement jusqu’au sommet des gouvernements mondiaux. Anthropic l’avait présenté le 7 avril comme une IA généraliste de frontière, douée d’une capacité singulière et troublante, celle de repérer des failles logicielles et de les exploiter pour pénétrer des programmes. Le modèle aurait déniché des vulnérabilités restées enfouies pendant des décennies dans tous les grands systèmes d’exploitation et navigateurs web. L’entreprise avait alors décidé de ne le confier qu’à une poignée de sociétés tech et financières, via son initiative Project Glasswing.
L’accès frauduleux se serait vraisemblablement produit par l’intermédiaire d’un environnement tiers. « Nous enquêtons sur un signalement faisant état d’un accès non autorisé à Claude Mythos Preview via l’un de nos environnements fournisseurs tiers », a déclaré Anthropic dans un communiqué. Bloomberg a révélé qu’un individu disposait déjà d’une autorisation pour consulter les modèles d’Anthropic, obtenue dans le cadre de travaux effectués pour un sous-traitant.
Raluca Saceanu, directrice générale de la société de cybersécurité Smarttech247, a bien cerné la faille. « Lorsque des outils d’IA puissants sont utilisés en dehors des contrôles prévus, le risque n’est pas qu’un incident de sécurité, c’est la diffusion de capacités qui pourraient servir à la fraude, à l’abus informatique ou à d’autres activités malveillantes. » Le groupe qui a eu accès au modèle l’utiliserait depuis lors sans chercher à pirater quoi que ce soit par crainte d’être repéré.
Aucun acteur malveillant n’a, à ce stade, été identifié. Anthropic affirme ne pas avoir de preuve que ses propres systèmes aient été directement compromis. L’incident relèverait davantage d’un détournement d’accès que d’un piratage classique. Et pourtant l’angoisse est là… Car le problème fondamental demeure. Les vulnérabilités dites « zero-day », ces failles inconnues des développeurs et pour lesquelles aucun correctif n’existe, sont le terrain de chasse favori des attaquants. Un outil capable de les débusquer à une vitesse inédite dans les mains de n’importe qui transformerait chaque logiciel en porte ouverte.
Richard Horne, directeur du National Cyber Security Centre britannique, a tenu mercredi un discours volontairement tourné vers l’espoir lors de la conférence CyberUK. « L’IA de frontière permet déjà rapidement la découverte et l’exploitation de vulnérabilités existantes à grande échelle, ce qui montre à quelle vitesse elle exposera les failles fondamentales de cybersécurité encore non traitées. » Il a exhorté les professionnels du secteur à ne pas craindre les nouvelles attaques par IA et à se concentrer sur les bases, notamment les mises à jour logicielles et le remplacement des infrastructures obsolètes.
Le Royaume-Uni se trouve pourtant dans une position de dépendance profonde. Tous les modèles d’IA dit « frontiers » sont aujourd’hui développés hors de son territoire, par des entreprises américaines ou chinoises. Le ministre de la sécurité Dan Jarvis a demandé aux firmes d’IA de collaborer avec le gouvernement sur ce qu’il appelle un « effort générationnel » pour protéger les réseaux critiques. OpenAI possède elle aussi un modèle dédié à la cybersécurité, baptisé GPT 5.4 Cyber.
Mythos existe et il va faaloir composer avec et s’adapter. La question qui hante désormais l’industrie n’est plus de savoir si des IA offensives seront un jour accessibles, mais combien de temps il reste avant qu’elles ne le soient pour tout le monde.

