Claude Mythos : l'IA qui révolutionne la cybersécurité avec des découvertes inédites

L’intelligence artificielle franchit un nouveau cap dans le domaine de la cybersécurité. Anthropic vient de dévoiler Claude Mythos, un modèle capable de détecter des vulnérabilités informatiques que personne n’avait repérées depuis des décennies. Une avancée technologique qui soulève autant d’espoirs que d’inquiétudes.

Des performances spectaculaires en cybersécurité

Les résultats obtenus par Claude Mythos dans le domaine de la sécurité informatique dépassent toutes les attentes. Sur le benchmark CyberGym, ce nouveau modèle atteint un score de 83,1 %, surclassant largement Claude Opus 4.6 qui plafonne à 66,6 %.

Plus impressionnant encore, Mythos réalise un score parfait de 100 % sur Cybench, démontrant une maîtrise inégalée dans l’identification des failles de sécurité. Cette performance marque un tournant dans l’utilisation de l’IA pour la protection des systèmes informatiques.

Des milliers de vulnérabilités zero-day découvertes

L’ampleur des découvertes réalisées par Mythos dépasse les prévisions les plus optimistes. Le système a identifié des milliers de vulnérabilités zero-day dans des systèmes et navigateurs majeurs utilisés quotidiennement par des millions d’utilisateurs.

Des failles vieilles de plusieurs décennies

Parmi les découvertes les plus surprenantes figurent des bugs présents depuis 27 ans dans OpenBSD et d’autres datant de 16 ans dans FFmpeg. Ces failles dormaient dans le code source sans avoir jamais été détectées par les experts humains.

Cette situation révèle une réalité préoccupante : la fenêtre entre la découverte d’une vulnérabilité et son exploitation potentielle s’est drastiquement réduite grâce à l’IA.

Excellence en ingénierie logicielle

Les capacités de Mythos ne se limitent pas à la cybersécurité. En ingénierie logicielle, le modèle résout 19 problèmes sur 20, établissant un nouveau standard de performance parmi les modèles disponibles publiquement.

Des scores records sur les benchmarks techniques

Sur SWE-bench Verified, Mythos obtient 93,9 % contre 80,8 % pour Claude Opus 4.6. L’écart se creuse encore davantage sur SWE-bench Pro avec 77,8 % face à 53,4 %.

La domination s’avère encore plus nette sur SWE-bench Multimodal, où Mythos atteint 59 % tandis que son prédécesseur stagne à 27,1 %.

Raisonnement scientifique de pointe

Dans le domaine du raisonnement scientifique, Claude Mythos démontre également sa supériorité. Sur GPQA Diamond, il obtient 94,6 % contre 91,3 % pour Claude Opus 4.6.

Le test le plus exigeant, Humanity’s Last Exam, révèle un écart considérable : Mythos atteint 56,8 % sans outils, là où Claude Opus 4.6 ne parvient qu’à 40 %.

Un accès restreint aux géants technologiques

Face aux implications sécuritaires, Anthropic a fait le choix d’une diffusion contrôlée. L’accès à Claude Mythos reste limité aux partenaires du Project Glasswing, un cercle fermé comprenant AWS, Apple, Google, Microsoft et la Linux Foundation.

Un financement massif pour la défense

Pour encourager l’utilisation défensive de cette technologie, Anthropic finance la recherche avec 100 millions de dollars de crédits. Cette initiative vise à renforcer la sécurité des infrastructures avant que des acteurs malveillants n’exploitent ces capacités.

Les informations proviennent de la System Card de Claude Mythos Preview, de la page Project Glasswing et du blog de la Frontier Red Team, publiées par Anthropic le 7 avril 2026.