Anthropic détrône Google et OpenAI : Claude Opus 4.6 règne en maître

Le classement des intelligences artificielles les plus performantes connaît un bouleversement majeur. Alors que les géants de la tech multiplient les lancements de nouveaux modèles, un acteur sort clairement du lot et impose sa domination sur tous les tableaux. Les utilisateurs ont tranché, et leur verdict pourrait redéfinir les rapports de force dans l’industrie de l’IA.

Anthropic écrase Google et OpenAI au classement

La société Anthropic réalise un exploit remarquable en plaçant son modèle Claude Opus 4.6 en tête du palmarès de la LMArena. Cette performance est d’autant plus impressionnante qu’elle intervient juste après le lancement de Gemini 3.1 Pro par Google et de GPT-5.4 par OpenAI.

Les deux déclinaisons du modèle phare d’Anthropic, la version standard et celle baptisée « thinking », occupent les premières marches du podium. Une consécration qui témoigne de l’avance technique prise par l’entreprise.

Un benchmark piloté par les votes des utilisateurs

La LMArena se distingue des autres systèmes d’évaluation par son approche collaborative. Créée par des étudiants de l’Université de Berkeley, cette plateforme autrefois connue sous le nom de Chatbot Arena repose entièrement sur les jugements du public.

Le principe du Battle Mode

Le fonctionnement s’articule autour de duels entre intelligences artificielles. Un utilisateur soumet une requête identique à deux modèles anonymes. Après avoir reçu les deux réponses, il désigne celle qu’il juge supérieure.

Chaque modèle se voit attribuer un score Elo, qui évolue au fil des confrontations. Ce système, emprunté au monde des échecs, permet d’établir un classement dynamique et représentatif des préférences réelles des utilisateurs.

Google maintient plusieurs positions stratégiques

Si Gemini 3.1 Pro n’atteint pas le sommet, Google parvient néanmoins à placer plusieurs de ses technologies dans le haut du tableau. Ses différentes déclinaisons de modèles avancés occupent les troisième, cinquième et neuvième positions.

Cette présence multiple démontre la solidité de l’écosystème développé par le géant de Mountain View, même face à des concurrents particulièrement affûtés.

Le retour d’OpenAI après deux mois difficiles

La société à l’origine de ChatGPT effectue un retour remarqué dans le top 10. Après avoir été totalement absente des premières places en janvier et février, OpenAI rebondit en installant ses modèles aux sixième et huitième rangs.

Cette remontée intervient malgré le lancement de GPT-5.4, qui n’a manifestement pas suffi à détrôner Claude Opus 4.6 de sa position dominante.

Grok 4.20 s’impose derrière le leader

Le modèle Grok 4.20, encore en version bêta, parvient à se hisser dans le peloton de tête. Bien qu’il reste distancé par les productions d’Anthropic, ce nouvel entrant confirme l’intensification de la compétition dans le secteur.

Des classements thématiques pour affiner l’analyse

Au-delà du leaderboard général, la plateforme propose des tableaux spécialisés par domaine d’application. Cette segmentation permet d’identifier les forces spécifiques de chaque intelligence artificielle selon les types de tâches.

Cette granularité offre aux développeurs et aux entreprises une vision plus précise pour choisir la technologie la mieux adaptée à leurs besoins particuliers.