L'usage des IA : une bombe à retardement budgétaire pour les entreprises

L’enthousiasme autour des modèles de langage génératifs se heurte à une réalité économique brutale. Alors que les entreprises multiplient les expérimentations, une étude révèle l’impossibilité de contrôler les coûts liés à l’utilisation de ces technologies. De Microsoft à Uber, les géants de la tech tirent la sonnette d’alarme face à des factures qui explosent.

Une consommation de tokens totalement imprévisible

La première révélation de cette étude est sans appel : personne ne peut anticiper les besoins réels en tokens avant d’exécuter une tâche. Ni les experts humains, ni les algorithmes d’intelligence artificielle eux-mêmes ne parviennent à établir des prévisions fiables.

Les variations sont vertigineuses. Pour une même mission, le nombre de tokens nécessaires peut fluctuer jusqu’à 30 fois. Cette imprévisibilité rend tout budget prévisionnel caduc et transforme chaque projet en pari financier.

Le mode agentique : un gouffre financier

L’écart de consommation entre les différents modes d’utilisation défie l’entendement. Alors qu’un raisonnement unique coûte environ 0,016 dollar et qu’un dialogue itératif atteint 0,023 dollar, le mode agentique explose à près de 1,9 dollar par tâche.

Ce dernier engloutit approximativement 1000 fois plus de tokens que le mode assistant classique. Un gouffre qui soulève de sérieuses questions sur la viabilité économique de ces approches avancées.

Aucune garantie de qualité malgré les coûts

Le paradoxe est cruel : investir davantage ne garantit pas de meilleurs résultats. L’étude démontre qu’une consommation élevée de tokens n’assure en rien une fiabilité accrue des réponses.

Pire encore, la précision des résultats diminue lorsque les coûts atteignent des niveaux élevés. Un constat qui remet en question l’équation qualité-prix de ces technologies.

Microsoft envisage de tourner le dos à Claude

Face à cette spirale financière, le géant de Redmond réfléchit à une décision radicale. Microsoft pourrait abandonner Claude Code au profit de Copilot CLI, jugé plus économique.

La plupart des licences Claude seraient concernées par cet arrêt, malgré la popularité de la solution auprès des développeurs. La rentabilité l’emporte sur l’engouement des utilisateurs.

Uber : quatre mois pour épuiser deux ans de budget

Le cas de la plateforme de VTC illustre l’ampleur du problème. Uber a consumé en quatre mois l’intégralité de son enveloppe IA prévue jusqu’en 2026. Un dérapage budgétaire spectaculaire qui interroge sur la gouvernance de ces projets.

L’analyse interne ne révèle aucune corrélation entre cette surconsommation et l’ajout de fonctionnalités véritablement utiles pour les clients. L’argent s’évapore sans création de valeur tangible.

Des prédictions systématiquement erronées

Les modèles de langage eux-mêmes contribuent au problème. Lorsqu’on leur demande d’estimer leurs propres besoins, ils sous-estiment systématiquement les coûts réels. Cette faille dans leur capacité d’auto-évaluation complique encore la planification.

La difficulté apparente d’une tâche ne permet pas non plus d’anticiper son coût. Les critères humains d’appréciation de la complexité ne correspondent pas aux ressources consommées par les algorithmes.

L’auto-prédiction : un outil imparfait mais utile

Malgré son manque de fiabilité, l’auto-prédiction conserve une utilité. Elle fournit au moins une indication relative des coûts, permettant de mettre en place des alertes budgétaires approximatives.

Cette approche reste cependant un pis-aller, loin de la rigueur nécessaire à une gestion financière saine des projets d’intelligence artificielle en entreprise.