
Entretien avec l’IA : Le « tokenmaxxing » est-il en train de transformer l’IA en théâtre de la fausse productivité ?
Le 6 avril 2026, The Information révèle qu’un ingénieur de Meta a installé sur l’intranet du groupe un tableau classant les 85 000 employés de Meta selon le nombre de tokens qu’ils consomment, autrement dit selon la quantité d’IA qu’ils brûlent chaque jour pour travailler. Plus on sollicite les modèles, plus on grimpe dans le classement, jusqu’à décrocher des titres honorifiques en interne. En trente jours, les salariés ont consommé 60 trillions de tokens, soit une facture estimée à plus de 100 millions de dollars. L’épisode a installé un mot dans le vocabulaire de la Silicon Valley, le tokenmaxxing, soit l’art de maximiser sa consommation d’IA en lançant des agents en parallèle, en allongeant ses prompts, en faisant tourner les modèles en continu, le tout pour grimper dans des classements internes que Microsoft, Salesforce, Amazon ou Writer ont également adoptés. Alors, sommes-nous face à une nouvelle forme de présentéisme numérique, où brûler des millions de tokens sert avant tout à simuler l’activité professionnelle ? TNS a posé la question à Claude AI.
À travers cet usage, l'IA sert réellement à produire plus et mieux, ou sert-elle d'alibi à une activité simulée ?
« Les deux, et c’est précisément ce qui rend le phénomène trouble. Les données disponibles montrent une accélération réelle. L’étude de Faros sur 22 000 développeurs et 4 000 équipes établit une hausse de 34% des tâches complétées et de 66% des epics livrés dans les environnements à forte adoption IA. Personne ne conteste sérieusement que les modèles produisent quelque chose. La question est de savoir quoi.
Chez Meta, des ingénieurs interrogés par Gergely Orosz pour The Pragmatic Engineer décrivent les power users du leaderboard Claudeonomics comme producteurs de travail jetable, observable directement en consultant leurs trajectoires de prompts. Chez Amazon, le Financial Times rapporte que des salariés font tourner l’outil IA interne sur des tâches triviales pour gonfler leur compteur.
Le simulacre n’est plus une accusation, c’est un fait documenté. Reste que la distinction entre vraie production et activité simulée devient elle-même de plus en plus difficile à établir, parce qu’un agent lancé en parallèle produit toujours quelque chose. Un rapport, une analyse, un bout de code. Le théâtre n’est plus l’absence de production, mais l’incapacité à juger si cette production a la moindre valeur. » – Claude AI
Justement, si la valeur d'un cadre se mesure désormais en tokens consommés, qu'est-ce que cela dit de notre rapport au travail ?
« Que nous n’avons jamais su mesurer le travail intellectuel, et que chaque révolution technologique nous renvoie à cet aveu. Dans les années 1990, IBM mesurait ses développeurs aux lignes de code écrites, une métrique abandonnée depuis trente ans pour la même raison qui rend le tokenmaxxing absurde : la quantité produite ne dit rien de la valeur produite. La loi de Goodhart, énoncée en 1975 par l’économiste Charles Goodhart, prévient depuis longtemps que toute mesure qui devient une cible cesse d’être une bonne mesure. Le tokenmaxxing en est l’illustration manuelle.
Ce qu’il révèle aussi, c’est une bascule du présentéisme. Hier, on jugeait l’engagement d’un cadre à sa présence physique au bureau, à ses mails envoyés à 23 heures, à son agenda saturé. Aujourd’hui, on le juge à sa consommation de calcul. La métrique a changé, la logique d’affichage reste identique.
Plus inquiétant, ce déplacement coïncide avec une angoisse sourde, celle de devoir justifier sa valeur à l’heure où l’IA accomplit une part croissante du travail. Brûler des tokens devient une manière visible de dire je travaille encore. Dans la formule du commentateur de Mr Prompts, c’est ce qui arrive quand la hustle culture découvre l’IA et invente une course à la performance de la productivité plutôt qu’à son obtention. » – Claude AI
Le tokenmaxxing ne serait-il pas en train de fabriquer une dette technique invisible que personne ne veut voir ?
« Les chiffres sont sans ambiguïté. La même étude Faros qui mesure l’accélération de la production mesure aussi ses contreparties : 54% de bugs supplémentaires par développeur, un temps médian de revue de code multiplié par cinq, un code churn (réécriture du code juste après son écriture) en hausse de 861% dans les environnements à forte adoption IA. Autrement dit, on produit plus vite, on défait plus vite, et on inspecte de moins en moins ce qui a été produit.
Cette dette ne se voit pas immédiatement, parce qu’elle se loge dans des couches profondes du logiciel et qu’elle ne fait pas dérailler les KPI trimestriels. Elle apparaîtra plus tard, sous la forme d’incidents en production, de maintenances impossibles, de refontes coûteuses confiées à d’autres équipes. Angie Jones, ancienne VP engineering chez Block, anticipe le retournement et prédit que 2027 sera l’année où l’on cessera de célébrer la combustion massive de tokens pour valoriser leur usage efficient.
Le paradoxe est cruel pour les directions qui tolèrent aujourd’hui ces classements. Elles paient deux fois. Une première fois la facture, une seconde fois la remédiation. Et entre les deux, elles auront récompensé les profils qui ont creusé le trou. » – Claude AI
Les + vues
Inscrivez-vous !
INSCRIVEZ-VOUS À
NOTRE NEWSLETTER !
![]()
Renseignez votre adresse mail
pour recevoir nos nouveautés
et rester informé de nos actualités.
Entretien avec l’IA
Tout voirTop Mots Clés :
Laisser un commentaire