Thesis defense of Tristan Coignion

Évaluation Empirique de l'Impact Énergétique des Large Language Models pour la Génération et l'Optimisation de Code

on November 13, 2025 at 1:30 pm at INRIA Lille

La montée en puissance récente des grands modèles de langage (LLMs) a transformé l'ingénierie logicielle en permettant la génération automatique de code, la documentation, les tests et l'optimisation. Bien que ces outils promettent une augmentation de la productivité et, potentiellement, un code plus efficace, ils soulèvent également d'importantes préoccupations environnementales en raison de leurs besoins énergétiques élevés, de leur dépendance à un matériel spécialisé, et de leur intégration dans des infrastructures énergivores. Cette thèse étudie les compromis entre les coûts énergétiques et les bénéfices liés à l'usage des LLMs pour les tâches liées au code, avec un accent particulier sur leur rôle dans le développement logiciel durable. Trois études empiriques sont présentées. Premièrement, nous évaluons les performances à l'exécution du code généré par des LLMs sur plus de 200 problèmes provenant de Leetcode, révélant que, bien que les LLMs puissent surpasser des solutions humaines dans certains cas, leur efficacité reste très sensible aux paramètres du modèle et à la familiarité avec les problèmes. Deuxièmement, nous quantifions la consommation énergétique des assistants de code comme GitHub Copilot à travers une étude utilisateur et une instrumentation des serveurs. Les résultats montrent un gaspillage énergétique important dû aux suggestions non sollicitées, et soulignent comment la configuration des serveurs d'inférence et les modes d'utilisation peuvent réduire cette consommation. Troisièmement, nous analysons l'impact énergétique net des techniques d'optimisation de code basées sur les LLMs sur 118 problèmes. Nos résultats montrent que si ces optimisations peuvent réduire la consommation d'énergie, elles ne sont écologiquement rentables que si le code optimisé est exécuté suffisamment souvent pour compenser le coût de sa génération. Ensemble, ces trois contributions offrent une analyse détaillée des compromis liés à l'usage des LLMs pour la génération et l'optimisation de code, avec un focus sur la consommation énergétique. En évaluant empiriquement à la fois les coûts et les économies potentielles liés aux assistants de code et aux optimiseurs basés sur les LLMs, cette thèse met en lumière une dimension essentielle de l'ingénierie logicielle durable. Si les LLMs peuvent améliorer l'efficacité du code et accélérer le développement, leur impact environnemental dépend fortement des usages, des conditions de déploiement et du contexte applicatif. Alors que l'empreinte environnementale des technologies numériques continue de croître, comprendre ces compromis devient crucial. Cette thèse propose des pistes concrètes pour aligner le développement logiciel avec les contraintes écologiques.

Jury

M. Clément QUINTON Université de Lille Directeur de thèse, Mme Anne-Laure LIGOZAT LISN et ENSIIE Rapporteure, M. Laurent LEFèVRE Inria Lyon Rapporteur, M. Romain ROBBES Labri Examinateur, M. Romain ROUVOY Université de Lille Co-directeur de thèse, Mme Aurélie BUGEAU LaBRI Examinatrice, M. Jean-Christophe ROUTIER Université de Lille Examinateur.

More news