Thesis defense of Maxime Huyghe

Exploration automatisée de l’impact des paramètres de configuration sur les empreintes de navigateur

on November 26, 2025 at 10:00 am at Amphi IRCICA

Les navigateurs web exposent de nombreux attributs d'API, créant des empreintes numériques uniques pour le suivi non consenti des utilisateurs. Face aux restrictions des méthodes traditionnelles (ex. cookies), les empreintes de navigateur s'imposent comme une alternative persistante, exploitant configurations et environnements d'exécution. L'impact des paramètres de configuration sur les empreintes est toutefois mal compris, freinant le développement de technologies de protection de la vie privée et la prise de décisions éclairées par les utilisateurs. Cette thèse aborde ces défis par une analyse empirique et une modélisation formelle pour approfondir la compréhension des empreintes de navigateur et de sa variabilité. Nous présentons trois contributions majeures, offrant des perspectives sur les configurations et les caractéristiques des empreintes. Premièrement, FP-Rainbow, une méthodologie automatisée analysant l'impact des paramètres de configuration sur les empreintes de navigateur. Une expérimentation sur 1,748 paramètres et 18 versions de Chromium a généré 61,559 empreintes, constituant l'étude systèmatique la plus exhaustive à ce jour sur l'impact des configurations. Notre analyse a identifié 32 à 56 paramètres clés qui impactent l'empreinte et a atteint 78,15 % de succès dans l'identification des paramètres à partir des empreintes du navigateur, prouvant leur impact direct et quantifié. Deuxièmement, nous introduisons une nouvelle représentation formelle par modélisation par caractéristiques (feature modeling) issue de l'ingénierie des lignes de produits logiciels pour capturer la variabilité des empreintes numériques. Notre méthode transforme les paires attribut-valeur en arbres hiérarchiques, préservant relations et contraintes. Elle facilite l'analyse avancée de la variabilité (échantillonnage, suivi d'évolution, exploration de l'espace de configuration) et réduit la taille des données jusqu'à 59,000 fois sans perte d'information. Troisièmement, nous étendons ces techniques aux paramètres de configuration et aux attributs environnementaux (OS, matériel, logiciel). En unifiant ces données, nous introduisons un langage de requête et une méthode pour extraire des empreintes minimales conservant des taux d'identification élevés. Ces contributions ont des implications multidisciplinaires. Pour la confidentialité, nos résultats offrent des preuves quantitatives pour éclairer les décisions des utilisateurs. Les développeurs peuvent utiliser nos outils pour évaluer l'impact sur la vie privée des nouvelles fonctionnalités et implémenter des configurations par défaut protectrices. Tous nos jeux de données, outils et méthodologies sont open-source, assurant reproductibilité et validation communautaire. Ces jeux de données complets intègrent informations détaillées sur les configurations matérielles, logicielles et les empreintes, facilitant diverses applications de recherche. Cette démarche favorise une compréhension approfondie des empreintes de navigateurs et soutient le développement de technologies efficaces de protection de la confidentialité. Ces travaux ouvrent des perspectives prometteuses : extension à d'autres navigateurs/plateformes, études longitudinales de l'évolution des empreintes, intégration du machine learning pour une analyse affinée, et développement de technologies de confidentialité de nouvelle génération. Nos méthodologies posent les bases d'une évaluation continue de la confidentialité face à l'évolution des technologies web.

Jury

M. Lionel SEINTURIER Université de Lille Directeur de thèse, M. Aurélien FRANCILLON Eurecom Rapporteur, Mme Sonia BEN MOKHTAR LIRIS Examinatrice, M. Vincent ROCA Inria Rapporteur, M. Clément QUINTON Université de Lille Co-directeur de thèse, Mme Estelle PAWLOWSKI ENSICAEN / Laboratoire GREYC Examinatrice, M. Walter RUDAMETKIN IRISA Invité.

More news