Thesis of Solène Bernard

Stéganographie d’images numériques via l’utilisation de réseaux de neurones sous présence d’un adversaire

La stéganographie est une technique qu'Alice peut utiliser pour envoyer secrètement un message à Bob. Cela consiste à dissimuler discrètement un message au sein d'un contenu public sans éveiller les soupçons du stéganalyste Eve, qui observe le canal de communication et peut le couper. Les images numériques offrent un potentiel énorme pour cacher un message en modifiant légèrement ses coefficients. Dans cette thèse, nous présentons une procédure automatique pour améliorer la stéganographie en modifiant des images naturelles. Pour augmenter la sécurité, Alice doit adapter l'incorporation du message au contenu afin d'éviter les zones à risque, comme le ciel ou les murs. Sa mission consiste donc à concevoir une fonction de distorsion définissant quels coefficients de l'image ne doivent pas être modifiés. D'autre part, Eve peut utiliser des détecteurs de pointe en entraînant un modèle d'apprentissage profond pour détecter quelles images ont été modifiées. Ils sont très performants pour détecter des modifications invisibles à l'œil nu effectuées à une image. Dans ce manuscrit, nous proposons d'utiliser des notions de théorie des jeux pour aborder le problème, car nous pouvons voir Alice et Eve comme jouant à un jeu compétitif avec des ambitions antagonistes. Cela nous aide à définir correctement le problème et met en évidence le problème d'optimisation $minmax$ qu'Alice veut résoudre. Notre première contribution propose une solution pratique pour résoudre le problème d'optimisation en construisant un jeu itératif fictif où les deux joueurs peuvent jouer de manière optimale. Tout d'abord, (i) Alice peut créer de nouveaux stégos en adaptant sa fonction de distorsion pour vaincre le détecteur dérivable optimal d'Eve. Puis (ii) Eve peut créer un nouveau classificateur optimisé pour détecter les meilleurs stégos d'Alice. De cette façon, nous proposons une procédure automatique qui améliore le schéma d'Alice par rapport à un détecteur dérivable. Nous avons utilisé pour nos expériences l'algorithme ADV-EMB~cite{tang2019spatial} pour l'étape (i). Les résultats montrent que le protocole automatique donne des stégos indétectables par un détecteur spécifique mais aussi par des classifieurs non considérés jusqu'alors. Notre deuxième contribution propose une amélioration de ADV-EMB. Alors que cet algorithme repose sur une heuristique, nous proposons d'adopter une technique d'optimisation classique, la descente de gradient, pour aborder la résolution du problème d'optimisation. L'idée principale est d'appliquer une astuce de reparamétrisation qui permet de différencier l'espérance de la détectabilité donnée par un détecteur par rapport à la fonction de distorsion. Cette nouvelle méthode fournit une attaque plus puissante, qui améliore encore plus la discrétion d'Alice.

Jury

M. Patrick BAS - Université de Lille - Directeur de Thèse M. John KLEIN - Université de Lille - Co-directeur de Thèse Mme Caroline FONTAINE - Laboratoire LSV, ENS Paris-Saclay - Examinatrice Mme Luisa VERDOLIVA - University Federico II of Naples, Italie - Examinatrice M. Andrew KER - Oxford University College - Rapporteur M. Laurent AMSALEG - IRISA-INRIA Rennes - Rapporteur M. Teddy FURON - INRIA Rennes - Invité M. Tomas PEVNY - CVUT (Université technique de Prague) - Invité

Thesis of the team SIGMA defended on 18/10/2021