on November 25, 2025 at 2:00 pm at IMT Nord Europe (Villeneuve d'Ascq Cité scientifique)
Les données de formes 3D sont particulièrement difficiles à traiter en raison de leur relativement faible quantité et de leur complexité. Pourtant, réussir à calculer des déformations plausibles de telles formes est essentiel pour de nombreuses applications, allant de la réalité augmentée à l’ingénierie mécanique et à l’imagerie biomédicale. Les méthodes d'apprentissage ont montré des performances remarquables dans le traitement des données de textes et d'images. Cependant, généraliser de tels modèles pour traiter les données de formes déformables pose de multiples défis en raison de leur aspect non euclidien et de leur grande dimensionnalité. Les maillages de surface constituent une discrétisation naturelle des données de formes 3D. Lorsqu’ils sont acquis à l’état brut, ces maillages ne sont pas alignés par rapport à un template, ce qui signifie que l’agencement des sommets et des faces du maillage n’est pas précisément connu. Cette observation est souvent négligée, et de nombreux algorithmes, en particulier ceux basés sur l’apprentissage, sont conçus pour des données alignées avec une structure connue. Cela limite leur utilisation pour des applications réelles, puisque le modèle ne peut pas généraliser à de nouvelles discrétisations. Cette thèse présente des avancées concernant le problème de la prédiction de déformations de surfaces qui restent robustes lorsque les maillages d’entrée sont remaillés, et nous présentons plusieurs contributions en ce sens dans ce manuscrit. Tout d’abord, nous proposons une nouvelle fonction de coût pour l’apprentissage non supervisé des déformations de visages à partir d’un template, en utilisant un modèle de type autoencodeur. Ensuite, nous enrichissons la structure d’espace latent global pour induire de la localité en combinant des features locales et globales, ce qui permet de prédire des déformations et des interpolations partielles. Puis, avec une modalité supplémentaire (l’audio), nous développons cette idée afin de proposer le premier modèle de têtes parlantes en 3D capable de généraliser à travers différentes structures de maillage. Enfin, nous modifions ce même modèle de manière séquentielle pour l’utiliser dans des mouvements impliquant de grandes distances tels que la marche et la course. Ensemble, ces contributions répondent à des limitations communes et difficiles des modèles de déformations de surface.
M. Mohamed DAOUDI IMT Nord Europe Directeur de thèse, Mme Stefanie WUHRER Centre Inria de l’Université Grenoble Alpes Rapporteure, M. Guillaume LAVOUé École Centrale de Lyon Rapporteur, M. Sylvain ARGUILLèRE Université de Lille Co-encadrant de thèse, M. Alain TROUVé ENS Paris-Saclay Examinateur, M. Jean FEYDY Centre Inria de Paris Examinateur, M. Stefano BERRETTI Media Integration and Communication Center (MICC) & Department of Information Engineering (DINFO) University of Florence Invité, M. Stefan SOMMER University of Copenhagen Invité.