Thèse de Afifa Dahmane

Estimation du regard à partir de la vidéo

L'objectif de cette thèse est l'estimation de la pose de la tête humaine à partir d'images monoculaires. Le but est d'avoir un retour d'information de l'utilisateur sur l'orientation de son regard, et ce, de manière non-intrusive. Ce domaine de recherche est très actif compte tenu de l'évolution des interfaces de communication entre l'homme et la machine, d'autant plus que plusieurs défis sont toujours ouverts. Notamment, la robustesse du système, son invariabilité à l'identité des personnes et à l'illumination ainsi que la qualité du matériel de capture requis. L'approche que nous avons proposée est basée sur la symétrie bilatérale du visage. Nous utilisons des caractéristiques extraites de la symétrie pour estimer la pose de la tête par le biais de l'apprentissage. Les caractéristiques utilisées sont géométriques mais extraites de manière globale à partir de toute la texture du visage, sans que des points ou des contours spécifiques ne soient requis. Ces caractéristiques ont été validées expérimentalement à l'aide de bases d'images et de vidéos publiques dédiées à l'estimation de la pose de la tête. L'apprentissage supervisé ainsi que la régression sont utilisés pour construire des modèles de poses. Ces modèles ont été testés sur des séquences vidéo indépendantes des bases utilisées pour l'apprentissage. L'erreur d'estimation a été calculée et les résultats sont supérieurs ou équivalents à l'état de l'art.

Jury

Thèse de l'équipe FOX soutenue le 1er février 2015

Retour vers les autres thèses