Hdr de Odalric-Ambrym Maillard

Mathématique de la prise de décision séquentielle statistique

Ce document montre un tour d’horizon de quelques contributions récentes à la mathématique de l’apprentissage statistique séquentiel. Contrairement aux articles de recherches qui partent d’exemples et donnent peu de place aux outils mathématiques, souvent relayés en annexe, nous présentons ici ces outils en pleine lumière, afin de souligner leur rôle capital dans le développement de nouvelles stratégies de prise de décision séquentielle dans l’incertain. Nous revisitons en particulier les propriétés de la transformée de Laplace d’une variable aléatoire, la prise en compte des temps d’arrêt pour la concentration de distributions empiriques, avant de souligner le rôle fondamental du « changement de mesure » dans la construction à la fois des meilleures bornes de performances atteignables et des stratégies quasi-optimales. Nous nous tournons ensuite vers l’obtention de bornes d’erreur en temps fini pour l’estimation de paramètre dans différents modèles paramétriques, avant d’expliquer le rôle clé de la dualité de Legendre-Fenchel dans la construction de stratégies robustes et sensibles au risque. Enfin, nous présentons, dans le cadre des processus décisionnels de Markov, de nouveaux éléments de compréhension utiles à la découverte de nouvelles stratégies de prise de décision séquentielle. Ce manuscrit se termine par une présentation plus détaillée de trois contributions clés à la théorie de bandits, aux automates stochastiques ainsi qu’à l’agrégation d’experts.

soutenue le 11/02/2019