Chargé de recherche (HDR)


Equipe(s)

SCOOL

Ma thèse

“Apprentissage Séquentiel : Bandits, Statistique et Renforcement”

Dirigée par Rémi Munos / Débutée le 1er octobre 2008

Domaine de recheche : Informatique

Thèses dirigées ou co-encadrées au sein de CRIStAL

Edouard Leurent

Apprentissage par renforcement sûr et efficace pour la planification de comportement en conduite autonome Soutenue le 30 octobre 2020

Reda Ouhamma

Bandits non stationnaires et recommandations médicales

Hassan Saber

Structure adaptation in reinforcement learning

Patrick Saux

Bandits non-stationnaires et applications au suivi de patients

Dorian Baudry

Efficient Exploration in Structured Bandits and Reinforcement Learning

Fabien Pesquerel

Structures et regrets en apprentissage par renforcement