DatInG : Data Intelligence Group

Équipe SequeL

Sequential Learning

Responsable: Philippe Preux

PRÉSENTATION MEMBRES THÈSES PUBLICATIONS

Présentation

SequeL est une équipe de recherche travaillant dans le domaine de l'apprentissage automatique ; plus précisément, SequeL est dédié à l'étude du problème de décision séquentielle dans l'incertain, c'est-à-dire, comment un « agent » ayant une certaine tâche à accomplir peut acquérir un comportement optimal afin de réaliser cette tâche, dans un environnement inconnu. SequeL est composé d'environ 25 membres. Les activités vont de la recherche fondamentale à la coneption d'algorithmes et la valorisation de ses recherches auprès d'entreprises. Les questions étudiées sont par exemple « Que peut apprendre efficacement une machine de Turing ? », ou dans un contexte budgétisé « étant donné une quantité de ressources de calcul, quelle est le meilleur comportement qui puisse être appris ? », ou encore des questions plus orientées vers des applications dans la recommandation de produits en ligne.

Les recherches menées dans SequeL ont produit le programme de jeu de Go multi-récompensé Crazy Stone ; plusieurs doctorants de l'équipe ont vu leurs travaux récompensés par des prix Gilles Kahn, Jacques Neveu, ou encore ECCAI. SequeL a remporté la compétition "ICML 2011 Exploration vs. Exploitation" et la compétition "ACM RecSYS 2014", toutes deux dans le cadre des systèmes de recommandation. L'expertise présente dans SequeL a débouché sur des collaborations avec de nombreuses entreprises internationales, nationales et des PMEs locales, parmi lesquelles nous citons Orange Labs, Intel, Technicolor, Deezer.

 

 

Dorian Baudry

Efficient Exploration in Structured Bandits and Reinforcement Learning

Omar Darwiche Domingues

Sequential Learning in Dynamic Environments

Johan Ferret

Apprentissage par renforcement explicable

Yannis Flet-Berliac

Deep Reinforcement Learning in Stochastic and non Stationary Environments

Guillaume Gautier

Echantillonnage rapide de processus déterminantaux

Nathan Grinsztajn

Apprentissage par renforcement pour la résolution séquentielle de problèmes d'optimisation combinatoire incertains et partiellement définis

Léonard Hussenot Desenonges

Apprentissage par renforcement et robustesse face aux attaques adversariales

Edouard Leurent

Conduite automobile autonome : application des techniques d'apprentissage automatique à la planification contextualisée de trajectoire

Reda Ouhamma

Bandits non stationnaires et recommandations médicales

Pierre Perrault

Online Learning on Streaming Graphs

Sarah Perrin

Apprentissage par renforcement dans les jeux à champ moyen

Hassan Saber

Structure adaptation in reinforcement learning

Mathieu Seurin

Problème de récompenses Multi'échelle dans le contexte de l'apprentissage par renforcement

Julien Seznec

Sequential Learning for Educationnal System

Xuedong Shang

Méthodes adaptatives pour l'optimisation dans un environnement stochastique

Jean Tarbouriech

Exploration/exploitation à grande échelle

Kiewan Villatel

Sequential Learning for Online Advertising

Les autres équipes du groupe thématique ' DatInG '

LINKS MAGNET SIGMA