DatInG : Data Intelligence Group

Équipe SequeL

Sequential Learning

Responsable: Philippe Preux

PRÉSENTATION MEMBRES THÈSES PUBLICATIONS

Présentation

SequeL est une équipe de recherche travaillant dans le domaine de l'apprentissage automatique ; plus précisément, SequeL est dédié à l'étude du problème de décision séquentielle dans l'incertain, c'est-à-dire, comment un « agent » ayant une certaine tâche à accomplir peut acquérir un comportement optimal afin de réaliser cette tâche, dans un environnement inconnu. SequeL est composé d'environ 25 membres. Les activités vont de la recherche fondamentale à la coneption d'algorithmes et la valorisation de ses recherches auprès d'entreprises. Les questions étudiées sont par exemple « Que peut apprendre efficacement une machine de Turing ? », ou dans un contexte budgétisé « étant donné une quantité de ressources de calcul, quelle est le meilleur comportement qui puisse être appris ? », ou encore des questions plus orientées vers des applications dans la recommandation de produits en ligne.

Les recherches menées dans SequeL ont produit le programme de jeu de Go multi-récompensé Crazy Stone ; plusieurs doctorants de l'équipe ont vu leurs travaux récompensés par des prix Gilles Kahn, Jacques Neveu, ou encore ECCAI. SequeL a remporté la compétition "ICML 2011 Exploration vs. Exploitation" et la compétition "ACM RecSYS 2014", toutes deux dans le cadre des systèmes de recommandation. L'expertise présente dans SequeL a débouché sur des collaborations avec de nombreuses entreprises internationales, nationales et des PMEs locales, parmi lesquelles nous citons Orange Labs, Intel, Technicolor, Deezer.

 

 

Membres

Permanents

  • Professeur
    • Philippe Preux (Responsable)
  • Directeur de recherche
    • Rémi Munos
  • Chargés de recherche
    • Emilie Kaufmann
    • Alessandro Lazaric
    • Odalric-Ambrym Maillard
    • Daniil Ryabko
    • Michal Valko

Non permanents

  • Post Doctorant
    • Mohammad sadegh Talebi
  • Doctorants
    • Sheikh Waqas Akhtar
    • Merwan Barlier
    • Nicolas Carrara
    • Omar Darwiche Domingues
    • Yannis Flet-berliac
    • Ronan Fruit
    • Guillaume Gautier
    • Edouard Leurent
    • Pierre Perrault
    • Hassan Saber
    • Mathieu Seurin
    • Julien Seznec
    • Xuedong Shang
    • Florian Strub
    • Kiewan Villatel
  • Autre catégorie
    • Lilian Besson

Associés

  • Professeur
    • Olivier Pietquin

Merwan Barlier

Dialogues intelligents basés sur l'écoute de conversation homme/homme

Nicolas Carrara

Apprentissage par renforcement pour optimisation de systèmes de dialogue via l'adaptation à chaque utilisateur

Omar Darwiche Domingues

Sequential Learning in Dynamic Environments

Yannis Flet-berliac

Deep Reinforcement Learning in Stochastic and non Stationary Environments

Ronan Fruit

Transfer of Knowledge in reinforcement learning for the improvement of exploration and generalization

Guillaume Gautier

Echantillonnage rapide de processus déterminantaux

Jean-Bastien Grill

Création et analyse d'algorithmes efficaces pour la prise de décision dans un environnement inconnu et incertain

Edouard Leurent

Conduite automobile autonome : application des techniques d'apprentissage automatique à la planification contextualisée de trajectoire

Pierre Perrault

Online Learning on Streaming Graphs

Hassan Saber

Structure adaptation in reinforcement learning

Mathieu Seurin

Problème de récompenses Multi'échelle dans le contexte de l'apprentissage par renforcement

Julien Seznec

Sequential Learning for Educationnal System

Xuedong Shang

Méthodes adaptatives pour l'optimisation dans un environnement stochastique

Florian Strub

Contributions à l'apprentissage séquentiel profond et à son application à l'interaction homme-robot

Kiewan Villatel

Sequential Learning for Online Advertising

Romain Warlop

Novel Learning and Exploration-Exploitation Methodes for Effective Recommender Systems 2018-10-19

Alexandre Berard

Traduction Neuronale : Architectures et Applications 2018-06-15

Daniele Calandriello

Apprentissage séquentiel efficace dans des environnements structurés avec contraintes 2017-12-18

Julien Perolat

Apprentissage par renforcement : le cas multijoueur 2017-12-18

Marc Abeille

Thompson Sampling pour l'exploration-exploitation dans les systèmes linéaires 2017-12-13

Pratik Gajane

Multi-armed bandits with unconventional feedback 2017-11-14

Frédéric Guillou

On Recommendation Systems in Sequential Context 2016-12-02

Tomas Kocak

Apprentissage séquentiel avec similitudes 2016-11-28

Vincenzo Musco

Usages of Graphs and Synthetic Data for Software Propagation Analysis 2016-11-03

Hadrien Glaude

Méthodes des moments pour l'inférence de systèmes séquentiels linéaires rationnels 2016-07-08

Marta Soare

Computational and sample complexity of planning and reinforcement learning algorithms 2015-12-14

Amir Sani

Machine Learning for Decision-Making under Uncertainty 2015-05-12

Olivier Nicol

Évaluation basée sur des données d'algorithmes de bandits contextuels et application à la recommandation dynamique 2014-12-18

Boris Baldassari

Maisqual : Amélioration de la qualité logicielle par fouille de données. 2014-07-01

Victor Gabillon

Algorithmes budgétisés d'itération sur les politiques obtenues par classification. 2014-06-12

Azadeh Khaleghi

Sur Quelques Problèmes non supervisés impliquant des séries temporelles hautement dépendantes 2013-11-18

Christophe Salperwyck

Apprentissage incrémental en ligne sur flux de données 2012-11-30

Alexandra Carpentier

De l'échantillonnage optimal en grande et petite dimension 2012-10-05

Jean Francois Hren

Compromis exploration - Exploitation en optimisation et contrôle 2012-06-01

Odalric-Ambrym Maillard

Apprentissage Séquentiel : Bandits, Statistique et Renforcement 2011-10-03

Manuel Loth

Algorithmes d'Ensembles Actifs pour le LASSO 2011-07-08

Sébastien Bubeck

Jeux de bandits et fondations du clustering 2010-06-10

Michal Valko

Bandits and graphs and structures 2016-06-15

Jérémie Mary

Data-Driven Recommender Systems - Sequences of Recommendations 2015-11-24

Mohammad Ghavamzadeh

Complexité d’Échantillonnage pour la Prise de Décision Séquentielle 2014-06-11

Daniil Ryabko

Apprenabilité dans les problèmes de l'inférence séquentielle 2011-12-19

Les autres équipes de ' DatInG : Data Intelligence Group '

LINKS MAGNET SIGMA