DatInG : Data Intelligence Group

Équipe SequeL

Sequential Learning

Responsable: Philippe Preux

PRÉSENTATION MEMBRES THÈSES PUBLICATIONS

Présentation

SequeL est une équipe de recherche travaillant dans le domaine de l'apprentissage automatique ; plus précisément, SequeL est dédié à l'étude du problème de décision séquentielle dans l'incertain, c'est-à-dire, comment un « agent » ayant une certaine tâche à accomplir peut acquérir un comportement optimal afin de réaliser cette tâche, dans un environnement inconnu. SequeL est composé d'environ 25 membres. Les activités vont de la recherche fondamentale à la coneption d'algorithmes et la valorisation de ses recherches auprès d'entreprises. Les questions étudiées sont par exemple « Que peut apprendre efficacement une machine de Turing ? », ou dans un contexte budgétisé « étant donné une quantité de ressources de calcul, quelle est le meilleur comportement qui puisse être appris ? », ou encore des questions plus orientées vers des applications dans la recommandation de produits en ligne.

Les recherches menées dans SequeL ont produit le programme de jeu de Go multi-récompensé Crazy Stone ; plusieurs doctorants de l'équipe ont vu leurs travaux récompensés par des prix Gilles Kahn, Jacques Neveu, ou encore ECCAI. SequeL a remporté la compétition "ICML 2011 Exploration vs. Exploitation" et la compétition "ACM RecSYS 2014", toutes deux dans le cadre des systèmes de recommandation. L'expertise présente dans SequeL a débouché sur des collaborations avec de nombreuses entreprises internationales, nationales et des PMEs locales, parmi lesquelles nous citons Orange Labs, Intel, Technicolor, Deezer.

 

 

Membres

Permanents

  • Professeur
    • Philippe Preux (Responsable)
  • Directeur de recherche
    • Rémi Munos
  • Maîtres de conférences
    • Christos Dimitrakakis
    • Romaric Gaudel
    • Jérémie Mary
    • Bilal Piot
  • Chargés de recherche
    • Emilie Kaufmann
    • Alessandro Lazaric
    • Odalric-Ambrym Maillard
    • Daniil Ryabko
    • Michal Valko

Non permanents

  • Post Doctorant
    • Matteo Pirotta
  • Doctorants
    • Marc Abeille
    • Merwan Barlier
    • Alexandre Berard
    • Daniele Calandriello
    • Nicolas Carrara
    • Ronan Fruit
    • Pratik Gajane
    • Guillaume Gautier
    • Jean-Bastien Grill
    • Julien Perolat
    • Florian Strub
    • Romain Warlop
  • Ingénieur
    • Ralph Bourdoukan
  • Autres
    • Lilian Besson
    • Xuedong Shang

Marc Abeille

Controle robuste et apprentissage par renforcement, application au problème de construction de portefeuille

Merwan Barlier

Dialogues intelligents basés sur l'écoute de conversation homme/homme

Alexandre Berard

Learning from Post-edition in Machine Translation

Daniele Calandriello

Efficient Sequential Learning in Structured and Constrained Environment

Nicolas Carrara

Apprentissage par renforcement pour optimisation de systèmes de dialogue via l'adaptation à chaque utilisateur

Ronan Fruit

Transfer of Knowledge in reinforcement learning for the improvement of exploration and generalization

Pratik Gajane

Sequential Learning and Decision Making under Partial Monitoring

Guillaume Gautier

Echantillonnage rapide de processus déterminantaux

Jean-Bastien Grill

Création et analyse d'algorithmes efficaces pour la prise de décision dans un environnement inconnu et incertain

Julien Perolat

Apprentissage par renforcement : cas du jeu à 2 joueurs

Florian Strub

Contributions à l'apprentissage séquentiel profond et à son application à l'interaction homme-robot

Romain Warlop

Novel Learning and Exploration-Exploitation Methodes for Effective Recommender Systems

Frédéric Guillou

On Recommendation Systems in Sequential Context 2016-12-02

Tomas Kocak

Apprentissage séquentiel avec similitudes 2016-11-28

Vincenzo Musco

Usages of Graphs and Synthetic Data for Software Propagation Analysis 2016-11-03

Hadrien Glaude

Méthodes des moments pour l'inférence de systèmes séquentiels linéaires rationnels 2016-07-08

Marta Soare

Computational and sample complexity of planning and reinforcement learning algorithms 2015-12-14

Amir Sani

Machine Learning for Decision-Making under Uncertainty 2015-05-12

Olivier Nicol

Évaluation basée sur des données d'algorithmes de bandits contextuels et application à la recommandation dynamique 2014-12-18

Boris Baldassari

Maisqual : Amélioration de la qualité logicielle par fouille de données. 2014-07-01

Victor Gabillon

Algorithmes budgétisés d'itération sur les politiques obtenues par classification. 2014-06-12

Azadeh Khaleghi

Sur Quelques Problèmes non supervisés impliquant des séries temporelles hautement dépendantes 2013-11-18

Christophe Salperwyck

Apprentissage incrémental en ligne sur flux de données 2012-11-30

Alexandra Carpentier

De l'échantillonnage optimal en grande et petite dimension 2012-10-05

Jean Francois Hren

Compromis exploration - Exploitation en optimisation et contrôle 2012-06-01

Odalric-Ambrym Maillard

Apprentissage Séquentiel : Bandits, Statistique et Renforcement 2011-10-03

Manuel Loth

Algorithmes d'Ensembles Actifs pour le LASSO 2011-07-08

Sébastien Bubeck

Jeux de bandits et fondations du clustering 2010-06-10

Michal Valko

Bandits and graphs and structures 2016-06-15

Jérémie Mary

Data-Driven Recommender Systems - Sequences of Recommendations 2015-11-24

Mohammad Ghavamzadeh

Complexité d’Échantillonnage pour la Prise de Décision Séquentielle 2014-06-11

Daniil Ryabko

Apprenabilité dans les problèmes de l'inférence séquentielle 2011-12-19

Les autres équipes de ' DatInG : Data Intelligence Group '

LINKS MAGNET SIGMA