DatInG : Data Intelligence Group

Équipe SequeL

Sequential Learning

Responsable: Philippe Preux

PRÉSENTATION MEMBRES THÈSES PUBLICATIONS

Présentation

SequeL est une équipe de recherche travaillant dans le domaine de l'apprentissage automatique ; plus précisément, SequeL est dédié à l'étude du problème de décision séquentielle dans l'incertain, c'est-à-dire, comment un « agent » ayant une certaine tâche à accomplir peut acquérir un comportement optimal afin de réaliser cette tâche, dans un environnement inconnu. SequeL est composé d'environ 25 membres. Les activités vont de la recherche fondamentale à la coneption d'algorithmes et la valorisation de ses recherches auprès d'entreprises. Les questions étudiées sont par exemple « Que peut apprendre efficacement une machine de Turing ? », ou dans un contexte budgétisé « étant donné une quantité de ressources de calcul, quelle est le meilleur comportement qui puisse être appris ? », ou encore des questions plus orientées vers des applications dans la recommandation de produits en ligne.

Les recherches menées dans SequeL ont produit le programme de jeu de Go multi-récompensé Crazy Stone ; plusieurs doctorants de l'équipe ont vu leurs travaux récompensés par des prix Gilles Kahn, Jacques Neveu, ou encore ECCAI. SequeL a remporté la compétition "ICML 2011 Exploration vs. Exploitation" et la compétition "ACM RecSYS 2014", toutes deux dans le cadre des systèmes de recommandation. L'expertise présente dans SequeL a débouché sur des collaborations avec de nombreuses entreprises internationales, nationales et des PMEs locales, parmi lesquelles nous citons Orange Labs, Intel, Technicolor, Deezer.

 

 

Membres

Permanents

  • Professeur
    • Philippe Preux (Responsable)
  • Directeur de recherche
    • Rémi Munos
  • Maîtres de conférences
    • Christos Dimitrakakis
    • Romaric Gaudel
    • Jérémie Mary
    • Bilal Piot
  • Chargés de recherche
    • Emilie Kaufmann
    • Alessandro Lazaric
    • Odalric-Ambrym Maillard
    • Daniil Ryabko
    • Michal Valko

Non permanents

  • Post Doctorant
    • Matteo Pirotta
  • Doctorants
    • Marc Abeille
    • Merwan Barlier
    • Alexandre Berard
    • Daniele Calandriello
    • Nicolas Carrara
    • Ronan Fruit
    • Pratik Gajane
    • Jean-Bastien Grill
    • Julien Perolat
    • Florian Strub
    • Romain Warlop
  • Ingénieur
    • Ralph Bourdoukan
  • Autres
    • Lilian Besson
    • Alexis Martin
    • Xuedong Shang

Marc Abeille

Controle robuste et apprentissage par renforcement, application au problème de construction de portefeuille

Merwan Barlier

Dialogues intelligents basés sur l'écoute de conversation homme/homme

Alexandre Berard

Learning from Post-edition in Machine Translation

Daniele Calandriello

Efficient Sequential Learning in Structured and Constrained Environment

Nicolas Carrara

Apprentissage par renforcement pour optimisation de systèmes de dialogue via l'adaptation à chaque utilisateur

Ronan Fruit

Transfer of Knowledge in reinforcement learning for the improvement of exploration and generalization

Pratik Gajane

Sequential Learning and Decision Making under Partial Monitoring

Jean-Bastien Grill

Création et analyse d'algorithmes efficaces pour la prise de décision dans un environnement inconnu et incertain

Julien Perolat

Apprentissage par renforcement : cas du jeu à 2 joueurs

Florian Strub

Contributions à l'apprentissage séquentiel profond et à son application à l'interaction homme-robot

Romain Warlop

Novel Learning and Exploration-Exploitation Methodes for Effective Recommender Systems

Frédéric Guillou

On Recommendation Systems in Sequential Context 2016-12-02

Tomas Kocak

Apprentissage séquentiel avec similitudes 2016-11-28

Vincenzo Musco

Usages of Graphs and Synthetic Data for Software Propagation Analysis 2016-11-03

Hadrien Glaude

Méthodes des moments pour l'inférence de systèmes séquentiels linéaires rationnels 2016-07-08

Marta Soare

Computational and sample complexity of planning and reinforcement learning algorithms 2015-12-14

Amir Sani

Machine Learning for Decision-Making under Uncertainty 2015-05-12

Olivier Nicol

Évaluation basée sur des données d'algorithmes de bandits contextuels et application à la recommandation dynamique 2014-12-18

Boris Baldassari

Maisqual : Amélioration de la qualité logicielle par fouille de données. 2014-07-01

Victor Gabillon

Algorithmes budgétisés d'itération sur les politiques obtenues par classification. 2014-06-12

Azadeh Khaleghi

Sur Quelques Problèmes non supervisés impliquant des séries temporelles hautement dépendantes 2013-11-18

Christophe Salperwyck

Apprentissage incrémental en ligne sur flux de données 2012-11-30

Alexandra Carpentier

De l'échantillonnage optimal en grande et petite dimension 2012-10-05

Jean Francois Hren

Compromis exploration - Exploitation en optimisation et contrôle 2012-06-01

Odalric-Ambrym Maillard

Apprentissage Séquentiel : Bandits, Statistique et Renforcement 2011-10-03

Manuel Loth

Algorithmes d'Ensembles Actifs pour le LASSO 2011-07-08

Sébastien Bubeck

Jeux de bandits et fondations du clustering 2010-06-10

Michal Valko

Bandits and graphs and structures 2016-06-15

Jérémie Mary

Data-Driven Recommender Systems - Sequences of Recommendations 2015-11-24

Mohammad Ghavamzadeh

Complexité d’Échantillonnage pour la Prise de Décision Séquentielle 2014-06-11

Daniil Ryabko

Apprenabilité dans les problèmes de l'inférence séquentielle 2011-12-19

Les autres équipes de ' DatInG : Data Intelligence Group '

LINKS MAGNET SIGMA