SESAMS

SESAMS - Systèmes conversationnels de recherche d’information

Coordinatrice : Laure Soulier, Laboratoire d’informatique de Paris 6)

Partenaire : Philippe Preux, Inria, CRIStAL

Équipe : SCOOL du Groupe Thématique DaTinG

JCJC - Jeunes chercheuses et jeunes chercheurs

Résumé :

Le projet s’adresse à un nouveau paradigme en RI dans lequel l’utilisateur peut interagir avec le moteur de recherche en langage naturel par l’intermédiaire d’uns système conversationnel. Nous appelons cela des systèmes conversationnels orientés vers la recherche d’information. Plusieurs défis importants : 1) comprendre le besoin d’information de l’utilisateur ; 2) concevoir un système proactif ; et 3) évaluer ce nouveau paradigme.

Apprentissage à partir de traces utilisateurs

Les systèmes conversationnels axés sur la recherche sont caractérisés par un contexte hétérogène impliquant : 1) un retour d’information implicite par rapport au moteur de recherche et/ou 2) des besoins d’information en langage naturel exprimés par le système conversationnel. Ce cadre complexe donne lieu à de nouveaux défis :
-Comprendre et contextualiser le besoin d’information pour le classement des documents. L’expression variable des besoins en langage naturel pose de grands défis à sa compréhension. Ce problème pourrait être abordé, par exemple, par le biais de modèles de traduction neuronale profonde (par exemple, les approches d’encodage et de décodage) en présentant le problème de compréhension comme une traduction. En outre, le processus de compréhension doit également tenir compte du contexte hétérogène en fonction de l’objectif de recherche. On peut, par exemple, combiner des modèles de traduction avec les techniques d’apprentissage par renforcement qui permettent d’apprendre conjointement la représentation du contexte et des documents.
-Enclencher des interactions proactives avec le système conversationnel orienté vers la recherche en anticipant les besoins des utilisateurs et en demandant un retour d’information aux utilisateurs (par exemple, demander les préférences des utilisateurs sur les requêtes reformulées ou les documents récupérés). Ce défi est lié aux interactions dans un cadre dynamique dans lequel le système conversationnel axé sur la recherche stimule le retour d’information des utilisateurs afin d’améliorer l’efficacité de la recherche. Ceci, par exemple, conduirait à des méthodes d’apprentissage par renforcement adaptatif guidées par une politique de RI.

Abstract :

The project envisions a novel paradigm in IR in which the user can interact with the search engine in natural language through the intermediary of a conversational system. We refer to this as search-oriented conversational systems. There are several important challenges underlying this novel paradigm : 1) understanding the user’s information need ; 2) designing a proactive system ; and, 3) evaluating this novel paradigm.

Learning from users’ interaction

Search-oriented conversational systems are characterized by a heterogeneous context involving : 1) implicit feedback with respect to the search engine and/or 2) natural language information needs expressed through the conversational system. This complex framework gives rise to novel challenges :
. Understanding and contextualizing the information need for document ranking. The variable expression of information needs in natural language poses great challenges to its understanding. This problem could be tackled for instance through deep neural translation models (e.g., encoder-decoder approaches) by casting the understanding problem as a translation. In addition, the understanding process should also cope with the heterogeneous context according to the retrieval objective. One may, for instance, combine translation models with reinforcement learning techniques that jointly learn the representaion of the context and the documents.
. Engaging the search-oriented conversational system in pro-active interactions by anticipating user’s needs and requesting feedback from users (e.g., asking user’s preferences over reformulated queries or retrieved documents). This challenge is related to interactions in a dynamic setting in which the search-oriented conversational system stimulates users’ feedback to enhance the retrieval effectiveness. This, for instance, would lead to adaptive reinforcement learning methods driven by an IR-guided policy.