Coordinateur : Michaël Thomazo, Inria
Partenaire : Antoine Amarilli, Inria Lille CRIStAL
Équipe : D-DAL du Groupe Thématique : SISE
Dates : 2025 - 2030
Résumé :
Dans une société axée sur les données, où la prise de décision dépend d’une analyse avancée des données, les informations pertinentes sont souvent dispersées dans de multiples sources. Cela pose le défi de fournir une vue intégrée de plusieurs sources de données afin de permettre à une partie prenante d’effectuer des recherches intuitives et efficaces. Le projet EXPAND vise à faciliter l’accès aux données et leur intégration grâce à la technologie OBDA (Ontology-Based Data Access). En bref, l’OBDA fournit un cadre formel permettant d’intégrer des sources de données multiples en ajoutant une couche ontologique au-dessus d’elles. Les fondements de l’OBDA ont fait l’objet de recherches intenses au cours des 15 dernières années et ont déjà permis des applications industrielles réussies. Cependant, malgré ses promesses, le cadre OBDA actuel est encore confronté à des défis importants.
En effet, pour récolter tout le potentiel de l’approche, trois ingrédients clés sont nécessaires : premièrement, l’utilisateur doit pouvoir exprimer son besoin d’information, ce qui nécessite des langages de requêtes expressifs ; deuxièmement, l’utilisateur doit pouvoir comprendre la raison pour laquelle une réponse donnée est fournie, ce qui nécessite à la fois des facilités d’explication et des représentations compactes de réponses diversifiées ; troisièmement, le système doit fournir des réponses en temps réel, ce qui nécessite des algorithmes d’interrogation efficaces qui s’adaptent à la présence de grands ensembles de données. L’état de l’art dans le domaine de l’OBDA est encore très limité en ce qui concerne ces trois défis.
Le projet EXPAND relèvera ces défis en poursuivant trois objectifs. Le premier objectif est d’étendre l’OBDA pour prendre en charge des classes de requêtes comprenant l’agrégation, la navigation et la négation par défaut. Le deuxième objectif est de fournir à l’utilisateur un contexte suffisant pour l’aider à accepter ou à rejeter les réponses fournies par le système, notamment en exploitant des techniques provenant de domaines voisins. Le troisième objectif est de développer des techniques d’optimisation tenant compte des données afin de rendre un cadre OBDA expressif applicable dans la pratique. Enfin, nous démontrerons nos techniques sur trois cas d’utilisation dans l’agriculture et l’agronomie, en nous appuyant sur des collaborations en cours avec l’INRAe et le DFKI.
Abstract :
In a data-driven society where decision-making depends on advanced data analysis, valuable information is often scattered across multiple sources. This raises the challenge of providing an integrated view of multiple data sources to allow for intuitive and efficient querying by a stakeholder. The EXPAND project aims to facilitate data access and integration through the Ontology-Based Data Access (OBDA) technology. In a nutshell, OBDA provides a principled way of integrating multiple data sources by adding an ontological layer on top of them. The foundations of OBDA have been the subject of intense research over the last 15 years, and have already allowed for successful industrial applications. However, despite its promises, the current OBDA framework still faces some sensible challenges.
Indeed, to reap the full potential of the approach, three key ingredients are necessary : first, the user should be able to express their information need, and this requires expressive query languages ; second, the user should be able to understand the reason why a given answer is provided, and this requires both explanation facilities and compact representations of diverse answers ; third, the system should provide answers in a timely manner, and this requires efficient querying algorithms that scale in the presence of large datasets. The state of the art in OBDA is still severely limited regarding these three challenges.
The EXPAND project will tackle these challenges by pursuing three goals. The first goal is to expend OBDA to support query classes featuring aggregation, navigation and default negation. The second goal is to provide enough context to a user to help them to accept or discard answers provided by the system, in particular by leveraging techniques from neighbouring fields. The third goal is to develop data-aware optimization techniques to make an expressive OBDA framework applicable in practice. Finally, we will demonstrate our techniques on three use cases in agriculture and agronomy, building upon ongoing collaborations with INRAe and DFKI.