L’apparition sur internet du “linked data” (le web des données) appelle à réfléchir à de nouvelles techniques de traitement des bases de données. Les défis classiques de la recherche dans les bases de données doivent désormais être relevés pour ce qui concerne le “linked data”: comment définir des requêtes exactes et logiques, comment gérer des mises à jour dynamiques, et comment automatiser la recherche de requêtes appropriées ? Par contraste avec le traditionnel “linked open data” (données ouvertes et liées), le projet LINKS sera centré sur la collecte de “linked data” en différents formats, partant de l’hypothèse que les données sont correctes dans la plupart des dimensions. Ces défis restent difficiles à relever du fait de données incomplètes, de schémas peu instructifs et hétérogènes, du fait d’erreurs subsistantes de données ainsi que des ambiguïtés. Nous développerons des algorithmes pour évaluer et optimiser la logique des requêtes dans la collecte de “linked data”, des algorithmes d’apprentissage incrémental permettant de contrôler les flux de “linked data” et pouvant gérer des mises à jour dynamiques des recherches, et des algorithmes d’apprentissage symbolique permettant de déduire par l’exemple des requêtes appropriées pour la collecte de “linked data”.
Sylvain Salvati
Evaluation du programme hyperstreaming pour les données dynamiques
Langages réguliers et circuits de taille linéaire
Compilation et aggrégation dans les bases de données
Compilation et exécution efficace des expressions régulières en Streaming
Enrichir et résoudre des programmes linéaires avec des requêtes conjonctives 28/02/2023
Safety of data transformations 16/12/2021
Requêtes logiques sur les hyperflux 24/07/2020
Normalisation et apprentissage de transducteurs d'arbres et de mots 07/11/2016
Evaluation de requêtes XPath sur des flux XML avec des réseaux d'automates de mots imbriqués 17/06/2016
Requêtes et schémas hétérogènes : Complexité et apprentissage 01/07/2015