PALOMA

PALOMA - Paléomique : modèles et algorithmes

Coordinatrice : Hélène Touzet, CNRS CRIStAL

Équipe : Bonsai du Groupe Thématique : MSV

Dates : 2025 - 2029

Résumé :

Les progrès de la biologie moléculaire permettent aujourd’hui d’accéder aux informations génétiques contenues dans des échantillons anciens d’origine animale, renouvelant de manière radicale les approches d’identification des espèces en paléontologie et zooarchéologie. Ces nouvelles données offrent une perspective inédite sur la biologie et l’écologie du passé. Toutefois, comme pour toute nouvelle source de données, il est nécessaire de développer des méthodes numériques adéquates pour leur analyse.
Le projet PALOMA se concentre sur l’analyse des protéines anciennes, la paléoprotéomique, représentée par exemple par les techniques d’empreinte de masse peptidique pour le collagène, et sur l’analyse conjointe de l’ADN ancien et des et des protéines dans une démarche intégrative. Les objectifs du projet sont de concevoir des algorithmes et des modèles pour formaliser et automatiser l’analyse des données de spectres de masses pour les échantillons anciens. Pour ce faire, nous nous appuierons sur des méthodes issues de l’algorithmique des séquences et de l’apprentissage automatique. Toutes ces contributions seront valorisées sous forme de logiciels libres, pensés pour permettre une analyse à grande échelle reproductible et pour faciliter une large diffusion des méthodes dans la communauté. Elles seront complétées par des cas d’études soigneusement sélectionnés pour leur intérêt intrinsèque et pour la difficulté d’analyse qu’ils représentent. Pour sa réussite, le projet est porté par un consortium pluridisciplinaire réunissant bioinformaticiens, protéomiciens, généticiens, zooarchéologues et paléontologues.

Abstract :

Advances in molecular biology have made it possible to access genetic information from ancient animal samples, revolutionizing approaches to species identification in paleontology and zooarchaeology. This new data provides an unprecedented perspective on the biology and ecology of the past. However, as with any new data source, it is essential to develop appropriate digital methods for its analysis.
The PALOMA project focuses on the analysis of ancient proteins-paleoproteomics-exemplified by techniques such as peptide mass fingerprinting for collagen, and on the integrated analysis of ancient DNA and proteins. The goal of the project is to design algorithms and models to formalize and automate the analysis of mass spectrometry data from ancient samples. To achieve this, we will introduce innovative methodological developments drawn from combinatorics, discrete algorithms, and machine learning.
All these contributions will be developed as open-source software, designed to enable large-scale, reproducible analysis and to facilitate the widespread adoption of these methods within the community. The software will be complemented by case studies carefully selected for their intrinsic interest and the analytical challenges they present. To ensure the project’s success, it is led by a multidisciplinary consortium of bioinformaticians, proteomicists, geneticists, zooarchaeologists, and paleontologists.