Soutenance de thèse de Dinh-viet-toan Le

Modélisation de la Musique Symbolique par des Approches de Traitement Automatique du Langage Naturel

le 3 novembre 2025 à 14:30 à Bâtiment ESPRIT - Atrium

La musique est souvent comparée à un langage. Cette comparaison est notamment due au fait que musique et langage naturel partagent de nombreuses similarités. Parmi celles-ci figurent leurs représentations respectives à travers la notation musicale symbolique – ou partition musicale – et la forme écrite textuelle du langage. Ainsi, le domaine de la recherche d’information musicale MIR a fréquemment emprunté des outils provenant du domaine du Traitement automatique du langage naturel (TALN) afin de les adapter au traitement de données musicales symboliques. Ce phénomène s’est particulièrement intensifié avec l’essor des modèles de type Transformer dans le domaine du TALN. Cette thèse propose tout d’abord une synthèse structurée des adaptations des méthodes de TALN développées dans le champ du MIR pour le traitement de la musique symbolique. Elles sont présentées selon trois axes, chacun portant sur l’utilisation de différentes représentations de la musique symbolique à divers niveaux. La musique symbolique représentée comme des données séquentielles a conduit au développement de plusieurs stratégies de tokenization, que nous proposons d’organiser au sein d’une taxonomie unifiée. Ces représentations sont ensuite traitées par des modèles, tels que les architectures basées sur des mécanismes de récurrence ou d’attention. Celles-ci, initialement conçues pour les données textuelles, ont donné lieu à de multiples adaptations pour le traitement de la musique symbolique. Enfin, ces représentations abstraites sont utilisées pour accomplir des tâches, où émergent à la fois des parallèles et des spécificités distinctives entre MIR et TALN. Ces aspects structurent ensuite les trois contributions techniques de cette thèse. Dans un premier temps, nous étudions l’expressivité des représentations séquentielles de la musique à travers le développement de stratégies de tokenization basées sur les intervalles musicaux, ainsi que l’analyse d’une stratégie de tokenization en sous-mots, le Byte-Pair Encoding, appliqué aux tokens musicaux symboliques. Nous proposons ensuite un cadre pour l’explicabilité de modèles, qui est utilisé pour l’analyse du mécanisme d’attention d’un modèle basé sur Transformeur, entraîné sur une tâche d’analyse d’harmonie fonctionnelle. Enfin, nous développons un modèle adapté des outils du TALN pour une tâche de ré-orchestration, considérée comme un cas de génération automatique de musique multi-instrumentale. Par ces contributions, cette thèse soutient que les méthodes de TALN restent avant tout une boîte à outils dans laquelle le MIR peut s’inspirer. Malgré les analogies entre ces deux domaines, la principale motivation guidant une étude en MIR devrait avant tout être d’ordre musical.

Jury

M. Marc TOMMASI Université de Lille Directeur de thèse, Mme Chloé BRAUD Institut de Recherche en Informatique de Toulouse Examinatrice, M. Emmanouil BENETOS Queen Mary University of London Examinateur, M. Patrick BAS Université de Lille Examinateur M. Louis BIGO Université de Bordeaux Co-directeur de thèse, M. Marius BILASCO Université de Lille Examinateur, M. Xavier HINAUT Inria Bordeaux Rapporteur, Mme Cheng-Zhi Anna HUANG Massachusetts Institute of Technology Rapporteure, Mme Mikaela KELLER Université de Lille Invitée.

Plus d'actualités