MELISSA

MELISSA - Contributions méthodologiques en apprentissage statistique inspirées par l’ingénierie de surface

Coordinateur : Marc Sebban, Université Jean Monnet Saint-Etienne

Partenaire : Marc Tommasi, Rémi Gilleron, Université de Lille, Le Bars Batiste, Jan Ramon, Inria, CRIStAL

Équipe : MAGNET du Groupe Thématique : DatInG.

Dates : 2024 - 2029

Résumé :

Les dynamiques sous-jacentes aux phénomènes physiques sont généralement gouvernées par des équations aux dérivées partielles (EDP). Malgré d’importantes avancées en simulation numérique, résoudre efficacement ces équations reste complexe et souvent prohibitif en temps de calcul.
L’apprentissage automatique guidé par la physique (PiML) a émergé comme une solution prometteuse pour apprendre des solveurs d’EDP et pour compléter les lois physiques en tirant parti des données. Du point de vue de l’apprentissage automatique, ignorer les principes fondamentaux de la physique peut conduire à des problèmes mal posés et à des solutions non consistantes entraînant une mauvaise généralisation. De nombreuses contributions algorithmiques en apprentissage profond ont récemment exploité ces contraintes physiques pour (i) concevoir des fonctions de perte régularisées par de la connaissance physique, (ii) initialiser les réseaux neuronaux avec des paramètres consistants, (iii) guider la conception d’architectures neuronales, ou (iv) construire des modèles hybrides. Malgré des avancées indiscutables, ce sujet émergent soulève de nombreux défis : (i) Dérivation de garanties : les fondements théoriques du PiML en sont encore à un stade précoce. Il est crucial d’étudier ses propriétés théoriques pour avoir une compréhension globale de ses capacités et limitations ; (ii) Apprentissage parcimonieux : alors que les approches PiML supposent avoir accès à des ensemble de données importants, de nombreuses applications ne permettent pas de les fournir ; (iii) Enrichissement des lois physiques : dans les situations réelles, les lois physiques peuvent n’expliquer que partiellement les dynamiques sous-jacentes ; (iv) Résolution de EDP paramétriques : les approches actuelles offrent des solutions pour seulement une gamme limitée de paramètres (conditions initiales/bord, termes de forçage) ; (v) Modélisation de l’incertitude : l’incertitude est un problème clé en physique, pourtant la plupart des approches PiML sont déterministes ; (vii) Modèles fondamentaux pour la physique : la modélisation de plusieurs physiques pour tirer parti de grands ensembles de données de simulation émerge comme un sujet clé à travers le développement de modèles fondamentaux pour la physique.

Développer des solutions adaptées pour relever ces défis est crucial pour l’exploitation des modèles de PiML dans des scénarios réalistes. Pour ce faire, les problèmes physiques abordés dans MELISSA se placeront dans le scénario complexe et représentatif de contraintes réalistes, où les données sont rares et les lois physiques n’expliquent que partiellement les dynamiques. Nous aborderons en particulier l’auto-organisation de la matière, la phénomène qui se produit lorsqu’une impulsion laser interagit avec la surface d’un matériau, induisant une modification de celle-ci et l’émergence de motifs. La modélisation de cette dynamique est complexe impliquant des phénomènes issus issus de l’électromagnétisme, la thermodynamique et la mécanique des fluides, dont les interactions sont encore inconnues. De ce fait, il ,’existe actuellement aucune EDP qui modélise précisément le phénomène. La difficulté de cette tâche est accrue par la quantité limitée de données disponibles. En effet, du fait que la lumière se propage trop rapidement et que l’impulsion du laser est très courte, il n’existe aucun équipement électronique capable de capturer la dynamique. Par conséquent, contrairement à d’autres systèmes dynamiques (e.g. en météorologie, en modélisation de la température des lacs, en mécanique des fluides, etc.), l’acquisition d’une grande quantité de données est un obstacle insurmontable.
En menant ce projet d’un point de vue théorique et algorithmique, l’objectif du projet MELISSA est de concevoir la prochaine génération d’algorithmes informés par la physique fondés théoriquement, dans ce contexte difficile n’ayant pour l’instant pas encore significativement été étudié par la communauté scientifique.

Abstract :

The underlying dynamics of many physical problems are governed by parameterized partial differential equations (PDEs). Despite important scientific advances in numerical simulation, solving efficiently PDEs remains complex and often prohibitively expensive. Physics-informed Machine Learning (PiML) has recently emerged as a promising way to learn efficient surrogate solvers, and augment the physical laws by leveraging knowledge extracted from data. From a machine learning perspective, ignoring the fundamental principles of the underlying physics may lead to ill-posed problems and thus to implausible solutions yielding poor generalization. Numerous algorithmic contributions in deep-learning have recently exploited domain knowledge for (i) designing suitable physics-regularized loss functions, (ii) initializing neual networks with meaningful parameters, (iii) guiding the design of consistent architectures, or (iv) building hybrid models. Despite indisputable advances, PiML remains an emerging topic that raises many open problems. Current challenges include : (i) Deriving generalization guarantees : The theoretical foundation of PiML is still at its early stage. Yet, in view of its potential, it has become crucial to study its theoretical properties to gain a comprehensive grasp of its capabilities and limitations ; (ii) Learning with a limited amount of data : While current PiML approaches assume having access to abundant training data, many applications involve limited data availability ; (iii) Augmenting partially known physical laws : In real-world situations, physical laws many only partially explain the underlying dynamics ; (iv) Parametric PDE solving : One is generally interested in solving PDEs for various situations with varying parameters, including initial/boundary conditions and forcing terms. Current attempts offer solutions for oly a limited range of parameters ; (v) Uncertainty modeling : Uncertainty is a key issue in physics, yet most state of the art PiML approaches are deterministic ; (vi) Foundation models for physics : Modeling multiple physics to take benefits from large available simulation datasets in order to solve scare data problems is currently emerging as a key topic through the development of foundation models for physics.

Developing suited solutions that address these interrelated challenges is crucial fot the usability of PiML in realistic scenarios. In order to bridge the reality gap between small-scale experiments and real-world problems, we will hypothesize that the physical problems addressed in MELISSA lie in a complex setting of PiML representative of realistic constraints, where data are scarce and the available physical laws only partially explain the observed dynamics. A representative of this family of problems is self-organization of matter, the dynamical system taht occurs when an ultra-short laser pulse interacts with a surface, inducing material modification and the emergence of patterns. Modelling this dynamics is complex because it involves electromagnetism, thermodynamics and fluid mechanics, whose interactions are still unknown. Consequently, there is currently no PDE that accurately models the whole physical phenomenon. The complexity of this task is increased by limited amount of experimental data available. Indeed, because light propagates too fast and the pulse is very short, there is no electronics able to capture the dynamics. Therefore, unlike other dynamical systems (e.g. in meteorology, temperature lake modeling, fluid mechanics, etc.), acquring a large amount of data is an insurmountable obstacle.

By conducting this project from both theoretical and algorithmic perspectives, our objective is to design the next generation of provably accurate physics-informed algorithms in this challenging context that has not yet received a significant interest from the scientific community.