STRESS

STRESS - Tests statistiques et estimation robuste avec très peu de données

Coordinateur : Timothée Mathieu, Inria, CRIStAL

Équipe : SCOOL du Groupe Thématique : DatInG.

Dates : 09/2025 - 09/2029

Résumé :

Au cœur des études scientifiques expérimentales se trouve la question de la vérification d’une hypothèse : un nouveau traitement médical est-il meilleur qu’un placebo ? Un nouvel algorithme est-il plus efficace que l’état de l’art ?
En raison des fluctuations aléatoires, il est nécessaire de répéter plusieurs fois un expérience (pour rassembler plusieurs échantillons) avant de prendre une décision.
Pour ces applications, nous avons besoin de méthodes statistiques pour les tests d’hypothèses qui s’accompagnent de garanties formelles sur leur probabilité d’erreur.
Ces méthodes doivent également permettre de réaliser des tests avec le moins d’échantillons possible afin d’être applicables à des domaines dans lesquels la collecte d’échantillons est longue ou coûteuse.
L’objectif de STRESS est d’obtenir un contrôle précis de la taille d’échantillon minimale nécessaire pour prendre une décision ou faire une prédiction. STRESS répondra à un problème courant dans les méthodes séquentielles : avoir un contrôle pratique sur le moment où l’algorithme arrêtera de collecter des données.

Abstract :

At the core of scientific experimental studies, there is the question of testing a hypothesis : is a new treatment better than a placebo ? Is a new algorithm more efficient on a computational task than the state of the art ?
Because of random fluctuations, it is necessary to repeat experiments over several trials (to gather several samples) before making a decision.
For those applications, we need statistical methods for hypothesis testing that come with formal guarantees on their probability of error.
Those methods should also allow fort tests with as few trials as possible in order to be applicable to domains where gathering samples is long or costly.
The goal of STRESS is to give sharp control on the minimal sample size needed to take a decision or to make a prediction.
STRESS will answer a common problematic in sequential methods : to have a practical control on when the algorithm will stop collecting data.