REVEAL - Outils pour la détection de manipulation d’images numériques
Coordinateur : Patrick Bas, CNRS, CRIStAL
Équipe : SIGMA du Groupe Thématique : DatInG.
Date : 2016
Résumé :
L’objectif du projet REVEAL est d’étudier le problème d’extraction de preuves à partir d’images numériques tout en fournissant à la communauté académique et aux experts en criminalistique des solutions logicielles de référence. Nous comptons étudier plus particulièrement les problèmes de détection de manipulation ou de localisation de manipulations tout en considérant le passage à l’échelle, ces trois contraintes sont capitales pour répondre au concours Defals.
Afin d’atteindre cet objectif, notre méthodologie se décompose en plusieurs parties clés :
1) l’acquisition de très grandes bases d’images, qui pourront ensuite être utilisées afin d’entrainer des modèles d’extraction de preuves. Ces bases seront également automatiquement traitées afin de générer un grand nombre d’image manipulées.
2) le développement d’algorithmes d’extraction de preuves qui supporteront la grande diversité des sources d’images, et l’analyse d’un très grand nombre de celles-ci. Nous comptons utiliser des langages adaptés et des grilles de calculs haute performance. Nous comptons également proposer une plateforme dédiée aux universitaires et une autre plateforme professionnelle dédiée aux experts.
3) la diversification des stratégies qui seront développées, certaines reposant sur l’extraction de caractéristiques, d’autres sur des modèles statistiques, certaines supervisées par des experts, d’autres totalement automatiques, certaines provenant de l’apprentissage supervisé, d’autres non-supervisé, ...
4) l’engagement fort des membres du projet qui participeront activement aux deux campagnes du concours, particulièrement du responsable du projet et de certains de ses membres, qui ont déjà participé activement à l’organisation ou sont entrés dans la compétition de concours similaires.
5) la garantie d’avoir un transfert de connaissances entre les partenaires universitaire (CRIStAL et GIPSA) et l’IRT B-COM afin de développer des produits dédiés aux experts.
6) la participation de membres de l’entreprise DxO aux discussions scientifiques liées au projet. L’entreprise française DxO est l’un des leaders mondiaux en développement d’images numériques.
Le projet REVEAL est naturellement composé de tâches qui mèneront au développement d’algorithmes de pointe en extraction de preuves et à la participation active au challenge. La tâche T0 (coordination et communication) est une tâche générale qui permettra un déroulement harmonieux du projet tout en garantissant une communication interne et externe. Les trois tâches suivantes sont dédiées à la R&D. La première (T1) cherchera à construire des bases de plusieurs millions d’images originales ou manipulées. Les deux suivantes (T2 et T3) chercheront à développer des méthodes d’extraction de preuves qui sont soit basées sur des caractéristiques, soit sur des modèles statistiques. Les algorithmes qui seront développés dans ces deux tâches seront directement utilisés dans la tâche liée directement aux deux campagnes du concours (T4). L’autre retombée de Defals, en lien direct avec la tâche T4, sera la mise à disposition de deux plateformes, l’une libre pour les universitaires et la DGA, l’autre dédiée aux experts en criminalistique.
Abstract :
The goal of the REVEAL project is to address the problem of digital image forensics and to provide reference algorithms to the academic community and to the forensics experts. We will tackle the problems of image tempering detection, image tempering localization and large scale image analysis, which are the main requirements of the Defals challenge. In order to do so, our methodology relies on several core components :
1. the acquisition of a large image database that will be used in order to train models designed for forensics purposes ; this database will also be automatically processed in order to generate examples of manipulated images,
2. the development of forensics algorithms that will be able to scale with respect to the large diversity of image sources ans image numbers. This will be possible by specific coding principles and the access to HPCs. We plan also to release our algorithms to the academic community by the development of a dedicated platform, but also to release a forensic private server especially dedicated to forensics experts,
3. the diversification of the forensics strategies that will be developed, some relying on feature extractions, other relying on the training of statistical models, some possibly tutored by forensics experts, other fully automatic using deep learning strategies, some supervised, other unsupervised, ...
4. the strong commitment of the academic researchers at participating at the two milestones of the Defals challenge, particularly the project leader who has already been confronted to the organization and the participation in two challenges in data-hiding, and the two other partners who have participated to previous challenges in data-hiding,
5. the guaranty to have a continuous transfer between the two academic partners (CRIStAL and GIPSA) and the technological institute B-COM in order to develop products dedicated to forensics experts,
6. the participation members of the DxO company as scientific advisors in the scientific discussions and the different developments of the project, DxO is one leading company in image development and photographic device characterization.
The REVEAL project is naturally decomposed into tasks that will lead to the development of state of the art algorithms in forensics, and to the participation in tehe contest. Tak T0 (Coordination and communication) is the general task of the project. The aim of this task is to ensure the smooth running of the project, but also to deal with internal and external communication subtasks. Then, three tasks are dedicated to research. The first one (T1) aims at building very large datasets of original and manipulated images. The two next ones (T2 and T3) respectively address the two core parts of the research project which are the development of forensics tools that are either based on feature extraction algorithms, or on statistical models. The goal of these two tasks will be to provide state-of-the-art methods for the Defals contest. This is achieved by the conduction of a dedicated task on participating in the two Defals submissions (T4). Another output of Defals, linked with T4, is the generation of two forensics platform, one open for academics and for DGA, and an another dedicated to forensics experts.