[Offre de thèse 2021] Apprentissage automatique pour détecter les “deepfakes”

Encadrement : Kamel Smaïli (kamel.smaili@loria.fr)

Équipe : SMarT

Financement : concours pour un contrat doctoral

Google a affirmé que certains problèmes nécessitent 10000 ans de calcul (avec l’ordinateur le plus rapide du monde) mais sur l’ordinateur quantique de Google, ils ne nécessitent que 200 secondes. Ces nouveaux ordinateurs sont basés sur le principe de la mécanique quantique [Mora-Lopez 2009]. L’informatique quantique est modélisée par des circuits quantiques, qui sont basés sur le bit quantique, ou qubit, qui est quelque peu analogue au bit dans le calcul classique. Les qubits peuvent être dans un état quantique 1 ou 0, ou dans une superposition des états 1 et 0.

Les ordinateurs classiques effectuent des opérations classiques déterministes ou peuvent émuler des processus probabilistes à l’aide de méthodes d’échantillonnage. En couplant la superposition et l’intrication, les ordinateurs quantiques peuvent effectuer des opérations quantiques qui sont difficiles à émuler à l’échelle avec des ordinateurs classiques.

Dans cette thèse de doctorat, nous nous intéressons au développement d’un nouveau modèle d’apprentissage automatique prédictif basé sur l’informatique quantique. En d’autres termes, nous nous intéressons aux algorithmes d’apprentissage automatique quantique. L’apprentissage automatique quantique est un domaine de recherche interdisciplinaire émergent, qui est la combinaison de la physique quantique et de l’apprentissage automatique. Les algorithmes d’information quantique sont utilisés dans l’apprentissage automatique et l’intelligence artificielle dans l’état du système quantique [Shuld 2018]. Lorsque l’apprentissage automatique et l’ordinateur quantique interagissent l’un avec l’autre, on parle d’apprentissage automatique quantique [Ciliberto 2018]. L’utilisation de l’apprentissage machine quantique (Quantum Machine Learning : QML) permet de révolutionner les performances et la vitesse.

Le terme ‘deepfake’ est une combinaison des termes Deep learning et Fake. Ce terme fait référence aux œuvres audiovisuelles dans lesquelles l’image de quelqu’un est synthétisée. En fait, les deepfakes concernent le processus de fabrication et de manipulation d’images et de vidéos numériques. En utilisant des réseaux de neurones profonds qui rendent le résultat plus convaincant. Ces vidéos peuvent créer l’illusion de la présence d’une personne et d’activités qui n’ont pas lieu en réalité [Nguyen 2020], [Yang 2020].

Le travail de recherche de cette thèse aura pour objectif de détecter les vidéos ‘deepfake’. Cette expérience testera des techniques d’apprentissage profond et de renforcement pour détecter les deepfakes et  qui utilisent des algorithmes similaires à ceux utilisés pour construire le deepfake. On peut citer la méthode GAN [Goodfellow 2014], [Gauthier 2015]. Les métriques seront principalement la précision de reconnaissance des modèles dans la façon dont les deepfakes sont créés, et le nombre d’incohérences que l’algorithme peut relever.

Encadrement

Le doctorant sera sous la supervision de Kamel Smaïli, professeur.

Le doctorant travaillera dans le groupe de recherche SMarT qui a une forte expérience dans l’apprentissage profond et a commencé récemment à travailler sur les Deepfakes en construisant les bases de données nécessaires. Évidemment, nous ne disposons pas d’un ordinateur quantique, mais nous travaillerons sur différents ordinateurs quantiques disponibles en ligne, comme IBM Qiskit, Google Quantum AI, Microsoft Azure Quantum Computer, D-Wave et Rigetti Forest.

References

[Mora-Lopez 2009] J. Mora-Lopez, “Fundamentals of Physics “– Volume I, EOLSS Publications, 2009.

[Schuld 2009] M. Schuld and F. Petruccione, “Supervised learning with quantum computers”, Quantum Science and Technology, Springer, 2018.

[Ciliberto 2018] C. Ciliberto, M. Herbster, A. Alessandro, M. Pontil, A. Rocchetto, S. Severini, L. Wossnig, “Quantum machine learning: a classical perspective”, Proceedings of the Royal Society A: Mathematical, Physical, 2018

[Gauthier 2015] J. Gauthier, “Conditional generative adversarial nets for convolutional face generation”, Technical report, 2015.

[Goodfellow 2014] I. Goodfellow, J. Pouget-Abadie, M. Mirza, B. Xu, D. Warde-Farley, S. Ozair, A. Courville, Y. Bengio, “Generative adversarial nets”, NIPS, 2014.

[Nguyen 2020] T.T. Nguyen, C.M. Nguyen, D.T. Nguyen, S. Nahavandi, “Deep Learning for Deepfakes Creation and Detection: A Survey”, arXiv, 2020

[Li 2020] Y. Li, X. Yang, P. Sun, H. Qi, S. Lyu, “Celeb-DF: A Large-scale Challenging Dataset for DeepFake Forensics”, arXiv, 2020

Logo d'Inria