Chargement Évènements

« Tous les Évènements

  • Cet évènement est passé

Soutenance de thèse de Djedjiga Belhadj (Read)

28 mars 2024 @ 14:00 - 16:30

Djedjiga Belhadj (Read) soutiendra sa thèse intitulée “Multi-GAT semi-supervisé pour l’extraction d’informations et son adaptation au chiffrement homomorphe”, le 28 mars à 14h en salle A008.

Résumé :

Cette thèse est réalisée dans le cadre du projet BPI DeepTech, en collaboration avec la société Fair&Smart, veillant principalement à la protection des données personnelles conformément au Règlement Général sur la Protection des Données (RGPD). Dans ce contexte, nous avons proposé un modèle neuronal profond pour l’extraction d’informations dans les documents administratifs semi-structurés (DSSs). En raison du manque de données d’entraînement publiques, nous avons proposé un générateur artificiel de DSSs qui peut générer plusieurs classes de documents avec une large variation de contenu et de mise en page. Les documents sont générés à l’aide de variables aléatoires permettant de gérer le contenu et la mise en page en respectant des contraintes visant à garantir leur proximité avec des documents réels. Des métriques ont été introduites pour évaluer la diversité des DSSs générés en termes de contenu et de mise en page. Les résultats de l’évaluation ont montré que les jeux de données générés pour trois types de DSSs (fiches de paie, tickets de caisse et factures) présentent un degré élevé de diversité, ce qui permet d’éviter le sur-apprentissage lors de l’entraînement des systèmes d’extraction d’informations. En s’appuyant sur le format spécifique des DSSs, constitué de paires de mots (mots-clés, informations) situés dans des voisinages proches spatialement, le document est modélisé sous forme de graphe où les nœuds représentent les mots et les arcs, les relations de voisinage. Le graphe est incorporé dans un réseau d’attention à graphe (GAT) multi-couches (Multi-GAT). Celui-ci applique le mécanisme d’attention multi-têtes permettant d’apprendre l’importance des voisins de chaque mot pour mieux le classer.  Une première version de ce modèle a été utilisée en mode supervisé et a obtenu un score F1 de 96 % sur deux jeux de données de factures et de fiches de paie générées, et de 89 % sur un ensemble de tickets de caisse réels (SROIE). Nous avons ensuite enrichi le Multi-GAT avec un plongement multimodal de l’information au niveau des mots (avec des composantes textuelle, visuelle et positionnelle), et l’avons associé à un auto-encodeur variationnel à graphe (VGAE). Ce modèle fonctionne en mode semi-supervisé, capable d’apprendre à partir des données annotées et non annotées simultanément. Pour optimiser au mieux la classification des nœuds du graphe, nous avons proposé un semi-VGAE dont l’encodeur partage ses premières couches avec le classifieur Multi-GAT. Cette optimisation est encore renforcée par la proposition d’une fonction de perte VGAE gérée par la perte de classification. En utilisant une petite base de données non annotées, nous avons pu améliorer de plus de 3 % le score F1 obtenu sur un ensemble de factures générées. Destiné à fonctionner dans un environnement protégé, nous avons adapté l’architecture du modèle pour son chiffrement homomorphe. Nous avons étudié une méthode de réduction de la dimensionnalité du modèle Multi-GAT. Ensuite, nous avons proposé une approche d’approximation polynomiale des fonctions non-linéaires dans le modèle. Pour réduire la dimension du modèle, nous avons proposé une méthode de fusion de caractéristiques multimodales qui  nécessite peu de paramètres supplémentaires et qui réduit les dimensions du modèle tout en améliorant ses performances. Pour l’adaptation au chiffrement, nous avons étudié des approximations polynomiales de degrés faibles aux fonctions non-linéaires avec une utilisation des techniques de distillation de connaissance et de fine tuning pour mieux adapter le modèle aux nouvelles approximations. Nous avons pu minimiser la perte lors de l’approximation d’environ 3 % pour deux jeux de données de factures ainsi qu’un jeu de données de fiches de paie et de 5 % pour SROIE.

Jury

Rapporteurs :

  • Rolf Ingold (Université de Fribourg)
  • Jean-Yves Ramel  (LIFAT – Université de Tours)

Examinatrices :

  • Claire Gardent (CNRS – LORIA)
  • Véronique Eglin (LIRIS – INSA – CNRS)

Directeur :

  • Abdel Belaïd (Université de Lorraine – LORIA)