Loading Events

« All Events

PhD Defense: Nicolas Hubert (BIRD)

17 June 2024 @ 14:00 pm - 17:00 pm

Nicolas Hubert, PhD student in the ERPI laboratory and in the BIRD team, will defend his thesis on Monday, 17 June 2024 at 2pm in the Auditorium 1 of the ENSGSI.

His thesis is entitled “From knowledge-aware to knowledge-enhanced graph embedding models for link prediction”.

Rapporteurs:
Fatiha Saïs, Professeure, Université Paris Saclay
Paul Groth, Professor, University of Amsterdam
Examinator:
Fabian Suchanek, Professor, Télécom Paris, Institut Polytechnique de Paris
Invited guest:
Heiko Paulheim, Professor, University of Mannheim
Supervisors:
Davy Monticolo, Professor, Université de Lorraine
Armelle Brun, Professeure, Université de Lorraine

Abstract:
Knowledge graph embedding models (KGEMs) have gained considerable traction in recent years. These models learn a vector representation of knowledge graph entities and relations, a.k.a. knowledge graph embeddings (KGEs). This thesis specifically explores the advancement of KGEMs for the link prediction (LP) task, which is of utmost importance as it underpins several downstream applications such as recommender systems.
In this thesis, various challenges around the use of KGEMs for LP are identified: the scarcity of semantically rich resources, the unidimensional nature of evaluation frameworks, and the lack of semantic considerations in prevailing machine learning-based approaches.
Central to this thesis is the proposition of novel solutions to these challenges. Firstly, the thesis contributes to the development of semantically rich resources: mainstream datasets for link prediction are enriched using schema-based information, EducOnto and EduKG are proposed to overcome the paucity of resources in the educational domain, and PyGraft is introduced as an innovative open-source tool for generating synthetic ontologies and knowledge graphs. Secondly, the thesis proposes a new semantic-oriented evaluation metric, Sem@K, offering a multi-dimensional perspective on model performance. Importantly, popular models are reassessed using Sem@K, which reveals essential insights into their respective capabilities and highlights the need for multi-faceted evaluation frameworks. Thirdly, the thesis delves into the development of neuro-symbolic approaches, transcending traditional machine learning paradigms. These approaches do not only demonstrate improved semantic awareness but also extend their utility to diverse applications such as recommender systems.
In summary, the present work not only redefines the evaluation and functionality of knowledge graph embedding models but also sets the stage for more versatile, interpretable AI systems, underpinning future explorations at the intersection of machine learning and symbolic reasoning.
Keywords:
Knowledge graph, Graph embedding, Neuro-symbolic AI, Link prediction
Résumé:
Les modèles d’embeddings à base de graphes de connaissances ont considérablement gagné en popularité ces dernières années. Ces modèles apprennent une représentation vectorielle des entités et des relations des graphes de connaissances (GCs). Cette thèse explore spécifiquement le progrès de tels modèles pour la tâche de prédiction de lien (PL), qui est d’une importance capitale car elle se retrouve dans plusieurs applications telles que les systèmes de recommandation.
Dans cette thèse, divers défis liés à l’utilisation des modèles d’embeddings de GCs pour la PL sont identifiés : la rareté des ressources sémantiquement riches, la nature unidimensionnelle des cadres d’évaluation, et le manque de considérations sémantiques dans les approches d’apprentissage automatique.
Cette thèse propose des solutions novatrices à ces défis. Premièrement, elle contribue au développement de ressources sémantiquement riches : les jeux de données principaux pour la prédiction de lien sont enrichis en utilisant des informations basées sur des schémas, EducOnto et EduKG sont proposés pour surmonter la pénurie de ressources dans le domaine éducatif, et PyGraft est introduit comme un outil innovant pour générer des ontologies synthétiques et des graphes de connaissances. Deuxièmement, la thèse propose une nouvelle métrique d’évaluation orientée sémantique, Sem@K, offrant une perspective multidimensionnelle sur la performance des modèles. Il est important de souligner que les modèles populaires sont réévalués en utilisant Sem@K, ce qui révèle des aspects essentiels et jusqu’alors inexplorés de leurs capacités respectives et souligne le besoin de cadres d’évaluation multidimensionnels. Troisièmement, la thèse se penche sur le développement d’approches neuro-symboliques, transcendant les paradigmes traditionnels de l’apprentissage automatique. Ces approches ne démontrent pas seulement une meilleure capacité sémantique dans leurs prédictions, mais étendent également leur utilité à diverses applications telles que les systèmes de recommandation.
En résumé, le présent travail ne redéfinit pas seulement l’évaluation et la fonctionnalité des modèles d’embeddings de GCs, mais prépare également le terrain pour des systèmes d’intelligence artificielle plus polyvalents et interprétables, soutenant les explorations futures à l’intersection de l’apprentissage automatique et du raisonnement symbolique.
Mots clés: 
Graphe de connaissance, Plongement de graphe, IA neuro-symbolique, Prédiction de lien

Details

Date:
17 June 2024
Time:
14:00 pm - 17:00 pm
Event Category:

Venue

ENSGSI