[Proposition de thèse 2023] D’une ontologie dédiée aux conversations au contrôle des modèles conversationnels
Sujet de thèse– LORIA, Nancy, France
Encadrants : Mathieu d’Aquin, Gaël Guibon
Contexte :
Durant les dernières années, les modèles conversationnels se sont fortement développés, en partie grâce aux modelés de langage (Large Language Models, LLMs) et la qualités de leurs résultats est devenue significativement meilleure en termes de réalisme et d’acceptabilité par l’utilisateur. N´néanmoins, dans leur application des tâches particulières, il reste important de bien contrôler le d´déroulement des conversations de façon `a les guider vers une conclusion positive. Pour cela, il est n´nécessaire d’intégrer des connaissances sur le d´déroulement de conversations dans le fonctionnement des modelés conversationnels. L’objectif de cette thèse est de représenter de telles connaissances au sein d’une ontologie, de façon `a ce que celle-ci puisse être utilisée pour contrôler les sorties d’un modèle au cours d’une conversation. Les ontologies sont des modèles conceptuels et logiques des connaissances d’un domaine. Elles permettent la représentation de taxonomies de concepts pertinents dans ce domaine, des relations entre ces concepts et de leur définition formelle, rendant ainsi possible la réalisation d’inférences sur des situations spécifiques. Dans le contexte des agents conversationnels, elles ont été typiquement utilisées pour représenter les connaissances n´nécessaires `a la génération de réponses [1, 7]. Peu de travaux se sont penchés sur la représentation de connaissances sur les conversations elles-mêmes pour guider leur d´déroulement. Une exception récente est l’ontologie Convology [3, 10], qui repressente différents aspects des conversations, mais dont l’application se focalise spécifiquement sur l’utilisation en santé et pour des taches de gestion et de compréhension, plutôt que pour améliorer l’efficacité du d´déroulement des conversations.
Objectifs :
Comme mentionne plus haut, l’hypothèse principale sur laquelle repose ce sujet de thèse est que la représentation structurée et explicite de connaissances sur les caractéristiques des conversations et de leur d´enroulement peut aider `a produire des conversations de meilleure qualité. Un premier objectif est donc l’utilisation de m´méthodes d’extraction de connaissances afin de construire une ontologie contenant ces informations, et ce, `a partir de l’analyse de corpus de conversations annotés avec de telles caractéristiques (actes de dialogues, ´états du dialogue, ´émotions, sentiments, etc.). Plusieurs m´méthodes seront testées pour automatiquement apprendre `a la fois une typologie des déroulements de conversations, les dimensions par lesquelles ils peuvent être reconnus et la façon dont ils sont associés avec la réussite ou l’échec de ces conversations. Sur la base de cette ontologie, l’objectif final de cette thèse est d’établir des méthodes permettant de guider des modèles conversationnels pré-entraînés vers des réponses ayant une plus grande probabilité d’amener `a une conclusion positive de la conversation. Plusieurs approches ont d’ors et déjà intégré des modules dédiés `a la représentation de dialogues et de la ”mémoire” de connaissances [6, 11]. Néanmoins, celles-ci se concentrent sur des conversations spécifiques `a des tâches particulières et ne considèrent pas les aspects d’interopérabilité ou de contrôle. De plus, la recherche actuelle sur le sujet se focalise soit sur des conversations d’ordre général [12], soit sur des approches indépendantes de la langue pour des conversations orientées vers une tache précise [5, 9, 12]. Dans cette thèse, l’objectif est de construire des modèles indépendants aux taches finales. Cela pourra ˆêtre réalisé, par exemple, en utilisant l’ontologie pour jouer le rôle de discriminateur dans un modèle génératif contradictoire (Generative Adversarial Network, GAN) [4]. En plus d’amener `a des conversations plus efficaces, il est attendu de l’utilisation de l’ontologie de permettre une plus grande interprétabilit´e des résultats du fait de la relation entre ces résultats et les caractéristiques de conversations représentées de façon formelle et symbolique dans l’ontologie. Cela permettra de dépasser les modeles ”boˆıtes noires” du Traitement Automatique du Langage actuel [11] vers des modelés moins nuisibles `a l’utilisateur et au fournisseur, et s’appuyant sur une ´éthique contrôlable.
Méthodologie :
La réalisation de cette thèse se fera de façon itérative. Les deux objectifs présentés plus haut peuvent être vus comme deux ´étapes dans le travail : la réalisation de l’ontologie (1) suivie de son utilisation pour contrôler les modèles conversationnels (2). Néanmoins, plusieurs itérations de ces étapes seront réalisées, produisant des versions de plus en plus complètes de l’ontologie et fournissant des résultats de qualités grandissante dans son utilisation intégrée avec les modèles conversationnels. Cette approche devrait permettre de réduire les risques associés `a la réalisation de ce travail de recherche et entrainer, in fine, une validation rapide des hypothèses sur lesquelles elle repose.
Construction de l’ontologie ; L’ontologie sera construite sur la base de plusieurs jeux de données de conversations [8, 2]. Au travers de l’utilisation de sources de données et de types de données multiples, l’objectif est de construire une ontologie robuste et indépendante du domaine et de la tâche. Cette approche centrée sur les jeux de données a pour avantage de ne pas nécessiter une représentation exhaustive et manuelle de la conversation. Elle simplifie ainsi le processus itératif sur lequel se fonde la m´méthodologie de cette thèse.
Contrôle des modèles conversationnels ; Sur la base de l’hypothèse qu’un contrôle au travers de l’ontologie amènera `a de meilleurs modelés conversationnels, moins limites `a des dialogues orientés pour une tâche précise, plusieurs m´méthodes d’intégration seront testées. Suivant l’approche itérative, l’aspect important sera d’obtenir des résultats s’améliorant progressivement, sans nécessiter une ontologie exhaustive, ni une intégration complète d`es le début. L’´évaluation se fera donc au travers de plusieurs tâches courantes de conversation (détection d’actes de dialogues, slot filling, etc.) en considérant l’interaction et l’explicabilité comme des aspects primordiaux du résultat de cette thèse.
Equipe d’encadrement
La thèse aura lieu au LORIA de Nancy, France, et sera encadrée par deux chercheurs de deux équipes différentes du LORIA aux expertises complémentaires respectivement en modèles de langage/conversationnels et en ingénierie des ontologies.
Gaël Guibon (équipe SyNaLP) est maître de conférences `a l’Université de Lorraine. Ses recherches se concentrent sur le traitement automatique de la langue et sur l’apprentissage automatique pour des données conversationnelles, l’analyse du dialogue et l’adaptation de modèle, en particulier sur la base de contenu généré par les utilisateurs de sources variées (réseaux sociaux, messageries instantanées, etc.).
Mathieu d’Aquin (équipe K) est professeur d’informatique `a l’Université de Lorraine et responsable de l’équipe K au LORIA. Ses recherches se focalisent sur les méthodes d’ingénierie des connaissances et leurs contributions `a la performance et `a l’interprétabilité des processus d’intelligence artificielle.
References
[1]Hadeel Al-Zubaide and Ayman A. Issa. Ontbot: Ontology based chatbot. In International Symposium on Innovations in Information and Communications Technology, pages 7–12, Nov 2011.
[2] Emile Chapuis, Pierre Colombo, Matteo Manica, Matthieu Labeau, and Chlo´e Clavel. Hierarchical pre-training for sequence labelling in spoken dialog. In Findings of the Association for Computational Linguistics: EMNLP 2020, pages 2636–2648, Online, November 2020. Association for Computational Linguistics.
[3] Mauro Dragoni, Giuseppe Rizzo, and Matteo A Senese. Convology: an ontology for conversational agents in digital health. In Web Semantics, pages 7–21. Elsevier, 2021.
[4] Ian Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, and Yoshua Bengio. Generative adversarial nets. In Advances in neural information processing systems, pages 2672–2680, 2014.
[5] Fei Mi, Minlie Huang, Jiyong Zhang, and Boi Faltings. Meta-learning for low-resource natural language generation in task-oriented dialogue systems. In Proceedings of the 28th International Joint Conference on Artificial Intelligence, pages 3151–3157, 2019.
[6] Bowen Qin, Min Yang, Lidong Bing, Qingshan Jiang, Chengming Li, and Ruifeng Xu. Exploring auxiliary reasoning tasks for task-oriented dialog systems with meta cooperative learning. In Proceedings of the AAAI Conference on Artificial Intelligence, volume 35, pages 1370113708, 2021.
[7] Abdul Quamar, ChuanLei, Dorian Miller, Fatma Ozcan, Jeffrey Kreulen, Robert J Moore, and Vasilis Efthymiou. An ontology-based conversation system for knowledge bases. In Proceedings of the 2020 ACM SIGMOD International Conference on Management of Data, pages 361–376, 2020.
[8] Hannah Rashkin, Eric Michael Smith, Margaret Li, and Y-Lan Boureau. Towards empathetic open-domain conversation models: A new benchmark and dataset. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 5370–5381, Florence, Italy, July 2019. Association for Computational Linguistics.
[9] Evgeniia Razumovskaia, Goran Glavas, Olga Majewska, Edoardo M Ponti, Anna Korhonen, and Ivan Vulic. Crossing the conversational chasm: A primer on natural language processing for multilingual task-oriented dialogue systems. Journal of Artificial Intelligence Research, 74:1351–1402, 2022.
[10] Milene Santos Teixeira, Vin´ıcius Maran, and Mauro Dragoni. The interplay of a conversational ontology and ai planning for health dialogue management. In Proceedings of the 36th annual ACM symposium on applied computing, pages 611–619, 2021.
[11] Jintao Wen, Dazhi Jiang, Geng Tu, Cheng Liu, and Erik Cambria. Dynamic interactive multiview memory network for emotion recognition in conversation. Information Fusion, 91:123–133, 2023.
[12] Yicheng Zou, Bolin Zhu, Xingwu Hu, Tao Gui, and Qi Zhang. Low-resource dialogue summarization with domain-agnostic multi-source pretraining. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 80–91, 2021.