BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//LORIA - ECPv6.15.18//NONSGML v1.0//EN
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALNAME:LORIA
X-ORIGINAL-URL:https://www.loria.fr
X-WR-CALDESC:Évènements pour LORIA
REFRESH-INTERVAL;VALUE=DURATION:PT1H
X-Robots-Tag:noindex
X-PUBLISHED-TTL:PT1H
BEGIN:VTIMEZONE
TZID:Europe/Paris
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20220327T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20221030T010000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20230326T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20231029T010000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20240331T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20241027T010000
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
DTSTART;TZID=Europe/Paris:20231117T140000
DTEND;TZID=Europe/Paris:20231117T160000
DTSTAMP:20260405T130052
CREATED:20231113T151421Z
LAST-MODIFIED:20231113T151421Z
UID:23819-1700229600-1700236800@www.loria.fr
SUMMARY:Soutenance de thèse de Juliette Faille (Synalp)
DESCRIPTION:Juliette Faille (Synalp) soutiendra sa thèse intitulée « Génération de texte en langue naturelle à partir de données : évaluation et explicabilité »\, le 17 novembre à 14h en salle C005. \nRésumé :\nLes modèles de génération de langage naturel (NLG) ont récemment atteint de très hautes performances. Les textes qu’ils produisent sont généralement corrects sur le plan grammatical et syntaxique\, ce qui les rend naturels. Bien que leur sens soit correct dans la grande majorité des cas\, même les modèles de NLG les plus avancés produisent encore des textes avec des significations partiellement inexactes.\nDans cette thèse\, en nous concentrons sur le cas particulier des problèmes liés au contenu des textes générés\, nous proposons d’évaluer et d’analyser les modèles utilisés dans les tâches de verbalisation de graphes RDF (Resource Description Framework) et de génération de questions conversationnelles.\nTout d’abord\, nous étudions la tâche de verbalisation des graphes RDF et en particulier les omissions et hallucinations d’entités RDF\, c’est-à-dire lorsqu’un texte généré automatiquement ne mentionne pas toutes les entités du graphe RDF d’entrée ou mentionne d’autres entités que celles du graphe d’entrée. Nous évaluons 25 modèles de verbalisation de graphes RDF sur les données WebNLG. Nous développons une méthode pour détecter automatiquement les omissions et les hallucinations d’entités RDF dans les sorties de ces modèles. Nous proposons une métrique basée sur le nombre d’omissions ou d’hallucinations pour quantifier l’adéquation sémantique des modèles NLG avec l’entrée.\nNous constatons que cette métrique est corrélée avec ce que les annotateurs humains considèrent comme sémantiquement correct et nous montrons que même les modèles les plus globalement performants sont sujets à des omissions et à des hallucinations.\nSuite à cette observation sur la tendance des modèles de verbalisation RDF à générer des textes avec des problèmes liés au contenu\, nous proposons d’analyser l’encodeur de deux de ces modèles\, BART et T5. Nous utilisons une méthode d’explicabilité par sondage et introduisons deux sondes de classification\, l’une paramétrique et l’autre non paramétrique\, afin de détecter les omissions et les déformations des entités RDF dans les plongements lexicaux des modèles encodeur-décodeur. Nous constatons que ces classifieurs sont capables de détecter ces erreurs dans les encodages\, ce qui suggère que l’encodeur des modèles est responsable d’une certaine perte d’informations sur les entités omises et déformées.\nEnfin\, nous proposons un modèle de génération de questions conversationnelles basé sur T5 qui\, en plus de générer une question basée sur un graphe RDF d’entrée et un contexte conversationnel\, génère à la fois une question et le triplet RDF correspondant. Ce modèle nous permet d’introduire une procédure d’évaluation fine évaluant automatiquement la cohérence avec le contexte de la conversation et l’adéquation sémantique avec le graphe RDF d’entrée.\nNos contributions s’inscrivent dans les domaines de l’évaluation en NLG et de l’explicabilité. Nous empruntons des techniques et des méthodologies à ces deux domaines de recherche afin d’améliorer la fiabilité des modèles de génération de texte.\nJury\nRapporteurs :\n\nCyril LABBE\, Professeur des universités\, Université Grenoble Alpes\nBenjamin PIWOWARSKI\, Chargé de recherche\, Sorbonne Université\n\nExaminateurs : \n\nChloé CLAVEL\, Professeure des universités\, Télécom Paris\nLaure SOULIER\, Maîtresse de conférences\, Sorbonne Université\nAlbert GATT\, Professeur des universités Université d’Utrecht\n\nDirectrice de thèse :\n\nClaire GARDENT\, Directrice de recherche\, Université de Lorraine
URL:https://www.loria.fr/event/soutenance-de-these-de-juliette-faille-synalp/
LOCATION:C005
CATEGORIES:Soutenance
END:VEVENT
END:VCALENDAR