BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//LORIA - ECPv6.15.12.2//NONSGML v1.0//EN
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALNAME:LORIA
X-ORIGINAL-URL:https://www.loria.fr
X-WR-CALDESC:Évènements pour LORIA
REFRESH-INTERVAL;VALUE=DURATION:PT1H
X-Robots-Tag:noindex
X-PUBLISHED-TTL:PT1H
BEGIN:VTIMEZONE
TZID:Europe/Paris
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20220327T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20221030T010000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20230326T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20231029T010000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20240331T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20241027T010000
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
DTSTART;TZID=Europe/Paris:20230602T150000
DTEND;TZID=Europe/Paris:20230602T170000
DTSTAMP:20251204T033318
CREATED:20230601T081127Z
LAST-MODIFIED:20230601T084834Z
UID:20250-1685718000-1685725200@www.loria.fr
SUMMARY:Soutenance de thèse de Guillaume Le Berre (Synalp)
DESCRIPTION:Guillaume Le Berre (Synalp) soutiendra sa thèse intitulée « Vers la mitigation des biais en traitement neuronal des langues »\, le 2 juin à 15h.\nRésumé :\nIl est de notoriété que les modèles d’apprentissage profond sont sensibles aux biais qui peuvent être présents dans les données utilisées pour l’apprentissage. Ces biais qui peuvent être définis comme de l’information inutile ou préjudiciable pour la tâche considérée\, peuvent être de différentes natures : on peut par exemple trouver des biais dans les styles d’écriture utilisés\, mais aussi des biais bien plus problématiques portant sur le sexe ou l’origine ethnique des individus. Ces biais peuvent provenir de différentes sources\, comme des annotateurs ayant créé les bases de données\, ou bien du processus d’annotation lui-même. Ma thèse a pour sujet l’étude de ces biais et\, en particulier\, s’organise autour de la mitigation des effets des biais sur l’apprentissage des modèles de Traitement Automatique des Langues (TAL). J’ai notamment beaucoup travaillé avec les modèles pré-entraînés comme BERT\, RoBERTa ou UnifiedQA qui sont devenus incontournables ces dernières années dans tous les domaines du TAL et qui\, malgré leur large pré-entraînement\, sont très sensibles à ces problèmes de biais. \nMa thèse s’organise en trois volets\, chacun présentant une façon différente de gérer les biais présents dans les données. Le premier volet présente une méthode permettant d’utiliser les biais présents dans une base de données de résumé automatique afin d’augmenter la variabilité et la contrôlabilité des résumés générés. Puis\, dans le deuxième volet\, je m’intéresse à la génération automatique d’une base de données d’entraînement pour la tâche de question-réponse à choix multiples. L’intérêt d’une telle méthode de génération est qu’elle permet de ne pas faire appel à des annotateurs et donc d’éliminer les biais venant de ceux-ci dans les données. Finalement\, je m’intéresse à l’entraînement d’un modèle multitâche pour la reconnaissance optique de texte. Je montre dans ce dernier volet qu’il est possible d’augmenter les performances de nos modèles en utilisant différents types de données (manuscrites et tapuscrites) lors de leur entraînement.
URL:https://www.loria.fr/event/soutenance-de-these-de-guillaume-le-berre-synalp/
LOCATION:Loria
CATEGORIES:Soutenance
END:VEVENT
END:VCALENDAR