BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//LORIA - ECPv6.15.18//NONSGML v1.0//EN
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALNAME:LORIA
X-ORIGINAL-URL:https://www.loria.fr
X-WR-CALDESC:Évènements pour LORIA
REFRESH-INTERVAL;VALUE=DURATION:PT1H
X-Robots-Tag:noindex
X-PUBLISHED-TTL:PT1H
BEGIN:VTIMEZONE
TZID:Europe/Paris
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20230326T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20231029T010000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20240331T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20241027T010000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:+0100
TZOFFSETTO:+0200
TZNAME:CEST
DTSTART:20250330T010000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:+0200
TZOFFSETTO:+0100
TZNAME:CET
DTSTART:20251026T010000
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
DTSTART;TZID=Europe/Paris:20240606T090000
DTEND;TZID=Europe/Paris:20240606T120000
DTSTAMP:20260405T202310
CREATED:20240527T110843Z
LAST-MODIFIED:20240527T140228Z
UID:26313-1717664400-1717675200@www.loria.fr
SUMMARY:Soutenance de Timothée Anne (Larsen)
DESCRIPTION:Timothée Anne (Larsen) soutiendra sa thèse intitulée « L’optimisation multi-tâche et ses applications à la robotique : d’abord résoudre\, ensuite généraliser »\, le 6 juin à 9h en salle B013. \n\nRésumé\nDoter des agents artificiels\, tels que des robots\, d’une capacité à apprendre à réaliser des tâches complexes et à s’adapter est une quête centrale de la recherche en intelligence artificielle. L’apprentissage par renforcement profond en est aujourd’hui une des méthodes privilégiées\, mais n’est ni toujours simple à mettre en œuvre\, ni toujours la plus performante. \nDans cette thèse\, nous étudions un autre concept d’apprentissage de politique qui se divise en deux étapes : une étape de résolution d’un ensemble de sous-problèmes puis une étape de généralisation. Plus formellement\, la première étape reformule le problème général comme un problème multi-tâche permettant d’obtenir un jeu de données de solutions. La seconde étape utilise de l’apprentissage supervisé sur ce jeu de données pour entraîner une politique générale.Nous évaluons d’abord la viabilité de ce concept à un problème d’apprentissage de réflexes d’évitement de chute avec un robot humanoïde réel. Non seulement il permet d’apprendre des comportements en simulation qui permettent d’éviter la chute dans plus de 75\% des cas\, mais ces comportements sont assez robustes pour fonctionner sur le robot réel. \nNous développons ensuite un algorithme de qualité-diversité multi-tâche\, Multi-Task Multi-Behavior MAP-Elites\, pour améliorer l’efficacité d’échantillonnage de la première étape de résolution. Nous illustrons cet algorithme sur le même problème d’apprentissage de réflexes d’évitement de chute d’un robot humanoïde et pour généraliser à des environnements plus réalistes. \nNous proposons enfin de passer d’une étape de résolution discrète à une résolution continue. Pour ce faire\, nous reformulons le problème d’optimisation multi-tâche boîte noire comme un problème d’optimisation paramétrique et proposons une méthode pour le résoudre : Parametric-Task MAP-Elites. \Parametric-Task MAP-Elites résout une nouvelle tâche à chaque itération\, recouvrant asymptotiquement l’espace des tâches. Après avoir consommé son budget d’évaluations\, \eng{Parametric-Task MAP-Elites} distille les solutions trouvées dans une politique pour généraliser à l’ensemble de l’espace continu. \nL’optimisation multi-tâche est une méthode sous-exploitée qui montre\, dans cette thèse\, son aptitude à permettre de résoudre certains problèmes de robotique de façon plus simple à mettre en œuvre et plus performante que l’apprentissage par renforcement profond. \nJury\nRapporteurs : \n\nClément Moulin-Frier\, Centre Inria de l’université de Bordeaux\nMarc Schoenauer\, Centre Inria de Saclay\n\nExaminatrices : \n\nBernardetta Addis\, LORIA – Université de Lorraine\nAmy Hoover\, New Jersey Institute of Technology\n\nEncadrant : Jean-Baptiste Mouret\, Centre Inria de l’Université de Lorraine
URL:https://www.loria.fr/event/soutenance-de-timothee-anne-larsen/
CATEGORIES:Soutenance
END:VEVENT
END:VCALENDAR