[PhD Proposal 2023] Apprentissage et adaptation pour les essaims robotique

Dates limites
—Date limite de candidature: 23 mai 2023
—Arbitrage et classement par le laboratoire: 9 juin 2023

Annonce PDF

Encadrants:
Alain Dutech, Chargé de Recherche HDR à l’INRIA et membre de l’équipe Biscuit du Loria
AmineBoumaza, Maître de conférence à l’Université de Lorraine membre de l’équipe Larsen du Loria

Contexte : 

Cette proposition rentre dans le cadre de l’intelligence artificielle et plus précisément celui de la conception automatique d’agents robotiques dotés de comportements autonomes leur permettant de s’adapter au mieux à leur environnement. Un agent est considéré ici comme une entité robotique dotée de capacités sensorimotrices limitées, capable d’évoluer de manière autonome dans un environnement dynamique et partiellement connu. L’objectif final est de concevoir automatiquement le comportement des agents qui leur permettent au mieux d’atteindre un objectif donnée.
Cette proposition tentera de contribuer à cette thématique en étudiant comment apprendre les comportements d’un essaim de robots par apprentissage évolutionnaire ( Evolutionary Robotics) [4].
Les essaims de robots sont des systèmes composés d’un grand nombre de robots (de l’ordre de plusieurs dizaines) relativement simples. Du fait du grand nombre d’unités, ces systèmes ont de bonnes propriétés de robustesse et de passage à l’échelle. Néanmoins, concevoir des systèmes de telle nature pour réaliser des tâches intéressantes reste un défi important pour lequel les approches classiques (machine learning, deep learning) ne sont pas utilisables. Des approches automatisées et décentralisés comme l’Embodied Evolutionary Robotics[1] constituent une alternative attirante. Elles ouvrent de nombreuses possibilités, puisque l’apprentissage est mené en parallèle par chaque robot de l’essaim et en ligne pendant l’exécution d’une tâche; s’adapter à des situations imprévues devient envisageable.

Objectifs :

Ces approches ont été utilisées avec succès sur un grand nombre de problèmes[1],cependant le type de problèmes sur lesquels elles réussissent reste limité. Plusieurs améliorations restent a faire pour élargir leurs champs d’application, et passer à l’ultime étape: une flottille de robots réels. Ce passage nécessite d’analyser finement les algorithmes existants et d’en concevoir de nouveaux.
Pour cela nous envisageons d’explorer deux pistes :
1)favoriser la diversité comportementale [3]et2) exploiter les mécanismes de motivation intrinsèque[5].  A travers ces eux mécanismes, les conditions pour permettre à une flotille de faire face et de s’adapter à un environnement dynamique et imprévisible seront favorisées.
Ils permettront de plus de ne pas avoir à concevoir des solutions rigides dont la robustesse serait mise en échec devant des obstacles ou des difficultés imprévues. Afin d’améliorer l’analyse de l’approche évolutionnaire et afin de mieux identifier ses avantages et ses limites, nous envisagions d’utiliser des modèles connus dans le domaine des systèmes distribués et l’apprentissage social[2].
Ces résultats semblent très prometteurs pour analyser les dynamiques internes de ces algorithmes ainsi que pour identifier les conditions nécessaires pour leur réussite.
En effet, les algorithmes de robotique évolutionnaire en essaim partagent différentes propriétés avec les algorithmes d’apprentissage social(accès partiel aux données ou à l’état global du système, échanges par communications locales, asynchronisme, aléa etc.),certaines méthodes ou modèles d’analyse de ces derniers pourraient être envisagés pour étudier les algorithmes que nous souhaitons développer.

Informations additionnelles
Le travail de recherche proposé ici alliera l’analyse algorithmique et l’expérimentation en simulation etou sur des robots réels. Nous recherchons un candidat avec de bonnes connaissances en algorithmique, avec un intérêt pour l’apprentissage automatique et la robotique ,ainsi qu’une bonne maîtrise de la programmation.