Bienvenue à Chloé Braud

15 novembre 2017

Récemment recrutée en tant que chargée de recherche au CNRS, Chloé Braud a rejoint l’équipe Synalp du Loria
le 1er octobre 2017. Zoom sur cette chercheuse qui a su allier les mathématiques et les lettres dans son parcours.

D’une prépa maths à la linguistique

Originaire de Narbonne, elle débute ses études par une année de prépa « Mathématiques, Physique et Sciences de l’Ingénieur ». Mais elle renonce pour rejoindre une deuxième année de DEUG en Lettres Modernes, puis une licence option français langues étrangères à la Sorbonne. Elle y suit pour la première fois un cours de linguistique qui va être déterminant dans sa carrière puisqu’elle s’oriente vers un Master en recherche de linguistique informatique à Paris 7. Elle obtient par la suite un financement de sa thèse par le Ministère et rejoindra Alpage (laboratoire d’Analyse Linguistique Profonde à Grande Echelle) aux côtés de Pascal Denis, aujourd’hui responsable de l’équipe MAGNET à Inria Lille et Laurence Danlos, Professeure de linguistique informatique à Paris 7. Elle obtient sa thèse en 2015.

À la suite d’un tutoriel animé par Anders Søgaard, elle candidate à un post-doctorat à Copenhague pour travailler avec son équipe sur l’apprentissage semi-supervisé dans le cadre de l’ERC Lowlands et l’obtient. Elle y passera presque deux ans avant de rejoindre le Loria. « La qualité de travail au Danemark est exceptionnelle, il y a beaucoup de discussions et l’ambiance est très conviviale ».

Identifier les relations sémantiques à partir d’apprentissage semi-supervisé

Au sein de l’équipe Synalp, Chloé travaille aujourd’hui sur l’analyse automatique de texte en particulier en utilisant des méthodes d’apprentissage semi-supervisé ou par transfert qui visent à utiliser des données non-annotées avec des données annotées, ces dernières étant en effet moins nombreuses car coûteuses à obtenir. Il s’agit de définir des stratégies qui permettent de mélanger ces deux types de données. « Ce qui est intéressant dans l’apprentissage, c’est de voir ce qu’on fait quand on manque de données », complète Chloé. Même si les chiffres évoluent, les données annotées continuent de manquer. « Le premier corpus contenait 385 documents annotés, aujourd’hui, on en a près de 2000 », ajoute Chloé. Pour l’analyse discursive, il existe plusieurs corpus en différentes langues. Donc Chloé a proposé d’adapter un modèle construit sur l’anglais à d’autres langues comme le basque, une langue moins bien dotée.

Ses travaux de recherche portent sur l’analyse discursive, c’est-à-dire les liens sémantiques s’établissant entre les phrases, en particulier quand ces liens sont implicites. Ainsi, s’il est facile pour un humain de reconnaître un lien de causalité dans la phrase « Paul est tombé. Marie l’a poussé. » même en l’absence d’un connecteur comme « parce que », c’est une tâche très difficile pour une machine.

En juin dernier, Chloé a co-organisé le premier workshop pour les femmes et les groupes sous-représentés dans les traitements des langues et des connaissances qui a eu lieu communément avec ACL à Vancouver.

D’ici la fin de l’année, elle va bientôt concrétiser son plus beau projet, celui d’être maman.

En savoir plus sur Chloé Braud

Share on FacebookShare on Google+Tweet about this on TwitterShare on LinkedIn