Traitement automatique des langues et IA

Créé à partir d’un noyau centré sur le traitement automatique des langues, l’axe s’étend à d’autres domaines de recherche en IA, en capitalisant sur des méthodes fondamentales communes, en particulier l’apprentissage profond. Cet axe trouve de nombreux domaines d’application dans le laboratoire : vision et traitement des images, sécurité et protection de la vie privée, apprentissage distribué et fédéré, parole, langage, robotique interactive multimodale, architectures neuronales, systèmes de recommandation et apprentissage par renforcement.

L’axe TAL et IA entretient de multiples connexions avec d’autres thématiques comme l’industrie du futur et la santé, mais aussi avec les sciences humaines et sociales autour des enjeux de l’éthique.

 

Équipes impliquées : Synalp, Multispeech, Orpailleur, Smart, Sémagramme, Bird, ABC, Coast, Pesto, Mocqua.

Projets européens

NL4XAI : Interactive Natural Language Technology for Explainable Artificial Intelligence

NL4XAI will train 11 creative, entrepreneurial and innovative early-stage researchers (ESRs), who will face the challenge of making AI self-explanatory and thus contributing to translate knowledge into products and services for economic and social benefit, with the support of Explainable AI (XAI) systems. Project consortium consists of 10 beneficiaries and 9 partner organizations.

En savoir +

  • H2020 COMPRISE : pour un système d’interactions vocales qui respecte vos données

Les assistants vocaux, basés sur des algorithmes de machine learning, 

recueillent un grand nombre de données personnelles. Le projet européen H2020 COMPRISE (COst-Effective, Multilingual, PRivacy-driven voice-enabled Services), coordonné par Emmanuel Vincent, a pour objectif de développer des services vocaux multilingues protégeant la vie privée des utilisateurs. Deux outils open-source, un transformateur de voix et un transformateur de texte ont été lancés.
En savoir +

  • H2020 AI-PROFICIENT

Porté par l’Université de Lorraine (CRAN et Loria), le projet AI-PROFICIENT (Artificial Intelligence for Improved Production efficiency, quality and maintenance) a pour objectif de placer l’humain au centre de la mise en œuvre de solutions innovantes d’IA dans l’industrie manufacturière digitalisée pour améliorer la planification et l’exécution de la production et de la maintenance afin de répondre aux défis d’adaptabilité, d’agilité et de résilience de l’industrie du futur.
En savoir +

  • PAPUD : Profiling and Analysis Platform Using Deep Learning

Le projet développe des méthodes de traitement automatique des langues basées sur l’apprentissage profond et déployées dans plusieurs applications industrielles, dont le calcul de correspondance entre offres d’emploi et CV, l’analyse de produits vendus en supermarchés à partir de leur description et commentaires utilisateurs, l’analyse des réseaux sociaux mais aussi le traitement des fichiers de journalisation système pour la prédiction de pannes dans des fermes de GPU.
En savoir +

  • Humane-AI-net – European Network of human-centered artificial intelligence

Faciliter une marque européenne d’IA éthique et digne de confiance qui améliore les capacités humaines et donne aux citoyens et à la société les moyens de relever efficacement les défis d’un monde interconnecté et globalisé.
En savoir +

  • TAILOR 

un réseau européen pour des IA fiables.
Faire émerger de nouvelles solutions dans le domaine de l’intelligence artificielle de confiance en favorisant la méthode dite hybride, qui mêle approche symbolique, optimisation et apprentissage.
En savoir +

  • HyAIAI

Pour une IA hybride interprétable.
Le projet s’attaque au problème de l’interprétation des modèles Machine Learning par l’étude et la conception d’approches hybrides qui combinent des modèles numériques de pointe avec des modèles symboliques explicables.
En savoir +

Des défis pour la communauté internationale

  • DCASE

Detection and classification of Acoustic scenes and events
En savoir +

 

Collaborations industrielles majeures

  • META AI 

    Dans sa thèse, Angela Fan a relevé le défi de la génération de textes longs et structurés couplé à la fouille d’information à l’échelle du Web. Elle a conçu un réseau profond entraîné de bout-en-bout qui, à partir de 100 documents issus d’une requête Web, génère les différentes sections d’une bibliographie Wikipedia, y compris les liens et citations.
  • HuggingFace

  • Orange

  • Aliae

une entreprise de Nancy, dont l’engagement pour la santé est d’assurer une évaluation continue de la qualité de vie des patients, avec un dialogue simple et empathique qui s’inscrit naturellement dans leur quotidien.

Son corpus scientifique et les technologies associées (NLP, machine learning, IA) transposent ces insights en informations médicales précieuses pour les HCP (programmes de soins, études cliniques…).

Projets nationaux

  • Projet LUE OLKi, Open Language and Knowledge for Citizens

Ce projet vise à : 

  • développer de nouveaux algorithmes améliorant la compréhension automatique de documents en langage naturel. 
  • Fournir un logiciel de plateforme de diffusion de ressources langagières
  • Offrir aux usagers des fonctionnalités de communication instantanée dédiées à la recherche scientifique
    En savoir +

  • GDR LIFT 

La linguistique informatique met à la disposition des linguistes un large éventail de techniques et de ressources qui ouvrent des perspectives nouvelles pour l’analyse linguistique, que ce soit pour collecter et annoter des données ou pour extraire ou vérifier des généralisations linguistiques. L’objectif du GDR LIFT (Linguistique Informatique, Formelle et de Terrain) est

  • d’explorer ce potentiel en tirant parti d’un réseau scientifique favorisant les interactions entre linguistes, linguistes de terrain et linguistes informaticiens et
  • de favoriser l’émergence de méthodes nouvelles qui bénéficient à la fois aux linguistes (automatisation des processus d’analyse et de validation), aux linguistes de terrain (facilitation des processus de collecte et d’analyse des données) et aux linguistes informaticiens (développement de nouvelles techniques nécessitées par l’analyse linguistique, essor des méthodes non ou faiblement supervisées pour l’analyse des langues peu dotées, peu écrites ou non documentées).
    En savoir +
  • Chaire IA XNLG

Financé par l’ANR française, le projet XNLG (2020-2024) est l’une des 40 chaires nationales d’IA.

XNLG étudie la génération de textes multilingues et multi-sources : générer des textes dans plusieurs langues, à partir de différentes sources (bases de connaissances, textes, représentations du sens) et pour divers objectifs de communication (résumer, simplifier, converser, verbaliser).

  • ANR DeepPrivacy : Apprentissage distribué, personnalisé, préservant la privacité pour le traitement de la parole
  • ANR LEAUDS : Learning to understand audio scenes
  • ANR MPHASIS : Hate speech in social media

 

RESSOURCES

  • Site ia.loria.fr
  • Charte éthique de l’IA
  • Blog éthique et TAL
  • Séminaires philo-info

Logo d'Inria