SMarT

Statistical Machine Translation & Speech Modelization and Text

Département 4 : Traitement des langues et des connaissances


Responsable d’équipe : Kamel Smaïli

Tél. :  +33 3 83 59 20 83
Mail : smaili@loria.fr

Site de l’équipe

Présentation

L’objectif de l’équipe SMarT est de développer des modèles de représentation du langage pour les systèmes de traduction automatique et de reconnaissance de la parole. Cette modélisation consiste à utiliser des méthodes mathématiques pour identifier, extraire et proposer des associations entre motifs langagiers servant à la traduction et à la reconnaissance de la parole. Les langues sont étudiées à travers les corpus monolingues, parallèles ou comparables pour des langues peu dotées (les dialectes arabes), l’arabe standard, le français et l’anglais. L’extraction opérée sur ces corpus concerne des associations de motifs multilingues et des concepts sémantiques multilingues. Par ailleurs, nous travaillons sur l’analyse des sentiments dans des corpus multilingues comparables.

Axes thématiques

  • Traduction sans alignement et utilisation de décodage évolutionniste
  • Traduction de la parole de langues peu dotées
  • Estimation de la qualité de la traduction
  • Etude des opinions dans des corpus comparables

Softwares

•    SUBWEB : outil d’alignement de sous-titres bilingues
•    QUEST : contribution au développement d’un outil de la mesure de la qualité d’une traduction

Collaborations

  • Université de Tunis
  • Université de Sheffield
  • CRSTDLA : Centre de recherche Scientifique et Technique pour le Développement de la Langue Arabe
  • LRI : Laboratoire de recherche en Informatique Université d’Annaba

Mots-clés

Modélisation statistique du langage, traduction automatique, traduction Parole-Parole, étude des langues peu dotées, modélisation, fouille de corpus comparables, mesures de confiance

Membres Permanents :

  • Kamel Smaïli : Pr UL
  • David Langlois : MCF UL

Membres associés :

  • Mme Chiraz Latiri : Pr à l’université de Tunis
  • Mourad Abbas (HDR) : CR (CRSTDA) –  Centre de recherche Scientifique et Technique pour le Développement de la Langue Arabe, Alger-Algérie
  • Karima Meftouh : MCF – Université de Annaba-Algérie

Doctorants :

  • Motaz Saad, 3ème année de thèse, Université de Lorraine
  • Cyrine Nasri, 4ème année de thèse, Université de Lorraine et Université de Tunis

Département 4 : Traitement des langues et des connaissances


Responsable d’équipe : Kamel Smaïli

Tél. :  +33 3 83 59 20 83
Mail : smaili@loria.fr

Présentation

L’objectif de l’équipe SMarT est de développer des modèles de représentation du langage pour les systèmes de traduction automatique et de reconnaissance de la parole. Cette modélisation consiste à utiliser des méthodes mathématiques pour identifier, extraire et proposer des associations entre motifs langagiers servant à la traduction et à la reconnaissance de la parole. Les langues sont étudiées à travers les corpus monolingues, parallèles ou comparables pour des langues peu dotées (les dialectes arabes), l’arabe standard, le français et l’anglais. L’extraction opérée sur ces corpus concerne des associations de motifs multilingues et des concepts sémantiques multilingues. Par ailleurs, nous travaillons sur l’analyse des sentiments dans des corpus multilingues comparables.

Axes thématiques

  • Traduction sans alignement et utilisation de décodage évolutionniste
  • Traduction de la parole de langues peu dotées
  • Estimation de la qualité de la traduction
  • Etude des opinions dans des corpus comparables

Softwares

•    SUBWEB : outil d’alignement de sous-titres bilingues
•    QUEST : contribution au développement d’un outil de la mesure de la qualité d’une traduction

Collaborations

  • Université de Tunis
  • Université de Sheffield
  • CRSTDLA : Centre de recherche Scientifique et Technique pour le Développement de la Langue Arabe
  • LRI : Laboratoire de recherche en Informatique Université d’Annaba

Mots-clés

Modélisation statistique du langage, traduction automatique, traduction Parole-Parole, étude des langues peu dotées, modélisation, fouille de corpus comparables, mesures de confiance

Membres Permanents :

  • Kamel Smaïli : Pr UL
  • David Langlois : MCF UL

Membres associés :

  • Mme Chiraz Latiri : Pr à l’université de Tunis
  • Mourad Abbas (HDR) : CR (CRSTDA) –  Centre de recherche Scientifique et Technique pour le Développement de la Langue Arabe, Alger-Algérie
  • Karima Meftouh : MCF – Université de Annaba-Algérie

Doctorants :

  • Motaz Saad, 3ème année de thèse, Université de Lorraine
  • Cyrine Nasri, 4ème année de thèse, Université de Lorraine et Université de Tunis

En ce moment

Logo du CNRS
Logo Inria
Logo Université de Lorraine