Curriculum Vitae

Situation actuelle

Depuis septembre 1998 : maitre de conférences, université Nancy 2, IUT Charlemagne.

Études et diplômes

2005 : Habilitation à diriger les recherches de l'Université Nancy 2
Titre : << Contributions à la reconnaissance robuste de la parole >>. LORIA
Directeurs d'habilitation : J.P. Haton, Professeur à l'Université Henri Poincaré Nancy 1

2004-2006 : Détachement à l'INRIA, équipe Parole.

1997-1998 : recherche post-doctorale (bourse INRIA) à la Carnegie Mellon University Robust Recognition (Richard Stern), Computer Science Department, CMU, 5000 Forbes av., Pittsburgh, PA 15213, USA

1994-1997 : Doctorat de l'Université Henri Poincaré Nancy 1
Titre : << Extension du modèle stochastique des mélanges de trajectoires pour la reconnaissance automatique de la parole continue >>. LORIA
Directeurs de thèse : Y. Gong, actuellement chercheur au Texas Instruments, USA
et J.P. Haton, Professeur à l'Université Henri Poincaré Nancy 1

1992-1994 : DEA d'informatique de l'Université Henri Poincaré Nancy 1. Titre : << Ordonnancement stochastique : processus de décision markovien et indices de Gittins >>
Responsables : René Schott, professeur à l'Université Henri Poincaré Nancy 1 ; Marie-Claude Portmann, professeur à l'École des Mines de Nancy.

1983-1988 : Diplôme d'ingénieur de l'Université de Kazan, Russie. Specialité économie et mathématiques

1983 : Baccalauréat à Kazan, Russie

Fonctions antérieures

Novembre 1995 : Séjour à l'Université de Gand, Belgique, collaboration dans le cadre du projet européen COST 249 (1 mois).

1988-1992 : Poste d'enseignement à plein temps en Informatique Appliqué et Mathémathiques Appliquées à l'Université de Kazan, Russie.

Enseignement

1998-2008 : IUT Charlemagne. 250 heures de cours, TD et TP de l'algorithmique, programmation en C, structure de donnéees, projets tutorés, encadrement de stages.

1995, 1996 : École des Mines de Nancy (INPL) :
30 heures de TD et TP de Pascal (1-ere année),
30 heures de TD de recherche opérationnelle (2-eme année).

1994 : Bibliothéque Universitaire de Nancy 1 :
12 heures de cours de programmation en C.

1988-1992 : Université de Kazan, Russie : 4 ans d'enseignement de l'informatique (TD et TP) à plein temps.
Faculté d'informatique appliquée à la gestion de la production et faculté de mathématiques appliquées.
Matières enseignées : algorithmique, programmation en C, bases de données, programmation linéaire et non linéaire, théorie des jeux, modélisation de problèmes économiques, suivi des stages, projets en groupe.

Recherches

Mots-cles

Reconnaissance de la parole continue,
modélisation acoustique,
modèles fondés sur les segments,
modèle stochastique des trajectoires,
segmentation,
adaptation du modèle acoustique aux conditions de test,
compensation,
reconnaissance avec de données manquantes,
indexation de documents sonores,
développement des systèmes d'assistance aux handicapés.

Résumé du mémoire de thèse

Nous nous intéressons dans cette thèse à la modélisation acoustique de la parole continue à l'aide du modèle stochastique des mélanges de trajectoires (MSTM). Ce modèle, développé au LORIA pour la reconnaissance automatique de la parole, est un modèle fondé sur les segments (SBM), qui se différencie des modèles de Markov cachés fondés sur les trames (FBM). Le MSTM donne de bons résultats de reconnaissance en mode dépendant du locuteur. En revanche, les problèmes liés à la variabilité multi-environnements, à la multiplicités des contextes phonétiques et à l'adaptation aux conditions de test sont toujours d'actualité. Dans ce cadre, notre travail propose différentes extensions du MSTM. Tout d'abord, nous mettons en évidence le phénomène de repliement des trajectoires propre aux modèles FBM. L'étude expérimentale montre que ce phénomène peut être atténué dans les modèles SBM. Par la suite, nous soulignons l'importance du modèle de segmentation pour les modèles SBM. Dans le MSTM, chaque état est modélisé par une distribution gaussienne, ce qui n'est pas suffisant pour bien représenter un état. Pour prendre en compte la distribution complexe de chaque état, nous proposons de remplacer la distribution de chaque état de MSTM par un mélange de distributions. Pour diminuer la variabilité de la parole due aux différents environnements, nous développons une approche de la normalisation des environnements pendant l'apprentissage et une approche de l'adaptation du modèle acoustique, issu de l'apprentissage, à l'environnement de test. Les approches normalisent ou adaptent le modèle acoustique à l'aide de transformations linéaires. Enfin, nous proposons de nouvelles heuristiques pour élaguer plus efficacement l'arbre de recherche pendant la reconnaissance. Les expériences sur un corpus de parole en français montrent que les extensions proposées permettent d'améliorer les performances de MSTM.

Publications

Langues

Anglais lu, écrit et parlé.
Français courant.
Langue maternelle : russe.
Irina ILLINA Home Page