Curriculum Vitae
Situation actuelle
Depuis septembre 1998 : maitre de conférences, université Nancy 2,
IUT Charlemagne.
Études et diplômes
2005 : Habilitation à diriger les recherches de
l'Université Nancy 2
Titre : << Contributions à la reconnaissance robuste de la parole >>.
LORIA
Directeurs d'habilitation : J.P. Haton, Professeur à
l'Université Henri Poincaré Nancy 1
2004-2006 : Détachement à l'INRIA, équipe Parole.
1997-1998 : recherche post-doctorale (bourse
INRIA) à la Carnegie Mellon University
Robust Recognition (Richard Stern), Computer Science Department,
CMU, 5000 Forbes av., Pittsburgh, PA 15213, USA
1994-1997 : Doctorat de l'Université Henri Poincaré Nancy 1
Titre : << Extension du modèle stochastique des
mélanges de trajectoires pour
la reconnaissance automatique de la parole continue >>. LORIA
Directeurs de thèse : Y. Gong, actuellement chercheur au
Texas Instruments, USA
et J.P. Haton, Professeur à
l'Université Henri Poincaré Nancy 1
1992-1994 : DEA d'informatique de l'Université Henri
Poincaré Nancy 1.
Titre : << Ordonnancement stochastique : processus de
décision markovien et indices de Gittins >>
Responsables : René Schott, professeur à
l'Université Henri Poincaré Nancy 1 ;
Marie-Claude Portmann, professeur à l'École des Mines de Nancy.
1983-1988 : Diplôme d'ingénieur de l'Université de Kazan, Russie.
Specialité économie et mathématiques
1983 : Baccalauréat à Kazan, Russie
Fonctions antérieures
Novembre 1995 : Séjour à l'Université de Gand, Belgique,
collaboration dans le cadre du projet européen COST 249 (1 mois).
1988-1992 : Poste d'enseignement à plein temps en Informatique Appliqué et Mathémathiques Appliquées à l'Université de Kazan, Russie.
Enseignement
1998-2008 : IUT Charlemagne. 250 heures de cours, TD et TP de l'algorithmique,
programmation en C, structure de donnéees, projets tutorés, encadrement de stages.
1995, 1996 : École des Mines de Nancy (INPL) :
30 heures de TD et TP de Pascal (1-ere année),
30 heures de TD de recherche opérationnelle (2-eme année).
1994 : Bibliothéque Universitaire de Nancy 1 :
12 heures de cours de programmation en C.
1988-1992 : Université de Kazan, Russie : 4 ans d'enseignement de
l'informatique (TD et TP) à plein temps.
Faculté d'informatique appliquée à la
gestion de la production et faculté de mathématiques
appliquées.
Matières enseignées :
algorithmique,
programmation en C,
bases de données,
programmation linéaire et non linéaire,
théorie des jeux,
modélisation de problèmes économiques,
suivi des stages,
projets en groupe.
Recherches
Mots-cles
Reconnaissance de la parole continue,
modélisation acoustique,
modèles fondés sur les segments,
modèle stochastique des trajectoires,
segmentation,
adaptation du modèle acoustique aux conditions de test,
compensation,
reconnaissance avec de données manquantes,
indexation de documents sonores,
développement des systèmes d'assistance aux handicapés.
Résumé du mémoire de thèse
Nous nous intéressons dans cette thèse à la modélisation acoustique de
la parole continue à l'aide du modèle stochastique des mélanges de
trajectoires (MSTM). Ce modèle, développé au LORIA pour la
reconnaissance automatique de la parole, est un modèle fondé sur les
segments (SBM), qui se différencie des modèles de Markov cachés fondés
sur les trames (FBM). Le MSTM donne de bons résultats de
reconnaissance en mode dépendant du locuteur. En revanche, les
problèmes liés à la variabilité multi-environnements, à la
multiplicités des contextes phonétiques et à l'adaptation aux
conditions de test sont toujours d'actualité. Dans ce cadre, notre
travail propose différentes extensions du MSTM. Tout d'abord, nous
mettons en évidence le phénomène de repliement des trajectoires propre
aux modèles FBM. L'étude expérimentale montre que ce phénomène peut
être atténué dans les modèles SBM. Par la suite, nous soulignons
l'importance du modèle de segmentation pour les modèles SBM. Dans le
MSTM, chaque état est modélisé par une distribution gaussienne, ce qui
n'est pas suffisant pour bien représenter un état. Pour prendre en
compte la distribution complexe de chaque état, nous proposons de
remplacer la distribution de chaque état de MSTM par un mélange de
distributions. Pour diminuer la variabilité de la parole due aux
différents environnements, nous développons une approche de la
normalisation des environnements pendant l'apprentissage et une
approche de l'adaptation du modèle acoustique, issu de
l'apprentissage, à l'environnement de test. Les approches normalisent
ou adaptent le modèle acoustique à l'aide de transformations
linéaires. Enfin, nous proposons de nouvelles heuristiques pour
élaguer plus efficacement l'arbre de recherche pendant la
reconnaissance. Les expériences sur un corpus de parole en français
montrent que les extensions proposées permettent d'améliorer les
performances de MSTM.
Langues
Anglais lu, écrit et parlé.
Français courant.
Langue maternelle : russe.
Irina ILLINA Home Page