Partenaires

Analyse et modèle génératif de l’expressivité. Application à la parole et à l’interprétation musicale.

G BELLER, Université Paris VI - IRCAM, 2009
jeudi 28 janvier 2010.
 

Résumé : Cette thèse s’inscrit dans les recherches actuelles sur les émotions et les réactions émotionnelles, sur la modélisation et la transformation de la parole, ainsi que sur l’interprétation musicale. Il semble que la capacité d’exprimer, de simuler et d’identifier des émotions, des humeurs, des intentions ou des attitudes, est fondamentale dans la communication humaine. La facilité avec laquelle nous comprenons l’état d’un personnage, à partir de la seule observation du comportement des acteurs et des sons qu’ils émettent, montre que cette source d’information est essentielle et, parfois même, suffisante dans nos relations sociales. Si l’état émotionnel présente la particularité d’être idiosyncrasique, c’est-à-dire particulier à chaque individu, il n’en va pas de même de la réaction associée qui se manifeste par le geste (mouvement, posture, visage...), le son (voix, musique...), et qui, elle, est observable par autrui. Ce qui nous permet de penser qu’il est possible de transfor mer cette réaction dans le but de modifier la perception de l’émotion associée. C’est pourquoi le paradigme d’analyse-transformation-synthèse des réactions émotionnelles est, peu à peu, introduit dans les domaines thérapeutique, commercial, scientifique et artistique. Cette thèse s’inscrit dans ces deux derniers domaines et propose plusieurs contributions. D’un point de vue théorique, cette thèse propose une définition de l’expressivité, une définition de l’expressivité neutre, un nouveau mode de représentation de l’expressivité, ainsi qu’un ensemble de catégories expressives communes à la parole et à la musique. Elle situe l’expressivité parmi le recensement des niveaux d’information disponibles dans l’interprétation qui peut être vu comme un modèle de la performance artistique. Elle propose un modèle original de la parole et de ses constituants, ainsi qu’un nouveau modèle prosodique hiérarchique. D’un point de vue expérimental, cette thèse fournit un protocole pour l’acquisition de données expressives interprétées. Colatéralement, elle rend disponible trois corpus pour l’observation de l’expressivité. Elle fournit une nouvelle mesure statistique du degré d’articulation ainsi que plusieurs résultats d’analyses concernant l’influence de l’expressivité sur la parole. D’un point de vue technique, elle propose un algorithme de traitement du signal permettant la modification du degré d’articulation. Elle présente un système de gestion de corpus novateur qui est, d’ores et déjà, utilisé par d’autres applications du traitement automatique de la parole, nécessitant la manipulation de corpus. Elle montre l’établissement d’un réseau bayésien en tant que modèle génératif de paramètres de transformation dépendants du contexte. D’un point de vue technologique, un système expérimental de transformation, de haute qualité, de l’expressivité d’une phrase neutre, en français, synthétique ou enregistrée, a été produit. Enfin et surtout, d’un point de vue prospectif, cette thèse propose différentes pistes de recherche pour l’avenir, tant sur les plans théorique, expérimental, technique, que technologique. Parmi celles-ci, la confrontation des manifestations de l’expressivité dans les interprétations verbale et musicale semble être une voie prometteuse. Mots-clés Émotions, expressivité, performance artistique, interprétation musicale, parole, prosodie, transformation du signal de parole, modélisation générative, apprentissage, réseau bayésien.



Forum

Contact : webmaster-afcp@afcp-parole.org - Hébergement : Université d'Avignon
Développé sous SPIP