Production
Accueil Remonter Production Signal acoustique Analyse du signal Perception Reconnaissance Systèmes en 1995 Bibliographie

Production
Signal acoustique
Analyse du signal
Perception
Reconnaissance
Systèmes en 1995
Bibliographie

  La production de la parole
1. Les sons

2. La production

3. Modèle de production

1. Les Sons.

La parole se distingue des autres sons par des caractéristiques acoustiques ayant leurs origines dans les mécanismes de production. Les sons de parole sont produits soit par les vibrations des cordes vocales (source de voisement), soit par l'écoulement turbulent de l'air dans le conduit vocal, soit lors du relâchement d'une occlusion de ce conduit (source de bruit).

Dans le processus de communication parlée, pour une langue donnée, les sons permettent de distinguer les différentes unités de signification du langage [CAL 89]. L'unité élémentaire d'un son permettant la distinction des différents mots est le phonème.

La notion de phonème ne tient compte que des caractéristiques acoustiques qui permettent une distinction entre des mots. On ne tient pas compte des phénomènes physiques de production du son, tant que la différence d'articulation (fonction du dialecte, de la cadence d'élocution, du contexte) ne permet pas de distinguer des mots différents. La représentation phonétique d'un texte dépend de la langue dans laquelle il est écrit. Le tableau suivant donne une liste des phonèmes pour le français [BOI 87].

PHONEMES
VOYELLES SEMI-
CONSONNES
CONSONNES
ORALES NASALES   LIQUIDES NASALES FRICATIVES OCCLUSIVES
          voisées non voisées voisées non voisées
[i] lit [] lin [j] [l] lait [m] mais [v] vais [f] fait [b] baie [p] paie
[e] les [] lent [w] wais [R] raie [n] nez [z] zéros [s] sait [d] dais [t] taie
[e] lait [] long [y] huer     [h] gagner [z ] jeux [ò] chez [g] gai [k] quai
[a] là [] un                            
[u] loup                                
[o] lot                                
[y] lu                                
[Æ] leu                                
[œ] leur                                
[] le                                

Les phonèmes peuvent êtres rangés en catégories selon des "traits distinctifs" qui indiquent une similitude au niveau articulatoire, acoustique ou perceptif. Les voyelles peuvent être rangées selon [CAL 89]:
bulletla nasalité;
bulletl'ouverture du conduit vocal;
bulletla position de la constriction du conduit vocal;
bulletl'arrondissement des lèvres.

Les consonnes sont classées selon :
bulletle voisement;
bulletle mode d'articulation (occlusif, nasal, fricatif);
bulletle lieu d'articulation (labiale, dentale, palatale).

D'autres aspects de la parole permettent de distinguer les différentes significations. Des phénomènes comme la prosodie, la durée ou l'intensité des phonèmes, le timbre de la voix permettent à l'auditeur d'identifier le locuteur ou de se faire une idée sur son attitude.

Cette multiplication des informations complique le traitement automatique de la parole, mais l'être humain en tire sans doute des avantages pour percevoir le message, particulièrement lorsque le signal acoustique est bruité.

Retour au début du document

2. La production.

Le processus de production de la parole présente certaines caractéristiques :
bulletContinuité; lorsqu'on écoute parler une personne, on perçoit une suite de mots que l'analyse du signal vocal sépare difficilement. Le même problème de segmentation se retrouve à l'intérieur du mot, perçu comme une suite de sons élémentaires, les phonèmes.
bulletVariabilité; à contenu phonétique égal, le signal vocal est très variable, tant pour différents individus que pour un même locuteur, en raison des différences anatomiques.
bulletLe conduit vocal est un tuyau tridimensionnel qui est excité par une ou deux sources acoustiques. La source laryngienne peut être considérée comme quasi périodique, avec une fréquence pouvant évoluer très rapidement. La seconde source génère du bruit de friction ou d'explosion (glotte, lèvres).
bulletEncodage; depuis l'idée jusqu'au signal sonore, interviennent plusieurs niveaux successifs de traitement: sémantique (concept), syntaxique (structure du langage), lexical (mots), morphologique, phonétique (phonèmes et leurs interactions).

Le larynx est un lieu important pour les mécanismes phonatoires. Il est situé dans la région moyenne du cou et il est constitué de cartilages, de muscles, de muqueuse et de nerfs. Il contient les "cordes vocales" qui sont un ensemble de muqueuses, de ligaments et de muscles.

La langue joue un rôle dans la phonation, car sa mobilité lui permet d'agir avec précision et rapidité sur la taille du conduit vocalique.

Les lèvres sont situées à l’extrémité du conduit vocal et c'est leur écartement (et les variations de cet écartement ) qui est important du point de vue acoustique.

Retour au début du document

1.3. Modèle de production de la parole.

Une représentation fonctionnelle du modèle de production, séparant sources, conduit et rayonnement aux lèvres, est donnée par la figure 1.

Figure 1. Modèle fonctionnel de production de la parole.

Une phrase est une suite de sons voisés, de sons non voisés et de silences. Pour la générer, il faut connaître pour chaque intervalle de temps dT, intervalle durant lequel le modèle est considéré comme invariant (5 à 25 ms):

bulletLa fréquence fondamentale F0;
bulletLes amplitudes Av et Ab;
bulletLes coefficients des filtres modélisant le conduit vocal, l’impulsion glottale et le rayonnement aux lèvres.

Retour au début du document