Analyses du langage parlé

Une facette importante des travaux de notre labo est l’étude du langage parlé, en particulier la voix et l’articulation, les composantes sensorimotrices du langage, ainsi que de leur vieillissement. Nous vous avons déjà présenté les composantes de la parole à travers une analogie de trompette, nous vous décrivons aujourd’hui les analyses que nous effectuons pour étudier la voix et la parole !

Pour évaluer le langage parlé, nous effectuons des enregistrements vocaux. Selon ce que nous cherchons à étudier précisément, ces enregistrements peuvent prendre plusieurs formes :

Production de voyelles soutenues (pour l’analyse de la voix);
Production de séquences de syllabes (principalement pour l’analyse de l’articulation, mais aussi de la voix et de la résonance);
Répétition de syllabes ou de mots présentés dans des écouteurs (pour l’analyse de l’articulation, de l’accès lexical, et du traitement phonologique ou sémantique);
Génération de mots à partir d’une lettre ou d’une image (pour l’analyse de l’articulation, de l’accès lexical, et du traitement phonologique ou sémantique);
Lecture de texte (principalement pour l’analyse de l’articulation, mais aussi de la voix et de la résonance);
Narration d’une histoire personnelle (principalement pour l’analyse de l’articulation et de la prosodie, mais aussi de la voix et de la résonance).

La préparation aux analyses commence lors des visites des participants et participantes au labo : s’assurer de la qualité des enregistrements. Peu importe le type d’enregistrement, nous devons toujours nous assurer que le signal est bien capté par le microphone, qu’il est assez fort, mais sans l’être trop, qu’il, n’y a pas de bruit de fond ni de grésillement. Pour nous assurer que la position du micro demeure constante durant toute la durée de l’enregistrement, nous utilisons des micros-casques. Les enregistrements sont effectués dans la grande salle insonorisée du laboratoire (figure 1), ce qui nous permet d’obtenir des enregistrements de grande qualité et sans bruit de fond.

Figure 1. Notre salle insonorisée.

Après la récolte de données, nos étudiants et étudiantes s’affairent en salle informatique. C’est un travail minutieux et de longue haleine qui inclut plusieurs étapes. C’est parti !

1- Nettoyage et définition des sections d’intérêt

Une fois les enregistrements effectués, ils sont sauvegardés en haute résolution sur notre serveur sécurisé suivant un protocole strict pour nommer les fichiers. La première étape d’analyse est celle du nettoyage. Nous nous assurons que les enregistrements ne contiennent pas les instructions des expérimentateurs ou expérimentatrices, et que les rires, la toux, les raclements de gorge, et tout autre bruit sont retirés.

Ensuite, nous utilisons un logiciel d’analyse acoustique (Praat) pour identifier les parties de l’enregistrement qui seront analysées, c’est-à-dire que nous identifions le début et la fin des enregistrements.

2- Analyse de la voix

Pour analyser la voix (phonation), des scripts d’analyse (voir encadré 1) sont utilisés pour extraire différentes mesures à partir des enregistrements segmentés:

Des mesures de la hauteur de la voix (on parle ici de sons aigus ou graves) comme la fréquence fondamentale (qui nous renseigne sur la hauteur de la voix d’une personne), la hauteur maximale et minimale de la voix (mesurée en Hertz, qui nous indique la capacité d’une personne à contrôler sa voix).
Des mesures d’intensité de la voix (on parle ici de la « force » de la voix), comme l’intensité minimale, maximale et moyenne de la voix (mesurées en décibels, une autre mesure de contrôle vocal).
D’autres mesures telles que le « jitter » et le « shimmer », des mesures de la stabilité vocale, liées aux mesures de la hauteur et de l’intensité respectivement.

3- Transcriptions

En général, une transcription de ce qui est produit est effectuée, sauf pour les enregistrements de voyelles soutenues. Cette transcription est effectuée soit directement en alphabet phonétique (voir encadré 2) ou alors en alphabet français, avant d’être convertie par la suite. Pour nous assurer que cette transcription est juste, celle-ci est toujours effectuée par deux personnes, indépendamment.

4- Découpage

Nous utilisons ensuite un autre script qui découpe l’enregistrement en mots, en syllabes et même en phonèmes (les consonnes et les voyelles) (figure 2). Il faut ensuite vérifier l’enregistrement au complet pour nous assurer que le découpage est adéquat, et le corriger minutieusement lorsqu’il ne l’est pas. En effet, même si les scripts d’analyses sont puissants, la parole est tellement variable qu’aucune analyse automatique n’est parfaite !

Figure 2. Exemple d’enregistrement découpé.

5- Analyse de la parole

Ce découpage nous permet d’examiner les erreurs, son par son. Cette étape est effectuée par au moins deux personnes qui détermineront indépendamment, à l’aide d’une grille d’analyse, le type d’erreur pour chaque son incorrect. S’agit-il d’une inversion de phonèmes, comme dans « peaucha » ou lieu de « chapeau » ? D’un ajout ? Comme dans « chapleua » au lieu de « chapeau » ? D’une simplification ? Comme dans « bouette » ou lieu de « brouette » ?

Lorsque les erreurs sont identifiées, le débit de parole est alors mesuré, par exemple, en calculant le nombre de syllabes réussies par secondes (au moyen d’un script !), ainsi que le coefficient de variation (qui quantifie la régularité de l’élocution). Nous pouvons aussi aller plus loin et examiner la durée des voyelles et des consonnes pour caractériser encore plus finement le débit de parole et comprendre si la durée de certains sons spécifiques (par exemple les voyelles), par exemple, change avec l’âge.

Dans plusieurs projets, nous calculons aussi le temps de réponse, c’est-à-dire le temps qu’une personne prend pour initier la production d’une syllabe ou un mot. Ceci nous renseigne sur la durée de préparation nécessaire. Plus l’item à produire est complexe ou rare, plus le temps de réponse est long. Par exemple, il faut plus de temps pour se préparer à dire le mot « brouette » que le mot « table », qui est plus simple et plus fréquent. Selon la nature de la tâche, le temps de réponse nous renseignera sur la préparation articulatoire, la sélection lexicale, ou d’autres processus en jeu.

6- Analyse phonétique

L’étape finale est l’analyse phonétique, c’est-à-dire l’analyse de la réalisation acoustique des consonnes ou des voyelles. Par exemple, l’analyse de la composition spectrale des voyelles, le temps nécessaire pour que la vibration des cordes vocales soit visible et de nombreuses autres caractéristiques. Ces informations sont extraites avec des scripts et vérifiées manuellement. Elles nous renseignent sur les capacités et les difficultés articulatoires des locuteurs. Afin d’élaborer les meilleures analyses phonétiques possibles, nous collaborons régulièrement avec des phonéticiennes : Johanna-Pascale Roy de l’Université Laval, et Anna Marczyk de l’Université d’Aix-Marseille, en France.

En somme, l’analyse du langage parlé est détaillée, minutieuses, et exige de très longues de travail! Les projets incluant ce type de mesure s’étirent généralement sur plusieurs mois, voire plusieurs années!

Pour en savoir plus sur nos projets publiés portant sur le langage parlé, visitez notre site web :

Pour les analyses de voix :

Lortie, C., Rivard, J., Thibeault, M., *Tremblay, P. (2016) The moderating effect of frequent singing on voice aging. Journal of Voice.
Lortie, CL., Thibeault, M., Guitton, M.J., Tremblay, P. (2015) Effects of age on the amplitude, frequency and perceived quality of voice. Age. 37(6):117
Lortie, C.L., Thibeault, M., Guitton, M.J., Tremblay, P. (2018) Age differences in voice evaluation: from auditory-perceptual evaluation to social interactions. Journal of speech, language, and hearing research, 61(2): 227-245.

Parole

Tremblay, P., Poulin, J., Martel-Sauvageau, V., Denis, C. (2019) Age-related deficits in speech production: from phonological planning to motor implementation. Experimental gerontologist.
Tremblay, P., Deschamps, I., Bédard, O., Tessier, M.-H., Carrier, M., Thibeault, M. (2018) Aging of speech production, from articulatory accuracy to motor timing. Psychology of Aging, 33(7) :1022-1034.
Tremblay P, Sato M, Deschamps I. (2017). Age-related differences in speech production: an fMRI study of healthy aging. Human Brain Mapping (5):2751–2771.
Bilodeau-Mercure M., & Tremblay P. (2016) Impact of aging on sequential speech production: articulatory and physiological factors. Journal of the American Geriatric Society, 64(11):e177-e182. doi: 10.1111/jgs.14491.
Tremblay P, Deschamps I. (2015). Structural brain aging and speech production: a surface-based brain morphometry study. Brain Structure and Function, 221(6), 3275-3299.
Bilodeau-Mercure M, Kirouac V, Langlois N, Ouellet C, Gasse, I., Tremblay P. (2015). Movement sequencing in normal aging: speech, oro-facial and finger movements. Age, 37(4), 37-78.

Lectures suggérées :

Article précédent

Arrivée de Marilyne

Article suivant

Blogue

Analyses du langage parlé

Arrivée de Marilyne

Visite de notre salle insonorisée

Blogue

Analyses du langage parlé

Arrivée de Marilyne

Visite de notre salle insonorisée

Articles similaires

Marc-André au CRBLM

L’amorçage : une fenêtre sur l’organisation de notre cerveau !

Rentrée 2025 au labo !