La complexité du langage oral se révèle lorsque nous le découpons en petits blocs de construction pour mieux l’étudier. Les phrases sont en effet formées de mots, les mots de syllabes et les syllabes de toutes petites unités de sons, appelés phonèmes.

Ces phonèmes, particuliers à chaque langue, sont indispensables à la distinction des mots les uns des autres. Par exemple, la différence entre les mots saper et zapper repose uniquement sur la différence entre le premier phonème de chaque mot. Le /s/ et le /z/ sont des phonèmes de la langue française. Les phonèmes se prononcent différemment selon leur position et leur environnement au sein d’un mot, ou au gré des accents régionaux. Ces possibilités de prononciation sont appelées des « phones ».

Le projet SyllabO+, une fierté de notre laboratoire, découle de l’absence d’information sur l’utilisation des mots, des syllabes et des phonèmes du français québécois, qui diffère des autres variétés de français, comme celle de la France ou de la Suisse. Chaque variété de français est en effet unique à plusieurs égards.

Le projet SyllabO+ a démarré en 2013. Financé par plusieurs subventions du Conseil de recherches en sciences humaines (CRSH), le projet, mené par Pascale Tremblay, a débuté par la collecte d’enregistrements de parole de 225 personnes âgées de 18 à 97 ans. Ces enregistrements ont d’abord été transcrits en alphabet phonétique international (API) – un langage utilisé par les linguistes et les créateurs de dictionnaires pour représenter les sons de toutes les langues facilement – puis les transcriptions ont été découpées en mots, puis en plus petits blocs de syllabes et de phonèmes! Le corpus ainsi découpé comprenait 360 000 syllabes! Ceci représente un travail énorme qui s’est étalé sur plusieurs années!

SyllabO+ est un outil disponible gratuitement en ligne qui permet d’effectuer des recherches dans plusieurs bases de données : mots, lemmes, syllabes, et phones. La base de données des mots contient près de 16 000 mots différents, la base de données des syllabes contient 5614 syllabes différentes et celle des phones contient 49 phones différents!

Le projet est toujours en développement! Nous travaillons maintenant sur les morphèmes, qui sont les unités de sens qui composent les mots. Ce projet est mené par une équipe composée de Pascale Tremblay, Noémie Auclair-Ouellet, professeure -chercheuse à l’Université McGill, et Alexandra Lavoie, une assistante du laboratoire qui a découpé tous les mots en morphèmes! Au fil des ans, de nombreuses personnes au contribué à ce gigantesque projet : Pascale Bédard, qui en a fait son sujet de maîtrise, Johanna-Pascale Roy, professeure à l’Université Laval, Patrick Drouin, professeur à l’Université de Montréal et plusieurs étudiants du laboratoire : Émilie Belley, Anne-Marie Audet, Julie Rivard, Claudie Ouellet, Chloé Chagnon-Dumesnil, et Catherine Denis.

À quoi sert SyllabO+? SyllabO+ permet de rechercher des syllabes et des phonèmes afin d’obtenir des statistiques d’utilisation qui leur sont associées, incluant la fréquence d’occurrence de chaque syllabe et de chaque phonème et plusieurs autres statistiques. Une vraie cartographie de la langue québécoise! Cette information est utile pour la création de matériel d’évaluation du langage pour la recherche ou pour la clinique, lequel doit être contrôlé en fonction de différents paramètres comme la fréquence d’utilisation des mots ou des syllabes. Nous utilisons SyllabO pour développer les stimuli de chacune de nos études. Cette information est aussi utile aux enseignants et aux apprenants du français pour découvrir quels mots sont les plus souvent utilisés. Finalement, pour tous les amoureux de la langue qui voudraient savoir, par exemple, si le mot « auto » est plus fréquent que le mot « char » ou que « voiture »? La réponse sur SyllabO+!

À lire aussi :

Notre article sur SyllabO+ :

Bédard, P., Audet, A-M, Drouin, P., Roy, J-P, Rivard, J., *Tremblay, P. (2017) SyllabO+: a new tool to investigate sublexical phenomena in Québec spoken French. Behavioral Research Methods, Volume 49, Issue 5, p 1852–1863.

Le mémoire de maîtrise de Pascale Bédard, disponible sur CorpusUL, le dépôt institutionnel de l’Université Laval, vise à rendre librement accessible votre production scientifique afin d’en accroître la visibilité et de favoriser le partage des connaissances de façon durable :

http://hdl.handle.net/20.500.11794/26947

 

Lectures suggérées:

,