SyllabO+

Nous sommes fiers de présenter SyllabO+ [SilabO+], la toute première base de données dédiée aux phénomènes sous-lexicaux de la langue orale franco-québécoise. SyllabO+ contient plus de 360 000 syllabes  (incluant 5613 syllabes différentes) et plus de 830 000 phones (incluant 49 phones différents) extraits des échantillons de parole de 225 locuteurs adultes du français québécois âgés de 20 à 97 ans en contextes de communication spontanée formelle et informelle.

On peut rechercher dans SyllabO+ des syllabes et des phones uniques, mais également des paires, des groupes de trois et des groupes de quatre syllabes ou phones, ainsi que les statistiques d’utilisation qui sont associées à ces unités et groupes, incluant les fréquences d’occurrence normalisées, les fréquences de cooccurrence entre paires de syllabes ou paires de phones, les probabilités de transition et l’information mutuelle entre paires de syllabes et de phones. L’un des éléments les plus novateurs de ce projet est la possibilité de rechercher les statistiques d’utilisation des syllabes et phones ou groupes de syllabes et phones en fonction du sexe et de l’âge des locuteurs et du contexte d’utilisation (formel ou informel). 

Le projet SyllabO+, commencé à l’été 2013, a été réalisé par l’équipe de la chercheuse Pascale Tremblay, Ph. D. au Laboratoire des neurosciences de la parole et de l’audition de l’Université Laval. Il forme le cœur du projet de maîtrise de Pascale Bédard, qui a effectué une grande partie du travail, sous la direction de Pascale Tremblay, en collaboration avec Patrick Drouin, Ph. D., de l’Université de Montréal et Johanna-Pascale Roy, Ph. D., de l’Université Laval. Le précieux travail d’Anne-Marie Audet et de Julie Rivard a également permis la réalisation du projet. Ont également participé à cette grande aventure et de Claudie Ouellet, Chloé Chagnon-Dumesnil, Micaël Carrier et Catherine Denis.

Ce projet a été financé par le Conseil de recherches en sciences humaines du Canada (CRSH) à travers une Subvention Développement Savoir et une subvention Connexion obtenues par la Dre Tremblay, et rendu possible grâce à une subvention Fonds des leaders de la Fondation Canadienne pour l’innovation (FCI) également obtenue par la Dre Tremblay. Ce projet a été grandement facilité par le centre de recherche CERVO , où est situé le laboratoire, ainsi que l’Université Laval.

Pourquoi SyllabO+ ?

À ce jour, très peu d’outils sont disponibles pour étudier l’utilisation du français québécois oral. C’est la complexité des étapes de création d’un corpus oral et le temps de travail nécessaire pour accomplir ces étapes qui expliquent la rareté des outils d’étude et de promotion de la langue orale. Afin de combler cette lacune, nous avons commencé en 2013 un vaste projet qui incluait la création d’un corpus et de bases de données permettant l’étude de la langue parlée au Québec en fonction des caractéristiques des locuteurs (âge et sexe) et des contextes de communication. En effet, le choix des mots varie en fonction du degré de formalité du contexte. Au Québec, par exemple, le mot « char » est souvent utilisé en contexte informel alors que les mots « voiture » et « auto » seront préférés en contextes formels. SyllabO+ contient les enregistrements de 225 locuteurs franco-québécois en contextes formels et informels. Ces enregistrements ont été transcrits en alphabet phonétique international (API) et découpés en syllabes.

 À partir de ce riche corpus, nous avons créé deux bases de données : une base de données des syllabes de la langue orale du Québec, et une base de données des phonèmes de la langue orale du Québec, afin d’étudier le rôle de ces unités importantes (syllabes et phonèmes) dans le traitement et la production du langage oral. Ces deux bases de données sont maintenant publiées (Bédard et al., 2016, Behavioral Research Methods). La base de données syllabique contient plus de 360,000 syllabes (dont 5,613 syllabes uniques), alors que la base de données phonémique contient 830,189 phonèmes (dont 49 phonèmes uniques). La plateforme web que nous avons créée permet de rechercher les syllabes (p. ex. « ba »), mais également des groupes de syllabes (p. ex. « ba-to »), ainsi que les statistiques d’utilisation qui leur sont associées, incluant la fréquence d’occurrence de chaque syllabe et de chaque phonème, la fréquence de cooccurrence de paires de syllabes, leur probabilité de transition et plusieurs autres statistiques.

En plus de faciliter la recherche sur le langage, incluant dans les domaines des neurosciences cognitives du langage, de la psycholinguistique, de la psychologie expérimentale, de la neurolinguistique, de la phonologie et de la phonétique, SyllabO+ sera également une source d’information utile pour les orthophonistes. En plus de fournir l’inventaire de toutes les structures (syllabes et phones) contenues dans la langue orale, SyllabO+ en quantifie l’usage selon l’âge et le sexe des locuteurs et le contexte de communication, et permet donc d’identifier les structures les plus importantes. SyllabO+ sera ainsi une source unique d’information pour l’élaboration de cibles d’intervention orthophoniques visant la réadaptation de la perception et la production de la parole. SyllabO+ sera également une source d’information unique pour la création de matériel d’évaluation, lequel doit être contrôlé en fonction de différents paramètres psycholinguistiques comme la fréquence d’utilisation. SyllabO+ permettra ainsi aux cliniciens et chercheurs de développer des outils d’évaluation et d’intervention plus contrôlés.

Développée dans une perspective d’accès libre, la plateforme SyllabO+ est maintenant en ligne ! Elle inclut les bases de données syllabiques et phonémiques.

Grâce à une deuxième subvention du CRSH obtenue en 2016, nous travaillons actuellement à l’ajout d’une troisième base de données, les mots et expressions de la langue orale Québécoise ! Nous avons reçu en décembre 2016 un nouveau financement du CRSH (via le programme Connexion) pour compléter ce projet. Les transcriptions orthographiques sont en cours de normalisation et les algorithmes en cours d’élaboration. Visitez notre site au cours de l’année 2017 pour obtenir des nouvelles de ces développements excitants !

Documentation

L’article décrivant SyllabO+ est maintenant publié! Téléchargez-le en cliquant ici.

Vous pouvez également consulter la documentation supplémentaire, telle que le protocole de transcription phonétique et de syllabation, la description des colonnes de chaque tableau de résultats avec le détail des calculs effectués, un petit guide d’utilisation avec des exemples, un document où se trouve un résumé des informations sur les enregistrements audio. Toute la documentation est disponible en français et en anglais.