Dis-moi quelle langue tu parles, je te dirais combien de voyelles tu as.

Vous avez peut-être été très surpris-es de savoir que le français ne comptais pas 5 ou 6 voyelles mais 14 ou 16 voyelles. Tenez-vous bien, dans les langues du monde il peut y avoir jusqu’à 50 voyelles !

Compter les voyelles est une question très compliquée dans les faits mais on peut trouver des langues possédant 2 voyelles seulement et d’autres possédant jusqu’à une cinquantaine de voyelles phonologiques. Toutefois, les langues possédant de nombreuses voyelles sont plutôt rares. En moyenne, les langues ont 11 voyelles, la médiane se trouve à 9 voyelles, et le mode à 6 voyelles.

Histogramme du nombre de voyelles par langue sur un échantillon de 2095 langues. Sur l’axe x le nombre de voyelles de 0 à 50 et sur l’axe y le nombre de langue de 0 à 450. Une ligne bleue indique un médiane de 9 voyelles, une ligne rouge indique en moyenne 11 voyelles et le mode à 6 voyelles. La distribution du nombre de moyenne est asymétrique, les langues tendent à avoir peu de voyelles.

Légende : Histogramme du nombre de voyelles par langue sur un échantillon de 2095 langues. La ligne bleue indique la médiane (9 voyelles), la ligne rouge la moyenne (11 voyelles).

Carte monde indiquant le nombre de voyelle par langue. Chaque langue est représentée par un point dont la couleur varie entre le violet foncé (peu de voyelles) et le jaune clair (beaucoup de voyelles). On note une majorité de points violets (peu de voyelles) en particulier en Australie. On que les langues d’Europe, d’Afrique et d’Asie tendent à avoir plus de voyelles que la moyenne. Sur le continent Américain (nord et sud) il n’y a pas de tendance aussi claire.

Légende : Carte monde indiquant le nombre de voyelle par langue. Chaque langue est représentée par un point dont la couleur varie entre le violet foncé (peu de voyelles) et le jaune clair (beaucoup de voyelles).

Alors pourquoi c’est compliqué d’estimer le nombre maximum de voyelles d’une langue ? Les critères de définition bien sûr ! Il faut définir des critères purement phonétiques qui nous permettent de définir si considère tel ou tel son comme une voyelle phonologique. Parmi ces critères, on trouve le timbre vocalique, la longueur vocalique et la qualité de voix. Bien sûr il y a des linguistes qui auront des critères différents des miens.

Le timbre en phonétique, c’est-à-dire l’impression auditive qui différencie le [i] dans <pile> du [y] dans <pull>. La différence de timbre entre un [i] et un [y] dépend des lèvres, si elle sont étirées pour [i] ou arrondies pour [y]. Donc pour les selfies, si on veut un grand sourire on fait [iiiiiiiiii], si on veut faire la bouche en cul de poule, on fait [yyyyyyyyyyyy] ! Le rôle des lèvres est un des paramètres qui permet de changer de timbre vocalique. Il y en a d’autres !

Pour varier le timbre on peut jouer sur la position de la langue dans la bouche, par ex. si on s’amuse à alterner <u> [y] et <ou> [u] sans pauses (u-ou-u-ou-u-ou …), la langue va d’avant en arrière (et les lèvres restent arrondies). On peut aussi s’amuser à alterner [i] et [a] (i-a-i-a-i-a), là on se rend compte que la bouche s’ouvre pour [a] et se ferme pour [i]. Chez le/la dentiste, bien entendu on va dire [aaaa] pour que le/la dentiste puisse bien voir la cavité buccale.

Il y a aussi la « nasalité ». Par exemple, « Un bon vin blanc », il y a les 3 (voire 4 selon les régions) voyelles nasales du français. La nasalité d’une voyelle, c’est le fait que l’air passe à la fois par le nez et la bouche. Si vous mettez votre main à la sortie des narines, vous sentirez le flux d’air nasal passer. Le « timbre » implique en fait un jeu de résonances acoustiques dans votre pharynx, votre bouche et votre nez. La résonance sera différente en fonction de la position de la langue, des lèvres et de si l’air passe ou non par le nez.

La figure montre différentes configuration buccales pour produire les voyelles orales du français et la figure suivante montre les résonances acoustiques correspondant à chaque voyelle.
La figure précédente montre différentes configuration buccales pour produire les voyelles orales du français et cette figure  montre les résonances acoustiques correspondant à chaque voyelle.

Légende : à gauche, les configurations articulatoires des voyelles du français « parisien » et à droite les résonances acoustiques correspondant à ces configuration.

Il n’y a pas que le timbre qui compte ! Il y a des langues qui utilisent la durée des voyelles (longues ou brèves comme le latin je crois) pour changer de sens. L’arabe par exemple est une langue qui a 3 distinctions de timbre vocalique [i a u] et des différences de durée, c’est-à-dire court versus long. L’arabe compte donc 6 voyelles phonologiques : [i a u] (court) et [i: a: u:] (long).

Pas tout à fait une distinction de durée mais les diphtongues (2 sons = 1 voyelle) et les triphtongues (3 sons = 1 voyelles) ! Par exemple, en Anglais les diphtongues sont phonologiques, elles changent le sens comme dans « pay » [phɛɪ] VS « pie » [phaɪ]. Est-ce qu’on considère qu’on a un seul son ou bien une suite de plusieurs sons ? Là encore, il est nécessaire de bien connaître la langue et de procéder à une analyse systématique sur tous ces types de sons pour savoir s’il y a diphtongue ou pas.

Le même timbre de voyelle peut avoir une durée plus ou moins longue mais peut aussi avoir une qualité de voix différente qui change le sens des mots ! C’est quoi ça encore !? C’est la façon dont on va façonner sa voix. On peut la souffler comme Jane Birkin ou la craquer comme dans l’exemple audio dessous. Dans certaines langues ça va donner des informations extralinguistiques (statut social, état de fatigue, états dépressifs), mais dans d’autres langues ça peut changer le sens d’un mot attention !

Légende : exemple de voix craquée en anglais « Thank you for considering me for this opportunity » (Merci de m’avoir pris en considération pour cette opportunité). On entend la voix craquée à partir de « considering me » jusqu’à la fin. (Source : Wikipedia1)

Il y a 3 qualités de voix communes : la voix modale (par défaut disons), la voix soufflée (Jane Birkin) et la voix craquée. Par exemple en Mazatec (Méxique), il existe une distinction phonologique entre la voix craquée et la voix soufflée. C’est-à-dire que l’utilisation de l’une ou l’autre va changer le sens d’un mot ! Par exemple, [ndæ̰] (craqué) signifie les « fesses » alors que [ndæ̤] (soufflé) signifie « cheval », ne vous trompez pas si vous allez à Oaxaca ou à Veracruz !

Légende : Signal sonore et spectrogramme de 2 mots du mazatec [ndæ̰] « fesses » et [ndæ̤] « cheval » (Source : Base de données de l’Université de Californie Los Angles2)

Par contre, il y a des langues qui utilisent encore plus de qualités de voix différentes ! C’est là que je vous emmène dans le désert du Kalahari (Botswana, Namibie, Afrique du Sud) à la rencontre du peuple « San » (Bochiman étant le terme du colonisateur). Le ǃXóõ [ǃχɔ̃́ː] est une langue passionnante. Elle est parlée par 2.500 personnes et tenez-vous bien … cette langue comprend 161 phonèmes ! (En français c’est une trentaine).

On compte 44 voyelles phonologiques. On compte seulement 5 timbres vocaliques [i e a o u] pouvant contraster avec différents types phonatoires basiques (modal; nasal; soufflé; pharyngalisé; craqué; sphinctérique ou strident/harsh) ou bien combinés (à la fois soufflé ET nasal, nasal ET soufflé ET pharyngalisé etc). Bref, avant de parler [ǃχɔ̃́ː], étirez vos articulateurs pour éviter un claquage vocal !

Dans tout ça, les linguistes s’intéressent à comprendre comment se structurent les systèmes vocaliques. Les systèmes les plus communs sont ceux avec 5 et 7 voyelles : [i e ɛ a ɔ o u]. Les systèmes à 3 voyelles ont généralement [i a u], si le système a plus de voyelles on ajoute des distinctions supplémentaires, bref versus long par ex. comme en arabe ce qui donne 6 voyelles. On peut aussi ajouter d’autres timbres ou bien différentes qualités de voix.

Ce qui est frappant, c’est que les systèmes vocaliques ne se structurent pas au pif de façon aléatoire mais qu’ils suivent des tendances « universelles ». Ce sont ces tendances universelles et tacites que les linguistes spécialisé-es en phonétique et en phonologie essayent d’expliciter pour comprendre l’évolution du langage, le changement linguistique et une partie du fonctionnement langagier.

Crédits :

Données quantitatives et géographiques : Moran, Steven & McCloy, Daniel (eds.) 2019. PHOIBLE 2.0. Jena: Max Planck Institute for the Science of Human History.

  1. https://en.wikipedia.org/wiki/File:Vocal-Fry-May-Undermine-the-Success-of-Young-Women-in-the-Labor-Market-pone.0097506.s005.oga ↩︎
  2. https://www.phonetics.ucla.edu/vowels/chapter12/mazatec.html ↩︎

En savoir plus sur Alexis Dehais-Underdown

Abonnez-vous pour recevoir les derniers articles par e-mail.