AQ3   LA VOIX ET L’OUÏE

                                             AQ3.2 L'oreille externe et l'oreille moyenne
                                             AQ3.3 L'oreille interne
                                             AQ3.4 Sensibilité du système auditif humain
                                             AQ3.5 Niveaux physiques et niveaux physiologiques
                                             AQ3.6 Effet de la durée et du bruit sur la perception sonore

 

Il était difficile de décrire les phénomènes liés aux sons et à leur propagation sans évoquer le fonctionnement de nos propres organes nous permettant d’émettre et d’entendre des sons. Il s’agit bien sûr d’une description sommaire, mais qui met en évidence l’aspect subjectif de notre perception sonore.

En effet, quelque soit les démonstrations théoriques et techniques, notre perception sonore s’accompagne de critères subjectifs comme aigu - grave, fort - faible, harmonieux - discordant. De plus, les sons éveillent en nous des sentiments de joie, tristesse ou crainte qui vont entraîner des ordres d’action ou de défense.

AQ3.1  La production sonore humaine : La voix

Il est courant de séparer l’appareil de production sonore humaine en trois parties. L’appareil respiratoire tout d’abord qui forme avec les poumons un réservoir d’air. Seule l’expiration est contrôlée et contenue par la musculature de l’abdomen afin d’envoyer la quantité d’air nécessaire au fonctionnement de la production sonore.

La deuxième partie comprend le larynx, les cordes vocales ainsi que l’épiglotte. En temps normal, les cordes vocales sont relâchées et n’obstruent pas le larynx, ce qui permet le passage libre de l’air. Lors d’une émission sonore, les cartilages du larynx ferment les cordes vocales.

La pression de l’air dans le larynx augmente jusqu’à une valeur suffisante pour forcer les cordes vocales à s’ouvrir. L’air s’y précipite et la pression sous les cordes vocales retombe ce qui les referment. La pression remonte et le phénomène se répète périodiquement, ce qui met en vibration les cordes vocales. La force de tension qui maintient fermée les cordes vocales va déterminer la fréquence de la vibration.

La troisième partie est constituée de l’ensemble bucco-nasal, qui joue le rôle de résonateur et donc de filtre sonore. Le mouvement des lèvres, de la langue, du voile (qui fait intervenir la cavité nasale) et de la mâchoire inférieure va effectuer l’articulation proprement dite et produire la prononciation des lettres puis des mots, etc.

En phonétique (étude des sons du langage), les consonnes sont classées d’après les organes principaux qui sont en jeu; les consonnes bilabiales (p, b), labiodentales (f, v), dentales (t, d), palatales (l), vélaires (k, g), nasales (m, n), gutturales (r) et alvéolaires (s, z). Les consonnes se distingues des voyelles par la présence d’un obstacle qui empêche le libre écoulement de l’air.

Les voyelles sont formées essentiellement par la position de la langue dans la cavité buccale et par la forme de la bouche. Si le voile s’abaisse, une partie de l’air s’échappe par la cavité nasale et donne des voyelles dites nasales comme le " on " de bon.

Ce qui caractérise le timbre de la voix est la grandeur et la forme du filtre formé de l’ensemble bucco-nasal. Toutefois, nous pouvons admettre que l’ensemble des fréquences vocales varie de 50Hz à 8kHz environ. Les voix masculines et féminines se différencient par la fréquence fondamentale des cordes vocales: environ 130Hz pour les voix masculines et environ 205Hz pour les voix féminines.

 

AQ3.2  L’oreille externe et l’oreille moyenne

Nous entendons un son lorsque des vibrations de l'air ambiant atteignent notre tympan et le mettent en mouvement dans certaines conditions d'amplitudes et de fréquences. Cette stimulation mécanique provoque un phénomène électrochimique transmis jusqu'au cortex cérébral. Le résultat sera la perception du son.

Nous pouvons dire que l'oreille transforme l'énergie acoustique reçue d’abord en une énergie mécanique, oreille externe et moyenne, puis en une énergie électrochimique, oreille interne, qui sera transmise par le nerf auditif au cerveau de manière à engendrer une réaction.

L'oreille humaine se dissocie en trois parties correspondant chacune à un milieu de propagation différent.

   

 L’oreille externe

 L’oreille moyenne

  L’oreille interne...

  ... et milieu de perception

 ( acoustique)

  (mécanique)

 (transducteur mécanique-électrochimique)

 

L’Oreille externe comprend le pavillon, le conduit auditif long de 25 à 30 mm et 7mm de diamètre moyen. Du fait de sa géométrie, toutes les fréquences ne sont pas transmises de manière linéaire. Elle favorise les fréquences de 2kHz à 5kHz qui arrivent au tympan avec une intensité 2 fois supérieure à l’entrée du canal auditif.

L’Oreille moyenne transmet les vibrations du tympan à l'oreille interne. Les vibrations du tympan sont transmises mécaniquement par les osselets à la fenêtre ovale, qui correspond à l’entrée du colimaçon. La vibration mécanique est ainsi amplifiée d’environ quinze fois. Des muscles retiennent les osselets ce qui permet de limiter l’amplitude des déplacements lors d’une intensité sonore trop importante.

La cavité de l’oreille moyenne est maintenue à la même pression atmosphérique que l’oreille externe grâce à la trompe d’Eustache qui débouche à l’arrière de la cavité buccale, vers le pharynx. La trompe d’Eustache s’ouvre lors du mouvement de déglutition.

AQ3.3  L’oreille interne

Elle est composée du colimaçon (cochlée) et des canaux semi-circulaires. Ces derniers sont responsables de notre perception d'équilibre, en utilisant la propriété d'inertie cinétique d'un liquide.

Lors d’une accélération (ou décélération) par exemple, notre corps est soumit à une variation plus ou moins brusque. Nous savons qu’un liquide suit les mouvements avec une inertie plus grande que les solides. Cette inertie va incliner de petits cils qui transmettre à leur tour par des terminaisons nerveuses l’information au cerveau.

Le colimaçon se présente comme un tube conique enroulé qui contient un liquide appelé cochléaire autour d’une fine membrane de dimension variable. De cette membrane s'éloignent, par l'intermédiaire de cellules, environ trente milles fibres nerveuses formant le nerf auditif crânien.

Une vibration de l'étrier entraîne une déformation de la membrane basilaire mise en mouvement par les liquides formant la rampe (tube). La membrane, de part ses dimensions, vibre à son maximum à certains endroits précis et différents selon la fréquence du son responsable de toute cette agitation. Les cellules concernées (env. 100/mm ) transmettent des impulsions aux fibres nerveuses auxquelles elles sont rattachées.

AQ3.4  Sensibilité du système auditif humain

Notre système d’audition présente des performances remarquables. Nous sommes capables d’entendre des sons ayant une plage de fréquences couvrant quatre décades (10E4), soit de 20Hz à 20kHz environ et nous percevons ces sons pour une plage d’intensités très importante, d’un facteur de 10E14 environ, soit de 1pW/m2 à 100W/m2.

En soumettant des sons purs de fréquences et d’intensités variables auprès du plus grand nombre de personnes possibles, il en a été extrait la courbe de sensibilité (moyenne) de l’oreille humaine. Ce graphique met en évidence les limites minimales et maximales qui peuvent être admises. Il s’agit de la courbe du seuil d’audibilité et de la courbe du seuil de la douleur.

Des vibrations acoustiques en dehors de la zone audible sont également repérables. Il s’agit :

D’autres facteurs de perception sonore fortement subjectifs n’apparaissent pas sur ce graphique. Des propriétés comme le volume, la hauteur, la localisation ou le timbre sont utilisés pour exprimer la qualité d’un son. Par exemple, nous reconnaissons comme agréable un son composé d’harmoniques ayant des amplitudes spécifiques, alors qu’un autre est dissonant ou catalogué comme bruyant (voir signal acoustique).

De plus, notre système de perception nous permet de sélectionner certains sons dans un environnement remplis de sources sonores des plus diverses produisant un bruit ambiant. Sans toutes ces formidables facultés, beaucoup de sources sonores qui nous entourent nous seraient insupportables.

AQ3.5  Niveau physique et niveau physiologique

Il est d'usage courant d'exprimer la quantité d’un son, donc son intensité, en utilisant une unité logarithmique qui exprime ce qui est communément appelé un niveau acoustique N [dBSL] (SL pour Sound Level). Un niveau acoustique est obtenu par le rapport de l’intensité acoustique à mesurer Jmes. avec une intensité prise comme référence Jréf. tel que N = 10 × log Jmes. / Jréf. [dBSL]. Jréf. étant choisi au seuil d’audibilité à 1pW/m2.

Le tableau ci-dessous indique différents niveaux correspondants à des intensités de sources sonores auxquelles nous pouvons régulièrement être soumis.

 0 dBSL

 seuil d'audition  

 60 dBSL

 conversation vive

 5 dBSL

 chambre muette (anéchoïde)  

 80 dBSL

 rue bruyante

 10 dBSL

 laboratoire d'acoustique  

90 dBSL

 discothèque

 20 dBSL

 studio d'enregistrement  

100 dBSL

 marteau piqueur à 2 mètres

 30 dBSL

 résidence tranquille  

110 dBSL

 atelier de chaudronnerie

 40 dBSL

 conversation normale  

120  dBSL

 réacteur d'avion à 10 mètres

 50 dBSL

 musique douce  

140 dBSL  

 seuil intolérable

Pour affiner la mesure de perception sonore de l’oreille humaine, il est demandé aux personnes soumises aux tests d’indiquer pour diverses fréquences la même sensation d’intensité sonore. Il est noté ensuite la quantité sonore à fournir pour obtenir cette sensation constante.

Les diverses courbes du graphe ci-dessous indiquent les intensités requises pour produire la même impression sonore chez une personne. Les échelles verticales mettant en relation les grandeurs physiques avec les niveaux acoustiques.

   

Autrement dit, chaque ligne sur le graphique représente une intensité acoustique perçue comme d'égale valeur. Nous repérons qu’un son juste audible à 20Hz est en fait une vibration acoustique d'un niveau valant environ 80dBSL.

Ou encore, si nous désirons reproduire des sons, captés par un microphone, d’un niveau constant de 40dBSL sur toute la plage de fréquences audibles, il nous faut un système ayant une courbe de réponse variable en fonction de la fréquence.

Imaginons une chaîne audio ayant une réponse en fréquences qui corrige notre perception sonore. Cette courbe de réponse en fréquences, obtenue par la lecture du graphique ci-dessus, donne :

f [Hz]

D N [dB]

20

+60

50

+30

100

+20

200

+10

1k

0

2k

0

5k

0

10k

+10

Si nous désirons mesurer un local d'écoute avec un sonomètre de manière à obtenir un résultat identique à notre perception sonore, il faudra que le sonomètre aie une courbe de réponse qui tienne compte du graphique ci-dessus. Nous parlerons de filtres pondérés, ou de mesure pondérée.

L'étage numéro 3 ci-dessus représente le filtre de pondération. La courbe de droite est la correction pondérée de type A. En effet, la correction physiologique demandée par notre perception varie en foncon de l'intensité reçue, ce qui demande des filtres complexes. Pour simplifier la tâche, la commission CEI à élaboré des normes de pondération:

 
La capacité de percevoir des sons très faibles (1pW/m2 ) et de supporter des sons très élevés (100 W/m2 ) est possible grâce à l’action des muscles autour du tympan et des osselets de l’oreille moyenne.
 
 
La conséquence fait qu’une intensité augmentant dix fois nous est perçue que comme un doublement de l’intensité.
 
 
Par exemple, dix violonistes jouants en même temps donneront une impression sonore seulement deux fois plus élevées que si un seul violon était joué.
 
C'est ce qui a été appelé loi de Fechner.
 

D'une manière plus générale, nous pouvons dire que la plupart de nos sens réagissent de manière exponentielle (ou logarithmique) aux variations physiques de notre entourage.

Les amplificateurs et autres éléments d'une chaîne audio nous proposent des corrections du signal transmis afin d'adapter la composition en fréquences en rapport avec les courbes de perception de l'oreille. On parle de correction physiologique, ou encore de LOUDNESS. Chaque fois, ce sont des corrections de tonalité dépendantes de la fréquence qui corrigent les " défauts " de notre perception sonore.

 

AQ3.6  Effet de la durée et du bruit sur la perception sonore

L'étude des sons et bruits de durée brève ou "clic" montre que l'intensité subjective de la perception qui en résulte (étude de comportement à une stimulation) varie en fonction de la durée de l'onde sonore.

Un son d'une durée de 200ms environ est le mieux perçu par notre cerveau, puis notre perception décroît lentement.

La rapidité avec laquelle nous percevons les sons est importante pour réagir correctement, en cas d’urgence par exemple. Nous identifions, localisons et réagissons de manière parfois instinctives, ce qui met en jeu des réflexes " automatiques ".

Si un son (désiré ou non) dure très longtemps, notre cerveau est capable d’ignorer cette information sonore fournie par notre système auditif qui lui est incapable d’isoler.

Ce qui peut diminuer notre rapidité de perception et entraîner des dangers, professionnels notamment.

Dans le milieu ambiant où nous sommes‚ des vibrations sonores de toutes sortes existent dont la composition en fréquences rempli tout le spectre audible et dont les amplitudes peuvent être variables : C'est une définition du bruit.

En représentation temporelle, le bruit est dessiné par une bande large, ci-dessous en grisé, et en représentaton spectrale par un rectangle couvrant toute la plage de fréquence, également en grisé.

           

Si la quantité de bruit est trop élevé ou la durée de l’exposition trop longue, des sentiments de gêne, de douleur ou simplement de fatigue peuvent se faire sentir.

Ces mesures et études sur les réactions humaines permettent, en technique, d’adopter des normes (ISO, CEI, etc.) et d’établir des courbes de réponses normalisées. Certains signaux acoustiques, comme le bruit créé électroniquement illustré ci-dessous, permettent différentes mesure; mesures de salles de concert, mesures de réponses en fréquences, etc.

Par chance, il nous est possible de localiser une source sonore dans l'espace et de distinguer ou d'isoler une petite zone si notre attention n'est pas (trop) perturbée. Ce qui nous permet concrètement de suivre une conversation dans un milieu sonore ambiant dont le bruit est d'amplitude pourtant fortement élevée. En fait il a été constaté que le bruit ambiant était d'autant plus gênant que les fréquences le composant étaient basses ou voisines des fréquences du signal utile (généralement voisines de 1 à 2 kHz).

Nous pouvons représenter le signal de sortie d'un amplificateur, par exemple, juste au moment du début de la première note de la musique écoutée.

 

L'écart B représente la valeur crête à creux du bruit ou souffle, et l'écart S la valeur crête à creux du signal dit utile.

 

Un son d'amplitude B, présent dans le signal S, couvre l'amplitude des petites variations, provoquées par les harmoniques et par les fréquences élevées, d'un signal S.

Ces petites variations (Smin) ne seront plus perceptibles.

 

 

Le rapport S/B exprime l'écart maximal, également appelé la dynamique du signal.