Acoustic passion

Acoustic passion

2- Perception du son

Dans cet article je vais tenter de donner les bases de la psycho acoustique concernant la perception du son. Les points abordés seront la perception en fonction de l'intensité/fréquence du son, et la psycho acoustique sur la localisation de l'origine d'une onde sonore par le cerveau.

1- Perception intensité/fréquence

Je renvoie sur ce site qui explique très bien la perception sonore :


Concernant la dynamique sonore (plage entre le son le plus faible perçu et le son le plus élevé perçu) vous remarquez donc qu'elle s'étend environ de 65dB à 130dB pour un son de 20Hz, soit une dynamique de 65dB, alors qu'elle s'étend approximativement de 0dB à 120dB pour un son de fréquence 1000Hz, soit une dynamique de 120dB...

Ainsi, cela implique que 2 sons de 20Hz et 1kHz joués à 100dB à intensité égale (perçus donc à la 10ème courbe soit 100 phones) et joués par un système parfaitement équilibré à "cette" intensité sonore, sera également perçu à 100 phones.

Cependant, si le son est à présent diminué de 60dB et donc reproduit par le même système sonore à 40dB, le son à 20Hz ne sera plus du tout perçu (en dessous de la courbe d'audibilité) alors que le son de 1khz sera toujours perçu à 40 phones (soit je crois 6 fois moins fort que précédemment, et 4 fois supérieur au minimum audible à cette même fréquence).

Il y a donc un problème. Ce problème est que pour diminuer le son de 40dB et conserver l'authenticité de perception sonore, il faut tenir compte de la variation de perception en fonction de la fréquence et ce par rapport à l'intensité d'enregistrement !

En effet, si l'intensité sonore de l'enregistrement n'est pas connu, on ne peut savoir à quelle intensité reproduire ce même enregistrement. Et comme on ne peut savoir à quelle intensité le reproduire, on ne peut savoir comment corriger l'intensité de chaque fréquence.

L'article suivant étudie propose un algorithme à ce sujet, je crois qu'il permet d'évaluer l'intensité accoustique de l'enregistrement et également les pics sonores "perçues", mais je n'ai pas encore pris le temps de me pencher sur ce sujet : http://webs.uvigo.es/servicios/biblioteca/uit/rec/BS/R-REC-BS.1770-1-200709-I!!PDF-E.pdf

Comme on peut le constater c'est un problème relativement important qu'on ne peut ignorer, et ce n'est pas un égaliseur (même dynamique) qui corrigera ce problème...

2- Localisation psycho acoustique

C'est une des parties les plus complexes ! (ce qui explique aussi sa négligence dans les systèmes hi-fi).

Voici encore un lien d'un site très complet et très bien expliqué sur ce sujet :


Comme on peut le voir, le cerveau décrypte l'information sonore qui lui parvient selon de nombreux paramètres qui lui permettent de localiser l'origine de l'onde sonore qui lui parvient.

On retiendra ces 3 paramètres :

1 et 2 - "L'intensité perçue et le temps de réception. La différence de trajet d'une oreille à l'autre permet de savoir si la source est plus à gauche qu'à droite. Les limites de la différence en intensité sont de l'ordre de 7dB et en temps de l'ordre de 0,7 ms. "

3- "La différence de timbre entre les sons captés par chaque oreille. Il y a des diffractions sur le nez, les pommettes et les pavillons qui colorent le son en fonction de l'incidence du son. Le cerveau peut décrypter ces informations pour localiser la source.
La localisation sur les côtés de la tête est très mauvaise car l'une des deux oreilles est vraiment masquée, l'adaptation sera de tourner la tête dans la direction générale perçue pour affiner la localisation."

3- Problème de reproduction stéréo

En reproduction stéréo, 2 paramètres sont plus ou moins respectés : la différence d'intensité perçue et la différence de temps de perception entre les 2 oreilles. Plus ou moins pourquoi, car en réalité il y a des ondes sonores du haut parleur gauche qui parviennent à l'oreille droite, et des ondes sonores du haut parleur droite qui parviennent à l'oreille gauche. C'est appellé le "cross-talk", et expliqué également ici :


Pour ceux qui ne comprennent pas l'anglais, vous voyez sur le premier schéma le son généré par une guitare à 45° d'azimut par rapport à l'auditeur. Chaque oreille percoit l'onde sonore avec un décalage temporel (déphasage), une modification de timbre (filtrage HRTF entraîné par la tête, l'oreille etc.) et une différence d'intensité dû également à la tête (les basses fréquences sont moins affectés car elles peuvent traverser plus facilement la tête et donc parviennent moins atténuées).

Dans une reproduction stéréo, chaque haut parleur génère 2 signaux (le haut parleur un signal d'intensité supérieure pour "imiter" la différence d'intensité sonore perçue dans le cas réel) cependant chaque onde parvient à chaque oreille, et ce pour les 2 hauts parleurs. Il en résulte qu'au lieu de percevoir 2 signaux (1 par oreille) chaque oreille perçoit 2 signaux (les signaux en pointillés sont les signaux indésirables, non-présents à l'enregistrement).

Le procédé utilisé dans l'expérience n°2 de l'article précédent permet donc d'éliminer cet effet de "crosstalk", et donc d'améliorer la perception spatiale sonore (lien vers le site décrivant l'expérience). On voit bien que la perception est beaucoup plus naturelle et nettement amélioré lorsque ces 2 signaux n'existent pas : en effet bien que les 2 hauts parleurs soient situés en face de l'auditeur, le son semble provenir jusqu'à 60-70° de côté au maximum !

4- Tous les paramètres comptent !


On peut se poser alors la question, pourquoi après avoir éliminé ce problème d'interaural cross-talk, le son ne peut pas sembler provenir complètement de côté ?

La réponse est très simple : tous les paramètres qui rentrent en compte dans la localisation d'un son par le cerveau ne sont pas respectés.

* Dans le cas d'un stéréo sans séparation des 2 champs sonores gauche/droite, le cerveau détermine très précisément la largeur sonore comme étant situé entre le haut parleur gauche et droite au maximum, en passant par leur milieu. Cet effet est dû à l'interaural cross-talk.

* Après séparation de l'interaural cross-talk, l'image perçue s'étend de 60-70° par côté et passe par leur milieu. Ceci dit, la localisation est parfois imprécise (en général l'incohérence vient de l'enregistrement, par exemple un effet sonore stéréo mal fait ...)

* Dans le cas du casque stéréo, le cerveau localise le son comme allant de l'oreille gauche à droite, en passant par le centre de la tête.

C'est dans ce dernier cas qu'on comprend mieux l'importance du dernier paramètre, qui n'est respecté dans aucun des 3 systèmes : le filtrage HRTF.

En effet un son provenant de côté subit des déformations importantes dans les hautes fréquences, dû à son passage par l'oreille externe jusqu'au tympan (diverses diffraction, réfractions qui entraînent un filtre en "peigne", appellé plus communément "comb-filtering"). Si ces déformations sont absentes (par exemple dans le cas d'une écoute avec casque ou écouteurs), le cerveau n'est pas leurré : il se rend compte que l'onde sonore n'a pas subit la transformation qu'un son qui parviendrait normalement de côte devrait subir, et déduit donc, puisqu'il ne peut localiser son origine, que le son provient de l'intérieur de la tête.

Problème identique dans le cas du stéréo, ou dans le cas légèrement amélioré du stéréo avec annulation de l'interaural cross-talk, le son provient de face et subit donc les déformations d'une onde qui provient de face. Le cerveau est leurré car les 2 premiers paramètres sont cohérents, cependant quand le paramètre du filtrage HRTF devient trop incohérent (à partir de 60° de côté), bien que les 2 autres paramètres soient cohérents, il juge la localisation incohérente et limite donc sa position à ce maximum.

Pour reconstituer donc un son cohérent et naturel, tant au niveau de l'intensité de perception de chaque fréquence, mais également au niveau de la perception spatiale des sons, il est donc nécessaire :

- de respecter la même intensité de reproduction sonore que l'intensité d'enregistrement (et en cas de variation d'intensité de reproduction, varier l'intensité de chaque fréquence selon les courbes d'isosonies)

- de respecter également les 3 paramètres utilisés par le cerveau pour localisé l'origine des sons qui nous parviennent cités en 2-

Je rajouterai un dernier paramètre, qui est celui de la réverbération, mais qui fera l'objet d'un prochain article car cela nécessite une explication plus poussée ! On se contentera pour l'instant de considérer que le son reproduit ne contient pas de réverbérations supplémentaires (et donc que l'écoute se fait idéalement dans une chambre anéchoïque)


03/01/2010
0 Poster un commentaire

Inscrivez-vous au blog

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 4 autres membres