Tests de localisation

Une prise de son coïncidente utilise les caractéristiques directives des microphones. La prise de son en biphonie se base sur des résultats psychoacoustiques. Les différences d’intensité entre deux canaux sont représentatives d’un angle de perception. A ce sujet, beaucoup d’études ont été menées, et l’on a accès facilement aux nombreux résultats les concernant dans des livres ou des publications[16][45].

 

Il existe aussi beaucoup de résultats concernant les courbes de fonctions de transfert de la tête suivant l’incidence du son et la fréquence[4]. Malheureusement ces résultats sont inexploitables pour le cas qui nous intéresse, c’est à dire les lois de panning à affecter à chaque paire d’enceintes dans une configuration 5.1. Les lois de panning mentionnées par les auteurs font plutôt référence à des lois mathématiques, afin de les implanter directement sur les consoles de production[43].

 

Il est donc nécessaire de connaître le plus précisément possible les différences d’intensité à affecter par paire d’enceinte pour une localisation précise. Pour cela des tests perceptifs seront mis en place. Notons que des résultats ont été publiés dernièrement par Woszczyk [51]après la décision de mettre le test en place. D’autres résultats issus d’une étude de Bruhnes [6]qui a aussi été effectuée au CNSM, apportent des informations intéressantes sur la localisation. Les valeurs de ces deux résultats seront comparées au chapitre .4.4.

.1       Choix du test

 

Un test psychoacoustique nécessite des conditions optimales pour sa fiabilité. Ici, on cherchera à déterminer l’angle azimutal ressenti par l’auditeur en fonction d’un stimulus sonore distribué avec des niveaux différents pour chaque enceinte. L’objectif pourtant simple, pose de multiples problèmes de fond pour sa validation. On citera tout d’abord  les différents problèmes inhérents à la réalisation du test puis on donnera les solutions pratiques choisies avec les conséquences qu’elles entraînent :

 

*   Quelle matière sonore doit être utilisée pour correspondre au mieux à des conditions générales ?

*   Quelles sont les enceintes les plus représentatives pour ce test ?

*   A quelle distance doit-on placer les enceintes de l’auditeur ?

*   Doit-on utiliser un local type pour effectuer cette expérience ?

*   Quelles sont les directives à donner à l’auditeur pour que la localisation ne soit pas faussée ?

*   Quelle durée doit-on prescrire à l’ensemble du test pour ne pas engendrer de fatigue auditive au sujet effectuant les écoutes ?

*   Comment le sujet doit-il juger l’angle d’incidence de sa perception auditive ?

*   Combien d’auditeurs sont nécessaires pour des résultats pertinents ?

 

Les réponses aux questions concernant le déroulement du test sont dictées par les résultats recherchés et par les conditions matérielles disponibles. On s’aidera des expériences relatives à des tests déjà effectués dans des conditions similaires.[6][27][51].

 

Le sujet du mémoire concerne une prise de son comparable à celle effectuée en biphonie, cela veut dire que les microphones auront une directivité constante sur tout le spectre audible. En conséquence, il ne sera pas nécessaire de faire des essais par bandes de fréquence. De même, la captation multicanale concerne la localisation du son en général. Pourquoi recréer ici artificiellement des salves de bruit ou autres stimuli représentant des caractéristiques particulières du son ? Le choix se finalisera donc sur un stimulus d’origine musicale qui est représentatif  des sonorités écoutées généralement. On reprochera tout de même à cette méthode, le fait de privilégier certaine zone formantique propre à l’échantillon musical.

 

Le morceau choisi est un passage chanté a cappella par Suzanne Vega, échantillon sonore ayant été utilisé avec succès pour d’autres travaux.[27][6]. Ce morceau à l’avantage de proposer un spectre plus étendu qu’une voix parlée tout en privilégiant les zones spectrales de la voix nécessaires à la clarté du message. Il contient des attaques intéressantes pour la richesse des transitoires. Devant la répétition successive du stimulus sonore pendant la durée du test, la musique offre un coté plus séduisant que des salves de bruit.

 

La restitution se fait sur les enceintes disponibles (modèle 4412 de JBL) présentant des réponses en fréquence et en directivité de qualité correcte. Peu de travaux concernent le choix des enceintes en restitution multicanale. Le choix est donc dicté par un modèle ayant des caractéristiques qui ne s’écartent pas trop de la moyenne (nombre de voies, directivité, encombrement, appairage entre elles, qualité générale). Il me semble que des études approfondies concernant la reproduction par enceintes du son multicanal en 5.1 donneraient des informations précises quant au matériel à retenir. Néanmoins, on se doute qu’une large directivité des transducteurs risque de perturber l’écoute en excitant davantage le local de reproduction augmentant ainsi la quantité d’énergie diffuse. Un pré test identique utilisant des Genelec 1032A donne des résultats similaires avec les mêmes sujets.

 

La distance entre les enceintes et l’auditeur dépend d’un compromis entre les dimensions des enceintes, le temps de réverbération du local, le volume du local et la sensation pour l’auditeur de ne pas être gêné par la présence des enceintes. Les tests se sont déroulés à la salle Schaeffer du Conservatoire National Supérieur de Musique de Paris. C’est une salle un peu réverbérante avec un temps de réverbération de 0.5s car de grand volume (500m3). Elle présente indéniablement des modes propres car la géométrie du local est de forme légèrement parallélépipédique. Les enceintes sont des trois voies avec des transducteurs qui ne sont pas placés sur le même axe de symétrie. Ce sont donc des enceintes de moyenne portée qui nécessitent d’être placées à distance raisonnable. L’angle de diffusion total est de l’ordre de 120° à 2 kHz. Les conditions d’écoute optimales ne sont donc pas réunies, néanmoins, malgré une sensation sonore très différente de celle effectuée au studio de production, les résultats de localisation convergent dans le même sens. Un local avec un temps de réverbération inférieur à 0.5s aurait été plus adapté mais s’apparente plus aux conditions d’écoute chez le particulier. Si la reproduction biphonique nécessite une certaine réverbération pour s’exprimer au plus près de la sensation voulue par le preneur de son, on doit réévaluer la question pour le multicanal si la volonté est de reproduire une écoute réaliste et localisable. Le rayon entre la tête de l’auditeur et les enceintes est de 3.2m ce qui est très proche de la distance critique dans cette salle. En augmentant le nombre de haut-parleurs, on atténue la clarté du local ce qui fait qu’une écoute plus proche des transducteurs ou un local plus mat auraient été préférables.

 

Un texte de préambule que l’on trouvera retranscrit en annexe permet de spécifier à l’auditeur les conditions du déroulement du test. Il lui conseille particulièrement de garder la tête vers l’avant durant la phase d’écoute. La perception de la localisation est totalement modifiée si l’on dirige sa tête vers la source fantôme. Il est recommandé aussi à l’auditeur de fixer une lumière clignotante matérialisant le point de référence frontale basée sur la médiane. Le repère visuel contribue à fixer une référence spatiale évitant ainsi des biais de perception déjà observés dans différents tests. La perception de la localisation auditive et visuelle est étroitement liée tant de manière cognitive que subjective. Des résultats expérimentaux prouvent que des tests effectués les yeux clos sont moins précis que si le sujet possède un repère visuel qui l’ancre dans l’espace[26].

 

La partie choisie pour le test dure 12s, elle est répétée deux fois consécutivement pour confirmer la première impression, et créer une sorte de préapprentissage. Une pause entre chaque test autorise une certaine relaxation et laisse un temps important pour juger de la localisation et inscrire sa réponse. Une pause trop longue pourrait déconcentrer le sujet dans la phase du test.

 

 La bande audio comprend 40 tests avec des localisations aléatoires pour une durée totale de 30 minutes. Ce qui fait que l’auditeur écoute 80 fois le même passage sonore. Le changement aléatoire de la direction du son émis requiert une concentration du sujet pour la perception relative de l’image fantôme ce qui coupe la monotonie évidente du test.

 

Les tests de localisation décrits dans la littérature font références à plusieurs méthodes pour le jugement angulaire de la perception. Une solution consiste à demander au sujet de se tourner vers la localisation présumée du son et de noter le numéro d’étiquette correspondant le mieux à sa sensation. Ces étiquettes fixées sur une corde à linge à la hauteur des enceintes segmentent la perception azimutale. Une autre solution est de faire correspondre une source réelle (petit haut-parleur ou petit instrument de musique) à la source fantôme perçue maniée par un manipulateur qui reportera lui-même les incidences angulaires ressenties par l’auditeur. Cette méthode nécessite beaucoup d’interactions, elle est très contraignante pour le manipulateur qui subit l’écoute obligatoire du test pour chaque individu. Une autre possibilité de jugement est possible en proposant un diagramme polaire comme feuille de réponse à la personne testée. Dans ce cas, il n’est pas nécessaire pour le sujet de pivoter afin de valider son choix. On peut craindre ici une imprécision supplémentaire due à l’abstention visuelle. Il aurait pu être intéressant de choisir une solution mixte comprenant la méthode des étiquettes et celle du diagramme polaire.

 

Le choix du test s’est porté sur la première solution : la division spatiale par pas de 5° à l’aide de 72 étiquettes numérotées. Il est aussi demandé à l’auditeur de spécifier l’étiquette représentant la zone centrale lors d’une perception apparente plus large que la résolution de l’étiquette. Dans le cas où l’auditeur serait dans l’incapacité de donner une réponse, on lui demande de noter un point d’interrogation.

 

.2       Réalisation pratique du test

 

Chaque étape du test correspond à une direction azimutale différente et la séquence du test est aléatoire. Une différence de niveau est appliquée aux paires d’enceintes relatives à la zone d’incidence. Une compensation de niveau est affectée aux deux canaux pour garder une sensation d’intensité sonore équivalente par la formule suivante :

 

                                                                             

 

Le support d’enregistrement est une bande magnétique HI8 au format D.A. de Tascam. Le montage et les ajustements de niveaux ont été réalisés à l’aide d’un DD1500 AKAI et diffusés par des enceintes Genelec 1037 via une console O2R Yamaha. Les annonces qui comprennent le texte de préambule et les numéros de chaque test ont été montés sur le DD1500.

Les différences de niveau utilisées (DI en dB) sont les suivantes et s’inspirent des résultats obtenus par Woszczyk [51]et Bruhnes [6]:

 

Pour l’avant entre –30 et +30°  : 15 , 10 , 5 , 0 , 3 , 6 , 12.

Pour l’arrière entre 120 et 240°:  17 , 14 , 11 , 8 , 5 , 2 , 0 , 3 , 6 , 9 , 12 , 15 , 18.

Pour le côté gauche entre 240 et 330° :  21 , 18 , 15 , 12 , 9 , 6 , 3 , 0 , 3 , 6.

Pour le côté droit entre 30 et 120° :  5 , 3 , 1 , 1 , 3 , 5 , 7 , 9 , 11 , 13.

 

La configuration en 5.1 étant symétrique, une redondance d’ordre deux apparaît quant aux résultats. Les différences de niveau utilisées pour la zone située à droite ne sont pas les mêmes que pour celles de gauche, afin d’obtenir une meilleure définition.

 

La reproduction de la bande HI8 s’effectue par une console 03D. Cette table de mixage sert à la distribution des canaux aux enceintes 4412 JBL et à la calibration des niveaux. Les amplificateurs sont de marque Crest. Une calibration est faite à chaque changement de configuration à l’aide d’un Audioprécision System One et du bruit rose à l’aide d’un micro 4006 de B&K placé à 1.5m.

 

Même s’il a été convenu de ne pas prendre en compte les variations de localisation en intensité dues à la fréquence, des tests complémentaires à vocation indicative concernant la partie spectrale ont été créés pour séparer la reproduction du test en deux zones :

*   Une partie basses fréquences avec un filtre passe bas du 2ème ordre coupant à 2kHz.

*   Une partie hautes fréquences avec un filtre passe haut placé à 1kHz.

Seule la partie test est filtrée, les annonces conservent leurs spectres d’origine. Le rendu sonore est encore intelligible avec les spectres tronqués.

 

De la même façon, un test complémentaire nous fournira des indications sur la robustesse du pan-pot dans une configuration 5.1. Les personnes testées seront décalées de 50 cm du centre idéal pour quatre directions : avant arrière gauche et droite par rapport à l’axe médian et transaural.

.3       Déroulement du test

 

Les résultats ont été saisis au fur et à mesure des tests permettant de connaître le nombre d’auditeur nécessaire à l’obtention de résultats convergents. Sur les cinq jours impartis aux tests d’écoutes, cette méthode m’a autorisé à l’élaboration de tests complémentaires. Ils concernent d’une part la perception de la localisation aux basses fréquences et aux hautes fréquences par filtrage du stimulus original et d’autre part, la robustesse des systèmes 5.1 par panning.

 

Les intervenants sont issus des étudiants et du personnel du Conservatoire de Musique de Paris, ils sont majoritairement très sensibilisés par le son et la musique. 40 personnes ont effectué le test dont 75% de sexe masculin. Ils proviennent des milieux suivants : preneurs de son professionnels, étudiants aux métiers du son, étudiants en musique, accordeurs de piano et des personnes dont la profession n’est pas liée à l’audio.

 

La phase de test comprend l’écoute proprement dite et un dialogue d’échange sur la perception individuelle de chacun.

 

Devant la constatation d’un décalage angulaire général de la perception latérale vers la gauche dans les résultats, la configuration des enceintes a été remaniée (rayon plus faible de 2.8m, recentrage et retournement du dispositif par rapport à la salle, nouvelle calibration). La déviation à gauche perçue a été légèrement réduite mais elle n’a pas disparue des valeurs résultantes. Cet écart est peut être issu des modes propres de la salle ou de la réponse en fréquence des enceintes.

 

.4       Résultats des tests

.4.1     Résultats d’ordre général

 

Hormis les résultats recherchés par l’expérience, les commentaires donnés sous forme écrite et par l’échange oral après le test sont des plus intéressants. La durée du test semble correcte, elle n’est jugée ni trop courte ni trop longue sauf pour un cas (durée trop longue) où le sujet se focalisait sur la première attaque du chant et négligeait le reste du message (notons que ses résultats concordent avec les autres). La répétition du même message sonore a gêné certaines personnes, principalement celles qui n’appréciaient pas particulièrement Suzanne Vega et ceux qui ont fait le test avec le spectre tronqué. Pour un auditeur, le test s’est avéré devenir un supplice.

 

Pour quelques auditeurs, la concentration imposée par le test est devenue éprouvante, ils avaient l’impression de ne plus être objectif à partir de la moitié du test. D’autres ont ressenti avec certaines séquences un son qui émanait de deux enceintes distinctes. En fait, ils percevaient grossièrement une image fantôme mais avec des zones spectrales de fréquence qui provenaient d’une enceinte précise. Phénomène ressenti dans l’aigu pour les attaques et les composantes sibilantes de la voix.

 

Aucune inversion de localisation avant arrière n’a été répertoriée durant le test. Cette constatation positive provient sans doute du contenu musical du stimulus comparé aux salves de bruits souvent utilisées. De plus, l’exemple placé à l’avant, permet de référencer qualitativement de manière cognitive l’auditeur sur la couleur du son. Le son latéral et arrière est détimbré naturellement par les HRTFs, il n’y a pas de confusion possible avec la référence préalablement entendue.

 

La perception de la localisation des sons émis par les deux enceintes arrières est  différente suivant les auditeurs (en proportion identique). Soit la perception est ressentie en élévation, soit à la hauteur des enceintes. Il est possible d’avoir deux perceptions différentes en se concentrant mentalement. Cela amène à faire une distinction entre les auditeurs sensibilisés aux écoutes électroacoustiques et ceux qui ont une écoute plus naturelle . L’ingénieur du son a appris à placer des sons dans un espace sonore qui n’est pas une représentation respectueuse de la réalité. Néanmoins, par apprentissage, il saura poser exactement des sources sonores à la position angulaire qu’il désire. On constate ainsi que les auditeurs travaillant en stéréophonie sont plus aptes à discriminer précisément en azimut une image fantôme. Les autres perçoivent une sensation dans la même direction mais qui pour eux, reste floue ou est perçue en hauteur.

.4.2     Résultats des tests avec le spectre tronqué

 

Les réponses données sont totalement similaires à celles du test global que ce soit pour le grave ou l’aigu. Ce résultat n’indique pas si la localisation en intensité est indépendante de la fréquence émise, mais elle nous informe de la similitude globale de sensation de la localisation en haute fréquence et en basse fréquence en bande large. Pour un confort d’écoute, les deux bandes passantes des filtres utilisés ne sont pas complémentaires car une zone de recouvrement de 1kHz existe. Il se peut que l’essentiel de l’information de localisation en fonction du morceau musical choisi se situe à cette frontière mais il est plus judicieux de croire que la localisation de la partie basse du spectre est de même ordre de grandeur qu’en haute fréquence ou que la largeur des bandes passantes est trop grande pour influencer le jugement.

.4.3     Résultats complets

 

Les résultats complets concernent les réponses à la perception de la localisation ressentie par les différents sujets. Tous les résultats ont été pris en compte même ceux qui semblent dévier anormalement de la tendance générale. Dans la mesure où le test a été effectué avec la même rigueur par tous les participants, il ne semble pas pertinent d’écarter certains mauvais résultats. La démarche inverse pourrait d’ailleurs être jugée non scientifique. N’oublions pas que la perception de la localisation d’une image fantôme n’est pas forcément similaire entre les individus.

 

On trouvera dans les pages suivantes, les résultats sous forme graphique. Tout d’abord des graphiques avec les moyennes, les écarts types ainsi que les minima et maxima des réponses angulaires dans les quatre quadrants formés par les paires d’enceintes. Ces mêmes moyennes seront représentées sous une forme repliée sur la médiane en raison de la redondance par deux du test. Les résultats seront ensuite mis sous forme graphique polaire pour une meilleure lisibilité et corrélation physique. On trouvera à la fin du chapitre une comparaison des résultats à ceux que l’on peut trouver dans la littérature. Les résultats des tests à spectre tronqué sont incorporés dans les tests complets.

 

Toutes les courbes présentées sont obtenues avec le panel complet des auditeurs. Pour les premiers graphiques, les points en forme de losange représentent les valeurs extrêmes, les marques en forme de trait symbolisent l’écart type centré sur la moyenne qui est caractérisée par les courbes continues. Les courbes de moyenne sont lissées.

 

figure 1.  Résultats du quadrant avant -30 à +30°

 

 

figure 2.  Résultats du quadrant latéral droit +30 à +120°

 

On remarque instantanément pour le quadrant frontal de la figure 1, une dissymétrie de perception entre la partie droite et gauche. Ce problème d’offset n’a pas pu être élucidé malgré un changement de placement d’enceintes et une nouvelle calibration. Ce décalage vers la gauche est de l’ordre de 5°.La courbe présente une allure assez linéaire avec des pentes variant légèrement et symétriquement en fonction des zones angulaires. L’écart type est très faible.

 

Le quadrant latéral droit figure 2 montre que les valeurs de différence d’intensité attribuées pour le test n’ont pas été bien distribuées, il aurait été préférable de travailler sur une gamme plus large s’étendant au moins jusqu’à 12 dB. Les écarts types élevés de l’ordre de 20° indiquent une faiblesse de localisation latérale. Les valeurs des minima et des maxima montrent la forte variance inter individuelle. La courbe moyenne ne présente pas d’accident notable hormis la valeur pour une différence d’intensité de 3 dB qui s’écarte de la tendance

 

La figure 3 représentant le quadrant arrière met en évidence le même problème, le mauvais choix des valeurs initiales affectées aux pan-pots pour la création des tests. On remarque un accident à 6 dB. Ces accidents émanent peut être de réflexions murales. La figure 2 et la figure 3, représentant les quadrants latéraux ont des écarts types beaucoup plus grand pour les angles situés au centre des deux enceintes. On retrouve ici les constatations de Theile[38].

 

figure 3.  Résultats du quadrant latéral gauche +240 à +330°

 

La courbe de la figure 5 est très régulière, il est presque surprenant de trouver une moyenne si régulière pour des sons qui émanent de l’arrière. La localisation est relativement stable entre individus avec la disposition des enceintes arrières du 5.1. On remarquera ici aussi un offset de l’ordre de 7° pour la position extrême de 180°. Les écarts types et les valeurs extrêmes sont beaucoup plus important que pour le quadrant avant et s’approchent d’avantage des données latérales. Ces quatre graphiques prouvent que la précision du jugement est plus fiable à l’avant, résultats se corrélant aux résultats de la discrimination angulaire en azimut. On constate aussi que la taille du quadrant est proportionnelle à cette précision.

figure 5.  Résultats du quadrant arrière +120 à +240°

 

figure 7.  Résultats du quadrant replié avant 0 à +30°

 

 

Les courbes de la figure 7 à la figure 9 montrent ces mêmes résultats repliés sur l’axe médian central. On visualise aussi la tendance linéaire qui est calculée en fonction des résultats repliés pour s’affranchir du décalage de perception de l’avant et de l’arrière. La tendance polynomiale d’ordre deux quant à elle, est une manière rapide d’obtenir des valeurs concernant la pente de la courbe.

 

Pour le quadrant frontal figure 7, la représentation n’est pas idéale mais les courbes de tendance donnent grossièrement les résultats désirés : une pente moyenne de 10° par une différence d’intensité de 5dB. On observe également une pente plus raide pour la zone angulaire proche du centre de l’ordre de 15° par 5dB.

 

figure 6.  Résultats des quadrants repliés latéraux de +30 à +120°

 

La tendance polynomiale se confond avec la moyenne pour les quadrants latéraux de la figure 6. Entre les résultats latéraux droits et gauches, aucun biais ne vient perturber les données et l’allure constante de la courbe est remarquable. On ne peut pas extrapoler les valeurs de différence d’intensité manquantes pour l’avant entre 30 et 40° car on se situe au niveau du coude où la courbe va rejoindre doucement sans jamais l’atteindre la position angulaire de l’enceinte avant. On a une pente de 30°/5dB pour la zone frontale et de 20°/5dB pour la partie arrière. Une différence d’intensité de 0dB correspond à un angle de 79° environ, valeur très proche du centre géométrique des deux enceintes qui est de 75°.

figure 9.  Résultats du quadrant replié arrière de +120 à +180°

Sur le graphique replié de l’arrière figure 9, les tendances du 1er et du 2nd ordre sont très semblables, cette pente continue nous informe que la progression est purement linéaire pour l'arrière. On lit ici, une pente de l’ordre de 20°/5dB.

 

Le Tableau 1 suivant récapitule les différentes asymptotes obtenues. Les quadrants latéraux et arrière ont des pentes plus raides mais elles ne sont pas totalement proportionnelles à la taille du quadrant. La perception latérale de la localisation nécessite des DI plus faibles.

 

Zone angulaire approximative en degré

Pente asymptotique

Enceintes concernées

0 à 15

15°/5dB

L et R

15 à 30

10°/5dB

L et R

30 à 90

30°/5dB

L et LS ou R et RS

90 à 120

20°/5dB

L et LS ou R et RS

120 à 180

20°/5dB

LS et RS

Tableau 1.  Résultat sous forme de pente angulaire en fonction des différences d'intensité

 

Ces résultats repliés sont maintenant interprétés dans leur ensemble à l’aide d’une visualisation polaire. On y trouve des représentations avec des axes linéaires permettant de détailler les résultats ainsi que des représentations logarithmiques sur une échelle de 30 décibels correspondant aux diagrammes polaires employés pour l’affichage de la directivité des microphones de qualité professionnelle. La visualisation en linéaire est plus claire mais n’est pas un axe représentatif de la perception auditive.

 

Sur les diagrammes polaires de la figure 8 et de la figure 9, les résultats apparaissent pour les quatre quadrants qui nous intéressent. Les symboles qui différencient les quatre courbes sont les valeurs de DI choisies préalablement pour le test. On voit que certaines zones angulaires sont plus détaillées que d’autres. On retrouve dans cette représentation le biais de perception à l’avant et à l’arrière. Hormis ce défaut, la symétrie de directivité est respectée. Comme on le pressentait, les diagrammes de directivités exigés pour la zone frontale sont plus directifs que ceux de la zone arrière.

 

 

 

figure 8.  Diagrammes polaires du test en valeurs linéaires


 


figure 9.  Diagrammes polaires du test en valeurs logarithmiques

figure 10.  Diagrammes polaires du test en valeurs linéaires comparés à des courbes théoriques

 

Nous pouvons maintenant comparer ces diagrammes aux directivités théoriques des différentes technologies de microphones. La clarté de vision obtenue par la représentation linéaire de la figure 8 nous autorise à superposer les représentations polaires souhaitées aux  directivités possibles (figure 10). Les courbes théoriques retenues pour cette comparaison sont celles du 1er et du 2nd ordre.. L’œil sert ainsi d’outil de comparaison entre les diagrammes. On choisira les directivités des microphones qui s’approchent le plus des résultats : cardioïde, hypercardioïde et second ordre simple. La visualisation des diagrammes utilise une routine Matlab .Pour une meilleure précision, les courbes suivantes sont représentées avec les résultats finaux repliés.

 

La courbe des données frontales superposée avec la courbe théorique du 2nd ordre de la figure 11 est d’une grande similitude et plus particulièrement pour la zone frontale comprise entre 0 et 30°. La directivité du 2nd ordre correspond à notre attente et elle sera retenue pour la suite de l’étude. L’axe du diagramme polaire théorique a été calé pour un angle de 45° pour épouser au mieux les contours de la courbe subjective, ce qui fait qu’il se confond avec le centre géométrique de captation égale à (90+120)/2-30 = 45°. Il faudra prendre en compte cette valeur lors de la prise de son pour se situer au plus près des résultats subjectifs. Cet angle correspond à l’angle physique de prise de son pour les microphones captant la zone frontale.

 

Les résultats du test concernant la captation arrière sont comparés avec les différentes directivités de la figure 12 à la figure 14. Pour la simulation cardioïde et du 2nd ordre, l’allure  des courbes comparées diffère sensiblement, des différences supérieures à 5dB sont constatées dans la zone utile avec le cardioïde et supérieures à 10 dB avec le 2nd ordre. La figure 13 montre qu’une directivité hypercardioïde se confond bien plus avec les résultats des tests. Le problème évident concerne le lobe arrière beaucoup trop important (6dB d’atténuation par rapport à l’axe) qui vient capter le son à –50° dans la configuration. Le 2nd ordre ne sera pas sélectionné pour la captation arrière, pas plus que l’hypercardioïde qui n’est pas conforme aux exigences du multicanal en raison de son lobe important, on gardera dans un premier temps la solution cardioïde. L’angle choisi pour la représentation des courbes théoriques est de 130° alors que le centre géométrique de captation se situe à 210/2+30=135°.

figure 11.  Comparaison des valeurs repliées du test et une directivité du 2nd ordre pour l'avant

figure 12.  Comparaison des valeurs repliées du test et une directivité du 2nd ordre pour l'arrière

figure 13.  Comparaison des valeurs repliées du test et une directivité hypercardioïde pour l'arrière

figure 14.  Comparaison des valeurs repliées du test et une directivité cardioïde pour l'arrière

 

 

.4.4     Comparaison avec d’autres résultats

 

Les résultats publiés concernant ce type de tests ne sont pas nombreux. En fait seul les récents résultats de Woszczyk [51]et de Bruhnes [6]existent à ma connaissance. Dans leurs études, ils se fient à la recommandation ITU[17].

 

Pour son test, Woszczyk utilise cinq canaux en incorporant l’enceinte centrale. Ce qui fait que ses résultats pour la zone frontale sont divisés en deux zones –30 à 0° et 0° à 30° et ne sont donc pas compatibles avec ceux obtenus dans ce mémoire. Les autres quadrants quant à eux correspondent tout à fait (choix de l’angle de diffusion des enceintes arrières de 120°). Le stimulus utilisé est une voix de femme enregistrée en milieu anéchoïque et cinq personnes ont effectué le test. La notation des résultats s’est faite à l’aide d’un tableur représentant un diagramme polaire.

 

Bruhnes ne fait pas l’étude du quadrant avant, il estime que ces résultats sont connus. Il utilise les stimuli suivant : impulsions de bruit rose, impulsion de grosse caisse et vibraphone. Son test est effectué par 10 sujets. Il recense en moyenne 15% d’erreur (des inversions notamment qui ne seront pas prises en compte dans les résultats). Les personnes testées n’avaient pas le droit d’utiliser les petits mouvements de tête et avaient les yeux bandés. Les éléments de comparaison sont les valeurs moyennes des résultats des trois tests. La méthode de détermination de la perception angulaire se fait par la méthode de la comparaison d’un son réel par rapport à la source fantôme. Voir chapitre .1. 

 

Une étude réalisée par West [43]recense quelles sont les meilleures lois de panning pour un environnement multicanal en 5.1. Des lois mathématiques affectées aux boutons de pan-pot des consoles numériques peuvent se rapprocher de la perception de la localisation. On comparera donc deux lois avec les résultats du test : une loi en sinus et une loi linéaire.

La loi en sinus est décrite ainsi :

 

 

j est l’angle de la source fantôme et j0, l’angle physique entre les deux haut-parleurs.

A et B sont les coefficients linéaires à affecter aux deux canaux sachant que leur somme est égale à 1.

 

La loi linéaire est :

 

              sachant que     

 

Le quadrant arrière de 120° n’est pas utilisable dans la formule en sinus car elle correspond aussi à un angle j0  de 60°.

 

On comparera aussi les résultats du test avec ceux largement diffusés dans la littérature concernant la zone frontale[4][45]. On comparera  les données de Mertens, de Simonsen et de Wendt.

figure 15.  Comparaison de divers résultats pour le quadrant frontal

 

Pour la comparaison des résultats pour le quadrant avant (figure 15), la pente est sensiblement la même pour la zone proche de l’axe. Les lois de pan-pot en linéaire et en sinus codent les différences d’intensité trop faiblement comparées aux données des résultats subjectifs. Les résultats de Mertens suivent de très près, les résultats obtenus ici. Ces résultats concernent ceux de la biphonie et il est étonnant qu’après des décennies d’utilisation, de telles variations de valeurs existent encore. On aurait pu s’attendre à des résultats plus proches les uns des autres car les prises de son en DI sont issues directement de ces données.

 

La figure 16 représentant les quadrants latéraux nous indique que la loi linéaire correspond mieux aux valeurs du test dans la zone centrale du quadrant que la loi en sinus. Les résultats se corrèlent assez bien avec ceux du test alors que ceux de Woszczyk semblent plus variables. Cette courbe capricieuse est certainement due au faible nombre de sujets. Paradoxalement, c’est pour ce quadrant que les différents résultats sont les plus proches alors que les divergences entre les individus sont les plus grandes.

 

Sur la figure 17, les résultats du test s’écartent très sensiblement de tous les autres. Est-ce que ce sont les conditions des tests (méthode et mode de notation) qui sont trop différents pour donner des résultats comparables ? Seul le test présent utilise l’interaction visuelle pour juger la  perception de la localisation. Mais des effets de salle ou le choix des stimuli contribuent peut-être aussi à ces variations. Les résultats du test seront conservés pour la suite du mémoire pour deux raisons : le nombre d’auditeurs est supérieur à celui des autres tests et les résultats ne possèdent pas d’inversion avant arrière. Remarquons tout de même la similitude entre les résultats de Bruhnes et la loi linéaire.

 

Ces comparaisons reflètent un triste constat : les variations des différentes courbes entre elles sont la preuve d’une non reproductibilité des tests subjectifs de la perception de la localisation en multicanal.

 

figure 16.  Comparaison de divers résultats pour le quadrant latéral

figure 17.  Comparaison de divers résultats pour le quadrant arrière

.4.5     Résultats concernant la robustesse

 

6 personnes ont effectué le test en étant décalées de 50 cm par rapport au centre ce qui correspond à 1/5ème du rayon environ entre l’auditeur et les enceintes. Aucune inversion de localisation n’a été recensée dans les feuilles de résultats.

figure 18.  Essai de la robustesse des lois de pan-pot

La figure 18 montre la déviation générée pour ces positions excentrées. Chaque courbe ne correspond qu’à un ou deux individus, les valeurs ne doivent donc pas être considérées comme des résultats globaux. On dira donc avec précaution que la position décalée de l’auditeur génère des écarts angulaires de perception qui sont de l’ordre de 50° en moyenne et qui peuvent aller jusqu’à 90° maximum. On peut aussi dire à la vue de ces résultats que les positions décalées sur le coté sont moins robustes. On peut l’expliquer par le fait que ces placements ne respectent pas le symétrie axiale de la médiane.

 

On remarque que la perception stagne sur des paliers à des angles précis (ceux des enceintes évidemment) mais que la perception de la localisation des sujets est continue. L’auditeur possède, compte tenu sa position décentrée une perception faussée certes, mais non corrompue par des changements de direction. On peut penser qu’avec des stimuli en mouvement, l’effet dynamique voulu sera encore ressenti.

 

.5       Conclusion du test

 

Refaire le test une seconde fois améliore les résultats. Cela met en jeu un apprentissage. La difficulté d’organiser un planning et le fait de ne pas contraindre les auditeurs volontaires à une deuxième écoute m’ont dissuadé d’imposer une seconde écoute.

 

Les résultats des tests sont globalement très satisfaisants, ils répondent à la question concernant la directivité des microphones à employer dans une prise de son multicanal en DI et nous renseignent sur l’angle physique de prise de son à utiliser.

 

La comparaison des résultats des différents tests montre une grande divergence. Les différents échantillons musicaux et sonores ainsi que les conditions d’écoutes variées en sont certainement les facteurs d’origine. Des moyennes décalées entre elles de plus de 20° sont inquiétantes en ce qui concerne la validité des courbes, une normalisation des conditions de test s’avère nécessaire pour une meilleure fiabilité.