Un bref survol des systèmes de prise de son en 5.1 s’impose car les expériences sont riches en informations et certains résultats donnent des orientations de recherche à suivre ou à ne pas suivre sur l’aptitude du système d’enregistrement à respecter la localisation des sources.
Pour la zone frontale de captation, ce système est composé d’un triplet microphonique espacé entre eux de 1.5m à 2m. Les microphones sont omnidirectionnels et en raison de leurs écartements, ils ne sont pas adaptés à une bonne localisation : l’utilisation de trois capsules pour la reproduction frontale engendre trois images fantômes qui tendent à rendre plus confuse la précision [39](figure 1). Deux microphones placés à l’arrière servent à nourrir les enceintes surround afin d’assurer une compatibilité en 5.1. La distance séparant les microphones surround des principaux, permet d’ajuster l’image subjective de la prise de son. Ce système donne de bons résultats quant aux critères de spatialisation et du renforcement de l’image centrale.

figure 1. Formation de 3 images fantômes en DT
Le Fukada-tree est une variante de ce système qui reprend l’agencement des microphones en remplaçant les capsules omnidirectionnelles par des cardioïdes. La localisation est ainsi améliorée au détriment de la réponse aux basses fréquences inhérentes aux capsules directives.
Dans le mémoire d’Arnaud Mora et de Nicolas Jacques[27], le sujet est une prise de son en différence de temps pure basée sur un Decca-tree. Devant la constatation de résultats de localisation médiocres, ils améliorent progressivement leur modèle en ajoutant du codage en différence d’intensité. Ils utiliseront des microphones omnidirectionnels plus directifs (grandes capsules), qu’ils pointeront ensuite vers la source et, ils sous mixeront les voies surround afin de minimiser les inversions entre l’avant et l’arrière. Les écoutes finales leurs semblent satisfaisantes.
En tétraphonie l’enregistrement avec deux couples ORTF donne des résultats intéressants car il génère un codage frontal et arrière de la localisation. Cette captation est assez souple car la distance entre les deux couples a peu d’influence. L’interaction entre les deux couples contribue à recréer une spatialisation agréable. C’est une méthode de captation qui ne prend nullement en compte la localisation latérale mais qui devant la difficulté de perception de la direction des images fantômes dans cette zone[38], est certainement le système d’enregistrement multicanal donnant les meilleurs résultats en regard de sa facilité de mise en œuvre. C’est dans les situations où deux masses sonores seront réparties l’une à l’avant, l’autre à l’arrière que ce système donnera ces meilleures capacités (enregistrement d’un orchestre et d’un orgue dans une église par exemple). La restitution peut se conformer à l’agencement du 5.1 en éliminant l’enceinte centrale.
Une variante composée de deux couples MS[16], construit à base de la même capsule bidirective et de deux capsules directives dirigées de part et d’autre de l’axe de symétrie est une des solutions de prise de son coïncidente. Par rapport au couple ORTF, on regrettera l’impossibilité d’adapter le rapport de capture entre le champ réverbéré et le champ direct.
Les études liées à l’hexaphonie et la tétraphonie avec les enceintes placées en tétraèdre sont des études qui sortent du contexte 5.1.
Le travail de Guillaume Le Du [21]est intéressant, il utilise les résultats de la biphonie pour obtenir une bonne localisation avant. Il se base sur les résultats mixtes de la biphonie [45][46](prise de son en DT et DI), pour obtenir des angles de captation compatibles avec la diffusion. Le respect théorique des angles de pointage et des distances entre les capsules n’étant pas réalisable, il introduit un réglage supplémentaire. Cet ajustement se matérialisant par un décalage en distance qui introduit un offset temporel. Cela provoque une modification des références axiales. Ainsi le repère de l’axe central en DT est différent de celui du DI. Le nombre de combinaisons de codage possible augmente. Les valeurs à affecter aux différences d’intensité et de temps sont tributaires d’un nouveau paramètre et autorisent par ce biais à se rapprocher d’une configuration théorique idéale.
Les enceintes arrières servent à restituer l’enveloppement. Il constate que les capsules omnidirectives en 5.1 génèrent trop de diaphonie et ne permettent pas la perception de la latéralisation en multicanal. Il observe aussi que la distorsion angulaire entre 0° et 30° est réduite par l’utilisation de l’enceinte centrale.
Avec le système ASM5 commercialisé, Brauner propose un produit tout en un, composé de 5 microphones appairés. Chaque microphone possède une directivité ajustable du 1er ordre allant de l'omnidirectionnelle à la bidirectionnelle. Les microphones avants sont placés aux sommets d'un triangle rectangle et espacés de 17.5 cm du centre d'enregistrement. Chaque microphone « surround » est positionné à 60 cm vers l'arrière avec un angle de 60° par rapport à l'axe médian (voir figure 2).

Son intérêt principal est sa possibilité d'ajuster les directivités pour modifier la captation de l'ambiance de la salle où même de diriger une source lors de l’enregistrement.
Ce système offre ainsi à l'ingénieur du son, un outil pour l'expérimentation sonore et des possibilités artistiques étendues.
Ce microphone n'a pas pour vocation d'être fidèle au niveau de la perception de la localisation.
Dans le même esprit que Brauner, c'est à dire bénéficier d'une directivité ajustable au niveau de la console, Bruck a commercialisé avec Schoeps, une sphère de 18 cm de diamètre plus petite que celle utilisée pour les enregistrements biphoniques (20 cm) afin d'y loger de part et d'autre deux capsules bidirectionnelles. Ces deux capsules supplémentaires mixées avec les capsules omnidirectionnelles effleurant la sphère (principe de la prise de son M-S) permettent de créer 4 canaux audios individuels (voir figure 3).

Le canal central est fabriqué à partir des signaux gauche et droite à l’aide d’un matriçage emprunté à l’ambisonie. Ce microphone autorise le preneur de son à modifier les directivités pour s'adapter aux contraintes de la prise de son ou de régler la qualité sonore suivant ses goûts. La vocation de ce procédé est avant tout, un microphone de captation d'ambiance.
« The Holophone » est un produit commercialisé. Ce système est construit à partir d'une tête elliptique de 19 cm par 15 sur laquelle viennent se greffer 7 microphones omnidirectionnels (figure 4).

Ce système ne se base sur aucun principe ni aucune théorie, cela ressemble à une extension de la tête artificielle. Ce microphone est voué à une captation fortement génératrice de réverbération artificielle en raison de ces nombreux capteurs. Les courbes de directivité et les distances entre les capsules données par le constructeur ont des valeurs trop faibles pour une utilisation respectant la localisation.
C’est vers le début des années 70 qu’émerge le principe de la prise de son ambisonique. Issue de la métathéorie de la localisation auditive, elle propose un système de prise de son comportant un matriçage pour une diffusion sur un nombre quelconque d’enceintes à condition qu’elles soient placées à équidistance l’une de l’autre. La matrice de reproduction sera différente en fonction de la quantité d’enceintes et des indices de la métathéorie pris en compte.
La réalisation pratique du système de prise de son impose une restriction et une simplification très importante de la théorie (utilisation de la directivité du 1er ordre uniquement par exemple, la captation d’ordre 2 nécessite des microphones de directivité du second ordre non disponibles). La prise en compte de chaque nouveau paramètre conduit à des matrices non solvables et des simplifications sont nécessaires pour une application pratique.
Ces systèmes, pourtant précurseurs, tardent à s’imposer pour ces raisons ainsi qu’à cause du flou entretenu quant à la théorie et à la complexité de mise en œuvre. Des matrices offrant la compatibilité 5.1 sont d’ores et déjà disponibles pour les futurs DVD Audios. L’effervescence engendrée par ce procédé n’a pas permis d’obtenir à ce jour, de résultats subjectifs concernant la localisation.

figure 5. Capsules en montages tétraédrique
La figure 5, montre l’assemblage coïncident du microphone Soundfield, principal capteur acoustique de la prise de son ambiphonique. La distance entre les capsules autorise la restitution des fréquences jusqu’à 12 kHz sans aliasing spatial. L’ambisonie est tributaire d’un codeur et d’un décodeur.
L’holophonie est un des moyens de reproduction nécessitant autant de microphones que d’enceintes. Pour une recombinaison parfaite du front d’onde cette technologie demande une quantité de l’ordre de 250 haut-parleurs. Une captation acoustique qui sans le renfort d’une simplification drastique est actuellement irréalisable. De nombreuses études en cours vont dans ce sens. Notons que c’est actuellement la seule et unique méthode pour faire une reproduction tridimensionnelle sonore réelle car elle se base sur l’équation fondamentale de la propagation des ondes en acoustique.
La modélisation des phénomènes cognitifs et physiologique est certainement le seul moyen de rendre ce système viable en réduisant la quantité de matériel nécessaire.