La prise de son immersive : Espèces d’espaces

Ambisoniques, harmoniques, sphériques

De plus en plus de contenus multimédia réclament un enveloppement sonore, souvent pour accompagner une image immersive. Les techniques de prises de son spatialisé ont évolué, mais aucun standard ne s’est encore véritablement imposé. Voici donc un passage en revue des applications, du questionnement esthétique possible et des principales technologies.

Les applications actuelles

– Radio

Ce média se présente comme une évidence et Radio France a un rôle extrêmement moteur dans le développement des technologies liées à la prise de son immersive. Avec les progrès de la diffusion binaurale(1), la demande en contenus sonores spatialisés augmente. Même si la discrimination avant/arrière reste toujours compliquée selon les individus, l’externalisation(2)fonctionne bien : c’est la spectaculaire valeur ajoutée de l’écoute binaurale. Hyper Radio (Radio France) et Arte Radio sont des piliers de ce type de diffusion.

– Cinéma, télévision

Le son spatial a toujours été d’actualité au cinéma, mais l’apparition de standards de diffusion de très haut niveau comme le Dolby Atmos ouvre le champ aux créateurs. La TV HD, elle, permet la diffusion d’un flux 5.1 ou binaural utilisé en particulier pour la captation d’ambiances d’évènements sportifs.

– Internet, réalité virtuelle et jeux vidéo

Depuis l’apparition sur YouTube et Facebook de vidéos 360°, la demande en contenus sonores immersifs a explosé. Cela explique l’apparition de matériel très bon marché, type Zoom H3-VR, permettant de réaliser des prises de son ambisoniques.

Les jeux vidéo sont souvent regardés de haut par les acteurs culturels habituels. Mais le développement de la réalité virtuelle initié par ce secteur a ruisselé en particulier sur les arts plastiques, avec le détournement de logiciels comme Unity(3).

– Théâtre

La composition d’univers sonores pour le théâtre a toujours fait appel à toutes sortes de technologies ; c’est le lieu du mélange. Le son immersif y a aussi sa place, en fonction de la scénographie du projet.

– Musique liveou enregistrée

Quelques contenus, mais c’est étonnamment le parent pauvre du secteur. Les artistes s’en empareront certainement bientôt, mais c’est une preuve que la composante spatiale n’est pas encore un facteur compositionnel évident.

Immersif : pour quoi faire ?

L’axe sera mis ici sur la prise de son, mais nous évoquerons forcément les procédés de diffusion associés. C’est en effet le nerf de la guerre commercial : comment l’utilisateur final écoutera-t-il le contenu ? Sur un set d’enceintes à géométrie variable ou bien tout simplement au casque ?

La tendance actuelle tend à montrer que l’écoute au casque prend le dessus, de part sa simplicité, et grâce au développement des techniques de binauralisation.

Selon Frédéric Changenet (Radio France), le son immersif a trois niveaux d’écoute :

– Le son “HD” : il est plus précis, plus défini ;

– Il permet de faire passer du sens : on traduit des aspects sémantiques par la spatialisation du son. Cela nécessite une écriture spécifique ;

– L’écoute n’a plus de frontalité, comme en réalité virtuelle. Un degré d’interactivité apparaît : c’est l’auditeur qui règle son propre cadre. L’écriture doit intégrer cette liberté de l’auditeur, mais en même temps chercher à la canaliser si besoin ; nous n’en sommes pour l’instant qu’aux balbutiements de cette esthétique.

En ce qui concerne l’aspect “haute définition sonore”, cela est confirmé par Michel Pierre, preneur de son de musique classique. “En stéréo classique, l’utilisation de micros d’appoint sert à palier des phénomènes de masquage fréquentiel. En multicanal, la séparation spatiale des informations permet de se passer ou de diminuer l’usage de ces appoints.”

Le son immersif se veut-il une reconstruction ultra-réaliste d’un environnement sonore ou bien une réinterprétation de la réalité, sans doute faussée, mais dont les codes nous permettent de rêver un peu plus ?

Quant au rapport à l’image, que ce soit au cinéma, au théâtre ou bien lors de captations de concerts, la cohérence des cadres visuel et sonore est sévèrement ébranlée. L’image projetée est frontale et plate, et ce qui se joue à l’écran est forcément dans un ailleurs. Même si au théâtre le public partage le lieu et l’acoustique de l’action regardée, cela n’est guère plus vraisemblable. Le off de l’action doit-il être le présent spatial du spectateur ? Ce questionnement de sens est souvent occulté par une jouissance esthétique qu’apporte le son immersif, bien compréhensible !

Seule, la réalité virtuelle porte en elle une réelle justesse, une cohérence entre le son et l’image.

Les technologies de prises de son

Deux grandes catégories de prise de son immersive s’offrent à l’ingénieur du son : coïncidente (ambisonique, DMS) ou non. Deux manières d’envisager la captation et la restitution de l’espace…

Nous citerons ici un grand nombre de procédés, mais nous n’en détaillerons que certains.

Tout d’abord, tant qu’à parler de son “3D”, évoquons les systèmes qui intègrent réellement l’élévation.

– Ambisonique

La théorie de Michael Gerzon décompose le champ de pression sonore en composantes harmoniques spatiales ; plus le nombre d’harmoniques est élevé (on parle “d’ordre”) plus la définition spatiale est fine. La captation se fait à l’aide de microphones multi-capsules plus ou moins coïncidentes.

Le plus grand nombre de microphones ambisoniques sur le marché est d’ordre 1 (4 capsules en tétraèdre par micro). Trois exceptions en HOA(4) : l’Eigenmike de MHAcoustics (32 capsules, ordre 4), répondant aux standards de l’audio pro, l’Octomic de Coresound (8 capsules, ordre 2) et le Zylia (19 capsules, ordre 3) plutôt destinés aux amateurs.

 

Nous avons rencontré Jean-Marc L’Hotel, un des spécialistes français du domaine. Il a réalisé en 2010 l’univers sonore du premier documentaire tourné, monté et mixé en ambisonique Je vous écris du Havre. Depuis, il ne cesse d’expérimenter autour de cette technique au travers d’œuvres sonores, d’installations, … L’ambisonique lui apparaît comme la technique d’enregistrement la plus souple : “L’ambisonique me permet de déplacer le point de vue sonore a posteriori ; c’est très riche en terme créatif”. De plus, la prise de son ambisonique permet de capter une scène sonore, le son et son contexte.

Comment choisis-tu l’emplacement de ton micro ?

Jean-Marc L’Hotel : Ce type de prise de son nécessite une attitude différente : toute la réflexion sur une captation classique est liée à sa diffusion sur une paire de haut-parleurs. En ambisonique, je change de schéma : l’endroit où je pose mon micro est celui où je trouve que le son est bon, sans casque. J’enregistre “dans” le son et non plus face au son. Sans casque, je ne suis plus coupé de l’environnement que je capte, j’en fais partie ; et les acteurs de cette scène à enregistrer acceptent d’autant plus ma présence. Ces nouveaux outils m’ont aidé à mieux comprendre mon travail.

Quels types de microphones utilises-tu ?

J.-M. L’H. : J’utilise toute la gamme de micros Soundfield (ST450, ST350, SPS200), des Sennheiser Ambeo, des Zoom H2n dont je récupère le signal AmbiX. J’aime faire de la prise de son en déambulation, donc les systèmes que j’utilise sont réellement transportables. Pour moi, les plus belles choses à trouver en son sont ces acoustiques que l’on traverse.

Quelles sont les évolutions notables ces dix dernières années ?

J.-M. L’H. : De grandes joies, et des peurs… Tout d’abord, il y a de grands progrès sur les plug-inde décodage, en particulier avec l’apparition du décodeur “Blue Ripple Sound”(5). Du côté matériel, c’est plus inquiétant… Beaucoup de micros de qualité inférieure apparaissent, c’est une bonne chose pour le développement de l’ambisonique, mais j’espère que cela ne tirera pas les meilleurs vers le bas.

– MMAD 3D

Michael Williams et Guillaume Le Dû ont développé le Multichannel Microphone Array Design qui permet d’associer de 2 à 11 microphones pour des prises de son surround 2D ou 3D.

Quels que soient le type et le nombre de micros utilisés, des abaques (logicielles) sont fournies pour donner les écartements et angulations des capteurs ; cela permet de créer un réseau microphonique pour lequel il n’y a aucun recoupement des angles de prise de son, et donc d’obtenir une reproduction de l’espace très régulière.

Le MMAD 3D dispose un système 4.0 additionnel placé à 1 m de hauteur par rapport au système horizontal.

 

La suite de cet article dans le N°224 de l’Actualité de la Scénographie > Acheter ce numéro