Le mapping vidéo : état des lieux autour du travail de Cosmo AV

Spectacles, événements, communication d’entreprises, parcs d’attractions, télévision, le mapping vidéo sous toutes ses formes et dans toutes ses dimensions est partout. À la croisée des chemins, c’est à la fois un nouveau média populaire et branché, un espace de recherche et de création artistique, un support de communication et de marketing publicitaire. Sa diffusion semble s’accroître sans cesse, tandis que les technologies se démocratisent et que les équipements deviennent de plus en plus accessibles.

Pierre-Yves Toulot est un acteur majeur de la discipline en France et a embarqué dans cette aventure dès les prémices. Cela en fait l’interlocuteur idéal pour une discussion à bâtons rompus sous forme d’état des lieux.

Tour Eiffel, 2009 - Photo © Cosmo AV

Tour Eiffel, 2009 – Photo © Cosmo AV

Formé à l’ENSATT de la Rue Blanche, il s’oriente d’abord vers la conception lumière, pendant dix ans, pour le théâtre, la danse, le cinéma et l’éclairage architectural, tout en s’initiant progressivement à la vidéo. Il fonde Cosmo AV avec José Cristiani en 2003, une structure dédiée à cette nouvelle activité parallèle, d’abord pour le spectacle vivant, des comédies musicales à l’époque. L’activité s’intensifie rapidement et se diversifie : événements privés, petites entreprises, puis projections architecturales à partir de 2007, et enfin cérémonies, événements sportifs, télévision et muséographie depuis 2010. Les projets s’enchaînent et propulsent la société sur les plus gros événements, en France et à l’international, comme les cent-vingt ans de la Tour Eiffel en 2009, en collaboration avec Christophe Berthonneau du Groupe F. “On gérait la partie contenu vidéo, la création, la réalisation, et le design technique du dispositif. C’était une époque où les choses s’inventaient au fur et à mesure qu’on les faisait. Les vidéoprojecteurs n’étaient pas conçus pour ça ; projeter avec un angle de 60° vers le plafond, en mode portrait… Il n’y avait pas à l’époque de serveurs capable de gérer de la 3D et il a donc fallu travailler avec des développeurs pour l’intégrer dans des média serveurs. C’est pour ça qu’on est très impliqué dans la technologie. C’est aussi ma passion, cela m’a toujours intéressé de profiter des spectacles pour tester des nouvelles technologies, pour élargir la palette… De manière générale, sauf rares exceptions, on fait toujours les préconisations techniques. Comme un éclairagiste qui demande tel type de projecteur, installé à tel endroit, …

En 2017, il fonde la société Whatsit : “Je souhaitais faire profiter à d’autres studios et structures de tout ce qu’on a dû inventer pendant ces seize années au sein de Cosmo AV et proposer de manière indépendante toute l’expertise technique et technologique sur le vidéo mapping”.

Cette structure lui a permis de porter deux projets en particulier :

– Lumings, un outil d’implantation vidéo pour simuler de la manière la plus réaliste possible le rendu technique d’un mapping en vidéoprojection ;

– Showviz, une plate-forme de travail collaborative pour les créateurs de spectacles, qui permet de simuler sur une maquette virtuelle tous les corps de métier en même temps : scénographie, pyrotechnie, écran d’eau, chorégraphie, lumière, son, mapping vidéo.

Il vient enfin de créer il y a un mois la société Intensity, une plate-forme à destination des concepteurs lumière, dédiée à l’éclairage architectural, en exploitant de la lumière digitale “du vidéo mapping qui sert à éclairer, tout simplement. Ce sera la nouvelle source de lumière pour l’architecture. On souhaite développer un dispositif complètement pérenne et qui se manipule aussi simplement que l’éclairage architectural classique. La gestion de contenus et de scénarios permettra de concevoir l’éclairage à travers cette plate-forme. D’autres structures travaillent déjà sur les prochaines sources vidéo, avec des technologies laser, des têtes déportées, étanches, compactes, puissantes, qui pourront être aussi simples à installer que ce qu’on peut faire aujourd’hui en éclairage architectural, sur des mâts par exemple”.

On le met à toutes les sauces… Qu’est-ce que le mapping vidéo ?

Pierre-Yves Toulot : Scénographie d’images, images monumentales, architecturales, tout ça c’est du vidéo mapping. J’ai participé à des conférences sur le sujet avec d’autres, avec des visions un peu différentes, mais à la fin on se rejoint sur le fait qu’il y a des volumes et que c’est souvent en live, pour un public. C’est de l’image qui habille les volumes. Il y a un lien avec la scénographie, on parle beaucoup en ce moment de scénographie lumineuse ou de scénographie d’image. C’est peut-être même la meilleure définition : c’est une idée classique de scénographie et du trompe-l’œil, un de ses thèmes anciens. Je suis plutôt pour une vision très large, on peut aussi intégrer l’utilisation d’écrans LEDs, selon le dispositif qu’on exploite. On parle d’ailleurs de LED mapping, il y a donc bien un lien évident.

C’est un sujet qu’on va bientôt pouvoir mieux développer puisqu’on est en train de monter la fédération professionnelle de vidéo mapping. On vient d’organiser les premières réunions. L’idée est de réunir tous les studios, les Français au moins et les freelances, autour d’une fédération professionnelle qui permettra justement de mieux définir, pour expliquer ce qu’est le vidéo mapping à des producteurs, à des acteurs publics ou privés, et pour défendre un peu nos droits. Mais aussi avancer sur la pédagogie pour que des gens se forment au vidéo mapping ; il y a un manque énorme de gens compétents pour travailler plutôt sur la partie graphique mais aussi technique.

Volver

Quelles sont les étapes d’un projet de vidéo mapping ?

P.-Y. T. : Il faut dès le départ s’assurer qu’on sera capable de produire la chose artistiquement et techniquement. On commence donc par définir une base artistique, ce qu’on doit raconter et comment on va le raconter, avec un kit technique. Cela donne le cadre de production dans son aspect financier et technologique. Est-ce qu’on a la technologie suffisante, est-ce qu’il y a des choses à améliorer, à développer ? Artistiquement, quel est le niveau d’exigence d’écriture, le niveau de production en termes de nombre de métiers qui vont intervenir sur la réalisation du contenu ? Est-ce qu’on doit mettre en œuvre de l’interactivité ? Une 3D lourde, détaillée, ou une 3D simple, ou pas de 3D du tout… ?

On passe ensuite à la modélisation des volumes, du support, qu’il soit architectural ou scénographique pour construire ce qu’on appelle pixel map, ou canevas, ou encore mire, qui donnera le support à la réalisation de l’image. Historiquement, on prenait des photos du point de vue des projecteurs et du point de vue du public. En redécoupant toutes ces photos en petits morceaux, et en les recollant sur une seule image, on arrivait à en faire un canevas de travail efficace et rapide. On continue à utiliser souvent cette technique car c’est quand même la plus souple. Mais avec l’arrivée des médias serveurs avec de la diffusion 3D, un outil très pratique, on passe de plus en plus par la modélisation des sites. On utilise des scans 3D, voire de la photogrammétrie (technique utilisant la parallaxe obtenue entre des images acquises selon des points de vue différents, pour reconstituer le relief de la scène). On a utilisé aussi des drones pour des zones aveugles depuis certains endroits. Le système avec les photos est adapté si on sait où sont les vidéoprojecteurs. Mais si on a des doutes sur la position finale, pour des problèmes techniques, d’autorisation ou d’approvisionnement en matériel, c’est plus souple de partir d’un modèle 3D et de définir par la suite les positions.

Le canevas est le lien entre l’artistique et la technique, il sert à la fois à construire le contenu et pour la diffusion. Les modèles 3D sont très pratiques pour la diffusion, mais le plus souvent on reprend des photos virtuelles de ces modèles pour réaliser le contenu qui n’a pas forcément besoin de la 3D.

Pendant ce temps, on avance sur l’écriture. On travaille sur la narration, sur les choix esthétiques et le rythme du futur spectacle. C’est aussi la phase de recherche et de test d’animations, des étapes qui sont très proches de celles du film d’animation, avec les mêmes outils. On réalise un storyboard d’animation, on voit déjà les couches d’animations apparaître, on distingue ce qui est de l’élément de synthèse… Une fois que la trame est définie, on commence à travailler sur les rythmes, les enchaînements. Dans le vidéo mapping, ce sont souvent les enchaînements qui sont les plus spectaculaires, les plus surprenants.

Quand cette trame est complète, séquencée, découpée, maquettée pour certains éléments en termes de graphismes ou de sons, c’est là qu’interviennent les gens plus spécialisés dans l’image. On fait un découpage technique, en termes de ressources : telle personne en 3D, telle autre en effets spéciaux, le 2D, le matte painting, … Les tâches sont réparties en fonction des éléments à produire et un chef de projet devient le garant du scénario, de la qualité de l’animation ; il va coordonner tout ça jusqu’au compositing final : toutes ces couches, tous les éléments fabriqués doivent être assemblés, pour produire ce qui avait été imaginé dans le scénario.

On utilise un outil appelé l’animatique qui est une maquette du projet, une trame graphique et animée nous permettant de vérifier les durées, les longueurs, avec des images fixes au départ, remplacées à mesure de l’avancement par des images de maquettes d’animation, puis les animations finales et les transitions. On réalise ainsi des dizaines de versions, jusqu’au produit final. On peut travailler en parallèle sur le son, essayer des bruitages, concevoir des musiques spécifiques.

Et comme le mapping c’est du volume, nous avons développé notre propre outil de prévisualisation, pour vérifier en “grandeur nature” virtuelle notre vidéo mapping. On modélise le site et on le met dans notre plate-forme Showviz qui nous permet de nous balader en réalité virtuelle, sur toutes les zones accessibles au public, de voir les déformations qui peuvent se produire, les vitesses, les échelles, les détails, …

Puy du Fou, Tolède, 2019 – Photo © Cosmo AV

Vous utilisez forcément des images de synthèse ?

P.-Y. T. : C’est ce qu’on utilise quand on veut faire simple, parce que cela permet de gérer de A à Z une production. Même si j’en conçois beaucoup, je milite pour qu’on continue à essayer d’autres choses. On a créé du stop motion, du dessin, de la peinture en stop motion, en live, de la captation, beaucoup en fond vert, on a tourné en intérieur, en extérieur, dans l’eau, on a essayé à peu près tout ce qu’il était possible de réaliser, des spectacles en relief, avec des captations reliefs. Aujourd’hui, le mapping reste un domaine dans lequel on peut faire des propositions, tester, prendre des risques. Il faut en profiter. Il y a encore tellement de choses à inventer qu’il ne faut pas se limiter à de la synthèse pure et dure ou à de l’animation 2D classique. Je reste persuadé qu’on doit continuer à faire des choses aussi à la main, des dessins, des sculptures, du tournage. Je trouve que c’est l’ensemble qui enrichit la proposition, il faut arriver à mixer tout ça, il n’y a pas un mode unique pour fabriquer. Mais c’est vrai que la synthèse amène des possibilités puissantes, pour des effets spéciaux difficiles à faire en tournage.

En ce moment, on utilise beaucoup de la synthèse avec des outils temps réel. On a fait la moitié de nos productions avec cela cette année. Ce sont les moteurs de jeux vidéo, des éditeurs qui permettent de les fabriquer. On entre des personnages, des paysages, tous les éléments qui organisent un univers de jeu vidéo en 3D ; et en le programmant d’une certaine manière cela crée de l’animation, des événements. Pour notre usage, on ne programme pas les actions d’un jeu vidéo mais des actions qui permettent de déclencher des événements dans la séquence pouvant être joués en live ou enregistrés pour être utilisés dans un logiciel de 3D classique. Il y a de l’intelligence artificielle dans ces logiciels, on pose un personnage, il se met à bouger sans qu’on ait rien fait… On appelle cela moteur parce qu’ils créent du mouvement. C’est la nouveauté en ce moment, beaucoup de studios s’y mettent car cela permet de faire des maquettes très rapidement.

Ensuite, c’est la mise en œuvre sur le terrain, l’aspect technique de l’installation et des réglages qui demandent de la méthode, une grande précision, avec des dispositifs qui sont souvent un peu complexes, les machines doivent être installées de manière stable, même dans des positions acrobatiques.

Anciennement, on ajustait à vue, on mettait la photo à la sortie du vidéoprojecteur et on réglait comme on pouvait la déformation dans l’image. Les média serveurs d’aujourd’hui, ceux d’une certaine taille, intègrent le fait de pouvoir gérer des modèles 3D à la diffusion, c’est-à-dire de pouvoir se servir du modèle 3D du bâtiment ou de la scénographie pour positionner les vidéoprojecteurs et les régler. Pour créer le lien entre la 3D virtuelle et la 3D réelle du volume, on pointe des arêtes, des points spécifiques, et le vidéoprojecteur s’ajuste automatiquement. C’est une nouvelle manière de régler, une fonctionnalité puissante qui offre plus de souplesse et de rapidité.

Comment voyez-vous les perspectives d’évolutions futures ?

P.-Y. T. : Au niveau des sources, la dernière technologie qui aujourd’hui est implantée globalement c’est le laser phosphore. Elles consomment moins, elles sont puissantes et permettent de mettre les machines dans n’importe quel sens. On est maintenant vraiment libéré de cette contrainte. Le rendu des couleurs n’est pas idéal mais en général le public ne le voit pas, on fait ce qu’il faut pour que ce soit joli, mais avec le Xénon on avait quand même des rendus de couleurs bien meilleurs. On travaille beaucoup plus sur l’étalonnage, la colorimétrie est moins stable d’un projecteur à l’autre.

La prochaine technologie existe déjà mais est encore très rare et ce sera (je pense) le laser RGB : de vraies sources laser en trois couleurs qui permettront d’avoir une qualité de lumière bien meilleure. C’est en tout cas ce que je vérifie à chaque fois que j’ai pu en tester. Mais c’est une technologie qui aujourd’hui n’est pas souple, qui a besoin de beaucoup de refroidissement et qui est très fragile. Des recherches sont entreprises en ce moment pour stabiliser ce type de sources, afin qu’elles soient exploitables beaucoup plus simplement. Certains fabricants travaillent à déporter les sources de lumière, pour résoudre ce problème. Il y a d’un côté la source de lumière, dans un rack, et de l’autre la tête vidéo, reliées avec un système de fibre optique. Le concept est basique et existe depuis des dizaines d’années, mais à cette échelle-là, avec ces puissances-là et cette qualité, cela n’existait pas. On sait maintenant effectivement déporter la tête vidéo de la source de lumière d’au moins 50 m, voire plus, ce qui donne des perspectives nouvelles en termes d’installation. On s’affranchit aussi des problèmes de refroidissement et donc de bruit, d’encombrement. Utiliser un 20 000 lumens dans une salle de théâtre était jusqu’à présent compliqué au niveau du bruit. Avec les dernières machines à tête séparée que j’ai vu tourner en 20 000 lumens, il n’y a plus de bruit du tout… Il n’y a même pas de ventilateur pour refroidir, c’est un refroidissement passif.

Aujourd’hui, “la norme” pour des grosses installations de vidéo mapping, en architectural ou pour des cérémonies, c’est des machines de 30 000 lumens, en 2K ou 4K. Les prochaines sorties de machines sont plutôt autour de 50 000 lumens et on peut imaginer que ce sera le nouveau standard d’ici deux à trois ans. Il existe déjà des machines plus puissantes, jusqu’à 70 000 lumens, mais qui sont hors de prix. Ce sont des monstres, plutôt réservés aux très grosses salles de cinéma.

Au niveau des liaisons vidéo, on s’achemine de plus en plus vers des liaisons réseaux permettant des câblages plus faciles. On est plus dans du dvi lourd ou de la fibre lourde. Pour des très grosses résolutions et des grosses fréquences, il faut des liaisons 10 GB qui ne sont pas banales dans les vidéoprojecteurs d’aujourd’hui. Mais même si ce n’est pas encore standardisé, chaque marque est en train de développer son propre vrai format vidéo sur réseau.

Existe-t-il du matériel dédié au vidéo mapping ?

P.-Y. T. : De plus en plus, à commencer par le prix. Aujourd’hui, notre moyenne en projection c’est des 20 000 lumens mono DLP. Avec une seule roue de couleurs, la qualité de l’image est un peu moins bonne, mais ce sont des machines bien meilleur marché, puissantes, compactes et qui, grâce à la technologie laser phosphore, durent très longtemps, ce qui permet même des installations pérennes. Elles sont beaucoup moins fragiles qu’avant, faciles à l’entretien. Et chose très importante pour le mapping, une électronique interne permet de faire différents types de déformation dans le vidéoprojecteur lui-même et on n’est plus obligé de passer par des outils média serveurs complexes.