Vous trouverez ci-dessous des tablatures proposés par Gilbert Audin, pour les bassons Buffet, Patrick Vilaire, pour les bassons Selmer, et Philippe Hanon pour les bassons Ducasse, version système allemand.
Blog
-
Sons multiphoniques au basson : définition, principes physiques et notations
1. Introduction
Il a été dit beaucoup de choses, et à la fois trop peu, sur les sons multiphoniques au basson. Ce champ d’investigation a bénéficié de quelques recherches fondamentales depuis les années 19501, ce qui nous donne quelques bases de connaissances et de réflexions utiles sur le sujet, mais globalement, les recherches sur les sons multiphoniques ont été discontinues dans le temps, et ceci a créé un décalage entre les connaissances acquises sur le sujet, et le potentiel de recherche à mener, notamment avec l’aide des outils informatiques à disposition aujourd’hui.
Nous avons donc un corpus qui, dans une certaine mesure, « décante » les principes acoustiques généraux et les pratiques musicales, mais en revanche ne détermine pas précisément les problématiques liées à l’usage des sons multiphoniques, qu’il s’agisse de trouver tous les sons multiphoniques les plus communs (ou à la sonorité la plus proche) entre le système allemand et le système français, de déterminer comment obtenir tel ou tel son multiphonique, de connaître l’influence de l’instrument et de l’anche sur le son multiphonique, etc..
Et pourtant, c’est précisément ce que l’on voudrait tous savoir ! Ainsi, c’est afin de tenter de résoudre certaines points issus de cette réflexion qu’au cours de plusieurs études sur le sujet, à titre universitaire comme en tant que compositeur et bassoniste, je me suis penché sur la question.
Convenant que répondre convenablement à toutes ces questions sur les sons multiphoniques relèverait de l’exploit, au moins aurai-je montré quelques points-clés du sujet sous forme d’un panorama allant de l’analyse acoustique des sons multiphoniques jusqu’aux premières problématiques du compositeur, à savoir leur(s) notation(s).
2. Définition du son multiphonique
Les définitions entourant la notion de sons multiphoniques sont rares, et même souvent absentes des différentes méthodes pour basson existantes. Cela peut sembler paradoxal de proposer des notations de sons multiphoniques, sans définir correctement ce qu’ils sont.
Aussi proposons-nous la définition suivante :
« un son multiphonique est le résultat d’une perception de plusieurs hauteurs simultanées par un jeu de divisions non-entières de la colonne d’air et d’une excitation acoustique unique. »A partir de cette définition, nous observerons que les sons que l’on qualifient habituellement de « sons harmoniques » ne s’y retrouveront pas, et que l’on parle bien d’une « excitation acoustique unique », ce qui éloigne des sons multiphoniques les sons à plusieurs sources émettrices, comme les sons diphoniques.
Notons que cette définition est potentiellement valable pour tous les instruments à vent. Le basson est un instrument de choix pour produire ce type de sonorité, étant donné qu’il peut en produire beaucoup, notamment grâce à la richesse de son timbre.
De ces sons multiphoniques, nous pourrons décomposer ceux-ci en quatre ou cinq grandes catégories (homogènes, hétérogènes, stables, instables, aléatoires). Pour les étayer, nous aurons recours, dans les explications qui suivent, à des résultats d’analyses informatiques.
3. Caractéristiques du son multiphonique lors de son analyse acoustique
Espace sonore
Le premier point à considérer, lors d’une analyse acoustique du son, c’est de définir une zone, ou plutôt des zones vers lesquelles cibler nos microphones.
En 2008, j’ai mené une petite expérience, afin de déterminer ces zones. Lors de cette expérience, j’avais personnellement pris mon basson (système allemand), et une autre personne avait empoigné un microphone, le faisant tourner autour selon deux axes décrits par le schéma ci-dessous.

Le résultat, montré en Illustration 1, est représentatif de ce que l’on peut obtenir lorsque l’on teste les sons multiphoniques. La répartition des fréquences dans les différentes zones peut toutefois varier. Dans le cas présent, les fréquences basses (les graves) sont très présentes en sortie de la petite branche, alors que les fréquences hautes (les aigüs) plutôt présentes du côté du bonnet. Ces fréquences à l’intensité forte (dans l’illustration en jaune) forment des formants géographiques.

Battements
Dans les caractéristiques des sons multiphoniques, nous retrouvons également la présence de « battements », perceptibles ou non. Ces battements se caractérisent par des atténuations soudaines et périodiques du son. Dans certains cas, quand cette périodicité est inférieure à environ 20Hz (c’est-à-dire 20 fois par seconde), on peut percevoir un rythme.
Dès lors que cette périodicité est supérieure à 20Hz, on peut percevoir éventuellement une fréquence nouvelle perceptible comme hauteur grave. L’illustration 2 ci-dessous montre bien ce phénomène, surtout après le marqueur « 0.10 » (les hautes fréquences, sur la partie haute du sonagramme, illustrement bien ces coupures périodiques)

L’absence de battements perceptibles définit un son multiphonique homogène, la présence de battements perceptibles définit un son multiphonique hétérogène.
Périodes
A un autre niveau se situent la notion de « périodes » qui sont soient des jeux de phases entre les fréquences, soit des battements sans coupure de son.

Ces périodes sont notamment perceptibles lors de l’écoute, si l’on prête attention à l’évolution du timbre dans le temps.
Approximations dans la notion de hauteur
L’une des caractéristiques qui va notamment poser problème lorsque l’on essaiera de retranscrire en accords nos sons multiphoniques, est la notion de hauteur.
Par le fait que notre oreille déforme légèrement la perception des fréquences, et le fait que le son multiphonique évolue dans le temps, il semble indispensable d’une part de mesurer les variations de fréquences, et d’éventuellement corriger la mesure de ces fréquences avec un algorithme de simulation d’une perception d’humains d’autre part.

L’illustration 4, ci-dessus, schématise le début d’une approche que j’exploite actuellement, afin de déterminer les variations des valeurs de fréquence à l’intérieur d’un son multiphoniques.
Il s’agit de recueillir toutes les fréquences obtenues après analyse informatique d’un son multiphonique, de ne pas tenir compte du moment où elles apparaissent et disparaissent, puis de les ordonner de la plus petite valeur de fréquence à la plus grande valeur de fréquence. Ces fréquences sont converties en hauteurs.
Le résultat de cet ordonnancement laisse entrevoir l’existence de paliers, permettant ainsi de définir à la fois une valeur moyenne de hauteur par palier, ainsi que les valeurs les plus basses et plus hautes à l’intérieur de chaque paliers. Ces dernières valeurs nous permettent de connaître l’état de stabilité des hauteurs considérées.
Cette approche a tendance à confirmer toute la difficulté de réaliser une notation convenable des sons multiphoniques sur une portée, simplement en tenant compte du fait que :
- Le son multiphonique est variable dans le temps
- Les fréquences extractibles des sons multiphoniques varient, parfois indépendamment, en intensité et en valeur nominale.
- Plus généralement, ce qui est physiquement mesurable n’est pas nécessairement audible, et ce qui est audible n’est pas une perception stricte de ce qui est mesurable.
4. Pratique musicale : l’écriture (la notation)
Partant des constatations des caractéristiques liées à l’émergence de nos sons multiphoniques, nous avons alors à nous préoccuper d’une autre grande (et inépuisable!) problématique qui est : la notation des sons multiphoniques.
Plusieurs approches ont vu le jour. En tant que tel, chacune des notations étudiées essaie de répondre à sa manière à un ou plusieurs aspects formulables du problème. Nous avons décomposé ces notations en quatre grandes thématiques : l’écriture par la technique instrumentale, l’écriture par le résultat sonore, l’écriture hybride et l’écriture complexe.
L’écriture par la technique instrumentale
L’écriture par la technique instrumentale, c’est tout simplement prendre appui sur les doigtés, la pression sur l’anche, la pression d’air.. pour décrire sous forme graphique comment produire tel ou tel son multiphonique.

L’illustration 5 ci-dessous en est l’exemple le plus simple, on écrit simplement le doigté de son multiphonique (qui, dans ce cas-ci, fait émerger systématiquement un son multiphonique instable)
L’écriture par le résultat sonore souhaité
Autre méthode, rarement employée, est l’écriture qui consiste à décrire le son multiphonique tel que l’on voudrait qu’il « sonne », c’est-à-dire avec les hauteurs perceptives principales à reproduire.

L’écriture hybride
L’écriture hybride, c’est une façon double de noter sur portée :
la façon de produire le son,
Une autre façon de l’écrire, suivant un schéma mnémotechnique et/ou par le biais de l’écriture par le résultat sonore. (comme pour l’illustration 7 ci-dessous)
L’écriture complexe
L’écriture complexe est une façon plus « travaillée par la composition » d’envisager le son multiphonique. Il s’agit alors d’incorporer le son multiphonique de la même façon que l’on dote n’importe quelle note, ou ensemble de notes, de trilles, d’appogiatures, de tremoli, etc…
5. Conclusion
Confrontés à la notation des sons multiphoniques, les bassonistes ont trois grands problèmes :
Comment bien lire la notation ? [La lecture]
Comment être sûr d’être conforme aux attentes du compositeur ? [L’idée musicale]
Suis-je capable de produire ce qui est écrit ? [La faisabilité]Tout au long de notre article, nous avons délimité les sons multiphoniques au travers de domaines comme l’acoustique instrumentale et la notation, qui peuvent laisser penser que l’étude en elle-même est cloisonnée.
En réalité, l’étude des sons multiphoniques révèle plutôt un schéma en série qui part de l’excitateur (l’anche), passe par l’instrument notamment au travers d’une combinaison de pression d’air et de doigté, pour finalement s’épanouir à l’extérieur de l’instrument.
Une difficulté d’exécution en amont aura comme conséquence de rendre instable le résultat en aval. C’est le défi qui nous est donné de renforcer la connaissance des sons multiphoniques, de les pratiquer régulièrement, afin de consolider cette chaîne, ce qui encouragera encore les compositeurs de notre époque à écrire pour le basson.
William Goudfreind
-
Equilibrage des anches
Traduction française de » l’équilibrage des anches » du bassoniste suédois C. Davidsson
Vous pouvez passer beaucoup de temps à gratter et à ajuster des, anches avec aucun ou seulement un minimum de résultat. Vous pouvez aussi y passer un minimum de temps pour un résultat maximum. Alors, bien sur, vous devez savoir où gratter/ajuster etc.
Mais la chose la plus importante est que vous ayez une approche méthodique, afin d’avoir une vision d’ensemble tout en portant votre attention sur ce que vous êtes en train de faire. Vous apprendrez ainsi de vos erreurs et développerez votre connaissance et votre habileté de façon à obtenir vos anches exactement comme vous les voulez.
Diagnostique
D’abord, l’anche que vous êtes sur le point d’ajuster nécessite un diagnostique. Il ne suffit pas que vous la mettiez au rancart en vous contentant de penser qu’elle est mauvaise, parce que l’anche la plus impossible peut avoir une fin heureuse, et vice versa.
OK, vous ne sentez pas bien cette anche, mais qu’est-ce exactement à propos de cette anche qui ne vous va pas ? Il peut n’y avoir qu’une seule chose, ou y en avoir plusieurs, ou l’anche entière s’avérer être carrément un immense gâchis. Si c’est seulement par exemple l’attaque d’une note qui n’est pas bonne, vous devez seulement gratter/ajuster la zone ou les zones qui influencent l’attaque/le coup de langue.
Mais s’il y a plus que cela, il est, temps d’être méthodique et de résoudre les problèmes un par un.
Quand vous jouez une anche vous pouvez probablement dire tout de suite si cette anche est trop dure, trop tendre, trop sombre, trop claire, trop lourde dans le registre aigu, trop lourde dans le registre grave, trop brillante etc. Vous prenez des mesures pour corriger tous les problèmes dans l’ordre où ils se présentent.
Équilibre
Il est important de savoir que tout est en rapport, et que c’est l’équilibre entre toutes les corrections qui vous donnera une meilleure anche. Souligner que si vous grattez ici le résultat sera ceci et que, si vous grattez là le résultat que sera cela est facile, je vous le montrerai dans les dessins ci-après.
Ce qui est plus difficile, c’est d’obtenir un équilibre dans cette anche, ce que vous réussirez, soit par pur coup de chance, soit si vous développez le sens du degré jusqu’au-quel vous devez faire telle chose ou telle autre à vos anches. Ce sens pour les anches, vous seul pouvez le développer. Toutefois, avec un atout majeur si vous êtes stratégique, si vous ne grattez pas trop à la fois et avec l’aide des dessins ci-après, avec le temps vous pourrez encore vous développer à travers vos propres découvertes.
Grattez avec votre œil ! Veillez, où que vous grattiez, à ne pas obtenir de creux ni d’arêtes. Il devrait y avoir une jonction progressive entre les parties que vous avez ajustées et celles que vous avez laissées telles quelles. Équilibrez du milieu de l’anche vers les bords. Trop épais au milieu et trop fin au bord par exemple vous donnera une anche qui résiste partout. Utilisez votre œil et veillez à ce qu’elle soit partout régulière, harmonieuse et satinée.
Apprenez à connaître la façon dont les différents roseaux réagissent a des grattages similaires. Faites toujours en sorte de conserver en l’état les qualités dont vous êtes satisfait, et faites en des points de repère pour les choses dont vous n’êtes pas satisfait.
Outils
Utilisez votre imagination quand il s’agît d’outils. il est important que vous ayez des outils avec lesquels vous ayez plaisir à travailler et qui conviennent aux différentes phases du travail.
Les outils de base sont un mandrin, un équarrissoir, une languette, un couteau et une pince.
Le mandrin ne sera pas trop long, sinon il risque de toucher la languette a l’intérieur de l’anche.
La languette devra être assez large pour que l’anche entière tienne dessus.
Le couteau devra être un couteau à anches, mais d’autres couteaux conviennent aussi bien à condition de ne pas être trop gros, de bien tenir dans la main et, d’être faciles à aiguiser.
La pince doit être petite, et pas trop épaisse, de façon a ce que vous puissiez atteindre de petites surfaces.
Du papier de verre résistant à l’état humide avec une surface très unie (P1000) est une aide précieuse pour lisser la surface de l’anche et quand vous avez besoin d’ajuster la pointe.
Une lime à ongle en métal est excellente par exemple pour limer les bords de l’anche.
Un couteau avec une lame courbe facilite la précision de grattage dans les petites surfaces.
Ci-après vous trouverez un chapitre sur le dépistage des défauts puis une description de ce qui arrive (ou pourrait arriver) si vous ajustez les différents points de l’anche, et pour finir, les dessins des points de grattage d’anches.
Maintenant, il ne me reste plus qu’à vous dire: …Bonne Chance !
Dans la description ci-dessous, j’indique les différentes façons de vous approcher de ce dont manque votre anche. Cela ne signifie pas que vous deviez appliquer tous les remèdes à chaque point, ne faites cela que dans les cas les plus désespérés. Les solutions ci-dessous sont dans l’ordre que je trouve approprie. Faites alterner plusieurs façons d’atteindre le but désire car toute correction a ses effets secondaires et quelques uns de ces effets secondaires peuvent être mis dans la balance pour arriver à ce que vous voulez faire de votre anche.
Si l’anche est trop dure :
Veillez à ce que le milieu de l’anche (15) ne soit pas trop épais par rapport aux bords.
Si c’est le cas grattez ici. Si vous avez trop de bois sur votre anche, commencez à gratter uniformément l’anche entière ( 8 ).
Essayez de discerner si par exemple le registre aigu devient léger et le registre grave devient lourd ou vice versa.
Arrêtez ensuite et grattez un peu plus sur les surfaces dont vous n’êtes pas satisfait.
Si le roseau est très dur, vous pouvez en dernier ressort plonger l’anche entière ( 8 ) dans de l’eau bouillante pendant environ 10 secondes.
Trop tendre:
Si l’anche n’est tendre qu’en partie, essayez de tirer et de resserrer la première et la deuxième bagues (10), (11).
Si cela ne suffit pas. pincer l’anche des deux côtés juste derrière la première bague au point (14).
Si l’anche est très tendre, alors couper la pointe d’environ 0,5 a 1,0 mm.
Trop lourde dans le registre grave:
Gratter la partie arrière (3).
Vous pouvez aussi pincer sous et sur la deuxième bague (13).
Jusqu’à un certain point, cela aide à gratter les coins externes sur le point (18), mais cela rend également les notes aiguës plus faciles.
Le point (1) facilite un peu les graves, mais libère surtout l’anche dans son ensemble.
Trop lourde dans le registre aigu :
Gratter au point (21).
Resserrer et pincer la deuxième bague des deux côtés (11).
Gratter au point (2), mais si cela ne suffit pas également aux points (7) et (1 8).
Si besoin est, équarrissez l’anche ou coupez la.
Son trop sombre:
Commencez par gratter la pointe régulièrement et entièrement (9).
Veillez à ce que le « cœur » au point (4) ne soit pas trop épais par rapport aux surfaces avoisinantes. Prenez en peu a la fois ici, puisque vous perdez « du son » et de la stabilité, mais d’un autre côté, vous gagnez en liberté et flexibilité.
Si plus de grattage est nécessaire, commencez par le point (7). Pincez des deux côtés de l’anche à la deuxième bague (11).
Finalement, tirez le couteau d’un trait le long de l’anche de chaque cote du milieu absolu (19). Ce grattage ne doit être effectue qu’en dernier ressort, et pas trop.
Trop clair ou trop brillant:
Grattez les bords de chaque côté (6).
Même au point (1) qui s’étend vers le milieu et qui rend le son plus sombre.
Pincer avec une pince des deux côtés de l’anche, derrière la première bague au point (14).
L’anche aura une ouverture plus large vous pincerez pour l’amoindrir avec vos doigts devant la première bague.
Vous aurez aussi accru la résistance en pinçant au point (14).
Enfin, pincez sous et sur la deuxième bague (13).
Attaque trop dure :
Gratter avec un couteau l’extérieur de la pointe (5) et (7).
Le point (9) vous donnera une attaque plus facile et une flexibilité plus grande. Essayez aussi les points (1) et (4).
Attaque trop facile :
Pincer pour les rapprocher les deux parties de l’anche avec vos doigts et râpez (avec du papier de verre résistant à l’état humide (P1000) le bord antérieur de la pointe (17), ou coupez l’anche (0,5 mm).
Resserrez la première bague (10).
Grattez encore au point (21). Vous pouvez aussi pincer l’anche des deux côtés au point (14).
Trop bas dans le registre aigu:
Équarrissez l’anche ou coupez la.
Pincez des deux cotes de l’anche à la deuxième bague (11) et/ou pincez pour la resserrer l’anche à la première bague, point (12).
Trop haut dans le registre grave:
Pincez l’anche pour la resserrer à la deuxième bague (13).
Grattez au point (1), et si besoin est au point (3). Grattez au point (16), les « yeux ».
Que se passe-t-il quand on gratte ou ajuste les différents points ?
Il y a beaucoup à dire à ce sujet et vous ferez beaucoup de découvertes personnelles. Je vais décrire en termes généraux ce qui se passe fondamentalement.
- Gratter ici vous donne une anche plus libre. Le son devient légèrement plus sombre et les graves y gagnent.
- L’attaque devient plus aisée. Plus de flexibilité dans tout le registre. Les sons importuns sont assourdis.
- Le registre grave est facilité.
- Le « cœur », le noyau du son. Trop peu à cet endroit fait s’écrouler l’anche ; trop la rend lourde avec une mauvaise attaque et sans flexibilité quand on joue legato. Essayez d’autres solutions avant de gratter ici, mais si vous devez le faire, ne grattez que peu à la fois. Le ton devient plus clair et plus faible mais plus libre.
- L’attaque est facilitée ainsi que le pianissimo dans l’aigu.
- Gratter le long des bords assourdit le son et assombrit légèrement le ton. L’anche devient plus flexible. Si vous en retirez trop ici par rapport au milieu de l’anche, un déséquilibre est créé et l’anche devient instable, rai e et résistante.
- Facilite le registre aigu et l’attaque. Vous obtenez également un son plus clair.
- Si vous râpez uniformément tout autour de l’anche cela conserve ses rapports intrinsèques, et elle devient plus légère.
- Facilite le registre aigu, améliore l’attaque, donne un son plus clair et plus de flexibilité.
- Les côtés de la première bague La première bague de devrait pas être trop serrée sous peine de restreindre les vibrations de l’anche. Si elle est trop tirée et que vous voulez une anche plus libre, relâchez la juste un peu. En pinçant l’anche des deux côtés vous obtenez une ouverture plus large, plus de résistance, un son plus sombre, et facilitez le registre grave.
- Les côtés de la deuxième bague. La deuxième bague devrait être tirée relativement fermement. Pincez des deux côtés et vous obtenez une ouverture plus petite, et facilitez le registre aigu.
- Sur et sous la première bague. Pincez les deux parties de l’anche ici pour les rapprocher et vous avez une ouverture plus petite, un son plus clair et facilitez le registre aigu.
- Sur et sous la deuxième bague. Pincez ici et vous obtenez une ouverture plus large, plus de volume, un legato plus facile, un son plus sombre et un registre grave plus aise.
- Les côtés derrière la première bague. Pincez ici et vous obtenez un son plus sombre, plus de résistance et de stabilité.
- « l’arrière ». Trop de bois ici vous donne une anche dure, butée. Trop peu de bois et l’anche s’effondre.
- Si vous râpez ici, l’anche devient plus flexible et plus vibrante. Le registre aigu est amélioré. Le son devient plus clair.
- Pincez la pointe pour rapprocher les deux parties avec vos doigts et râpez le bord avant si l’attaque est trop facile.
- Améliore l’attaque dans le registre aigu et donne un grave plus libre. Plus vous grattez vers le milieu de l’anche (les lignes marquées), plus vous obtenez un son sombre, plus de flexibilité, une meilleure attaque et un plus beau legato.
- Si vous avez l’impression que le son est « mort » vous pouvez, en dernier lieu tirer le couteau le long de ces lignes, mais seulement une ou deux fois. Cela donne plus de vigueur au son.
- Si vous avez une jauge, vous pouvez mesurer les différents points d’épaisseur de l’anche. Cette suggestion vous donne une anche bien équilibrée avec beaucoup de puissance si vous utilisez un roseau dense normal. En même temps cela vous donne une idée de l’inclinaison de la pointe de l’anche à l’arrière (en regardant sur de côté). Si vous voulez une anche plus légère, grattez juste uniformément toute la surface pour que les rapports à l’intérieur de l’anche restent les mêmes. Mesurez le milieu de l’anche (l’arrière) depuis la pointe. A 4mm du bord l’épaisseur est de 0,65mm, à 8mm du bord : 0,65mm, à 12mm du bord : 0,70mm, à l6mm du bord : 0,80mm, à 20mm du bord : 0,85mm et à 24mm du bord : 0,90mm.
- Retient le son, donne plus de résistance et un son plus sombre. Améliore le registre aigu.


-
L’instrumentarium du XIXème siècle comme reflet des mouvements esthétiques
Conférence de O. Blanchard lors du colloque Fou de Basson 1999
Lorsqu’il s’agit d’interpréter une œuvre du XIXè siècle, le musicien semble, à première vue, beaucoup moins confronté à des problèmes d’ordre stylistique que pour la musique des siècles antérieurs, tant il est vrai que les critères esthétiques que nous connaissons aujourd’hui (critères d’originalité de l’œuvre, rôle dévolu à l’art…) sont déjà en grande partie mis en place à cette époque. Cependant, les récents essais d’exécution sur instruments dits authentiques montrent que cette proximité peut n’être qu’une apparence trompeuse.
Les œuvres de ce siècle méritent d’être considérées elles aussi dans leur singularité comme il est maintenant coutumier de le faire pour la musique dite baroque. Si l’on se penche sur le cas d’un instrument particulier, en l’occurrence le basson, cette optique s’impose d’autant plus que, d’une part, le XIXè siècle ne constitue pas une période très riche en œuvres solistes » majeures » pour l’instrument, à l’instar du hautbois ou de la majorité des vents, et que d’autre part, la mise en place des deux systèmes de facture demeure un point de focalisation quasi unique.
Ce phénomène, encore perceptible de nos jours, pour ne pas dire sensible, ne saurait rester un point d’ancrage unique et ne doit pas empêcher de considérer la diversité des courants présents au XIXè siècle. Il convient donc de s’abstenir de qualifier toute œuvre écrite à cette époque de » romantique » et de ne pas se limiter aux deux catégories généralement évoquées et très réductrices : œuvres de compositeurs pour un instrumentiste précis (Kozeluch, Danzi, David, Hummel, Berwald, Weber) et œuvres d’instrumentistes qui les jouaient (Gebauer, Jacobi, Almenräder).
Le XIXè siècle est un siècle marqué par d’importantes mutations, notamment dans la lignée de la Révolution française, qui justifient une étude détaillée des options esthétiques en présence.
Le rôle des instruments varie en fonction des idées directrices (que l’on se souvienne simplement du sens symbolique du cor à l’époque romantique) ; un examen approfondi peut aider l’artiste à affiner son interprétation.
I. L’héritage
Aux XVIIè et XVIIIè siècles, le basson connaît un emploi fréquent, tout d’abord au sein de la polyphonie, puis dans le cadre de basse continue qui lui assigne une place presque constante. Mais cette basse continue constitue également un profond changement dans la conception de la musique ; en effet, fait nouveau dans la musique, un instrument, un individu, se dégage de la masse musicale pour exalter des valeurs individuelles : la musique cesse peu à peu d’être au cœur de la vie collective, acquiert son autonomie et met en exergue les qualités individuelles.
La virtuosité naît et avec elle le fossé entre artiste et » profane » ( » la naissance du » public » au sens moderne est en chemin). Le musicien doit alors redéfinir sa place sociale puisqu’il ne sera plus au service de la collectivité, d’autant plus que la spécialisation autour d’un instrument mettra fin à la musique de corporation. Tandis que la place des cours dans la vie musicale va diminuer et que la bourgeoisie va de plus en plus exiger une représentation tant sur le plan politique (Révolution française) qu’artistique (Le barbier de Séville de Beaumarchais), une nouvelle entité indépendante va se constituer, révélatrice du rôle grandissant de l’individualité et de la bourgeoisie : l’orchestre.
A la cour de Mannheim, la place des instruments se fixe, préparant le classicisme et le romantisme : la notion de timbre devient aussi importante que la composition et l’on admire maintenant tout autant l’interprétation (individuelle), les effets d’orchestre (le célèbre crescendo de Mannheim) que la composition. Aux violons échoit la mélodie, nouveau cœur de l’œuvre, tandis qu’entre eux et la basse, les instruments à vents ( » l’harmonie « ) assurent le remplissage harmonique par de longues tenues.
La musique acquiert son langage propre et le fait que des gens comme Mozart, puis Danzi, Winter ou Weber soient passés par Mannheim révèle le sens du timbre qui va aller croissant. Chez Mozart, on trouve encore des traces d’utilisation d’instruments » au choix » (clarinettes ou hautbois dans le final de la 40ème), mais c’est là une tendance sur le déclin. Le basson y trouve sa place ainsi que le montre la présence de 72 élèves bassonistes à la création du conservatoire de Paris.
Les » Viennois » restent jusqu’à Beethoven dans cette tradition de codification de la place des instruments, le basson étant utilisé par exemple dans » l’unisson viennois » (basson jouant la mélodie deux octaves plus bas que les flûtes ou violons, et donc sous l’accompagnement).
Parallèlement, une mutation commence à s’opérer : celui qui était le » fier » ou » lugubre » basson est de plus en plus utilisé pour ses qualités chantantes et est même nommé en 1802 » instrument de l’amour » (Koch). Cette mutation progressive permettra à terme des utilisations plus variées de l’instrument même si cela reste modeste au XVIIIè siècle. La lutte entre formes héritées de la monarchie et idées nouvelles donne d’ailleurs lieu à de nombreuses expérimentations. Un témoin de ces tensions sociales est la symphonie concertante, compromis entre l’aspiration individuelle et la pluralité de solistes. Elle connaît une floraison significative pour finalement disparaître très vite dans les premières décennies du XIXè siècle (Pleyel, Danzi), ne correspondant plus à la société établie.
De même, l’octuor à vents, qui assurait une place au basson dans les petites cours en mal de représentation, assure une transition entre la musique de circonstance et la musique libéré d’un engagement précis : la Sérénade KV 388 de Mozart, dans le ton sombre de do mineur, n’a plus grand chose à voir avec la musique de table. De plus, l’octuor permet de faire entendre des arrangements d’opéras connus, montrant à quel point la musique devient susceptible de pérennité. L’octuor perdure quelque peu au XIXè (Beethoven), mais est vite supplanté par des œuvres plus ambitieuses, plus conformes à la conception nouvelle, de la musique, représentative de l’individu : .l’octuor de Beethoven sera transcrit par l’auteur lui-même pour ensemble à cordes. Les rares exemples de sérénades pour vents du XIXè siècle affichent une franche ambition classicisante (de Gounod à Dvorak).
La petite symphonie de Gounod fut écrite en grande partie pour mettre en valeur les capacités du flûtiste Taffanel ; en cela, elle est déjà contraire au genre. En tout état de cause, l’histoire de l’octuor témoigne des liens qu’entretiennent les vents et la musique militaire ; si Mozart, Haydn puis Beethoven utilisent ça et là le contrebasson, c’est bien parce que la musique militaire viennoise en prévoyait dès le XVIIIè siècle.
En cela, l’histoire du basson allait demeurer en partie liée à l’évolution de la musique militaire.
II. Le début du XIXè siècle : l’idéalisme.
Le XVIIIè siècle marque donc un tournant : en libérant progressivement la musique de la tutelle des cours et des églises, il oblige le musicien à se trouver une nouvelle raison d’être, qui ne soit plus liée à un employeur : Beethoven devra renoncer à son salaire de la cour de Bonn, une fois celle-ci dissoute par Napoléon.
Dans le même temps naissent la notion d’artiste telle que nous l’entendons et celle du public qui, en payant, juge et assure la subsistance du musicien. Un Haydn et un Mozart n’avaient pas besoin de réfléchir aux raisons d’être de leur art ; un Beethoven sera féru de littérature et de philosophie pour trouver un sens à sa musique. D’un côté, 104 symphonies » de circonstance » de Haydn, de l’autre, les neuf symphonies (dont une avec chœur !) de symphonies : l’oeuvre d’art devient quelque chose de plus en plus unique. Mais le XIXè siècle ne constitue pas pour autant un tout homogène.
Le danger du schématisme est d’autant plus grand que les différents courants peuvent fort bien coexister à la même époque (Goethe, classique, critiquant le romantisme, en offre une illustration) et que tous les genres n’évoluent pas à la même vitesse (le Lied de Schubert est déjà bourgeois alors que ses opéras demeurent dans la plus pure tradition italienne classique), voire varient selon les pays, la donnée nationale devenant très importante au XIXè siècle.
1) Le classicisme.
Lorsque l’on parle de classicisme, on peut tout d’abord évoquer l’influence énorme exercée par Mozart au début du XIXè siècle. Les ouvertures d’un Rossini fourmillent ainsi d’unissons viennois.
Un concerto pour basson tel que celui de Hummel témoigne par sa structure de la persistance des canons dits classiques. Mais c’est là une conception restreinte du terme de classicisme. La Konzertsück pour basson de Berwald illustre l’évolution du courant : la partie de basson débute par une démonstration du registre et de la puissance du soliste ; le troisième mouvement concourt à une unité nouvelle de l’œuvre d’art, en reprenant le thème du premier. Le classicisme s’enrichit d’un fondement philosophique plus solide. Selon ses théoriciens, l’art, reflet de lois universelles (comme déjà chez Mozart), a pour mission nouvelle d’élever chaque homme vers l’idéal, cette humanité noble chantée dans » l’Ode à la joie « .
Chargées d’un bagage idéologique, fait nouveau, les formes musicales deviennent trop petites, comme en témoigne une symphonie d’une heure comme la » neuvième « . De même, les moyens augmentent : l’effectif orchestral (d’autant plus que les salles grandissent), la palette de nuances (le crescendo de Rossini, le sforzando de Beethoven).
Pour élargir les possibilités, les compositeurs utilisent davantage les vents, ce qui valut à Beethoven (surnommé » bête à vent » en France) le reproche de faire de la musique » militaire « .
Mais cette utilisation se cantonne principalement dans le domaine orchestral. En effet, le musicien classique nouveau doit être un colosse à même de montrer la voie de l’idéal : l’introduction du concerto de l’empereur montre le pianiste dominateur. De même, le quintette avec piano de Beethoven fait du piano l’acteur principal, à l’inverse de celui de Mozart.
De même, le quintette à vent, qui connaît une certaine notoriété au début du XIXè siècle, ne saurait en aucun cas concurrencer le quatuor à cordes, plus conforme au souci idéologique de l’époque car plus homogène et permettant un travail dense sur la forme.
2) Le romantisme.
Cependant, à la même époque, un autre courant profite de ces progrès tout en les utilisant à d’autres fins.
Les concertos pour basson de Danzi traduisent cette évolution : celui en fa M contient certes un allegro de forme sonate, mais frappe par son unité motivique et ses modulations inattendues (faM->labM). Ici, l’artiste devient quelqu’un » d’à part « , qui doit stupéfaire. Le romantisme assigne en effet un autre but à l’art. Celui-ci doit révéler les harmonies cachées du monde (le romantisme est un idéalisme), que seul le génie peut voir. A ce titre, le génie ne connaît d’autre contrainte formelle que celle, individuelle, de son cœur. Par sa différence, il peut comprendre le sens caché du monde. Le concertino pour basson de Peter Winter préfigure ainsi par sa structure en un seul mouvement enchaîné les formes unitaires et cycliques. Une imagerie médiévale, chrétienne et nationale sous-tend ce courant (là où le classicisme est antique, païen et cosmopolite).
C’est dans cette veine que se situe la redécouverte de Bach et surtout de ses grandes œuvres monumentales (messes et passions), non sans influence sur l’emploi de vents à découvert : la cantate » Vom Himmel hoch » de Mendelssohn utilise le basson dans la droite ligne des airs avec vent obligé de Bach. Le compositeur ou, fait nouveau, le chef d’orchestre devient un héros à la fois admiré et rejeté. L’orchestre devient son instrument, ce qui se traduit soit par une soumission totale au soliste-compositeur (concertos de Chopin) soit par une recherche d’unité d’expression sous l’égide du chef ; Weber repositionne les pupitres et généralise l’usage de la baguette pour obtenir de nouveaux effets. Dans son concerto pour basson, l’usage des timbales à l’entrée du soliste ou l’accompagnement par deux cors dans le 2ème mouvement, la place réduite de la cadence, limitant les excès du soliste, témoignent de cette volonté de maîtriser la totalité des effets.
La dualité, facteur d’équilibre chez les classiques, devient ici facteur de tension expressive ; le jeu entre majeur et mineur en est un exemple. Or, il pose de nouveaux problèmes à l’instrument, exigeant de lui de nouveaux chromatismes, de nouvelles harmonies, voire de nouveaux registres, ne serait-ce que pour exprimer ce nouveau champ d’investigation qu’est l’irrationnel. Le début du 4ème mouvement de la symphonie N°3 de Schumann, utilisant en doublage trombones basses et bassons, met en évidence ce nouveau souci de recherche.
Même dans les opéras, l’orchestre n’accompagne plus, il participe à l’action et à l’expression.
3) Le traité de Berlioz.
En citant beaucoup Mozart et Beethoven, le traité d’orchestration de Berlioz, édité en 1841, montre à quel point romantisme et classicisme, bien qu’absolument opposés, utilisent un substrat commun, obligeant l’interprète actuel à un travail de décodage pour une exécution plus fidèle.
Berlioz fait état des évolutions de l’orchestre, rend hommage contrebasson et au basson, mais, dans le même temps, il cantonne ce dernier dans un rôle qui le poursuivra longtemps.
Le souci de caractérisation qui anime le romantisme en est une cause. Ainsi, le basson se voit doté d’un » timbre dépourvu d’éclat et de noblesse « , d’une » propension au grotesque, dont il faut toujours tenir compte quand on le met en évidence « , tandis que son aigu est » pénible, souffrant, je dirai même misérable « . Cette conception illustre le souci de constitution d’un orchestre normé, véritable outil du compositeur.
Elle perdurera pendant plus d’un demi-siècle pendant lequel le basson trouve une place fixe à l’orchestre, mais au détriment de son rôle soliste.
III. La fin et les restes de l’idéalisme.
Les œuvres de Bernhard Henrik Crusell héritent de cette tradition et se situent dans la droite ligne du romantisme, à l’instar du concertino de Ferdinand David.
Cependant, une évolution se dessine. Ainsi, le concertino de David frappe par sa relative modestie formelle (2 mouvements seulement). De plus, une remarque du bassoniste dédicataire du concertino en sib majeur de Crusell, Franz Preumayr, dépeint ce glissement : Preumayr parle du concertino comme de son » cheval de bataille « .
Il s’agit maintenant de plaire et d’impressionner. Certes, l’œuvre a une forme encore assez ambitieuse (3 mouvements enchaînés), mais les termes d’ « allegro brillante » ou de » polacca » et l’utilisation d’un air à la mode comme thème du deuxième mouvement annoncent une esthétique de la facilité, de la distraction. L’introduction du basson, loin d’être l’unique cadence, révèle le caractère de pot-pourri destiné à la bravoure.
Pour les idéalistes, la virtuosité était le reflet de l’ambition titanesque du compositeur ou de l’instrumentiste. Maintenant, elle est plutôt une brillance sans lendemain ; en effet, les courants post-idéalistes, parmi lesquels celui que l’on nomme » Biedermeier » renoncent à l’idéal, trop dangereux, tout comme la bourgeoisie renonce à une réelle représentation politique.
La musique n’aspire plus qu’à divertir au quotidien, dans le cadre de cercles privés (comme les célèbres schubertiades) ; elle devient soit plus intimiste et sans virtuosité (les lieder à accompagnement simplifié de Schubert), soit plus » gratuite « , ornée d’une virtuosité sans lendemain. Conradin Kreutzer et Johann Wenzel Kalliwoda, qui se sont succédés à la même cour, montrent la progression dans cette voie d’une génération à l’autre. Kalliwoda marque un pas de plus vers l’éclat destiné au salon.
De tels compositeurs se contentent de conserver les acquis du grand orchestre, mais n’expérimentent plus. Il est significatif que tous deux aient écrit pour le basson sous forme de variations : l’unique souci devient la facilité et l’agrément.
De même, le pittoresque, qui chez les romantiques servait à exalter des valeurs individuelles, devient un exotisme de bon goût. Le nombre impressionnant de mouvements de concertos écrits à la polonaise en est un exemple. Signe du souci essentiellement tourné vers l’effet immédiat, nombre d’oeuvres concertantes pour basson de cette époque adoptent la forme de pot-pourri, de fantaisie ou de thème et variations (le fichier » basson-XIXè » de la Bibliothèque nationale regorge de pièces intitulées » air varié « ).
Carl Almenräder, bassoniste de cette époque le déplore lorsqu’il déclare que » le vrai concerto est un genre perdu « . Les variations et rondo de Kalliwoda seront publiées en 1856 alors que le Konzertstück de Berwald devra attendre 1990 !
Dans l’intérieur bourgeois, c’est le piano, partie intégrante de la bonne éducation, notamment des jeunes filles, qui gagne toutes les faveurs.
A l’inverse du XVIIIè, l’instrument à vent n’occupe plus la place prépondérante dans la musique de chambre. Le basson en fait les frais. Les rares œuvres qui existent sont bien souvent écrites dans des cadres pédagogiques qui expliquent aussi le recours à la facilité sur le plan formel. A cette époque fleurissent, à côté des variations (les bassonistes connaissent les variations sur » Au clair de la lune » de Gebauer), les transcriptions d’airs opéras et autres pièces » caractéristiques « , voire des œuvres franchement destinées à l’enseignement. La frontière en est d’ailleurs fluctuante.
IV. Le développement de l’instrument et la fin du siècle.
1) Les progrès de l’instrument.
Le souci pédagogique grandissant influe naturellement sur le développement de l’instrument mais il n’en est pas l’unique cause. En effet, en dépit d’une donnée nationale grandissante, les idées et la musique circulent de plus en plus, demandant une plus grande homogénéisation, chaque instrumentiste pouvant être amené à jouer des œuvres pas forcément prévues pour son modèle. Le positivisme, croyance au progrès, compense ici le conservatisme des musiciens et explique de nombreux essais, corroborés par la collaboration fréquente des scientifiques et des musiciens.
Plusieurs facteurs favorisent la volonté de perfectionner l’instrument. L’harmonie est devenue plus complexe, et les modulations de plus en plus surprenantes deviennent difficiles à réaliser avec des doigtés à demi-trous et à fourches (qui expliquent que la plupart des œuvres concertantes pour basson du XIXè sont en sib ou en fa).
Les orchestres s’étoffent et les salles deviennent de plus en plus grandes, pour permettre aux musiciens ou aux administrateurs de plus grandes rentrées d’argent. Le basson développé par Almenräder puis Heckel, loin d’être l’unique exemple, cherche à être ne même temps plus homogène, plus à même de se fondre dans l’orchestre (l’instrument est un maillon de l’œuvre au milieu de l’orchestre) et plus sonore.
L’interdépendance entre progrès de facture et composition est totale. Compositeurs et instrumentistes demandent de nouvelles possibilités et tout progrès entraîne une démonstration ; le séjour de Wagner à Biebrich se soldera ainsi par l’utilisation du contrebasson dans Parsifal.
En 1909, Richard Strauss, complétant le traité de Berlioz, peut déclarer : » L’emploi du contrebasson, aujourd’hui très amélioré par Heckel, se recommande vivement « .
2) L’alternative de la fin du siècle.
La » période bourgeoise » a permis à l’orchestre de se fixer dans la vie sociale. Par la suite, deux voies se présentent, profitant de manière égale des progrès réalisés, mais s’opposant dans leurs buts.
Soit on poursuit les expérimentations romantiques, comme le font Wagner ou Mahler (Symphonie des mille), soit on se retourne plus modestement vers les anciens pour y trouver des valeurs éternelles (Brahms). Wagner cherche ainsi l’œuvre d’art totale, unissant tous les arts. La place de l’instrument y est fonctionnalisée, à tel point que même le chanteur devient un instrument du compositeur, au même titre que les autres. Le basson est donc poussé dans le grave (d’où le célèbre bonnet Wagner).
Mais dans le même temps, on perçoit un début d’affinement : dans Tristan, Wagner préfigure presque l’orchestre de chambre feutré des » impressionnistes « . Les tenants des deux écoles illustrent un souci d’authenticité, révélateur de l’esprit dit » fin de siècle « . La recherche d’un ailleurs se fait alors jour, le pittoresque devient l’authentique : que ce soit dans l’orient de Schéhérazade ou dans l’Espagne de Carmen, les bois trouvent ici un rôle de tout premier plan.
Autre conséquence, la musique ne se veut plus belle ; elle veut être vraie : Nietzsche ouvre l’art à l’irrationnel, à la psychologie sourde. Dès lors, un Verdi pourra exiger d’une voix qu’elle sonne » laide » en fonction du rôle.
La musique trouve un nouveau champ d’investigation.
CONCLUSION
Le basson, tout en ayant alors trouvé sa place incontestée dans l’orchestre, n’en est pas moins cantonné à ce que Berlioz lui avait assigné. Lorsque Mahler l’emploie dans sa première symphonie pour jouer » Frère Jacques » en mineur, c’est avec une évidente volonté grotesque.
Strauss, dans son traité de 1909, résume la présence du basson dans l’unisson viennois de la façon suivante : » on croit entendre un vieillard suivant de sa voix défaillante les airs qui charmèrent sa jeunesse. « .
Lorsque Stravinsky confie à l’instrument le solo du Sacre (dès le début de l’œuvre et dans le registre aigu de l’instrument !), il montre à quel point l’orchestre est en quelque sorte uniformisé, sclérosé : il est temps de reprendre les explorations, d’autant plus que la facture a énormément progressé.
Avec l’impressionnisme ou le sérialisme, la notion de timbre va gagner de nouveaux droits. En 1934, Charles Koechlin, dans son traité d’orchestration, pourra enfin affirmer contre Berlioz qu’il est parfaitement injuste de qualifier le basson de manquant de noblesse.
Bref aperçu (incomplet) de possibles applications instrumentales
En premier lieu, l’interprète pourra s’interroger sur le rôle de la forme. Si celle-ci éclate au XIXè siècle, cela peut être pour différentes raisons : une œuvre classique reflète des idées, tandis que le romantique veut plus surprendre.
Au-delà de la forme, c’est le but de l’œuvre concernée qui devra faire l’objet d’une interrogation. La réponse à cette question permet de hiérarchiser les différents éléments constitutifs de l’œuvre. Ainsi, par exemple, les traits virtuoses ne jouent pas forcément le même rôle.
Ainsi, le concerto de Weber, œuvre plutôt romantique, possède une grande unité formelle et expressive où la virtuosité ne joue qu’un rôle subalterne.
A l’inverse, son rondo hongrois, beaucoup plus dans le goût bourgeois, fait étalage de virtuosité brillante, constituant avec l’agrément le véritable but de l’œuvre. L’interprète fidèle prendra conscience de ces différences, même au sein d’un compositeur. Enfin, en fonction du ou des courants abordés, le timbre de l’instrument pourra être plus ou moins uniforme, plus ou moins homogène.
La plupart des bassonistes le savent intuitivement, mais, bien souvent, on se contente d’une anche brillante (dite malheureusement trop souvent » romantique « ) et d’une autre plus » lyrique « . Le développement de l’instrument au XIXè est suffisamment complexe pour que l’on affine ce découpage. Outre les applications en tant que soliste, c’est la fusion de l’instrument au sein de la masse orchestrale qui varie.
-
Historique du trombone
Auteur : Tristan Mauguin
Publié initialement sur Le site du Trombone
Le trombone appartient à la famille des cuivres, comme la trompette, le cor, le tuba et le saxhorn. On utilise pour sa fabrication le cuivre jaune (alliage de laiton) ou le cuivre nickelé. Comme la trompette et contrairement au cor, sa perce est cylindrique, terminée par un pavillon.
De la Renaissance à la fin du xxe siècle, le trombone ne cesse d’évoluer. Toujours discret, souvent anonyme, il suit les mouvements et s’imprègne des particularités sociales ou musicales de chaque époque. Ainsi, de siècles en siècles, le tromboniste s’affirme dans le milieu professionnel, et sa technique se perfectionne. Dans les années 1450, le mouvement « Renaissance » se répand dans l’Europe entière. Tous les arts tremblent sous les innovations et la recherche de nouvelles productions. Ainsi, la musique s’oriente vers des richesses mélodiques et harmoniques nouvelles. Dans cette évolution, les parcs instrumentaux doivent se renouveler ou se développer. Le trombone dans sa forme définitive (une embouchure, une coulisse, un pavillon) apparaît à cette époque. Descendant de la trompette naturelle, il est modifié (la coulisse apparaît) pour apporter aux cuivres un échantillon nouveau de notes chromatiques, en plus des harmoniques naturelles. Ainsi le trombone alors nommé sacqueboute (du vieux français sacquer et bouter : tirer et pousser) peut intégrer plus activement les productions musicales de l’époque.
Certes, certains diront que le trombone prend sa source dans l’Antiquité, mais nous fixerons sa « date de naissance » sur la base de l’existence d’un instrument de cuivre à embouchure, pavillon et coulisse mobile produisant une succession de notes chromatiques sur sept positions. Or, la première illustration d’un tel instrument nous vient d’une peinture d’une église de Rome, The Assumption of the Virgin de Filippino Lippi, datant de 1490.
1450-1700
Sous l’emprise du facteur d’instruments Neuschel à Nuremberg, la sacqueboute apparaît de la trompette naturelle, et passe rapidement outre les problèmes techniques (justesse des rapports et fluidité de la coulisse) pour se développer et envahir les cours musicales. Bientôt, chaque troupe possédera ses sacqueboutiers. Et dans l’Europe entière, les compositeurs l’intègrent à leurs œuvres. Instrument prestigieux et majestueux (sonorité claire, formes sculptées argentées et aurifiées), il inspire les compositions cérémonielles et religieuses. G.Gabrieli (Italie) et S.Scheidt (Hollande) le joignent aux cornets à bouquin pour de grandes sonneries en chœurs (le plus célèbre est une de Gabrieli dans laquelle évoluaient trois chœurs de quatre sacqueboutes). Schütz (Hollande), inspiré par le chant, remarque que les polyphonies lentes s’appliquent extraordinairement aux sonorités riches des sacqueboutes. Et même plus tard, ce nouvel instrument intègre l’orchestre : L’Orfeo de Monteverdi (1607) et le Te Deum de Lully (1677) utilisent les sons graves et puissants pour évoquer les enfers.

Trombone ténor du xviie siècle signé Georg Ehe de Nuremberg Le sacqueboutier devient alors musicien de cour à part entière. Son niveau de vie dépendant de ses qualités de musicien, il développe sa technique instrumentale pour inciter les compositeurs à écrire avec lui. Ainsi, la sacqueboute devait pouvoir se fondre dans les sonorités des violes ou du clavecin : le son était petit (le pavillon étroit et directionnel n’était qu’un prolongement de la coulisse), le jeu très léger et très articulé (peu d’air dans l’instrument, une embouchure étroite et peu profonde soulignait le travail de la langue), et la technique de coulisse pleine de dextérité (de même que pour le cornet à bouquin ou la flûte, le sacqueboutier maîtrisait les ornementations). Dans un esprit complémentaire, le pupitre d’orchestre se divise en trois voix : la sacqueboute alto (en ré), la sacqueboute ténor (en la) et la sacqueboute basse (en mi ou en ré). Ainsi, de la musique religieuse (évocation des enfers, doublure des voix de chœur) à la musique cérémonielle (les fanfares épiques), la sacqueboute a su séduire la musique de la Renaissance puis baroque.

Trombone baroque 1700-1800
Durant ce siècle, le développement de l’instrument est plus humble. En effet, soit par manque de musiciens compétents pour inspirer l’écriture, soit par désintérêt des compositeurs, les œuvres avec sacqueboute sont plus rares.
Seules les cours de Vienne et Salzbourg entretiennent encore leur pupitre de sacqueboutes. Mais le rôle de l’instrument en orchestre change : il devient soliste (surtout l’alto) ; il n’est pas rare de voir des œuvres religieuses avec solo de sacqueboute (deux sacqueboutes – alto et ténor – solo dans le Requiem de Reutter – 1709-1772 –, un sacqueboute ténor dans le Tuba Mirum du Requiem de Mozart).

Trombone soprano du xviiie siècle, signé J. F. Schwabe de Leipzig La technique instrumentale, plus à découvert, s’adapte donc (toujours sous l’influence de la famille Neuschel) : le pavillon s’évase, il devient moins directionnel, le son s’élargit tout en restant très articulé et donne naissance au trombone. L’épanouissement sonore de l’instrument suscite même la composition d’œuvres pour trombone solo : Léopold Mozart (1719-1787), Georg Wagenseil (1715-1747), et Georg Albrechtberger (1736-1809) composent des concertos pour trombone alto. Dans l’orchestre, la présence des trombones s’affirme : Mozart les emploie dans ses opéras (Don Giovanni, La Flûte enchantée), Beethoven dans ses symphonies (la Pastorale et surtout la Neuvième) et Haydn pour La Création.
Période creuse pour certains, le xviiie siècle reste indéniablement très fructueux pour le répertoire soliste du trombone.
1800-1850
Ce début de xixe siècle n’est que l’aboutissement du précédent : le trombone ne parvient plus à s’affirmer autant que les bois ou les cordes dans les symphonies. Bien sûr toujours très utilisé, son rôle devient très précis dans l’orchestre. Les soli disparaissent au profit de tutti de pupitre. L’emploi des trombones est alors dans le but de créer des effets sonores harmoniques encore renforcés par le développement du son des instruments (élargissement des pavillons, l’embouchure plus profonde apporte la rondeur des timbres, Wagner emploie même le trombone contrebasse). Ainsi Berlioz offre-t-il une part importante au trombone dans son Te Deum (ils sont répartis en fanfares aux quatre points cardinaux de l’église pour produire un effet spatial impressionnant) ou dans sa Symphonie fantastique (ils imagent la marche au supplice).
Hector Berlioz décrit le trombone (dans son Traité d’Orchestration) : « […] Le trombone est, à mon sens, le véritable chef de cette race d’instruments à vent que j’ai qualifiés d’épiques. Il possède en effet au suprême degré la noblesse et la grandeur ; il a tous les accents graves ou forts de la haute poésie musicale, depuis l’accent religieux, imposant et calme, jusqu’aux clameurs forcenées de l’orgie. Il dépend du compositeur de le faire tour à tour chanter un chœur de prêtres, menacer, gémir sourdement, murmurer un glas funèbre, entonner un hymne de gloire, éclater en horribles cris, ou sonner sa redoutable fanfare pour le réveil des morts ou la mort des vivants.
On a pourtant trouvé moyen de l’avilir, il y a quelque trente années, en le réduisant au redoublement servile, inutile et grotesque de la partie de contrebasse. Ce système est aujourd’hui à peu près abandonné, fort heureusement. Mais on peut voir dans une foule de partitions, fort belles d’ailleurs, les basses doublées presque constamment à l’unisson par un seul trombone. Je ne connais rien de moins harmonieux et de plus vulgaire que ce mode d’instrumentation. Le son du trombone est tellement caractérisé, qu’il ne doit jamais être entendu que pour produire un effet spécial ; sa tâche n’est donc pas de renforcer les contrebasses, avec le son desquelles, d’ailleurs, son timbre ne sympathise en aucune façon. De plus il faut reconnaître qu’un seul trombone dans un orchestre semble toujours plus ou moins déplacé. Cet instrument a besoin de l’harmonie, ou, tout au moins, de l’unisson des autres membres de sa famille, pour que ses aptitudes diverses puissent se manifester complétement. Beethoven l’a employé quelquefois par paires, comme les trompettes ; mais l’usage consacré de les écrire à trois parties me parait préférable. […]
Dans le forte simple, les trombones, en harmonie à trois parties, dans le médium surtout, ont une expression de pompe héroïque, de majesté, de fierté, que le prosaïsme d’une mélodie vulgaire pourrait seul atténuer et faire disparaitre. Ils prennent en pareil cas, en l’agrandissant énormément, l’expression des trompettes ; ils ne menacent plus, ils proclament, ils chantent au lieu de rugir. Il faut remarquer seulement que le son du trombone basse prédomine toujours plus ou moins, en pareil cas, sur les deux autres, surtout si le premier est un trombone alto1.
Dans le mezzo forte du médium, à l’unisson ou en harmonie avec un mouvement lent, les trombones prennent le caractère religieux. Mozart, dans les chœurs des prêtres d’Isis, de la Flute enchantée, a produit d’admirables modèles de la manière de leur donner la voix et les allures pontificales2.
Le pianissimo des trombones appliqué à des harmonies appartenant au mode mineur est sombre, lugubre, je dirais presque hideux. Dans le cas surtout ou les accords sont brefs et entrecoupés de silences, on croit entendre des monstres étranges exhaler dans l’ombre les gémissements d’une rage mal contenue. On n’a jamais, à mon sens, tiré un parti plus dramatique de cet accent spécial des trombones, que le fit Spontini dans son incomparable marche funèbre de la Vestale : « Périsse la vestale impie ! » et Beethoven dans l’immortel duo du second acte de Fidelio chanté par Léonore et le geôlier creusant la tombe du prisonnier qui va mourir3.
L’habitude prise aujourd’hui par quelques maitres de former un quatuor des trois trombones et de l’ophicléide, en confiant à celui-ci la vraie basse, n’est peut-être pas irréprochable. Le timbre des trombones, si mordant, si dominateur, n’est point le même il s’en faut, que celui de l’ophicléide, et je crois qu’il est beaucoup mieux de ne faire que redoubler la partie grave par cet instrument, où, tout au moins, de donner une basse correcte en écrivant leurs trois parties comme si elles devaient s’entendre seules.
Gluck, Beethoven, Mozart, Weber, Spontini, et quelques autres, ont compris toute l’importance du rôle des trombones ; ils ont appliqué avec une intelligence parfaite à la peinture des passions humaines, à la reproduction des bruits de la nature, les caractères divers de ce noble instrument ; ils lui ont en conséquence conservé sa puissance, sa dignité et sa poésie. Mais le contraindre, ainsi que la foule des compositeurs le fait aujourd’hui, à hurler dans un credo des phrases brutales moins dignes du temple saint que de la taverne, à sonner comme pour l’entrée d’Alexandre à Babylone quand il ne s’agit que de la pirouette d’un danseur, à plaquer des accords de tonique et de dominante sous une chansonnette qu’une guitare suffirait à accompagner, à mêler sa voix olympienne à la mesquine mélodie d’un duo de vaudeville, au bruit frivole d’une contredanse, à préparer, dans les tutti d’un concerto l’avènement triomphal d’un hautbois ou d’une flute, c’est appauvrir, c’est dégrader une individualité magnifique ; c’est faire d’un héros un esclave et un bouffon ; c’est décolorer l’orchestre ; c’est rendre impuissante et inutile toute progression raisonnée des forces instrumentales ; c’est ruiner le passé, le présent et l’avenir de l’art ; c’est volontairement faire acte de vandalisme, ou prouver une absence de sentiment de l’expression qui approche de la stupidité. »

Trombone « romantique » du xixe siècle, d’origine belge Seulement, le trombone fuit peu à peu cette musique fastueuse (grands orchestres, grands effets grande salles) que privilégie la bourgeoisie. Les pupitres voient peu à peu disparaître les trombones altos et basse au profit de trois ténors plus homogènes (intonations et sons identiques). Sous l’influence des facteurs parisiens Courtois et Couesnon, le trombone s’installe même dans de nouvelles tonalités (mi bémol pour l’alto, fa pour le basse et surtout si bémol au ténor), plus douces à l’oreille et plus faciles d’intonation. Le trombone se popularise. Un concerto est composé par David (1810-1873) pour trombone ténor, puis un autre Morceau symphonique par Guilmant (1873-1911) : leur style est marqué, allant, rigoureux.
Le trombone s’oriente vers une musique plus proche du tout un chacun, des basses classes sociales, où il va séduire une société ouvrière en pleine croissance.
1850-1900
C’est l’époque où se développent de nouveaux genres musicaux et de nouveaux orchestres : les ensembles militaires, les harmonies et autres fanfares fleurissent autour des nouvelles villes industrielles. À ce moment, le trombone doit son départ à tous ces musiciens amateurs qui aiment se divertir à le jouer.
Certes, les qualités techniques pâtissent du manque de finesse de ces musiques (le détaché dur et le manque d’air produisent des sons si agressifs que l’on demande au tromboniste de jouer vers le sol pour l’atténuer !), mais l’instrument à présent plus populaire stimule les fabricants qui essayent toutes sortes de modifications techniques (des pistons à la place de la coulisse, etc.) et inspire les compositeurs, notamment Rimsky-Korsakov qui compose un concerto pour trombone et harmonie. Cette fin de siècle marque ainsi le début de l’éclectisme musical dans lequel va évoluer dorénavant le tromboniste. En effet, alors que Franck et Saint-Saëns le valorisent dans la Symphonie en ré mineur et la Troisième Symphonie en ut pour orgue (1888 et 1889), les amateurs affirment la présence du trombone dans les musiques de kiosque (marches, chansons) ou de danse (polkas, valses…).
1900-1960
Les années 1900 furent pour les trombonistes une source immense d’inspiration. La musique populaire y évolue en effet presque aussi rapidement que les saisons, et le tromboniste, redevenu musicien professionnel, travaillant au cachet, s’engouffre dans toutes les aventures musicales qui apparaissent. On dit que le glissando viendrait de l’époque où les trombonistes, assis sur les camionnettes accompagnant les parades aux États-Unis, remontaient la coulisse en jouant pour éviter les piliers de ponts… Ceci paraît futile, mais une chose est certaine : la technique trombonistique doit beaucoup au jazz et aux jazzmen.
Kid Ory se lance à La Nouvelle Orléans vers 1900 dans les premiers chorus de trombone grâce à la technique savonneuse qui consistait à chercher les bonnes notes par le glissando. Plus sérieusement, il est le premier à créer et jouer les sourdines : la bouteille pour le son bouché et la ventouse pour l’effet wah-wah.
Plus vers 1930, Jack Teagarden (1905-1965) s’inspire des solos de Louis Armstrong pour donner au trombone une sonorité plus ronde, moins militaire, avec un vibrato et une dextérité de coulisse depuis longtemps oubliée. Il est le précurseur de la technique « plein air » qui rapproche le trombone de la tradition vocale.
Vers 1950 avec le « bop » et le « hard bop », des trombonistes tels que Kai Winding, J. J. Johnson, ou « Slide » Hampton tentent de passer outre les limites de vitesse fixées par la coulisse. Ils travaillent sur la vélocité harmonique et sur les jeux rythmiques pour copier le phrasé du sax et ainsi figurer dignement aux côtés de Charlie Parker dans les Jam Sessions. (Certains tentent aussi d’associer un piston au jeu de coulisse, mais renoncent vite face à la difficulté d’utilisation !) En France aussi dans les années 1920, des trombonistes d’orchestres classiques s’essaient à la variété et au jazz, et ce cumul de divers genres musicaux inspire certains compositeurs. Ainsi, nombre de partitions sont écrites au regard du jazz. L’exemple le plus connu est celui du Boléro de Ravel, dans lequel le solo de trombone est pensé d’après et pour le style de Léo Vaughant (des aigus très larges, faciles et flottants…) ; Bernstein aussi s’inspire du jazz dans toute son œuvre et notamment dans la pièce pour trombone seul et pulsation du pied Elegy for Mippy ii.
Encore un peu plus tard, le trombone classique inspire à nouveau des compositeurs tels que Milhaud (1892-1974 – Concertino d’Hiver), Saint-Saëns (1835-1921 – Cavatine), Hindemith (1895-1963 – Sonate), Jacob (Concerto), F.Martin (1890-1974 – Ballade) et Tomasi (1901-1971 – Concerto) qui enrichissent le répertoire soliste du trombone.
Trombone moderne
Depuis 1960, dans une fin de siècle où le mélomane a des difficultés à comprendre la musique de son époque, on assiste à l’épanouissement du trombone et à un retour à ses traditions. Il réapparaît dans quasiment toutes les formes d’expression musicale :
1. Le jazz ne cesse d’innover. Du développement de la respiration continue (Jimmy Cleveland vers 1960) au mélange des sonorités du violoncelle et du trombone (Glenn Ferris – 1995), le tromboniste explore les profondeurs du néoclassicisme moderne (Bill Watrous et la multiphonie en 1980 – voix et vibrations amplifiées dans le trombone–, Albert Mangelsdorff et les chorus harmoniquement libres).
2. Les trombonistes viennent enrichir la chanson de variété, en soliste ou en section. Le trombone est utilisé de Gainsbourg (Black Trombone) à Nougaro (Nougayork), et de James Brown à Sting.
3. La musique contemporaine développe encore le répertoire soliste : Folke Rabe, Odette Gartenlaub ou Luciano Berio composent Basta, Essai ou Sequenza 5 pour trombone solo ; Pierre Boulez utilise le trombone (Benny Sluchin dans ses créations de l’Ensemble intercontemporain).
4. On assiste à l’émergence de trombonistes solistes de carrière (M. Becquet, G. Millière et B. Slokar depuis 1975, J. Mauger depuis 1990 et surtout C. Lindberg dit « le Paganini du trombone » depuis 1980) qui offrent le trombone au grand-public.
5. La musique baroque effectue depuis 1980 un grand retour : des sacqueboutiers professionnels (D. Lassal, les Sacqueboutiers de Toulouse, J. Herbin, S. Legée…) commencent même à former des élèves dans les conservatoires.
6. Les trombones d’orchestre trouvent une puissance encore jamais égalée, dynamisée par l’expression du volume des salles de concert et par l’apparition de nouveaux fabricants : Bach et Edwards aux États-Unis, Besson en Angleterre, Yamaha au Japon et toujours Courtois et Selmer en France. La mécanique instrumentale recommence à évoluer. Dans les années 1960, le trombone ténor s’équipe d’une valve transpositeur si bémol/fa, et les coulisses s’élargissent en plus des embouchures plus profondes et des tubes moins enroulés qui augmentent la portée du son.
Aujourd’hui
Après près de cinq cents ans, le trombone semble avoir atteint son apogée. Il est virtuose, puissant et populaire. Le come-back de la sacqueboute pourrait même faire penser à un bilan. Depuis le xve siècle, le trombone et les trombonistes sont toujours portés par les tendances musicales et les idées novatrices, ainsi la technique de jeu est sans cesse en mutation. À l’approche du xxie siècle, on assiste à un retour de la douceur, au phrasé chantant, après les années 1970-1980 plus rigides et rythmiques. Pourtant, malgré toutes ces évolutions, seul le tromboniste a changé avec le temps, car le trombone de l’an 2000, lui, reste fondamentalement le même que la sacqueboute de 1450 : une embouchure, une coulisse de sept positions et un pavillon.
- l’ouverture des Francs Juges, mesure 20 et suivantes, mesure 100 et suivantes ; ↩︎
- Symphonie fantastique, quatrième mouvement, mesure 78 et suivantes, 114 et suivantes ; cinquième mouvement, mesure 147 et suivantes ; ↩︎
- Roméo et Juliette, premier mouvement, mesure 45 et suivantes, 79 et suivantes ; sixième mouvement, mesure 160 et suivantes ; ↩︎
— Symphonie funèbre et triomphale, passim, et notamment le solo du deuxième mouvement ;
— Marche hongroise de la damnation de Faust, mesure 94 et suivantes.
-
Le TanaCello, un instrument polyvalent dans l’apprentissage du violoncelle
Résumé
Tout au long de son histoire, le violoncelle s’est développé grâce aux relations étroites existant entre les interprètes, les luthiers et les compositeurs. Avec l’apparition de la musique mixte, de nouvelles contraintes sont apparues, liées à l’interaction interprète/électronique. Construit récemment en collaboration avec le compositeur Juan Arroyo et le luthier Lucas Balay, d’après un concept d’Adrien Mamou-Mani, le violoncelle hybride pourrait être une réponse à certaines de ces questions. Le violoncelle hybride pourrait aussi être un atout dans l’apprentissage du violoncelle, tant au niveau de l’intégration du répertoire avec électroniques, qu’à un niveau purement pédagogique.
Introduction
Tout au long de son histoire, le violoncelle n’a cessé de se développer grâce aux relations existant entre les interprètes, les luthiers et les compositeurs. Ce triangle a permis d’apporter de nombreuses modifications sur la facture instrumentale selon les critères esthétiques propres à chaque époque. L’impact de ces modifications et la création de nouveaux répertoires musicaux ont engendré de nouvelles techniques instrumentales. La question de la transmission de ces nouvelles techniques a incité de nombreux pédagogues (Duport, Popper, Dotzauer, Feuillard, Palm) à créer des méthodes adaptées pour ces nouveaux besoins afin que leurs élèves puissent y avoir accès.
Avec l’apparition de la musique mixte dans la deuxième moitié du xxe siècle, le compositeur peut ajouter à son univers musical de nouvelles techniques issues de l’électronique puis de l’informatique musicale. Cette extension du langage musical entraîne de nouvelles contraintes tant pour les interprètes que pour les compositeurs. En effet, la question de l’interaction entre le jeu instrumental et l’électronique apparaît, les sources de diffusion du son ne sont plus clairement identifiables, la logistique nécessaire aux répétitions nécessite un équipement adéquat, l’obsolescence des programmes informatiques pose la question de la pérennité de ce répertoire et de sa transmission. Malgré l’extension de ce répertoire les problèmes perdurent. Parallèlement à cette nouvelle écriture musicale, la facture instrumentale semble se figer et être peu en adéquation avec les recherches et problématiques des interprètes et compositeurs contemporains.
Avec l’apparition de l’hybridation instrumentale, concept utilisé par le chercheur Adrien Mamou-Mani et développé en collaboration avec le compositeur Juan Arroyo et le luthier Lucas Balay, consistant à enrichir les propriétés acoustiques du violoncelle par des propriétés électroniques, notamment par l’intégration d’un actionneur dans sa caisse de résonance, de nouvelles questions apparaissent quant à son utilisation et son intégration dans le monde musical actuel. L’instrument est dit hybride, car il peut diffuser deux sources sonores de natures distinctes (instrumentale et électronique) à partir d’un seul corps sonore : sa propre caisse de résonance. Le son résultant est dit hybride. Ce nouvel instrument, le TanaCello1, pourrait être une réponse à plusieurs des problématiques citées auparavant, mais également une source de réflexion sur son utilisation en pédagogie dans l’apprentissage du violoncelle. En effet, comment ces nouvelles technologies, utilisées comme outils pédagogiques, peuvent-elles à la fois améliorer les méthodes d’apprentissages existantes et en développer de nouvelles afin de guider l’étudiant dans son développement ?
1. L’évolution de la facture du violoncelle
Le violoncelle naît à Brescia dans la région de Crémone en Italie entre 1520 et 1550 dans les ateliers des maîtres luthiers Gasparo da Salò (1542-1609), Andrea Amati (1505) et Giovanni Paolo Maggini (1581). Inspirée à la fois par la viole de gambe (pour les dimensions conservées plus ou moins identiques) et par le violon ou violino (nombre de cordes, proportions, fond cintré, absence de frettes), la facture du violoncelle s’est perfectionnée au fil des ans grâce au travail des luthiers. Leur travail a consisté, du moins au début, à perfectionner le violoncelle afin que sa sonorité puisse égaler, dans le registre grave des basses, les sonorités riches et puissantes des violons. Deux écoles, celle de Brescia (da Salò, Maggini, Rogeri) et celle de Crémone (Amati, Stradivarius) rivalisaient à l’époque dans la construction des instruments à cordes.
Gasparo da Salò, luthier et contrebassiste virtuose, issu d’une famille de musiciens reconnus en Italie, est connu pour ses premiers modèles de violoncelle (largeur 76 cm, longueur 71 cm) puissants et permettant une réponse d’attaque rapide. À cette époque, les violons jouaient régulièrement en plein air lors des processions, rivalisant avec les cornets et les trombones. La puissance de l’instrument était primordiale pour l’instrumentiste. Antonio Stradivarius (1644-1737) va expérimenter la forme du violoncelle dite forme en B et sera celui qui fixa les dimensions encore aujourd’hui universellement adoptées (longueur 76 cm, largeur 44 cm).
Les musiciens italiens se sont rapidement emparés de ce nouvel instrument qui comblait le manque de sonorité de la viole de gambe dans leurs orchestres.
Les musiciens, souvent également compositeurs, vont écrire pour leur instrument, permettant ainsi de repousser leurs prouesses techniques chaque fois plus loin. Les transformations et les développements techniques du jeu du violoncelle sont directement associés aux grands virtuoses qui jalonnent l’histoire de la musique et plus spécifiquement celle du violoncelle. Il est important de souligner que très peu de concertos majeurs ont été composés pour le violoncelle avant le xixe siècle hormis ceux de Vivaldi, Haydn, C.P.E. Bach et Boccherini. En effet, souvent réduit à des fonctions harmoniques et rythmiques dans les accompagnements, le rôle du violoncelle s’est émancipé au sein de l’orchestre dans les symphonies de Beethoven. Cependant, les grands violoncellistes tels que Luigi Boccherini, Jean-Louis Duport, François Servaix, Carl Davidoff feront connaître le violoncelle comme instrument soliste en lui composant des concertos. Parmi les transformations et développements techniques qui ont fait passer le violoncelle de l’époque dite baroque à l’époque moderne voici les plus importantes.
- La technique dite du pouce révolutionna la technique de jeu du violoncelle. Elle a été empruntée à la trompette marine et aurait été développée par Francesco Alborea dit Franciscello (1691-1739), violoncelliste virtuose.
- La longueur de touche s’est allongée progressivement afin de pouvoir jouer dans le registre aigu et développer la technique du pouce. Luigi Boccherini, (1743 à Lucques – 1805 à Madrid) fut probablement à l’origine de cette modification.
- L’invention de la pique a permis une plus grande stabilité et aisance dans le jeu. Elle daterait du xviiie siècle et plusieurs modèles sont utilisés.
- Le « la » est passé de 415 Hz (baroque) à 430 Hz (classique) puis à 440-442 Hz (moderne). Cela a entraîné une modification de la barre d’harmonie solidifiant la table de l’instrument, la pression sur la caisse de résonance ayant été augmentée.
- La forme du chevalet n’a de cesse d’évoluer. Aujourd’hui encore, suivant la projection sonore désirée, les modèles proposés varient (chevalet français, belge entre autres).
- L’âme a vu son diamètre augmenter depuis sa création.
Depuis sa création, le violoncelle n’a cessé de connaître des évolutions, des modifications techniques facilement adoptées ou non par les violoncellistes. L’instrument en lui-même, bien que déjà utilisé communément en Italie, restait fort peu joué en France (où il fut introduit aux alentours de 1725) où la viole de gambe lui était préférée. Il faudra attendre la venue de Luigi Boccherini en 1768 au Concert Spirituel à Paris pour que l’engouement se généralise. Au début, les instrumentistes français ont continué à jouer parallèlement de la viole de gambe, et ont adapté leur répertoire sur le violoncelle. Puis, progressivement, ils se sont spécialisés. Le violoncelle était alors joué sans pique et était tenu comme la viole de gambe. L’usage de la pique n’a obtenu que très tardivement l’approbation générale. En effet, en France les maîtres du Conservatoire n’acceptaient pas les élèves utilisant la pique. En 1846, lors de sa venue à Paris, le célèbre violoncelliste belge François Servais avait le violoncelle posé sur une pique et tous les étudiants voulurent l’imiter au grand mécontentement des maîtres qui continuèrent à s’entêter jusqu’à la nomination de Jules Delsart en 1884 et celle de Hyppolite-François Rabaud. La pique prendra diverses formes et aujourd’hui encore les violoncellistes peuvent en choisir la forme et le matériau par exemple.
De nos jours, certains luthiers continuent d’expérimenter le design de la caisse de résonance, mais cela relève plus souvent de l’art sculptural que d’une réelle amélioration au niveau acoustique. Pierre Boulez écrit :
[…] la facture instrumentale est figée parce que la demande pour le répertoire classique doit satisfaire avant tout les normes d’une musique composée depuis longtemps, qui utilise des instruments dont la conception remonte aisément à deux siècles et plus (Boulez, 1995, p. 70).
Avec l’apparition de la musique électronique au xxe siècle, les champs de création se sont élargis pour les compositeurs leur offrant ainsi la possibilité, au fur et à mesure des progrès technologiques, d’allier les sons acoustiques et les sons électroniques au sein d’une même œuvre.
2. La musique mixte
La musique mixte allie une partition électronique et une partition instrumentale. L’électronique peut être générée soit en temps réel, soit en temps différé. Depuis leur apparition, les logiciels de programmation musicale n’ont cessé de se perfectionner, des centres de recherches se sont créés partout dans le monde afin de développer et d’améliorer les langages de l’informatique musicale. Dans ces nouvelles partitions musicales, il n’y a plus une mais plusieurs sources sonores de projection du son, générant de nouvelles problématiques propres à cette nouvelle musique. Celles-ci sont autant musicales que logistiques.
La réflexion sur la place de l’interprète et celle de l’électronique est primordiale. En effet, la place de l’interprète est bousculée. Il n’est plus seul maître de la gestion du résultat sonore, les haut-parleurs modèlent l’espace de projection du son.
Pour Hugues Dufourt, le problème central reste le rapport entre « le texte du programme informatique et le texte instrumental – qui, le plus souvent ne fusionnent pas ou ne fusionnent que par accident » (Dufourt, 1995, p. 64-65).
Plusieurs facteurs rendent fragile le résultat présenté en concert, notamment l’appropriation des traitements par l’interprète lui-même ainsi que la logistique des répétitions.
En effet, cette appropriation de l’électronique comme une entité de jeu à part entière reste peu contrôlée par l’interprète. Au cours de sa formation, ce dernier n’est que rarement, voire pas du tout, confronté à cette nouvelle musique. Le geste instrumental déclenchant la réaction d’un traitement n’est pas naturellement intégré au jeu instrumental et demanderait une connaissance de la partition électronique. Pour comprendre et analyser une partition électronique, il faudrait acquérir une formation en informatique musicale, en programmation musicale ce qui ne fait pas partie, pour l’instant, du cursus de formation de l’interprète. En découle la difficulté, pour les interprètes, de connaître réellement la partition électronique. De surcroît, celle-ci est rarement ou succinctement décrite dans la partition transmise à l’interprète. D’où la sensation, souvent, de jouer un « solo » alors qu’il s’agit d’un duo avec électronique. Cela reviendrait à travailler une sonate sans connaître la partition de piano et de ne découvrir cette dernière que lors de répétitions finales, ce qui semble évidemment absurde.
La logistique indispensable aux répétitions est une autre difficulté freinant la transmission de ce répertoire. En effet, seuls les centres de recherche en informatiques musicales et quelques conservatoires disposent du matériel nécessaire pouvant accueillir les interprètes. La présence d’un Réalisateur en Informatique Musicale, d’un ingénieur du son, et la mise à disposition de matériel adapté (microphones, haut-parleurs, ordinateurs équipés des logiciels requis, câbles…) rendent l’accès à la musique mixte peu aisé. Ces difficultés ne facilitent pas la diffusion du répertoire. En effet, pour être jouée, une pièce mixte demande une logistique très importante qui n’est pas à la portée de toutes les salles de concert.
2.1. L’HyperCello
À la recherche de solutions pour remédier à ces problématiques, plusieurs travaux ont abouti à la création de nouveaux instruments tels que, entre autres, l’« HyperCello » de Tod Machover construit au MIT Media Lab en 1993.
Dans les années 1990, le compositeur Tod Machover cherche à contrôler certains paramètres de jeu du violoncelliste et à leur faire correspondre des traitements en temps réel. Le but musical est de permettre au musicien de jouer en concert une musique électronique complexe combinant la performance avec la qualité studio. Cela aboutit à la création de sa pièce Begin Again Again, le 14/08/1991 à Tanglewood (USA) par Yo-Yo Ma.
Avec l’HyperCello, Tod Machover arrive à détecter et à contrôler cinq paramètres de jeu : la pression de l’archet, la position de l’archet sur les cordes, l’orientation du poignet droit (celui de l’archet) et les positions des doigts sur la touche. L’électronique est alors plus en adéquation avec le jeu de l’interprète. L’utilisation de cet instrument semble cependant se limiter au seul projet initial et aux projets du compositeur Tod Machover. Aucun autre interprète, ni aucun autre compositeur n’ont composé ensuite pour l’HyperCello.
Ces recherches permettent de créer plus de souplesse dans la partition électronique et redonnent une place d’interprète à l’instrumentiste. Cependant la dichotomie des sources sonores persiste, les problèmes de logistiques et d’autonomie de l’interprète également. L’idée d’un instrument capable de s’auto-suffire, permettant de jouer ce répertoire mixte apparaît. Le concept de l’instrument permettant de diffuser au travers de sa propre caisse de résonance l’électronique en même temps que son propre son acoustique, supprimant ainsi les haut-parleurs externes, est développée à l’IRCAM par le chercheur Adrien Mamou-Mani au sein de l’équipe d’Acoustique Instrumentale. C’est l’instrument hybride.
2.2. L’instrument hybride
Le principe de l’instrument hybride est basé sur « l’utilisation d’instruments acoustiques contrôlés par feedback avec du traitement et de la synthèse sonore, en vue d’étendre les possibilités sonores des instruments. Le son final est ainsi hybride. Il provient de la superposition de la vibration acoustique (ou mécanique) et de son traitement numérique. Un avantage important de ces instruments est que l’interface avec le musicien reste l’instrument acoustique, tout en incluant les potentialités de la synthèse sonore2. »
Construit avec l’aide du luthier Lucas Balay, le TanaCello est un prototype d’instrument hybride conçu par le compositeur Juan Arroyo d’après le concept d’Adrien Mamou-Mani.

Figure 1. Vue de l’intérieur du violoncelle
© Lucas BalayL’actionneur est collé sur le fond de la caisse et est relié par un câble XLR à la carte son. C’est grâce à lui que s’effectue la diffusion du son électronique. Un microphone de marque Shadows est quant à lui positionné sous les pieds du chevalet. Il permet la captation du son.
Le TanaCello permet d’apporter une réponse à plusieurs problématiques liées à la musique mixte : de par l’allègement du dispositif électroacoustique, il offre la liberté d’organiser des concerts de musique mixte dans des salles non équipées, et de manière autonome pour les interprètes, offrant ainsi la capacité d’une plus grande diffusion de ces productions avec électronique. Il permet de recréer un espace sonore où l’instrumentiste se réapproprie l’attention de l’écoute du son, où la source n’est plus détachée de sa projection. L’interprète se réattribue l’expertise du résultat sonore dans sa globalité, il peut contrôler l’électronique comme une entité de jeu au même titre que la justesse, les timbres, les nuances. L’interprète peut répéter facilement et de manière autonome, sans nécessité d’un lieu équipé. La connaissance de la partie électronique, de par la possibilité de répéter, s’en trouve considérablement améliorée.
Cependant, la puissance délivrée reste faible comparée à celle des haut-parleurs et l’électronique se trouve colorée par la caisse de résonance de l’instrument. Cela induit une nouvelle conception de la musique mixte, plus chambriste. Pour l’instant, la limite principale rencontrée est la facture médiocre du TanaCello. En effet, les tests ont été effectués sur un violoncelle n’ayant aucune valeur et n’ayant par conséquent que très peu de potentiel de richesses sonores. Cela limite probablement le rayonnement de la partie électronique, celle-ci s’appropriant les propriétés acoustiques de l’instrument.
2.3. La musique mixte dans l’enseignement
Lors de l’année académique 2012-2013, un projet autour du répertoire violoncelle et électronique a été réalisé avec la classe de violoncelle du Conservatoire Royal de Musique de Liège en collaboration avec le Centre de Recherche Henri Pousseur3. Il s’agissait d’initier les étudiants à la musique dite mixte, à travers l’étude de pièces de jeunes compositeurs issus des classes de composition de Michel Fourgon (Liège), de Luis Naon (CNSMDP) et du Cursus 1 de l’IRCAM. Le programme mélangeait à la fois des pièces solos et des pièces d’ensemble. Hormis pour les pièces d’ensemble, composées spécialement pour le projet, des vidéos et enregistrements étaient mis à disposition des étudiants. Tout au long de la préparation de ce projet de nombreuses difficultés sont apparues :
En tout premier lieu, ce fut l’approche face à ce nouveau langage contemporain. Pour la majorité des étudiants, c’était une grande découverte et il a donc fallu leur « traduire » les informations afin qu’ils puissent déchiffrer et commencer leur travail.
La deuxième difficulté résidait dans la compréhension musicale globale des pièces, et ce pour deux raisons : la première était que les partitions à leur disposition ne comportaient que succinctement, ou pas du tout, d’indications sur le contenu électronique. Cela revenait à travailler la partie 1 d’un duo sans en connaître la partie 2. Cela paraît absurde. La deuxième difficulté était que sans accès à l’électronique dans leur travail personnel, ni durant les premiers cours, il leur était impossible d’imaginer la partie électronique ni l’impact de leurs gestes sur les différents traitements et ce malgré les enregistrements disponibles.
Constatant les difficultés à se mettre au travail même pour les étudiants habituellement studieux, une session de répétition avec électronique fut rapidement organisée au Centre Henri Pousseur à Liège afin qu’ils découvrent, écoutent et comprennent comment, de leurs gestes, de leur précision de timbre (ponticello, tasto), de nuances, et de rythme dépendait le résultat global de la pièce, comme si l’électronique reflétait chaque geste, grossissant de même les imperfections.
L’importance du geste musical était ici mise en lumière de manière brute et évidente.
À travers cette expérience, le travail avec la musique mixte s’est avéré bénéfique pour plusieurs aspects de leur jeu aussi bien dans les partitions contemporaines que pour le répertoire classique. Assurément, la notion du geste instrumental mis en lumière par l’électronique leur a permis d’en comprendre toute l’importance dans tous les répertoires, la notion de pulsation imposée parfois par l’électronique les a obligés à décentrer leur écoute et à affiner leur ressenti auditif. Tous ces aspects positifs ont été contrebalancés par les difficultés d’organisation. Ce type de projet par ailleurs bénéfique pour les étudiants reste donc ponctuel.
À la suite de cette expérience, le TanaCello semblerait une solution plus accessible pour aborder le répertoire mixte dans l’apprentissage du violoncelle. Pour commencer, la mise à disposition d’un TanaCello dans les conservatoires permettrait aux classes de violoncelle d’intégrer le répertoire mixte plus facilement. L’élève pourrait ainsi, dans un premier temps, répéter avec son professeur puis répéter seul en réservant l’instrument. Certains conservatoires proposent la location ou le prêt d’instruments pour les étudiants, en imaginant que l’on remplace un violoncelle abîmé par un TanaCello, progressivement les instruments mis à disposition par le conservatoire pourraient être équipés du système hybride.
3. La musique acoustique
Dans la musique instrumentale, et plus spécifiquement dans les pièces pour violoncelle seul, la source sonore est unique. Elle provient de la caisse de résonance de l’instrument. La mise en vibration de cette dernière s’opère par la corde qui transmet, via le chevalet, la vibration qui lui est imposée soit pas l’archet soit par un impact (pizz). Dans l’apprentissage du violoncelle, deux grandes catégories de paramètres mécaniques sont enseignées : ceux effectués par le bras droit du violoncelliste et liés à l’archet et ceux réalisés par sa main gauche.
Pour parvenir à contrôler l’archet, l’élève doit maîtriser trois paramètres :
- la position de l’archet sur la corde (ordinario, sul tasto, sul ponticello) ;
- la force de pression exercée sur l’archet ;
- la vitesse de déplacement de l’archet sur la corde ;
- la combinaison de ces trois paramètres permet d’obtenir un son infiniment varié.
Avec l’évolution des langages musicaux, la notion du son s’est transformée. Ainsi, suivant le type de répertoire, l’étudiant doit apprendre à choisir la combinaison adéquate.
La main gauche permet principalement de contrôler la hauteur des notes. L’élève doit apprendre à maîtriser ce qui est appelé communément « son manche » en se laissant guider par son oreille. Pour cela, il doit « éduquer » son oreille. L’apprentissage porte sur plusieurs paramètres : la justesse, la connaissance du manche (positions, écarts entre les doigts), les démanchés qui permettent de se déplacer sur le manche d’une position à l’autre, et le vibrato qui permet de donner l’expressivité à la note.
Mêlés à ces paramètres mécaniques, l’élève doit également développer des compétences autour des paramètres liés à l’interprétation musicale tels que le rythme, la conscience corporelle de la pulsation et l’écoute.
Étant donné que les notions à enseigner pour le professeur et à apprendre pour l’élève sont nombreuses et variables selon chaque individu, un aspect épineux fréquemment rencontré lors de la formation du musicien a retenu ici mon attention : le sens du rythme ou plus exactement de la pulsation. Je me suis intéressée à la sensation corporelle qu’en a l’étudiant dans son jeu. En effet, véritable socle clé de l’interprétation, la pulsation liée au temps musical doit être comprise par l’auditeur, impliquant par là même qu’elle soit physiquement ressentie par l’interprète. C’est également une notion essentielle dans la pratique musicale réunissant plusieurs interprètes (musique de chambre, ensembles) que de savoir transmettre corporellement à ses partenaires ses intentions rythmiques (savoir donner un départ, savoir guider un rubato…). Un état des lieux sur les différentes méthodes existantes consistant à enseigner ces paramètres a déjà été fait dans la littérature. Deux procédés reviennent régulièrement.
Le plus répandu est celui consistant à utiliser l’outil « métronome ». Traditionnellement utilisé pour le travail du rythme, de la stabilité du tempo dans une phrase musicale, le métronome ne se révèle pourtant pas être l’outil parfaitement adéquat pour développer le sens rythmique. Effectivement, nombreux sont les étudiants qui malgré un travail rigoureux et consciencieux, une fois cette « béquille » enlevée, continuent à presser, à ralentir, à écourter certaines valeurs, à « manger » les silences, sans en avoir réellement conscience.
L’usage du métronome pose toujours question dans l’enseignement et ce depuis plusieurs générations de pédagogues, certains le considérant comme anti-musical, entravant toute liberté expressive, d’autres « métro maniaques » ne pouvant pas concevoir un travail sans. Maurice Gendron4, dans son livre l’Art du Violoncelle, remarque qu’il est important de bien en comprendre l’utilisation dans le but de « contrôler la structure rythmique d’une œuvre : sans rythme, il n’y a plus de musique » (Gendron, 1999). Pour Xavier Gagnepain (actuellement professeur au Conservatoire à Rayonnement régional de Boulogne-Billancourt), « il faut se garder de toute utilisation passive du métronome. Pour une action bénéfique, une part d’action rythmique personnelle est indispensable » (Gagnepain, 2003, p. 29).
Le deuxième procédé utilisé est celui du chant intérieur. Dans son excellent ouvrage Du musicien en général au violoncelliste en particulier (2003) le violoncelliste pédagogue Xavier Gagnepain propose plusieurs méthodes, fruits de son expérience et de sa réflexion sur la pratique de la musique, afin d’aider l’étudiant à évaluer ses qualités et faiblesses et lui permettre de développer ce qu’il appelle son « chant intérieur » en remédiant à ce défaut par exemple :
- chanter l’accompagnement en jouant sa propre voix pour développer son « sens rythmique » (Gagnepain, 2003, p. 26 = le rythme collectif ;
- « s’entendre tel que l’on joue » (Gagnepain, 2003, p. 10) avec le rôle ici du professeur comme oreille extérieure.
Toutes ces méthodes fonctionnent et ont fait leurs preuves amenant ses anciens étudiants à de brillantes carrières (Raphaël Merlin, violoncelliste du quatuor Ebène, Jérôme Pernoo, Ophélie Gaillard…). Toutes ces méthodes demandent cependant du temps qui manque souvent dans l’enseignement. En effet, la durée d’un cours est de trente minutes par semaine. Il y a 39 semaines par an d’où environ 20h de cours par an pour permettre à l’enseignant de transmettre et aider l’étudiant à développer sa pratique instrumentale5.
Je me suis donc interrogée sur l’apport du TanaCello comme outil pouvant améliorer ces méthodes d’apprentissage et guider l’étudiant vers une plus grande autonomie dans son travail, à la fois comme simple outil de diffusion et comme outil actif via une programmation électronique pour des exercices techniques entre autres.
4. Le TanaCello en pédagogie
Le but de cette première séance de travail, lors de laquelle le TanaCello sera utilisé comme outil pédagogique dans l’apprentissage de cet instrument, est de vérifier l’hypothèse qu’il pourrait être un atout dans l’enseignement musical et plus spécifiquement dans la formation de l’étudiant violoncelliste.
En conséquence, je me suis intéressée aux lacunes à la fois techniques mais surtout musicales auxquelles le métronome ne peut palier et auxquelles il m’était possible d’envisager une solution à travers le TanaCello. L’identification de ces problèmes m’a été possible de par mon expérience de pédagogue et d’interprète. Je les ai regroupés en deux grandes catégories : les pièces solos et les pièces accompagnées.
Dans les pièces solos, la conscience rythmique (par exemple la conscience de l’existence d’un espace-temps reliant musicalement les notes entre-elles) est trompée à la fois par les difficultés techniques rencontrées et par la gestion du stress. Le sens rythmique mais également l’organisation corporelle sont essentiels pour que de véritables progrès puissent libérer l’étudiant de ces obstacles.
Dans les pièces « accompagnées » (concerto, sonate…), le facteur notable est la méconnaissance du conducteur. Souvent, les élèves jouent en croyant connaître l’accompagnement mais en réalité l’accompagnateur les suit et s’adapte à leur jeu. Ici, c’est leur perception harmonique ainsi que leur oreille de chambriste dont il faut encourager le développement.
Pour développer le sens rythmique, l’idée est que l’enregistrement de l’accompagnement diffusé à travers le corps du TanaCello permettrait à l’étudiant de ressentir corporellement celui-ci. Cela lui permettrait d’adapter ses sensations de jeu afin d’acquérir la pulsation adaptée à la pièce étudiée de manière plus rapide et efficace.
Pour l’écoute objective de ce qui est joué, l’enregistrement en temps réel et sa diffusion immédiate permettraient à l’étudiant de pouvoir vérifier et d’affiner en prenant du recul l’équilibre entre le son ressenti et la réalité produite.
Afin de tester cette idée, j’ai demandé à une jeune étudiante, appelée ici Émilie, d’utiliser le TanaCello lors d’un cours.
Le choix du morceau et du paramètre travaillé avec le TanaCello s’est fait en fonction du répertoire travaillé par Émilie au moment du cours. Il s’agit du Scherzo de Daniel Van Goens, morceau développant la virtuosité de la coordination main gauche/main droite. Ici, la difficulté rythmique réside dans la régularité de l’accompagnement. Pour enregistrer la partie de piano et l’adapter à l’élève, elle m’a transmis le tempo auquel elle pouvait jouer la pièce (noire= 104).
L’enregistrement a été réalisé par une pianiste professionnelle à l’aide d’un clic diffusé dans son oreille au tempo indiqué. Il a fallu traiter le fichier son afin que celui-ci ne soit pas altéré lors de sa diffusion dans le TanaCello à l’aide du logiciel ProTools. En effet, certaines fréquences du piano ne sortaient pas clairement à travers la caisse de résonance du TanaCello. Le son traité ainsi diffusé reste fidèle à celui d’origine diffusé par des haut-parleurs, et il est possible de jouer normalement tout en l’entendant correctement.
En complément du travail sur la conscience rythmique, un point de technique d’archet sera travaillé durant la séance, permettant d’allier la découverte de traitements électroniques simples et le travail technique. Ce point technique est l’attaque produite par l’archet lors d’un mouvement dit tiré au talon et poussé à la pointe. En effet, Émilie doit apprendre à produire des attaques identiques à deux endroits différents de l’archet, ce qui sous-entend deux positions corporelles différentes. Souvent persuadé d’avoir réalisé le geste à l’identique, l’élève n’entend pas la différence entre ses deux attaques. Ne l’entendant pas, malgré l’oreille extérieure du professeur, elle peine à l’améliorer car elle n’est pas guidée par sa propre écoute.
Pour cela, le traitement delay (temps de 1000 millisecondes), qui permet de capter et d’enregistrer l’attaque produite en temps réel puis de la diffuser à l’identique immédiatement, sera utilisé. Un delay avec une seule répétition sera employé, permettant ainsi d’alterner les deux attaques.
Ici, le cours sera plutôt orienté comme étant une séance de tests afin de confirmer l’efficacité du TanaCello dans le développement de la conscience rythmique par rapport à d’autres outils existants (métronome, clic diffusé dans des haut-parleurs, chant intérieur). En effet, il faut préalablement vérifier qu’il pourrait être un atout en le comparant aux autres outils existants. Pour cela, deux systèmes de diffusion de l’accompagnement seront comparés. Le premier système sera dit « classique » via des enceintes, le deuxième sera diffusé à travers le TanaCello. Ici le but est de vérifier que le fait de ressentir l’accompagnement physiquement (à travers les vibrations transmises dans la caisse de résonance) est une donnée essentielle et efficace dans le développement de la conscience rythmique. L’installation est la suivante :

Figure 2. Schéma de l’installation du cours Une explication sur le fonctionnement du TanaCello sera donnée en début de cours. Émilie commence à jouer sur son propre violoncelle un extrait du morceau, sans accompagnement, afin de pouvoir vérifier que les points à améliorer ciblés à travers le TanaCello lui sont bien appropriés. La séance a été ciblée en fonction de ses besoins car Émilie est une élève régulière. Après cette vérification, Émilie joue directement sur le TanaCello. Je pourrais procéder différemment, c’est-à-dire en utilisant les méthodes connues pour travailler la sensation rythmique puis sortir le violoncelle hybride comme outil final c’est-à-dire : je lui joue l’accompagnement pendant qu’elle rejoue ou je lui fais chanter l’accompagnement ou je lui diffuse l’accompagnement dans les enceintes (HP1 et 2). Mais l’utilisation du TanaCello pourrait être alors en quelque sorte préparée par ces exercices préliminaires et son efficacité ne serait pas alors complètement validée.
De plus, une certaine passivité dans l’apprentissage de la part de l’étudiant ressort de ces méthodes comme s’il lui fallait nécessairement une oreille extérieure à la sienne pour entendre et corriger ses erreurs. Comme si, même après avoir entendu son erreur, il n’était pas encore capable de la corriger seul, ce qui impliquerait qu’en dehors du cours, l’étudiant ne travaillerait pas alors de manière efficace. Le TanaCello serait également un moyen d’amener les étudiants vers une plus grande autonomie dans leur travail. Cela permettrait au professeur de dédier son temps de cours à d’autres aspects musicaux.
Émilie joue sur le TanaCello un extrait d’un morceau, puis elle rejouera le même extrait sur son violoncelle avec l’accompagnement diffusé dans les enceintes (HP1-2). Il faudra lui donner un petit temps d’adaptation sur le TanaCello afin qu’elle vérifie ses écarts de la main gauche et, pour l’archet, les écarts entre les cordes. Même si les différences sont minimes, elles peuvent perturber les repères de jeu. Tout le long de la séance, des questions sur son ressenti lui sont posées :
- Où entend-elle le mieux l’enregistrement : dans les enceintes/dans le violoncelle/sans avis ?
- Y a-t-il un cas où elle ressent plus aisément la pulsation ? Si oui, lequel et pourquoi ?
- le TanaCello a-t-il été un apport dans sa séance de travail ?
- Si elle pouvait l’utiliser régulièrement, serait-ce un atout dans son apprentissage ?
Émilie se prête au test avec enthousiasme et beaucoup d’intérêt pour ce nouvel instrument.
Sur l’apport du TanaCello dans son cours, Émilie se trouve plus active dans la détection des points à améliorer car, même si au début l’écoute à travers le TanaCello l’a perturbée, elle a pu progresser dans sa conscience rythmique et la connaissance de l’accompagnement et améliorer un aspect technique en se guidant sur sa propre écoute. Pour la connaissance de l’accompagnement, Émilie note que cela lui permettra de profiter plus pleinement de ses répétitions avec l’accompagnateur. En effet, elle aura déjà pris l’habitude d’écouter une autre partie musicale et d’être rythmiquement avec. Elle pourra donc être plus réceptive au jeu de l’accompagnateur.
L’utilisation du TanaCello s’est révélée positive et efficace dans la résolution des deux problèmes ciblés lors de la séance : la conscience rythmique et un aspect purement technique d’attaque d’archet. Après une prise en main de l’instrument, l’élève a pu s’adapter et l’utiliser correctement. Pour la conscience rythmique, Émilie était tout d’abord débordée par ses propres soucis techniques et n’arrivait pas à écouter ce qui était diffusé à travers les haut-parleurs ?[AM1] Quand l’enregistrement a été diffusé via le TanaCello, elle a été « obligée » de l’écouter en même temps que ce qu’elle produisait et, par ce biais, de se rendre compte que la pulsation « qu’elle imaginait correcte ne l’était pas ». À partir de cette prise de conscience, elle a pu modifier ses repères auditifs et établir une pulsation adéquate. L’immédiateté du résultat avec le TanaCello est apparue évident. Pour le travail d’un point technique, l’utilisation de traitements s’est avérée ici efficace. En effet, lui permettant d’entendre ce qu’elle venait de produire sans passer par l’oreille de son professeur, elle pouvait affiner son geste instantanément.
Conclusion
Le TanaCello pourrait répondre à certaines problématiques liées à l’apprentissage du violoncelle. Il permet à l’étudiant de développer sa propre écoute du son produit sans passer par le filtre de la perception qu’en a eu son professeur. Le ressenti corporel nécessaire à la transmission d’une pulsation apparaît plus évident à travers les vibrations de la caisse de résonance. La capacité à alterner les méthodes en variant les outils d’apprentissages (traditionnels, techniques) apparaît comme un atout tant pour le professeur que pour l’étudiant dans la gestion du cours et du travail personnel. Destiné dans ce test à être utilisé comme un outil pédagogique, son usage reste ici contrôlé par le pédagogue. Cependant, son emploi nécessite une connaissance du langage informatique afin de maîtriser la réalisation et/ou le contrôle de patchs (partitions électroniques) conçus pour cet instrument. La logistique encore relativement imposante du système, bien qu’elle soit en constante évolution, reste un handicap pour sa production et sa diffusion vers un public plus large. L’utilisation de ces nouvelles techniques dans l’apprentissage du violoncelle permet de remettre directement en question les méthodes « traditionnelles » et interroge sur la place de ces nouvelles technologies dans l’enseignement musical. La question de l’obsolescence des programmes et donc de leur pérennité est primordiale, soulevant la problématique de la transmission de ces nouvelles techniques. Cependant, les possibilités à explorer avec le TanaCello offre des perspectives variées et nombreuses qui font de lui un instrument polyvalent à l’image des nécessités musicales actuelles.
Bibliographie
Boulez Pierre (1995), « Problèmes artistiques de l’institution musicale », Cahier de l’IRCAM : Instruments, no 7, coll. « Recherche et Musique », IRCAM-Centre G. Pompidou, Paris, 3e trimestre, 152 p.
Carat Benjamin (1998), « Le nouveau rapport interprète-instrument dans les œuvres pour violoncelle nécessitant un dispositif électronique », Mémoire de DEA, IRCAM, Paris IV.
Dufourt Hugues (1995), « L’instrument philosophe », Instruments, cahiers de l’IRCAM, Recherche et Musique, 3e trimestre, p. 64-65.
Fallowfield Ellen (2010), Cello Map: a Handbook of Cello Technique for Performers and Composers, thèse de doctorat, Research and Development at the Hochscule für Musik Basel, Switzerland et université de Birmingham.
Gagnepain Xavier (2003), Du musicien en général, au violoncelliste en particulier, collection Points de vue, Cité de la Musique, Paris.
Gendron, Maurice (1999), L’Art du Violoncelle, Schott.
Jaques-dalcroze Émile [1916] (1988), « La rythmique : enseignement pour le développement de l’instinct rythmique et métrique, du sens de l’harmonie plastique et de l’équilibre des mouvements, et pour la régularisation des habitudes motrices », vol. 1, Jobin & Cie, Lausanne [1916], édition Library of the University of Toronto, Avril 1988.
Jaques-dalcroze Émile (1965), Le rythme la musique et l’éducation, Foetisch, Lausanne.
Leipp Émile (2010) [1984], Acoustique et Musique, Presse des Mines, ParisTech, 4e édition de 1984.
Miranda Eduardo & Marcelo Wanderley (2006), « New Digital Musical Instruments: Control and Interaction beyond the Keyboard », vol. 21, the Computer Music and Digital Audio Series, A-R editions, Middleton Wisconsin.
Palm Siegfried (1985), Pro Musica Nova Studies for playing Contemporary Music, Breitkopf und Härtel.
Ricquier Maurice (1999), L’utilisation de vos ressources intérieures dans votre activité instrumentale…, Gérard Billaudot, Paris, 3e édition.
Schaeffner André (1968), Origine des instruments de musique, Mouton & Cie et Maison des Sciences de l’Homme, réédition, Pays-Bas.
Stowell Robin (2006), The Cambridge Companion to the CELLO, Cambridge University Press, 6e édition.
Vezina Lyse (2006), Le Violoncelle, ses origines-son histoire-ses interprètes, éditions Varia, Montréal.
Wiederke Jacques (1993), Le violoncelle contemporain, éditions musicales l’Oiseau d’Or.
Les cahiers de l’IRCAM (1992), Composition et environnements informatiques, Recherche et Musique, automne 1992.
Citation
Jeanne Maisonhaute,
« Le TanaCello, un instrument polyvalent dans l’apprentissage du violoncelle »,
Revue Francophone d’Informatique et Musique [En ligne], Numéros, n° 6 – Techniques et méthodes innovantes pour l’enseignement de la musique et du traitement de signal, mis à jour le : 18/06/2018, URL : https://revues.mshparisnord.fr:443/rfim/index.php?id=543.
[AM1]Pourquoi un point d’interrogation ?
- Le TanaCello porte le nom du quatuor Tana qui a créé, le 14 janvier 2015, au Musée d’art contemporain de Strasbourg le premier quatuor à cordes hybride SMAQRA de Juan Arroyo. ↩︎
- Cf. le projet IMAREV (Instruments de Musiques Actifs avec REglages Virtuels), financé par l’Agence Nationale de la Recherche en partenariat avec l’IRCAM ; coordinateur du projet Adrien Mamou-Mani. ↩︎
- Fondé en 1970 par Henri Pousseur et Pierre Bartholomé (anciennement « Centre de Recherches et de Formation musicales de Wallonie »). ↩︎
- 1920-1990, professeur à l’Académie nationale de musique de Sarrebruck en Allemagne entre 1953 et 1970, puis au Conservatoire National Supérieur de Paris entre 1970 et 1987, il enseigna également à la Yehudi-Menuhin School à Stoke d’Abernon en Angleterre et au Mozarteum de Salzbourg. ↩︎
- Entretien avec Philippe Bary, professeur au Conservatoire Paul Dukas, Paris XII, assistant au Conservatoire National Supérieur de Musique de Paris dans les classes de Maurice Gendron, Philippe Muller et actuellement Raphaël Pidoux ↩︎
-
Faire sauter les maisons d’opéra
2025 célèbre le centenaire de Pierre Boulez. Homme-orchestre, grand architecte de la musique en train de se faire, celui qui fut compositeur, chef, théoricien et pédagogue nous laisse en héritage un florilège de citations provocantes et provocatrices, dont la violence apparente cache un sens profond, un tempérament complexe. C’est ce sens et ce tempérament que tente de saisir Pascal Leray, en s’appuyant sur différentes figures de l’histoire des arts. Portrait en forme de divagation.
On ne peut définitivement pas qualifier Pierre Boulez de soixante-huitard. Il avait passé la quarantaine quand le mouvement étudiant s’est enclenché. Il ne serait pas moins abusif d’en faire le précurseur de cette période de bouleversements sociétaux quand il déclarait qu’il fallait « faire sauter les maisons d’opéra », proposition qui lui avait valu quelques ennuis. C’était en 1967, pourtant. L’injonction aurait pu figurer en bonne place parmi la multitude des slogans inventés l’année d’après, dont beaucoup résonnent encore dans nos mémoires. Mais non. S’il faut rattacher cette brutale exigence du compositeur, ce n’est probablement pas tant au grand bouleversement que vit la société française en cette fin de décennie qu’à une révolte de quelques décennies antérieure : le surréalisme.
Le fait est frappant : tant par sa musique que dans ses écrits de l’après-guerre immédiat, le compositeur encore tout en devenir paraît animé par une colère dont l’objet n’est pas si évident à comprendre. Dans ses correspondances, il se plaint d’une variété extraordinaire de personnes, ne manquant jamais l’occasion de lâcher un sarcasme avec une pointe plus qu’incisive : cruelle. Par la suite, les éclats se sont enchaînés pour s’atténuer au fil des ans, laissant de plus en plus de place à une pensée très pédagogique, comme elle s’exprime en particulier dans le volume des Leçons de musique qui complète les Jalons (pour une décennie) parus au tout début des années 1990 et qui réunissaient une première série de ses cours au Collège de France. Il n’en « projetait » pas moins, à la veille de mai 1968, de « faire sauter » nos établissements d’art lyrique alors si justement conçus pour un public contemporain de Napoléon III. L’homme s’était si bien arrondi que nul ne s’offusqua, en 2010 tandis qu’on fêtait son 85e anniversaire, qu’il émît le vœu qu’on brûlât les bibliothèques. Il avait déjà fait l’éloge de l’amnésie longtemps auparavant. Mais de là à mettre en danger nos galeries d’ouvrages musicaux ou autres qui, certes, dorment parfois de longs siècles sans qu’un œil s’y attarde, je dois bien le dire : ce n’est pas raisonnable. On avait appris à écouter le musicien, je crois. Faire sauter les maisons d’opéra, brûler les bibliothèques – s’entendent ici comme autant de métaphores. Et l’on est tenté d’ajouter « surréalistes », non parce que l’image serait d’un même type que « la rencontre fortuite sur une table de dissection d’une machine à coudre et d’un parapluie » (Lautréamont, Breton) mais parce qu’on y entend la même rage, le même besoin révolutionnaire que ne l’exprimaient, avec une virulence parfois effrayante, les poètes bagarreurs qui composaient, entre les deux guerres mondiales, le groupe surréaliste.
La clé, c’est peut-être René Char qui nous la donne : « Enfin, si tu détruis, que ce soit avec des outils nuptiaux » (Les Matinaux). La destruction boulézienne, à l’instar de l’utopie surréaliste, n’apparaît pas comme une fin en soi mais plutôt comme la condition de l’émergence d’une chose nouvelle : l’amour, chez les surréalistes. La beauté dite « convulsive » qui doit être « explosante-fixe » pour André Breton. Concernant l’opéra, la méthode préconisée par Boulez n’est pas la plus recommandable mais elle nous ramène à une autre figure littéraire dont François Meïmoun a souligné toute l’importance pour la formation et la pensée artistiques (et transartistiques) de Pierre Boulez : Antonin Artaud.
« Il faut organiser le délire ». L’injonction a si fortement marqué Caroline Potter qu’elle en fait le titre de son étude, prolongeant la prospection initiée par François Meïmoun et qui excède de loin le cadre musical puisqu’il plonge dans la littérature (et un courant littéraire dont la musique n’est pas, loin s’en faut, la préoccupation majeure). Le surréalisme n’est pas une référence exclusive pour le jeune Boulez mais il est manifeste que ce courant a laissé plus d’une trace dans son œuvre. René Char bien sûr ; André Breton (…explosante fixe…) ; Henri Michaux, même s’il a eu peu de liens directs avec le groupe parisien ; Antonin Artaud, enfin, dont la présence est plus fantomatique mais non moins réelle et effective. Et peut-être plus encore.
Pour un lecteur d’aujourd’hui, ces considérations peuvent surprendre, tant le compositeur et chef d’orchestre Pierre Boulez a marqué son temps par des initiatives artistiques conduites avec beaucoup de mesure et de soin, qu’il s’agisse de projets musicaux, lyriques ou institutionnels. Ici, la rage semble avoir cédé le terrain à l’exactitude et au souci du détail. Pourtant, « tout se tient », disait Victor Hugo dans la préface de Cromwell et l’on peut assez précisément retracer la façon dont le musicien d’âge mûr accomplit les exigences du jeune homme fraîchement et durablement marqué par la découverte d’Antonin Artaud, dont il venait d’assister à une lecture à la galerie Loeb, à Paris. Du point de vue scénographique, le compositeur Pierre Boulez n’a eu de cesse de vouloir faire encercler le public par les musiciens (Domaines, Rituel) ou par la musique elle-même, à travers des dispositifs mixtes (…explosante fixe…, Dialogue de l’ombre double) ou non (Sur incises). Si Antonin Artaud n’est pas « mis en musique », contrairement à d’autres poètes, il a une incidence exorbitante sur les vues artistiques de Boulez. Pas seulement et peut-être pas tellement parce qu’il serait une figure privilégiée du « délire » mais parce que, contrairement à l’image qu’on donne trop souvent de lui, Antonin Artaud poursuit une réflexion très raisonnée sur son art, ses arts : poésie, théâtre mais aussi cinéma. Certes, il sublime tout ce qu’il voit ou, du moins, tout ce qui signifie à ses yeux (le théâtre balinais, la peinture de Paolo Uccello…) mais il en fait découler des conceptions dont l’impact a été considérable dans le théâtre comme dans la littérature. À l’instar de celle d’Antonin Artaud, la pensée théorique de Pierre Boulez s’est construite sur un univers de références qui excède de loin la musique. La relation de Boulez à la peinture s’est pleinement exprimée à travers Le Pays fertile mais aussi avec l’exposition organisée au Louvre, dont la composition jette une lumière très particulière sur l’œuvre de Boulez me semble-t-il, Œuvre : fragment. Elle est constante dans les cours du Collège de France et même son ouvrage le plus redoutablement technique, Penser la musique aujourd’hui, présente des ressemblances structurelles assez troublantes avec Point, ligne, plan de Vassili Kandinsky.
Finalement, nul opéra n’a été mis en danger et au contraire, plusieurs salles de concert portent désormais le nom de Pierre Boulez pour qui il était essentiel de faire évoluer le cadre et les espaces de diffusion musicale tels qu’on les connaissait alors. Mais les bibliothèques ? Pourquoi vouloir brûler les bibliothèques ? Faut-il y voir une référence à René Char et à l’épreuve de la Résistance : « La bibliothèque est en feu » ? Pourquoi, si l’on laisse de côté le côté potache de la plaisanterie, vouloir à ce point demander un effacement de la mémoire ? De notre mémoire collective, qui plus est ! C’est on ne peut plus troublant. Bien sûr, l’idée générale est assez claire et il l’a plus d’une fois exprimée : il s’agit de ne pas se laisser paralyser par le passé et par un rapport excessivement rigide à la tradition, de permettre à l’imagination de s’exprimer et par là même, d’exprimer son aujourd’hui pleinement, quitte à s’inventer des généalogies fantasques ou pas de généalogie du tout (ce qui est fantasque). Là encore, aucune bibliothèque à ma connaissance n’a eu à se plaindre de la malveillance de Pierre Boulez. Enfin… pour l’instant. La bibliothèque n’est pas en feu mais à bien y regarder, elle forme une sorte d’archipel qu’il serait fort difficile de cartographier avec exactitude.
« Partition retirée du catalogue ». Jeunes mélomanes avides de musique contemporaine dans les années 1980 et 1990, nous avons intégré cette notion avec un naturel confondant. Celui qui se frottait, en tant qu’auditeur ou comme interprète, au répertoire du compositeur Pierre Boulez se trouvait vite devoir assimiler ce concept un peu bizarre quand on y regarde de près. Il n’y a pas de précédent de compositeur qui parle de « partition retirée du catalogue ». L’idée d’œuvre reniée n’est certes pas neuve. Le « catalogue » raisonné des œuvres d’un compositeur établi par le compositeur lui-même non plus, même si l’on en trouverait difficilement trace avant le XIXe siècle. Mais la notion précise, « partition retirée du catalogue », semble être une création lexicale de celui qui, non seulement fut un chef d’orchestre exceptionnel, un compositeur de premier plan, un théoricien et un pédagogue prolifique, un pianiste et un ondiste trop peu entendu, hélas ! ou encore un bâtisseur d’institutions… Cet homme doit peut-être encore être considéré comme un auteur littéraire au sens plein du terme. Et quand il parle d’œuvre « retirée du catalogue », il est certes dans une gestion très pragmatique de ses droits de diffusion mais également dans la composition d’un tableau étrange, dont certaines parties ont été retirées mais transparaissent encore, comme dans certains tableaux de Paul Klee. C’est ainsi qu’on ne pouvait, alors, que rêver d’entendre Polyphonie X ou le Quatuor pour quatre ondes Martenot, qui étaient marqués du sceau de l’interdit. Le bibliothécaire Pierre Boulez ne vous permettra décidément pas une consultation facile. Pire ! Il ne se prive pas de vous faire savoir qu’il a mille et un trésors dans ses magasins (Anthèmes 3, Strophe…) qu’il ne vous montrera pas car ces pièces ne sont « pas très intéressantes », d’après lui. Or, nous ne parlons pas seulement d’œuvres « retirées du catalogue ». Nous parlons d’œuvres restées inachevées (et elles sont nombreuses) ou d’œuvres réalisées et laissées longtemps dans l’ombre. Ainsi, quand on lui évoque Improvisé – pour le docteur Kalmus, il insiste sur la brièveté de l’œuvre, il rappelle son caractère circonstanciel, il s’excuse presque de l’existence de cette pièce.
Circonstanciel. Ce mot ne nous ramène pas à Antonin Artaud mais à un autre poète, auquel le compositeur a rendu hommage de plus d’une façon : Stéphane Mallarmé. C’est compréhensible. L’auteur d’Igitur et d’Un coup de dés jamais n’abolira le hasard est une des figures majeures de la modernité poétique, la plus emblématique peut-être par la rigoureuse quête d’absolu qui y est conduite jusqu’à toucher le néant. La quête de Mallarmé emprunte des chemins parfois inattendus et présente quasi constamment un visage double : d’un côté un désespoir et une angoisse indicibles, quasi mortelles, de ne pouvoir atteindre l’Absolu sans qu’il se nie dans son expression même ; de l’autre les procédés et facéties d’un « spirituel histrion » qui met en scène le personnage qu’est le poète, prompt à s’étrangler face à cette radicale impuissance à dire : « La Nature a lieu, on n’y ajoutera pas ». La circonstance est l’opposé même de l’éternité, dans le principe. Or, il y a de l’alchimiste chez Mallarmé, qui accorde une grande importance à l’alliance des contraires. La circonstance et l’éternité ont un élément en commun : l’instant. C’est ce qu’exprime en particulier le poème Remémoration d’amis belges, un des plus émouvants du recueil plusieurs fois remanié par son auteur, où « se dévêt, pli selon pli, la pierre veuve ». Un recueil qui, on le sait aujourd’hui, laisse de côté toute une série de poèmes de circonstance, offerts par le poète à ses proches et ses amis, qui forment à eux seuls un volume considérable, lequel ne comprend peut-être pas de poèmes aussi marquants que L’Après-midi d’un faune ou Brise marine (le temps le dira) mais qui oblige à reconsidérer l’étendue de l’œuvre d’un poète considéré comme « rare ».
Il en va de même du Livre, ce projet du poète qui a fortement marqué Pierre Boulez, à la suite de la publication en 1958 des notes manuscrites de Mallarmé accompagnées d’un large commentaire de Jacques Scherer. Ces notes n’étaient pas vouées à la publication. Le poète y conçoit de façon très concrète la réalisation de son Livre, sans début et sans fin, un objet appelé à tourner autour de lui-même. Il en pense la fabrication, le prix de revient et le coût, la publicité même. On est au cœur du paradoxe mallarméen : il compose un objet dont le projet vise l’Absolu en son essence même et il le pense dans les détails les plus triviaux, si ce mot a ici un sens. Si l’on revient à cet Improvisé – pour le docteur Kalmus, dont Boulez a fini par accepter la publication trente-cinq ans après la création initiale, nous voyons un geste presque totalement moulé dans la conception mallarméenne de la circonstance. Même la notion d’improvisation – qui prend un sens très particulier chez Pierre Boulez – est étroitement liée à la poétique mallarméenne.
Telle nous apparaît l’œuvre de Pierre Boulez aujourd’hui. Un recueil de René Char s’appelle La Parole en archipel. En effet, sa poésie souvent aphoristique est composée d’îlots. Dans Feuillets d’Hypnos, déjà, il écrivait : « Ta dictée n’a ni avènement ni fin. Souchetée seulement d’absences, de volets arrachés, de pures inactions. » Le fragment de l’esquisse comme l’immédiateté du geste improvisé marquent le continu d’une pensée organique. De Pierre Boulez, nous connaissons les grandes œuvres, telles qu’il les a établies. L’archipel de ses esquisses reste à explorer et il n’est certainement pas moins significatif, si l’on prend en considération les sources poétiques qui ont déterminé la forme générale de son œuvre musicale. Mais donc, les bibliothèques ?
Il y a lieu de penser que Pierre Boulez leur lance un singulier défi. Non parce qu’il prétendrait y mettre le feu ou les noyer. Mais parce qu’il leur offre un catalogue radicalement labyrinthique. Certaines œuvres ont été fixées. Il y a eu des révisions, cela n’est pas rare dans le monde de l’édition musicale. Mais il y a eu des transformations conséquentes. Le Visage nuptial a connu au moins trois expressions très différentes les unes des autres. Ce qui a été initialement proposé comme Mémoriale et qui est devenu …explosante fixe… réunit ce que Paolo Dal Molin appelle une « famille d’œuvres », une famille dont on ne connaît pas nécessairement tous les « membres ». Dérives 2 a accompli son chemin en croissant par étapes pour aboutir, d’une pièce d’à peine dix minutes, à un monument de plus de quarante minutes, « calme roc ici-bas chu d’un désastre obscur ». Aussi, l’établissement d’un catalogue comme l’intégration des versions successives et des transformations qui les accompagnent dans une base de données structurée apparaissent-ils comme de véritables défis à la raison, des entreprises dont le fatal inachèvement semble être, plus qu’un manque ou une carence, une composante nécessaire, possiblement la plus fertile.
Pascal Leray
-
Méthodes de prise de son en multicanal / Objets
Jean-Christophe Messonnier, Jean-Marc Lyzwa et Alexis Ling, Conservatoire National Supérieur de Musique et de Danse de Paris
Résumé
Depuis les années 1990, le service audiovisuel du Conservatoire de Paris travaille sur les systèmes de captation et de restitution de l’espace sonore dédiés à l’enregistrement de la musique. Ces recherches ont abouti à des méthodes adaptées à l’audio 3D, comme l’intégration du mode multicanal/objet, le contrôle du mixage via un rendu binaural avec headtracker, ou des techniques transaurales. En parallèle, nous avons pratiqué sur de nombreuses productions des systèmes de captation permettant de post-produire sous ces formats. L’évolution récente des moyens de diffusion audio et audiovisuelle comme le développement du format Dolby Atmos pour la musique donnant une actualité à ces méthodes, il a semblé opportun de faire un point sur celles-ci, en décrivant les différentes raisons de cette démarche.
Abstract
Since the 1990s, the audiovisual department of the Conservatoire de Paris has been working on music specific systems for recording and diffusing the sound space. This research has resulted in methods particular to 3D audio, such as the integration of multichannel/object mode, mixing control via binaural rendering with headtracker, or transaural techniques. At the same time, we have put to test, on many productions, capture systems allowing post- production in these formats. The recent evolution of the means of audio and audiovisual diffusion, such as the development of the Dolby Atmos format for music, gives a topicality to these methods, and it seemed appropriate to take stock of them, by describing the different reasons for this approach.
Depuis les années 1990, le service audiovisuel du Conservatoire de Paris travaille sur les systèmes de captation et de restitution de l’espace sonore. Ses recherches ont conduit à la mise en œuvre de techniques de prise de son et de post-production permettant d’améliorer, de préciser et de stabiliser la sensation d’enveloppement et d’immersion tout en renforçant la lisibilité et la compréhension de l’œuvre restituée. Travailler la prise de son et la post- production musicale, c’est attacher une importance toute particulière à la restitution spectrale, à la dynamique, à l’espace et à son ressenti, à la définition des sources pour une bonne intelligibilité et compréhensibilité des différents instruments ou groupes instrumentaux constituants l’œuvre. L’industrie cinématographique a très largement contribué aux développements et à la popularisation des techniques de restitutions spatiales et multicanales sans toutefois définir de canon esthétique. Après avoir expérimenté en multicanal depuis l’avènement du 5.1 et intégré le groupe Bili (http://www.bili-project.org/le-projet/) consacré au binaural, nous pratiquons depuis de nombreuses années des prises de son musicales, diffusées sur le site du Conservatoire de Paris, intégrant ces techniques. Cet article propose une synthèse de notre démarche. Nous avons développé plusieurs outils (moteurs de rendu transauraux et binauraux avec headtracker, base de données de HRTF) nous permettant de progresser dans la qualité de nos productions et nous décrirons leur utilisation, ainsi que la manière dont nous intégrons les techniques classiques d’enregistrement.
Stéréophonie à deux canaux et multicanal
La stéréophonie à deux canaux permet, à partir de deux enceintes disposées à ±30° et d’une position précise de l’auditeur, de donner à percevoir des sources fantômes en continu dans l’espace, d’une enceinte à l’autre, en fonction de la différence d’informations entre les deux oreilles perçue par l’auditeur (différence d’intensité et différence de temps). Pour plus d’informations sur ce phénomène, on peut se référer à Blauert (1983) et Plenge & Theile (1987). Elle permet également de percevoir les sources en profondeur, mais cette propriété est conservée en multicanal et elle ne constitue donc pas une différence entre les deux formats. On peut optimiser le signal à deux canaux, à la prise et en post-production. Cette attitude est largement dominante en musique, à la fois avec l’emploi d’un système principal microphonique à deux canaux par beaucoup d’ingénieurs du son en musique classique, et par la pratique du mastering sur le signal à deux canaux. Plus généralement, le monitoring de référence est dans la plupart des cas un système à deux canaux, sur enceintes ou au casque.
Cependant, dans la production du son pour le cinéma, un autre modèle a émergé et est maintenant largement dominant. Le signal master est ainsi constitué d’un ensemble de signaux décrivant la scène sonore, s’adaptant à toute une gamme de systèmes, allant de la très grande salle de cinéma équipée de dizaines d’enceintes, à l’écoute domestique pour laquelle un downmix deux canaux est réalisé. Nous reviendrons sur les caractéristiques de ces signaux, mais nous devons auparavant poser le débat.
Premièrement, le modèle de la production cinéma est-il exportable en partie pour la musique ? Y-a-t-il un intérêt à pratiquer le son multicanal pour la musique ? La question mérite actuellement d’être posée, car l’industrie musicale a commencé récemment à produire au format Dolby Atmos, et que la société Apple transforme ce format en binaural avec headtracker vers ses écouteurs nomades, afin que l’auditeur perçoive la scène sonore comme étant fixe, lorsqu’il bouge la tête. Nul ne connait l’avenir socio-économique de ces systèmes lorsqu’ils sont appliqués à la musique, mais ils impliqueraient alors une production en multicanal qui changerait radicalement les pratiques si elle s’imposait.
L’expérience que nous avons acquise depuis trois décennies dans le domaine de la captation et de la restitution en multicanal, mais également dans le développement d’outils spécifiques aux techniques en audio 3D, nous permet de donner un avis esthétique (pourquoi le faisons- nous ?) et technique (comment le faisons-nous ?). L’apport du multicanal est simple : il permet une immersion sonore beaucoup plus perceptible que la stéréophonie à deux canaux, l’immersion étant définie comme la sensation d’être à l’intérieur de l’espace restitué plutôt que devant cet espace. Cette différence d’immersion n’est pas forcément sensible dans des lieux d’écoute de petits volumes, où la réverbération de la salle crée l’essentiel de cette immersion et où, par conséquent, l’apport du multicanal n’est pas décisif. En effet, le signal émis par les enceintes est diffusé à travers l’acoustique du lieu d’écoute et l’auditeur est alors en présence du son direct des enceintes (entre ±30°), mais également du son réverbéré de la salle (en plus de celui diffusé par les enceintes sur 360°). La perception des plans sonores qui en résulte dépend donc de ces deux facteurs (Messonnier & Moraud, 2011). Mais, dès que le volume de la salle augmente assez pour que le niveau de la réverbération soit suffisamment bas à la position d’écoute, l’immersion est créée par le signal direct du système d’écoute et le multicanal est dans ce cas un atout décisif. Cette immersion va de pair avec une possibilité accrue d’analyse du champ acoustique due au démasquage binaural (Moore, 1989) et les systèmes multicanaux sont donc plus riches en quantité d’information perçue. L’immersion est liée à une utilisation de l’espace sonore qui peut être réalisée, soit par les sons directs, soit par l’ambiance, soit par la réverbération, et une infinité d’esthétiques peuvent être développées à partir de cette possibilité d’utiliser toutes les directions de l’espace sonore.
Le multicanal peut donc être, à notre sens, un atout. La question est donc la suivante : peut-on pratiquer la stéréophonie en multicanal pour la musique en ayant exactement la même qualité que celle de la stéréophonie à deux canaux ? Les systèmes de diffusion du son ont évolué. Indépendamment des dispositifs multicanaux, deux systèmes ont vu leur popularité exploser : l’enceinte Bluetooth avec un retour à la monophonie, et le casque audio pour la lecture de médias en mobilité. Pour les enceintes Bluetooth, la compatibilité mono est donc un enjeu. L’usage du casque ouvre aux techniques binaurales, avec ou sans headtracker, et cela nécessite un contenu multicanal. En parallèle avec la question précédente : continuer à produire comme avant n’est-il pas un problème ? Pour permettre cette présentation, nous devons tout d’abord rappeler quelques définitions.
Les modes de spatialité : multicanal ; mode objet ; ambisonics (Messonnier et al., 2016)
Comme décrit dans la norme EBU (2014) spécifiant les modes de spatialité pouvant être inscrits dans les signaux audio (Audio Definition Model, ADM), on dénombre au moins trois manières de spatialiser les sons. Ces données sont stockées dans la partie réservée aux metadata des fichiers Broadcast Wave File (BWF). Le même type de données est utilisé dans les systèmes propriétaires Dolby Atmos DTSX et MPEGH, permettant de plus de diffuser le signal à un débit raisonnable par des systèmes de compression de données. Ces trois modes de spatialité sont les suivants : le multicanal, le mode objet et l’ambisonie.
Le multicanal (Channel Based Audio), dont la stéréophonie à deux canaux fait partie, définit des canaux normalisés (L, R, C, etc.) correspondant à des directions de l’espace EBU, 2014). Ces canaux reçoivent des signaux répartis entre eux, soit par les systèmes de prise de son (un couple AB répartit par exemple le son entre L et R dans la stéréophonie à deux canaux), soit par les systèmes de post-production (potentiomètre panoramique). Si un signal n’est envoyé que sur un seul canal, ce signal se comporte comme un objet fixe. Un objet (Object Based Audio) est un signal défini par sa position spatiale, par exemple -15° azimut, 0° d’élévation, à un temps (time code) donné. Les positions des objets peuvent donc évoluer avec le time code et donc avec l’automation.
L’ambisonie (Scene Based Audio) est basée sur une analyse régulière de l’espace sonore avec une précision donnée par un paramètre appelé ordre (voir aussi ce numéro, Jullien, chapitre 5, pp. XX-XX). Chaque ordre renvoie donc à un ensemble de signaux complémentaires entre eux et représentant l’espace sonore, indépendamment du système de monitoring (en son 3D cela implique un minimum de canaux au 1er ordre : 4 canaux, 2ème ordre : 9 canaux, 3ème ordre : 16 canaux, 4ème ordre : 25 canaux, 5ème ordre : 36 canaux, 6ème ordre : 49 canaux…)
Ces différents modes de spatialité sont combinables entre eux dans l’ADM (Audio Definition Model, cf. ci-dessus), mais les formats propriétaires n’admettent qu’une base multicanale (appelée Bed) et un certain nombre d’objets (le nombre dépendant des systèmes). Lorsque nous parlions du multicanal dans la partie précédente, il s’agissait d’une combinaison de multicanal et de mode objet.
Les moteurs de rendu
En ambisonie, on a donc l’idée d’une scène sonore idéale, que l’on va devoir adapter au système de monitoring que l’on utilise. Lorsque l’on réalise une scène complexe mélangeant multicanal et mode objet, on est confronté à une situation similaire : la réalisation de la spatialité de la scène dépend du système de monitoring que l’on utilise et on doit avoir un dispositif permettant d’adapter l’information spatiale contenue dans le mixage (dans les metadata) à ce système de monitoring : c’est la fonction du moteur de rendu. Par extension, nous appellerons aussi “une scène” toute combinaison de multicanal, mode objet et ambisonie, nécessitant un moteur de rendu pour être réalisée.
Downmix et Upmix
Le moteur de rendu permet d’adapter un contenu multicanal/objet d’un système à un autre. Si le canal prévu dans le mixage existe, le signal sera diffusé sur l’enceinte correspondant à ce canal. Si le canal prévu n’existe pas, le signal prévu sera diffusé comme une source fantôme entre les deux enceintes correspondant aux canaux existants les plus proches, ou sera projeté dans le plan horizontal s’il n’y a pas d’enceintes en élévation dans la zone d’azimut concernée. S’il y a plusieurs plans d’élévation, le moteur réalisera une interpolation entre ces différents plans.

Figure 1 : Format 7.1 avec sources fantômes (en pointillés). Exemple : Un canal Lc ou l’objet correspondant (Left Center, -15° azimut ; 0° élévation) sera diffusé sur l’enceinte Lc si elle existe, et entre les enceintes L (-30° ; 0°) et C (0° ; 0°) si elle n’existe pas. L’optimisation du signal deux canaux
La méthode la plus simple du downmix deux canaux consiste à utiliser des panoramiques d’intensité classiques pour tous les angles compris entre -30° et +30° et pour la zone symétrique à l’arrière (entre -150° et +150°), qui est repliée sur l’avant. Les objets et les canaux dont les angles sont compris entre -30° et -150° sont fixés sur le canal de gauche, les objets et les canaux dont les angles sont compris entre +30° et +150° sont fixés sur le canal de droite. On obtient ainsi un signal stéréophonique pouvant être lu classiquement au casque comme sur enceinte, mais la scène est tronquée au-delà de ±30°.
On peut optimiser la scène sonore au casque ou sur enceinte en utilisant les techniques binaurales/transaurales. C’est l’objet des outils Transpan et MyBino, des moteurs de rendu transauraux et binauraux, dont le développement est issu d’une collaboration entre le service audiovisuel du Conservatoire et différents partenaires. Les techniques binaurales, pour une écoute au casque, utilisent des filtres reproduisant l’effet de la tête et des pavillons des oreilles sur le champ acoustique pour chacune des directions de provenance du son, nommés HRTF (Head Related Transfer Function). Les techniques transaurales, pour une écoute sur haut- parleurs, ajoutent à ces HRTF des filtres annulant les trajets croisés des enceintes (signal sortant du haut-parleur gauche allant sur l’oreille droite de l’auditeur, et signal sortant du haut-parleur droit allant sur l’oreille gauche), afin de retrouver ces HRTF aux oreilles de l’auditeur. Il y a un enjeu spectral dans le choix de ces HRTF. Pour Transpan comme pour MyBino, un travail important a été réalisé pour que la sonorité des filtres se rapproche le plus possible de la sonorité du signal, l’idée étant de garder l’équilibre spectral du signal stéréophonique tout en optimisant la spatialité de la scène, pour le casque ou pour le système d’enceintes.
Le moteur de rendu prend en entrée les différents signaux et affecte à chacun une voie de traitement qui va réaliser le filtre (HRTF + annulation des trajets croisés si transaural) pour une direction donnée. Il faut donc faire correspondre les réglages des directions à la configuration que l’on utilise. Pour prendre un exemple, on peut alimenter le moteur de rendu par un bus multicanal 11.1.4 et le régler sur les angles correspondants :
L (-30° ; 0°) R (+30° ; 0°) C (0° ; 0°) LFE (0° ; 0°) WL (-45° ; 0°) WR (+45° ; 0°) SL (-90° ;
0°) SR (+90° ; 0°) LS (-150° ; 0°) RS (+150° ; 0°) TL (-45° ; 45°) TR (+45° ; 45°) LC (-15° ;
0°) RC (+15° ; 0°) TRL (-135° ; 45°) TRR (+135° ; 45°)

Figure 2 : Représentation des directions des canaux sur trois moteurs de rendu différents : Transpan, MyBino2, MyBino1 (Note : l’ordre du bus correspond à la modification d’un bus 9.1.6 dans Pyramix, qui existe en natif et permet, de façon extrêmement pratique, une affectation des sons aux différents canaux, ce qui explique ce choix). Idéalement, chacun des sons de la scène doit être traité par une seule HRTF pour que l’on ait une direction précise. Si un son est situé entre deux canaux, par exemple entre LC et C, il en résulte un flou de localisation, puisque la somme des HRTF (0° ; 0°) et (-15° ; 0°) ne correspond pas exactement à la HRTF (-7,5° ; 0°). On a par conséquent le choix : utiliser plus d’objets, pour chacun des sons à spatialiser, ou accepter ce flou sur certains sons, pour toujours garder le même schéma de travail pour tous ses mixages.
Le signal ainsi obtenu peut être utilisé comme un signal stéréophonique traditionnel, même si la spatialité est optimisée soit pour le casque, soit pour les enceintes. Le moteur de rendu MyBino2 est conçu pour générer un signal binaural optimisé pour une écoute au casque, qui puisse être entendu comme un signal stéréophonique traditionnel sur enceintes, l’image sonore étant alors anamorphosée.
Il est également possible d’utiliser un headtracker avec le moteur binaural (Hedrot pour MyBino1 (https://alexisbaskind.net/fr/hedrot-head-tracker/), Feichter pour MyBino2). Ce dispositif envoie les coordonnées d’orientation de la tête de l’auditeur au moteur de rendu, afin que celui-ci change les HRTF produites pour que les sources paraissent à l’auditeur comme étant fixes dans l’espace lorsqu’il bouge la tête, comme dans un espace sonore réel. Le contrôle de la stabilité de la scène passe par la maîtrise de l’information fournie par le headtracker et par l’individualisation des HRTF, tous les individus ne percevant pas la même localisation pour une HRTF donnée. Ce point constitue une direction de recherche encore en cours, mais MyBino apporte des débuts de réponse. Ce dispositif permet d’améliorer le réalisme des sensations sonores (Hendrickx et al., 2017), notamment pour les sources situées dans la zone frontale. On peut formuler l’hypothèse qu’il existe une ambiguïté pour ces sources, le cerveau ayant des difficultés à déterminer leur position, avant ou arrière, puisque les différences de phase et d’intensité perçues par nos deux oreilles sont identiques dans ces deux cas. Cette ambiguïté est levée par le dispositif car, lorsqu’on tourne la tête, les sources se déplacent en sens inverse si elles sont à l’avant ou à l’arrière.
Nous utilisons ces différentes réalisations du mixage pour le contrôler. Chacune des réalisations est vérifiée sur un système particulier (mono sur une seule enceinte, deux canaux sur enceintes, deux canaux au casque, multicanal dans différents formats) et renseigne sur un aspect particulier du mixage, les localisations et le déploiement des réverbérations dans l’espace conditionnant les relations de masquage entre les différents sons qui constituent la scène. On peut passer d’un mode de monitoring à un autre en fonction de son environnement de travail. Ces modes de monitoring sont complémentaires.
La spatialité des scènes
Les considérations précédentes ne font pas d’hypothèses sur les signaux correspondants aux différentes directions de l’espace. Dans le contexte de la production de musique en général, et de notre approche en particulier, une partie de ces signaux correspond aux sons directs des différentes sources constituant la scène sonore, et une autre partie de ces signaux correspond à la réverbération de la scène. Cette réverbération n’est pas forcément homogène : elle peut être constituée de plusieurs réverbérations ayant chacune des caractéristiques spécifiques, comme
par exemple différents temps de réverbération, pour différents groupes de sources, ayant chacune une répartition spatiale différente. Cette spatialité de la réverbération est une des possibilités nouvelles offertes par ces nouveaux formats et elle ouvre de nouveaux champs esthétiques.
On peut considérer le format 11.1.4 comme un format 7.1.4 dont on a augmenté la définition dans la partie avant par l’ajout de sources supplémentaires WL, WR, LC et RC. Le fait de matérialiser autant que possible la direction des sources par leur présence sur un canal (ou un objet) unique, et non pas comme une source fantôme entre deux canaux, permet d’une part, d’avoir une scène plus stable en multicanal (si l’auditeur se déplace, les sources fantômes se déplacent mais les sources réelles restent à leur place) et d’autre part, d’avoir des scènes binaurales plus définies en évitant de mélanger plusieurs HRTF pour une direction de source, ce qui est inévitable si un signal est présent sur deux canaux en même temps. Il est donc nécessaire de disposer d’un certain nombre de canaux, ou d’objets, afin d’obtenir une bonne définition pour les sons directs, mais il n’est pas indispensable de tous les utiliser pour diffuser la réverbération de la scène.

Figure 3 : Format 11.1.4 Un des avantages des formats immersifs est de permettre une différenciation plus forte des directions spatiales de la réverbération. Dans une acoustique naturelle d’une salle de grand volume, la réverbération qui vient de l’avant n’est pas la même que celle qui vient des côtés, de l’arrière ou du haut, car le jeu des réflexions sur les parois de la salle est différent suivant la position des sources, leur directivité et l’acoustique même de la salle. On peut utiliser les canaux L, R, SL, SR, LS, RS, TL, TR, TRL et TRR pour répartir la réverbération sur des directions occupant tout l’espace d’écoute de manière homogène, car on a ainsi 6 bases équiréparties de 60° dans le plan et 4 bases de 90° en élévation (les angles des canaux étant réglés comme sur la Figure 1).
Cette richesse de l’acoustique est très bien perçue en acoustique naturelle mais est limitée et altérée en stéréophonie à deux canaux. Il ne s’agit pas de prétendre que l’on peut rendre cette complexité telle qu’elle est à l’origine, car le multicanal implique un couplage avec la salle de diffusion qui va forcément modifier le rendu de la scène, mais il sera possible d’enrichir l’écoute en bénéficiant d’un plus grand nombre de ressources pour restituer cette complexité. Chacun est libre de jouer ou non sur le naturel de la représentation, et les options de répartition de la réverbération dépendent bien sûr du type de musique que l’on produit, mais, encore une fois, la nouveauté réside dans la possibilité de différentier la provenance spatiale des sons.
Les systèmes de captation et de post-production
Un des aspects fondamentaux de notre démarche est de rechercher une continuité entre les méthodes que l’on utilise pour la stéréophonie à deux canaux et celles que l’on peut utiliser en multicanal ou en mode objet. Il nous semble important par exemple de continuer à exploiter les mêmes microphones que nous utilisions pour la stéréophonie à deux canaux car ils constituent pour nous un des éléments centraux de l’esthétique que nous cherchons à développer, quel que soit le format pour lequel on travaille.
Les méthodes sont un sujet sensible car elles représentent l’approche personnelle de chacun et chacune. Le fait de partager notre expérience permet de respecter ces approches et peut donner à réfléchir sur l’évolution de ses méthodes personnelles pour aborder ces formats ou offrir des éléments de comparaison si on les pratique déjà. De grandes lignes peuvent être partagées, qui dépendent notamment des styles musicaux enregistrés. Concrètement, chacun des objets de la scène est capté par un ou plusieurs microphones (cas du piano par exemple) et la méthode de base de captation des objets est donc identique à celle des microphones d’appoint en stéréophonie. Il est même usuel, pour nous, de construire une scène de jazz uniquement à partir de microphones d’appoint et de réverbérations artificielles.
On trouve des réverbérations artificielles multicanales, comme le SPAT, que nous utilisons beaucoup. On peut construire l’espace sonore à partir d’un ensemble de réverbérations 4 canaux ou 2 canaux réparties dans l’espace. La société AudioEase propose avec l’Altiverb des réverbérations 4 canaux à convolution ; TC Electronic, avec son System 6000, propose des moteurs de réverbérations multicanales ; et on peut également citer la DRE 777 de Sony, dont la production a été abandonnée, mais dont les réponses impulsionnelles sont excellentes et toujours utilisées. Pour les réverbérations à deux canaux, tous les systèmes disponibles sur le marché sont utilisables. On peut construire une réverbération multicanale avec plusieurs réverbérations à deux canaux possédant des critères communs (même temps de réverbération, par exemple). Toutes les techniques des musiques actuelles amplifiées sont utilisables, il suffit donc juste d’ajouter à ces traitements des choix plus larges de répartition spatiale qu’en stéréophonie à deux canaux.
Ces éléments ont en commun d’être tous suffisamment décorrélés et donc de pouvoir être additionnés sans problèmes de phase. La constitution de la scène va dépendre du positionnement spatial de chacun de ces éléments et la réduction stéréophonique peut très bien correspondre à ce que l’on aurait choisi en stéréophonie à deux canaux. Les réverbérations seules peuvent être immersives en multicanal et redevenir des réverbérations stéréophoniques à deux canaux lors de la réduction. L’emploi des techniques binaurales et transaurales nous permet de définir des scènes sur plus ou moins 45°, plutôt que plus ou moins 30° pour les sons directs, afin de les rendre plus immersives. En transaural, la scène sonore sera plus large que le cadre des enceintes, et le format binaural, lorsqu’il est écouté au casque, permettra une meilleure externalisation des sources.
On peut adjoindre à ces éléments des ambiances (captation de la réverbération de la salle) ou des ailes (captations latérales de la scène sonore et captation de la réverbération de la salle) qui elles aussi seront décorrélées. Il existe de nombreux choix et de nombreuses nuances pour
capter les ambiances, en fonction de la directivité et du placement des microphones. On peut, par exemple, utiliser des ambiances omnidirectionnelles situées au-delà de la distance critique, placées, lors du mixage, à plus ou moins 90° dans la scène, et des ambiances directives (cardioïdes ou autres) orientées vers le fond de la salle, placées à plus ou moins 150°. Pour les canaux d’élévation, on peut utiliser des ambiances diffuses si l’acoustique de la salle est intéressante, ou utiliser des réverbérations artificielles si l’on souhaite modifier l’impression acoustique de l’auditeur. On peut bien évidemment mélanger ambiance naturelle et réverbération artificielle sur un même canal.
Si l’on place ces réverbérations, naturelles ou artificielles, avec des gains similaires, dans des directions régulièrement réparties de l’espace (dans notre cas ±30°, ±90°, ±150° dans le plan horizontal, et ±45°, ±135° à 45° d’élévation), on obtient une réverbération immersive. La partie la plus délicate va concerner les secteurs où il y a aussi du son direct (traditionnellement l’avant-scène).
Une première solution consiste à associer des appoints et des ambiances avant (par exemple des microphones cardioïdes orientés vers la scène, mais distants entre eux). La localisation sera alors donnée par la direction de l’appoint. On peut aussi souhaiter capter une source, ou un ensemble de sources, d’un point plus éloigné, d’une part, parce que l’on ne souhaite pas placer d’appoints sur chacune des sources (cas d’un orchestre symphonique par exemple) et d’autre part, lorsqu’un éloignement du microphone est préférable pour une question de qualité de timbre. Les sources musicales n’ont pas la même qualité de son direct à différentes distances car les points de rayonnement s’y additionnent différemment. La qualité de leurs timbres (indépendamment de la réverbération qui y participe) est optimisée pour une certaine distance de perception. C’est donc à chacun de décider, en fonction de l’ensemble de ses contraintes, de ses conceptions et de ses gouts propres, s’il préfère, selon les cas, utiliser un appoint ou enregistrer la source par un système placé plus loin et captant une partie de la scène sonore, voire toute la scène sonore.
La première différence d’un système frontal, utilisé en multicanal, comparé à un système principal, utilisé en stéréophonie à deux canaux, est qu’il ne capte qu’une partie de la réverbération, les autres directions de celle-ci devant être réparties sur d’autres directions de la scène afin d’avoir un résultat immersif. Il devra donc être placé plus près ou être constitué de microphones plus directifs. La deuxième différence est qu’il devra résister aux différentes réductions (downmixs) et que la sommation des éléments du système ne devra pas poser de problème de phase. La troisième est que, si l’on veut utiliser une version binaurale du mixage, on a tout intérêt à matérialiser chacun des signaux que l’on veut ensuite traiter par des HRTF pour avoir une meilleure définition de la scène sonore. L’interpolation entre les HRTF ±30° de deux signaux issus d’un couple stéréophonique ne conduira pas au même résultat que la perception de sources fantômes à partir de deux enceintes situées à ±30° diffusant ces signaux. Dans le deuxième cas, le cerveau dispose des informations issues des mouvements de la tête et travaille avec ses propres informations correspondant aux HRTF, ce qui n’est généralement pas réalisé dans le premier cas.
Les systèmes que nous avons adoptés et qui répondent aux critères précédents sont des antennes acoustiques, dont la théorie et l’application aux systèmes multicanaux a été décrite de manière exhaustive par Mike Williams (2000). Les antennes acoustiques destinées à l’enregistrement multicanal sont initialement prévues pour capter tout l’espace et nous avons, en première approche, utilisé des antennes à 5 canaux omnidirectionnelles pour les systèmes 5.1.

Figure 4 : Exemple Antenne pour un 5.1 – 5 microphones DPA 4041 
Figure 5 : Installation à Notre-Dame de Paris Dans la mesure où une antenne destinée à un grand nombre de canaux est très encombrante, on peut aussi remplacer les parties de l’antenne correspondant aux directions de l’espace où il n’y a pas de sources sonores directes par des ambiances.
Une autre de nos influences, importante, vient des systèmes que Kimio Hamazaki a développé pour les systèmes de restitution multicanaux en 22.2 (Hamazaki, 2006). Ces systèmes sont constitués d’un mélange d’antennes et de systèmes d’ambiance et nous avons travaillé en ce sens en essayant de rendre ces systèmes plus discrets visuellement. Les ambiances peuvent être placées par exemple sur les côtés afin de ne pas être trop visibles par le public ou par les caméras.
On peut choisir une antenne constituée de microphones de directivités différentes afin que la réverbération captée par l’antenne soit moins présente sur les canaux centraux que sur les côtés, ce qui permet de contrôler sa répartition spatiale.
Ces possibilités permettent de construire dans chacune des situations des systèmes différents, en fonction du but sonore recherché et des contraintes de production (présence de la vidéo ou du public et donc contraintes visuelles, contraintes dues au temps d’installation, à des limitations techniques, etc.). L’important est de définir un signal pour chacune des directions de la scène. Mais ce signal peut être défini par un appoint, une ambiance, un élément d’antenne ou de la réverbération artificielle, ce qui offre un grand nombre de possibilités.
Ces systèmes ont des fondements très classiques, dans la possibilité de les réaliser. Nous gardons d’une part, la maîtrise de la microphonie. D’autre part, nous pouvons capter le champ acoustique de près ou de loin en utilisant un système principal ou des appoints et des ambiances, comme nous le faisions avant. Le changement consiste uniquement à réaliser la direction du son différemment, en définissant quel signal correspond à toutes les directions d’une scène, plutôt qu’en définissant quelles relations (différences d’intensité et/ou différences de temps) il y a entre les sons présents sur deux canaux à la fois. Ceci ne définit pas une esthétique.
L’esthétique commence dans la mise en œuvre de ces moyens pour occuper l’espace. En partant du modèle cinématographique, on peut observer que cette esthétique peut être très différente suivant les films. Dans Birdman (2014) de A.G. Iñárritu, Michael Keaton fait le tour de la salle via les enceintes surround, ce qui est loin d’être habituel. Dans The French Dispatch (2020) de Wes Anderson, la musique est en mono à droite et les dialogues au centre, ce qui crée un parti-pris très fort. Chaque film a en fait ses spécificités et la manière de
répartir le son dans l’espace fait partie de son style, comme les choix de lumière, le format d’image, etc. Le champ d’expérimentation est à notre avis tout aussi ouvert en musique, avec des possibilités de spatialisation beaucoup plus importantes qu’auparavant.
Bibliographie
Blauert, J. (1997), Spatial hearing, London, The MIT Press.
HAMASAKI, K., HIYAMA, K. (2006), Development of a 22.2 Multichannel Sound System, Broadcast Technology n°25, https://www.nhk.or.jp/strl/publica/bt/en/fe0025-2.pdf
Hendrickx, E., Stitt, P., Messonnier, J.-C. , Lyzwa, J.-M. , Katz, B. F. G., de Boishéraud, C. (2017), Influence of head tracking on the externalization of speech stimuli for non- individualized binaural synthesis, J.Acoust. Soc. Am., vol. 141, pp. 3678–3688.
Messonnier, J.-C., Lyzwa, J.-M., Devallez, D., de Boishéraud, C. (2016), Object-based audio recording methods, AES 140 th convention.
Messonnier, J.-C. & Moraud, A. (2011), Auditory distance perception: criteria and listening room, AES 130th convention, London.
Moore, B. C. J. (1989), An introduction to the psychology of hearing, Academic press, EBU TECH 3364 Audio Definition Model. Metadata specification, Genève, édit. 2014.
Plenge, G., & Theile, G. (1986), Überlegungen zur Leistungsfähigkeit verschiedener stereofoner Verfahren. Institut für rundfunktechnik Münich.
Williams, M. (2004), Microphone Arrays for stereo and Multichannel sound recording, Vol II, Editrice II Rostro.
Biographies auteurs
Jean-Christophe Messonnier. Après une formation d’ingénieur du son à l’ENS Louis- Lumière et parallèlement à une formation d’ingénieur en acoustique au CNAM, terminée en 1994, Jean-Christophe Messonnier est entré au service audiovisuel du Conservatoire en 1988. Dans cette longue pratique au service du Conservatoire, il a cherché à comprendre comment on pouvait formaliser la transmission du son et comment l’acoustique pouvait aider à comprendre certains des problèmes reliés à cette transmission. C’est ce qu’il enseigne à la Formation Supérieure au Métiers du Son du Conservatoire depuis 1992.
Jean-Marc Lyzwa exerce la fonction d’ingénieur du son depuis 1990 au service audiovisuel du Conservatoire de Paris et enseigne à la Formation Supérieure aux Métiers du Son les techniques de prise de son et de post-production. Investi depuis 1995 dans la restitution et la création de l’espace sonore en développant des techniques de captation et de post-production 3D en stéréophonie à deux canaux et en multicanal, il a collaboré avec l’équipe espaces acoustiques et cognitifs de l’IRCAM à la réalisation d’outils de traitement binaural / transaural, spécifiquement adaptés à la production musicale, notamment avec Transpan. Il participe au projet de recherche BiLi (Binaural Listening) de 2013 à 2017 et au projet de recherche PHEND (The Past Has Ears at Notre-Dame) depuis 2021.
Alexis Ling est responsable du service audiovisuel du Conservatoire depuis 2020, mettant à profit les connaissances qu’il a acquises lors de son parcours : licence EEA à la faculté d’Orsay, Maîtrise de Sciences et Techniques image et son à l’université de Brest, Formation Supérieure aux Métiers du Son au Conservatoire de Paris, puis activité d’ingénieur du son en freelance dans le secteur de la musique classique, puis en broadcast pour le groupe Canal+. Au sein du Conservatoire, il enseigne et mène une réflexion sur la façon dont les outils et les activités audiovisuelles, en production et en recherche, peuvent accompagner le travail pédagogique et valoriser le travail des étudiants et des étudiantes.
-
Utilisation de techniques binaurales et transaurales en prises de son et en post-productions multicanales 5.1.
Conférence AES – Sao Paulo – Brésil – mai 2009
Jean-Marc LYZWA : Ingénieur du son
Conservatoire national supérieur de musique et de danse de Paris (Cnsmdp) Alexis BASKIND : Réalisateur en informatique musicale et ingénieur du son http://alexisbaskind.net
Introduction
Depuis déjà plusieurs années, une réflexion est menée au Cnsmdp sur les techniques de prise de son et de post-production à mettre en oeuvre afin de créer une immersion sonore plus réaliste pour l’auditeur en ce qui concerne la musique enregistrée. L’objectif est d’améliorer, de préciser et de stabiliser la sensation d’enveloppement tout en renforçant la lisibilité et la compréhension de l’œuvre restituée.
Les différentes évolutions du son cinématographique et des techniques audionumériques ont conduit à la normalisation d’un format : le système multicanal 5.1. Il constitue aujourd’hui la référence commerciale des systèmes de restitution en multicanal. Il est largement distribué et les ventes de systèmes dédiés augmentent sans cesse avec le passage progressif aux téléviseurs à écrans plats. Les grandes enseignes de matériel HiFi proposent sur le marché une palette de systèmes 5.1, relativement diversifiée en termes de qualité et de prix.
Initialement associée exclusivement à l’image, cette norme 5.1 obéit à une logique frontale de la scène sonore, restituée sur le secteur LCR.

Le système 5.1 Elle est extrêmement plus fragile si cette scène musicale est ouverte, voire éclatée dans l’espace et répartie autour de l’auditeur. C’est précisément ces cas particuliers qui suscitent notre intérêt. Obtenir un enveloppement stable du champ sonore s’avère indispensable pour la HDTV et plus particulièrement pour la 3D Full HD, mais également pour la restitution d’œuvres musicales spatialisées. La WFS et le 22.2 difficilement exploitable dans un salon, le 5.1 reste par conséquent le système de restitution multicanal le plus approprié et le mieux adapté pour le grand public.
En comparaison avec la stéréophonie à deux canaux, le système multicanal 5.1 se caractérise par deux améliorations essentielles : l’une favorisant la restitution d’un enveloppement réaliste, l’autre permettant une localisation plus ou moins précise des sources sonores à l’intérieur de l’espace restitué.
Le système 5.1 permet donc de restituer de manière optimum une scène frontale, en plaçant l’auditeur dans la perspective d’une écoute réaliste en salle. Dans ce cas, l’auditeur est enveloppé par la réverbération du lieu d’enregistrement ou par une réverbération artificielle. La scène sonore est alors limitée sur le secteur frontal.
Le système 5.1 est également censé permettre la restitution d’une œuvre éclatée dans l’espace et par conséquent d’une image sonore enveloppante sur 360°.
Cependant, le système 5.1 reste par bien des points un système de restitution imparfait par son manque d’homogénéité. Une instabilité de localisation des sources concerne tout d’abord les secteurs latéraux du système. La distance des deux groupes de haut- parleurs entre le secteur frontal et le secteur arrière est importante, son ouverture est de 80°.
+30° 0° -30°

Limitations de la norme ITU 5.1 – Secteurs latéraux Les sources sonores restituées dans ces secteurs sont des sources fantômes produites par un point d’émission avant (+/- 30°) et un point d’émission arrière (+/- 110°). Excentré par rapport à notre axe d’écoute (0°), notre système auditif rencontre des difficultés pour la perception cohérente de ce type de signal d’informations.
Avec une ouverture très importante de 140°, le secteur arrière est quant à lui extrêmement instable.
+30° 0° -30°

Limitations de la norme ITU 5.1 – Secteur arrière Si l’on s’écarte latéralement de l’axe d’écoute, la source sonore restituée à l’arrière bascule très rapidement sur le haut-parleur arrière le plus proche. Le 6.1, avec un canal central arrière peut alors constituer une solution plus stable.
Notre processus de perception spatial est plus précis à l’avant et sur le plan horizontal que sur les cotés et à l’arrière. Le système de restitution 5.1 repose donc sur une certaine incohérence en l’absence de l’image.
Pour le secteur frontal, le secteur où l’oreille en localisation est la plus précise, on se retrouve avec trois points de diffusion, concentrés sur 60° (L (30°) / C (0°) / R (-30°)). On obtient par conséquent une très bonne stabilité pour ce secteur.
Seuls deux points de diffusions positionnés à +/- 110° à l’arrière (Ls (110°) / Rs (-110°)), assurent un relais avec le secteur avant pour couvrir les secteurs où l’oreille est la moins précise : les cotés et l’arrière. L’ensemble de cette zone fragile d’un point de vue perceptif couvre tout de même un secteur de 300°.
Conscient des défauts que compte le système multicanal 5.1 spécifiquement développé à l’origine pour l’audiovisuel et fixé par la norme ITU1, la prise de son et la post-production à mettre en œuvre pour ce système imposent donc de nouvelles méthodes de travail, mais peuvent également conduire à une nouvelle orientation esthétique de l’image sonore.
L’orientation du projet s’articule sur l’association de différentes techniques propres à la prise de son et innovantes en post-production afin de proposer à l’auditeur une restitution de l’œuvre enregistrée enveloppante, stable, et homogène.
Notre culture de la scène sonore en musique, imposée par l’architecture de la plupart des salles, fixe de manière générale une représentation essentiellement frontale. La stéréophonie à 2 canaux installe l’auditeur efficacement dans cette représentation.
Les productions musicales en multicanal 5.1 de manière générale ont très souvent tendance à restituer de manière optimum une scène frontale, en plaçant l’auditeur dans la perspective d’une écoute réaliste en salle. L’auditeur est dans ce cas, enveloppé par la réverbération du lieu d’enregistrement ou par une réverbération artificielle. La sensation de profondeur de la scène sonore est généralement accentuée. Et le canal central vient renforcer la stabilité de la scène sonore.
Or, le multicanal 5.1 offre la possibilité d’orienter l’auditeur vers une nouvelle lecture de l’enregistrement et de l’œuvre musicale. D’une restitution réductrice de l’espace à 60° en stéréophonie à deux canaux, le multicanal 5.1 permet un déploiement de l’espace sur 220° voire sur 360° avec plus ou moins de stabilité.
Les sources sonores reproduites ne sont plus concentrées et délimitées sur le secteur frontal, mais peuvent s’étaler dans l’espace. On limite de ce fait les effets de masquage. La restitution en multicanal 5.1 permet d’adapter une image sonore en extra largeur, elle propose donc une séparation et une meilleure localisation spatiale des différents instruments qui composent la formation musicale enregistrée.
D’un point de vue esthétique, l’approche recherchée consiste à placer l’auditeur au plus près de ce que peut percevoir le chef d’orchestre lorsqu’il dirige et ceci dans une acoustique réaliste, restituée ou artificielle.
La direction de travail formulée repose sur l’hypothèse que le compositeur dans l’action de l’écriture développe une image spatiale mentale très proche de ce que peut percevoir et ressentir le chef d’orchestre lorsqu’il dirige.
À la suite de nombreux entretiens avec des compositeurs, eux-mêmes chef d’orchestre, il en résulte que c’est très fréquemment le cas. Aujourd’hui, il reste à déterminer si cette hypothèse peut être généralisée.
À travers cette nouvelle restitution sonore c’est donc une nouvelle perception de l’œuvre enregistrée qui est proposée à l’auditeur.
En élargissant l’espace stéréophonique, on améliore considérablement la clarté et la précision de l’oeuvre musicale restituée. L’analyse de l’enregistrement dévoile plus précisément l’intention compositionnelle et la conception du compositeur.
Le multicanal 5.1 offre le choix de nouvelles directives pédagogiques et propose une perception novatrice de la scène sonore restituée, une analyse plus détaillée de l’œuvre enregistrée, une approche et un ressenti perceptif différent de l’œuvre musicale.
Il peut permettre à l’auditeur de décrypter plus facilement toutes les subtilités de l’écriture musicale.
L’approche vise à stabiliser et préciser les sources présentes dans ces zones sectorielles qualifiées de fragiles en créant un enveloppement immersif réaliste et stable dans le plus grand respect de la restitution des timbres.
Pour cela, il est par conséquent fondamental de concevoir de nouveaux outils de spatialisation pour la prise de son et la post-production, visant à pallier les défauts de la norme 5.1 en termes de stabilité et de précision de localisation latérale et arrière, avec la mise en oeuvre d’une méthode construite sur la superposition de différentes couches, une combinaison de techniques communément utilisées en prise de son. C’est ce que nous nommerons par techniques mixtes ou combinatoires.

Superposition de différentes techniques de spatialisation 1ère couche : C’est tout d’abord la configuration d’un quintuplé microphonique. Ce système reproduit l’empreinte acoustique de la scène sonore à restituer. Il structure l’espace. Il est le système principal dans le processus de prise de son multicanal.
Ce quintuplé microphonique est constitué de 5 omnidirectionnels (4041 ou 4006 DPA). Il est spécifiquement assemblé pour le système 5.1 normalisé. L’assemblage de ce quintuplé repose sur la théorie des angles de prise de son. Le point de départ est de considérer que la prise de son multicanal 5.1 est une extension de la prise de son stéréophonique à 2 canaux. On se retrouve avec un système d’assemblage de type MMAD (Multichannel Microphone Array Design), exclusivement réalisé avec des omnidirectionnels.

Quintuplé microphonique Le principe est d’éviter tout chevauchement des angles de prise de son. Ce qui permet de raccorder parfaitement les couvertures frontale, latérales et arrière.
Si le système recrée des chevauchements, il apparaît une distorsion angulaire, un tassement du centre du segment. Ce trou central entraînera une condensation des informations sur les haut- parleurs.
Le choix de microphones omnidirectionnels quant à lui, se justifie pour le rendu fréquentiel très naturel et régulier dans l’axe du microphone mais également hors de son axe. Les problèmes liés à la diaphonie sont plus ou moins lissés. C’est bien entendu un choix esthétique personnel.
Prenons par exemple une source sonore positionnée physiquement à 72° par rapport à l’auditeur.

Exemple : restitution d’une harpe positionnée à 70° de l’auditeur L’image d’une source sonore, captée par le quintuplé microphonique est restituée par l’ensemble des 5 haut-parleurs.
Cette source se retrouve localisée dans le système de diffusion très grossièrement à la place qu’elle occupe par rapport au système de captation. Mais ce système à lui seul reproduit une image relativement instable suivant la distance de la source sonore à capter.

1ère couche – le quintuplé microphonique Le quintuplé microphonique omnidirectionnel peut évidemment être remplacé par tout autre système de captation multicanal. Le choix de ces systèmes est actuellement extrêmement diversifié. Nous pouvons citer entre autres : les systèmes basés sur le principe ambisonique comme les microphones Soundfield ou DPA, le système Trinov Audio, le système HOA, les systèmes basés sur le principe binaural, avec une tête artificielle, les systèmes basés sur le principe du double MS, avec le système schoeps, le MMAD, la croix IRT, l’OCT surround de Schoeps, l’ASM 5 de Brauner, le Holophone H3D, …
Dans la pratique, il est peu fréquent d’envisager une prise de son utilisant un système de captation unique. L’utilisation d’appoints microphoniques s’impose dans la plupart des projets de prise de son. Mais alors, comment gérer ces appoints dans une production en 5.1 ?
2ème couche : Les microphones d’appoints constituent la seconde couche de post-production. Ils vont êtres mixés sur l’image du quintuplé. Ils sont positionnés dans l’espace restitué 5.1 au panoramique d’intensité. Ils précisent la localisation et définissent les différentes sources sonores pointées. L’appoint de la source sonore à souligner sur notre exemple est mixé au panoramique sur le secteur latéral gauche.

2ème couche – les appoints Cependant, la harpe captée par l’appoint arrive en avance de son image sonore restituée par le quintuplé microphonique, de par la distance qui les sépare.
Chaque appoint est par conséquent, recalé en temps et donc délayé par rapport au système dit principal. L’image sonore globale restituée du mixage entre le quintuplé et les différents appoints devient alors fusionnelle et cohérente.

L’appoint est remis en temps par rapport au quintuplé Son image est calée sur l’image de cette source restituée par le quintuplé microphonique. Cet appoint va préciser et consolider la position de la source. On peut pivoter la tête pour regarder cette image sonore : la source sonore soulignée est alors toujours perçue à son azimut d’origine, si l’on est situé proche du sweet spot. Cette construction reste fragile suivant la position d’écoute adoptée.
Le principe est simple, il consiste à ajuster l’appoint microphonique par rapport au quintuplé microphonique et de le positionner dans l’espace au panoramique d’intensité pour que les 2 images spatiales coïncident, ce qui permet d’apporter une précision spatiale et une précision spectrale en limitant toute forme d’incohérence.
3ème couche : Elle est réalisée en post- production à l’aide d’un outil de traitement du signal. C’est l’élément nouveau introduit. Elle combine 2 traitements transauraux qui visent à stabiliser les zones dites fragiles du système de restitution 5.1, les latéraux et éventuellement l’arrière. Cet outil de traitement transaural est spécifiquement adapté au système de restitution multicanal normalisé. Ce sont les signaux des appoints à spatialiser sur les secteurs latéraux qui sont traités. Le traitement transaural de l’appoint se combine à l’image sonore restituée en panning d’intensité de ce même appoint.
Ces deux couches transaurales viennent se superposer et se combiner sur l’image sonore de l’instrument souligné par l’appoint et restituée par le quintuplé microphonique. Cette méthodologie à pour rôle de fixer, figer et structurer l’image sonore à l’intérieur de l’espace de restitution 5.1. C’est le principe de ce que nous nommerons : technique combinatoire.
L’utilisation du traitement transaural permet de dépasser les limitations du 5.1, notamment l’instabilité perçue lors des déplacements avant/arrière et le manque de précision latérale et arrière.
L’utilisation du panoramique d’intensité permet de dépasser les limitations du transaural, en particulier l’instabilité engendrée par rotation de la tête, mais également le repliement partiel de la scène vers l’avant ainsi que la coloration spectrale pouvant être générée avec ce type de traitement.
Afin de limiter l’instabilité spatiale que peut engendrer le traitement transaural, notamment lors des mouvements de la tête, un double traitement transaural est appliqué.
Un premier traitement est appliqué sur le secteur avant.
L’azimut du traitement est calé sur la position de l’appoint donné par le panoramique d’intensité. La superposition des 2 couches, l’une issue du traitement transaural et l’autre du panoramique d’intensité permet de stabiliser l’image sonore de la source soulignée.

Double traitement transaural – frontal Un second traitement transaural est appliqué sur le secteur arrière. Il vient renforcer la stabilité de l’image de la source sonore soulignée. Cette technique fixe l’instrument souligné et contribue à la perception d’un enveloppement précis et réaliste.

Double traitement transaural : frontal & arrière L’auditeur peut alors regarder et suivre de manière analytique une source isolée de la scène sonore sans déformation de l’espace restitué.
Une fois mixées, ces différentes techniques de spatialisation favorisent la construction d’une image sonore globale plus stable. La zone d’écoute s’en retrouve élargie.
4ème couche : Les réverbérations artificielles en multicanal constituent la dernière couche. Elles permettent d’intégrer au mieux les différents éléments qui viennent se superposer. Elles
permettent de renforcer la notion d’espace et d’enveloppement.
la superposition des différentes couches de mixage augmente naturellement le nombre de paramètres de réglages et requiert un ajustement précis de ces différentes couches à la fois temporellement et spatialement.
En particulier, en vertu de la loi du premier front d’onde qui détermine la localisation perçue des sources sonores il convient de contrôler avec précision l’ordonnancement temporel des informations délivrées respectivement par le système de prise de son principal (quintuplé, réseau microphonique, système ambisonic soundfield ou HOA,…), les traitements en panoramique d’intensité des différents appoints et les traitements transauraux effectués sur les microphones d’appoint de sorte à stabiliser l’image sonore à l’intérieur du système de restitution. De cet ordonnancement découleront simultanément la qualité de l’image spatiale (localisation et stabilité en azimut, proximité, élévation et stabilité) et la qualité spectrale.
Le Traitement transaural
Le traitement binaural / transaural permet de dépasser les limitations du panoramique 5.1. Il stabilise la source sonore sur les latéraux par rapport aux déplacements avant/arrière de l’auditeur.
Cette technique, dont le principe est connu depuis les années 60 (première implémentation pratique brevetée par Atal et Schroeder en 1966), est constituée de deux éléments en cascade :
- la synthèse binaurale vise à simuler le trajet acoustique entre une source sonore placée réellement autour de l’auditeur et chacune de ses deux oreilles, afin de restituer au mieux les caractéristiques (différences interaurales de spectre et de temps) requises par le système auditif pour évaluer la position de la source. Cette simulation est effectuée par filtrage de la source monophonique à traiter, les filtres étant mesurés en chambre sourde avec un sujet réel ou une tête artificielle, pour le plus grand nombre de positions possible. Le résultat de la synthèse binaurale est donc destiné à une écoute au casque, car l’écoute via des haut-parleurs introduit elle- même des trajets acoustiques parasitant les indices spatiaux

Principe de la synthèse binaurale - le traitement transaural vise à restituer un signal binaural sur des enceintes acoustiques, par la correction des trajets acoustiques mentionnés ci-dessus. En particulier, il s’agit de chercher au mieux à annuler les trajets croisés (« cross-talk cancellation ») qui sont les principaux responsables de la perturbation des indices spatiaux.

Schéma de principe du traitement transaural, implémentation symétrique La conjonction de ces deux techniques permet donc en théorie une restitution des sources au- delà du traditionnel espace stéréophonique. Ainsi, il est possible de simuler la présence d’une source latérale avec des haut-parleurs frontaux ou arrières. En pratique, les points faibles de son application sont :
- sa sensibilité à la géométrie et aux caractéristiques acoustiques de la tête et du torse de l’auditeur : pour une restitution optimale, il faudrait que chaque mixage soit adapté individuellement à chaque auditeur. En pratique c’est bien sûr impossible, donc on procède en utilisant une base de données de filtres convenant au plus grand nombre de gens possible. L’effet principal d’une inadéquation des filtres à l’auditeur est une perte d’efficacité de l’externalisation.
- la coloration entraînée par la multiplicité des filtres et les traitements par retards. Celle-ci est également partiellement compensée par l’utilisation en parallèle du panoramique d’intensité.
- sa sensibilité aux mouvements de l’auditeur : si celui-ci tourne la tête, ou se déplace de gauche à droite, l’effet est rapidement perdu. Ce défaut est compensé par l’utilisation conjointe avec un panoramique d’intensité, qui permet à la scène sonore de conserver sa cohérence.
En revanche la restitution transaurale est beaucoup plus robuste aux mouvements avant/arrière que ne l’est le panoramique d’intensité dans un environnement 5.1. L’utilisation conjointe des deux techniques vise donc à pouvoir compenser les défauts de l’une avec les atouts de l’autre.
Conclusion
D’innombrables débats se posent et s’opposent depuis plusieurs années déjà sur les différentes techniques de prise de son conciliables avec le système de restitution irrégulier que constitue le
5.1. De nombreuses théories ou réflexions autour de la captation sont développées et chacune se défend de présenter le meilleur système, la solution la plus adaptée pour retranscrire l’espace sonore de manière la plus réaliste et naturelle qu’il soit. Peu d’entre elles cependant, explorent l’ensemble des différentes techniques utilisées réellement par l’ingénieur du son dans la réalisation d’une production, notamment la mise en oeuvre et la gestion des microphones d’appoint, mais également les différentes méthodes de mixage et de la post- production dans leur ensemble.
En tenant compte des nombreux défauts du système de restitution décrits précédemment, l’intention de ce projet est d’adapter et de créer des techniques de prise de son et de post- production aptes à améliorer la perception d’enveloppement, la précision et la stabilité de localisation sur les secteurs latéraux et sur l’arrière.
Aucun système n’étant réellement optimal pour la totalité des différents paramètres entrant en ligne de compte pour une production particulière dans une acoustique précise, les faiblesses d’une approche doivent êtres compensées par les qualités que peuvent apporter les autres techniques utilisées.
Les inconvénients d’une technique, vont sans cesse être compensés par les qualités combinées d’une autre, c’est le principe même de cette approche dite de techniques mixtes ou combinatoires.
La mise en œuvre de ces différents procédés vise à tirer le meilleur parti possible des contraintes imposées par la norme 5.1.
Les principales améliorations constatées mettent en évidence une très nette amélioration de la stabilité latérale, en particulier lors des mouvements avant et arrière de l’auditeur. La sensation d’enveloppement devient beaucoup plus homogène. On constate un élargissement de la zone d’écoute ainsi qu’un meilleur détachement des différents plans sonores.
Cependant, il n’est pour l’instant pas encore possible d’améliorer franchement la stabilité et la précision sur le secteur arrière.
Notre système d’analyse auditif permet de focaliser et de diriger notre écoute à l’intérieur ou sur l’ensemble de la scène sonore réelle ou reproduite.
Notre système de perception auditif est capable de naviguer à l’intérieur d’une image sonore restituée. Par cela rien ne doit faire obstacle entre le passage d’une écoute globale d’une scène sonore et l’écoute suivie d’un instrument ou d’un groupe instrumental à l’intérieur même de l’orchestre. L’ingénieur du son doit éviter d’imposer une image figée de la scène sonore en soulignant tel ou tel instrument par rapport à un autre.
Le mixage se résume en un subtil équilibre dans l’assemblage de différentes techniques de prise de son, dosées de telle manière qu’elles donneront à l’œuvre musicale restituée une lisibilité optimale et à l’auditeur la plus grande liberté d’écoute.
Chaque œuvre musicale est écrite avec des considérations spatiales particulières. Le principe de la restitution en multicanal 5.1 est intimement lié à la sensation d’immersion et de reproduction d’une acoustique réaliste du lieu d’enregistrement ou artificielle. De ce point de vue, l’ouverture spatiale promise par la norme 5.1 ITU se doit d’apporter une évolution considérable par rapport à la stéréophonie à deux canaux.
- Recommandation ITU-R BS.775 ↩︎
-
Conception et expérimentation d’un système de prise de son et de mixage basé sur la technique de spatialisation sonore Higher Order Ambisonics (HOA)
Sébastien Moreau, Perrine Ganjean
Salle Pleyel
Résumé
Dans le cadre de notre projet portant sur la prise de son et le mixage HOA (Higher Order Ambisonics), un système de captation a été conçu sur la base d’un dispositif circulaire de microphones. Ce système permet en théorie d’obtenir des signaux HOA en appliquant successivement sur les signaux captés des opérations de matriçage (combinaison linéaire) et de filtrage. Sa réalisation pratique a pris la forme d’une structure modulable dont les principaux paramètres (taille, nombre et modèle des microphones notamment) se modifient aisément en fonction du contexte musical et des préférences de l’ingénieur du son. Divers enregistrements ont été réalisés et ont permis de valider globalement l’étude théorique. L’analyse du rendu des timbres instrumentaux et de l’espace sonore a révélé l’impact des différents paramètres du dispositif sur la perception auditive et, pour certains, l’intérêt de les choisir en s’écartant des recommandations théoriques. Enfin, la technique HOA a été intégrée dans une station multipiste audionumérique de manière à pratiquer le mixage avec une ergonomie comparable à celle du mixage stéréophonique traditionnel.
Higher Order Ambisonics (HOA)
Higher Order Ambisonics (HOA) [1,2] est une évolution de la technique de spatialisation sonore Ambisonics apparue dans les années 1970 sous l’influence notable de Michael Gerzon. Cette dernière permet de reproduire un champ sonore 3D grâce à la connaissance de ses caractéristiques directionnelles en un point : les composantes omnidirective (W) et bidirectives en 3D (X, Y, Z) constituant le Format B (B-Format) [3]. Cependant, sa faible résolution spatiale limite la reconstruction du champ sonore à une petite zone de l’espace, notamment en haute fréquence. Higher Order Ambisonics permet l’amélioration de cette résolution (et donc d’étendre le sweet spot1 lors de la restitution) en y ajoutant des composantes supplémentaires issues de la décomposition du champ acoustique sur une base de fonctions propres. Ces fonctions propres, associées à l’équation d’onde en coordonnées sphériques (3D), combinent les harmoniques sphériques et des fonctions de Bessel sphériques. Si l’on restreint l’espace à deux dimensions, les fonctions propres en question deviennent celles de l’équation d’onde en coordonnées polaires et associent dans ce cas les harmoniques cylindriques et des fonctions de Bessel de première espèce. Ces aspects théoriques peuvent paraître complexes, mais ils fondent la légitimité de la technique HOA.
La première approche pratique de la prise de sons basée sur la théorie HOA proposée par Craven et Gerzon a abouti à la mise au point du microphone Soundfield sous la forme d’une combinaison tétraédrique de microphones à directivité hypercardioïde quasi-coïncidente, associé à des outils de matriçage pour l’encodage et le décodage des signaux [5].
Aujourd’hui, dans son principe le plus général, un système de prise de son HOA prend la forme d’un réseau circulaire ou sphérique de microphones dont le but est d’échantillonner l’onde acoustique. Les signaux microphoniques sont destinés à être projetés sur la base des fonctions propres mentionnées précédemment, ce qui définit l’opération d’encodage dans le domaine HOA (plus synthétiquement appelé «encodage HOA»). Il en résulte un ensemble de signaux HOA qui constituent une nouvelle représentation de la scène sonore dans un domaine dual des coordonnées d’espace. Cette représentation possède un certain nombre d’avantages. Il s’agit d’abord d’une représentation hiérarchique dans laquelle les signaux sont regroupés par ordre (m=1 à M), le niveau de précision spatiale augmentant avec l’ordre. Ainsi, les signaux des premiers ordres se suffisent pour représenter l’intégralité de la scène sonore, mais l’information spatiale associée est pauvre. À l’extrême, l’ordre 0 correspond à une prise de son monophonique et est en soi une représentation complète et parfaitement exploitable de la scène sonore, mais qui ne contient quasiment pas d’information spatiale (en dehors de l’information de distance liée au rapport entre l’énergie du son direct et l’énergie du champ réverbéré). La prise en compte des ordres supérieurs ne permet alors que d’augmenter la résolution spatiale de la scène. Le second avantage de la représentation HOA est qu’elle définit un format générique indépendant à la fois du format de prise de son (i.e. les signaux issus des microphones) et du format de restitution (i.e. les signaux alimentant les haut-parleurs). En effet, les signaux HOA doivent passer par une étape préalable de matriçage (décodage HOA) avant diffusion sur un dispositif de haut-parleurs. Au passage, on notera que, contrairement à d’autres techniques de spatialisation, la technique HOA n’est pas associée à un dispositif de restitution spécifique : n’importe quelle configuration de haut-parleurs peut être utilisée (même si toutes ne sont pas aussi performantes pour restituer au mieux l’ensemble des caractéristiques spatiales du champ sonore en question). C’est justement le rôle de l’opération de décodage d’adapter les signaux HOA au système d’écoute. Enfin, dernier avantage de la représentation HOA : dans le domaine dual, il est plus facile de manipuler l’espace sonore (rotation, zoom).
Si ces propriétés font d’HOA une technique particulièrement adaptée aux nouvelles technologies interactives de diffusion de contenus multimédias, son développement se heurte actuellement au manque d’outils mis à disposition des ingénieurs du son pour l’enregistrement et la postproduction. Nous présentons dans cet article l’état d’avancement des travaux que nous menons à la salle Pleyel sur la prise de son et le mixage HOA. La première partie expose les fondements théoriques de la technique de spatialisation dans un espace à deux dimensions décrit par un système de coordonnées polaires (r, q). La deuxième partie s’intéresse à la conception d’un système de prise de son HOA sous la forme d’un dispositif circulaire de microphones. La troisième partie concerne la mise en œuvre de la méthode de prise de son et fait le bilan des premiers enregistrements réalisés. Enfin, l’intégration du dispositif de captation et plus largement de la technique HOA dans une station audionumérique de mixage et de postproduction est décrite et discutée dans la quatrième partie.
Représentation du champ sonore : les signaux HOA
Pour représenter une scène sonore en deux dimensions et permettre sa reproduction, la technique de spatialisation sonore HOA se fonde sur le développement en série du champ de pression acoustique sur la base des fonctions propres de l’équation d’onde en coordonnées cylindriques (rayon r, azimut q ). Dans une zone de l’espace centrée à l’origine du repère et ne comprenant pas de sources sonores, le champ de pression acoustique p s’exprime ainsi sous la forme d’une série de Fourier-Bessel [1, 2] :

(1) où k = 2p ƒ/c est le nombre d’onde, c la vitesse du son dans l’air et m l’ordre des composantes. Les fonctions propres associent des fonctions de Bessel de première espèce à dépendance radiale Jm (kr) illustrées à la figure 1 à des harmoniques cylindriques représentées pour les huit premiers ordres à la figure 2 et sont définies par :

(2) Les coefficients, qui représentent les coefficients de la série de Fourier-Bessel, suffisent à décrire entièrement le champ acoustique et constituent dans la technique HOA le format de représentation du champ sonore. Exprimés ici implicitement dans le domaine fréquentiel, ces coefficients constituent des signaux audio, au même titre que des signaux monophoniques, stéréophoniques ou binauraux. Nous les appelons signaux HOA.
La série de Fourier Bessel (1) implique une infinité de signaux HOA. En pratique, la représentation d’une scène sonore doit être limitée à un ordre maximal M fini, soit à un nombre restreint de 2M+1 signaux HOA. Cette restriction du nombre de signaux correspond à une troncature de l’équation (1) qui ne permet plus de décrire exactement le champ sonore mais seulement de façon approximative. La précision de l’approximation qui influera directement lors de la reproduction sur la taille de la zone d’écoute [2, 4], augmente avec l’ordre M. Le format 2D Ambisonics ou B-Format introduit par Gerzon est un cas particulier de cette représentation HOA qui revient à limiter l’ordre maximal de la décomposition à M=1. Seules les trois premières composantes sont ainsi prises en compte :


Fig. 1 : Illustration des fonctions de Bessel Jm en fonction de kr pour les ordres m = 0 à 8
Illustration of Bessel functions Jm as a function of kr up to order m = 8
Fig. 2 : Illustration des harmoniques cylindriques pour les ordres m = 0 à 5
Cylindrical harmonics up to order 5Encodage spatial HOA
Comme en stéréophonie, deux méthodes distinctes permettent d’encoder (créer) des signaux HOA. La première consiste à simuler la position des sources sonores en appliquant sur des signaux audio monophoniques des gains adaptés (panpot2 d’amplitude). La seconde méthode a pour but la captation directe de signaux HOA naturels à partir d’un dispositif microphonique.
La synthèse HOA peut être illustrée avec le cas simple d’une onde plane d’incidence θS transportant un signal S. La décomposition associée en série de Fourier-Bessel est connue [12]. On en déduit aisément les signaux HOA qui s’obtiennent en pondérant le signal audio par les harmo-niques cylindriques [2] :

(3) Cette équation livre une nouvelle interprétation de l’encodage spatial : on se rend compte qu’il s’apparente à une prise de son par des microphones directifs 2D dont la directivité s’identifie aux harmoniques cylindriques. Les signaux HOA d’ordre 0 et 1 seraient ainsi issus respectivement d’un microphone virtuel omnidirectif et de deux microphones virtuels bidirectifs agencés perpendiculaire- ment (cf. Figure 2), et ainsi de suite.
L’encodage d’une scène sonore naturelle est beaucoup moins évident. En effet, s’il est possible d’enregistrer avec des microphones usuels les signaux HOA jusqu’à l’ordre 1, il en n’existe pas de directivités équivalentes aux harmoniques cylindriques d’ordres supérieurs.
D’autre part, l’enregistrement direct des signaux HOA nécessiterait de placer tous les microphones en un même point de référence, ce qui n’est évidemment pas réalisable.
Quelques solutions ont déjà été proposées par le passé, concernant notamment la prise de son en trois dimensions à partir de structures microphoniques sphériques [4-7]. Nous présentons dans la deuxième partie, une méthode d’enregistrement 2D qui permet d’obtenir des signaux HOA naturels d’ordre quelconque à partir d’un dispositif microphonique circulaire.
Décodage spatial HOA
Contrairement aux signaux stéréophoniques, les signaux HOA sont indépendants du système de diffusion et doivent être adaptés en fonction du contexte d’écoute avec le but de recréer les composantes harmoniques originales de la série de Fourier Bessel (principe de ré-encodage) [2]. Ce processus d’adaptation, ou encore de décodage HOA, consiste à alimenter chaque haut-parleur du dispositif en fonction de sa position angulaire par un signal combinant les signaux HOA de façon linéaire [2]:

(4) L est le nombre total de haut-parleurs du dispositif de diffusion et

les gains pondérant les signaux HOA alimentant le l-ième haut-parleur et déterminés en fonction de sa position angulaire.
Par exemple, en disposant en cercle et de façon régulière L=2M+2 haut-parleurs (ce qui garantit une reconstruction du champ acoustique conforme à celui décrit par des signaux HOA d’ordre M [2, 4]), l’application du principe de ré-encodage permet de calculer les gains [2] :

(5) Il existe également des procédures d’optimisation du calcul de ces gains

ayant pour but d’améliorer du point de vue perceptif la restitution sonore dans certains cas particuliers (trop faible résolution des signaux HOA pour la zone d’écoute visée par exemple) [2].
Conception d’un dispositif circulaire de microphones pour l’enregistrement HOA
Fondements théoriques
Puisque la captation directe des signaux HOA caractérisant une scène sonore naturelle n’est pas réalisable, une méthode alternative doit être envisagée. Cette méthode est suggérée par la définition des signaux HOA contenu dans la série de Fourier-Bessel (1) de manière implicite [8]. Les signaux HOA étant les coefficients du développement de la pression acoustique sur la base des fonctions propres, il suffit pour les obtenir de projeter la pression sur chaque fonction propre :

(6) Cette équation s’interprète de la façon suivante : ayant fixé le rayon à une valeur finie r=R, la première étape consiste à enregistrer la pression acoustique avec des microphones omnidirectifs disposés sur un périmètre circulaire continu, puis ces signaux microphoniques sont combinés linéairement (opération symbolisée par l’intégrale), enfin un filtrage

est appliqué.
Deux difficultés doivent cependant être surmontées pour mettre en œuvre un tel dispositif de prise de son : l’emploi d’un nombre fini et limité de microphones, alors que l’intégrale dans l’équation (6) repose sur un signal continu de pression, et la réalisation des filtres

, en particulier pour les fréquences où les fonctions de Bessel s’annulent.

Fig.3 : Représentation schématique d’un dispositif de prise de son HOA
Schematic view of a HOA microphoneDiscrétisation du cercle microphonique continu
L’emploi d’un nombre fini de microphones ne permet pas d’enregistrer la pression acoustique sur un périmètre circulaire continu. Cependant, par analogie au théorème classique d’échantillonnage de Shannon dans le domaine temporel, les signaux HOA peuvent être déduits de façon exacte jusqu’à un ordre fini M en positionnant 2M+2 microphones aux sommets d’un polygone régulier (échantillonnage régulier de l’azimut), soit aux angles :

(7) Les signaux HOA s’obtiennent alors grâce à la formule suivante, correspondant à la discrétisation de l’équation (6) :

(8) La discrétisation du cercle microphonique engendre un double phénomène d’aliasing qui parasite l’acquisition des signaux HOA. Dans le domaine spatial, l’effet résulte du sous-échantillonnage des modes harmoniques supé- rieurs à M (fréquences spatiales) et tout de même présents dans les signaux captés par les microphones en fonction du rayon du dispositif de prise de son et de la fréquence (cf. Figure 1). Dans le domaine temporel, la fréquence ƒal au-dessus de laquelle le phénomène de repliement apparaît dépend, selon le critère de Shannon, de la distance Δd entre deux microphones adjacents :

(9) où c est la vitesse du son dans l’air.
Problèmes liés à la mise en œuvre du filtrage
L’étape de filtrage

n’est pas réalisable en l’état puisqu’il est indéterminé lorsque les fonctions de Bessel s’annulent. D’autre part, lorsque les fonctions de Bessel ont une valeur proche de zéro, les filtres se caractérisent par des phénomènes excessifs d’amplification qui dénotent un manque d’information utile dans les signaux captés et rendent le dispositif d’enregistrement particulièrement sensible aux imperfections comme le bruit de fond des microphones et leurs erreurs de positionnement par rapport au modèle théorique.
Pour éviter l’annulation du terme de filtrage, une solution consiste à remplacer les microphones de pression par des microphones cardioïdes (ou plus généralement une combinaison de microphones de pression et de micro- phones à gradient de pression), auquel cas le terme de filtrage devient [2, 4] :

(10) où alpha caractérise le coefficient de cardioïcité des microphones (0 £ α £ 1). On constate alors que, pour α≠0 et α≠1, EQm est défini pour l’ensemble des fréquences audibles et pour tout dispositif de rayon non nul.
Cependant, puisque le dénominateur dans l’expression d’EQm tend vers zéro avec la fréquence d’autant plus vite que l’ordre est grand, il subsiste dans ces filtres une amplification importante en basse fréquence d’autant plus prononcée que l’ordre est élevé [4, 8]. Or, les zones fréquentielles concernées par ces amplifications excessives ne contribuent pas significativement à la reconstruction de la scène sonore si l’on restreint la zone d’écoute à un disque de rayon fixe et que l’on souhaite obtenir cette reconstruction avec une résolution homogène sur l’ensemble du spectre des fréquences audibles [4, 8]. Ces zones fréquentielles concernent en effet dans ce cas le champ acoustique au-delà de la zone d’écoute. Par conséquent, il n’est pas utile de s’obstiner à extraire en force des données du champ acoustique faiblement présentes dans le signal et corrompues par l’effet dominant des imperfections du système de prise de son (bruit de fond et erreurs de positionnement des microphones notamment). Un processus de régularisation de Tikhonov limitant les phénomènes d’amplification en basse fréquence peut donc être appliqué sur les filtres instables EQm. Les filtres résultants s’expriment ainsi :

(11) où EQm désigne le conjugué complexe de EQm et l est le paramètre de régularisation compris entre 0 et 1 dont la valeur idéale permet de préserver les informations utiles dans le signal et d’éliminer les informations inconsistantes. Comme illustré à la figure 3, les filtres

se substituent finalement dans notre procédé d’enregistrement aux filtres

théoriques.
Pratique de la prise de son HOA
Présentation du dispositif de prise de son et des enregistrements effectués
L’étude théorique rapportée précédemment nous a permis de réaliser un dispositif expérimental de prise de son HOA [9]. Nous avons fait pour cela fabriquer sur mesure une structure en étoile, constituée d’un anneau central percé sur la tranche tous les 5° pour y fixer des tiges en aluminium de différentes longueurs (cf. Figure 4). Ce dispositif est facile à monter, sa taille et sa configuration angulaire sont variables et ses tiges s’adaptent à tous types de pinces microphoniques. Le matriçage et le filtrage des signaux captés (cf. Figure 3) ainsi que le décodage des signaux HOA sont réalisés au moyen de plugins VST3 (Orange Labs) [10], insérés dans le logiciel audionumérique Reaper.
Tous les traitements sont exécutés en temps réel pour permettre une écoute instantanée du rendu sonore sur différents systèmes de reproduction.

Fig. 4 : Dispositif de prise de son HOA
Microphone array for HOA recordingPlusieurs enregistrements HOA de différents ensembles musicaux ont été effectués à la salle Pleyel et au Conservatoire national supérieur de musique et de danse de Paris. Le dispositif microphonique HOA a été utilisé soit comme système principal de prise de son de manière analogue au couple stéréophonique (cf. Figure 5), soit comme système d’ambiance lors de concerts en public. Ces enregistrements ont été l’occasion d’expérimenter la prise de son HOA en faisant varier l’ordre (jusqu’à M =4), la taille, la directivité des microphones, et le paramètre de régularisation λ des filtres. Plus de détails sur les configurations testées sont données dans les références [8, 9].

Fig. 5 : Séance d’enregistrement HOA d’un quatuor de clarinette à la salle Pleyel Premiers résultats des écoutes
Cette section synthétise les premiers résultats informels de nos expérimentations sur la prise de son HOA [8], [9].
Directivité des microphones
Les enregistrements ont été réalisés avec des microphones à directivité cardioïde (Neumann KM184), hypocardioïde (Schoeps MK21), et omnidirectionnelle (DPA 4006). Lorsque cela était possible, les systèmes étaient montés conjointement avec un décalage de 5° sur l’anneau central de la structure pour que la comparaison soit la plus objective possible. Les microphones à directivité cardioïde ont rapidement été écartés malgré le rendu précis de la localisation des sources sonores car ils nous semblaient trop dégrader le timbre. Le tableau 1 donne une lecture parallèle des principales caractéristiques que nous avons associées à l’utilisation des microphones à directivité omnidirectionnelle et hypocardioïde.
Microphones à directivité hypocardioïde Microphones omnidirectifs Localisation assez précise Localisation peu précise Dureté des timbres, manque de graves Timbres naturels, réponse spectrale large Sources assez proches, salle petite Sensation d’enveloppement, salle large Image plus robuste aux mouvements de l’auditeur Faible robustesse de l’image Tabl. 1 : Tableau comparatif des caractéristiques du rendu sonore en fonction de la directivité des microphones utilisés
Comparative view of sound characteristics as a function of microphone directivityRayon du dispositif HOA
Le choix du rayon du dispositif résulte d’un compromis difficile entre la volonté de limiter les phénomènes d’aliasing4 en haute fréquence et celle de disposer d’un maximum de données acoustiques exploitables en basse fréquence (cf. section 2.2 et 2.3). De plus, le placement du système microphonique, notamment lorsqu’il est utilisé comme dispositif principal de prise de son, est susceptible de faire varier de façon significative le rendu des timbres et de l’espace.
Nous avons testé plusieurs tailles de rayon de 26 cm à 93 cm et tenté d’optimiser à chaque fois la position du dispositif de prise de son. Nous avons tout d’abord remarqué que les restitutions de l’acoustique du lieu et des timbres paraissaient d’autant plus naturelles et la sensation d’enveloppement plus agréable que le rayon était grand. À l’inverse, l’acoustique du lieu était moins prégnante et possédait une réverbération moins présente et plus courte lorsque le rayon diminuait. Si les choses sont moins nettes concernant la précision de la localisation des sources sonores, les dispositifs de grands rayons (plus de 60 cm) nous ont parus tout de même plus performants en général. Il semblerait enfin que la taille du dispositif soit faiblement dépendante de celle de l’ensemble musical enregistré puisque nous avons préféré un même rayon (86 cm) pour par exemple un orchestre symphonique et un quatuor de clarinettes.
Filtrage

Le choix du paramètre de régularisation λ qui permet dans l’idéal de filtrer les données acoustiques erronées dans les signaux audio sans éliminer les informations fiables (cf. Section 2.3) est délicat. En effet, notre parti pris pour la réalisation d’une structure microphonique facilement modulable nous empêche de baser l’optimisation des filtres sur des mesures acoustiques comme cela se ferait dans le cas d’une structure fixe. Nous avons par conséquent appliqué une méthode d’essai-erreur consistant à tester successivement différentes valeurs du paramètre λ jusqu’à aboutir au meilleur compromis sonore sur les rendus des timbres et de l’espace. Il est apparu logiquement que des valeurs trop élevées du paramètre λ (au-dessus de λ =0,07 dans notre cas) entraînaient une dégradation importante de la localisation des sources sonores et un déséquilibre spectral en faveur des basses fréquences.
À l’inverse, des valeurs trop basses de ce paramètre (en dessous de λ=0,05 dans notre cas) amélioraient la précision de localisation mais provoquaient un déséquilibre spectral en faveur des fréquences hautes. En outre, le meilleur compromis obtenu ne permettait toujours pas de respecter convenablement les timbres des instruments. Nous avons finalement jugé préférable de supprimer complètement l’étape de filtrage (cf. Figure 3) pour que les timbres des instruments retrouvent leur naturel à la restitution. Cette solution induit en contrepartie une imprécision dans la localisation des sources sonores. Mais cette localisation reste globalement cohérente et pourra être améliorée en ajoutant des microphones d’appoints placés à proximité des instruments et replacés virtuellement dans l’espace lors de l’étape de mixage (cf. Section 4).
Confrontation entre la théorie et la pratique
Les premiers enregistrements que nous avons réalisés ont validé de manière générale la théorie de la prise de son HOA avec un dispositif microphonique circulaire. Ils nous ont également permis d’acquérir un peu plus d’expérience de terrain et d’apprécier l’importance pour le rendu sonore de chaque paramètre intervenant dans la conception du système. Nous en tirons quelques enseignements qui devront être confirmés et complétés par la suite. Premièrement, il apparaît clairement que l’emploi de micro- phones à directivité omnidirectionnelle doit être privilégié contrairement à ce que nous suggère la théorie. En effet, si la précision de la localisation n’est pas aussi bonne qu’avec des microphones directifs, ils apportent un rendu plus fidèle des timbres instrumentaux et de l’acoustique du lieu qui nous paraissent essentiels.
Ensuite, le rayon du dispositif nous semble devoir être grand pour favoriser le rendu spatial, notamment la sensation d’enveloppement. En outre, les phénomènes d’aliasing spatial qui dégradent en théorie la qualité sonore d’autant plus que le rayon est grand, ne sont en réalité pas très gênants d’un point de vue perceptif.
Enfin, nous ne sommes pas encore parvenus à concevoir des filtres

permettant de restituer convenablement le timbre des instruments. Contre toute attente, cependant, la suppression complète de l’étape de filtrage s’est avérée être en pratique une solution satisfaisante. En effet, si la localisation des sources sonores est en contrepartie moins précise, le rendu de l’espace sonore global et des timbres instrumentaux nous a paru tout à fait bon.
Mixage et postproduction HOA
Présentation de l’environnement de travail
Le choix d’un environnement de travail pour le mixage et la postproduction HOA n’est pas aisé. En effet, la majorité des outils actuels (consoles de mixage et logiciels audionumériques notamment) sont dédiés à la stéréophonie et ne permettent pas de manipuler directement des signaux HOA. Pour obtenir une ergonomie de mixage et de postproduction proche de celle de la stéréophonie, nous avons choisi de travailler avec le logiciel Reaper, dont la grande flexibilité autorise une intégration poussée de la technique HOA. Ce logiciel permet en effet de définir pour chaque piste et chaque bus interne le nombre de canaux qu’elle véhicule sans a priori sur le contenu. La technologie HOA en elle-même est intégrée sous la forme d’une suite logicielle de plugins VST, et qui fournit les principaux outils de mixage : traitements liés au dispositif de prise de son HOA, panpot d’amplitude pour le placement d’une source virtuelle dans l’espace, décodage des signaux HOA pour l’adaptation au contexte d’écoute. Ces plugins sont entièrement paramétrables grâce à des fichiers de configuration qui permettent de les adapter à la géométrie du dispositif de prise de son ou au système de diffusion par exemple. Ils s’insèrent directement sur les bus multicanaux par lesquels transitent les signaux HOA.
Exemple d’une session de mixage/postproduction
Pour illustrer de façon concrète le mixage HOA, nous présentons une session de travail basique réalisée pour l’enregistrement et la postproduction d’un quatuor de clarinettes à la salle Pleyel [9]. Cet enregistrement a été effectué avec un dispositif de prise de son HOA circulaire d’ordre 4 constitué de dix microphones omnidirectifs, et quatre microphones d’appoint à directivité hypocardioïde placés à proximité des instruments (cf. Figure 5). La figure 6, page suivante, est une capture d’écran de la fenêtre d’édition du logiciel Reaper montrant les cinq pistes audio : une piste à 10 canaux contenant les signaux captés par le dispositif microphonique HOA et 4 pistes monophoniques accueillant les signaux des microphones d’appoint. Les méthodes traditionnelles d’enregistrement et de montage multipistes peuvent être ici appliquées sans difficulté, y compris concernant la piste multicanale.

Fig. 6: Capture d’écran de la fenêtre d’édition du logiciel Reaper
Screen view of the Reaper edit windowLe routage des signaux et les différents traitements appliqués pendant le mixage sont représentés schématiquement à la figure 7.
Comme nous pouvons le constater, la méthode de travail est très proche de celle utilisée en stéréophonie traditionnelle. Un plugin VST inséré sur la piste du dispositif HOA de prise de son assure la conversion des signaux captés en signaux HOA. Chaque piste d’appoint comporte les effets audio habituels (délai, égalisation, compression, etc.) et un module VST de panoramique HOA qui convertit le signal mono- phonique en signaux HOA. Les niveaux d’envoi de chacune des tranches de la console virtuelle dans les bus Master ou Auxiliaire sont commandés par des faders5 mono ou multicanaux. Ne disposant pas d’effet audio au format HOA, notre configuration intègre une réverbération externe Lexicon 960L capable de traiter des signaux stéréophoniques 5.0.
Pour cela, les signaux sortant du bus Auxiliaire dédié à cet effet sont précédemment convertis au format 5.0 par un décodeur HOA. Ceux qui retournent de l’appareil de réverbération subissent le traitement inverse : chaque signal est replacé dans l’espace par l’intermédiaire d’un plugin de panpot HOA en fonction de la position du haut-parleur qu’il est censé alimenter. Enfin, le décodeur HOA inséré sur la tranche Master permet de modifier en temps réel le choix du système de diffusion pour le monitoring.
Perspectives de développement
Si les méthodes précédemment exposées nous semblent pouvoir favoriser le développement de la pratique de la prise de son et du mixage HOA, il reste encore beaucoup à faire.
Le principal problème réside actuellement dans le manque d’outils mis à la disposition des ingénieurs du son. Malgré la possibilité de travailler avec la suite de plugins VST et encore confidentielle, nous avons nous-mêmes été confronté à l’inexistence d’effets audio, notamment de réverbération, traitant directement des signaux HOA. Cela nous a obligé à complexifier la procédure de mixage en utilisant un format stéréophonique multicanal intermédiaire. Pour espérer faire d’HOA une vraie alternative à la stéréophonie multicanale et bénéficier de ses atouts dans le contexte actuel de déploiement des nouvelles technologies (diffusion Internet, par exemple), la priorité nous semble être de développer des outils de création sonore au format HOA, par exemple en intégrant cette technologie dans les logiciels et les consoles audionumériques (sans remettre en cause totalement la philosophie de travail issue de la pratique stéréophonique), et en développant des dispositifs de prise de son laissant si possible aux ingénieurs du son quelques libertés (structure modulable, choix des microphones, etc.).

Fig. 7 : Synoptique des traitements audio appliqués lors du mixage HOA d’un quatuor de clarinette Nos premières expérimentations de prise de son ont montré qu’il existait une différence significative entre les préceptes issus de la spéculation théorique et ceux issus de l’action pratique. Il faudra par conséquent amplifier ces expérimentations pour éprouver en profondeur la technologie HOA, prendre du recul et forger finalement des automatismes comme cela s’est produit pour la stéréophonie. Des solutions devront également être trouvées à des problèmes très concrets comme la gêne occasionnée par le dispositif de prise de son lors d’un concert avec public.
Conclusion
L’étude de la théorie sur laquelle se fonde la technologie HOA nous a permis de concevoir un système de prise de son réaliste sous la forme d’un dispositif circulaire de microphones.
Pour expérimenter un tel système, nous avons fait fabriquer une structure microphonique en étoile avec une résolution angulaire de 5° et s’adaptant à tous types de microphones. Les outils nécessaires à la prise de son et au mixage HOA ont été intégrés dans une station audio- numérique Reaper au moyen de plugins VST développés par la société Orange Labs.
Les enregistrements réalisés ont permis de valider globalement la théorie tout en en relativisant certains aspects. Nous avons choisi de privilégier le rendu spectral au détriment de la précision de localisation des sources sonores. Les meilleurs résultats ont ainsi été obtenus avec un système de prise de son basé sur des microphones omnidirectifs et sans appliquer l’étape de filtrage, contrairement aux recommandations théoriques. L’effet produit par l’aliasing spatial s’est en outre révélé peu gênant, ce qui a permis l’utilisation de systèmes de prise de son de grande taille favorisant la sensation d’enveloppement sonore. Il a été rendu possible de mixer directement dans le format HOA les signaux issus du dispositif de captation avec des signaux issus de microphones d’appoint et d’appliquer des effets audio (égalisation, réverbération, etc.) avec une ergonomie comparable à celle du mixage stéréophonique traditionnel. Même si davantage d’outils de prise de son et de mixage (effets audio notamment) devront être développés pour faciliter la production musicale, il est envisageable à très court terme de créer et transmettre en temps réel des contenus multimédias au format HOA grâce aux nouvelles technologies de diffusion comme l’Internet. La capacité d’adaptation des signaux HOA au contexte d’utilisation (système de diffusion sonore, débit du réseau de transmission), la possibilité qu’ils pourraient offrir à l’utilisateur d’interagir avec la scène sonore (par exemple la faire tourner, zoomer sur une partie de l’espace), et les faibles ressources informatiques mobilisées pour ces opérations font de la technique HOA un candidat sérieux face à la stéréophonie.
Remerciements
Nous tenons à remercier Virginie Burgun et Olivier Rosset pour leurs travaux de stage menés dans le cadre de notre projet de prise de son et de mixage HOA. Beaucoup d’éléments de cet article sont issus de cette collaboration. Nous sommes également très reconnaissants envers les musiciens qui ont accepté d’être enregistrés, Orange Labs pour avoir mis à notre disposition leurs plugins VST de mixage HOA, et le Conservatoire national de musique et de danse de Paris qui nous a conviés à des séances d’enregistrements particulièrement instructives. Nous remercions enfin Michael Williams pour la fabrication de la structure de prise de son.
Références bibliographiques
[1] J.S. Bamford, An Analysis of Ambisonic Sound Systems of First and Second Order, Master of Science Thesis, University of Waterloo, Waterloo, Ont., Canada, 1995.
[2] J. Daniel, Représentation de champs acoustiques, application à la transmission et à la reproduction de scènes sonores complexes dans un contexte multimédia, Thèse de Doctorat, Université de Paris 6, 2000.
[3] M.A. Gerzon, Ambisonics in multichannel broadcasting and video, J. Audio Eng. Soc., vol. 33, no. 11, pp. 859–871, Nov. 1985.
[4] S. Moreau, Étude et réalisation d’outils avancés d’encodage spatial pour la technique de spatialisation sonore Higher Order Ambisonics: microphone 3D et contrôle de distance, Thèse de Doctorat, Université du Maine, 2006.
[5] P. Craven et M. A. Gerzon, Coincident Microphone Simulation Covering Three Dimensional Space and Yielding Various Directionnal Outputs, U.S. Patent 4,042,779, 1977.
[6] J. Meyer et G. Elko, A Highly Scalable Spherical Microphone Array Based on an Orthonormal Decomposition of the Soundfield, ICASSP 2002, vol. 2, pp. 1781–1784.
[7] A. Laborie, R. Bruno, et S. Montoya, A New Comprehensive Approach of Surround Sound Recording, AES 114th Convention, Amsterdam, The Netherlands, 2003.
[8] V. Burgun, Conception et réalisation d’un système microphonique 2D pour la technologie de spatialisation sonore Higher Order Ambisonics (HOA), Mémoire de fin d’études de la Formation Supérieure aux Métiers du Son, CNSMDP, Paris, France, 2011.
[9] O. Rosset, Optimisation d’un système microphonique 2D et pratique avancée du mixage pour la technologie de spatialisation sonore Higher Order Ambisonics (HOA), Mémoire de fin d’études de la Formation Supérieure aux Métiers du Son, CNSMDP, Paris, France, 2012.
[10] Suite logicielle “HOA VST Plug-ins – Manuel d’utilisation. Orange Labs, Lannion, France, 2008.
[11] M. Bruneau, Introduction aux théories de l’acoustique, Université du Maine, Le Mans, 1983.
[12] Philip M. Morse and K. Uno Ingard. Theoretical Acoustic, McGraw-Hill, 1968.
Notes
- Le sweet spot est un terme utilisé par les ingénieurs du son pour décrire le point focal ↩︎
- La panoramique sonore est la répartition des sons entre les différentes voies de diffusion du contenu sonore.
Que son interface de gestion soit matérielle ou logicielle, elle tend à se présenter sous la forme standard d’un taper pour les contextes stéréo (deux canaux), c’est-à- dire une roulette (éventuellement crantée, à course finie ou non, etc.) ou un élément d’interface graphique qui permet, pour une piste stéréo donnée, d’augmenter ou diminuer l’intensité (dB) relative du signal entrant entre les deux canaux de sortie (qui sont en fait, dans la plupart des cas, des bus). On parle de pan pot pour panoramic potentiometer, c’est-à-dire potentiomètre panoramique. ↩︎ - Les plugins VST utilisés pour l’étude ont été développés par la société Orange Labs ↩︎
- Dans le traitement du signal l’aliasing ou crénelage fait référence à un effet qui provoque des signaux différents pour devenir indiscernables. Il se réfère également à la distorsion qui se produit lorsque le signal reconstruit à partir d’échantillons est différent du signal continu d’origine. ↩︎
- Un fader ou tirette, est un bouton de commande rectiligne réglant le niveau d’un signal audio. ↩︎