Blog

Enjeux et spécificités de la collaboration professionnelle entre directeurs artistiques et chefs d’orchestre

Théo Terracol

Sous la direction de François-Xavier Féron Novembre 2019

Résumé

Contexte de recherche. Ce mémoire est l’aboutissement d’un travail de recherche mené au Conservatoire National Supérieur de Musique et de Danse de Paris dans le cadre de la Formation Supérieure aux Métiers du Son.

Introduction. L’enregistrement musical est un processus complexe mettant en jeu un grand nombre de paramètres d’ordre artistique, technique, pratique et relationnel. Nous avons choisi de mener une réflexion autour des enjeux et des spécificités qu’implique la collaboration professionnelle entre le directeur artistique et le chef d’orchestre. Notre étude s’incrit donc dans le contexte spécifique des enregistrements d’ensembles musicaux dirigés.

Méthodologie. Nous avons effectué une série d’entretiens auprès de dix personnalités francophones du monde de la direction artistique et de la direction d’orchestre, dans le but de recueillir leur point de vue sur le sujet étudié. Les données issues de ces entretiens ont ensuite été confrontées à deux méthodes d’analyse : l’analyse de contenu et l’analyse par théorisation ancrée.

Résultats. Il apparaît dans notre étude que la collaboration professionnelle entre le directeur artistique et le chef d’orchestre s’articule autour de quatre axes principaux : les Aspects relationnels, l’Expertise du directeur artistique, la Nature des échanges et l’Organisation du travail.

Conclusions. Cette étude est l’une des premières à aborder spécifiquement la collaboration professionnelle entre directeurs artistiques et chefs d’orchestre. Elle a ainsi pu permettre d’élargir et de préciser le champ de recherche autour du domaine de la direction artistique.

TERRACOL, T., Enjeux et spécificités de la collaboration professionnelle entre directeurs artistiques et chefs d’orchestre. Mémoire de Master 2, Formation Supérieure aux Métiers du Son, Conservatoire National Supérieur de Musique et de Danse de Paris, 2019.

Introduction

Ce mémoire s’inscrit dans la continuité d’une réflexion personnelle et critique vis-à-vis du rôle du directeur artistique dans le contexte spécifique de l’enregistrement d’orchestre. Cette réflexion, née de notre propre expérience de directeur artistique et de chef d’orchestre, s’est manifestée tout au long de nos quatre années d’études au Conservatoire National Supérieur de Musique et de Danse de Paris.

Nous avons noté l’existence de nombreuses similitudes entre la fonction du chef d’orchestre et celle du directeur artistique telle qu’on l’enseigne en Formation Supérieure aux Métiers du Son. Ces deux activités requièrent des qualités analogues tant sur le plan artistique que sur le plan humain. Tout d’abord, directeur artistique et chef d’orchestre doivent tous deux faire preuve d’une bonne compréhension musicale et esthétique des œuvres. Ils doivent posséder un bagage d’idées sur la musique et sur son interprétation. L’écoute est un atout indispensable, tout comme la capacité à entretenir de très bons rapports humains. Enfin, directeur artistique et chef d’orchestre travaillent avec d’autres musiciens dans un but commun : celui de servir au mieux le compositeur et son œuvre.

Alan Gilbert, chef d’orchestre et directeur musical de l’Orchestre Philharmonique de New York de 2009 à 2017, décrit dans une vidéo publiée par le journal Times le rôle du chef d’orchestre (New York Times, 2012). Il axe son discours autour de l’importance du geste et de l’écoute et souligne la nécessité de faire part de ses aspirations en terme d’interprétation :

« L’une des façons d’améliorer la sonorité [d’un orchestre], c’est de montrer qu’on écoute vraiment les choses et qu’on accorde une réelle importance au son. En réalité, cela ne relève pas de la direction d’orchestre. Il s’agit plutôt d’incarner, de représenter une certaine aspiration, et il est troublant de voir à quel point cela peut faire toute la différence. Si nos oreilles sont grandes ouvertes et qu’on se sent concerné par la qualité du son, alors celle-ci en sera affectée.”¹

Cette citation, aussi surprenante qu’elle puisse paraître à première vue, peut tout à fait s’appliquer au rôle du directeur artistique. A l’instar d’un chef d’orchestre en situation de répétition ou de concert, le directeur artistique doit faire preuve d’une oreille attentive, active et bienveillante, guider et encourager les artistes pour parvenir au meilleur résultat possible. En situation d’enregistrement, le directeur artistique incarne donc une figure tutélaire et avertie pouvant avoir sa propre influence sur le projet artistique final.

De ce fait, il nous semble légitime de nous interroger sur la collaboration professionnelle qu’entretiennent le chef d’orchestre et le directeur artistique, deux acteurs majeurs de la production d’un disque de musique orchestrale. Bien qu’il n’existe que très peu de littérature approfondie sur ce sujet, il est néanmoins possible de trouver un certain nombre d’écrits dans lesquels des directeurs artistiques et des chefs d’orchestre mentionnent les enregistrements qu’ils ont effectués au cours de leur carrière. Cependant, le contenu de ces écrits ne se limite qu’à quelques anecdotes, parfois amusantes, mais qui ne permettent pas de comprendre pleinement les enjeux et les spécificités de la collaboration professionnelle entre un directeur artistique et un chef d’orchestre.

Pour répondre à ce questionnement, nous avons donc choisi d’articuler notre raisonnement en quatre étapes consécutives. Dans un premier temps, nous avons effectué une recherche documentaire axée autour de l’essor de l’enregistrement de musique d’orchestre et du rôle du directeur artistique. Puis, à travers une série de plusieurs entretiens, nous avons recueilli la parole de personnalités expertes issues des milieux de la direction artistique et de la direction d’orchestre. Dans le but de parvenir à formuler les enjeux du phénomène étudié, nous avons soumis les données collectées à deux types d’analyse : l’analyse de contenu et l’analyse par théorisation ancrée. Enfin, en guise de conclusion, nous procéderons à une discussion critique de notre démarche et des résultats obtenus.

I.Contextualisation et enjeux d’une pratique artistique

1. L’enregistrement de la musique orchestrale

a) Les premières réalisations

Réalisée en 1913 à Berlin et considérée à tort comme le premier enregistrement de musique orchestrale de l’histoire du disque (Badal, 1996), la Cinquième Symphonie de Beethoven d’Arthur Nikisch avec l’Orchestre Philharmonique de Berlin, doit avant tout sa postérité au prestige de ses interprètes. Le premier enregistrement d’une pièce orchestrale serait en réalité attribué à la maison de disques allemande Odeon Records qui publia en 1909 la Suite du ballet Casse-Noisette de Tchaïkovsky, interprétée par le London Palace Orchestra sous la direction d’Hermann Finck (Eyser, 1986).

À partir de la décennie 1920, les techniques de prise de son et de diffusion se perfectionnent de manière significative. L’invention du microphone électrostatique au sein des laboratoires Bell, l’émergence d’une nouvelle technique d’amplification électrique du son ainsi que l’avènement de la radiodiffusion participent à l’essor de l’industrie du disque. C’est à ce moment-là que les chefs d’orchestre vont véritablement se confronter au nouveau médium qu’est l’enregistrement. Parmi les plus représentatifs, citons Arturo Toscanini qui réalise lors d’une tournée américaine en 1921 ses premiers enregistrements (Mozart, Beethoven, Berlioz, Massenet, Bizet) avec l’Orchestre de La Scala de Milan pour une jeune maison de disques qui deviendra par la suite RCA Victor. Félix Weingartner, chef d’orchestre très prolifique en studio, grave dès 1923 pour Columbia les cycles complets des symphonies de Beethoven et de Brahms (Badal, 1996). Enfin, à partir de 1926, le compositeur et chef d’orchestre Richard Strauss se lance dans l’enregistrement de ses propres œuvres et de celles de Mozart, Wagner et Beethoven.

b) Un nouveau cadre de travail

Confrontés au monde du studio, les chefs d’orchestre et les musiciens doivent appréhender une nouvelle forme d’interprétation dont l’absence de public s’avère être l’un des facteurs les plus troublants (Chanan, 1995). Du fait de la durée limitée de chacune des faces d’un disque, les œuvres sont découpées et enregistrées en plusieurs sections. Des microphones envahissent le plateau et captent le moindre son émis par les musiciens. Malgré cette avancée technologique notable, permettant une plus large diffusion du répertoire symphonique, un certain nombre de chefs d’orchestre sont longtemps restés hermétiques à l’enregistrement. Wilhelm Furtwängler, bien qu’ayant légué une discographie considérable, n’en a jamais vraiment mesuré la plus-value : pour lui, la malhonnêteté du disque réside dans le fait de découper indéfiniment une œuvre en plusieurs morceaux (Shirakawa, 1992). Il considère que l’expérience du concert est bien plus en phase avec la réalité de la musique et donc qu’elle est la seule digne d’intérêt. Son homologue Otto Klemperer dénonçait lui aussi le processus du montage avec une certaine ferveur, le qualifiant de fraude, d’arnaque, “ein Schwindel !” (Badal, 1996). Le chef wagnérien Hans Knappertsbusch, déconcentré par les conditions du studio, considérait le processus d’enregistrement comme absurde et refusait catégoriquement d’en écouter le résultat final. Notons enfin qu’à toutes ces controverses s’ajoutent très tôt de nombreuses objections esthétiques et éthiques formulées par un bon nombre d’intellectuels, parmi lesquels figurent Theodor Adorno (Adorno, 1990 et Levin, 1990) et Walter Benjamin (2008).

À l’inverse, certains chefs d’orchestre ont dès le début manifesté un réel intérêt pour l’enregistrement et se le sont rapidement approprié. Au début des années 1930, Leopold Stokowksi a mené avec l’Orchestre de Philadelphie un certain nombre d’expérimentations au sein des Laboratoires Bell à New York. C’est l’enregistrement monophonique qui l’amènera à penser un nouveau placement de l’orchestre selon lequel les premiers et seconds violons sont situés en bloc à la gauche du chef et les violoncelles à sa droite. Dans les années 1960, Stokowksi souhaite retranscrire le plus fidèlement possible les sensations de l’auditeur dans les conditions réelles d’une salle de concert : il poursuit ses expérimentations en travaillant avec la stéréophonie Phase 4 de la firme Decca et suggère lui-même de nouvelles idées en termes de placement microphonique, d’acoustique, de spatialisation et de mixage (Smith, 1990). L’expérimentation la plus populaire est probablement celle que Stokowski a réalisé en collaboration avec Walt Disney dans le film d’animation Fantasia sorti en 1940. Soucieux d’explorer les nouvelles possibilités liées aux innovations technologiques du son multicanal, Stokowski a divisé l’orchestre en plusieurs parties, le tout capté sur huit pistes et restitué sur un nouveau format de diffusion sonore immersif baptisé Fantasound (Garity & Hawkins, 1941).

Fig. 1 : Leopold Stokowski et l'acousticien Harvey Fletcher dans les studios des Laboratoires Bell (c. 1929). — Fig. 1 : *Leopold Stokowski et l’acousticien Harvey Fletcher dans les studios des Laboratoires Bell (c. 1929).*

c) Un outil de diffusion et de démocratisation du répertoire

À partir des années 1990, fort d’un recul de près de 80 ans sur l’expérience de l’enregistrement, plusieurs chefs d’orchestre se sont exprimés sur son rôle et sa plus-value. Lorin Maazel et Christoph Von Dohnàny soulignent tous deux l’aspect historique de l’enregistrement qui constitue une précieuse archive attestant de l’interprétation d’une œuvre par un interprète à un instant donné. L’enregistrement permet de laisser une trace durable dans le temps et témoigne de l’évolution de l’interprétation au fil des décennies. Pour Pierre Boulez, c’est une voix royale vers la démocratisation de la musique : l’action d’enregistrer garantit à chacun un accès facile et immédiat au meilleur du grand répertoire. Sir Colin Davis considère l’enregistrement comme une véritable source d’information et y voit un fort potentiel éducatif : en témoigne son acharnement et sa volonté à enregistrer pour Philips dans les années 1960-1970 l’intégrale des œuvres de Berlioz, dont la production mal connue du grand public était jusqu’ici peu enregistrée et rarement jouée. Le disque devient donc avec le concert l’un des meilleurs moyens de découvrir les œuvres de tel ou tel compositeur. Enfin, l’enregistrement est pour Kurt Masur une opportunité pour un chef comme pour un orchestre de se faire connaître et de rayonner à travers le monde (Badal, 1996).

Dans un documentaire (Burton, 1992) consacré au premier enregistrement studio de la tétralogie de Richard Wagner, le chef d’orchestre hongrois Georg Solti identifie plusieurs contraintes liées au contexte de l’enregistrement d’orchestre : la gestion du temps, la nécessité de rester musicalement cohérent sur plusieurs jours (notamment en matière de tempo), ainsi que la difficulté à avoir une vision globale et un recul nécessaires sur le projet. Solti compte alors sur la collaboration de John Culshaw, directeur artistique, pour le seconder.

Fig. 2 : Georg Solti et l'Orchestre Philharmonique de Vienne pendant l'enregistrement du Ring de R. Wagner (1958). — Fig. 2 : *Georg Solti et l’Orchestre Philharmonique de Vienne pendant l’enregistrement du* Ring *de R. Wagner (1958).*

2. La direction artistique

a)Terminologie

Dans un premier temps, il convient de mentionner que la terminologie relative à la fonction du directeur artistique varie selon les différents pays. En France et dans les pays francophones, le terme de directeur artistique est majoritairement utilisé. Certains parlent également de directeur d’enregistrement. Tout comme le mot chef et son autorité sous-jacente peuvent aujourd’hui déranger certains chefs d’orchestre, de plus en plus de directeurs artistiques insistent sur le fait que le mot directeur n’est pas synonyme de pouvoir absolu. Dans les pays germaniques, c’est le terme de Tonmeister (de l’allemand Ton : son et Meister : maître) qui est très largement utilisé. Celui-ci se rapporte exclusivement au répertoire de la musique classique occidentale. Enfin, dans les sphères anglophones, on parle de producer ou de recording producer. Notons que ce terme s’applique aussi bien au répertoire de la musique classique occidentale qu’au répertoire des musiques actuelles.

b) Emergence d’une profession

Borwick (1973) attribue la théorisation du concept de Tonmeister au compositeur viennois Arnold Schoenberg qui dès 1946 prône l’éducation de « maîtres du son » qualifiés dans les domaines de la musique et de la prise de son :

« Ceux-ci devront être formés dans les domaines de la musique, l’acoustique, la physique et la mécanique de façon à ce qu’ils puissent être capables de contrôler et d’améliorer la qualité sonore des enregistrements. […] L’étudiant devra être formé à repérer les différences entre l’image mentale qu’il se fait de la pièce lorsqu’elle est parfaitement jouée et le jeu réel des musiciens ; il sera capable de nommer ces différences et de dire comment les corriger. »²

Il convient cependant de nuancer les propos de Borwick. En effet, Schoenberg théorise ici davantage le concept d’éducation des directeurs artistiques que le concept de directeur artistique en lui-même. Et qui dit théorisation d’un concept ne dit pas invention. La fonction de directeur artistique telle que nous la connaissons aujourd’hui existait déjà bien avant 1946.

Dès ses débuts, l’enregistrement a nécessité un jugement avisé au sujet des décisions artistiques : validation ou ré-enregistrement d’une prise, montage, prise de son, choix des artistes, etc. Ces décisions étaient coordonnées par une personne appelée producer dont le rôle n’a cessé d’évoluer tout au long du XXᵉ siècle (Robert, 2004). Fred Gaisberg, employé par la Gramophone Company et His Master’s Voice, eut un rôle plus ou moins similaire à celui du directeur artistique moderne tel que nous l’entendons aujourd’hui. Gaisberg était en charge de l’ensemble du processus d’enregistrement et veillait à ce que celui-ci soit d’un point de vue artistique aussi satisfaisant que possible (Moore, 1999).

Mais l’importance du rôle de directeur artistique est intimement liée à l’âge d’or des grandes firmes. Au sortir de la Seconde Guerre mondiale, Deutsche Grammophon, Decca et EMI emploient des personnalités fortes pour mener à bien des projets d’enregistrement ambitieux et créer les meilleures collaborations artistiques qui soient avec leurs artistes. Parmi les noms les plus marquants, il convient de mentionner Walter Legge et John Culshaw.

Legge a travaillé de nombreuses années durant pour EMI avec Herbert von Karajan, Wilhelm Furtwängler, Otto Klemperer et Victor de Sabata. Méticuleux, il tenait à ce que chaque enregistrement soit le plus vivant et le plus intense possible, et n’avait aucun scrupule à utiliser les nouvelles techniques de montage pour y parvenir. Selon sa compagne la soprano Elisabeth Schwarzkopf, aucun chef d’orchestre, pas même Karajan, ne pouvait ignorer son avis, surtout s’il s’agissait d’une question d’interprétation (Schwarzkopf, 1983).

Fig. 3 : *Herbert von Karajan (à gauche) et Walter Legge (au centre).*

John Culshaw a longuement travaillé pour Decca et collaboré avec Georg Solti, Herbert von Karajan et Fritz Reiner. Culshaw, « magicien de la technique et philosophe passioné de musique » (Badal, 1996), est le représentant d’une certaine génération de directeurs artistiques à la fois perfectionnistes et innovants, utilisant les nouvelles technologies de prise de son sans concession comme en témoignent ses deux enregistrements majeurs : Elektra³ de Richard Strauss, très largement critiqué pour ses audacieuses prises de risques (Culshaw, 1968) et l’intégrale de la Tétralogie de Richard Wagner⁴, un projet ambitieux d’une envergure démesurée.

Fig. 4 : Georg Solti et John Culshaw pendant l'enregistrement d'Elektra de R. Strauss (1966). — Fig. 4 : *Georg Solti et John Culshaw* *pendant l’enregistrement d’*Elektra *de R. Strauss (1966).*

c) Le rôle du directeur artistique : état de l’art

Selon Haas (2003), le rôle du directeur artistique est simple et se résume à retranscrire sur un support audio la performance d’un chef et de son orchestre. Chanan (1995) le présente comme une oreille extérieure qualifiée d’un point de vue musical et technique. Auditeur privilégié, il sert de médiateur entre la partition, l’artiste et les moyens technologiques d’enregistrement (Frith & Zagorski-Thomas, 2012). Selon King (2016), la fonction principale du directeur artistique consiste à soutenir l’artiste dans la réalisation de ses idées musicales et à le guider tout au long du processus d’enregistrement.

Culshaw (1968) met en regard la figure du directeur artistique et celle du chef d’orchestre. Il pointe les nombreuses similitudes qui existent entre ces deux fonctions et affirme que chacun des deux protagonistes possède une idée parfaitement claire de comment l’œuvre doit être jouée. L’un comme l’autre, ils impriment leur marque sur l’enregistrement. Badal (1996) conçoit la relation qu’entretiennent le chef d’orchestre et l e recording producer comme un véritable partenariat artistique qui conditionne la qualité artistique du disque, pour le meilleur et pour le pire. Ravet (2015) considère le directeur artistique comme un co-auteur de l’interprétation avec qui le chef d’orchestre partage l’autorité créatrice. C’est lui qui contrôle le temps d’enregistrement et qui donne le feu vert pour passer d’une prise à une autre. De façon plus générale, il est garant de la qualité obtenue au moment de l’enregistrement tant d’un point de vue artistique et esthétique que d’un point de vue technique.

Des travaux de recherche sur la direction artistique d’enregistrements ont déjà vu le jour. Hennion (1989) étudie le rôle du directeur artistique dans le contexte de la musique de variété. Proposant une approche sociologique, il le considère comme un intermédiaire entre la musique et son industrie, entre l’artiste et son public. Cotelle (2001) interroge plusieurs directeurs artistiques sur la vision qu’ils ont de leur métier et met en lumière l’importance de l’aspect relationnel. Enfin, Patmore et Clark (2007) proposent une réflexion autour de l’influence esthétique que peut avoir le directeur artistique dans le milieu de la musique classique à travers la personnalité de John Culshaw.

3. Enjeux épistémologiques

a) Les recherches d’Amandine Pras

Amandine Pras est ingénieure du son, directrice artistique et chercheuse. Elle a réalisé un grand nombre d’études liées au domaine des pratiques d’enregistrement. Sa thèse de doctorat (Pras, 2012) a pour objet l’investigation de meilleures pratiques d’enregistrement studio à l’ère du numérique. Son approche en tant que chercheuse fait appel à divers domaines comme la sociologie et la linguistique.

Pras a mené deux études qualitatives visant à documenter les pratiques de la direction artistique et plus précisément les compétences et qualités nécessaires à la fonction de directeur artistique. Amandine Pras et Catherine Guastavino (2011) ont effectué une série d’entretiens auprès de seize musiciens et six ingénieurs du son de milieux différents, dans le but de parvenir à une formulation du rôle idéal du directeur artistique. Les données issues de ces entretiens ont ensuite été confrontées à la méthode d’analyse par théorisation ancrée que nous définirons plus tard dans ce mémoire. Pras et Guastavino ont identifié trois catégories relatives à la fonction de directeur artistique : mission (son rôle), skills (ses compétences) et interaction (rapport avec les musiciens).

En 2013, pour compléter les résultats obtenus, Pras, Guastavino et Cance ont décidé de collecter des données supplémentaires auprès d’une population de directeurs artistiques professionnels (Pras et al., 2013). Six experts du monde de l’enregistrement ont donc été interrogés par le biais de questionnaires et d’entretiens. En combinant plusieurs méthodes d’analyse qualitative du domaine des sciences sociales et de la linguistique, Pras, Guastavino et Cance ont identifié et hiérarchisé les compétences du directeur artistique. Une partie des résultats identifiés en 2011 grâce au corpus de musiciens et d’ingénieurs du son ont été confirmés par cette nouvelle étude. Des résultats complémentaires sont apparus.

La fonction de directeur artistique selon Pras se résume en trois catégories :

la mission de direction artistique : en fonction du contexte esthétique, rôle d’oreille extérieure, guide, critique, recherche du meilleur résultat artistique.
la relation avec les musiciens : observation, adaptation, managing, conserver la sensibilité des artistes, adapter son langage et rôle de pont entre les artistes et le public.
les compétences en matière de communication : créer une bonne atmosphère, permettre la confiance et l’honnêteté.

Fig. 5 : présentation des résultats obtenus par Pras et al. (2013) — Fig. 5 : *présentation des résultats obtenus par Pras et al. (2013)*

Comme le montrent les études menées par Pras, Guastavino et Cance, la direction artistique est une activité complexe impliquant une multitude de problématiques à la fois musicales et relationnelles. Cependant, ces travaux ne se limitent pas à un cadre d’étude particulier et abordent le rôle du directeur artistique de manière globale, sans spécification de répertoire, d’esthétique ou de formation enregistrée.

b) Objet et problématique de recherche

Nous avons choisi d’inscrire notre étude dans un contexte spécifique : celui des enregistrements de musique d’ensemble dirigée. Nous nous limitons donc au contexte des ensembles instrumentaux dirigés par un chef d’orchestre : grand orchestre symphonique, orchestre de chambre, orchestre à cordes ou à vents, petit ensemble baroque ou contemporain. L’enregistrement doit être supervisé par un directeur artistique, capable d’interagir avec le chef d’orchestre et les musiciens.

Bernard Lehmann, chercheur dans le domaine de la sociologie de la musique, affirme que pour un orchestre, la répétition est en réalité « une série de négociations effectuées entre les musiciens et le chef sur la définition du ton à donner à l’œuvre». Il ajoute que cette définition « a d’autant plus de chances d’être acceptée par les musiciens que le chef sait y mettre la forme » (Lehmann, 2002, p.203). Les propos tenus par Lehmann nous semblent tout à fait transposables dans le domaine de l’enregistrement, qui s’avère être une série de négociations effectuées entre le chef et le directeur artistique sur la définition du ton à donner à l’œuvre. De ce fait, quelle relation professionnelle entretient le directeur artistique avec son interlocuteur privilégié : le chef d’orchestre ? De quelle manière travaillent-ils ensemble ? Quelles sont les problématiques mises en jeu ? Existe-t-il des spécificités liées à ce contexte particulier ?

Nous tenterons d’apporter des éléments de réponse à ces interrogations au moyen d’une étude pratique fondée sur la collecte et l’analyse de données discursives recueillies auprès de dix professionnels du milieu de la direction artistique et de la direction d’orchestre.

II. Méthodologie de collecte de données

1. Techniques d’entretien

« L’enquête par entretien est l’instrument privilégié de l’exploration des faits dont la parole est le vecteur principal.»⁵

L’objectif de notre étude étant à la fois de documenter la pratique de la direction artistique dans le contexte d’un enregistrement de musique d’ensemble et d’interroger les relations existantes entre le chef d’orchestre et le directeur artistique, nous avons choisi de fonder la base de notre recherche sur la technique de l’entretien permettant de collecter la parole d’experts.

« L’enquête par entretien est […] particulièrement pertinente lorsque l’on veut analyser le sens que les acteurs donnent à leurs pratiques, aux évènements dont ils ont pu être les témoins actifs ; lorsque l’on veut mettre en évidence les systèmes de valeurs et les repères normatifs à partir desquels ils s’orientent et se déterminent. »⁶

Nous avons donc fait appel à dix professionnels francophones afin qu’ils nous fassent part de leurs expériences et de leurs points de vue sur le sujet étudié. On distingue traditionnellement trois différents degrés de directivité d’un entretien : l’entretien non directif, l’entretien semi-directif et l’entretien directif (Fenneteau, 2007).

L’entretien directif consiste à interroger le participant en lui posant des questions correspondant à la problématique de l’enquête. Le discours de la personne interrogée est par conséquent cadré et fortement orienté. Bien que cette technique permette d’obtenir des informations précises sur le phénomène étudié, elle présente un inconvénient non négligeable puisqu’elle ne permet pas d’explorer en profondeur l’opinion du participant. En effet, les questions directives empêchent d’exprimer une partie des pensées et des sentiments et il ressort souvent des réponses superficielles.

L’entretien non directif favorise une parole plus libre et engage à s’exprimer librement. Le participant adopte alors un discours plus fluide et parcourt le sujet plus en profondeur. Ce qui fait la force de l’entretien non directif peut dans certains cas s’avérer être une faiblesse. En effet, une trop grande liberté peut amener la personne interrogée à s’éparpiller et à perdre une certaine continuité dans son discours. De plus, les propos de chacun des participants sont difficilement comparables, ce qui complique lourdement le travail d’analyse.

Ainsi, nous avons choisi d’opter pour une forme mixte combinant à la fois directivité et non-directivité en réalisant des entretiens semi-directifs. C’est par le biais d’un guide d’entretien rédigé préalablement par le chercheur que celui-ci va orienter le discours du participant, sans pour autant le cadrer explicitement. Si un thème particulier figurant dans le guide d’entretien n’est pas évoqué spontanément par le participant, le chercheur peut alors intervenir pour orienter la discussion. L’entretien semi-directif nous a semblé être un bon compromis pour pouvoir collecter un matériau riche et avoir un réel aperçu des principales dimensions du phénomène étudié.

2. Protocole expérimental

a) Panel des participants à l’étude

Sélectionner les participants à une enquête est une étape majeure : il s’agit de « déterminer les acteurs dont on estime qu’ils sont en position de produire des réponses aux questions que l’on se pose » (Blanchet & Gotman, 2007). Dans le cas de notre étude, la définition de la population est incluse dans la définition du phénomène étudié, à savoir des directeurs artistiques et des chefs d’orchestre. Seuls deux critères de choix ont été définis et ce, par souci de méthode et d’analyse. Tout d’abord, chaque participant devait parfaitement parler le français : une langue commune est nécessaire pour pouvoir mettre en regard les propos des uns avec ceux des autres. De plus, chacun devait obligatoirement avoir au minimum une expérience d’enregistrement de musique d’ensemble dirigée, soit en tant que directeur artistique, soit en tant que chef d’orchestre. L’âge, le sexe et le nombre d’années d’expérience sont trois aspects que nous souhaitions être relativement hétérogènes sur l’ensemble des participants. Cependant, il convient de mentionner que, malgré plusieurs prises de contact, aucune femme chef d’orchestre n’a participé à cette étude.

Malgré nos tentatives d’obtenir un corpus équitable de cinq directeurs artistiques et cinq chefs d’orchestre, nous n’avons malheureusement pas été en mesure de respecter cette condition : deux entretiens ont dû être annulés par deux chefs d’orchestre pour des raisons professionnelles. Cependant, nous avons pu réunir un corpus de dix participants. Parmi eux, six sont des directeurs artistiques, et quatre sont des chefs d’orchestre. Bien qu’un plus vaste corpus de participants est préférable dans toute étude, nous avons dû nous concentrer sur une dizaine de profils riches, sensibles au sujet étudié et fortement impliqués dans le domaine de l’enregistrement de musique d’ensemble dirigée. En amont de chaque entretien, nous avons fait remplir à chacun des participants un court questionnaire permettant de cerner son profil et son parcours professionnel (cf. Annexe 1) . Par souci de confidentialité et conformément aux conditions énoncées en préambule de chaque entretien, nous avons choisi de ne pas divulguer le nom des participants à notre étude. Garantir l’anonymat est un bon moyen d’inciter les personnes interrogées à s’exprimer plus librement.

Les cinq figures ci-dessous présentent le profil de l’ensemble des participants à l’étude.

Fig. 6 : Tranches d'âge des participants. — Fig. 6 : *Tranches d’âge des participants.*

Fig. 7 : Époque à laquelle les participants ont réalisé leur premier enregistrement tous répertoires confondus. — Fig. 7 : *Époque à laquelle les participants ont réalisé leur premier enregistrement tous répertoires confondus.*

Fig. 8 : Époque à laquelle les participants ont réalisé leur premier enregistrement avec des ensembles dirigés. — Fig. 8 : *Époque à laquelle les participants ont réalisé leur premier enregistrement avec des ensembles dirigés.*

Fig. 9 : Nombre d'enregistrements réalisés tous répertoires confondus. — Fig. 9 : *Nombre d’enregistrements réalisés tous répertoires confondus.*

Fig. 10 : *Nombre d’enregistrements réalisés avec des ensembles dirigés.*

La prise de contact avec les participants de cette enquête s’est effectuée de deux manières. Ayant dans notre entourage certaines connaissances dont les profils correspondent tout à fait aux critères définis dans cette étude, nous avons directement pris contact avec ces personnes par e-mail ou par téléphone. Nous avons néanmoins été en mesure de souligner le cadre institutionnel et d’adopter une attitude tout à fait formelle avec ces personnes et ce, pour le bien de l’étude. Pour ce qui est des autres participants, la majorité d’entre eux, précisons-le, nous avons été mis en contact de manière indirecte, en passant par l’entremise d’assistants ou de personnel institutionnel. Bien que cette méthode ne soit pas neutre, dans la mesure où nos demandes étaient doublées d’une demande tierce (sociale ou professionnelle), celle-ci a pour réel avantage de maximiser les chances d’acceptation de la part de l’expert sollicité.

b) Guide d’entretien

L’élaboration du guide d’entretien (Annexe 2) est une étape cruciale puisque c’est son contenu qui va conditionner la nature des informations collectées. Par souci de méthode et de cohérence, nous avons choisi d’utiliser le même guide d’entretien pour les deux groupes de participants : les directeurs artistiques et les chefs d’orchestre. Ainsi, chaque thème a pu être abordé avec chaque participant de manière uniforme. Une fois notre guide élaboré, nous avons choisi de le tester auprès de deux participants pilotes (un jeune chef d’orchestre et un jeune directeur artistique), dans le but de vérifier la pertinence des thèmes abordés et la cohérence des questions posées. Cette étape nous a permis de voir les faiblesses de notre guide et d’y apporter les modifications et reformulations nécessaires.

Les questions n’ont pas forcément toujours été posées dans le même ordre, puisqu’il nous a semblé préférable de nous adapter au discours de notre interlocuteur afin de mener une discussion plus fluide. Pour chercher à fluidifier le discours, inciter les participants à approfondir un sujet ou les inviter à aborder un nouveau point, nous avons utilisé trois stratégies d’intervention énumérées par Blanchet et Gotman (2007) :

la contradiction : action ayant pour but de s’opposer au point de vue développé par le participant afin l’amener à approfondir ou clarifier son opinion. Ainsi, l’enquêteur est certain de bien comprendre les arguments de son interlocuteur ou bien comment il relate certains faits.
la consigne : il s’agit d’une intervention qui a pour but d’inviter la personne interrogée à parler d’un autre sujet. La consigne peut induire deux types de discours selon sa formulation : un discours d’opinion dans lequel le participant expose son point de vue, ou bien un discours de narration qui permet de relater des faits. Nous avons à plusieurs reprises utilisé des consignes au cours de nos entretiens (« J’aimerais que vous me parliez de… »).
la relance : de nature plus spontanée, telle un commentaire, la relance de l’intervieweur permet de souligner, reformuler, synthétiser. Elle peut indirectement induire de la part du sujet une confirmation du discours ou une précision.

c) Cadre de l’entretien

Il est nécessaire d’attacher beaucoup d’attention au choix du cadre de l’entretien. En effet, l’environnement dans lequel la personne interrogée se situe peut avoir tendance à influencer sa réflexion et son discours. Il convient de définir trois paramètres pouvant être décisifs : le choix du lieu et du moment, le contexte humain et le cadre contractuel de l’entretien (Fenneteau, 2007) :

Choix du lieu et du moment

Pour la plupart des entretiens, nous nous sommes efforcés de choisir les moments les plus propices ainsi que des lieux pertinents, porteurs de sens et traduisant les préoccupations de la personne interrogée. Les entretiens avec les chefs d’orchestre se sont déroulés la plupart du temps dans la loge d’une salle de concert à l’issue d’une répétition ou bien au domicile du participant dans lequel nous avions été convié. Les entretiens avec les directeurs artistiques se sont pour la plupart déroulés à l’issue d’une séance d’enregistrement, dans un studio ou au Conservatoire National Supérieur de Musique et de Danse de Paris. Lorsque l’éloignement géographique était trop important, nous avons pu aisément convenir d’un entretien par appel vidéo via Skype. Ainsi, nous avons ainsi souhaité mettre chaque participant en confiance en l’interrogeant dans un lieu qui lui était familier et en choisissant le moment le plus propice au regard de son agenda bien souvent très chargé.

Contexte humain

Le contexte humain est défini selon « les interactions entre le profil psychosociologique de l’interviewer et celui de l’interviewé » (Fenneteau, 2007). Afin de rendre ces interactions les plus profitables au bon déroulement des entretiens, je me suis efforcé d’adopter une attitude respectueuse et arrangeante et de spécifier en amont de la rencontre mon statut d’étudiant, mon fort intérêt pour le sujet ainsi que mes connaissances en matière de direction artistique, d’enregistrement et de direction d’orchestre.

Cadre contractuel de l’entretien

Nous nous sommes efforcés d’établir clairement le cadre de mes entretiens dès la prise de contact avec les experts que je souhaitais interroger. Toutes les prises de contact ont été effectuées par courriel, ce qui a permis aux participants de garder une trace écrite du cadre de l’entretien. Afin d’être certain que toutes les conditions aient été clairement énoncées et comprises, nous avons pris l’initiative de rédiger un formulaire de consentement préalable à l’entretien (Annexe 3) et de le faire signer par toutes les personnes interrogées. Ce formulaire avait pour objectif de rappeler :

mon statut d’étudiant au sein de la Formation Supérieure aux Métiers du Son au Conservatoire National Supérieur de Musique et de Danse de Paris ;
le cadre de mes recherches (mémoire de Master) ;
la finalité de l’étude ;
la procédure d’entretien et sa durée approximative ;
l’enregistrement audio ayant pour but de recueillir l’intégralité des propos du participant ;
les droits du participant ;
la confidentialité des données issues de l’entretien ;
l’anonymat du participant.

d) Transcription des données orales

Nous avons réalisé nos entretiens sur une durée de six mois, entre janvier 2019 et juin 2019. La durée approximative de chaque entretien était comprise entre 25 et 55 minutes. Nous avons par la suite procédé à la retranscription des données collectées, ce qui consiste à transposer par écrit à l’aide d’un logiciel de traitement de texte les propos des participants recueillis oralement. La taille totale des données atteint près de 35 000 mots. L’entretien le plus court en compte environ 2050 et l’entretien le plus long en compte 5000. Par souci de clarté et pour faciliter l’analyse, nous nous sommes efforcés de gommer certaines fautes de langage, hésitations, onomatopées et ce, en restant le plus fidèle possible au discours original de l’interrogé. Par souci de confidentialité et conformément aux conditions énoncées en préambule de chaque entretien, nous avons choisi de ne pas publier l’intégralité des retranscriptions des entretiens. Cependant, précisons que de nombreux extraits seront par la suite cités, dans le but d’illustrer notre analyse. C’est au terme des retranscriptions qu’a pu débuter cette étape.

L’analyse des discours a été effectuée sur l’ensemble des entretiens retranscrits de manière littérale. Le principal objectif de cette analyse est de tenter de produire des résultats répondant aux objectifs de la recherche. Autrement dit, l’analyse contribue à façonner le discours des participants à l’étude pour en dégager un sens global et intelligible.

III. Analyse de contenu

1. Principe de la méthode

Dans un premier temps, nous avons choisi de faire appel à l’analyse de contenu, une méthode directement issue du domaine des sciences humaines et sociales. Celle-ci est définie par Berelson comme étant « une technique de recherche pour la description objective et quantitative d’un contenu » (Ghiglione & Matalon, 1998, p.155). Cette définition implique qu’il s’agit d’une approche mixte, à la fois qualitative et quantitative. Le contenu étudié étant signifié dans un texte d’origine écrit ou dans un discours oral, cette forme d’analyse relève donc du domaine de la sémantique (Blanchet, 1985).

a) Approche qualitative

L’analyse de contenu permet avant tout d’avoir une première approche des choses dans leur globalité : elle vise à identifier et à quantifier les principaux éléments présents dans un discours. Elle ne permet pas de répondre à la question comment ? mais plutôt de quoi est-il question ? Le chercheur est amené à comprendre et synthétiser les données. L’analyse de contenu sert à décrire et à déchiffrer tout passage de signification d’un émetteur à un récepteur (Bardin, 1989). Elle porte donc sur le signifié et cherche à rendre l’information la plus accessible possible avec une réduction minimale des informations.

b) Approche quantitative

L’approche quantitative de cette méthode découle de son approche qualitative. En effet, une fois les problématiques mises en jeu identifiées, il est parfois pertinent et utile de poursuivre la démarche en passant par une phase de quantification. Dans le cas d’une étude comme la nôtre, basée sur un grand nombre de données, l’approche quantitative peut permettre d’évaluer le poids de chaque élément du discours identifié au regard de l’ensemble du corpus.

2. Outil d’analyse

Pour procéder à l’analyse de contenu, nous avons fait appel à l’un des nombreux outils informatiques mis à la disposition des chercheurs. Sketch Engine est une plateforme en ligne conçue pour des applications d’analyse de textes. Développée par la compagnie Lexical Computing Limited en 2003, elle permet l’ajout de contenus écrits (dans notre cas la transcription de nos entretiens) et la création de corpus de textes. Sketch Engine permet d’entreprendre plusieurs démarches pour une première approche purement quantitative : de nombreux outils nous sont proposés parmi lesquels figurent le comptage fréquentiel de lemmes et la mise en évidence d’associations entre plusieurs lemmes. En linguistique, un lemme (ou item lexical) est défini comme une unité de langage autonome pouvant regrouper plusieurs mots de formes différentes mais associés à la même signification. À titre d’exemple, les mots « échanger », « échange », « échanges », « échangé » sont regroupés sous le même lemme « échanger » : tous présentent un radical commun (le lexème).

Afin de procéder à l’analyse des données sur Sketch Engine, nous avons réalisé deux corpus de textes : un corpus dédié aux directeurs artistiques et un autre corpus dédié aux chefs d’orchestre. Cela nous permettra par la suite de pouvoir les confronter.

3. Résultats

a) Wordlist : liste de lemmes

L’outil Wordlist de Sketch Engine permet d’afficher sous la forme d’un tableau la liste des lemmes de chaque corpus selon leur ordre d’apparition fréquentiel. Par souci de cohérence et dans le but d’obtenir un résultat plus explicite, nous avons choisi de retirer de la liste tous les mots non porteurs de sens comme les articles définis et indéfinis (le, la, les, un, une, des…), les conjonctions de coordination et de subordination (et, mais, ou, que, qui…), et les auxiliaires (a, est…). La liste des lemmes classés par fréquence d’emploi selon chaque corpus de textes est disponible en Annexe 4. Nous remarquons que les lemmes utilisés par les directeurs artistiques et les chefs d’orchestre sont globalement assez similaires et relatifs aux thématiques suivantes :

actions liées au processus d’enregistrement (faire, écouter, travailler, jouer, enregistrer, montage…)
communication (échanger, discuter, demander, parler…)
collaboration (confiance, ensemble, besoin, relation…)
gestion du temps (temps, séance, vite, gérer…)

Il convient d’ajouter que les pronoms « je » (personnel) et « on » (impersonnel) ont été volontairement conservés dans ces listes. En effet, selon Pras (dans Bénet, 2018), ces mots sont « indicateurs de l’implication de celui qui parle dans son discours ». Ainsi « je » et « moi » révéleraient un discours plutôt individuel et personnel, alors que « on » semblerait traduire une conception plus collective du phénomène évoqué. En prenant en compte cette règle, il semblerait que les directeurs artistiques adoptent une conception de l’enregistrement plus collective (2,84% de « on », 1,57% de « je ») que les chefs d’orchestre (3,69% de « je », et de « moi », 2,10% de « on »).

b)Thésaurus

Sketch Engine permet également de créer automatiquement un thésaurus et de le rendre explicite grâce à un outil de visualisation. Dans le domaine de la linguistique et de l’analyse de contenu, un thésaurus est un répertoire de plusieurs lemmes structuré autour d’un mot-clé préalablement défini. Dans le cas d’un corpus constitué de transcriptions d’entretiens, le thésaurus se révèle être un outil très utile puisqu’il permet de voir rapidement les associations de mots ou d’idées qui ont été faites par les participants à l’étude. Nous avons ici choisi de représenter trois thèmes clés abordés continuellement au cours de nos entretiens : l’enregistrement, les échanges et le temps.

L’enregistrement

Fig. 11 : représentation visuelle du lemme « enregistrement » (Directeurs artistiques). — Fig. 11 : représentation visuelle du lemme « ***enregistrement*** » (*Directeurs artistiques).*

Fig. 12 : représentation visuelle du lemme « enregistrement » (Chefs d'orchestre). — Fig. 12 : représentation visuelle du lemme « ***enregistrement*** » (*Chefs d’orchestre).*

Les représentations schématiques du thésaurus sont immédiatement lisibles et compréhensibles. Ainsi, nous pouvons voir que pour les directeurs artistiques comme pour les chefs d’orchestres, l’enregistrement est associé à la notion de temps et à ses différents acteurs : le chef, le directeur (artistique) et les musiciens. Pour les chefs d’orchestre, l’enregistrement semble être un travail qui implique des prises de décisions (choix) et des discussions (remarque). Enfin, les directeurs artistiques associent l’enregistrement à la notion de résultat final (le disque) et au déroulé des séances (les prises).

Les échanges

Fig. 13 : représentation visuelle du lemme « échange »(Directeurs artistiques). — Fig. 13 : représentation visuelle du lemme « ***échange*** »(*Directeurs artistiques*).

Fig. 14 : représentation visuelle du lemme « échange » (Chefs d'orchestre). — Fig. 14 : représentation visuelle du lemme « ***échange*** » (*Chefs d’orchestre*).

La notion de temps est ici encore mise en lumière. Elle pourrait être l’un des principaux sujets d’échange entre le directeur artistique et le chef d’orchestre. Des idées d’ordre artistique (interprétation, tempo, œuvre) y sont également associées. Enfin, les chefs d’orchestre semblent sensibles à la notion de confiance et au besoin de dialoguer.

Le temps

Fig. 15 : représentation visuelle du lemme « ***temps*** » (*Directeurs artistiques*).

Fig. 16 : représentation visuelle du lemme « temps » (Chefs d'orchestre). — Fig. 16 : représentation visuelle du lemme « ***temps*** » (*Chefs d’orchestre*).

Nous avons choisi d’approfondir les résultats obtenus jusqu’ici en étudiant les termes associés par les directeurs artistiques et les chefs d’orchestre au lemme temps. On retrouve dans les deux corpus les notions de dialogue (échange) et de confiance. Le temps semble être un facteur décisif dans la réalisation d’un enregistrement puisqu’il est associé par les directeurs artistiques et les chefs d’orchestre à la notion de problème.

c) Discussions

Au vu de ces résultats, il semble que l’analyse de contenu ne permette d’appréhender que de façon globale les propos recueillis. Néanmoins nous avons pu identifier certains thèmes abordés par les directeurs artistiques et les chefs d’orchestre : la communication, la collaboration artistique et la gestion du temps. Élaborer comme nous l’avons fait une liste de lemmes classés par occurrence et un thésaurus est un premier point d’entrée dans l’analyse. C’est une approche qui a le mérite de mettre en évidence dans les grandes lignes certains concepts abordés par les personnes interrogées. Cependant, cette démarche analytique semble insuffisante puisqu’elle ne permet pas d’extraire en profondeur le sens des données collectées. Le discours est découpé et les mots sont étudiés hors de leur contexte précis. L’analyse de contenu ne permet pas de formuler des réponses concrètes à notre problématique de recherche.

Ainsi, il nous paraît essentiel de compléter notre démarche d’investigation en utilisant une autre méthode d’analyse qualitative pour réévaluer, confirmer et préciser les résultats obtenus jusqu’ici.

IV. Analyse par théorisation ancrée

« L’analyse qualitative se présente comme un acte à travers lequel s’opère une lecture des traces laissées par un acteur ou un observateur relativement à un événement de la vie personnelle, sociale ou culturelle. »⁷

1. Principe de la méthode

Développée en 1967 par Glaser et Strauss sous le terme de « grounded theory » (Glaser & Strauss, 2017), l’analyse par théorisation ancrée est une démarche itérative progressive d’un phénomène qui, contrairement à l’analyse de contenu, n’est ni prévue ni liée à l’itération ou à l’ordre d’apparition des lemmes. Paillé parle d’un « acte de conceptualisation » (Paillé, 1994).

La singularité de cette méthode réside dans le fait que la collecte des données et l’analyse se font de manière simultanée et ce, contrairement aux méthodes plus habituelles qui préconisent d’abord une longue phase de collecte, puis une phase d’analyse de l’ensemble du corpus. A intervalles réguliers de deux entretiens, nous avons procédé à la transcription des données, puis à leur analyse. Cette analyse, au début relativement élémentaire voire superficielle, a le mérite de s’affiner et de se complexifier au fil des entretiens. Cette démarche de recherche inscrit le chercheur dans un “processus de questionnement” (Paillé, 1994, p.152) constant qui amène à vouloir toujours mieux comprendre et expliquer l’objet d’étude.

En théorie, il est possible de discerner six étapes dans le processus d’analyse par théorisation ancrée (Paillé, 1994) :

la codification : les propos sont déconstruits en groupes de mots et sont par la suite codifiés, étiquetés selon le sens qu’ils véhiculent (de quoi me parle-t-on ?) ;
la catégorisation : permet d’affiner la phase de codification, début de la conceptualisation (de quel phénomène est-il réellement question ?) ;
la mise en relation : les différentes catégories sont regroupées (pourquoi et comment le sont-elles ?) l’intégration : permet de cerner l’enjeu du propos et de centrer l’analyse sur un objet précis ;
la modélisation : synthèse des trois premières étapes faisant suite aux résultats de l’intégration (comment le phénomène étudié fonctionne-t-il si l’on se base sur les catégories identifiées précédemment ?)
la théorisation : étape finale du processus.

Afin de présenter notre analyse, nous avons choisi de regrouper nos résultats sous la forme de tableaux synthétiques. Chaque tableau correspond à une catégorie identifiée et regroupe les sous-catégories et les concepts émergents correspondants et leurs occurrences totales dans tout le corpus.

CATÉGORIE
Sous-catégorie 1	Concept émergent 1	partagé par…	occurrence totale
	Concept émergent 2	partagé par…	occurrence totale
	…	partagé par…	occurrence totale
	Concept émergent n	partagé par…	occurrence totale
Sous-catégorie 2	Concept émergent 1	partagé par…	occurrence totale
	Concept émergent 2	partagé par…	occurrence totale
	…	partagé par…	occurrence totale
	Concept émergent n	partagé par…	occurrence totale
…	…	…	…
Sous-catégorie n	Concept émergent 1	partagé par…	occurrence totale
	Concept émergent 2	partagé par…	occurrence totale
	…	partagé par…	occurrence totale
	Concept émergent n	partagé par…	occurrence totale

Fig. 17 : tableau synthétique des résultats de l’analyse par théorisation ancrée.

2. Présentation des résultats

Il convient avant toute chose de mentionner la convention adoptée pour référencer de manière anonyme les participants. L’acronyme CO se rapporte aux chefs d’orchestre. L’acronyme DA se rapporte aux directeurs artistiques. Les chiffres de 1 à 6 n’ont pas de signification particulière et sont simplement utilisés pour compléter le référencement.

37 concepts ont émergé de l’analyse, que nous avons regroupés en 4 grandes catégories :

ASPECTS RELATIONNELS : ensemble des rapports professionnels (hors échanges) qui lient le directeur artistique et le chef d’orchestre ;
EXPERTISE DU DIRECTEUR ARTISTIQUE : ensemble des compétences du directeur artistique dans le contexte particuler imposé par l’étude ;
NATURE DES ÉCHANGES : présentation des discussions mises en place entre le directeur artistique et le chef d’orchestre ;
ORGANISATION DU TRAVAIL : ensemble des éléments relatifs ayant trait à la logistique de l’enregistrement dans le contexte particulier imposé par l’étude.

Le tableau ci-dessous synthétise les résultats obtenus après analyse des données.

*CATÉGORIES*	*SOUS-CATÉGORIES*
ASPECTS RELATIONNELS	Dimension collaborative
	Relation de confiance
	Rapports hiérarchiques
	Dimension psychologique
EXPERTISE DU DIRECTEUR ARTISTIQUE	Action artistique
	Responsabilités
	Adaptation selon le contexte d’enregistrement
NATURE DES ÉCHANGES	D’ordre musical
	D’ordre organisationnel
	D’ordre technique
ORGANISATION DU TRAVAIL	En amont
	En post-production
	Contraintes temporelles
	Méthodes d’enregistrement

Fig. 18 : présentation des catégories et sous-catégories identifiées par l’analyse par théorisation ancrée.

a) Aspects relationnels

La direction artistique est un domaine dans lequel les relations humaines occupent une place de premier plan. Tous les participants se sont exprimés à ce sujet. La catégorie Aspects relationnels regroupe l’ensemble des éléments ayant trait aux rapports professionnels entretenus par le directeur artistique et le chef d’orchestre.

Le tableau suivant synthétise les propos tenus et les rassemble dans quatre sous-catégories : “Dimension collaborative”, “Relation de confiance”, “Rapports hiérarchiques” et “Dimension psychologique”.

ASPECTS RELATIONNELS
Dimension collaborative	complémentarité du chef d’orchestre et du directeur artistique	CO1, CO3, DA6	DA1, DA3,	CO2, CO4,	17
	partage d’une vision artistique commune	CO2, DA4	CO4,	DA2,	6
	communication	CO1, DA2, CO4, DA6		DA3,	5
Relation de confiance	nécessité d’une confiance mutuelle	CO1, CO2, CO3, CO4, DA5, DA6			14
Relation de confiance	délégation du travail	CO2, CO3, CO4			6
Rapports hiérarchiques	existence d’une autorité	CO1, CO3, DA6	DA1, DA3,	CO2, DA4,	12
Rapports hiérarchiques	rapports modifiés en cas de présence d’une tierce personne	DA1, DA2, DA4, DA6		DA3,	8
Dimension psychologique	trouver une entente commune	DA1, CO3, DA6	CO2, DA3,	DA2, CO4,	9
	comprendre son interlocuteur	DA2, CO3, DA4, DA5		DA3,	12
	pression et fatigue	CO1, DA2, DA5	CO2, DA3,	CO3, DA4,	10

Fig. 19 : les aspects relationnels de la collaboration entre directeur artistique et chef d’orchestre.

Dimension collaborative

Ce qui relève de la dimension collaborative dans les aspects relationnels touche à l’ensemble des paramètres relatifs à l’élaboration d’un travail effectué en commun par le directeur artistique et le chef d’orchestre.

Complémentarité des rôles

La collaboration entre le directeur artistique et le chef d’orchestre semble se construire sur la complémentarité des rôles de chacun. Le travail du directeur

artistique et celui du chef d’orchestre sont interdépendants. Tous deux œuvrent ensemble et convergent vers un but artistique commun.

✔ “C’est pour moi un métier très important. Le directeur artistique est quelqu’un qui accouche du résultat avec l’artiste.” (CO2)

✔ “Il existe entre le chef et le directeur artistique un partenariat très enrichissant et le plus souvent très intense. C’est vraiment un duo qui fonctionne main dans la main.” (CO1)

Pour certains participants, cette complémentarité se traduit par le fait que le rôle du chef d’orchestre et celui du directeur artistique sont parfois similaires. La fonction de chacun requiert des qualités musicales et relationnelles.

✔ “Chacun a son rôle mais il y a une partie des activités qui pourraient être faites et par l’un et par l’autre.” (DA1)

✔ “J’ai besoin de quelqu’un qui a effectivement la lecture presque d’un chef d’orchestre de la partition, et qui soit capable de l’entendre comme moi. S’il y a une erreur que j’ai pu laisser passer, alors le directeur artistique sera capable d’en faire part.” (CO3)

✔ “Pour moi ce sont deux métiers très complémentaires… je dirais même que c’est un peu le même métier. On doit écouter, comprendre l’oeuvre, gérer des musiciens…” (CO4)

L’un des participants à notre étude affirme que le directeur artistique est en fait un chef d’orchestre assistant. Son action serait de soutenir et si besoin de compléter la vision artistique du chef.

“À plusieurs reprises j’ai eu l’impression d’avoir le rôle d’assistant du chef, parce que finalement c’est un boulot assez similaire : noter sur la partition ce qui n’allait pas, aider dans la balance générale de l’orchestre, donner un point de vue sur l’interprétation si c’est demandé, etc.” (DA6)

Enfin, s’il le juge nécessaire, le directeur artistique peut compléter les propos du chef d’orchestre, par exemple en signalant un problème que celui-ci n’aurait pas évoqué ou en approfondissant une remarque faite à l’orchestre.

“Le directeur artistique peut proposer des choses complémentaires mais non redondantes avec ce que j’ai déjà dit à l’orchestre.” (CO1)
“Parfois il m’arrive de préciser les propos du chef aux musiciens. Si jamais un détail lui a échappé, je me permets d’intervenir pour compléter son intervention.” (DA4)

Partage d’une vision artistique commune

L’aspect collaboratif peut aussi se manifester à travers le partage d’une vision artistique commune. L’action de tendre ensemble vers un but commun permet de mobiliser les esprits et les compétences. Cela incite chacun à investir le maximum de lui-même pour atteindre le résultat souhaité.

“Il faut que tout le monde travaille dans le même sens, il faut que le chef d’orchestre, le directeur artistique et l’orchestre travaillent en harmonie, le plus efficacement possible et ce, pour le bien du projet artistique.” (DA4)
“C’est tout de suite beaucoup plus riche quand le chef et moi on sait qu’on veut travailler ensemble dans une direction artistique commune. On a vraiment envie de s’investir à fond. Et le résultat sera tout de suite plus intéressant.” (DA3)

L’un des participants à l’étude souligne cet aspect en affirmant que toute collaboration professionnelle entre un directeur artistique et un chef d’orchestre sera conditionnée par les goûts de chacun.

“Je pense qu’on ne peut pas marier n’importe quel directeur artistique avec n’importe quel chef d’orchestre, parce qu’à un moment donné, artistiquement parlant, il va s’agir de goût dans un sens très profond.” (CO2)

Communication

Avoir les mêmes objectifs artistiques et donner un sens commun au projet d’enregistrement ne suffit pas. Le dialogue étant la base de toute relation professionnelle, il est nécessaire que le directeur artistique et le chef d’orchestre puisse clairement communiquer.

“Il faut parler. C’est la base du rapport que j’entretiens avec le directeur artistique.” (CO1)
“Tout passe par le dialogue.” (DA3)

Cependant, certains participants nous ont fait part de leurs difficultés à communiquer avec leur interlocuteur. Un manque de communication peut s’avérer problématique et même ruiner une séance d’enregistrement.

“J’ai récemment fait un enregistrement avec un chef qui n’était pas compétent, pas collaboratif avec moi. Il y avait un très gros problème de communication. On ne se comprenait pas. On perdait énormément de temps et ça compromettait grandement le devenir de l’enregistrement en question.” (DA6)
“Je me souviens d’un très mauvais incident. Le directeur artistique, au lieu de passer par moi, commençait à prendre le pouvoir sur tous les musiciens et finalement à faire mon boulot. C’est devenu ingérable parce qu’il arrêtait lui-même l’orchestre, il commençait à prendre des initiatives qui étaient complètement déplacées. Ma légitimité a été un peu remise en cause et on n’arrivait pas à communiquer. C’était quelqu’un qui prenait trop de place et qui n’avait pas conscience des rôles que lui et moi on devait avoir.” (CO4)

Bien que la communication soit un point crucial dans toute collaboration professionnelle, elle peut parfois faire défaut. Nous étudierons ultérieurement dans une catégorie dédiée la nature intrinsèque des échanges entre le directeur artistique et le chef d’orchestre.

Relation de confiance

Cette catégorie regroupe les propos des participants ayant trait à la notion de confiance dans le rapport entretenu par le directeur artistique et le chef d’orchestre.

Nécessité d’une confiance mutuelle

Une collaboration artistique est efficace si elle s’inscrit dans un contexte où la confiance est de mise. Pour la majorité des participants à notre étude, la confiance est nécessaire afin de garantir le bon déroulement de l’enregistrement : elle simplifie les relations sociales et favorise le dialogue.

“Je pense que le mot le plus important c’est la confiance. Quand je n’ai pas totalement confiance en le directeur artistique, je trouve que ça fragilise tout l’objet parce que je ne sais plus sur quels œufs marcher, je ne sais plus dans quel sens aller. Pour moi, notre relation doit absolument être basée sur une totale confiance.” (CO3)
“Toute cette collaboration ne fonctionne que si le duo marche bien et que le travail se fait à deux, dans un climat de confiance qui favorise l’échange artistique.” (CO1)

La relation de confiance doit être réciproque. Le directeur artistique se doit de considérer le chef d’orchestre comme un interprète ayant ses propres conceptions musicales et ses propres objectifs à atteindre. En retour, le chef d’orchestre doit accorder toute sa confiance au directeur artistique qui est là pour le conforter dans ses idées musicales, mais aussi pour gérer l’ensemble des paramètres du projet,

“Le directeur artistique est un partenaire privilégié. Je dois lui faire confiance et il doit me faire confiance, car sinon notre collaboration sera stérile.” (CO3)
“Le directeur artistique doit avoir confiance en mes idées musicales d’interprète, même si je suis prêt à les discuter, mais seulement quand c’est pertinent.” (CO2)

“En séance, vu qu’on a peu de temps, les chefs sont vraiment obligés de nous faire confiance.” (DA5)

Délégation

Une relation de confiance mutuelle se manifeste quand les chefs d’orchestre prennent la décision de déléguer certaines tâches au directeur artistique, dans le but de se focaliser sur des éléments qui leur paraissent plus essentiels.

“S’il croit en lui, le directeur artistique est une personne sur laquelle le chef se repose pendant la séance, de manière à ce qu’il n’ait qu’à se concentrer sur l’interprétation de l’œuvre.” (CO4)
“Personnellement, je n’aime pas forcément avoir la main sur le déroulé de la séance et j’aime bien compter sur quelqu’un comme le directeur artistique pour déléguer la gestion du temps.” (CO3)

Rapports hiérarchiques

Cette catégorie regroupe l’ensemble des éléments relatifs à la notion d’autorité au sein des aspects relationnels. La collaboration entre le chef d’orchestre et le directeur artistique se construit aussi selon les lois de la hiérarchie.

Existence d’une autorité

Pour la majorité des participants, l’existence d’une autorité est indiscutable : il s’agit de celle de l’interprète. Par conséquent, le chef d’orchestre, de par sa position légitime d’interprète, a dans la plupart des cas toujours le dernier mot.

“S’il y a une prise de décision, c’est moi qui en aurait le dernier mot et pour une raison que j’argumente toujours à chaque fois.” (CO2)
“Le chef d’orchestre, c’est l’acteur principal puisque c’est lui l’interprète, c’est lui qui dirige. Si on a une divergence de type musical, je laisse faire le chef d’orchestre parce que c’est lui qui décide. Il aura toujours le dernier mot.” (DA5)
“Des fois, on a beau faire des suggestions, et même si on croit que ce qu’on propose est meilleur, si le chef ne veut pas, il le veut pas.” (DA3)

Le directeur artistique, est lui aussi en mesure de faire valoir une certaine forme d’autorité sur les musiciens et sur le chef. Il se doit cependant de la justifier auprès d’eux. La vision globale qu’il possède de l’ensemble du projet est telle que le directeur artistique peut très bien prendre une décision et l’imposer s’il considère que c’est dans l’intérêt de l’enregistrement.

“Le directeur artistique est en cabine, il sait exactement ce qu’il fait, c’est lui qui est aux commandes et s’il dit qu’il faut refaire une prise, c’est qu’il faut la refaire parce que ce qu’on a fait avant n’était pas bon.” (CO1)
“Le directeur artistique assied en quelque sorte une certaine autorité ou du moins un impact positif par rapport au groupe. C’est quelqu’un dont les musiciens voient que j’attends sa validation pour aller plus loin.” (CO3)

L’un des participants à l’étude nous a fait part d’un avis plus nuancé sur la question : il considère qu’aucune hiérarchie n’existe entre le directeur artistique et le chef d’orchestre. Tous deux sont sur le même pied d’égalité.

“Et tout ça dans un échange d’égal à égal, sans hiérarchie, comme deux alter ego travaillant ensemble. Et quand c’est comme ça, ça marche bien.” (CO3)

Modification des rapports hiérarchiques

Les rapports hiérarchiques entre le directeur artistique et le chef d’orchestre semblent être impactés si l’enregistrement implique une troisième personne décideuse et force de proposition. La plupart des directeurs artistiques interrogés ont mentionné diverses situations liées à la présence d’un soliste ou d’un compositeur. Dans le cas d’un concerto, le soliste sera l’interlocuteur privilégié du directeur artistique et du chef d’orchestre. Il sera aussi la plupart du temps le décideur final car c’est avant tout son disque. Dans le cas d’une pièce contemporaine, la présence du compositeur va également changer les rapports entre le directeur artistique et le chef d’orchestre.

“La relation qu’on a avec le chef va aussi changer si le compositeur est présent ou si on fait un concerto avec soliste. Dans le cadre d’un concerto traditionnel, ça rajoute une personne avec qui je vais avoir un échange et dont l’avis sera aussi important.” (DA3)

“Le compositeur est le plus souvent en cabine avec moi. Il peut être une sorte de deuxième directeur artistique et va parfois se placer entre le chef et moi. Si quelque chose ne lui plaît pas, il le dira directement au chef ou me demandera de relayer sa remarque.” (DA1)
“Évidemment, ça peut ajouter des complications mais ça peut aussi être plutôt divertissant d’avoir une troisième personne qui vient elle aussi apporter une vision de la musique qu’on joue. Ce n’est pas nécessairement une complication sur le plan musical, mais c’est sûr que le cadre devient encore un peu plus serré.” (DA2)

Dimension psychologique

Nous définissons la dimension psychologique comme l’ensemble des paramètres liés au domaine comportemental et affectif. Le directeur artistique et le chef d’orchestre doivent prendre en compte ces paramètres dans la relation professionnelle qu’ils entretiennent.

Trouver une entente commune

Pour le bon déroulement de l’enregistrement, les participants soulignent qu’une atmosphère de bonne entente est nécessaire. Il est ici question pour le directeur artistique et le chef d’orchestre de savoir nouer une relation de qualité avec son entourage professionnel.

“Je vais toujours voir le chef avant et après la séance, ne serait-ce que pour dire bonjour, pour créer quelque chose de positif entre nous. C’est important de tisser un minimum de lien avec la personne avec qui on travaille.” (DA1)
“J’ai beaucoup aimé Harnoncourt, notamment à cause de sa qualité humaine. Il était d’une gentillesse et d’une grande générosité. On s’entendait à merveille et tout se déroulait très bien.” (DA2)

Comme dans toute collaboration professionnelle, certains problèmes liés à des questions de personnalité peuvent se poser. Comme nous l’avons vu précédemment, une atmosphère de confiance réciproque est nécessaire au bon déroulement de l’enregistrement. Cependant, il semble pertinent de parler ici d’un sens du feeling : certaines collaborations fonctionnent bien, d’autres non.

“On peut avoir des points de divergences qui soient liés au fait que nos deux personnalités ne correspondent pas. C’est parfois une question de feeling. C’est aussi une question d’avoir envie de travailler avec telle ou telle personnalité.” (CO3)
“Certains chefs ont vraiment des personnalités difficiles. Je me souviens avoir été viré d’un projet parce que ça ne fonctionnait vraiment pas avec le chef qui faisait preuve d’une mauvaise foi sans nom…” (DA6)
“Je me souviens d’un enregistrement avec un chef d’orchestre au caractère très spécial et très froid. La séance s’est très mal déroulée, il n’avait aucune envie de faire, il laissait passer des choses pas en place ou fausses… Et il a quitté la séance au bout de 10 minutes car il en avait marre.” (DA4)

Comprendre son interlocuteur

Le directeur artistique doit être capable de comprendre son interlocuteur, de cerner ses envies artistiques pour pouvoir s’adapter en conséquence.

“J’ai besoin de quelqu’un qui se rapproche de ce que je suis et de ce que j’ai envie d’essayer de faire avec l’orchestre avec lequel je travaille. Le directeur artistique doit avoir la capacité à comprendre les artistes qui sont de l’autre côté des micros et pour le coup savoir adapter sa personnalité à ce qu’il reçoit.” (CO3)
“Il faut être capable de ressentir les interprètes qu’on a en face de nous, et de s’adapter en conséquence.” (DA4)
“En fait, le directeur artistique c’est beaucoup de psychologie. Le plus difficile c’est de trouver la limite à ne pas franchir. On voit bien dans le ton quand ça commence un peu à se raidir et qu’on se dit qu’on est allé trop loin.”

Pression et fatigue

Pour le chef d’orchestre, l’enregistrement est une source de fatigue et de pression psychologique auxquelles il est indispensable de faire face. Le directeur artistique doit en être conscient et tenir compte des contraintes qui en découlent.

“Le chef d’orchestre est sur la sellette avec les musiciens et il ressent l’atmosphère, l’ambiance et les tensions psychologiques qu’il peut y avoir parmi les musiciens. Il faut savoir que les enregistrements ce sont des moments très tendus pour les musiciens. Il y a parfois une tension assez extrême parce qu’on est à nu, on est à découvert, on entend tout, il faut que tout soit parfait. Dès qu’il y a un truc qui ne va pas, si c’est un instrument qui ne va pas, ça fait refaire la prise pour les 80 autres musiciens qui sont là. Du coup c’est une pression psychologique qui est énorme pour tous les musiciens.” (CO1)
“L’enregistrement est un moment où le bonheur, la joie, le bien-être ne sont pas forcément au rendez-vous. C’est un moment très particulier pour un artiste qui se retrouve devant un espèce de super-miroir en face de lui, qui lui renvoie une super image de ce qu’il est, de ses qualités comme de ses faiblesses.” (CO2)
“Et la fatigue, la lassitude, ce sont aussi des facteurs à prendre en compte.” (DA4)

b) Expertise du directeur artistique

La catégorie Expertise du directeur artistique se rattache à l’ensemble de compétences qui transparaissent chez le directeur artistique dans l’exercice de sa fonction. Nous avons identifié trois sous-catégories : “Action artistique”, “Responsabilités” et “Adaptation au contexte d’enregistrement”.

Le tableau ci-dessous synthétise les résultats.

EXPERTISE DU DIRECTEUR ARTISTIQUE
Action artistique	oreille extérieure	CO1, DA1, CO2, DA2, CO3, DA3, CO4, DA4, DA5, DA6	24
	conseil musical	DA1, CO2, DA2, CO3, DA3, CO4, DA6	16
	accompagner le chef dans le processus d’enregistrement	CO1, CO2, DA2, CO3, DA3, DA5	15
Responsabilités	gestion du projet dans sa globalité	CO1, DA1, DA2, CO3, DA3, CO4, DA4, DA5, DA6	18
	gestion du temps	DA2, CO3, CO4, DA4, DA5	6
	gestion du son	DA2, DA3, CO3, CO4, DA6	6
Adaptation selon le contexte d’enregistrement	selon l’effectif	DA1, CO2, DA2, DA3, DA5	7
	selon la méthode d’enregistrement	DA1, DA2, DA4, DA5	5
	selon la personnalité du chef	DA3, DA4, DA5, DA6	6

Fig. 20 : concepts relatifs aux compétences du directeur artistique.

Action artistique

La sous-catégorie Action artistique rassemble l’ensemble des compétences du directeur artistique d’un point de vue purement musical. Nous regroupons ici les aspects de son métier qui seront exclusivement portés sur les enjeux musicaux et artistiques.

Oreille extérieure

L’intégralité des participants considère que l’une des fonctions premières du directeur artistique est de faire office d’oreille extérieure pour le chef d’orchestre. Une grande partie des chefs nous ont fait part de leurs difficultés à prendre du recul lorsqu’ils sont au pupitre. Diriger un orchestre implique une grande concentration. Il est n’est pas possible pour le chef de pouvoir tout écouter simultanément.

“Il y a un foisonnement d’activité, de notes, d’interactions, et le chef seul ne peut pas forcément tout entendre.” (CO2)
“Quand on est dans l’action de diriger on ne peut pas en permanence tout scanner et on peut laisser passer des choses.” (CO3)

Le directeur artistique semble pouvoir répondre à ce besoin en proposant au chef d’orchestre une écoute supplémentaire. De par sa position géographique, en régie, il a le rôle d’un auditeur extérieur.

“En cabine, avec les écouteurs, on entend beaucoup plus de choses que tous ceux qui sont sur scène et qui jouent.” (CO1)
“Je suis parfois plus à même que le chef pour entendre certaines choses.” (DA5)

L’écoute du directeur artistique est double. Elle doit tout d’abord se focaliser sur les aspects les plus généraux de l’enregistrement. Le directeur artistique est la seule personne à avoir une vision d’ensemble du projet et à pouvoir la rapporter au chef d’orchestre.

“J’ai besoin de quelqu’un qui a une perception globale du son, une chose que moi je ne peux avoir que rarement au pupitre.” (CO3)
“J’ai une vision globale de la séance, mais aussi de la journée, des trois jours d’enregistrement, et de la balance. J’ai aussi la notion de ce qu’on va faire après en post-production, et ça en général les chefs ne le conçoivent pas tout fait. ” (DA5)

Le deuxième aspect de l’écoute du directeur artistique est plus critique et se porte davantage sur les détails : en se basant sur la partition de l’œuvre enregistrée, il doit être en mesure de repérer les erreurs commises par l’orchestre.

“Mon rôle, de par mon oreille, c’est avant tout d’avoir la capacité à repérer ce qui n’est pas ensemble, ce qui n’est pas juste, etc. Il s’agit de direction artistique de base. Je regarde la partition et il faut que ce qu’on entend ressemble le plus possible à ce qui est écrit.” (DA1)
“En fait, cette oreille du directeur artistique a une utilité très importante : étant un peu en retrait, elle détecte tout de suite s’il y a quelque chose qui est incohérent.” (DA3)

Par conséquent, le chef d’orchestre a besoin de compter sur une écoute attentive, pertinente et constructive de la part du directeur artistique.

“J’attends que très vite à la fin d’une prise, le directeur artistique ait entendu et compris comme moi ce qui a été, ce qui n’a pas été, en une demi-seconde.” (CO3)

“Le directeur artistique, c’est l’écoute active, et constructive, des interprètes qui enregistrent.” (CO2)

Enfin, l’un des participants à notre étude souligne le compromis auquel le directeur artistique doit faire face pour ne pas déstabiliser les interprètes avec une écoute trop critique.

“Ce qui est difficile pour le directeur artistique, c’est en même temps d’être une oreille très attentive, très rigoureuse et précise sans pour autant être une oreille castratrice ou une oreille trop froide. Il faut donc trouver un juste milieu entre les deux.” (CO2)

Conseil musical

Le terme “conseil musical” regroupe l’ensemble des suggestions et des avis musicaux donnés par le directeur artistique au chef d’orchestre. Il s’agit de la forme la plus concrète de l’influence que peut avoir le directeur artistique. Il peut suggérer des idées musicales et être force de proposition auprès du chef d’orchestre.

“Le rôle le plus noble et le plus délicat du directeur artistique, c’est d’écouter ce que font les artistes sur un plan purement musical et artistique, et de donner son avis. Selon les cas, on donne son avis plus ou moins librement, mais je ne me prive jamais de dire si je ne suis pas d’accord avec un tempo, une balance, un phrasé, le respect de la partition, etc. J’ai travaillé avec un certain nombre de chefs et d’orchestres pour qui cela était extrêmement important et donc j’ai été imprégné par ce point de vue.” (DA2)

“On est là aussi pour leur suggérer certaines choses. On peut animer, donner vie d’une autre manière au contenu musical. Et c’est au chef de s’en approprier. S’en approprier, j’insiste bien là-dessus. S’en approprier, sinon ça n’a aucune valeur.” (DA3)
“Quand j’ai le temps, ce qui est intéressant, c’est de proposer des choses, une lecture différente ou complémentaire de celle du chef.” (DA6)

Plusieurs chefs d’orchestre ont déclaré être sensibles aux suggestions du directeur artistique. Il doit être capable d’exprimer clairement son opinion sur le travail du chef, afin que celui-ci puisse corriger et améliorer certains points en vue de la prise suivante.

“J’aime bien que le directeur artistique puisse avoir une vue objective et distanciée de ce que je suis en train de faire et qu’il soit capable, et ça c’est une qualité que j’attends, de me dire que non là musicalement, ça ne marche pas, il y a un truc qui ne va pas, ou alors un ralenti qui est mal négocié, etc.” (CO3)

Enfin, si le chef est suffisamment en confiance et réceptif, les conseils du directeur artistique peuvent parfois prendre la forme d’une aide à l’interprétation.

“J’aime quand le directeur artistique est présent pour me dire qu’il peut y avoir encore plus d’intention, qu’on peut faire un tempo encore plus rapide, ou au contraire étirer les sons, prendre des risques à tel ou tel moment, etc. Finalement, il s’agit beaucoup plus d’enjeux d’interprétation que d’enjeux purement techniques.” (CO2)
“En musique contemporaine, on me demande parfois comment interpréter, comme faire sonner tel ou tel son, ça peut arriver.” (DA1)

Accompagner le chef

Le rôle du directeur artistique est aussi de guider le chef d’orchestre tout au long du processus musical. Il aide le chef, le conforte dans la réalisation de ses idées.

“Mon rôle c’est quand même en quelque sorte un rôle de serviteur, de ministre. J’aide le chef à traduire ce qu’il veut au travers de la partition. Et pour cela il a parfois besoin d’être guidé.” (DA2)

Plusieurs chefs d’orchestre ont déclaré vouloir être stimulés, poussés dans leurs retranchements afin de parvenir à un résultat artistique encore meilleur.

“Mes meilleurs souvenirs avec un directeur artistique, ce sont les moments où cette personne se montre être vraiment surprenante. Surprenante dans un sens qui me stimule dans les limites ou les barrières que je me fixe, et qui du coup stimule aussi l’orchestre.” (CO2)
“Récemment, j’ai enregistré une œuvre assez compliquée. On a été à fond jusqu’à la dernière minute et c’est un peu grâce au directeur artistique qui nous a constamment poussé à mieux faire et à aller de l’avant. Évidemment, c’est ça que j’attends d’un directeur artistique.” (CO3)
“Moi, ce que j’ai la prétention de faire, c’est d’essayer d’arriver à motiver les troupes, à motiver l’envie de jouer pour qu’il se passe quelque chose. La nature des relations entre le directeur artistique et le chef est plutôt dans la tentative de renforcement positif et de guidage.” (DA3)

A l’inverse, le directeur artistique est aussi là pour modérer le chef d’orchestre, afin qu’il reste focalisé sur l’essentiel et qu’il ne se perde dans des détails inutiles.

“Parfois, il faut vraiment que le directeur artistique gère la séance car les chefs ont plutôt tendance à se perdre dans des trucs… Donc si je sais qu’il reste encore des choses à faire, qu’il ne reste pas énormément de temps, je n’hésite pas à reprendre la main de manière délicate pour calmer les choses et rester sur l’essentiel.” (DA2)

“Moi j’essaye d’être un bulldozer qui avance et j’attends du directeur artistique que parfois, mais pas trop, il me modère et me dise « attention là on a pas tout ».” (CO3)

Responsabilités

Au cours de notre analyse, le rôle du directeur artistique s’est peu à peu affiné avec l’identification de ses responsabilités. Cette catégorie regroupe les éléments relatifs à la gestion de la logistique par le directeur artistique.

Gestion du projet dans sa globalité

Le directeur artistique est la personne responsable du projet dans toute sa globalité et ce, sur toute la durée de la production. Il assure la liaison entre les différents acteurs impliqués dans le processus d’enregistrement : le chef d’orchestre, les musiciens, le producteur, les chargés de production, la régie d’orchestre…

“Finalement notre rôle, c’est de réaliser un enregistrement de A à Z.” (DA4)
“Le directeur artistique a une mission importante sur la globalité du projet : il va diriger l’équipe technique et être en relation avec l’équipe artistique (chef, orchestre, chargés de production, etc).” (DA6)

Le directeur artistique est également responsable de la post-production. Afin d’être en mesure de pouvoir proposer un montage complet et cohérent, il doit s’assurer d’avoir enregistré tout le matériel nécessaire.

“En situation de studio, le directeur artistique ne doit pas oublier qu’il a pour mission de mettre en boîte un enregistrement complet, et donc d’enregistrer toutes les prises nécessaires.” (DA4)

De ce fait, le directeur artistique est le garant de la qualité artistique et du rendu final de l’enregistrement. Il doit penser au projet dans toute sa globalité.

“Le rôle du directeur artistique, c’est avant tout de garantir la qualité et l’excellence artistique d’un enregistrement.” (CO1)
“On a vraiment l’obligation, moi directeur artistique avec l’équipe de production, aussi bien technique et artistique, de donner un résultat qui soit à la hauteur de l’espoir et de l’exigence des artistes.” (DA2)

Gestion du temps

Le directeur artistique va aussi avoir la responsabilité de gérer le temps de la séance d’enregistrement. Il doit faire preuve de stratégie et d’efficacité pour parvenir à enregistrer tout le matériel musical nécessaire au montage du disque et ce, dans un temps imparti.

“Pour un directeur artistique, la gestion du temps est aussi importante que l’avis technique et l’avis musical.” (DA2)
“Il faut donc être capable de parfaitement gérer les séances en faisant attention à l’horloge, et voir tout ce qu’on pourra faire dans la durée compte tenu du temps restant.” (DA4)
“Un enregistrement, ça se fait dans un laps de temps court, et il faut savoir gérer le temps, être réactif, faire les choses rapidement, dans le temps qui est le temps de l’orchestre, qui est un temps très rapide.” (CO3)
“C’est au directeur artistique de me dire si oui on non on a du temps, c’est sa responsabilité. Je ne peux pas constamment avoir mes yeux sur ma montre. ” (CO2)

Gestion du son

Le directeur artistique doit également répondre de la prise de son et des éventuels problèmes techniques qui pourraient survenir pendant l’enregistrement.

“Le directeur artistique est là pour donner son avis d’abord d’un point de vue technique : il collabore avec l’équipe d’enregistrement pour élaborer ensemble une prise de son.” (DA2)
“La frontière entre directeur artistique et ingénieur du son n’est pas si évidente que ça, on est quand même très impliqué dans la réalisation sonore de la captation.” (DA3)
“Ce qui fait plus peur c’est vraiment les pannes techniques au son et le directeur artistique doit être capable de les gérer, et de gérer 90 musiciens et un chef d’orchestre qui attendent dans le studio.” (DA6)

Adaptation selon le contexte

Dans l’exercice de sa fonction, le directeur artistique doit être capable de faire face à différentes situations. Son rôle est donc variable en fonction du contexte et il doit s’adapter. Les propos relatifs à l’adaptation du directeur artistique sont regroupés dans cette catégorie.

Selon l’effectif

Ce critère ne semble pas faire l’unanimité chez tous les participants, qu’ils soient directeurs artistiques ou chefs d’orchestre. Certains considèrent que le rôle du directeur artistique est identifique quelque soit l’effectif enregistré (et donc la présence ou non d’un chef d’orchestre).

“Je crois que le rôle du directeur artistique est le même que pour n’importe quel processus d’enregistrement. Il ne diffère pas par exemple avec un disque de musique de chambre ou d’un récital.” (CO2)
“Pour moi il n’y a pas de différence entre le métier que j’exerce avec un orchestre et celui que j’exerce avec une autre formation.” (DA5)

À l’inverse, l’un des directeurs artistiques interrogés dans cette étude affirme que son métier change considérablement en fonction de la formation enregistrée. Selon lui, musique de chambre et musique d’orchestre auraient chacune une direction artistique propre.

“De mon point de vue, je différencie vraiment la musique dirigée avec un chef et la musique de chambre. Je ne vais pas du tout faire la même direction artistique, la formation enregistrée est différente et les conditions sont différentes.” (DA1)

Ainsi, la présence du chef pourrait modifier son rôle et l’intéraction que le directeur artistique aura avec les musiciens. Il doit s’adapter en conséquence.

“En orchestre, il y a quelqu’un entre les musiciens et moi, ce qui n’est pas vrai en musique de chambre, et à partir de là, mon rôle est forcément différent. Ce n’est pas la même chose.” (DA1)

Selon la méthode d’enregistrement

La majorité des directeurs artistiques ont spécifié la nécessité de devoir s’adapter au contexte d’enregistrement.

“Dans le cas d’un enregistrement de concert, l’influence musicale du directeur artistique est beaucoup plus limité que quand on est en séance. Du coup on a moins l’opportunité de travailler ensemble et il faut s’adapter en conséquence.” (DA2)
“Mon rôle va être différent si on est en studio ou en concert. Je vais devoir m’adapter au contexte.” (DA3)

Comparé à une situtation d’enregistrement studio, le rôle du directeur artistique dans le contexte d’un enregistrement de concert semble être moins conséquent.

“En règle générale dans le cas du live, je dirais que le directeur artistique doit encore plus s’adapter et faire la petite souris.” (DA4)

Selon la personnalité du chef

Enfin , le rôle du directeur artistique va varier en fonction de la personne avec qui il travaille. Il doit s’adapter à la personnalité du chef qu’il a en face de lui, à ses envies, ses demandes et ses attentes.

“Je ferais la différence entre les chefs qui savent ce qu’ils veulent, qui ont des envies, et ceux qui cherchent et ne savent pas trop. Avec ces derniers on peut faire tout ce que l’on veut. Avec les autres c’est différent, il faut s’adapter en fonction de ce qu’ils souhaitent.” (DA3)
“Je pense que le directeur artistique doit avoir la capacité de s’adapter suivant les chefs d’orchestre. Il doit sentir ce qu’il veut, à savoir est-ce qu’il veut qu’on gère la séance en nous faisant confiance ou bien au contraire est-ce qu’il veut tout gérer et reléguer un peu le directeur artistique à un rang inférieur ?” (DA4)
“Notre action artistique va dépendre du chef qu’on va avoir en face de nous. Certains chefs vont se reposer à 100% sur le directeur artistique en lui demandant ce qu’il doit faire dès la première prise. A l’inverse il y a des chefs qui ne vont te laisser rien faire. C’est vraiment du cas par cas, il faut s’adapter. Et donc ça va énormément influencer ma façon de travailler.” (DA6)

c) Nature des échanges

L’enregistrement est un terrain propice au dialogue. Précédemment, nous avons étudié les aspects relationnels qui lient le chef d’orchestre et le directeur artistique et nous avons souligné l’importance du dialogue. Étudions maintenant la nature des échanges mis en jeu. Dans cette catégorie sont regroupés tous les éléments relatifs aux discussions que peuvent avoir le directeur artistique et le chef d’orchestre. Nous avons identifié la mise en place d’échanges de trois ordres différents : “ d’ordre musical”, “d’ordre organisationnel” et “d’ordre technique”.

NATURE DES ÉCHANGES
D’ordre musical	paramètres musicaux élémentaires	DA2, CO3, DA4, DA5	DA3,	7
	balance	CO1, DA2, DA3, DA4, CO4, DA5		7
	tempo	DA2, DA3, DA6		6
	intention musicale	CO2, DA2, CO4	DA3,	5
	choix des prises	CO1, CO2, DA3, CO4, DA6	CO3, DA4,	9
D’ordre organisationnel	placement des musiciens	CO1, DA2, CO3, DA3, DA4, DA5		14
D’ordre organisationnel	organisation du temps	DA1, DA3, DA4, CO4, DA6	CO3, DA5,	11
D’ordre technique	son de l’enregistrement	CO1, DA1, CO3, DA3, DA5, DA6	DA2, CO4,	12
D’ordre technique	imperfections de montage	CO1, CO3		3

Fig. 21 : nature des échanges entre le directeur artistique et le chef d’orchestre.

Des échanges d’ordre musical

Les échanges d’ordre musical vont influencer positivement la qualité artistique du produit final. Ils visent à corriger des points techniques précis, à améliorer une sonorité ou un phrasé, à façonner une interprétation.

“Pour arriver à une interprétation intéressante, il y a effectivement des remarques pertinentes qu’on peut faire à la suite d’une prise : qui sont d’une part d’ordre du ménage, mais aussi d’ordre de l’interprétation, des équilibres et de la manière dont l’agogique vit. C’est je trouve le plus intéressant. Un chef est un interprète. Avec lui on peut parler interprétation, parler musique.” (DA3)

Paramètres musicaux élémentaires

Le concept “paramètres élémentaires” regroupe l’ensemble des éléments de base nécessaires à une exécution musicale correcte et cohérente : l’intonation, la mise en place et les nuances générales. Il s’agit du premier palier en termes d’échange artistique. Le directeur artistique note sur sa partition les éventuelles erreurs à retravailler avant d’en faire part au chef d’orchestre. Les participants D A 3 et DA5

soulignent l’importance de ces échanges.

“Il y a un travail que j’appelle faire le ménage et qui consiste à arrêter le chef quand les choses de bases ne vont pas dans l’orchestre.” (DA3)
“Je trouve que les chefs ne sont pas toujours assez attentifs sur ce genre de détails (la justesse, la mise en place) alors qu’en disque c’est quand même assez important. C’est mon rôle de dire et de pointer ce genre de choses que le chef n’a pas forcément noté.” (DA5)

Parfois, c’est le chef d’orchestre qui va spontanément demander au directeur artistique de le guider sur ce point.

“Certains chefs vont me demander s’il y a des choses qui n’ont pas été en terme de justesse, de mise en place, de nuance ou autre chose qu’il n’a pas pu entendre. Basiquement, ça va être “tiens là la flûte est partie en retard et du coup ce n’était pas tout à fait en place” ou bien “là c’était un peu faux”, “les cuivres étaient un peu trop forts”, etc.” (DA4)

L’un des directeurs artistiques interrogés nous a fait part d’un échange avec le chef d’orchestre Nikolaus Harnoncourt au sujet d’un problème de mise en place rythmique. Cette anecdote révèle que les paramètres musicaux élémentaires identifés ici ne sont pas forcément ceux auxquels les chefs d’orchestre accordent la plus grande importance en situation d’enregistrement. De plus, nous n’avons recensé aucun propos relatifs à ce concept dans tout le corpus lié aux chefs d’orchestre.

“Avec Harnoncourt, s’il y avait un problème de mise en place à certains endroits je lui disais mais il pestait un peu toujours. Parfois je dis « attendez ce n’est pas vraiment ensemble là » et Harnoncourt dit « mais ça ne doit pas être ensemble ! On l’a tellement travaillé pour que ça ne soit pas ensemble ! », on était vraiment pas du même avis.” (DA2)

Balance

Les questions de balance font partie intégrante des discussions musicales et ce, aussi bien pendant l’enregistrement que pendant le mixage en phase de post-production.

“Pendant la séance il y a une relation entre la cabine et le chef sur la notion des équilibres : est-ce qu’on veut plus de ci, moins de ça, est-ce que c’est bon ? Certains chefs sont à l’écoute et très demandeurs en terme de balance. Nous on a un réel rôle et il est important.” (DA3)
“Il y avait dans le mix des voix qui ne sonnaient pas assez, que je n’entendais pas assez. J’ai donc appelé le directeur artistique pour qu’on puisse se voir et régler ensemble les questions de balance, les rapports de niveaux entre les bois et les cordes par exemple.” (CO1)

La balance est un critère de discussion parfois subjectif qui varie selon les goûts et les conceptions esthétiques du chef d’orchestre.

“En mix, on peut avoir des points de vue vraiment différents. Je me souviens d’un projet où le chef me faisait mixer quelque chose d’une façon que je détestais vraiment. Et c’est dur de faire quelque chose qu’on aime pas. Il faut faire le travail jusqu’au bout mais ce n’est pas évident puisqu’on est pas convaincu et que ça ne nous plaît pas.” (DA4)

Tempo

Un certain nombre de participants ont également mentionné de possibles discussions autour du tempo.

“Je me souviens d’un chef qui avait vraiment une idée très différente du tempo que moi. On a un eu échange artistique très intense, on a discuté longuement parce que moi j’aurais préféré un tempo plus rapide et lui le voulait plus lent. ” (DA2)
“Je pense que parfois je pourrais être en porte à faux avec certains chefs qui prennent des tempi qui ne me conviennent absolument pas. Mais dans ce cas je ne préfère pas travailler avec eux. Après on peut ne pas être d’accord et trouver des choses incohérentes. Et il y en a beaucoup. On est jamais à l’abri de ça. Mais en même temps, tant que ce n’est pas nous qui jouons, c’est comme ça, on doit l’accepter.” (DA3)

Intention musicale

Le concept “intention musicale” regroupe les propos tenus par les participants relatifs à la mise en place d’un échange autour de la manière dont les interprètes peuvent faire vivre la musique (phrasé, énergie, agogique…).

“Après chaque prise, le chef me demande mon avis, à la fois musicalement et techniquement et je décris ce que j’ai ressenti. Et ce qui est le plus intéressant, c’est d’échanger sur comment la musique se joue, comment elle vit. Il peut s’agir de la façon dont on amène un crescendo, un rallenti, comment faire sentir un brusque contraste de caractère, etc…” (DA5)
“J’aime discuter avec le directeur artistique de tout ce qui fait vivre la musique. Il peut parfois me dire que je peux en faire beaucoup plus, étirer plus les sons, prendre plus de risques à tel ou tel moment, phraser davantage et mettre en lumière la courbe mélodique, etc.” (CO2)

Choix des prises

Pendant la phase de post-production, le directeur artistique et le chef d’orchestre peuvent avoir une discussion autour du choix des prises à utiliser dans le montage final. Celle-ci est importante puisqu’il s’agit de la dernière phase d’échange purement artistique.

“En post-production, quand on a beaucoup de matériel à écouter, il m’arrive parfois d’être un peu perdu et de ne plus savoir quoi choisir. Le directeur artistique peut être la personne qui dit que telle prise est meilleure qu’une autre. Il va donner un argument ou souligner une qualité d’une prise par rapport à une autre.” (CO2)
“On pourrait certes imaginer de prendre une mesure dans telle prise, tel crescendo dans telle prise, etc, c’est infini, mais au bout d’un moment il faut choisir, je dois faire confiance à la pré-sélection du directeur artistique et ensuite c’est un vrai dialogue entre lui et moi.” (CO3)
“En post-production, j’ai des échanges vraiment importants avec le chef. Il m’arrive de discuter et d’argumenter auprès d’un chef sur le choix des prises . Certains chefs font eux-mêmes leurs choix.” (DA3)

Des échanges d’ordre organisationnel

La sous-catégorie “échanges d’ordre organisationnel” regroupe l’ensemble des éléments qui évoquent la mise en place d’un échange autour des aspects pratiques et non musicaux de l’enregistrement.

Placement des musiciens

Le concept “placement des musiciens” se rapporte au placement d’un soliste ou d’un choeur par rapport à l’orchestre et à la disposition des musiciens à l’intérieur même de l’orchestre. Ces notions sont couramment évoquées dans les discussions. Dans la plupart des cas, le chef d’orchestre est légitime pour asseoir son autorité sur ce sujet : il décide du placement de son orchestre.

“En ce qui concerne la disposition de l’orchestre, j’ai toujours eu le loisir de faire comme je voulais et de choisir mon propre placement.” (CO1)
“Si c’est un orchestre classique, on peut se demander : est-ce que l’on veut ou non les cuivres derrière les bois, est-ce qu’on veut séparer les cors et les trompettes/trombones pour laisser les bois s’exprimer librement au milieu ? C’est ce genre de questions qu’on peut soumettre au chef.” (DA4)

Le directeur artistique peut dans certains cas être prescripteur et proposer une modification du placement des musiciens dans le but d’optimiser la prise de son et d’améliorer le rendu sonore final, ou bien de permettre au chef de bénéficier d’un confort d’écoute plus adapté.

“Je vais régler avec le chef plusieurs choses à savoir comment l’orchestre est disposé, où mettre les solistes s’il y en a… C’est aussi mon rôle de conseiller le chef sur ces points-là. Si on est en situation de studio, je vais préférer mettre le soliste non pas à la gauche du chef mais plutôt face à lui, un peu surélevé. C’est bien sûr dans l’intérêt de la prise de son.” (DA5)
“J’ai déjà fait plusieurs enregistrements au cours desquels on a choisi de mettre le choeur et les chanteurs derrière le chef, tout simplement pour qu’il soit proche d’eux, qu’il les entende et qu’il soit bien conscient de la prononciation. C’est une chose que j’ai proposée et à laquelle on a pu aboutir suite à un dialogue entre le chef, le choeur et moi.” (DA2)

Organisation du temps

Les questions relatives au planning de l’enregistrement et à l’organisation des séances sont également évoquées. Ici ressort l’aspect management du rôle du directeur artistique qui doit plannifier le déroulement de l’enregistrement.

“Préalablement, on se pose surtout des questions de planning. Quand on fait une pièce de Berlioz par exemple, les trompettes ne viennent pas tous les jours et il faut savoir quand est-ce qu’on les fait venir. Et puis il faut décider de comment est-ce qu’on enregistre et dans quel ordre.” (DA6)
“Le directeur artistique a aussi un côté pratique, organisationnel. Il peut aussi gérer le planning d’enregistrement avec le chef, l’orchestre et la maison de disques, pour prévoir ensemble qu’il faudra tant de temps pour enregistrer ci, tant de temps pour enregistrer ça… Il va y avoir une discussion autour de ça. Par exemple le chef peut considérer que tel mouvement est trop difficile pour une fin de journée donc que ce serait mieux de l’enregistrer un matin, etc.” (DA4)

L’organisation de la séance concerne principalement la manière dont l’œuvre sera enregistrée, à savoir quel découpage adopter et dans quel ordre procéder.

“En ce qui concerne le découpage de l’œuvre pendant la séance, on en parle ensemble. Mais en général ça va très vite, c’est une demi-seconde. Je dis au directeur artistique “bon maintenant on va de telle mesure à telle mesure”. (CO3)
“On travaille ensemble pour savoir par exemple quel temps on va se donner pour refaire tel ou tel passage, comment gérer la fin de séance, etc. Donc il y a parfois une discussion sur ce sujet, mais c’est surtout quand il y a une petite tension, une petite contrainte de temps.” (CO4)

Il nous paraît pertinent de souligner que ce point semble être un sujet de désaccord. En effet, certains directeurs artistiques et chefs d’orchestre nous ont fait part des divergences qu’ils pouvaient avoir à ce sujet. L’organisation de la séance est parfois un sujet délicat sur lequel le directeur artistique et le chef d’orchestre doivent trouver un accord commun.

“Les principaux problèmes que j’ai pu rencontrer ont été des problèmes de gestion de la séance d’enregistrement. Je me souviens d’un ou deux chefs qui ne savaient vraiment pas où il allaient. C’était plutôt embêtant parce que moi je savais quoi faire, comment et où aller.” (CO4)
“On peut avoir des divergences sur la façon dont on va procéder et dans quel ordre enregistrer la pièce. Certains chefs vont vouloir faire dans tel sens, alors que pour moi ce n’est pas cohérent.” (DA1)

Des échanges d’ordre technique

Le troisième et dernier type d’échanges identifié dans cette étude sont les échanges “d’ordre technique”, c’est-à-dire l’ensemble des discussions liées à des considérations purement technologiques gérées par le directeur artistique et sur lesquelles le chef d’orchestre n’a pas directement la main.

Son de l’enregistrement

Certains chefs d’orchestre affirment avoir un échange avec le directeur artistique autour de la prise de son, en amont ou pendant l’enregistrement.

“Je demande de plus en plus au directeur artistique de placer un couple de micros derrière moi, et de prendre principalement le son du couple, avec possibilité d’utiliser les micros d’appoints plus tard au mix. Je veux que le son, la bonne balance, ne vienne que de là où moi je suis, comme ça moi ça me permet de vraiment régler la balance.” (CO1)
“Je peux faire des commentaires sur le son, sur la prise de son. Il m’est arrivé de devoir parler de l’esthétique sonore globale, du placement des micros, de la prise en compte de la salle, etc.” (CO4)

Cependant, il est intéressant de constater que les directeurs artistiques ne partagent pas cet avis et ne considèrent pas la prise de son comme un sujet abordé au cours des discussions.

“En ce qui concerne l’esthétique de prise de son de l’enregistrement ce n’est pas quelque chose qu’on va discuter.” (DA2)
“Je n’ai jamais d’échange avec le chef sur la prise de son en amont, non, c’est ma cuisine.” (DA1)

Imperfections de montage

Pendant la phase de post-production, certains échanges gravitent autour d’éventuelles imperfections liées au montage et au mixage.

“En post-production, je fais part au directeur artistique des points de montage qu’on entend, des bruits parasites qui viennent gêner, etc.” (CO3)
“Parfois il nous arrive de laisser passer des points de montage mal gérés, ou un instrument qui ne ressort pas dans le mix. L’écoute du chef est aussi là pour nous guider et valider ou non notre première version.” (DA4)

d) Organisation du travail

Les participants à notre étude ont souvent mentionné l’aspect organisationnel de l’enregistrement. Cette catégorie rassemble donc l’ensemble des éléments relatifs au déroulé pratique de l’enregistrement. Nous avons identifié quatre sous-catégories : “ En amont”, “Post-production”, “Contraintes temporelles” et “Méthodes d’enregistrement”. L’organisation du travail est révélatrice du contexte dans lequel s’inscrit la collaboration entre le directeur artistique et le chef d’orchestre.

ORGANISATION DU TRAVAIL
En amont	prise de contact				DA1, CO2, DA2, CO3, CO4, DA5		6
	préparation artistique	personnelle	du	directeur	DA1, CO2, DA2		3
Post-production	investissement du chef variable				CO2, DA2, DA5	DA4,	5
	déroulé du montage				CO1, DA1, CO4, DA4	DA2,	6
Contraintes temporelles	manque de temps				DA1, DA2, CO3, DA3, DA6	CO2, DA5,	15
	contrainte de planning du chef				DA1, DA2, DA5		6
Méthodes d’enregistrement	live + patchs				DA2, DA, DA5, DA6		4
	studio				DA4, DA5		2
	rehearse and record				CO1, DA1, CO3		3

Fig. 22 : aspects organisationnels de l’enregistrement

En amont

Prise de contact

Pour les chefs d’orchestre, une préparation du projet avec le directeur artistique en amont de l’enregistrement n’est pas forcément nécessaire.

“La prise de contact en amont n’est pas toujours une condition indispensable au bon déroulement de l’enregistrement. C’est préférable, mais ça dépend vraiment des contextes et des personnes. C’est toujours mieux quand il y a un contact, un échange, mais ce n’est pas toujours le cas.” (CO4)

Pour certains directeurs artistiques, une prise de contact – même très succincte – permet cependant de bien débuter la relation professionnelle avec le chef d’orchestre.

“Il y a un échange mais qui très formel. Avec tous les chefs que j’enregistre, je mets un point d’honneur à les appeler avant et ce, pour une raison simple c’est de créer un minimum de lien entre nous, de façon à ce que le jour de l’enregistrement on se dise «Ah mais oui on s’est eu au téléphone la semaine dernière ! ».” (DA5)

Préparation personnelle du directeur artistique

Trois participants ont montré qu’ils accordaient une certaine importance à la préparation personnelle du directeur artistique.

“Je considère que le travail à fournir pour préparer un enregistrement d’orchestre est supérieur à un enregistrement de musique de chambre. Il faut arriver en sachant précisément ce qu’on va enregistrer. Et comme on a pas beaucoup de temps pour enregistrer, je me dois d’arriver en étant prêt. Si le chef a besoin de quelque chose et que je n’ai rien préparé, on perd en temps et en crédibilité. ” (DA1)

Post-production

Investissement du chef variable

L’implication du chef d’orchestre dans la phase de post-production semble être variable selon les profils.

“Je participe toujours au montage des disques et j’aime beaucoup ça. Il y a des artistes qui ne veulent pas être partie prenante du montage et n’entendent qu’un résultat. Moi je préfère travailler avec le directeur artistique pour voir jusqu’où on peut aller.” (CO2)

“Certains chefs, de grands chefs parfois, s’en foutent un peu de l’enregistrement et considèrent ça comme quelque chose d’annexe. A la fin de l’enregistrement on ne les voit plus. Mais il y a aussi de vrais passionnés comme Harnoncourt, René Jacobs ou encore Kent Nagano qui sont des personnes qui souhaitent obtenir un résultat au-delà du simple spectacle, ou du moins différent d’un spectacle ou d’un concert. Donc ce sont des situations auxquelles on doit s’adapter.” (DA2)

Déroulé du montage

La phase de montage se fait le plus souvent en deux temps. Tout d’abord, le directeur artistique envoie au chef d’orchestre une première proposition de montage. Ce dernier fait ensuite une liste de corrections et la transmet au directeur artistique en vue d’une deuxième phase de montage.

“Idéalement, j’aime quand le directeur artistique fait toute une première proposition de montage et me l’envoie comme une vraie première proposition artistique. Moi ensuite, je vais écouter et faire mes commentaires. Puis, il y a un deuxième envoi après commentaires et une deuxième écoute de ma part. C’est donc une seconde version que le directeur artistique propose, en tenant compte de mes commentaires, ou pas, selon les choix qui sont fait par lui et par moi.” (CO4)

Contraintes temporelles

Manque de temps

La notion de contrainte temporelle a souvent émergé au fil des entretiens et semble être spécifique à l’enregistrement de musique d’orchestre. La majorité des personnes interrogées déplorent un manque de temps et sont confrontées à une organisation du travail différente. L’un des participants observe ce changement et souligne l’impact que de telles contraintes peuvent avoir sur le métier de directeur artistique.

“Ce qui a changé entre le moment où j’ai commencé à travailler dans ce milieu et aujourd’hui, c’est évidemment la contrainte de temps. Avant on pouvait dire à l’orchestre de répéter pendant une heure pendant qu’on écoutait nos micros, qu’on les replaçait… Maintenant ce n’est plus le cas, il y a une grande contrainte de temps qui va affecter la prise de son, la balance, et bien sûr le processus de direction artistique. On doit s’organiser d’une autre manière.” (DA1)

Un autre directeur artistique affirme que cet aspect est propre à l’enregistrement d’orchestre, par opposition à un disque de musique de chambre :

“Un quatuor à cordes, un pianiste ou un chanteur qui viennent enregistrer un disque vont travailler jusqu’à ce qu’ils aient donné le meilleur d’eux-mêmes. Dans le cas d’un orchestre, le temps est un facteur très important. Les musiciens d’orchestre sont en règle générale syndicalisés et veulent qu’on respecte les horaires. Par conséquent, les choses sont différentes.” (DA2)

La principale cause du manque de temps est financière. Un orchestre coûte aujourd’hui très cher et chaque minute d’enregistrement est précieuse.

“Aujourd’hui enregistrer un orchestre est très onéreux. Les musiciens viennent, doivent dormir à l’hôtel et sont payés individuellement par séance. Ce sont des choses qui coûtent très cher pour le marché tel qu’il se présente aujourd’hui. ” (DA2)

La majorité des participants déplorent donc le peu de temps d’enregistrement auquel ils sont confrontés.

“Avec un orchestre, il y a un seul chef et c’est la montre : on a tant d’heures pour enregistrer, ni plus ni moins.” (DA6)
“Il va falloir faire le job dans un temps très limité parce qu’il y a concrètement très peu de temps pour enregistrer. Il faut aussi respecter certaines contraintes comme donner la pause des musiciens au bout d’une heure et quart par exemple, et ça compte énormément dans notre métier.” (DA5)

Le manque de temps va également impacter la réalisation de la balance qui devra se faire dans un temps parfois très limité.

“Pour une prise de son d’orchestre, dans le cadre d’un disque, on est aujourd’hui sur une balance de 20 minutes en gros. C’est très peu. On a intérêt à avoir bien préparé les choses et à être pertinent vis-à-vis de ce à quoi on veut tendre. ” (DA3)

Néanmoins, l’un des chefs d’orchestre interrogés considère cette pression liée au temps comme bénéfique pour l’enregistrement car stimulante d’un point de vue artistique.

“Moi j’essaie d’aller très vite, de gérer efficacement la montre. Le temps musical en orchestre est très comprimé. Mais quand on y réfléchit bien, c’est très créatif d’aller vite et je trouve très stimulant le fait d’être dans une intensité permanente.” (CO3)

Contrainte de planning du chef d’orchestre

Les contraintes temporelles sont également présentes en amont de l’enregistrement et pendant la phase de post-production. Le chef d’orchestre est souvent un artiste très demandé au planning chargé. Le directeur artistique doit en tenir compte pour l’organisation du projet.

“Par rapport à tous les musiciens, le chef d’orchestre est celui qui répond le moins rapidement parce qu’il a en général un emploi du temps monstrueux. On a très souvent du mal à les joindre et il faut parfois l’anticiper.” (DA5)

Méthodes d’enregistrement

Enfin, nous avons pu identifier les différentes méthodes d’enregistrement mises en place pour la réalisation d’un disque de musique d’orchestre.

Live + patchs

La méthode “live + patchs” (concert + séances de corrections) consiste à enregistrer un ou plusieurs concerts donnés par le chef et l’orchestre, puis à corriger les éventuelles faiblesses lors d’une séance d’enregistrement supplémentaire (la séance de patchs). Un dialogue entre le chef et le directeur artistique est mis en place entre le concert et la séance de patchs dans le but de réfléchir à quelle stratégie adopter. Les directeurs artistiques interrogés insistent sur le fait que cette méthode les pousse à être directifs et à se concentrer sur l’essentiel.

“Une fois le concert enregistré, j’arrive avec la partition et une liste de choses qu’il faudrait améliorer. Je fais parler le chef d’orchestre pour lui demander quelles sont ses impressions et ce que lui souhaite refaire. Puis il me demande mon avis et on décide quoi réenregistrer. Il faut être concret. Ensuite, on fait une séance de patchs et c’est vraiment le directeur artistique qui va prendre les rênes, tout simplement parce qu’il faut être très efficace à cause du temps imparti. Le directeur artistique va donc être très directif.” (DA4)
“Pour une séance de patchs après un concert, on doit aller à l’essentiel. En général on a entre une heure et un service, ce qui est peu. Entre le concert et ma séance de patchs, je ré-écoute tout le concert, je regarde ce qui n’a pas marché et j’élabore un plan d’attaque de façon à ce qu’on aille vraiment à l’essentiel.” (DA5)

Bien que l’influence du directeur artistique soit ici limitée, la méthode “live + patchs” reste aujourd’hui la plus utilisée car elle est aussi la plus rentable.

“En “live + patchs” j’ai beaucoup moins la main sur l’aspect artistique parce qu’au concert je ne fais pas grand chose à part prendre des notes. Je n’aurai la main que pendant la séance de patchs, ce qui peut être un peu frustrant parce qu’on ne peut pas toujours approfondir les choses. Le “live + patchs” n’est pas la meilleure solution mais c’est celle qui est la plus utilisée car ça coûte moins cher. Mais des fois ça apporte vraiment une plus-value car on a l’énergie du concert, chose difficilement reproductible en studio.” (DA5)

Studio

Certains participants affirment que l’enregistrement studio est quant à lui plus propice à des échanges artistiques poussés. Il consiste à effectuer l’intégralité de l’enregistrement sur plusieurs jours, dans un seul et même lieu (studio d’enregistrement, salle de concert…). L’organisation du travail est donc sensiblement différente de celle de la méthode “live + patchs”.

“Le fonctionnement de l’enregistrement en studio pur est différent : on prend le temps de faire une première prise, puis une deuxième prise, le chef peut venir écouter, on en parle, on se dit « ça c’est génial il faut garder » , « ça musicalement est-ce qu’on pourrait pas un peu changer », etc. Il y a vraiment un échange artistique beaucoup plus intéressant. On peut façonner davantage la musique puisqu’on part de rien, il n’y a pas déjà une base de concert sur laquelle on va rajouter des corrections.” (DA5)

L’influence du directeur artistique en situation de studio est variable selon les chefs d’orchestre. Il peut être actif et directif ou au contraire s’effacer derrière la personnalité du chef.

“A l’issue des prises, certains chefs d’orchestre voudront parler immédiatement à l’orchestre et seront plutôt directif et autonome. Dans ce cas-là le directeur artistique n’est en quelque sorte qu’un scripte qui note sur la partition les prises, ce qui est bien, pas bien, et éventuellement il pourra intervenir à la fin s’il y a des choses qui manquent. Dans d’autres cas, ce sera vraiment au directeur artistique de diriger la séance et de guider le chef à chaque prise. C’est variable.” (DA4)

Rehearse and record

Enfin, trois participants ont mentionné la méthode du “rehearse and record” qui permet de construire progressivement l’œuvre enregistrée en alternant des phases de répétitions et d’enregistrement.

“On laisse l’orchestre répéter quelques mesures, puis on les enregistre, etc. C’est la technique du “répété-enregistré”, c’est très pratique surtout pour le répertoire contemporain.” (DA1)
“J’aime bien prendre une section, assez longue, puis on la travaille et on l’enregistre au fur et à mesure jusqu’à ce qu’on ait tout.” (CO3)

V. Discussions

1. Évaluation de la démarche méthodologique

a) Deux approches analytiques complémentaires

La démarche méthodologique consistant à combiner deux types d’analyse s’avère pertinente dans le sens où l’analyse par théorisation ancrée vient confimer et préciser de manière significative les résultats obtenus par l’analyse de contenu. L’analyse de contenu est un bon point d’entrée dans le traitement des données car c’est une méthode qui a l’avantage de donner rapidement des éléments de compréhension. Ainsi, nous avons pu aisément identifier trois grandes problématiques liées à la relation professionnelle du directeur artistique et du chef d’orchestre, à savoir l’aspect collaboratif, la communication et la gestion du temps. L’analyse par théorisation ancrée est quant à elle une approche plus dynamique dans la mesure où elle incite le chercheur à développer et à proposer une interprétation du phénomène étudié. C’est en ce sens que nous considérons ces deux approches comme complémentaires, tant sur la forme de la méthode que sur le fond des résultats obtenus.

Le tableau ci-dessous met en parallèle les catégories référencées grâce à l’une et l’autre des deux méthodes d’analyse.

Analyse de contenu	Actions liées au processus d’enregistrement
	Collaboration
	Communication
	Gestion du temps
Analyse par théorisation ancrée	Aspects relationnels
	Expertise du directeur artistique
	Nature des échanges
	Organisation du travail

Fig. 23 : mise en regard des deux approches analytiques.

La catégorie Actions liées au processus d’enregistrement identifiée par l’analyse de contenu reste très générale et donc peu précise. Elle ne permet pas de bien cerner tous les enjeux organisationnels induits par la collaboration entre le directeur artistique et le chef d’orchestre. L’analyse par théorisation ancrée nous a permis de développer plus largement cet aspect en déterminant la manière dont se déroule un enregistrement et la façon dont le directeur artistique et le chef d’orchestre interagissent ensemble.

La notion de Collaboration de l’analyse de contenu a pu être précisée dans la sous-catégorie Dimension collaborative, elle-même issue d’une catégorie plus vaste que nous avons nommée Aspects relationnels. L’importance de la Communication se traduit par la mise en place de nombreux échanges entre le directeur artistique et le chef d’orchestre. Grâce à la méthode d’analyse par théorisation ancrée, nous avons pu identifier la nature de ces discussions.

Notons que c’est également cette seconde méthode qui nous a permis de mettre en lumière l’importance du rôle et les compétences du directeur artistique, deux éléments que nous n’avions pas explicitement identifiés par l’analyse de contenu.

Les deux approches analytiques choisies ne sont pas redondantes mais bel et bien complémentaires. Si l’analyse de contenu aide à identifier certaines problématiques de manière globale voire distanciée, l’analyse par théorisation ancrée permet quand à elle d’étudier plus en profondeur le phénomène observé.

b) Limitations et perspectives

Comme dans tout processus scientifique, il est nécessaire que le chercheur prenne un certain recul sur son travail. Il doit faire preuve de réflexivité et identifier les limitations de sa démarche. Nous souhaitons avant tout rappeler que cette étude s’inscrit dans le cadre d’un projet de recherche étudiant. Celle-ci aurait davantage pu être approfondie si nous avions disposé de temps et de moyens supplémentaires.

Panel de participants

Malgré nos efforts, le nombre peu élevé de participants et les profils de chacun ne permettent pas d’embrasser l’ensemble du milieu étudié, à savoir celui de l’enregistrement de musique d’orchestre. Il aurait donc été préférable d’interroger un nombre plus conséquent de professionnels pour pouvoir aller plus loin dans l’analyse des données et dans la validation des catégories identifiées.

Cette étude se limite à des experts du monde francophone et il serait pertinent de la mener dans des pays germaniques et anglo-saxons afin de confirmer ou d’infirmer l’universalité de nos résultats.

Nous aurions également pu envisager d’étendre et de préciser notre travail en interrogeant des acteurs extérieurs à la relation qu’entretiennent le directeur artistique et le chef d’orchestre comme par exemple les musiciens d’orchestre, les ingénieurs du son ou les producteurs. Nous invitons les chercheurs à approfondir ce sujet sous cet angle et à étudier les rapports triangulaires existant entre le directeur artistique, le chef d’orchestre et le compositeur ou bien entre le directeur artistique, le chef d’orchestre et le soliste.

Rigueur analytique

Bien que l’analyse par théorisation ancrée fasse appel à une méthodologie rigoureuse, elle reste malgré tout en partie subjective. Même s’il est fortement recommandé au chercheur de mettre son savoir et ses références de côté, celui-ci va interpréter les données collectées à travers le filtre de sa sensibilité théorique et produira sa propre catégorisation des concepts. Selon Guillemette (2006), il est donc impératif d’expliciter “la relation entre les intuitions du chercheur (faites de savoirs antérieurs et de références à des théories existantes) et les suggestions qui proviennent des données de terrain”.

Dans le cas de cette étude, notre double compétence en matière de direction artistique et de direction d’orchestre aurait donc pu compromettre toute tentative d’objectivité totale. Cependant, par souci d’honnêteté intellectuelle et de rigueur scientifique, nous nous sommes efforcés de mettre de côté nos présupposés et de construire le plus objectivement possible notre analyse.

Difficultés d’analyse

Il nous paraît important de mentionner les quelques difficultés auxquelles nous avons dû faire face pendant la phase d’analyse par théorisation ancrée. Tout d’abord, l’élaboration des catégories et des sous-catégories n’a pas été une tâche très aisée. Notre grille d’analyse a régulièrement subi un certain nombre de modifications, ce qui à plusieurs reprises nous a paru déroutant.

D’autre part, nous avons parfois eu du mal à classer certains propos pouvant appartenir à plusieurs catégories et nous avons été contraint de faire des choix. A titre d’exemple, la citation “En post-production, quand on a beaucoup de matériel à écouter, il m’arrive parfois d’être un peu perdu et de ne plus savoir quoi choisir. Le directeur artistique peut être la personne qui dit que telle prise est meilleure qu’une autre. Il va donner un argument ou souligner une qualité d’une prise par rapport à une autre .” peut se rapporter à deux de nos quatre catégories. Le chef d’orchestre évoque ici clairement la mise en place d’un échange autour de la sélection des prises, ce qui relève de la Nature des échanges et de sa sous-catégorie Échanges d’ordre artistique. Cependant si l’on considère que le participant met ici en lumière l’une des compétences du directeur artistique, à savoir sa disposition à conseiller l’interprète, alors cette citation relève de la catégorie Expertise du directeur artistique. De la même manière, la citation “A plusieurs reprises j’ai eu l’impression d’avoir le rôle d’assistant du chef, parce que finalement c’est un boulot assez similaire.” pourrait aussi bien être classée dans la sous-catégorie Rapports hiérarchiques que dans Dimension collaborative.

Outre les difficultés de catégorisation auxquelles nous avons dû faire face, le processus de fragmentation du discours s’est parfois révélé délicat et abstrait.

Enfin, la principale limite de cette étude réside peut-être en son ambition d’aboutir à une explication d’un phénomène en grande partie régi par des concepts appartenant aux domaines de la sociologie et la psychologie. Ainsi, il serait pertinent de

mener un travail similaire à celui-ci en prenant davantage en compte la dimension sociologique du phénomène et en menant une étude approfondie des profils psychologiques des divers participants.

Observations sur le terrain

La recherche scientifique se contruit aussi de manière empirique : effectuer une série d’observations sur le terrain aurait pu alimenter notre réflexion. Confronter les données issues de nos entretiens à la réalité du système nous aurait probablement permis de valider, d’infirmer ou de nuancer certains points d’analyse. Cependant, les résultats issus d’observations sur le terrain auraient exigé la mise en place d’une méthodologie plus complexe et d’un travail d’analyse trop conséquent pour un mémoire de cette envergure.

2. L’enregistrement comme une “création artistique commune et partagée”

Dans son étude, Ravet (2015) identifie les deux versants de la relation entre un chef d’orchestre et un ensemble de musiciens. Le premier repose selon elle sur des rapports de pouvoir sous-jacents : de par la nature de sa fonction, le chef d’orchestre est formellement en position de décider. La relation est dans ce cas dissymétrique. Le second aspect semble plus modéré car selon Ravet, l’interprétation de l’œuvre découle de la participation de l’ensemble des protagonistes et de l’organisation d’un travail commun : l’action créatrice est de nature profondément collective.

La collaboration professionnelle entre le directeur artistique et le chef d’orchestre est complexe. Elle se construit autour d’enjeux relationnels et repose sur un ensemble d’interactions et de négociations. Les résultats obtenus à la suite de notre analyse semblent converger vers le modèle proposé par Ravet. En effet, les notions de hiérarchie et d’autorité sont bel et bien présentes dans les rapports qu’entretiennent le directeur artistique et le chef d’orchestre. Le chef est un interprète à part entière. Par conséquent, son autorité est aussi légitime devant un orchestre que devant un directeur artistique. C’est à lui, l’auteur de l’interprétation musicale, que reviennent les décisions artistiques. Il aura pour ainsi dire toujours le dernier mot. Le second aspect identifié par Ravet trouve son pendant dans le concept “Dimension collaborative” de notre étude. Comme nous l’avons vu, l’enregistrement résulte de la participation active du chef d’orchestre et des musiciens mais aussi du directeur artistique. C’est ce partage de l’autorité créatrice qui fait de l’enregistrement un espace de création artistique commun au sein duquel sont investis le chef d’orchestre et le directeur artistique.

3. Mise en perspective avec le contexte économique actuel

Au cours de cette étude, nous avons pu identifier une préoccupation récurrente dans les propos des participants : le temps. La majorité d’entre eux affirme que la gestion du temps est, dans le contexte spécifique de l’enregistrement de musique d’orchestre, une contrainte importante. Le temps de préparation, le temps de dialogue, le temps de balance, le temps d’enregistrement et le temps de post-production sont comptés et dépendent de facteurs extérieurs d’ordre pratique et économique. Nous mentionnerons principalement les emplois du temps chargés liés aux carrières des chefs, le coût financier d’un orchestre et la restriction des budgets liée au contexte économique actuel.

Burgess (2008) affirme qu’aujourd’hui, les directeurs artistiques doivent non seulement s’adapter aux nouvelles formes de consommation et de diffusion de la musique (streaming, musique filmée, etc.), mais également faire face à des contraintes inhérentes à une industrie du disque en déclin, de moins en moins rentable et attractive. La contrainte budgétaire imposée par les labels discographiques possède donc un impact non négligeable sur les conditions de réalisation des enregistrements. Ces contraintes sont évoquées par les participants à notre étude et se traduisent particulièrement dans la catégorie Organisation du travail → Contraintes temporelles. La restriction du temps aloué à l’enregistrement amène donc à une modification des pratiques. L’enregistrement de type live + patchs est aujourd’hui devenu la norme car c’est une solution moins coûteuse et moins chronophage que le studio. Aujourd’hui, les enregistrements d’orchestre intégralement réalisés en studio sont devenus beaucoup plus rares.

La contrainte temporelle semble cependant moins impacter les enregistrements de musique de chambre ou de récitals puisque les musiciens ne sont pas soumis aux mêmes règles syndicales que les musiciens d’orchestre. Comme l’a précisé dans un entretien l’un des directeurs artistiques, un pianiste ou un quatuor à cordes jouera jusqu’à avoir donné le meilleur de lui-même. Mais qu’en est-il de l’action du directeur artistique ? Est-elle réellement impactée par ces contraintes de temps ? Les résultats tendent à montrer que la fonction première du directeur artistique, à savoir la gestion du projet dans sa globalité, ne change pas. Cependant, il peut être amené à adapter ses méthodes en fonction des conditions de travail et du temps alloué pour l’enregistrement.

Bien qu’aucun participant à l’étude n’ait explicitement formulé cette idée, l’influence musicale du directeur artistique pourrait quant à elle être impactée par ces nouvelles contraintes de travail. Dans le cadre d’un enregistrement live+patchs (environ 80% de la production de disques d’orchestre aujourd’hui), l’influence du directeur artistique sur le résultat final est moins important. Pendant le concert, son action va se limiter à répertorier les points positifs et négatifs de la performance, en vue d’une prochaine séance de patchs. Ces séances possèdent un intérêt artistique moins développé que l’enregistrement studio intégral, dans le sens où l’action du directeur artistique est limitée par la contrainte de devoir corriger toutes les erreurs survenues au concert. Il est frappant de comparer nos méthodes d’enregistrement actuelles, contraintes par le temps et les financements, avec celles pratiquées dans années 1960, lorsqu’il était encore possible de consacrer quinze services d’orchestre à l’enregistrement d’un opéra de Wagner (Burton, 1992). La direction artistique est donc un métier qui évolue continuellement avec son temps.

4. Apports personnels

Pour conclure, nous tenons à souligner que cette étude nous a été bénéfique sur plusieurs aspects. Tout d’abord, ce fut pour nous une magnifique occasion de rencontrer des chefs d’orchestre reconnus de stature internationale, et d’aborder avec eux les problématiques relatives à l’enregistrement. La parole des interprètes est très précieuse et permet de prendre un certain recul que nous n’avons pas toujours en cabine. Échanger avec plusieurs directeurs artistiques sur leur activité nous aura permis d’élargir et de réévaluer notre vision de ce métier. Ces rencontres ont été enrichissantes car elles nous auront probablement aidé à améliorer notre pratique de la direction artistique dans le contexte spécifique des enregistrements d’orchestre.

Aborder un travail tel que celui-ci en faisant appel à toute la rigueur de l’approche scientifique a été bénéfique. Ce fut pour nous une excellente opportunité de nous confronter aux différents processus de la recherche scientifique : formulation d’une problématique, recherche bibliographique, mise en place d’une méthodologie rigoureuse, rédaction d’un travail de grande ampleur, etc.

Enfin, les échanges que nous avons pu avoir avec les participants nous ont permis de mettre des mots sur les enjeux de l’enregistrement et de prendre conscience de l’importance des dimensions sociale et psychologique. L’enregistrement ne se limite pas à la simple captation sonore d’une œuvre musicale. C’est une véritable aventure humaine au sein de laquelle sont impliquées un grand nombre d’individualités qui agissent dans un but commun : celui de partager et de faire vivre la musique.

Conclusion

A notre connaissance, cette recherche est la première à aborder spécifiquement la collaboration professionnelle entre directeurs artistiques et chefs d’orchestre puisqu’il n’existe presque aucune littérature à ce sujet mis à part des témoignages autobiographiques. Notre travail a ainsi pu permettre d’élargir et de préciser le champ de recherche autour du domaine de la direction artistique en étudiant un cas précis dont nous avons souligné les spécificités.

Par l’intermédiaire d’une série d’entretiens avec des experts du monde de l’enregistrement, nous avons collecté un ensemble de données discursives. Celles-ci ont par la suite été confrontées à un double processus d’analyse qui au final s’est avéré pertinent. En effet, cette démarche nous a permis de mettre en lumière les divers aspects de la collaboration professionnelle entre le directeur artistique et le chef d’orchestre, ainsi que les différentes problématiques mises en jeu sur les plans humain, musical et pratique.

Comme dans toute collaboration professionnelle, l’aspect relationnel est un point essentiel. Son étude est révélatrice de la manière dont le directeur artistique et le chef d’orchestre collaborent. On sait qu’une grande partie du projet d’enregistrement est portée par le directeur artistique. L’analyse a permis de mieux cerner son action et ses compétences dans le contexte particulier imposé par l’étude. Nous avons également pu identifier la nature des discussions mises en place : elles peuvent être d’ordre musical, technique ou bien organisationnel. Enfin, l’analyse a montré que les conditions d’enregistrement ne sont jamais les mêmes et varient d’un projet à l’autre. Le directeur artistique et le chef d’orchestre sont donc amenés à adapter leur conception de l’organisation du travail.

L’enregistrement s’inscrit dans une démarche collaborative de création artistique commune et partagée entre le chef d’orchestre et le directeur artistique. Cependant, il est aujourd’hui légitime de s’interroger sur l’influence de ce dernier, à l’heure où le nombre de séances consacrées aux enregistrements est de plus en plus réduit.

Nous invitons les directeurs artistiques et les chefs d’orchestre à mener une réflexion personnelle sur leur fonction au sein de l’enregistrement, ainsi que sur les rapports professionnels qu’ils entretiennent. Nous invitons également les chercheurs intéressés à poursuivre cette étude sous un autre angle d’approche (contexte culturel anglo-saxon ou germanique, approche basée sur la psychologie des individus, point de vue des musiciens d’orchestre, des producteurs et des ingénieurs du son).

Références Bibliographiques

ADORNO, T., The Curves of the Needle, The Form of the Phonograph Record, and Opera and the Long-playing Record. Dans October, vol.55, 1990.

BADAL, J., Recording the Classics : Maestros, Music and Technology. Kent, Ohio : The Kent State University Press, 1996.

BARDIN, L., L’analyse de contenu (5e éd.). Paris: Presses Universitaires de France, 1989.

BÉNET, M., La collaboration entre une équipe son et une équipe image au sein d’une production de musique classique filmée, quelle question des contraintes ? Mémoire de Master 2, Formation Supérieure aux Métiers du Son, Conservatoire National Supérieur de Musique et de Danse de Paris, 2018.

BENJAMIN, W., The Work of Art in the Age of its Technological Reproductibility and Other Writings on Media (édité par JENNINGS, M.W. ; DOHERTY, B. ; LEVIN, T.Y.) Cambridge : Harvard University Press, 2008.

BLANCHET, A., L’entretien dans les sciences sociales : l’écoute, la parole et le sens. Paris : Dunod, 1985.

BLANCHET, A. & GOTMAN, A., L’enquête et ses méthodes : l’entretien (2e éd.) Paris: Armand Colin, 2007.

BORWICK, J., The Tonmeister Concept. Présenté à la 46e Audio Engineer Society Convention à New York, États-Unis, septembre 1973.

BURGESS, R.J., Producer Compensation: Challenges and Options in the New Music Business. Dans Journal on the Art of Record Production, vol.3, 2008.

BURTON, H., The Golden Ring. Antony : Polygram video (éd.) ; Paris : Polygram music video (distrib.), 1992.

CHANAN, M., Repeated takes: A short history of recording and its effects on music . London: Verso, 1995.

COTELLE, A., La direction artistique : quand les relations humaines croisent la musique, Mémoire de Master 2, Formation Supérieure aux Métiers du Son, Conservatoire National Supérieur de Musique et de Danse de Paris, 2001.

CULSHAW, J., The Record Producer Strikes Back. Dans High Fidelity, vol. 18(10), pp.68-71, 1968.

FENNETEAU, H., : Enquête : entretien et questionnaire (2e éd.), Collection Les Topos. Paris : Dunod, 2007.

FRITH, S. & ZAGORSKI-THOMAS, S., The art of record production : an introductory reader for a new academic field. Burlington: Ashgate, 2012.

GARITY, W.E. & HAWKINS, J.,N.A., Fantasound dans Journal of the Society of Motion Picture Engineers, vol.37(8), pp.127-146, 1941.

GHIGLIONE, R., & MATALON, B., Les enquêtes sociologiques : théories et pratique (6e éd.). Paris : Armand Colin, 1998.

GLASER, B. & STRAUSS, A., La découverte de la théorie ancrée : stratégies pour la recherche qualitative (2e éd.). Malakoff : Armand Colin, 2017.

GUILLEMETTE, F., L’approche de la Grounded Theory : pour innover ? Dans Recherches qualitatives, vol.26(1), pp.32-50, 2006.

HAAS, M., Studio Conducting dans The Cambridge Companion to Conducting, pp.28-39. Cambridge : Cambridge University Press, 2003.

HENNION, A., An intermediary between production and consumption – The producer of popular music dans Science Technology and Human Values, vol.14(4), pp.400-424, 1989.

KING, R., Recording Orchestra and Other Classical Music Ensembles. New York : Routledge, 2016.

LEHMANN, B., L’orchestre dans tous ses états : ethnographie des formations symphoniques. Paris: La Découverte, 2002.

LEVIN, T., For the Record : Adorno on Music in the Age of Its Technological Reproductibility. Dans October, vol.55, pp.23-47, 1990.

MOORE, J.N., Sound Revolutions : A Biography of Fred Gaisberg, Founding Father of Commercial Sound Recording. London : Sancturary Publ.,1999

NEW YORK TIMES, Connecting Music and Gesture with Alan Gilbert [vidéo en ligne]. The New York Times Company, 6 avril 2012 [vue le 15 septembre 2019] http://archive.nytimes.com/www.nytimes.com/interactive/2012/04/06/arts/music/the-connection-between-gesture-and-music.html

PAILLÉ, P., L’analyse par théorisation ancrée. Da n s Cahiers de recherche sociologique, vol.23, pp.147-181, 1994.

PAILLÉ, P. & MUCCHIELLI, A., L’analyse qualitative en sciences humaines et sociales (3e éd.). Paris : Armand Colin, 2012.

PATMORE, D. & CLARKE, E., Making and hearing virtual worlds: John Culshaw and the art of record production. Dans Musicae Scientiae, vol.11(2), pp.269–293, 2007.

PRAS, A., How to draw out the best musical performance : best practices for studio recording in the digital era. Thèse de doctorat, Université McGill, 2012.

PRAS, A. & GUASTAVINO, C., The role of music producers and sound engineers in the current recording context, as perceived by young professionals, in Musicae Scientiae, vol.15(1), pp.73-95, 2011.

PRAS, A. ; CANCE, C. ; GUASTAVINO, C., Record Producers’ Best Practices For Artistic Direction—From Light Coaching To Deeper Collaboration With Musicians, Journal of New Music Research, vol.42(4), pp.381-395, 2013.

RAVET, H., L’orchestre au travail : interactions, négociations, coopérations, Collection MusicologieS. Clermont-Ferrand : Vrin, 2015.

ROBERT, P., Performing Music in the Age of Recording. New Haven & London : Yale University Press, 2004.

SHIRAKAWA, S., The Devil’s Music Master : The Controversial Life and Career of Wilhelm Fürtwangler. Oxford: Oxford University Press, 1992.

SCHWARZKOPF, E., La voix de mon maître : Walter Legge. Paris : Pierre Belfond, 1983.

SMITH, W., The mystery of Leopold Stokowski. Cranbury : Associated University Presses, 1990.

ANNEXE 1 : Profil des participants à l’étude

ANNEXE 2: Guide d’entretien

Quelles sont les fonctions et le rôle du directeur artistique dans le contexte d’un enregistrement de musique d’ensemble ?
Selon vous, quelles sont les principales qualités que doit avoir un directeur artistique dans le contexte d’un enregistrement de musique d’ensemble ?
J’aimerais que vous me parliez maintenant de votre collaboration avec le directeur artistique/chef d’orchestre en amont de l’enregistrement.
Décrivez-moi maintenant l’interaction que vous avez avec le directeur artistique/chef d’orchestre pendant la séance d’enregistrement.
De quelle nature sont les échanges mis en place avec le directeur artistique/chef d’orchestre pendant la phase de post-production ?
J’aimerais que vous me fassiez part des éventuels problèmes et divergences que vous avez pu rencontrer en travaillant avec un directeur artistique/chef d’orchestre. Quelles solutions ont été adoptées ?
Au regard de votre parcours, parlez-moi de vos expériences les plus marquantes avec un directeur artistique/chef d’orchestre, qu’elles soient positives ou négatives.
Souhaitez-vous ajouter quelque chose que nous n’aurions pas évoqué ?

ANNEXE 3 : Formulaire de consentement préalable à l’entretien

Présentation du projet. Cet entretien s’inscrit dans le cadre d’un mémoire de recherche réalisé au Conservatoire National Supérieur de Musique et de Danse de Paris (CNSMDP) dans la Formation Supérieure aux Métiers du Son (FSMS). Ce projet vise à étudier la relation entre le directeur artistique et le chef d’orchestre au cours des enregistrements de musique d’ensemble dirigée et ce, dans le but de documenter cette pratique et d’identifier les problématiques artistiques et esthétiques mises en jeu.

Procédure. Votre participation à cette étude prendra la forme d’un entretien au cours duquel vous serez invité(e) à parler de votre expérience d’enregistrement de musique d’ensemble (orchestre symphonique, orchestre de chambre, ensemble baroque ou contemporain…) en tant que directeur artistique ou chef d’orchestre. Cet entretien, d’une durée variable entre une demi-heure et une heure et demie, sera enregistré en format audio uniquement, et ne sera utilisé que dans le cadre du présent projet de recherche.

Droits du participant. Votre participation à cette étude est volontaire. Ainsi, il vous sera permis de refuser de répondre à n’importe quelle question ou de stopper à tout moment l’entretien. Vous aurez le droit de réécouter l’intégralité ou une partie de l’enregistrement audio et d’en exiger sa destruction.

Confidentialité. Cet entretien sera traité de manière confidentielle et anonyme. Votre nom n’apparaîtra pas dans les publications résultantes.

Déclaration du participant :

« J’ai lu la description du projet de recherche et par la présente, accepte d’y participer. J’ai pris connaissance des conditions d’utilisations des résultats de cet entretien, et du fait que mon identité restera confidentielle. »

Nom : Date : / /

Signature :

Cette étude est menée par Théo Terracol et encadrée par François-Xavier Féron (STMS-IRCAM).

Contact : theo.terracol@gmail.com / 06 77 65 48 13.

ANNEXE 4 : Listes de lemmes classés par fréquence

Corpus « directeurs artistiques

on	2,84%	entendre	0,15%
faire	1,63%	parler	0,15%
je	1,57%	changer	0,14%
chef	1,50%	avis	0,13%
pouvoir	0,97%	disque	0,13%
orchestre	0,80%	trouver	0,13%
dire	0,71%	donner	0,12%
artistique	0,57%	musical	0,12%
échange	0,56%	partition	0,12%
enregistrement	0,56%	montage	0,11%
confiance	0,51%	relation	0,11%
directeur	0,46%	tempo	0,10%
temps	0,41%	gérer	0,10%
vouloir	0,39%	décider	0,10%
séance	0,27%	interprétation	0,10%
ensemble	0,25%	correction	0,9%
écouter	0,25%	essayer	0,9%
travailler	0,25%	technique	0,9%
devoir	0,25%	refaire	0,9%
musique	0,25%	balance	0,8%
discuter	0,24%	règle	0,8%
prise	0,24%	gestion	0,8%
musicien	0,23%	accord	0,8%
demander	0,22%	aimer	0,7%
concert	0,21%
savoir	0,21%
différent	0,19%
rôle	0,18%
soliste	0,17%
jouer	0,16%
studio	0,16%

Corpus « chefs d’orchestre »

je	3,09%	qualité	0,16%
on	2,10%	attendre	0,15%
faire	1,20%	échange	0,15%
artistique	1,18%	aimer	0,15%
directeur	1,12%	donner	0,15%
pouvoir	1,08%	répétition	0,15%
dire	0,87%	refaire	0,14%
avec	0,72%	travail	0,14%
moi	0,60%	trouver	0,14%
orchestre	0,52%	rôle	0,14%
savoir	0,51%	oreille	0,13%
temps	0,44%	problème	0,12%
musicien	0,41%	interprétation	0,12%
enregistrement	0,40%	ensemble	0,12%
chef	0,35%	gérer	0,12%
devoir	0,33%	cabine	0,12%
entendre	0,33%	technique	0,11%
prise	0,31%	œuvre	0,11%
séance	0,30%	remarque	0,11%
confiance	0,30%	avancer	0,11%
autre	0.29%	connaître	0,11%
besoin	0,28%	montage	0,10%
penser	0,24%	perception	0,09%
parler	0,21%	manière	0,08%
vouloir	0,20%	choix	0,08%
vite	0,20%	micro	0,08%
travailler	0,19%	écoute	0,08%
enregistrer	0,17%	métier	0,07%
suivre	0,17%
disque	0,17%
deux	0,16%
musical	0,16%

Remerciements

La réalisation de ce mémoire a été possible grâce au concours de plusieurs personnes à qui je souhaiterais témoigner toute ma reconnaissance.

Tout d’abord, je tiens à remercier chaleureusement François-Xavier Féron (STMS-IRCAM) pour son aide précieuse et ses conseils avisés, sa relecture attentive et l’intérêt porté à mon sujet de recherche.

Merci également à Corsin Vogel, Pierre-Antoine Signoret, Jean-Pascal Jullien et Denis Vautrin pour m’avoir aidé à préciser ma recherche.

Merci à tous les directeurs artistiques et chefs d’orchestre interrogés qui, par leur aide et leur collaboration, ont permis la réalisation de ce mémoire.

Merci au Conservatoire National Supérieur de Musique et de Danse de Paris, et plus particulièrement à la FSMS et ses professeurs, auprès de qui j’ai beaucoup appris pendant ces quatre riches années d’études.

Merci à mes camarades FSMS pour ces innombrables heures passées en Régie des Amphithéâtres…

Enfin un grand merci à mes parents, mon frère Hugo et Valentine qui m’ont toujours fait preuve d’un soutien des plus sincères.

Notes

« One of the ways to make your sound better is to make it really obvious that you’re really listening and that it really matters to you what it sounds like. That’s not actually conducting. It’s kind of embodying or representing a kind of aspiration, if you will, and it’s uncanny how that actually can make a difference. As soon as it’s apparent that your ears are open and that you’re interested and you’re following the contour of the sound, then that very contour is affected by that.” ↩︎
« Soundmen will be trained in music, acoustics, physics, mechanics and related fields to a degree enabling them to control and improve the sonority of recordings. […] The student should will be trained to notice all the differences between the image in his mind of the manner in which music should sound when perfectly played and the real playing; he will be able to name these differences and to tell how to correct them. » ↩︎
STRAUSS, R., Elektra. Wiener Philharmoniker (Georg Solti), Londres, Decca, 1966. ↩︎
WAGNER, R., Der Ring des Nibelungen. Wiener Philharmoniker (Georg Solti), Londres, Decca, 1958-1964. ↩︎
Blanchet & Gotman, 2007, p.25. ↩︎
Blanchet & Gotman, 2007, p.27. ↩︎
Paillé & Mucchielli, 2012, p.59. ↩︎

juin 12, 2026

HOOF : Un format pour le rayonnement des sources sonores
Par : Noé FAURE

Formation Supérieure aux Métiers du Son Directeur de mémoire : Charles VERRON, Septembre 2018

Abstract

Directivity of sound sources is a common phenomena of our everyday life. Someone’s voice talking, some musical instrument or high-speaker playing : they all radiate sound according to the direction in space in a way that is interpreted by the brain, consciously or unconsciously.

Some fields showed an early interest about the feature of directivity. In architectural acoustics and acoustic simulation, the interaction between source directivity and reverberation have been subject to many investigations. In musical acoustics, the capture and the analysis of source directivity is signi- ficant to fully characterize music instruments. Finally, the question of directivity appears in the field of video games. This was made possible by the improvement of game engines and with the increase of CPU. However, music and sound production are currently left behind : the acoustic phenomena of directivity is naturally present during sound recording, but the information is lost right away for the rest of the production chain.

The present work intends to explore a new kind of production workflow for sound engineers, inte- grating the manipulation of sound sources with directivity.

The HOOF (High Order O-Format ) presented here, appears as an interesting answer. It consists in using the spherical harmonics decomposition to store directional sound sources, for the purpose of post-production. In this work, we will first go into detail through the recording and encoding process. Then, we will talk about the post-production and the decoding part, back to the physical world.

Throughout the Appendix, we will review the pre-existing solutions to work with source directivity.

Résumé

La directivité des sources sonores est un phénomène que nous côtoyons au quotidien. Qu’il s’agisse de la voix d’un interlocuteur, d’un instrument de musique ou d’un haut-parleur, ces variations perceptives sont intégrées naturellement par le cerveau de manière consciente ou inconsciente.

Plusieurs domaines se sont déjà intéressés au rayonnement des sources sonores, notamment celui de l’acoustique architecturale et de la simulation acoustique où l’influence de la directivité sur la perception de la réverbération a été largement étudiée. Pour l’étude des instruments de musique, la captation et l’analyse du rayonnement ont également une place importante. Finalement, c’est dans le domaine des jeux vidéo que l’on retrouve la question de la directivité, permise par le perfectionnement progressif des moteurs de jeu et l’augmentation de la puissance de calcul. Mais le domaine de la production sonore et musicale est en reste : ce paramètre, présent naturellement au moment de la prise de son, disparaît ensuite de la chaîne de production.

Ce travail se propose donc d’explorer un nouveau type de production pour les ingénieurs du son, intégrant la manipulation de sources directives.

Le format HOOF (High Order O-Format), présenté ici, apparaît comme une réponse intéressante. Il s’agit d’utiliser le formalisme des harmoniques sphériques pour stocker des sources directives, à des fins de post-production. Nous évoquerons les problématiques de captation et d’encodage en harmoniques sphériques ainsi que les différentes possibilités de restitution, virtuelles ou physiques.

En annexe, on trouvera un état des lieux des différentes solutions logicielles pré-existantes pour appréhender les sources directives.

Mots clés : Sources directives, rayonnement, HOOF, harmoniques sphériques, réalité virtuelle.

Introduction

Nous assistons depuis quelques années à un regain d’intérêt et à une démocratisation des médias « immersifs ». Des casques stéréoscopiques et des caméras 360° sont désormais disponibles sur le marché du grand public, les productions vidéos 360° de qualité sont de plus en plus nombreuses (LeMoigne, 2016 [3]), et disponibles sur les réseaux sociaux : on peut désormais être son propre « réalisateur », immergé au sein d’un film, avec la possibilité de regarder tout autour de soi.

L’audio a donc un rôle important à jouer : il s’agit de plonger l’auditeur dans un espace sonore (« réaliste » ou « imaginaire »), soit grâce à un système de haut-parleurs ou par des traitements binauraux au casque. Cet intérêt pour « l’audio spatialisé » a amené les concepteurs de DAWs¹ à augmenter le nombre de canaux disponibles, les développeurs à concevoir des outils de spatialisation, et les ingénieurs du son à s’intéresser aux formats audios spatialisés.

Mais une prochaine étape importante, déjà en cours d’expérimentation, est sans doute la captation vidéo volumétrique (ou 6 DoFs²), offrant la possibilité au spectateur de se déplacer dans la scène, et éventuellement d’interagir avec elle. On risque donc d’assister prochainement à un nouveau type de média, à la frontière entre le jeu vidéo et le cinéma, interrogeant la place du spectateur dans l’œuvre cinématographique.

Certaines expériences avec des caméras « lightfield »³ ont déjà montré quelques résultats intéressants

pour ce type de captation. Et l’audio va devoir trouver des solutions pour capter ou simuler les effets « acoustiques » de distance, d’occlusion et de directivité des sources. Les sources sonores manipulées, jusqu’alors omnidirectionnelles, se verront attribuer un volume et une directivité propre.

Nous verrons dans une première partie que de nombreux travaux de recherche ont déjà été effectués autour de la captation et la caractérisation du rayonnement des sources sonores, dans des conditions plus ou moins restrictives, à des fins de simulations acoustiques. Un éclairage particulier sera apporté sur les instruments de musique, objets sonores complexes s’il en est.

Mais la spécificité de l’ingénieur du son est qu’il appréhende le son au service d’un projet artistique ou esthétique. Que ce soit dans un contexte musical, audiovisuel, radiophonique ou autre, les outils qu’il manipule, de la prise de son à la post-production, n’ont pas vocation à restituer fidèlement la réalité de manière scientifique et objective, mais de répondre à des codes, des goûts et des expérimentations artistiques variées.

Il s’agit donc d’imaginer un format pratique et pertinent pour manipuler les directivités de sources sonores dans le cadre de productions artistiques, pour les étapes de la captation et de la post-production : c’est l’objectif du format HOOF (High Order O-Format), extrapolation aux ordres supérieurs du O-Format ambisonique. Le travail sur les sources HOOF est indépendant du format de sortie, et la restitution peut-être faîte en stéréo, binaural, ou sur un système multicanal.

Nous détaillerons dans la seconde partie de ce mémoire les différents aspects de la solution HOOF (captation, post-production, restitution), en les illustrant par quelques cas d’usages. Les scripts Py- thon rédigés dans le cadre de ce travail seront disponibles en Annexe, ainsi qu’un état des différentes solutions pré-existantes.

Première partie : La directivité : méthodes de mesures et représentations

1. Définitions

En acoustique, on parle de rayonnement pour désigner l’émission d’énergie par une source sonore, sous forme d’ondes acoustiques. La directivité d’une source sonore est la répartition spatiale du rayonnement autour de la source. Elle est la plupart du temps exprimée sous forme d’une fonction en coordonnées sphériques, et permet de caractériser une source sonore.

Si une source sonore peut être parfaitement décrite d’un point de vue temporel et fréquentiel à partir d’un simple enregistrement monophonique, les informations de directivité nécessitent une des- cription spatiale.

Une source sonore est dite « omnidirectionnelle » ou « omnidirective » lorsque l’énergie est rayonnée de la même manière dans toutes les directions. C’est le cas le plus simple de description de la directivité, que l’on peut noter :

Il s’agit du cas théorique d’une source ponctuelle « monopole », aussi appelée « sphère pulsante »[6]. En effet, une source réelle ne peut pas être omnidirective à toutes les fréquences, comme le montre la figure 1 ci-dessous ⁴. La prise en compte de la fréquence est donc indispensable pour décrire des sources réelles.

Figure 1 – Diagrammes de directivité d’une enceinte à 100Hz, 1kHz et 10kHz. Modèle E12 audio- technik, de d&b

Comme le rappelle Martin Pollow dans [34], plusieurs définitions de la directivité fréquentielle sont possibles, suivant l’application envisagée. Il distingue en effet la « directivité en magnitude« , où seule la partie réelle du spectre complexe est prise en compte de la « directivité complexe » tenant compte des informations de phase.

L’aspect dynamique de la directivité peut également être pris en compte. En effet, pour certaines sources et à certaines fréquences, le rayonnement évolue au cours du temps, ce qui pourrait donner la description ultime de la « directivité dynamique« .

On pourrait donc décliner la fonction de directivité

de plusieurs manières :

Directivité en « gain » :

variation du niveau sonore autour de la source, en considé- rant toutes les fréquences (« pleine bande »).

Directivité en « magnitude » :

obtenue à partir de la partie réelle du spectre, souvent exprimée en utilisant des moyennages par bande d’octave (ou 1/3 d’octave).

Directivité « complexe » :

obtenue à partir du spectre complexe, prise en compte des informations de phase.

Directivité « dynamique« ,

évolution de la directivité au cours du temps. Ainsi, la finesse de la description doit être adaptée à l’application recherchée.

Dans le cadre de virtualisation de sources sonores, s’il s’agit simplement de faire entendre les variations de volume sonore en fonction de l’orientation de la source, une simple directivité « en gain » peut suffire. Si l’on souhaite ajouter du réalisme à la simulation et ajouter la dépendance fréquentielle, on peut utiliser une directivité en « magnitude ».

Enfin, si la phase absolue (l’inversion de phase) n’est pas directement perçue par l’oreille humaine, les dégradations spectrales dues à la phase le sont. La «directivité complexe» est donc une formulation utile dans les cas faisant intervenir plusieurs sources sonores corrélées, ou pour simuler des sources sonores en volume comme nous le verrons dans la troisième partie.

Mentionnons également que la directivité est souvent liée à la longueur d’onde rayonnée, plus précisément au rapport entre la fréquence rayonnée et les dimensions de la source sonore. Les fréquences possédant une longueur d’onde supérieure aux dimensions de la source sont généralement omnidirectives. On peut considérer, et on le voit sur la figure 1, que les sources sonores sont de plus en plus directives lorsque l’on monte en fréquence, et qu’elles sont moins directives lorsque leurs dimensions réduisent.

Notons finalement que la directivité peut également permettre de caractériser un récepteur, comme un microphone par exemple, ou encore l’oreille humaine. On désigne d’ailleurs fréquemment un mi- crophone par sa directivité : un microphone «omni», «cardio», ou «bidi», s’adapte différemment au contexte de prise de son. Les HRTFs⁵ constituent une mesure des fonctions de directivité des oreilles.

Un processus de transmission acoustique peut donc être caractérisé à la fois par la directivité de la source et du récepteur. Par exemple, le signal perçu par les oreilles est une combinaison de la directivité d’une source sonore et de celle des oreilles, de même qu’un signal capté par un microphone est le résultat de la combinaison de la directivité de la source avec celle du microphone.

2. Méthodes de mesures

On peut déterminer la directivité d’une source sonore en partant de modèles physiques théoriques. Cela consiste à approcher le comportement vibratoire d’une source réelle par une description mathématique de la structure vibratoire. Ces modèles sont pratiques, puisqu’ils sont paramétriques, et permettent de déterminer l’influence de tel ou tel paramètre sur le résultat sonore final. Mais ils ne constituent toujours qu’une approximation de la réalité.

Une seconde approche consiste à passer par la mesure, à l’aide d’un ou plusieurs microphones, pour caractériser le rayonnement d’une source sonore. Cela soulève différentes problématiques.

2.1 Sources sonores

Il est compliqué, par la mesure, de caractériser de manière continue la surface enveloppant la source sonore, la mesure consiste en un échantillonnage spatial de cette surface, souvent sphérique (ou circulaire en 2D). Afin de reconstituer une fonction continue à partir de la mesure, il sera nécessaire d’utiliser une loi d’interpolation⁶.

La norme ISO 3745 [16] fournit diverses recommandations concernant les mesures de directivité de sources sonores. Il y est précisé que la mesure de directivité « s’adapte à tous types d’excitations, impulsionnelles ou continues, constantes ou fluctuantes ». La mesure peut être « simultanée », si tous les microphones captent le signal au même moment ou « séquentielle », si l’excitation est parfaitement reproductible dans le temps.

Lorsque l’excitation est parfaitement reproductible (un haut-parleur par exemple), on peut utiliser un bras mécanique afin de déplacer les microphones, ou placer la source sur un plateau tournant afin de la faire pivoter tout au long de la mesure. Cela permet en général d’augmenter la résolution du maillage.

Pour la mesure, les microphones sont dirigés vers la source et placés à équidistance de son « centre acoustique ». Le champ de pression rayonné par la source est alors capté dans les différentes directions de l’espace.

2.2 Lieux de mesure

Afin de s’abstraire des caractéristiques acoustiques du lieu (réflexions, réverbération…), les mesures sont souvent faites en chambre anéchoïque (ou semi-anéchoïque). Les conditions anéchoïques sont censées simuler des conditions de champ libre autour de la source, c’est-à-dire des conditions dans lesquelles les réflexions acoustiques sont négligeables pour la zone de fréquence étudiée (de 100Hz à 10000Hz d’après l’ISO 3745 [16]).

Les chambres « semi-anéchoïques », quant à elles vérifient les conditions de champ libre sur une demi-sphère, le sol étant recouvert par une surface rigide semi-réfléchissante. Ces dernières conditions peuvent être intéressantes dans le cas où le rayonnement de la source sonore étudiée est fortement couplé avec le sol.

Comme l’ont proposés certains chercheurs, on peut également envisager de capter le rayonnement d’une source sonore dans un contexte acoustique «réaliste» (voir Fig.2(a)), et non en conditions de laboratoire [36]. C’est d’ailleurs l’option que j’ai prise lors de l’expérience de captation menée au CNSMDP en novembre 2017 (voir I.5).

2.3 Dimensions

Lorsqu’on parle de la directivité d’une source sonore, cela sous-entend en général le champ lointain, c’est-à-dire la zone à partir de laquelle le rayonnement de la source peut être considéré comme des ondes planes. Dans l’idéal, les dimensions du système de mesure devraient donc être adaptées à celles de la source sonore.

(a) Enregistrement en conditions acous- (b) Enregistrement en conditions anéchoïques, tiré de [28] tiques, tiré de [36]
Figure 2 – Captation de sources directives en conditions acoustiques et anéchoïques

Pour cela, la norme ISO3745 définit une «dimension caractéristique de la source» (d₀), exprimée en mètres. Comme on le voit sur la figure 3, il s’agit de la distance entre le centre géométrique de la source et le coin le plus éloigné de l’hypothétique «parallélépipède rectangle» qui contiendrait la source mesurée. Avec une différence entre les conditions de mesures anéchoïques et semi-anéchoïques.

À partir de cette valeur, plusieurs éléments sont à considérer pour la taille de la surface de mesure :

le rayon (r) de la sphère de microphones doit être au moins supérieur au double de la dimension caractéristique de la source (r > 2.d₀)

le rayon de la sphère doit être au moins supérieur au quart de la longueur d’onde la plus grave émise par la source (r > 1/4 λ_max)

le rayon de la sphère doit être au moins supérieur à 1 mètre.

Figure 3 – Dimension caractéristique de source (d₀) en conditions anéchoïques (gauche) et semi-anéchoïque (droite), extrait de [16].

Par exemple, pour un violon de dimensions : 21 x 9 x 60 cm, la dimension caractéristique de la source en conditions anéchoïques est : d₀ = 32.1cm .

On doit donc avoir :

r > 64.2cm

r > 43.4cm

r > 1m

⇾ On choisira donc une sphère de rayon > 1m.

2.4 Géométrie du système de mesure

Pour les mesures simultanées d’une source sonore par un réseau de microphones, diverses configu- rations de microphones sont envisageables afin d’échantillonner la sphère. Certaines sont régulières, d’autres non, le nombre de points de mesures peut varier également. En pratique, les principales possibilités citées par la norme ISO sont de discrétiser la sphère en utilisant des trajectoires circulaires coaxiales, méridionales, ou bien des trajectoires en spirales.

Il s’agit là de spécifications/recommandations afin de mesurer des niveaux sonores, par bandes d’octaves ou par tiers d’octaves, aux abords d’une source sonore quelconque. D’autre part, l’espacement équiangulaire avec un espacement régulier entre les microphones est le type de configuration pris en charge par la plupart des formats actuels (voir Annexe 3, « Formats de données »).

La question de la position et la répartition des microphones a également été étudiée dans une approche plus théorique par Franz Zotter dans sa thèse « Analysis and Synthesis of Sound-Radiation with Spherical Arrays » [40], dans le but de représenter la source en utilisant la base des harmoniques sphériques (voir partie 4.3 )

Il y fait état de différentes solutions pour passer de l’échantillonnage discret de la sphère à la représentation en harmoniques sphériques, avec des répartitions variées de microphones. Chacune d’elles présente des avantages et inconvénients en termes de nombre de microphones, de coût de calcul, mais surtout d’erreur générée lors du passage en harmoniques sphériques. Nous n’entrerons pas ici dans les détails mathématiques de ces solutions, la figure 4(e) montre la configuration à 64 microphones retenue par Zotter.

Enfin, chacun est libre d’adapter le système en fonction des sources sonores étudiées, de l’objectif des enregistrements, et évidemment du nombre de microphones, préamplificateurs et convertisseurs disponibles.

Si certaines sources présentent des symétries, il est possible d’effectuer la mesure sur une partie du champ, puis d’extrapoler. Des configurations à deux couronnes (Fig. 4(b)) peuvent être utilisées pour avoir une meilleure résolution sur les plans vertical et horizontal. Les étudiants « Tonmeister » de la Kunst Universität Berlin quant à eux, dans le cadre d’un projet de comparaison de position de micro- phones, ont placé des couples stéréophoniques⁷ autour d’une source afin de permettre à l’auditeur⁸ d’écouter les différentes paires de microphones en acoustique naturelle (Fig. 4(f)).

On le voit sur la figure ci-dessous, la résolution microphonique a tendance à augmenter au fil des années.

Figure 4 – Quelques systèmes de prises de son multi-microphoniques

3. Spécificités des instruments de musique

Nous allons nous intéresser au cas plus spécifique de la caractérisation du rayonnement des instruments de musique. Si les premiers travaux d’envergure datent des années 1970 avec Jürgen Meyer (publiés dans [26]), des travaux ont été menés ces dernières années notamment au Danemark par Otondo et Rindel [31], en Finlande par Pätynen et al [32], en Allemagne entre Berlin et Aachen par

Pollow [35] et Vorländer, principalement à des fins de simulations acoustiques. Des recherches ont également été menées à l’IRCAM et à l’IEM de Graz [28]. Différentes bases de données sont donc disponibles, que nous pourrons exploiter par la suite.

Nous allons voir que lorsqu’il s’agit d’enregistrer et de mesurer des rayonnements d’instruments de musique, des contraintes supplémentaires adviennent et différentes options pourront être prises en fonction de l’objectif de la mesure (acoustique instrumentale, simulation acoustique, sources virtuelles…).

3.1 Reproductibilité

Nous l’avons évoqué précédemment, la question de la reproductibilité du signal sonore est importante dans le choix du système de captation. S’agissant de l’instrument de musique, des systèmes de doigts robotisés[23] ou de bouches artificielles[28] ont été développés afin de s’abstraire du jeu du musicien et de pallier à la non-reproductibilité. Ainsi, il serait possible d’utiliser une mesure de type séquentiel, et d’utiliser un nombre restreint de microphones en répétant l’excitation autant de fois que nécessaire pour quadriller tous les points de mesure.

Cependant, la plupart des études récentes ont considéré qu’il était difficile de s’abstraire du musi- cien et de son jeu, ainsi que de son corps, qui joue un rôle prépondérant dans le rayonnement lui-même (masquage de certaines zones de l’espace). La mesure «simultanée» de la directivité a donc été adoptée, avec un musicien jouant au centre d’une sphère de microphones.

Pour notre part, dans le contexte de simulation ou de production de contenus et non de l’analyse objective à des fins scientifiques, nous envisageons également le système musicien-instrument comme indissociable dans la production et le rayonnement du son.

3.2 Contenu spectral

Un autre enjeu de l’instrument de musique est qu’il n’excite pas toutes les fréquences du spectre. En effet, chaque note jouée est constituée d’une fréquence fondamentale et de ses harmoniques ou partiels. Ce contenu spectral est propre à l’instrument, auquel s’ajoute le «bruit» lié à l’action de l’instrumentiste pour produire le son (souffle, son de clefs, déplacement des doigts sur les frettes,…).

Contrairement à un signal « sweep » envoyé dans un haut-parleur, permettant d’analyser finement une réponse impulsionnelle en balayant avec la même énergie toutes les fréquences du spectre, chaque note jouée sur un instrument excite un nombre fini de fréquences.

Plusieurs approches sont envisageables à la mesure, afin d’extraire l’information sur l’ensemble du spectre. Il est possible d’exciter artificiellement l’instrument à l’aide d’un signal synthétique plat en fréquence (un bruit blanc comme l’a fait LeCarou dans [23] ou un sweep), ou en utilisant un marteau pour produire une impulsion (de type Dirac comme dans NBody Project [7]) : ces deux méthodes permettent de s’abstraire des conditions de production du son par l’instrumentiste et sont souvent utilisées pour déduire/formuler des modèles mathématiques à partir des mesures.

D’autres approches consistent à extraire l’information utile par des traitements et moyennages à partir d’enregistrements musicaux, ou effectuer une description « note à note » à partir d’enregistrements de notes isolées jouées sur l’instrument. C’est le parti pris par les chercheurs de Aachen dans

[38] Pour la construction d’une base de données de directivité de 41 instruments de musique (modernes et anciens), ils ont ensuite effectué une extraction de pics à partir du spectre afin de ne garder que l’information pertinente. Une autre approche serait d’interpoler entre les différents pics et d’extraire « l’enveloppe spectrale » de l’instrument (que l’on peut deviner sur la figure 5).

Figure 5 – Analyses spectrales des différentes notes d’une trompette, enregistrement tiré de la base de données de Pollow et al [34]

Une méthode astucieuse a également été proposée par Perez Carrillo et al dans [33] pour exciter « de manière homogène toutes les fréquences sur une large zone de fréquences » en utilisant un glissendo (ce qui n’est possible que sur certains instruments).

Il s’agit là de conditions plus ou moins «écologiques» (par rapport au contexte habituel de jeu) pour étudier le rayonnement de l’instrument ou du système «musicien-instrument». Dans le cadre de l’expérimentation menée au Conservatoire (voir partie I.5), les méthodes de moyennage ont été utilisées, à partir d’enregistrements musicaux.

3.3 Mouvements du musicien

Une autre contrainte importante lors de la mesure est celle du mouvement de l’instrument. Comme nous l’avons mentionné plus haut, la source sonore doit être centrée lors de la mesure. Tout écart à cette position entraînera des variations de phase entre les signaux captés par les microphones et pourra engendrer du filtrage en peigne et des erreurs de mesure, d’autant plus grandes que l’on monte en fréquence.

Le centre acoustique de la source est défini comme « la position à partir de laquelle les ondes planes observées en champ lointain semblent diverger « , et la « position à partir de laquelle la pression diminue de manière inversement proportionnelle à la distance« [20]. Ces deux définitions étant liées à l’hypo- thèse que toute source peut être approximée par une « source ponctuelle équivalente », c’est-à-dire une source directive ramenée en un point de l’espace.

Une fois de plus, la connaissance de l’objectif de la captation doit aider à mesurer l’importance de cette erreur de mesure. S’il s’agit de mesurer la directivité en « magnitude », de petites variations de position auront peu d’influence. Mais si l’on souhaite étudier le rayonnement «complexe» de la source, les mouvements de la source peuvent être problématiques pour des questions de variation de phase.

Il est alors possible de contraindre le musicien en fixant l’instrument, ou de suivre ses mouvements à l’aide d’un dispositif de tracking et de les compenser en post-traitement sur le signal capté (type de dispositif utilisé lors des mesures de HRTFs). Différentes approches algorithmiques ont été proposées pour le recentrage acoustique de sources en rotation et translation, notamment par Deboy[10] et Ben Hagai et al[4].

La figure suivante montre une source omnidirectionnelle avant et après recentrage :

Figure 6 – Diagramme de rayonnement d’un monopole à 1000Hz décalé de 30cm, avant et après recentrage acoustique, tiré de [10]

Pour les instruments plus volumineux, souvent moins mobiles, le problème du mouvement se posera moins, mais la difficulté sera de déterminer précisément le centre acoustique de la source, et de disposer d’une chambre assez grande pour accueillir les mesures.

Quoi qu’il en soit, les musiciens (humains) ont tendance à bouger, plus ou moins selon les instruments et le répertoire. Qu’il s’agisse d’interagir avec l’acoustique du lieu ou de créer du mouvement dans le son, ces mouvements font partie intégrante de l’interprétation et doivent être pris en compte s’il s’agit d’une application artistique.

Nous verrons dans la partie II.7 deux scénarios de prise de son possibles dans lesquels la directivité des sources est prise en compte, le caractère « dynamique » de la directivité pouvant être simulé à la restitution.

4. Analyses et représentations

4.1 Les grandeurs objectives de la directivité

Les scientifiques s’appliquent à mettre en place des critères et formulations afin de décrire les différents paramètres du son. Pour parler du niveau sonore, on peut utiliser la sonie (ou « loudness« ), les dB pondérés A, B, C, LU, VU, pour s’adapter aux finesses de la perception. Pour la description du timbre, on peut parler du spectre, moyenné par octave ou 1/3 d’octave, de l’enveloppe temporelle, de l’enveloppe spectrale, des formants. . . La directivité présente également quelques critères d’apprécia- tion et descripteurs pertinents. Nous en citerons quelques uns :

Le facteur de directivité[13] : Souvent calculé dans l’axe principal de la source, il permet de juger de la répartition spatiale de l’énergie, ou du degré de proéminence d’une direction de l’espace. Il s’agit donc du rapport entre l’intensité rayonnée dans une direction donnée (I_ref ) et l’intensité moyenne⁹ rayonnée sur l’ensemble de la sphère (I_moy) :

Sa valeur sera égale à 1 pour une source parfaitement omnidirective.

L’indice de directivité quant à lui, défini dans la norme ISO-3745 est le facteur de directivité exprimé en dB :

ID = L_axe — L_moy = 10.log(Q)

Avec L_axe le niveau sonore moyen dans l’axe, et L_moy le niveau sonore moyen sur l’ensemble de la sphère.

L’indice de «non-uniformité du niveau sonore sur la surface » : défini dans l’ISO-3745 [16], cet indicateur permet d’évaluer la variabilité en niveau du champ sonore sur la surface de mesure. On peut le calculer par la formule suivante :

L_pi la pression moyenne au niveau du ième microphone (en dB).

L_pav la moyenne des pressions évaluée sur toute la surface de mesure (en dB).

N le nombre de microphones sur la surface.

Pour une source omnidirective, sa valeur sera donc nulle.

L’angle d’ouverture à n dB :

Cette valeur est parfois indiquée par les fabricants d’enceintes, à -3dB ou -6dB (« directivité nomi- nale »). Il s’agit de l’angle, par rapport à l’axe principal de directivité, à partir duquel le niveau sonore est à n dB en dessous du niveau dans l’axe.

Il permet de juger de la directivité d’une enceinte, ou au contraire de sa large ouverture. Cette valeur est parfois donnée par bande de fréquence ou pour une fréquence donnée. En effet, l’angle d’ouverture sera en général d’autant plus faible que l’on monte en fréquence.

Figure 7 – Diagramme de rayonnement d’un haut-parleur et angles de directivité à -6dB, à 500Hz en noir : 216°), 2.5kHz (en jaune : 106°) et 16kHz (en violet : 46°)

Sur la figure ci-dessus, représentant le diagramme de directivité du haut-parleur coaxial 6FHX51 du fabricant B&C¹⁰, on peut observer les angles d’ouverture à -6dB à différentes fréquences.

Le «front to back factor» et le «front to side factor» :

Ces critères, utilisés dans la description des antennes (réseau de capteurs répartis suivant une géo- métrie particulière) sont évoqués par J.Meyer (dans « Acoustics and the Performance in Music« ) pour exprimer la répartition spatiale de l’énergie selon les directions « avant-arrière » (F/B) ou « avant-côtés » (F/S). Cela implique de définir une orientation de référence pour la source, à partir de laquelle seront calculés les rapports d’énergie entre la direction avant, arrière, gauche et droite.

Typiquement, le « front to back factor » permettra de différencier un cor (pavillon orienté vers l’arrière) d’un trombone (pavillon orienté vers l’avant) : (F/B)_cor < 0 < (F/B)_trombone

On les note :

F/B = 10.log(I_avant) — 10.log(I_arriere)

F/S = 10.log(I_avant) — 10.log(I_cotes)

4.2 Les représentations visuelles

Une fois la mesure effectuée, vient la question de la représentation visuelle.

Comme nous l’avons souligné en première partie, la directivité est une fonction présentant plusieurs dimensions : spatiales (2D ou 3D), spectrales (résolution fréquentielle, octaves ou 1/3 d’octaves) et éventuellement la phase.

Jürgen Meyer est l’un des premiers à avoir mesuré, décrit, et représenté le rayonnement des instru- ments de l’orchestre, et a donc été confronté au problème de la représentation multidimensionnelle de la directivité en 2D, afin d’illustrer son ouvrage « Acoustics and the Performance of Music » [26].

a) Diagramme polaire d’un hautbois à différentes fréquences

b) Représentation de la directivité d’un cor, à différentes fréquences et sur plusieurs plans

Figure 8 – Deux types de représentations « polaires », en 2D et en 3D

Le diagramme polaire est utilisé par Meyer pour représenter, à une fréquence donnée et pour une certaine plage dynamique, la répartition spatiale de l’énergie dans le plan horizontal (fig. 8(a)). C’est une représentation très répandue aujourd’hui, notamment pour visualiser les caractéristiques des microphones.

Selon le même principe, Meyer propose également une représentation tri-dimensionnelle en effectuant des coupes dans certaines directions de l’espace (fig. 8(b)) : un plan horizontal, le plan vertical «avant-arrière», le plan vertical «gauche-droite», et le plan vertical dans l’axe de l’instrument.

a) Diagrammes de directivité d’un cor, sur les plans horizontal et verticaux

b) Représentation en histogrammes de la directivité d’un cor, à différentes fréquences

c) Représentation des zones de directivité (0-3dB) d’un violon à différentes fréquences sur le plan horizontal

Figure 9 – Trois types de représentations utilisées par Meyer

Une autre option est de présenter le diagramme de directivité projeté sur un plan, dans les diffé- rentes directions. Comme on peut le voir sur la figure 9(a), le niveau sonore est moyenné par plages de 0 à -3dB, de -3 à -10dB, puis en deçà. Si cette représentation a l’avantage de présenter simultanément les 3 variables (espace, fréquence, niveau), elle paraît moins directe à la lecture que la diagramme polaire, auquel nous sommes plus habitués.

Des histogrammes sont également utilisés par Meyer, où il moyenne par angle (Fig. 9(b)).

La visualisation proposée par Meyer qui a été la plus reprise dans différents ouvrages est sans doute celle présentée en figure 9(c). On y voit, pour certaines fréquences spécifiques, la zone où le niveau est maximum, sur une plage de 3dB. C’est sans doute la visualisation la plus simple du rayonnement, mais peu précise, car elle ne présente qu’un niveau moyen (0 à -3dB) pour une fréquence donnée, et dans un plan particulier.

Comme on le voit dans la démarche menée par Meyer, la question de la représentation n’est pas simple au vu du nombre important de variables en jeu. On peut aujourd’hui facilement tracer par des méthodes numériques différents types de représentations, en 2D et 3D, mais la question du choix des paramètres reste importante : il s’agit souvent d’un compromis entre précision, complexité et lisibilité.

4.3 Les harmoniques sphériques

L’ensemble des configurations de captation que nous avons présentées jusqu’ici possède des symétries sphériques. Un domaine parfaitement adapté au stockage et à la description des signaux captés est donc celui des harmoniques sphériques, que nous allons présenter ici.

Un signal temporel possède un spectre propre et peut se décomposer en une série de sinusoïdes. Dans le cadre du calcul informatique, on utilise la transformée de Fourier discrète (TFD) pour passer du domaine temporel (s(n)) au domaine fréquentiel (S(k)) :

avec n l’indice temporel, k l’indice fréquentiel, N le nombre de points considérés. La transformée de Fourier inverse (IFT), permet quant à elle, permet de repasser du domaine des fréquences au domaine temporel.

Le même raisonnement peut s’appliquer à des fonctions dépendant de variables spatiales. Une fonction continue exprimée en coordonnées sphériques possède un spectre sphérique (« Spherical Wave Spectrum« ) et peut se décomposer en une série d’harmoniques sphériques, en utilisant la transformée en harmoniques sphériques (« Discrete Spherical Harmonic Transform« , DSHT) :

Où A^m est un coefficient de pondération, Y ^m est l’harmonique sphérique d’ordre l et de degré m, définie à l’aide du polynôme de Legendre P^m, donnée¹¹ par :

La transformée en harmoniques sphériques inverse permet l’opération de retour dans la base angulaire.

On peut visualiser les 16 premières harmoniques sphériques sur la figure (Fig.10) ci-dessous :

Figure 10 – Représentation des harmoniques sphériques jusqu’à l’ordre 3 [1]

La décomposition en harmoniques sphériques est un outil mathématique utilisé dans différents domaines, pour l’analyse et la manipulation de données spatiales en coordonnées sphériques, notamment pour la topographie ou encore la cosmologie.

L’exemple suivant illustre l’utilisation des harmoniques sphériques pour l’analyse de données to- pographiques terrestres. Sur la figure 11, la carte topographique terrestre est d’abord analysée, puis tronquée à différents ordres. On peut y observer la contribution des différentes harmoniques sphériques sur le résultat final.

Figure 11 – Données topographiques terrestres analysées en harmoniques sphériques, tronquées à différents ordres. Figures générées à partir de la librairie « SHTools »

En acoustique physique, les harmoniques sphériques sont couramment utilisées dans la résolution de l’équation d’onde en coordonnées sphériques, lorsqu’il s’agit de décrire le champ sonore entrant ou sortant sur une surface donnée [9]. Mais également pour l’analyse du rayonnement de sources sonores, comme l’a fait Weinreich dès 1980 [39].

L’approche ambisonique

Michael Gerzon a été le premier, dans les années 70, à proposer d’utiliser une version tronquée du formalisme des harmoniques sphériques pour la captation, le stockage, la manipulation, et la restitution du champ sonore en un point de l’espace [12] [14]. En son temps, Gerzon s’est restreint aux quatre pre- mières harmoniques sphériques, dont les figures de directivité correspondent à celles de microphones réels courants (omnidirectionnel et bidirectionnel). Le format de stockage correspondant est appelé « B-Format « , ou encore « Ambisonique d’ordre 1 ».

Le format Ambisonique présente l’avantage d’être indépendant du système de prise de son et de restitution. On peut en effet encoder un microphone ou spatialiser des sources sonores, considérées alors comme des ondes planes convergentes. Le décodage peut être fait aussi bien sur un système de haut-parleurs qu’au casque, au travers de traitements binauraux.

Dans les années 2000, Jérôme Daniel (dans [8]) a contribué à étendre l’approche ambisonique aux ordres supérieurs, avec le format HOA (« High Order Ambisonics« ). Il s’agit d’utiliser un nombre plus important d’harmoniques sphériques, donc d’augmenter la résolution de description du champ sonore décrit, et d’élargir le « sweet spot » lors de la restitution sur haut-parleurs.

En pratique, plus l’ordre augmente, plus le nombre de microphones à la captation et de haut-parleurs à la restitution doit être élevé. Pour la captation de scènes sonores à ce format, on peut utiliser des microphones dits « Ambisoniques » ou « HOA », composés d’un nombre de capteurs du même ordre de grandeur que le nombre de composantes de l’ordre HOA cible.

Le formalisme des harmoniques sphériques peut également servir à décrire des rayonnements de sources sonores. C’est l’approche que nous développerons dans la deuxième partie à travers le HOOF (High Order O-Format).

La figure suivante (Fig.12) présente plusieurs systèmes microphoniques ambisoniques, depuis les années 1970 avec Gerzon jusqu’à aujourd’hui.

5. Enregistrement au CNSMDP

Dans le cadre de ce mémoire, un enregistrement a été réalisé en novembre 2017 au CNSMDP, afin de capter différentes directivités de sources sonores et de créer de la matière de travail. Cette expérimentation en conditions d’acoustique « réelle » a eu lieu dans la salle du Grand Plateau d’orchestre, où 8 microphones Schoeps MK4 (cardioïdes, afin de limiter l’effet de salle) ont été régulièrement disposés sur un plan horizontal circulaire, pointant vers le centre du cercle (voir Fig.13). Cette version 2D a servi de première approche, simple à mettre en place, avant l’expérimentation finale en 3D.

Plusieurs types de sources ont été enregistrées (une voix, un ukulele, un violon et une enceinte Yamaha HS7) à trois distances différentes de la source (70cm, 1m et 2m).

La source vocale était de type parlée, à un niveau « conversationnel » (lecture d’un texte d’environ 30 secondes). Le ukulele était joué en strumming, sur une grille harmonique de quatre accords durant 45 secondes. Le violon était joué par Shuichi Okada, violoniste au CNSMDP, interprétant la Chaconne de J.S. Bach (un extrait de 45 secondes a été sélectionné pour les analyses). Le haut-parleur, placé sur un pied à hauteur des microphones, a été excité avec un sweep afin de pouvoir en tirer une réponse impulsionnelle de source directive (ou « masque de directivité » comme nous le verrons en Partie II. 7.2).

Figure 13 – Quelques photos du système d’enregistrement

Cette séance a été réalisée de manière assez empirique, mais a permis de prendre conscience de certaines difficultés pratiques dues à la prise multi-microphonique de sources directives. Notamment, la précision dans le placement des microphones et le centrage précis de la source.

Les limites d’une telle prise de son « millimétrée » sont apparues. Le placement des microphones a été effectué suivant des critères « géométriques » et non pas en fonction de la source¹². Le timbre résultant dans les différents microphones était d’assez piètre qualité. Il serait d’ailleurs intéressant de réfléchir à une approche plus « qualitative » de la captation multi-microphonique de rayonnement, basée sur l’écoute et adaptée à la source. Reste à savoir si les modèles géométriques sont compatibles avec le plus traditionnel placement « à l’oreille ».

Toutefois, il est intéressant de pouvoir écouter les microphones aux différentes positions autour de l’instrument. La réponse directionnelle du haut-parleur a également donné des résultats très crédibles par simple convolution avec différents signaux monophoniques. Un patch Max/MSP de monitoring a été créé à cet effet (voir Fig.14).

Il était par ailleurs encourageant de constater que des analyses sommaires (effectuées à partir des en- registrements), même en conditions non-anéchoïques avec 8 microphones sur un plan, montrent déjà des résultats intéressants.

La figure 15 montre que l’ensemble des sources voient leur directivité s’affiner dans les hautes fré- quences, et on peut observer la direction des sources lors de la prise de son (voix en face, ukulele et violon vers le micro 8). L’analyse spectrale a été effectuée en moyennant par bandes d’octaves, sur toute la durée des extraits musicaux sus-cités. Les analyses de la figure 15 ont été tracées grâce au script Python « Plotpolar_Averagespectrum.py », disponible en Annexe.

Ces enregistrements nous serviront également à tester, dans la seconde partie, les différentes mé- thodes développées pour le processus d’encodage/décodage HOOF.

Figure 14 – Le patch Max/MSP créé pour écouter les différents microphones

Figure 15 – Les diagrammes polaires de trois sources enregistrées
Deuxième partie : le HOOF (High Order O-Format) : un format pour le rayonnement

6. Introduction du format HOOF

Le format ambisonique (introduit dans la partie 4.3) connaît aujourd’hui un fort intérêt, notamment pour la diffusion de vidéos 360° sur internet, et pour la réalité virtuelle. La mise sur le marché de nouveaux microphones ambisoniques, et le développement de solutions logicielles dédiées à la post-production ambisonique ont permis une certaine démocratisation de ce formalisme et son usage à des fins créatives.

Ce contexte de foisonnement autour des nouveaux formats audios « spatialisés » semble être une opportunité pour introduire une dimension supplémentaire rattachée aux sources sonores : celle de leur directivité. On parle en effet de « son 3D », ou « d’audio 360 », mais les sources avec lesquelles travaillent les ingénieurs du son jusqu’ici sont la plupart du temps omnidirectionelles.

À cela, j’ai eu l’idée d’ajouter la dimension de rayonnement des sources sonores sous forme d’harmoniques sphériques est venue d’une part, de l’utilisation croissante du format ambisonique, et d’autre part, des représentations visuelles des lobes de directivité d’instruments de musique en harmoniques sphériques fréquemment utilisées dans la littérature. Après quelques recherches bibliographiques, j’ai pu constater que cette approche avait déjà quelques antécédents qui méritaient d’être développés, notamment à l’ordre 1 avec le O-Format, d’où le HOOF (High Order O-Format) a tiré son nom¹³.

Les méthodes (et scripts Python associés) présentées dans cette partie ont été mises en place dans le cadre de ce mémoire. Elles constituent des premiers cas d’usages fonctionnels et proposent des pistes à explorer, mais ne sont en aucun cas une vérité absolue et définitive sur l’utilisation du format HOOF.

6.1 Le O-Format

Le O-Format peut être vu comme le « B-Format de la directivité ». Il a été introduit par Dylan Men- zies en 1999 dans sa thèse « New Electronic Performance Instruments For Electroacoustic Music » [24]. Il s’agit d’une méthode alternative aux « SoundCones« ¹⁴ pour manipuler des directivités de sources virtuelles de manière compacte. Dans un article datant de 2002 [25], Menzies détaille quelques aspects du O-Format, en décrivant des outils à mettre en œuvre pour ce format qui n’a jusqu’ici pas suscité un grand intérêt.

L’encodage vers le O-Format peut être fait à partir d’un enregistrement, ou par synthèse à partir de filtres. Menzies évoque déjà la possibilité créative de travailler avec des réponses impulsionnelles d’objets sonores stockées directement sous forme d’harmoniques sphériques : c’est ce qu’il appelle les « modèles de résonance ». Il évoque même la possibilité d’utiliser un enregistrement en B-Format de manière détournée, pour décrire des sources sonores directives.

Le rendu (l’écoute) d’une source encodée en O-Format se fait en sommant les contributions des différentes harmoniques sphériques (W,X,Y,Z) dans la direction « source-récepteur ». Une astuce est également proposée par Menzies pour ajouter une largeur à la source à l’aide du paramètre de « domi- nance » utilisé en ambisonique.

Menzies est conscient des limites du O-Format pour décrire des sources très directives (par rapport aux « SoundCones » par exemple), et note même la possibilité de monter en ordre afin d’augmenter la résolution de la description, mais « les coûts [de calcul] seraient trop élevés en comparaison aux gains apportés, de même que pour l’ambisonique d’ordre supérieur » (HOA).

Puisque le O-Format est le « B-Format de la directivité« , le HOOF peut être considéré comme le « HOA de la directivité« .

6.2 Avantages de l’approche en harmoniques sphériques

Si le O-Format n’a pas connu de grand succès en son temps, différentes raisons portent à croire que le contexte actuel puisse y être plus favorable.

La limite du coût de calcul évoquée par Dylan Menzies n’est plus d’actualité. De plus, l’architecture des stations de travail a évolué avec l’intégration de bus « ambisoniques » pour la majorité d’entre elles (qui étaient limitées jusqu’ici aux systèmes multicanaux traditionnels : stéréo, 4.0, 5.1 et 7.1) et d’outils permettant la manipulation d’une scène sonore au format ambisonique. Des effets associés à la représentation sphérique sont également disponibles (effets de focus, compression/EQ par beam,…), et ouvrent la voie à de nouvelles expérimentations créatives.

Les différentes motivations quant à l’utilisation d’un format en harmoniques sphériques pour dé- crire des directivités de sources se résument en quelques points :
- Rétrocompatibilité à l’ordre 0 (source omnidirectionnelle).
- Format compact et homogène (≥ 4 canaux pour décrire l’ensemble du champ sonore sphérique)
- Adaptabilité/scalabilité de la résolution (l’ordre ambisonique) aux besoins et aux capacités.
- Agnostisme du format au système de captation et de restitution.
- Démocratisation du formalisme ambisonique chez les ingénieurs du son qui n’existait pas lors des prémices du O-Format, et stations de travail compatibles (bus ambisoniques).
- Maléabilité du format pour l’application d’effets, multitude d’outils préexistants pour le HOA réutilisables (plugins ambisoniques, voir partie 8.1).
- Possibilités éventuelles de compression en utilisant des algorithmes développés pour le HOA¹⁵.
- Antécédents scientifiques à la représentation harmonique sphérique des figures de directivité.
Dans cette partie, nous allons détailler les trois grandes étapes de l’utilisation du HOOF dans une production audio « spatialisée ».

La captation, est l’étape par laquelle la matière sonore va être captée par des microphones sous forme de signal audio, la post-production est celle au cours de laquelle la matière captée va être transformée, puis mixée, et enfin l’étape de rendu consiste en la restitution du résultat sonore sur un système de haut-parleurs ou au casque.

La figure suivante illustre ces trois grandes étapes, en proposant un parallèle entre le HOOF et le HOA, pour repérer les similitudes et les différences entre ces deux formats.
7. Captation HOOF

Comme on peut le voir sur le schéma précédent (Fig. 16), le format HOOF peut être obtenu de deux manières différentes : par la captation multi-microphonique d’une source directive ou par synthèse à partir d’une source monophonique.

Les deux approches présentent chacune leurs avantages et inconvénients : la captation multi-micro phonique permet d’accéder à la directivité « réelle » de la source, de manière dynamique, mais nécessite un nombre plus important de microphones, alors que la synthèse consiste à appliquer une directivité ar- bitraire déterminée par l’ingénieur du son, mais ne requiert qu’un seul microphone lors de la captation.

En pratique, si l’on souhaite créer une scène sonore à 6 degrés de liberté faisant intervenir des sources directives, deux scénarios de prise de son sont possibles :

Chacune des sources est enregistrée par un système multi-microphonique, en re-recording¹⁶, éventuellement en conditions anéchoïques, puis mixée au sein d’une scène sonore.

Les sources sont enregistrées simultanément par des microphones d’appoint placés en proximité, et un masque de directivité est appliqué à chacune d’elle. Des capteurs de mouvements peuvent alors être utilisés pour restituer le mouvement des instruments dans la scène finale.

7.1 Enregistrement multi-microphoniques

Dans le cas du scénario 1, il faudra encoder en HOOF les différentes sources sonores, chacune enregistrée avec un système multi-microphonique. Pour cela, il sera nécessaire de trouver une matrice d’encodage permettant de passer du domaine discret des microphones au domaine HOOF.

Nous l’avons vu dans la partie I.2.4, différentes configurations de microphones sont envisageables pour la captation du rayonnement d’une source sonore. Un parallèle peut être fait entre le décodage HOA sur un ensemble de haut-parleurs, et l’encodage HOOF d’une configuration de microphones, pour laquelle il faudra calculer une matrice d’encodage spécifique. La résolution de la description dépend du nombre de microphones utilisés pour l’échantillonnage de la sphère (ou du cercle en 2D).

Le format HOA, via un processus de « panning-ambisonique »/décodage, peut être considéré comme une loi de panning entre les haut-parleurs. Le passage par le format HOOF à partir d’un enregistrement multi-microphonique fournit quant à lui une loi d’interpolation¹⁷ entre les microphones afin de passer d’une description discrète à une description continue du rayonnement de la source¹⁸.

La figure suivante illustre la « loi d’interpolation » du format HOOF, après encodage d’une configuration régulière de 8 microphones. Le script Python « Interpolation_HOOF_o123.py » utilisé pour générer ces figures est disponible en Annexe.

Figure 17 – L’interpolation inter-microphones en HOOF à l’ordre 1, sur deux types de rayonnements

Nous allons maintenant aborder le calcul des matrices d’encodages, permettant de passer d’un format de microphones discrets au format HOOF.

Encodage d’une configuration 2D, à l’ordre 1

On souhaite décrire une source rayonnante comme une combinaison linéaire d’harmoniques sphériques. Connaissant les signaux captés par les microphones (S_Mic) entourant la source, on cherche les signaux correspondant aux composantes (S_W , S_X, S_Y ), tels que :

Y étant la matrice décrivant les contributions des harmoniques sphériques dans les directions des microphones, données par l’équation (1) en première partie. Pour une configuration de n microphones placés sur un plan aux angles

on aura donc :

Afin de limiter la perte d’information lors de la captation de la figure de directivité de la source, il faut que le nombre de microphones (n) soit au moins égal au nombre de composantes harmoniques sphériques. C’est-à-dire, à l’ordre N, il faut que n ≥ (2N + 1) en 2D.

Il faudra donc : n ≥3 microphones à l’ordre 1, n ≥5 microphones à l’ordre 2, n ≥7 microphones à l’ordre 3, n ≥9 microphones à l’ordre 4, etc… Afin de passer des signaux microphoniques à la base des harmoniques sphériques, on cherche une matrice Y ^—¹ telle que :

La base des harmoniques sphériques, décrite par Y, présente une propriété d’orthogonalité, les colonnes des Y sont donc linéairement indépendantes. On peut utiliser la méthode de la « pseudo-inverse » afin d’approcher Y ^—¹ par une pseudo-inverse à gauche de Y :

Pinv(Y ) = (Y ^T .Y )^—¹.Y ^T

La matrice obtenue, spécifique à la configuration des microphones, permet de passer des signaux des microphones au domaine des harmoniques sphériques. Concrètement, on peut l’utiliser pour convertir un enregistrement multi-microphonique en source HOOF 2D.

Généralisation de l’encodage en 3D, à l’ordre N

On souhaite généraliser au cas d’une source rayonnante au centre d’une sphère de n microphones (S_Mic) entourant la source. À l’ordre N, on cherche les signaux correspondant aux (N+1)² composantes harmoniques sphériques, tels que :

Y étant la matrice décrivant les contributions des harmoniques sphériques dans une direction

donnée. Pour une configuration de n microphones placés aux angle

on aura donc :

En 3D, le nombre de microphones doit vérifier : n ≥ (N + 1)². Il faudra donc : n ≥4 microphones à l’ordre 1, n ≥9 microphones à l’ordre 2, n ≥16 microphones à l’ordre 3, n ≥25 microphones à l’ordre 4, etc…

On cherche à calculer la matrice permettant de passer des signaux microphoniques à la base des harmoniques sphériques, on cherche une matrice Y ^—¹ :

On peut également utiliser la méthode de la pseudo-inverse, de même qu’en 2D, qui nous permettra d’encoder une certaine configuration de microphones dans le domaine des harmoniques sphériques.

Grâce à ces matrices d’encodage, il est donc possible de produire des sources HOOF à partir de sources directives enregistrées.

Le script « EncodageHOOF_o123_3D.py » présenté en Annexe permet de générer une matrice d’encodage à l’ordre 1, 2 ou 3, à partir d’une configuration de microphones, et d’encoder les signaux dans le format HOOF 3D.

La figure suivante (Fig. 18) montre l’influence de l’ordre HOOF pour l’encodage d’une figure de directivité captée par 8 microphones sur un plan 2D. On remarque que plus l’ordre est élevé, plus la figure d’interpolation HOOF s’ajuste à la figure de directivité « captée ».

Figure 18 – Influence de l’ordre sur l’interpolation HOOF.

Considérations pratiques

Comme nous l’avons évoqué, un nombre minimum de microphones est requis afin d’encoder une source à un ordre HOOF donné (comme dans le cas des capsules nécessaires à la conception d’un microphone HOA). Trois cas sont envisageables :

Si ce nombre n’est pas atteint, le champ environnant la source sera « sous-échantillonné », et le problème « sous-déterminé », ce qui conduira à des coefficients HOOF incohérents.

Lorsque le nombre de microphones est égal au nombre de composantes HOOF, l’échantillonnage est dit « critique » : la solution au problème sera exacte pour cette position de microphones mais ne sera pas robuste à la rotation par exemple, comme on peut l’observer sur la figure 19.

Lorsque le nombre de microphones est supérieur au nombre de composantes HOOF, la source est « sur-échantillonnée », le problème est alors « sur-déterminé », c’est-à-dire qu’il n’y a pas de solution exacte, mais l’approximation du champ est potentiellement meilleure en augmentant le nombre de microphones.

Il est donc nécessaire d’adapter le système à la source à capter. C’est là que l’écoute et la connaissance du rayonnement des instruments de musique peut se révéler utiles. En effet, pour capter certains instruments comme les petites percussions (shakers, triangle, claves…) au rayonnement omnidirectionnel, il est démesuré d’utiliser un système de 64 microphones. Mais pour des instruments à cordes par exemple, dont la table d’harmonie génère un rayonnement plus complexe, il peut être utile d’augmenter au maximum le nombre de capteurs, afin d’approcher au mieux la réalité.

Les limitations pratiques du nombre de microphones disponibles, de voies de pré-amplificateurs, convertisseurs, d’espace disponible, temps de montage du système, etc… rentrent également dans l’équation. Suivant l’application et le débit disponible, il sera donc parfois plus intéressant de se restreindre à la version 2D du HOOF, moins gourmande et parfaitement valide sur le plan horizontal.

Figure 19 – Influence de la rotation des microphones sur l’encodage d’une source HOOF arbitraire à l’ordre 1, à échantillonnage quasi-critique.

Comme on le voit sur la figure ci-dessus (fig.19), la sous-estimation du nombre de microphones nécessaires à la captation peut conduire à des résultats incohérents. Pour cette source dont la fonction de directivité présente des variations à une fréquence spatiale élevée (fréquence angulaire de 22,5°), un échantillonnage tous les 90° ne sera pas suffisant, ou du moins pas robuste à une rotation du système.

Les options possibles sont donc d’augmenter le nombre de microphones, ou de répartir les microphones à des points « stratégiques » du rayonnement de la source. C’est-à-dire aux endroits présentant les variations les plus extrêmes : les creux et les pics de la figure de directivité.

7.2 Synthèse par masque de directivité

Dans le cas du scénario 2, le son de chacune des sources est capté par un microphone en proximité. Afin de créer une directivité propre à chaque source, deux méthodes sont envisageables : il s’agit soit d’appliquer un « masque de directivité » issu de mesures à la source, soit de « sculpter » sa directivité à l’aide de filtres manuels, c’est ce qu’on pourrait appeler une « égalisation spatiale« .

Synthèse par masque

Le concept de « masque de directivité » est assez direct : il s’agit d’appliquer un masque à un signal monophonique, afin de lui attribuer la directivité d’une source réelle.

Concrètement, il s’agit d’appliquer à la source un ensemble de filtres¹⁹, pondérant chaque composante harmonique sphérique pour coller à la directivité de la source initiale. Ce type de modèle SIMO (« Single Input Multiple Output) a été décrit par Franz Zotter dans sa thèse[40], et pourrait être résumé dans le domaine temporel par la formule suivante :

e(t)* Mask = s(t)

Avec e(t) le signal d’entrée monophonique, Mask le masque de directivité (vecteur de filtres : linéaire et invariant dans le temps), et s(t) les n composantes HOOF en sortie.

Nous utiliserons ici des filtres de type FIRs²⁰, mais il est également possible d’envisager une implémentation à l’aide de filtres paramétriques.

Comme on le voit sur la figure ci-dessous, pour générer un masque de directivité à partir d’une source réelle captée au sein d’un ensemble de microphones, deux cas peuvent se présenter :

a) On a accès à l’enregistrement acoustique d’un signal quelconque émis par une source sonore (voix par exemple), capté dans une direction d₀ donnée. Le masque à appliquer sera relatif à cette direction.

b) On a accès à un signal sweep, émis par une source placée au centre du système multi-microphoniques.

Cas n° 1 : Signal quelconque et calcul du masque masque relatif

Dans ce premier cas, nous avons accès à un signal quelconque en sortie de la source sonore, dans une direction de référence (S_ref ) et dans les directions des différents microphones. Il s’agit alors de déterminer un masque que l’on pourrait qualifier de « relatif » car il est lié à une direction de captation particulière²¹.

Comme on peut le voir sur le schéma ci-dessous (Fig. 20), la génération du masque à partir d’un signal quelconque multi-microphonique peut être réalisée en 3 étapes :

Analyses spectrales et extraction de l’enveloppe spectrale : le signal capté par les différents microphones est analysé par transformée de Fourier.

Nous l’avons évoqué en partie I.3.2 : chaque source sonore possède son timbre propre et n’excite pas toutes les fréquences. Il est donc nécessaire d’extraire l’enveloppe spectrale de la source, afin de constituer un masque à partir des informations pertinentes.

Diverses méthodes sont envisageables pour cela, comme l’extraction de pics utilisée par Martin Pollow dans [34]. Nous effectuerons quant à nous cette opération de lissage du spectre par simple moyennage grâce à une fenêtre glissante.

Figure 20 – Captation multi-microphonique : source et masque HOOF

B. Détermination du spectre différentiel : les différences spectrales entre les différents microphones et la référence renseignent sur la directivité de l’instrument dans ces directions de l’espace. Le masque de directivité que l’on souhaite obtenir est la compensation à appliquer aux différentes fréquences afin d’obtenir les différentes directions à partir d’un microphone de référence. On divise les enveloppes spectrales pour obtenir le masque de passage S_ref vers S_n (signal microphone n). Le lissage (ou extraction de l’enveloppe spectrale) effectué précédemment permet notamment d’éli- miner les risques de divergence liés à cette opération.

C. Transformée de Fourier inverse : les opérations précédentes ayant été effectuées dans le do- maine fréquentiel, il est nécessaire de repasser dans le domaine temporel à l’aide de la transformée de Fourier inverse.

Ce passage nécessite néanmoins quelques opérations préalables, comme la symétrisation et la du- plication du spectre en miroir, afin d’obtenir un filtre réel à phase linéaire.

Le script « FilterDesign_o123_2D.py », disponible en Annexe permet d’effectuer cette génération de masque à partir d’un signal multi-microphonique quelconque en renseignant la position des différents microphones sur le plan horizontal. Les masques générés à partir des signaux de voix, violon et ukulele sont également visualisables en Annexe.

Cas n° 2 : Détermination du masque à partir d’un signal sweep

Dans le cas où un sweep a pu être enregistré au moment de la captation, la génération du masque de directivité nécessite moins d’étapes.

Comme on peut le voir sur la figure 20, le signal sweep est capté par le système, puis déconvolué et encodé en HOOF, afin d’obtenir les réponses impulsionnelles à appliquer aux différentes harmoniques sphériques. Ce masque contient la fonction de transfert de la source elle-même et de sa directivité.

Il est possible d’accéder au « masque absolu » de certains instruments comme la trompette ou le trombone en envoyant un sweep par l’embouchure, ou en excitant le chevalet d’un instrument à cordes, mais cela peut s’avérer plus compliqué pour d’autres types de sources comme la voix, ou des instru- ments à percussion par exemple.

Une autre manière de créer une source HOOF serait donc d’appliquer « manuellement » certains gains ou filtres à une source monophonique, suivant les directions de l’espace, afin de la modeler selon la directivité souhaitée. Cela permet d’éviter l’écueil d’une source ne pouvant pas être mesurée, et pourrait également servir à créer des sources qui n’existent pas dans la réalité (directives dans les graves et omnidirectionnelles dans les aigus par exemple).

Synthèse par égalisation spatiale

J’aimerais proposer l’expression « égalisation spatiale » pour désigner le fait d’appliquer un filtrage fréquentiel dépendant des directions de l’espace. Il est possible de créer une source directive en utilisant ce type de filtrage.

Mon état des lieux m’a permis de dégager 2 principaux types d’égalisation spatiale au format HOOF : l’approche par « beamforming » et l’approche « discrète ».

Beamforming : Le plugin « DirectivityShaper » de l’IEM-suite (voir Fig.22), propose déjà une ap- proche d’égalisation spatiale par « beamforming « ²². L’utilisateur se voit proposer quatre beams, dont il peut régler la directivité (en faisant varier l’ordre de 0 à 7), la direction, et la pondération utilisée²³ (« Basic », « MaxRe » ou « InPhase »). Pour chacun des beams créés, un filtre paramétrique est appliqué (passe-bas, passe-bande ou passe-haut) : il en résulte une source directive au format HOOF pouvant monter à l’ordre 7.

Approche discrète : Un autre type d’interface pourrait être imaginée avec une approche plu- tôt « discrète » de l’égalisation spatiale. Il s’agirait de laisser à l’utilisateur un certain nombre de points à manipuler, échantillonnés sur la sphère (nombre plus ou moins important de points sui- vant l’ordre HOOF en sortie), pour créer des figures de directivité personnalisables pour chaque bande de fréquence²⁴, après interpolation entre les points. La question du nombre de bandes et celle du type de filtrage restent ouvertes.

Considérations pratiques

La question de l’ergonomie de ce type d’outil mériterait un travail plus approfondi, quant à la visualisation et la manipulation de la source 2D/3D, le type de filtres à utiliser, etc… afin de le rendre réellement exploitable en situation de production.

On peut d’ores et déjà remarquer un parallèle entre la synthèse HOOF et les modules de réverbérations numériques, qui peuvent être soit « à convolution » (issus de mesures acoustiques) soit « algo- rithmiques » (et paramétrables). Ces deux approches ne s’opposent pas et peuvent même parfois être combinées (cf les réverbérations hybrides). Le choix est laissé à l’ingénieur du son d’utiliser l’une ou l’autre selon ses goûts, ses envies, et le projet sur lequel il travaille.

En situation de production HOOF, l’ingénieur du son aurait donc le choix entre la captation multi-microphonique ou l’utilisation d’un plugin (à 1 entrée et N sorties) pour synthétiser chacune de ses sources directives.

On pourrait décrire l’outil de synthèse par masque comme une « Altiverb de la directivité »²⁵. On peut imaginer y trouver l’ensemble des instruments de l’orchestre, mais également différents masques de voix, de transducteurs de la vie quotidienne (radios, téléphones…), et pourquoi pas des animaux. Tout ce qui serait utile dans le cadre de la post-production de contenus 6 DoFs devrait s’y trouver. Il serait également souhaitable de pouvoir importer des masques issus d’autres formats (voir Annexe), pour lesquels des données ont déjà été captées et traitées, après conversion en HOOF.

Pour l’outil de synthèse par égalisation spatiale, une banque de « presets » basée sur des mesures pourrait également être fournie. Cela permettrait à l’ingénieur du son d’aller plus rapidement en choisissant un modèle de base, et en l’affinant à l’aide des différents contrôles, puis en le sauvegardant éventuellement pour un usage ultérieur.

7.3 Illustration : le violon Stroh

Pour clore cette section sur la création de sources HOOF, j’aimerais évoquer un exemple atypique d’instrument de musique, qui pose question et pourrait faire l’objet d’un rendu intéressant au format HOOF.

Parmi les instruments à cordes, le violon Stroh²⁶ (du nom de son inventeur) fait figure d’original. Parfois appelé «violon à pavillon» ou «violon trompette», cet instrument se distingue des autres ins- truments à cordes par son mode de rayonnement, qui se fait au travers d’un pavillon. Dans le cadre de la synthèse de directivité, la question du masque à appliquer à cet instrument pose donc question : celui d’un violon ou celui d’un instrument à pavillon ?

Figure 21 – Le violon Stroh, ou « violon à pavillon »

L’origine controversée du violon Stroh ne sera pas discutée ici, mais il est à noter que son invention a été déposée en 1899, époque des débuts de l’enregistrement, et s’inscrit dans la lignée du phonographe. Les premiers systèmes de prise de son, dits « acoustiques », possédaient un pavillon, vers lequel la source sonore devait être dirigée et projeter un maximum de son énergie afin d’augmenter le rapport signal/bruit.

Le violon Stroh, dont la directivité et la puissance se rapprochent plus de celles d’une trompette que d’un violon traditionnel, était donc un candidat particulièrement adapté à ces contraintes de prise de son.

Dans l’idéal, il serait intéressant de pouvoir mesurer la directivité du violon Stroh afin de lui appliquer son propre masque. Mais faute de moyens ou face à un instrument nouveau, l’ingénieur du son doit trouver des solutions. La synthèse de sources directives en est une. L’écoute doit évidemment guider son choix, mais les expérimentations créatives sont également permises par les masques de directivité. On pourrait tout à fait appliquer un masque de trompette à un violon, un masque de flûte à une guitare ou encore un masque de haut-parleur à une voix.

8. Post-production HOOF

8.1 Manipulations et visualisation de la source HOOF

Comme nous l’avons signalé en introduction de cette partie, les outils développés pour l’ambisonique peuvent tout à fait être utilisés dans le cadre du HOOF. Ces outils permettent d’effectuer des manipulations du champ sonore dans le domaine des harmoniques sphériques, c’est-à-dire indépendamment du système de captation et de restitution. Mais ils présentent également l’intérêt (souvent par l’intermédiaire d’un beamforming) de pouvoir travailler sur une partie isolée du champ, et ainsi de pouvoir véritablement « façonner » l’espace sonore (HOA) ou le rayonnement de la source (HOOF). La précision de cette zone de l’espace sera d’autant plus grande que l’ordre sera élevé.

Certaines manipulations sont assez spécifiques aux harmoniques sphériques comme la rotation et l’effet de focus, d’autres sont des outils « traditionnels » de l’ingénieur du son comme la compression dynamique ou le filtrage/EQ qui ont été adaptés au paradigme ambisonique. Les outils ambisoniques de visualisation du champ sonore peuvent être appliqués au champ rayonné par une source HOOF. La suite de plugins de l’IEM²⁷ présentée en figure 22 offre un panel de quelques effets ambisoniques disponibles actuellement, et utiles dans le cadre du HOOF. Ces plugins fonctionnent jusqu’à l’ordre 7 :

a) « OmniCompressor » : compression contrôlée par le signal du canal W (omni), et appliquée à l’ensemble des canaux.

b) « DirectionalCompressor » : compression contrôlée par une partie du champ sonore (à travers un beamforming), et appliqué à une partie du champ définie par l’utilisateur.

c) « EnergyVisualiser » : visualisation de la répartition de l’énergie sur la sphère, projetée en 2D. »ProbeDecoder » : projection en ondes planes dans une direction de l’espace (Voir partie 9.1). »RoomEncoder » : réverbération algorithmique MIMO (Voir partie 8.2).

d) « DirectivityShaper » : filtrage spatial d’une source monophonique (par beamforming) sur 4 bandes de fréquence afin de créer une source directive (Voir partie 7.2).

En termes d’implémentation et de coût de calcul, le format ambisonique est très économique. En effet, de simples combinaisons linéaires entre les différentes composantes permettent déjà d’effectuer des transformations intéressantes.

8.2 La réverbération

La réverbération artificielle est l’un des outils principaux du mixeur pour la création d’un espace acoustique. Les deux types de réverbérations artificielles existants sont la réverbération « à convolution« , utilisant des réponses impulsionnelles issues de mesures acoustiques, et la réverbération « algorithmique« , utilisant des modèles physiques ou des réseaux de retards pour simuler artificiellement des réflexions acoustiques.

Figure 22 – Six plugins de la suite IEM

Jusqu’à présent, l’envoi des sources sonores dans la réverbération ne prend pas en compte les caractéristiques de rayonnement des sources dans l’espace acoustique. L’utilisation du format HOOF et de réverbérations dédiées pourrait permettre cet ajout, et ainsi d’approcher un peu plus les conditions acoustiques « réelles ». Les deux approches « traditionnelles » de réverbération sont également envisa- geables pour la directivité.

Dans le cas de la réverbération HOOF, il faut noter une différence de nature entre les signaux d’entrée et de sortie, comme on peut le voir sur la figure de synthèse HOA-HOOF (Fig. 16). En effet, contrairement aux réverbérations HOA qui sont appliquées directement sur les composantes ambisoniques, la réverbération HOOF prendra en entrée des sources directives (HOOF) et restituera un effet de salle tel qu’il serait perçu par un auditeur, encodé en un point de l’espace (HOA).

La réverbération à convolution

Ce type de réverbération basée sur des réponses impulsionnelles de salles (RIRs pour « Room Im- pulse Response« ) est déjà utilisée dans le domaine de l’acoustique architecturale depuis de nombreuses années. Elle a évolué récemment afin de prendre en compte les informations de directivité de la source et du récepteur[11], sous la forme de systèmes MIMO (« Multiple Inputs Multiple Outputs« )[27]. Il s’agit d’effectuer des réponses impulsionnelles à l’aide de sphères compactes de haut-parleurs (source) et de microphones HOA (récepteur), comme le montre la figure 23 ci-dessous.

Ainsi, il serait possible de convoluer n’importe quel signal encodé en harmoniques sphériques par cet ensemble de filtres contenant les caractéristiques spatiales et temporelles de la réverbération.

Figure 23 – Schéma du système MIMO

La réverbération MIMO sous forme de plugin n’est finalement qu’une extension (en termes d’implémentation) des réverbérations à convolution mono et stéréo pré-existantes. Il serait donc possible de la mettre en œuvre rapidement dans un cadre de post-production.

Cependant, la limite de ce type d’approche est que la réponse impulsionnelle spatiale comprend le son direct, une source convoluée se verra donc attribuer une position dans l’espace (celle de la source au moment de la mesure). La configuration de mixage couramment utilisée de type « bus de réverbération », dans lequel toutes les sources sont envoyées et mélangées, n’est donc pas possible en l’état. Il faut avoir une réverbération propre à chaque source. Une autre limite à prendre en compte est celle du coût de calcul, proportionnel pour chaque source à la longueur de la réponse impulsionnelle et au nombre de canaux convolués.

Il est également envisageable, pour tenter d’approcher encore plus la réalité, de mesurer des réponses impulsionnelles MIMO aux positions des différentes sources dans la salle. Cela permet d’accéder au comportement acoustique « réel » de la salle dans ces configurations source-récepteur précises. Dans ce cas, on souhaitera conserver le son direct, le système MIMO jouera alors à la fois le rôle de réverbéra- tion et d’encodeur HOA (tout comme le plugin « Room Encoder » de l’IEM).

La réverbération algorithmique

On appelle « algorithmique » toute technique de réverbération basée sur des réseaux de retard (FDN²⁸) ou des lancers de rayons acoustiques.

Le « lancer de rayon » (« ray-tracing « ) est une solution permettant d’appliquer une réverbération en prenant en compte la directivité de la source. Il s’agit d’une technique couramment utilisée dans les logiciels de simulations acoustiques, pour simuler les caractéristiques acoustiques d’une salle avant même sa construction. Cela consiste à projeter un certain nombre de « rayons acoustiques » partant de la source jusqu’au récepteur, avec un certain nombre de réflexions sur les murs. La directivité de la source peut donc y être prise en compte, moyennant simplement un filtrage des rayons selon la direction de projection.

Un outil utilisant cette technique a déjà été implémenté dans un plugin de la suite IEM : le « Room Encoder » (voir Fig.22 (5)). Celui-ci permet de placer une source directive et un récepteur (jusqu’à l’ordre 7) dans un espace de type « boîte à chaussure », et de faire varier les paramètres de la réverbération. Cependant, le modèle utilisé et la limite du nombre de réflexions ne permet pas d’avoir un résultat sonore très convaincant.

Le framework EVERTims (Voir Annexe 3.3), permettant l’importation de modèles de directivités en harmoniques sphériques, utilise également cette technique de « lancer de rayons » pour simuler une réverbération à partir de géométries particulières de salles.

Il faut également noter que le coût de calcul peut être important par cette technique, surtout en temps réel, suivant le nombre de rayons et de réflexions considérées.

Concernant les réverbérations à « réseau de retard », il en existe pour des formats plus « traditionnels » (stéréo, 5.1 et plus récemment HOA), mais une implémentation prenant en compte les aspects de directivité du HOOF nécessiterait une étude plus approfondie.

Considérations pratique

Une dernière solution, plus raisonnable en termes de coût de calcul, serait d’ajouter la réverbération après décodage des sources HOOF. Par exemple une réverbération ambisonique dans le cas d’une resti- tution via un format HOA, ou une réverbération 5.0 ou quad si les sources HOOF sont ensuite mixées au format 5.1. Le son direct serait alors fonction de la directivité de la source, et la réverbération serait appliquée directement à celui-ci. Dans ce cas de figure, il est possible d’utiliser les réverbérations à « réseau de retard » (type Lexicon, Bricasti, TC Electronics) pré-existantes, suivant le format de sortie.

Il est de plus en plus question dans le cadre des nouveaux formats « objets » ou « hybrides »²⁹ de laisser le décodeur prendre en charge la gestion de la réverbération. Celui-ci se placerait donc en bout de chaîne, contrôlé par des métadonnées indiquées par l’ingénieur du son lors du mixage, et s’adaptera en fonction du dispositif de restitution (décodage sur haut-parleurs ou binaural).

8.3 Illustration : l’effet Leslie en HOOF

La cabine Leslie, inventée dans les années 1930 par Donald Leslie, est un système d’amplification et de diffusion sonore. Elle est dotée de deux diffuseurs rotatifs : un pour les aigus (la trompette) et un pour les graves (le tambour). Ce dispositif met à profit la directivité des diffuseurs pour créer de manière acoustique un effet unique, proche du vibrato³⁰. La figure 24(a) propose un schéma de fonc- tionnement de la cabine Leslie. Dans le cadre d’une prise de son stéréo (deux micros à 90° en général pour les aigus), la Leslie apporte également un effet de spatialisation et d’enveloppement naturel.

La cabine Leslie fut créée à l’origine pour s’associer avec les orgues électroniques, et plus particulièrement l’orgue Hammond, et offrir au son un effet acoustique plus convaincant que les vibratos utilisés à l’époque. Elle fut ensuite associé à d’autres instruments, au cours d’expérimentations créatives en studio, comme à la guitare de Georges Harrisson (dans « Lucy in the Sky with Diammonds« ³¹), ou à la voix de John Lennon (dans « Tomorow Never Knows« ³²), mais aussi à la basse ou même à l’accordéon, comme le montre cette publicité des années 70 (figure 24(b)).

La vitesse de rotation des diffuseurs possède deux modes, un lent et un rapide, chacun créant un effet différent. Dans les aigus, le mode rapide laisse même entendre une variation fréquentielle, due à l’effet Doppler. Les phases d’accélération et de décélération sont également utilisées pour l’effet de désynchronisation qu’elles procurent entre les graves et les aigus.

Des émulations logicielles de l’effet Leslie existent, simulant cet effet basé en premier lieu sur des phénomènes acoustiques liés au comportement directionnel des diffuseurs. Cet outil peut désormais faire partie de la boîte à outils du mixeur.

Nous allons voir que le format HOOF peut être utilisé pour simuler cet effet. De la manière la plus simple, il s’agirait d’appliquer à un son le masque HOOF d’un haut-parleur, puis de lui appliquer une rotation à une certaine vitesse et d’écouter le résultat.

La figure 24(c) propose une implémentation permettant de contrôler de manière indépendante les vitesses de rotation de la trompette et du tambour, par un filtrage de type « cross-over » des hautes et basses fréquences.

Une possibilité serait de mesurer la directivité d’une véritable cabine Leslie, afin d’appliquer directement les masques « trompette » et « tambour » au modèle.

Figure 24 – L’effet Leslie

9. Rendu HOOF

Comme on peut le voir sur la figure 16, il existe deux manières de restituer une source HOOF : la diffusion sur une sphère compacte de haut-parleurs ou l’intégration de la source à une scène sonore virtuelle.

Le cas du décodage sur haut-parleurs nécessiterait un développement approfondi, et ne sera donc pas abordé ici. De nombreux articles se trouvent dans la littérature, auxquels le lecteur curieux pourra se référer afin d’approfondir le sujet.

Nous détaillerons ici la seconde option, mettant en œuvre une projection en ondes planes source HOOF, dans une direction de l’espace.

9.1 Décodage « basique » en ondes planes

Afin d’écouter un signal qui a été encodé dans le domaine des harmoniques sphériques, il s’agit de projeter celui-ci dans une direction de l’espace correspondant à celle de l’auditeur. C’est-à-dire sommer les contributions des différentes harmoniques sphériques dans cette direction : c’est ce qu’on peut qualifier de décodage « basique ». Le son direct ainsi obtenu pourra ensuite être spatialisé dans un système de restitution.

Soit

l’angle relatif entre l’axe de la source et l’auditeur et (S_W , S_X, S_Y ) les composantes de la source encodées en harmoniques sphériques. On obtient le signal décodé S_p par :

Le plugin « ProbeDecoder » de la suite de plugin IEM (Fig. 22 (4)) est parfaitement adapté à cette application, puisqu’il permet d’écouter une direction de projection en ondes planes du champ ambiso- nique.

Le signal monophonique issu de la projection pourra ensuite être spatialisé en binaural ou sur un système de haut-parleurs, selon l’application. Il pourra également servir de signal d’entrée pour un mixage HOA « classique ».

9.2 Décodage par « beamforming » (optimisations)

Nous l’avons déjà évoqué dans la partie 7.2, le « beamforming » consiste à appliquer une pondération particulière aux harmoniques sphériques. Dans le cas du décodage, ce principe est mis à profit afin de minimiser les contributions des lobes secondaires, ou pour affiner le lobe principal. L’un va au détriment de l’autre : c’est ce qu’on peut constater sur la figure ci-dessous (Fig. 25, tirée de la thèse de Jérôme Daniel.

Les différentes pondérations utilisées pour l’ambisonique (MaxRE, InPhase, . . . ) peuvent être ap- pliquées dans le cas du HOOF, proposant un résultat sonore différent du décodage « basique » en ondes planes.

Un patch Max/MSP (Fig.26) a été créé afin de comparer l’effet des différents types d’optimisations sur la directivité d’une source HOOF lors d’une restitution en binaural. Il permet d’effectuer des rotations et déplacements de la source, et d’écouter le résultat selon l’optimisation utilisée.

Une série d’écoutes, effectuée à différents ordres HOOF, a permis de déterminer que l’optimisation

«InPhase» semble la plus pertinente à appliquer, autant en terme de timbre perçu que d’efficacité de l’effet de directivité.

Ce patch constitue donc une sorte de synthèse de cette seconde partie, dans laquelle nous avons abordé les notions d’encodage, manipulations et décodage HOOF. Il intègre des objets du Spat³³ et de la librairie ambisonique « HOA library« ³⁴.

Figure 25 – Lobes de directivité associés aux différents décodages ambisoniques, ordres 1 à 4. Figures tirées de [8].

La restitution d’un « effet de champ proche », qui consisterait à élargir la source sonore lorsque l’auditeur s’en approche, reste à explorer. Il s’agirait d’augmenter le volume apparent de la source sonore, en utilisant par exemple plusieurs projections en ondes planes qui seraient réparties devant l’auditeur.

Finalement, l’une des applications que nous ne développerons pas ici est le rendu d’une source HOOF sur sphère multi-haut-parleurs. Cet aspect soulève en effet de nombreuses problématiques an- nexes (de l’ordre de la conception acoustique du système d’enceintes) et constituerait un sujet de recherche à part entière.

Cependant, ce type de dispositif électro-acoustique, associé au format en harmoniques sphériques, est d’ores et déjà utilisé à l’IEM de Graz à des fins acoustiques, mais également artistiques. Il a été adopté notamment par le compositeur Gerriet K. Sharma qui utilise les réflexions liées à la géométrie du lieu afin de créer des sources secondaires, et composer des œuvres immersives « in-situ ».

Même s’il reste pour l’instant très onéreux, ce nouveau système de diffusion « multicanal en un point » offre de nouveaux champs d’exploration extrêmement prometteurs.

Figure 26 – Patch Max/MSP permettant d’écouter une source HOOF via un panning binaural

10. Conclusion

Le travail de synthèse qui a été fait dans ce mémoire a permis une réelle mise à jour des travaux de Dylan Menzies sur le O-Format, en la généralisant aux ordres supérieurs. La formalisation d’une chaîne de production à l’usage des ingénieurs du son a été mise en œuvre, et différents éléments de vocabulaire associés à la production dans le format HOOF ont été proposés.

Comme on a pu le constater à la lumière de cette seconde partie, les outils de production HOOF sont quasiment tous déjà fonctionnels : sous forme de briques successives, à l’exemple de la suite IEM, ou adaptables depuis l’ambisonique notamment pour les effets (EQ, compresseurs, rotateurs …).

Cependant, plusieurs aspects théoriques évoqués dans ce travail de recherche mériteraient d’être approfondis : la question de la répartition et l’encodage des microphones, la réverbération HOOF, ou encore l’effet de champ proche. Aussi, la mise en place de tests perceptifs formels pourrait permettre de valider les méthodes utilisées, et d’évaluer l’influence des différents paramètres en jeu (nombre de microphones nécessaires à la captation, ordre HOOF optimal,…).

Même si certains points peuvent encore être approfondis, le format HOOF est déjà exploitable dans la pratique, mais la question de son adoption par les ingénieurs du son reste épineuse. Lors des débuts du format ambisonique, peu de personnes auraient prédit son essor. Pourtant, l’apparition des vidéos 360° a permis le développement des nombreux outils de production dont nous disposons aujourd’hui. La création d’une suite de plugins HOOF dédiés, plus ergonomique, pourrait sans doute encourager les ingénieurs du son à travailler avec des sources directives. Mais c’est sûrement dans les applications qu’il faut chercher, et dégager des motivations artistiques à l’utilisation du format HOOF.

En termes d’applications, le cas de la navigation dans des scènes virtuelles pourrait constituer à terme un nouveau type de média, pour lequel la notion de source directive prendrait tout son sens. C’est le cas de la partie pratique que j’ai menée afin d’illustrer cet écrit : « Runai on the moon ». L’objectif de ce projet, mené en collaboration avec le groupe Runai³⁵, a été de créer une expérience musicale mettant en œuvre le format HOOF dans une scène à 6 degrés de libertés.

Il s’agit d’une sorte de clip immersif, permettant à l’auditeur de naviguer autour des musiciens dans un univers virtuel. Ce nouveau type de média questionne sur la place de l’auditeur vis-à-vis de l’œuvre avec laquelle il peut interagir, les aspects de narration, mais également sur le travail de l’ingénieur du son quant à la qualité du rendu final et du mixage, dont il n’aura finalement entendu qu’un nombre limité de versions.

La capacité à s’adapter et à remettre en permanence en question ses pratiques me paraît indis- pensable, en tant qu’ingénieur du son. La recherche et les évolutions technologiques offrent sans cesse de nouveaux outils, permettant de nombreuses expérimentations créatives, il ne tient qu’à nous de les saisir afin de créer du neuf, de l’inédit.

Troisième partie

ANNEXE : Scripts Python et solutions logicielles existantes

1. Scripts Python pour le format HOOF

2. Solutions préexistantes, 1re partie : les in- terfaces

La question de la directivité a déjà été abordée par certains domaines, qui ont conçu des solutions adaptées à leur application. Il s’agit d’une part, des logiciels de simulation acoustique, utilisés notamment par les ingénieurs en acoustique architecturale, et d’autre part, des jeux vidéos dans lesquels le joueur se déplace au sein d’un univers sonore virtuel interactif.

Chacun de ces domaines possède ses motivations propres pour la description modélisée de scènes sonores. On peut les résumer par la formule : « Plausibility VS Accuracy » utilisée par J.M Jot dans [22]. En effet, l’objectif de l’acoustique architecturale est en effet d’approcher au mieux la réalité physique dans le cadre de simulations, avec le plus d’exactitude possible.

Les designers sonores de jeux vidéos quant à eux travaillent à créer des scènes sonores crédibles : qu’elles soient « réalistes » ou « imaginaires ». Ces derniers sont motivés par des raisons créatives et perceptives. Ils sont également contraints par des questions de coût de calcul et les limites du moteur de rendu.

2.1 Les logiciels de simulation acoustique

Basés sur des modèles physiques, les logiciels de simulation acoustique permettent de simuler la réponse d’une salle avant même sa conception, ou encore de simuler la disposition d’un système d’enceintes de sonorisation. Des sources virtuelles sont donc utilisées, et leur directivité généralement prise en compte car elle influe sur le résultat sonore perçu. Nous en citerons quelques-uns :

Odeon

Ce logiciel dédié aux simulations acoustiques architecturales [30] propose d’utiliser des sources « points » omnidirectionnelles (de synthèse ou enregistrées) mais également des modèles directifs. Les modèles préexistants peuvent être importés dans le logiciel via les formats CLF³⁶ ou .So8 (format propriétaire natif d’Odeon).

Un module d’édition est également proposé (Le « Source Directivity Editor « , Fig. 27(a)) pour créer ses propres directivités, avec la possibilité de les exporter au format.So8. Ce module propose une résolution fréquentielle par bande d’octave (de 63Hz à 8kHz) et angulaire sur une sphère échantillon- née de 10° en 10°. Lorsque des données ne sont pas renseignées, le logiciel effectue une interpolation « elliptique » des valeurs pour chaque bande de fréquence, afin de lisser les valeurs.

Il est également possible de partir d’un fichier CLF au format texte importé, dans lequel est indiqué en premier lieu le type de directivité (« POLAR », « FULL » ou « SYMETRIC »), puis les valeurs correspondantes pour chaque angle et bande d’octave. Le type « POLAR » indique que les données de directivité ont été mesurées sur deux plans (horizontal et vertical), le type « FULL » indique que les données ont été mesurées sur toute la sphère échantillonnée de 10° en 10°, et le type « SYMETRIC » indique que la source possède un axe de symétrie (pas d’option de symétrie plane) et les données sont donc renseignées seulement sur un arc de 180°.

Figure 27 – Les interfaces de manipulation des directivités de trois logiciels de simulation acoustique

Ease

Ease (pour « Enhanced Acoustic Simulator for Engineers« ) est également un logiciel de simulation acoustique. Il propose un module appelé « Speaker Lab » (voir Fig.27(b)), permettant de créer, manipuler et exporter des sources directives au format GLL (« Generic Loudspeaker Library« ). Ces sources pourront ensuite être exploitées dans les modules de simulation acoustique de EASE.

Ce format, particulièrement adapté aux haut-parleurs permet de travailler avec des résolutions angulaires allant jusqu’au degré, par bande d’octave.

Il prend en compte les informations de phase, issues de mesures ou de simulation de haut-parleurs, sous forme de réponse impulsionnelle. Cela présente l’avantage de pouvoir travailler avec des sources multi-points (les fameux « line arrays« ) et d’ajuster un système à l’aide de délais ou de filtres FIRs.

De nombreux constructeurs fournissent désormais les fichiers GLL de leurs modèles d’enceintes, permettant l’importation dans EASE et la manipulation dans le module « Speaker Lab ».

CATT

Le logiciel CATT-Acoustic, largement répandu dans les bureaux d’étude en acoustique, permet également de gérer les sources directives par le biais de son module « directivity ».

Cet outil, que l’on peut visualiser sur la figure 27(c), permet de créer et manipuler des fichiers aux formats SD0, SD1 suivant la précision recherchée. En effet, le SD0 permet un échantillonnage des plans vertical et horizontal tous les 15○alors que le SD1 permet d’échantillonner la sphère complète tous les 10°.

Une évolution plus récente est le SD2, qui est géré quant à lui par la « DLL Directivity Interface », et permet de décrire une source acoustique sous une forme dynamique (DLL). La résolution fréquentielle est désormais inférieure à la bande d’octave, la résolution angulaire peut être de l’ordre du degré (et peut être irrégulière, plus dense à certains endroits), mais surtout : il est possible de créer une dépendance des données de directivité à la distance et gérer ainsi les effets de « champ proche » et « champ lointain ».

La dernière version en date est le SD3, qui prend également en compte les données de phase, avec une résolution angulaire de 5°.

Il est également possible d’importer des fichiers .CLF (format que nous évoquerons dans la partie suivante, annexe 3) dans le logiciel CATT-Acoustic.

2.2 Les bibliothèques audio 3D

Dans les années 90, les puissances de calcul des ordinateurs ont permis d’envisager le rendu d’univers audio-visuels 3D interactifs. Un format de fichier a alors été normalisé pour la description hiérarchique de scènes 3D interactives : c’est le VRML (« Virtual Reality Markup Language« ) [18]. Ce type de des- cription a pour but de spécifier au moteur de rendu la position des différentes sources sonores mais également les effets à appliquer quant à la réponse de l’environnement acoustique.

Le X3D (Extended 3D) [19] succède au VRML en 2004, en y ajoutant quelques améliorations, notamment la description du rayonnement des sources sonores.

Les « SoundNodes » permettent de caractériser le comportement spatial des objets sonores. Le modèle de directivité choisi est une directivité « en gain ». Il consiste en une double ellipse définissant un champ proche de la source où le niveau est maximum, et un champ éloigné où le son n’est plus perçu. La zone de décroissance se situe donc entre les deux ellipses (voir Fig.28(a).

En 2005, la partie 11 de la norme MPEG-4³⁷ spécifie le format BIFS (« Binary Format for Scene« ). Également basé sur une description hiérarchique des scènes sonores (comme VRML), sa spécificité est l’ajout de la dimension temporelle basée sur des « timestamps« ³⁸, mais aussi d’une possible caractéri- sation fréquentielle de la directivité. Le « DirectiveSound node » permet de spécifier ces informations de directivité de source sous deux approches : « physique » ou « perceptive ».

L’approche physique consiste à définir le diagramme de directivité 2D de la source, en spécifiant les angles et les gains associés à chaque fréquence, par le biais d’un vecteur. Ces valeurs sont spécifiées sur un demi-cercle, le modèle considéré étant à symétrie axiale. On le voit, cette approche « à la mano » est laborieuse et inadéquate à toute notion de créativité.

L’approche « perceptive », quant à elle développée conjointement par les chercheurs de l’IRCAM et de France Télécom (cocorico !) propose des paramètres « simples and intuitifs » au créateur de contenu tels que : la « source presence« , « source warmth« , « source brilliance« , ainsi que la caractérisation d’une « OmniDirectivity » pour chaque objet de la scène sonore. Celle-ci permet de spécifier l’égalisation (fré- quentielle) à appliquer à la source pour l’envoi dans la réverbération.

Dans les mêmes années, Microsoft fournit aux développeurs une API³⁹ afin de programmer des logiciels (jeux vidéo par exemple) dont les rendus seront gérés par les différents périphériques hard- wares compatibles : c’est le DirectX.

Figure 28 – Description du rayonnement d’un objet sonore en X3D (a) et DirectSound3d (b)

DirectSound3D est une bibliothèque audio de l’API DirectX, qui permet de gérer les scènes so- nores en 3D. Celle-ci propose un modèle de rayonnement basé sur des cônes de directivité : un cône intérieur pour simuler l’axe de directivité d’une source, où le gain est maximal, et un cône extérieur où le gain est moindre. La figure 28(b) illustre ce modèle.

La libraire OpenAL⁴⁰, ayant l’avantage d’être multi-plateformes, fournit dans son API des outils du même type, pour manipuler des sources directives.

2.3 Les DAWs, renderers audio spatialisés

De même que pour le domaine de « l’acoustique virtuelle interactive » dont nous venons de parler, l’espace sonore rendu dans un mixage musical ou de cinéma n’a pas pour vocation de reproduire la réalité acoustique avec exactitude, mais d’en fournir une version crédible d’un point de vue esthétique et artistique.

Cependant, parallèlement aux langages de descriptions utilisés pour les jeux vidéo, rares sont les outils de spatialisations sonores disponibles pour les ingénieurs du son permettant de contrôler di- rectement les effets de directivité des sources sonores. En effet, les mixeurs (musique et cinéma) ont toujours trouvé des astuces pour régler ces questions en utilisant les effets à leur disposition (filtres, EQ, réverbération, etc…).

Un simple filtre passe-bas est souvent placé en amont de l’envoi dans la réverbération pour limiter le rayonnement des aigus, conformément à la réalité perceptive de la réverbération. Également, le rapport « son direct/son réverbéré » et les effets de distance sont gérés en ajustant directement le niveau des faders.

Toutefois, et du fait du rapprochement que nous avons évoqué entre le travail des designers sonores et celui des ingénieurs du son, certains outils sont apparus permettant un contrôle plus direct (et visuel) des effets de directivité des sources.

Voici les trois solutions dédiées actuellement disponibles :

Le Spatialisateur (Spat)

Créé à l’IRCAM en 1995, le « Spat » est un logiciel destiné à la simulation acoustique [29], com- prenant des modules de réverbération et de spatialisation sonore. Celui-ci peut être utilisé dans des contextes très différents comme les concerts live, le mixage audio spatialisé, la réalité virtuelle, les ins- tallations sonores interactives… À l’origine développé sous forme modulaire avec des objets Max/MSP, dont le nombre a augmenté avec les années [5], le Spat a ensuite été porté en plugins audios par la société Flux : : (« Ircam-tools » et plus récemment « Spat Revolution »).

La particularité du Spat est qu’il se trouve à l’intersection entre l’acoustique physique et les outils de productions sonores plus traditionnels à destination artistique. En effet, il est basé en grande partie sur des modèles physiques pour la réverbération et certaines méthodes de rendu (WFS et ambiso- niques notamment), mais ses applications sont majoritairement musicales et artistiques.

Un point fort du Spat est que son développement a donné lieu à un grand nombre d’études sur les as- pects perceptifs de la réverbération et des espaces acoustiques, qui ont ensuite été implémentés dans le logiciel. L’utilisateur a donc le choix dans l’interface, avec la possibilité d’utiliser des contrôles « percep- tifs » (« présence« , « chaleur « , « brillance« , « enveloppement« …)⁴¹ ou des contrôles issus de l’acoustique (« EDT « , « densité modale« , « cluster distribution« …).

Les aspects de directivité des sources sonores y ont été pris en compte, particulièrement dans leur rapport à la réverbération. La source sonore est en effet divisée en deux parties : axis faisant office de son direct, et omni, signal qui alimentera la réverbération. Comme on peut le voir sur la figure 29(a), chacune des parties comporte une égalisation propre, paramétrable en 3 bandes de fréquences. Chaque source se voit définir une « aperture« , angle d’ouverture pour le son direct, qui rappelle forte- ment « l’angle d’ouverture à n dB » (défini partie 4.1).

Facebook Spatial Workstation (FB360)

La plateforme Facebook s’intéresse depuis quelques années aux contenus « immersifs ». En 2016, elle rachète Two Big Ears, une société ayant développé des outils de mixage dans un format fortement inspiré de l’ambisonique. Ces outils sont depuis distribués gratuitement sous forme de plugins, pour permettre aux créateurs de contenus d’accompagner la vidéo d’un son 360○.

Ce n’est que récemment⁴², dans la version 3.2, qu’un module de directivité (« Directionality« ) a été

ajouté au plugin (voir Fig. 29). Celui-ci consiste en l’application d’un filtre de type « high shelf », dont la fréquence centrale est fixé à 2kHz et la pente varie suivant la direction par rapport à l’axe (voir Fig. 30).

Le paramètre « opening angle » permet d’ajuster l’angle d’ouverture dans l’axe la source, et « effect level » est un coefficient de l’amplitude de l’effet appliqué. La réverbération incluse dans la suite FB360 (modèle de « shoebox » peu convaincant…) est alimentée par le signal de source directive.

Cet outil, reprenant l’idée du cône de directivité, est pour l’instant très basique. D’après la do- cumentation, les paramètres ont été optimisés pour la voix et laissent peu de marge de manœuvre à l’utilisateur (sur les paramètres de l’EQ par exemple). On peut imaginer que des versions prochaines verront l’ajout de réglages plus fins sur la directivité.

a) Capture d’écran du module Spat-Oper du Spatialisateur de l’IRCAM

b) Capture d’écran du plugin FB360 de Facebook (v3.2)

Figure 29 – La même scène sonore sur deux outils de spatialisation différents

Google Resonance SDK

La firme Google s’intéresse également à l’audio spatialisé pour les applications AR/VR. Récem- ment, la plateforme a mis à disposition un SDK⁴³ multi-plateformes, pour permettre aux développeurs d’intégrer l’audio spatialisé à leurs applications.

Le SDK propose différents modules et un moteur de rendu basé sur l’ambisonique pour un certain nombre de plateformes de développement : IOS, Android, Web, Unity, Unreal, FMOD et Wwise. Et également un plugin de binauralisation HOA (ordre 3) en VST.

Les modules pour FMOD et Unity incluent un « AudioListener » (rendu binaural), un « AudioSound- field » (lecture de fichiers ambisoniques), et un « AudioSource » permettant le contrôle de la directivité des sources sonores. Il s’agit simplement d’une loi de gain qui n’est pas sans rappeler l’ambisonique puisqu’elle utilise une combinaison de figures bidirectionnelle et omnidirectionnelle, contrôlée par le paramètre « Directivity« . Un second paramètre, « Sharpness« , permet de resserrer la directivité. La loi de gain implémente les deux paramètres Dir et Sharp comme suit :

Figure 30 – Variation des paramètres « Coverage angle » et « Eflect level » mesurés sur le plugin de spatialisation FB360.

Figure 31 – Variation des paramètres « Directivity » et « Sharpness » sur le Google Resonance Audio- Source

3. Solutions préexistantes, 2ᵉ partie : les formats de données

Nous venons d’étayer divers types d’interfaces et de moteurs de rendu déjà existants pour manipu- ler et jouer des scènes sonores mettant en œuvre des sources directives.

Mais comme le rappelle Jean-Marc Jot dans [21], pour qu’une solution logicielle soit viable, il est indispensable qu’elle réponde au défi de la standardisation : « Standardization is essential for enabling platform-independent playback and re-usability of scene elements by application authors and sound de- signers« ⁴⁴.

En effet, la définition d’un format commun pour les sources directives permettrait d’unifier les dif- férentes pratiques, et de faciliter la vie des ingénieurs du son sur le travail de création de scènes sonores.

Quelques tentatives sont apparues au cours des dernières années. Les avantages et inconvénients de chacune d’elles seront détaillées, puis synthétisées dans un tableau récapitulatif.

3.1 OpenDAFF

« We want to ease the exchange of directional audio data between people and institutions« ⁴⁵

Tel est le credo formulé par les chercheurs d’Aix-la-Chapelle (RWTH) à l’initiative d’OpenDAFF (« Open Directional Audio File Format « ), comme une réponse à l’appel de J.M Jot.

Leurs travaux autour de la simulation acoustique en réalité virtuelle ont donné lieu à la création de ce format d’échange de mesures acoustiques directionnelles. Ce format OpenDAFF peut être utilisé pour stocker des mesures de sources sonores (mesures de haut-parleurs, d’instruments de musique) ou de récepteurs (microphones, HRTFs). Il permet d’associer à chaque point d’une sphère échantillonnée une réponse impulsionnelle, une fonction de transfert du système, et les valeurs mesurées associées.

Une interface graphique (« DAFFViewer », voir Fig.3.1(a)) a été développée pour visualiser les don- nées, ainsi qu’un utilitaire en ligne de commande (« DAFFTool ») pour créer et manipuler des fichiers OpenDAFF. Une librairie C++ ainsi qu’une série de scripts Matlab sont également disponibles.

Le projet de l’OpenDAFF a été conçu spécifiquement pour la directivité. Des bases de données issues de travaux de recherche sont déjà constituées⁴⁶, mais il n’existe malheureusement pas d’outil dynamique et pratique pour manipuler ces directivités, ce qui constitue un frein à son adoption directe par les ingénieurs du son.

3.2 CLF (Common Loudspeaker Format)

Le format CLF [15] est également un format ouvert, destiné à stocker et à distribuer des données de systèmes de haut-parleurs. Il a été créé par le CLF-group⁴⁷, à destination des fabricants d’enceintes et des développeurs et usagers de logiciels de simulation acoustique, dans une volonté d’uniformisation face à la variété des formats propriétaires en usage, spécifiques à chaque logiciel.

Cela a été une réussite puisque la grande majorité des fabricants d’enceintes et des développeurs de logiciels dédiés l’ont adopté (Odeon, CATT,…). Des outils de visualisation (« CLFViewer ») et d’édition (« CLFEdit ») sont mis à disposition sur le site du CLF-group, ainsi qu’une base de données de fichiers CLF. Les fichiers sont créés au format binaire (extensions .CF1 ou .CF2) par les auteurs afin d’en assurer l’intégrité, ou au format texte afin qu’ils puissent être édités.

Comme son nom l’indique, ce format est fortement orienté à destination des logiciels de simulation acoustique évoqués en 2.1, et des applications de « design de système » en sonorisation. Il inclut non seulement des données concernant la directivité de la source, mais également des données mécaniques (poids, type d’enceintes), électro-acoustiques (sensibilité, puissance, impédance), et des critères comme l’indice de directivité ou l’angle d’ouverture à -6dB (voir 4.1), calculés par bandes de fréquences. Il peut donc servir à trouver des informations sur les différentes enceintes disponibles.

Les données de directivité sont issues de mesures avec un échantillonnage équi-angulaire de la sphère, le format a connu des évolutions depuis sa création :

CF1 : Résolution angulaire de 10°, résolution fréquentielle par bandes d’octave.

CF2 : Résolution angulaire de 5°, résolution fréquentielle par bandes de 1/3 d’octave.

CF2 version2 : Extension de CF2, avec l’ajout des informations de phase du système, et de données sur les filtres.

3.3. SOFA (Spatially Oriented Format for Acoustics)

Le format SOFA [15] a été développé à l’origine pour proposer une solution commune de stockage des HRTFs (Head Related Transfert Function), afin de permettre notamment le développement d’outils de rendus binauraux personnalisés. Il est également prévu d’y stocker tout type de données de me- sures issues de « systèmes acoustiques » en renseignant précisément les positions source/récepteur, qu’il s’agisse de BRIR (Binaural Room Impulse Response), de DRIR (Directive Room Impulse Response), ou encore de données de directivité de sources. Ce dernier aspect, qui pourrait nous intéresser ici, est actuellement en cours de développement par différents chercheurs participant à l’élaboration de SOFA.

Le projet EVERTims⁴⁸ propose un framework « open-source » pour les simulations acoustiques et la réalité virtuelle. Il met en œvre un réverbération en ray-tracing, et un module de gestion de source appelé « Source Unit » permettant de manipuler des sources directives : « The new auralization unit now supports the SOFA format to import either HRIR or source directivity patterns ».

Comme nous l’avons vu avec le projet EVERTims, il est en théorie possible d’implémenter l’impor- tation de données de directivité issues de mesures acoustiques via le format SOFA dans les simulateurs acoustiques. Malgré tout, cela n’a pas encore été mis en pratique, et pour la manipulation de sources, SOFA reste un format « figé » et peu malléable, au sens où il nécessite d’utiliser Matlab et ses librairies SOFA.

Figure 32 – Les interfaces de visualisation pour deux formats de données directives

Figure 33 – Tableau récapitulatif des différentes solutions logicielles actuelles

Table des figures

Bibliographie

Site web :. https://fr.wikipedia.org/wiki/Harmonique_sphérique. Dernière visite : 2018- 05-30.

Site web :. https://www.strymon.net/rotary-speaker-technology-white-paper. Dernière visite : 2018-05-30.

LeMoigne Alice. Vers une nouvelle vidéo musicale immersive :Quel son pour la vidéo 360 ? Master’s thesis, CNSMDP, Formation Supérieure aux Métiers du Son, 2016.

Ilan Ben Hagai, Martin Pollow, Michael Vorländer, and Boaz Rafaely. Acoustic centering of sources measured by surrounding spherical microphone arrays. The Journal of the Acoustical Society of America, 130(4) :2003–2015, 2011.

Thibaut Carpentier, Markus Noisternig, and Olivier Warusfel. Twenty years of ircam spat : looking back, looking forward. In 41st International Computer Music Conference (ICMC), pages 270–277, 2015.

Antoine Chaigne and Jean Kergomard. Acoustique des instruments de musique (2e édition revue et augmentée). Belin, 2013.

Perry R Cook and Dan Trueman. Nbody : Interactive multidirectional musical instrument body radiation simulators, and a database of measured impulse responses. In ICMC, 1998.

Jérôme Daniel. Representation de champs acoustiques, application a la transmission et a la res- titution de scenes sonores complexes dans un contexte multimedia. PhD thesis, Paris 6, 2000.

Jérôme Daniel, Sebastien Moreau, and Rozenn Nicol. Further investigations of high-order am- bisonics and wavefield synthesis for holophonic sound imaging. In Audio Engineering Society Convention 114. Audio Engineering Society, 2003.

Daniel Deboy. Acoustic centering and rotational tracking in surrounding spherical microphone arrays. Master’s thesis, Institute of Electronic Music and Acoustics, University of Music and Performing Arts, Graz, Austria, 2010.

Angelo Farina, Paolo Martignon, Andrea Capra, and Simone Fontana. Measuring impulse res- ponses containing complete spatial information. In Audio Engineering Society Conference : UK 22nd Conference : Illusions in Sound. Audio Engineering Society, 2007.

Peter Fellgett. Ambisonics. part one : General system description. Studio Sound, 17(8) :20–22, 1975.

Antonio Fischetti. Initiation à l’acoustique. 2001.

Michael A Gerzon. Ambisonics. part two : studio techniques. studio sound, 17(8) :24–26, 1975.

CLF Group et al. A common loudspeaker file format. Syn-Aud-Con Newsletter v32, (4), 2004.

Acoustics — Determination of sound power levels and sound energy levels of noise sources using sound pressure — Precision methods for anechoic rooms and hemi-anechoic rooms. Standard, International Organization for Standardization, Geneva, CH, March 2012.

Information technology – Coding of audio-visual objects – Part 11 : Scene description and applica- tion engine, address = Geneva, CH, institution = International Organization for Standardization. Standard, October 2005.

Information technology – Computer graphics and image processing – The Virtual Reality Mode- ling Language – Part 1 : Functional specification and UTF-8 encoding, address = Geneva, CH, institution = International Organization for Standardization. Standard, December 1997.

Information technology – Computer graphics and image processing – Extensible 3D (X3D) – Part 1 : Architecture and base components. Standard, International Organization for Standardization, Geneva, CH, December 2004.

Finn Jacobsen, Salvador Barrera Figueroa, and Knud Rasmussen. A note on the concept of acoustic center. The Journal of the Acoustical Society of America, 115(4) :1468–1473, 2004.

Jean-Marc Jot. Efficient description and rendering of complex interactive acoustic scenes. In 10th Int. Conference on Digital Audio Eflects. DAFx, 2007.

Jean-Marc Jot and Jean-Michel Trivi. Scene description model and rendering engine for interactive virtual acoustics. In Audio Engineering Society Convention 120. Audio Engineering Society, 2006.

Jean-Loïc Le Carrou. Vibro-acoustique de la harpe de concert. PhD thesis, Université du Maine, 2006.

Dylan Menzies. New performance instruments for electroacoustic music. PhD thesis, 1999.

Dylan Menzies. W-panning and o-format, tools for object spatialization. In Audio Engineering So- ciety Conference : 22nd International Conference : Virtual, Synthetic, and Entertainment Audio. Audio Engineering Society, 2002.

Jürgen Meyer. Acoustics and the Performance of Music. Verlag Das Musikinstrument Frankfurt am Main, 1978.

Hai Morgenstern, Johannes Klein, Boaz Rafaely, and Markus Noisternig. Experimental investi- gation of multiple-input multiple-output systems for sound-field analysis. In 22nd International Congress on Acoustics (ICA), 2016.

Markus Noisternig, Franz Zotter, and Brian FG Katz. Reconstructing sound source directivity in virtual acoustic environments. In Principles and Applications of Spatial Hearing, pages 357–372. World Scientific, 2011.

IRCAM/Espace Nouveaux. Spatialisateur, user manual. IRCAM.

ODEON Room Acoustics Software. Odeon User’s manual.

Felipe Otondo and Jens Holger Rindel. A new method for the radiation representation of musical instruments in auralizations. Acta Acustica united with Acustica, 91(5) :902–906, 2005.

Jukka Pätynen, Ville Pulkki, and Tapio Lokki. Anechoic recording system for symphony orchestra.

Acta Acustica united with Acustica, 94(6) :856–865, 2008.

Alfonso Pérez Carrillo, Jordi Bonada, Jukka Pätynen, and Vesa Välimäki. Method for measuring violin sound radiation based on bowed glissandi and its application to sound synthesis. The Journal of the Acoustical Society of America, 130(2) :1020–1029, 2011.

Martin Pollow. Directivity patterns for room acoustical measurements and simulations, volume 22. Logos Verlag Berlin GmbH, 2015.

Martin Pollow, Gottfried Behler, and Bruno Masiero. Measuring directivities of natural sound sources with a spherical microphone array. In Proceedings of the 1st Ambisonics Symposium Graz, pages 1–6, 2009.

BN Postma, Leonardo Katz, BF Funes, and Esteban Lombera. Design of a measurement me- thodology to characterize acoustic parameters and sound directivity of string instruments in a real acoustic environment. In International Symposium on Musical and Room acoustic (ISMRA), 2016.

Jens Holger Rindel, Felipe Otondo, and Claus Lynge Christensen. Sound source representation for auralization. In International Symposium on Room Acoustics : Design and Science. Hyogo, Japan, 2004.

Noam R Shabtai, Gottfried Behler, Michael Vorländer, and Stefan Weinzierl. Generation and analysis of an acoustic radiation pattern database for forty-one musical instruments. The Journal of the Acoustical Society of America, 141(2) :1246–1256, 2017.

Gabriel Weinreich and Eric B Arnold. Method for measuring acoustic radiation fields. The Journal of the Acoustical Society of America, 68(2) :404–411, 1980.

Franz Zotter. Analysis and synthesis of sound-radiation with spherical arrays. Citeseer, 2009.

Franz Zotter and Matthias Frank. Challenges of musical instrument reproduction including di- rectivity. The Journal of the Acoustical Society of America, 138(3) :1785–1785, 2015.

Remerciements

La réalisation de ce mémoire a été possible grâce au concours de plusieurs personnes que j’aimerais remercier tout particulièrement :

Charles, mon directeur de mémoire, pour son temps, ses conseils avisés et ses commentaires impitoyables mais éclairés.

Gregory et Jérôme pour les nombreuses élucubrations et discussions passionnantes, ainsi que Marc, Alex et toute l’équipe audio d’Orange Labs pour m’avoir permis de mener ces réflexions dans les meilleures conditions. Un grand merci à Laureline, Thomas et Stéphane.

Merci à Louise pour sa patience et son aide à la relecture.

Je remercie également :

La FSMS, étudiants et professeurs, Denis Vautrin son directeur, ainsi que Conservatoire de Paris, les musiciens que j’y ai rencontré et ses moyens techniques.

Shuichi Okada, violoniste, pour avoir accepté d’interpréter la Chaconne de Bach dans une cage de micros. Guillaume(s), Natalyia, Bogdan, Tobias, Samuel du groupe Runai, pour leur inves- tissement dans le projet expérimental de clip à 6 DoFs : les astronautes.

Et bien évidemment à la promo 2014, pour ces quatre ans intenses, ses rigolades et autres pi- treries.

Thanks to :

Martin Pollow, Franz Zotter and Jukka Pätynen, for providing me with some multi-microphone array audio samples. I wish this modest work to be a contribution to their research.

Notes

« Digital Audio Workstation » = Stations de travail audionumériques. ↩︎
« 6 Degrees of freedom » = correspondant aux 3 degrés de translation et rotation d’un auditeur au sein d’une scène. ↩︎
Dispositif permettant de capter une scène en relief. ↩︎
Enceinte E12 audiotechnik, de d&b. ↩︎
« Head Related Transfer Functions » : filtres utilisés pour la synthèse binaurale. ↩︎
Voir partie 7.1 ↩︎
Configuration de type « A-B », espacé de 50cm. ↩︎
Audios disponibles sur : http://soundmedia.jp/nuaudk. ↩︎
Intensité que donnerait une source omnidirectionnelle « équivalente » (de même puissance). ↩︎
http://www.bcspeakers.com/en/products/coaxial/6-5/8/6fhx51 ↩︎
NB : Les coefficients peuvent varier suivant la convention de normalisation utilisée. ↩︎
Ce qui est en principe contraire à l’éthique FSMS… ↩︎
La proposition m’a été soufflée par Jérôme Daniel au cours de discussions. ↩︎
Voir Annexe 2.2, DirectSound 3D. ↩︎
Codeurs développés dans la norme MPEG-H par exemple. ↩︎
Enregistrement des sources l’une après l’autre. ↩︎
D’autres lois d’interpolation sont envisageables, comme le VBAP par exemple. ↩︎
À l’écoute, l’interpolation a tendance à « lisser » la directivité de la source, par rapport à l’écoute des microphones originaux. ↩︎
Le masque peut décrire une simple directivité en « gain », il s’agira alors d’un vecteur de gains scalaires. Il peut également décrire, par un vecteur de filtres, une directivité en « magnitude » ou une directivité « complexe ». ↩︎
« Réponse Impulsionnelle Finie ». ↩︎
On pourrait envisager de générer ce masque systématiquement par rapport à l’axe principal de directivité de la source, où l’énergie est la plus importante sur l’ensemble du spectre. ↩︎
« Formation de voie » : pondération des harmoniques sphériques pour créer un lobe de directivité dans une direction. ↩︎
Ayant pour résultat le resserrement du lobe principal, et la présence plus ou moins prononcée de lobes secondaires. ↩︎
Dans le même esprit que l’interface du module « DLL Directivity Interface », voir figure 27 en annexe. ↩︎
Réverbération à convolution proposée par AudioEase et largement utilisée par les ingénieurs du son. ↩︎
<http://chroniques.bnf.fr/numero_courant/coulisse/violon_de_stroh.htm)> ↩︎
Au format VST distribués gratuitement et en open-source sur https://plugins.iem.at. ↩︎
Feedback Delay Network. ↩︎
Le MPEG-H ou l’ADM notamment. ↩︎
Variation périodique du volume au cours du temps à une fréquence donnée. ↩︎
Album « Sgt. Pepper’s Lonely Hearts Club Band « , The Beatles, 1967. ↩︎
Album « Revolver « , The Beatles, 1966. ↩︎
Spatialisateur de l’IRCAM, voir Annexe 2.3. ↩︎
http://hoalibrary.mshparisnord.fr ↩︎
Groupe de musique traditionnelle Irlandaise. ↩︎
Common Loudspeaker Format, voir Annexe 3 . ↩︎
Concernant le codage « d’objets audio-visuels », la partie 11 est dédiée à la « description et au rendu de scènes » [17]. ↩︎
« Timestamps » = Marqueurs temporels. ↩︎
API = « Application Programming Interface ». ↩︎
https://www.openal.org ↩︎
Que l’on retrouve d’ailleurs dans MPEG-4, partie 11 (voir Annexe 2.2). ↩︎
Version sortie en mai 2018. ↩︎
SDK = « Software Development Kit « , suite de « briques logicielles » à l’usage des développeurs. ↩︎
« La normalisation est essentielle pour permettre la compatibilité entre les diflérentes plateformes de restitution, et la réutilisation d’éléments communs dans plusieurs projets. » ↩︎
« Nous voulons faciliter l’échange de fichiers audio directionnels entre les personnes et les institutions. » ↩︎
http://www.opendaff.org ↩︎
http://www.clfgroup.org ↩︎
http://evertims.github.io ↩︎
juin 9, 2026

La séparation de sources pour le remixage en son immersif de masters monophoniques des années 1950-60

Comment servir et écouter aujourd’hui les trésors musicaux du passé ?

Par : Jean Viardot

Formation Supérieure aux Métiers du Son Directeur de mémoire : Valentin Bauer, Octobre 2023

Résumé

Les musiques afro-américaines des années 1950-60 ont influencé jusqu’à aujourd’hui plusieurs générations d’artistes. Pourtant, leurs enregistrements originaux ne sont plus aussi largement écoutés qu’autrefois. Le grand public ayant été formé à une écoute stéréophonique de haute définition, écouter des masters monophoniques au rendu bruité, déséquilibré et étriqué peut aussitôt sembler inhabituel, non spontané. C’est pourquoi, dans l’engouement suscité par l’audio immersif, notre étude cherche à savoir dans quelle mesure remixer en son immersif des masters monophoniques de blues, R&B et soul des années 1950-60 peut faire sens aujourd’hui sur le plan musical, culturel et historique.

Nous concevons une première expérience réunissant 24 ingénieurs du son, musiciens et experts du répertoire ciblé. Par un entretien semi-dirigé, une séance d’écoute avec questionnaire et une séance de remixage en son spatialisé de trois morceaux de blues, R&B, soul, elle vise à évaluer les comportements de réflexion, d’écoute et de remixage vis-à-vis de masters originaux des années 1950-60. Parmi les principaux résultats, les participants estiment pour deux morceaux que leur propre remixage favorise davantage la musique que le master original. Nous identifions le master original entravant le plus selon eux le message musical délivré, et nous en réalisons un remixage en son immersif, fidèlement à leurs commentaires et à leurs actions.

Dans une seconde expérience, un premier test d’écoute comparative du master original et de notre master remixé vise à connaître l’intérêt musical et culturel de présenter celui-ci au grand public. Huit professionnels de l’industrie phonographique jugent notre remixage respectueux de la musique, valorisant l’arrangement et susceptible de plaire. Le second test vise à connaître la préférence de 45 consommateurs de musique entre les deux versions. Une large majorité préfère écouter la chanson dans notre remixage, aurait envie de l’écouter plus souvent ainsi et de profiter en son immersif des autres chansons du label.

Abstract

African American music from the 1950s-60s has influenced various generations of artists. However, nowadays, consumers do not listen to these original recordings as widely as before. Being used to listening to high-fidelity stereo recordings, they may have difficulties listening to noised, disturbed, or tight mono recordings. Therefore, amid the current immersive audio craze, our study aims to understand how remixing in immersive audio 1950s-60s mono blues, R&B, soul recordings may be meaningful today, on the musical, cultural and historical levels.

Our first experiment gathers 24 sound engineers, musicians and experts of this musical repertoire. It aims to assess thinking, listening, and remixing behaviors towards the 1950s-60s original masters, through a semi-structured interview, a listening session with a questionnaire, and a spatialized audio remixing session of three blues, R&B, and soul recordings. Among the main results, regarding two songs, the participants think that their remix better fits the music than the original master. After identifying the worst original master with respect to the musical purpose according to them, we have remixed it in immersive audio, faithfully to their comments and actions.

In our second experiment, a comparative listening test between the original master and our new immersive audio master aims to understand the musical and cultural point to be able to introduce it to a wider audience. Eight experts from the phonographic industry assess that our remixed master respects the music, highlights the instrumental arrangement and would appeal to people. A second test aims to find out the preference between both versions of 45 music consumers. By an overwhelming majority, the participants prefer to listen to our immersive remix. Furthermore, they would like to listen to this song more often in the immersive format, and call for listening to other songs from the label in the same immersive audio conditions.

Introduction

La restauration par intelligence artificielle d’images captées au début du XXᵉ siècle⁣¹ détient le pouvoir de faire émerger en chacun de nous une nouvelle réflexion sur le temps passé. Empreint d’un réalisme inédit, ce nouvel objet nous livre en effet de cette époque une vue en tous points différente de celle que notre mémoire lui connaissait. La temporalité jusque-là évidente d’un film devient soudain sous-jacente. Au premier regard, la haute définition et le fluide enchaînement de ses images nous laissent logiquement croire à un film actuel. Mais l’instant suivant, des signes évidents d’un passé plus lointain (vêtements, accessoires, coiffures) contrarient notre première impression. Dès lors, un phénomène psychique survient en nous : la dualité époque passée (réalité) / époque simultanée (apparence). C’est cette dualité qui trouble l’œil et l’esprit, nous fait perdre la notion du temps et de l’espace, nous rend momentanément autre.

À la lumière de cette révolution technique, pouvons-nous croire à une expérience sensorielle analogue dans le domaine de l’audio ? Pouvons-nous, en remodelant le son d’un enregistrement monophonique, entendre nous situer soudain devant les musiciens de la séance, être instantanément projetés plusieurs décennies en arrière entre les murs du studio d’enregistrement ? En retravaillant l’aspect de l’objet qu’est l’enregistrement, on pourrait au moins espérer percevoir et apprécier autrement son contenu musical. Certes l’objectif est ambitieux ; mais certains procédés actuels, comme la séparation de sources et le mixage en son immersif, entretiennent aujourd’hui l’espoir de nous le faire vivre.

Toutefois, avant de songer à une quelconque expérience perceptive, il est nécessaire d’examiner le bien-fondé de cette démarche au travers d’une étude pratique et approfondie. Ce projet soulève en effet dans plusieurs domaines d’importantes questions, que nous aborderons.

Au vu de ce que nous avons évoqué, deux grandes problématiques se présentent à nous :

Dans quelle mesure remixer en son immersif des masters monophoniques fait-il sens aujourd’hui sur le plan culturel, historique et artistique ?
Cette démarche de travail répond-elle à une envie particulière des consommateurs actuels vis-à-vis des enregistrements anciens ?

Dans l’histoire de l’enregistrement musical, la période 1950-60 constitue une époque charnière. Pour la première fois en effet, le preneur de son ne dispose plus d’une seule empreinte sonore possible pour l’enregistrement d’une œuvre – celle imposée auparavant par la gravure directe sur le disque – mais d’un tout premier nuancier de couleurs sonores, grâce notamment à l’éclosion de l’enregistrement magnétique. L’une d’elles est ainsi choisie pour incarner finalement, en lien étroit avec l’œuvre et le style musical à enregistrer, l’esthétique sonore de l’enregistrement. Cette période est aussi extrêmement fertile musicalement. Dans le dur contexte de ségrégation raciale sévissant aux États-Unis, plusieurs artistes de blues, de rhythm and blues (R&B) et de soul s’installent très vite au sommet du paysage musical populaire. Grâce aux nouvelles techniques d’enregistrement, le caractère perpétuellement organique et créatif de leur musique transpire aussi désormais au travers d’esthétiques sonores bien caractéristiques.

Mais tout en pouvant considérer que la plupart des enregistrements de blues, R&B et soul des années 1950-60 ont été réalisés avec beaucoup de clairvoyance et une certaine maîtrise d’un matériel d’enregistrement certes en progrès mais encore limité, pensons-nous forcément pour autant que tous témoignent d’un rendu sonore « idéal » vis-à-vis de la musique annoncée ? Pensons-nous forcément que le rendu sonore de ces masters originaux est en tous points conforme à la manière dont l’œuvre a été pensée, composée, arrangée et interprétée ? Croyons-nous qu’il est vraiment celui qui place le potentiel de ressenti de l’œuvre à son plus haut niveau ? Cela concerne tant le respect et la mise en valeur de l’esthétique musicale, de la composition et de l’arrangement qui ont été pensés et organisés consciemment par les artistes, que le jeu d’interprétation et le son spécifique de chacun des musiciens de la séance.

Ces interrogations, orientées vers la problématique a, figurent au centre d’une première expérience que nous consacrons à trois masters originaux du répertoire cité. Celle-ci vise à étudier les comportements de réflexion, d’écoute et de remixage, lors d’une séance de remixage particulière. Nous obtenons les pistes séparées de ces enregistrements, inexistantes à partir des premiers magnétophones, grâce à une technologie récente de séparation de sources basée sur l’intelligence artificielle. Ce test, qui réunit ingénieurs du son, musiciens et experts musicaux du répertoire concerné, vise donc précisément à analyser leur évaluation du rendu sonore de ces masters originaux (Q.R.1) et de leurs masters remixés (Q.R.3) vis-à-vis de la musique, leur degré d’engagement dans la séance de remixage (Q.R.2) et la cohérence entre leurs réponses émises à l’entretien préliminaire et leurs choix de remixage (Q.R.4).

Cette première expérience donnera naissance à une seconde qui s’attachera à répondre à la problématique b. Nous tirerons en effet des remarques des participants de la première expérience l’enregistrement présentant le rendu sonore le moins en accord avec ce que suggère selon eux la musique. Nous en réaliserons un remixage en son immersif, fidèlement aux caractéristiques musicales relevées et aux choix de remixage privilégiés par l’ensemble des participants. Finalement, nous organiserons un test d’écoute comparative entre la version sonore originale de cette chanson et notre version remixée. Dans un premier test, nous solliciterons l’expertise de producteurs musicaux, de réalisateurs artistiques et d’ingénieurs du son pour savoir si notre version remixée présente aujourd’hui un intérêt culturel et musical à être entendue par le grand public, et si elle pourrait prétendre à être commercialisée aux côtés de la version originale (Q.R.5). Puis, dans un second test d’écoute comparative, nous demanderons à une partie du grand public (musiciens, non musiciens et experts du répertoire concerné) à travers laquelle des deux versions sonores ils préfèrent écouter cette chanson (Q.R.6).

Ainsi, nous serons en mesure de conclure notre étude sur le degré de pertinence musicale, culturelle et historique que présente aujourd’hui l’action de remixer en son immersif un master monophonique de blues, R&B ou soul produit dans les années 1950-60 (a). En plus de cela, nous pourrons savoir si cette nouvelle approche de travail répond en fait à une envie particulière des consommateurs actuels vis-à-vis des enregistrements anciens (b).

Notre étude s’organise donc en trois temps : une revue de littérature des principaux thèmes évoqués, l’expérience n°1 répondant à la problématique a, et l’expérience n°2 complétant la réponse à la problématique a et traitant la problématique b. Dans une discussion finale, nous confronterons les résultats de nos expériences avec les données issues de la littérature pour enrichir notre réponse aux problématiques a et b.

I. État de l’art

A. Enregistrer et écouter la musique blues/R&B/soul dans les années 1950-60 : allier organicité musicale et nouvelles techniques d’enregistrement

Nous proposons dans cette première partie une plongée dans les années 1950-60 au cœur de l’enregistrement musical aux États-Unis. Comme notre étude souhaite évaluer l’intérêt de remixer en son immersif la musique blues/R&B/soul de cette période, nous chercherons ici à comprendre ce qui fait son essence et comment les ingénieurs du son exploitent les nouvelles techniques sonores pour l’enregistrer tout en calibrant leur produit aux modes d’écoute du grand public.

1. Exprimer son identité noire dans la musique afro-américaine

Malgré l’abolition de l’esclavage, les États du Sud ne reconnaissent pas les amendements de la Constitution des États-Unis qui établit depuis 1870 l’égalité des droits civiques entre tous les citoyens américains. À travers les lois Jim Crow, ils instaurent jusqu’au milieu des années 1960 une politique de ségrégation raciale entre les Blancs et les Noirs dans tous les lieux publics (Poole, 2014). Celle-ci s’opère jusque dans les magasins de disques, dont les premiers ouvrent dans les années 1920. On y trouve alors des « pop records », des enregistrements de musique interprétée « par et pour les Blancs », et des « race records », similairement pour les Noirs (Pirenne, 1994). Notons pourtant que de nombreux Blancs américains se procurent assez tôt certains de ces « race records ». Les musiciens noirs y affirment leur identité dans trois genres dominants, le blues, le rhythm and blues et la soul, qui impliquent alors des moyens d’expression différents.

1) Le blues

Le blues naît bien avant l’industrie discographique. Il puise dans son essence dans les work songs² récités par les esclaves et travailleurs noirs durant la deuxième moitié du XIXᵉ siècle, en particulier la période esclavagiste (Woods, 2017). Bien que son style s’en éloigne dès les années 1920, notamment par l’emploi de la guitare acoustique, il en conserve l’idée de posséder peu pour exprimer beaucoup.

Traditionnellement, le Delta blues du Mississippi ne fait appel qu’à un chanteur-guitariste comme Robert Johnson qui, avec un lyrisme très organique, exprime toute la douleur, la plainte et l’amertume du peuple noir (Ausseil et al., 1995). Le tempo souvent lent mais appuyé traduit l’envie de voyager mais la difficulté pour y parvenir. Il s’accélère parfois sous la forme d’un boogie pour alléger le propos. De plus en plus, des instruments tels que la contrebasse, le piano, les vents (clarinette, saxophone, trompette, trombone), et des chœurs viennent s’ajouter à la voix (Bessie Smith, Georgia White) et à la guitare (parfois remplacée par le banjo) pour donner plus de poids aux sentiments véhiculés (Jolibert, 2002). Le blues migre ensuite à Chicago à l’aube des années 1950 (Muddy Waters, Howlin’ Wolf), où l’instrumentarium s’électrifie aussitôt, à l’image de la guitare, soliste désignée avec l’harmonica (Bas-Rabérin, 1973). Pour compenser cette nouvelle puissance de l’orchestre, la batterie apparaît. Par la douleur qu’il continue d’exprimer en fond, le blues s’exporte ensuite au-delà des frontières américaines.

Figure 1 : Muddy Waters (Source : https://digital.nepr.net) — *Figure 1 : Muddy Waters*
*(Source : https://digital.nepr.net)*

2) Le rhythm and blues

Révélé aux États-Unis au début des années 1940, le rhythm and blues est une définition musicale d’après-guerre de la population noire américaine. Bien que le terme, abrégé R&B, puisse être traduit par l’expression « rythme et mélancolie », les musiciens de ce courant entendent donner beaucoup plus de poids au rythme qu’au blues souffreteux (Hofstein, 1991). Avec cette énergie portée sur un texte plus léger et plus drôle, ils veulent faire oublier le quotidien discriminatoire que subit la population noire depuis plusieurs décennies (Hofstein, 1991). Pour lancer ce courant effervescent, ces musiciens réunissent les marqueurs de trois genres inhérents à la musique noire : le rythme du jazz, le lyrisme du blues, et bien sûr le chant gospel, qui réunit à lui seul ces deux attributs (Ripani, 2006). C’est en 1949 que Jerry Wexler, bientôt producteur d’artistes R&B chez Atlantic Records, baptise le « rhythm and blues » dans le magazine Billboard, bannissant le terme discriminatoire de « race music » (Pirenne, 1994).

*Figure 2 : Ray Charles(Source : https://www.deezer.com)*

La batterie, la contrebasse (bientôt basse électrique), le piano et parfois la guitare électrique forment le socle rythmique. Et inspirée des big bands swing, la section de cuivres (au moins un saxophone et une trompette) égaient le répertoire en dialoguant avec la voix principale. Des artistes remuants tels que Fats Domino, Big Joe Turner et Ray Charles viennent ainsi au tournant des années 1950 donner un souffle nouveau à toute la musique américaine. C’est ce courant en particulier qui entraîne dans son sillage l’émergence du rock’n’roll (Garofalo, 2002).

3) La soul

La soul se construit dès le milieu des années 1950 (Guralnick, 2003). Mais comme le rhythm and blues mêle simultanément plusieurs courants, ce n’est qu’en 1969 que le magazine Billboard lui donne un nom (Pirenne, 1994). Soul signifie « l’âme » : celle d’une chanson, d’une voix ou des musiciens. Bien que l’empreinte rythmique du R&B reste bien marquée, c’est la voix qui par son éloquence, sa grandeur, son expressivité, puisée dans la tradition du chant gospel pour incarner l’âme des Noirs américains. Guralnick (2006) raconte que c’est Ray Charles qui, au milieu des années 1950, lance ce courant en étant l’un des premiers artistes à arranger des chants de gospel dans un cadre profane³, ce qui lui vaut de nombreuses réprimandes de la population afro-américaine. Mais c’est aussi lui qui introduit le terme en 1958 dans son album Soul Brothers. La soul reprend les effectifs denses du R&B en y incluant souvent l’orgue, en référence à l’église, le tout dans une cadence rythmique tantôt très douce, tantôt frénétique. Durant toutes les années 1960, au paroxysme de tension liée à la lutte des Noirs américains pour la reconnaissance des droits civiques, les voix poignantes d’Aretha Franklin et d’Otis Redding expriment l’émotion sincère de la population afro-américaine. Toutefois à cette même période, certains labels de soul/R&B comme Motown Records abandonnent l’idée d’une culture unique en destinant ouvertement leur musique aux deux publics, Noirs et Blancs (Guralnick, 2003). Non seulement cette orientation, secondée par la fin de la ségrégation raciale, marque peu à peu la fin de la musique noire exclusive aux États-Unis, mais le blues, le rhythm and blues et la soul continuent jusqu’à aujourd’hui d’exercer leur influence.

Figure 3 : Aretha Franklin (Source : https://www.pinterest.cl) — *Figure 3 : Aretha Franklin* *(Source : https://www.pinterest.cl)*

2. L’adoption de nouveaux moyens d’enregistrement

1) L’avènement de l’enregistrement magnétique

L’arrivée de l’enregistrement magnétique dans les studios d’enregistrement à la fin des années 1940 pose les bases d’une nouvelle ère sonore, dont profitent ensuite pleinement les productions des années 1950-60.

Dans les années 1920-30, les laboratoires cherchent à remplacer l’enregistrement musical électrique par un medium plus facile à lire et à la restitution sonore moins bruitée. Ils fondent leurs recherches sur l’enregistrement magnétique, dont le principe est défini dès la fin du XIXᵉ siècle par Oberlin Smith et Valdemar Poulsen : un courant circulant dans une bobine génère un champ magnétique qui provoque l’aimantation de fines particules disposées sur un support (Mercier et al., 2010). Fritz Pfleumer invente alors en 1928 comme support d’enregistrement la bande magnétique, une bande papier kraft avec de la poudre de fer. Bien que sa grande souplesse empêche encore une magnétisation durable, elle attire l’attention de la compagnie allemande AEG qui rachète le brevet et commence à développer le Magnetophon K1 (Kimizuka, 2012). Via une bande d’acétate puis de plastique, ce dernier devient le premier enregistreur magnétique utilisé pour la diffusion radio et, dès 1936, l’enregistrement de concerts⁴. Mais l’Allemagne nazie tient en secret cette prouesse dont elle profite grandement pendant le conflit mondial (Rémond, 2015).

En juillet 1945, l’ingénieur électricien Jack Mullin est envoyé en Allemagne pour examiner les outils de communication utilisés par l’ennemi durant la guerre. Dans l’un des bunkers, il découvre plusieurs Magnetophon AEG. Il en rapatrie deux aux États-Unis, les remet en état et les présente au chanteur Bing Crosby, qui cherche justement un moyen pour enregistrer ses shows à la radio avec une qualité sonore semblable à celle d’une émission en direct (Cogan & Clark, 2003). Devinant tout le potentiel de cet outil, celui-ci soutient Mullin dans ses travaux en le faisant nommer ingénieur-chef au sein de la jeune entreprise Ampex. En 1948, Mullin ouvre les portes de l’enregistrement magnétique à la radio et très bientôt aux studios d’enregistrement, en commercialisant l’Ampex Model 200A (Kimizuka, 2012).

Figure 4 : Magnétophone Ampex 200A acquis dès 1949 par les studios Capitol(Source : https://www.historyofrecording.com) — *Figure 4 : Magnétophone Ampex 200A* *acquis dès 1949 par les studios Capitol(Source : https://www.historyofrecording.com)*

Très vite, le magnétophone monophonique⁵ investit les studios américains. Les ingénieurs du son aperçoivent aussitôt les grands atouts de production qu’offre la bande magnétique. Parmi ceux-ci, la nouvelle bande passante est sans doute la plus évidente et la plus bénéfique (Cogan & Clark, 2003). La fidélité de reproduction est alors hautement améliorée, ce qui sert particulièrement à la définition des timbres des instruments. De plus, le souffle d’enregistrement causé par le support est avec la bande magnétique bien plus faible que celui qu’occasionne le disque gravé, tel qu’on enregistrait la musique jusque-là. Mais surtout, en coupant les bandes issues de différentes prises et en les assemblant convenablement, les ingénieurs du son peuvent faire du montage entre les différentes prises. Cette nouvelle méthode de production constitue une ressource importante pour les musiciens et les producteurs qui souhaitent corriger quelques passages d’interprétation. Il devient aussi plus aisé de naviguer temporellement dans l’enregistrement grâce au rembobinage de la bande et à la réactivité de la tête de lecture. Enfin, une bande peut être effacée et donc réutilisée pour d’autres enregistrements, là où quelques années avant, il était évidemment inimaginable de pouvoir gommer le sillon gravé sur un disque.

Le magnétophone mono d’abord utilisé est dit pleine piste, car son unique piste d’enregistrement occupe toute la hauteur de la bande (Rumsey & McCormick, 2002). Pendant quasiment toute la décennie 1950, il est le maillon final de la chaîne sonore de tous les enregistrements aux États-Unis, dont ceux des artistes de blues, de R&B et de soul. Comme il est réduit à une seule piste, les instruments continuent d’enregistrer tous à la fois, en live, comme au temps de l’enregistrement acoustique puis électrique. Les ingénieurs du son lui envoient une somme de signaux provenant de plusieurs micros, qu’ils mixent en direct pendant la séance sur des mixettes de 4 ou 8 voies (Gordon, 2013) (figure 5). Ces mixettes rudimentaires limitent bien souvent le nombre de micros utilisés, et ainsi la qualité de restitution de tous les instruments. La musique comme le mixage, tout se fait en direct. Si les producteurs souhaitent une meilleure prise, il faut donc en refaire une en entier et avec tous les musiciens.

*Figure 5 : Mixette à lampes Ampex / Sigma 3761 utilisée par Tom Dowd au studio Stax (Source : https://reverb.com)*

Ainsi, l’enregistrement magnétique modifie d’abord légèrement le déroulé d’une séance d’enregistrement, il améliore surtout la qualité de restitution par rapport au disque. Le montage des bandes mixées constitue finalement une bande « master », envoyée aux stations de radio pour sa diffusion et aux compagnies de pressage de disques pour sa commercialisation (Rumsey & McCormick, 2002).

2) L’enregistrement multipiste, la question de l’overdubbing

Dès 1953, plusieurs studios commencent à se procurer des magnétophones bipistes⁶, 3 pistes, et bientôt 4 pistes. En octroyant par exemple une piste entière à la voix principale, les ingénieurs du son peuvent ajuster sa présence dans un mixage postérieur (Rumsey & McCormick, 2002).

Mais c’est à la fin des années 1950 que l’enregistrement magnétique vient possiblement modifier leurs habitudes de travail. Ampex inclut dans ses magnétophones la fonction simul-sync, qui rend la tête d’enregistrement capable de lire la bande avec une qualité de restitution acceptable.

Lecture et enregistrement peuvent donc être synchrones, lançant la mode de l’overdubbing⁷. Initiée dès 1950 par Les Paul avec deux enregistreurs mono, cette technique consiste à enregistrer une partie musicale par-dessus une autre enregistrée précédemment sur une autre piste (Bode, 1984). Pour un confort acoustique ou d’interprétation, les ingénieurs du son peuvent désormais enregistrer séparément chaque section instrumentale. En particulier, un musicien peut effectuer plusieurs prises de son passage soliste sans demander au reste de l’orchestre de jouer avec lui. Et un autre peut chanter ou jouer plusieurs voix sur un même passage.

Mais malgré l’atout apparent que représente cette pratique, les producteurs de blues, de R&B et de soul s’en tiennent d’abord à ce que suggère la musique⁸. Comme exposé en section I.A.1., la musique afro-américaine exprime avant tout un certain sentiment, une certaine énergie que les musiciens se sentent appelés à partager et interpréter collectivement, simultanément. La majorité de ces musiques reste donc principalement enregistrée dans la même pièce et en live (Gordon, 2013). Grâce au format de la prise de trois minutes, le grand public profite alors d’interprétations profondes et uniques de chanteurs de blues comme Howlin’ Wolf⁹ et de soul comme Otis Redding¹⁰, et parfois déchaînées avec Big Mama Thornton¹¹ et Ray Charles¹² en R&B.

Mais au cours des années 1960, le label de R&B Motown Records commence à se détacher de cette philosophie. Bien qu’il conserve d’abord l’enregistrement live, son fondateur Berry Gordy se procure en 1965 une nouvelle machine 8 pistes¹³. Il veut valoriser les riches arrangements des productions de la maison en les enregistrant dans des conditions acoustiques favorables (multi- cabines) et surtout séparément (overdubbing). Pour la chanson Ain’t No Mountain High Enough¹⁴ (1967), il enregistre d’abord en live la section rythmique, puis par overdubs successifs, la section de cuivres, de cordes, de percussions, et finit avec le duo vocal Marvin Gaye / Tammi Terrell. Tandis que Chess, Atlantic et Stax privilégient l’énergie musicale commune et instantanée digne des musiques afro-américaines, « Hitsville¹⁵ » veut concevoir un produit dédié à tous les publics, en exploitant tous les atouts de l’enregistrement multipiste (Bowman, 1997).

3) La chambre d’écho, signature d’un label

Les studios de musique afro-américaine veulent aussi offrir un espace sonore à leurs enregistrements ; ils construisent dans leurs locaux une ou plusieurs chambres d’écho. Dans ce volume très réverbérant, l’ingénieur du son diffuse la bande d’une piste ou d’un master. Par un micro, il y récupère la source réverbérée qu’il mixe ensuite avec les autres instruments enregistrés. Comme chaque chambre d’écho est unique acoustiquement, elle contribue à définir la signature du label, que le support magnétique est capable de retranscrire (Cogan & Clark, 2003).

Capitol Records, qui produit certains artistes de jazz convertis au R&B comme Louis Prima, en possède quatre dans les années 1950 (figure 6). À dix mètres de profondeur sous les studios de prise, leurs murs épais sont contenus dans un autre volume plus grand et séparé par un système de ressorts pour s’affranchir des vibrations extérieures (principe de la boîte dans la boîte) (Cogan & Clark, 2003). Les ingénieurs du son choisissent aussi la chambre en fonction du format mono ou stéréo du master (Cogan & Clark, 2003). Ces réverbérations naturelles marquent aussitôt le cachet du « son Capitol », comme nous l’entendrons en section II.A.1.1.

*Figure 6 : L’une des chambres d’écho des studios Capitol (Source : https://reverb.com)*

4) Le progrès du microsillon

Une fois le produit finalisé, l’enregistrement du magnétophone est gravé sur un disque acétate qui sert de modèle à des matrices utilisées pour le pressage de disques de polychlorure de vinyle (PVC), destinés au commerce (Rumsey & McCormick, 2002). Ce matériau plastique, bien moins lourd, moins fragile et moins coûteux que la gomme-laque (shellac), s’impose très rapidement et durablement sur le marché américain de l’enregistrement. En 1947, le label Columbia brevète le microsillon, un disque vinyle au sillon extrêmement fin qui accroît soudain la qualité audio des enregistrements des années 1950 et crée deux nouveaux formats commerciaux, l’album 33 tours et le single 45 tours (Kimizuka, 2012). En 1952, l’inventeur et ingénieur du son Emory Cook profite de cette finesse de gravure pour appliquer le concept de la gravure stéréophonique de Blumlein (Rumsey & McCormick, 2002) : le microsillon stéréo voit le jour (Barry, 2010). Dès 1958, plusieurs centaines d’enregistrements stéréophoniques sont commercialisés aux États-Unis. Toutefois, ce nouveau mode de gravure présente aussi d’importantes contraintes techniques, très vite compensées par les studios. Par nature, les basses fréquences ont une grande amplitude et une lente modulation (Rumsey & McCormick, 2002). La pointe peine donc à les graver à l’enregistrement et à les reproduire à la lecture du disque. Pour ôter cette contrainte, la Recording Industry Association of America instaure au début des années 1950 l’égalisation RIAA, qui indique à l’ingénieur du son d’atténuer les basses fréquences et d’amplifier les hautes fréquences avant la gravure (Rumsey & McCormick, 2002). Sans respect de cette courbe, la mauvaise gravure des basses fréquences pourrait distordre l’enregistrement et réduire le temps d’enregistrement disponible sur une face de disque. En réglant l’égalisation inverse à la lecture, l’auditeur retrouve le signal original. Cette méthode d’égalisation, approuvée dès 1954 par la majorité des studios américains, contribue grandement au succès populaire du disque vinyle (Stotzer, 2003).

3. La nécessité de privilégier le master monophonique

1) La diffusion radiophonique

Aussi précieux soient leurs nouveaux atouts d’enregistrement et de mixage, les ingénieurs du son sont priés par les producteurs de faire correspondre les masters aux moyens usuels d’écoute du grand public. Car invariablement, l’objectif reste de vendre.

Avant le succès de la télévision dans les années 1960, le moyen dominant pour la diffusion de l’information et de la musique reste la radio. En plus du poste sédentaire du salon, divers appareils à lampe plus petits, plus mobiles et parfois plus fantaisistes viennent satisfaire le quotidien de millions de personnes. Dès 1954, les consommateurs emportent partout avec eux leur petit poste à transistors. Et pour encourager cet usage, la radio FM vient grandement améliorer la qualité du signal émis (Lemesle, 2015). Les labels de distribution envoient donc les disques récemment pressés aux stations radiophoniques locales pour qu’elles diffusent le plus rapidement et le plus souvent possible. Avec cette forme consommatrice de l’écoute musicale, le but est de faire aimer au grand public le nouveau tube de l’artiste et lui donner envie de se procurer le disque 45 tours en magasin (Bowman, 1997). Or tous les postes de radio fixes et mobiles des années 1950-60 sont mono (Lemesle, 2015). Ainsi, malgré l’explosion du format stéréo, plusieurs labels importants de musique blues/R&B/soul exigent encore pendant plusieurs années à l’ingénieur du son de prioriser le rendu sonore du master mono. De cette manière, ils se garantissent une certaine corrélation entre ce qu’ils produisent et ce que les gens entendent.

2) Les disques à commercialiser

Mais la nécessité pour les maisons de disques de favoriser le master mono ne s’arrête pas à la première écoute du grand public ; elle persiste quand ce dernier a acheté leur disque.

Avec l’apparition du microsillon, plusieurs modèles de postes de radio intègrent une platine de disque vinyle. Mais la pointe d’un tourne-disque mono, qui ne se déplace que latéralement, peut user un disque stéréo. Le grand public qui possède majoritairement cet appareil moins coûteux que la platine stéréo, est donc prévenu : une platine mono (figure 8) ne peut lire que des disques mono (Gilotaux, 1967). Non seulement les ingénieurs du son doivent alors systématiquement livrer chaque nouvel album dans les deux formats, mais ils sont priés par le label de privilégier le mixage mono pour favoriser les ventes. Nous verrons alors en section II.B.1.1. et III.B.4. dans quelle mesure ce format dicté il y a 60 ans profite aujourd’hui à la musique.

*Figure 8 : Tourne-disques mono RCA Victor 7-EP-2 (1956)(Source : https://www.ha.com)*

Finalement, les entreprises phonographiques évitent cette double production en adoptant au cours des années 1960 la gravure universelle, qui modère l’amplitude verticale du sillon, ce qui met les deux canaux plus en phase et densifie donc le centre de l’image stéréo. Ces nouveaux disques stéréo compatibles peuvent être lus par toutes les platines, mais accélèrent la transition vers les platines stéréo (figure 9) pour profiter du nouvel espace sonore (Gilotaux, 1967).

Figure 9 : Tourne-disques stéréo
Westinghouse Model 52 MPS 2 (1960)(Source : https://www.pinterest.fr) — *Figure 9 : Tourne-disques stéréo*
*Westinghouse Model 52 MPS 2 (1960)(Source : https://www.pinterest.fr)*

B. Dolby Atmos, l’écoute musicale immersive

1. Mixer en Dolby Atmos

1) Présentation de la technologie

Le Dolby Atmos est une technologie de son immersif mise au point par les laboratoires Dolby en 2012. D’abord introduite dans les salles de cinéma, les disques Blu-ray et divers services de streaming vidéo payants, elle commence depuis plusieurs années à investir l’industrie musicale.

En immergeant l’auditeur au sein d’un système de haut-parleurs pouvant atteindre 64 unités, Dolby (2020) lui promet une expérience inouïe. Standardisé 7.1.4 (figure 10), ou parfois 9.1.6, 11.1.8, le Dolby Atmos est en effet l’un des seuls formats audio à proposer une dimension verticale à sa restitution. Dans les salles de cinéma équipées, et plus tard dans les salles de concert, ceci se traduit par l’alignement de deux rangées longitudinales de haut-parleurs suspendus au plafond. Un ou deux caissons de basses à l’arrière de la salle viennent aussi s’y ajouter (Cabanillas, 2020). À la demande des labels musicaux, de plus en plus de studios de mixage, comme le studio Guillaume Tell près de Paris, commencent dès 2016 à s’équiper d’une douzaine de nouveaux haut-parleurs (7 autour de soi, 4 au-dessus et 1 subwoofer pour le standard 7.1.4) et d’un moteur de rendu Dolby Atmos pour mixer ou remixer diverses productions en son immersif. Les ingénieurs du son apprennent donc à mixer en 3 dimensions (largeur, profondeur, hauteur), et à sculpter un nouvel « environnement sonore » pour la musique traitée. Par exemple, s’il le souhaite, cette technologie permet à l’ingénieur du son d’élargir la scène sonore d’un enregistrement symphonique, passant de 60° (stéréo) à 100° ou même 180°. En dissociant les sources, il est aussi en mesure de les démasquer et de former autour d’elles un nouvel espace propre (Simon, 2018).

2) Le mixage orienté objet

En mixage stéréo, l’ingénieur du son place chaque source en fonction des canaux (plutôt vers l’enceinte de gauche, plutôt vers celle de droite, etc.) (Rumsey & McCormick, 2002). En mixage immersif, il n’a plus cette contrainte frontale et peut disposer chaque source, qu’il nomme alors « objet », où il le souhaite dans l’espace sonore formé par le dôme d’enceintes. Très simplement, il peut définir la taille et l’orientation de cet objet dans l’espace, et même lui assigner des trajectoires manuelles ou automatiques, sans jamais se préoccuper de son système de diffusion (Erard, 2020). Il ne se soucie donc plus d’insérer son mixage dans une « image sonore » stéréophonique, mais de construire avec ses objets un « environnement sonore ». Le Dolby Atmos Renderer (figure 11), moteur de rendu du Dolby Atmos communicant avec la station audionumérique, peut accueillir jusqu’à 128 objets en entrée et les diffuser ou exporter vers 64 sorties physiques indépendantes (Dolby, 2021). Dedans, le mixeur peut visuellement y mixer ses sources dans un bed (7.1, 9.1, 11.1…), qui est dépendant du système de diffusion de la régie de mixage, ou bien à la manière d’un mixage orienté objet qui, comme défini précédemment, ne l’est pas. Finalement, le bed, les objets, et les métadonnées de ces objets qui contiennent toutes leurs données spatiales (position dans l’espace 3D, taille, orientation…), constituent le format Dolby Atmos (Dolby, 2020). Au terme du mixage immersif, l’ingénieur du son en réalise un export en 12 canaux, destiné aux plateformes de streaming dont nous étudierons l’offre en section I.B.3.2. Cet export est également encodé en 2 canaux, métadonnées comprises, pour une écoute binaurale au casque. D’autres logiciels de mixage orienté objet existent avec des performances similaires, comme SPAT Revolution¹⁶ développé par Flux et l’Ircam, que nous utiliserons dans le cadre de ce mémoire (voir section II.A.2.1.).

*Figure 10 : Dispositif du Dolby Atmos 7.1.4(Source : Dolby)*

*Figure 11 : Interface du Dolby Atmos Renderer(Source : Dolby)*

3) Comment mixer en Dolby Atmos ?

Les nouvelles fonctionnalités du mixage en son immersif ouvrent de nouveaux horizons aux méthodes de travail des ingénieurs du son. Néanmoins, ceux-ci doivent garder à l’esprit certains réflexes qu’ils avaient en mixage stéréo. Lors d’une table ronde consacrée au remixage et au remastering en Dolby Atmos d’enregistrements stéréo, certains d’entre eux livrent leur expérience et les habitudes de travail qu’ils ont acquises en la matière (Thornton, 2020). Tout d’abord, tous rappellent qu’il est question avant tout de musique, que comme en stéréo, « le plus important […] est de réaliser un mixage dans lequel l’artiste puisse se reconnaître ». Les ingénieurs du son restent également toujours aussi attentifs à l’écoute du grand public : « Si l’on est distrait par quelque chose qui soit étranger à la musique, alors il y a erreur dans le mixage », annonce l’un d’eux. Cependant, ils reconnaissent que « l’implication de la musique vers la spatialisation n’est pas immédiate, [que] c’est un exercice très difficile ». Par exemple, en devant remixer en son immersif un titre des Rolling Stones à partir des bandes multipistes, l’un des mixeurs déclare qu’il est « très difficile de conserver quelque chose de compact dans un mixage spatialisé ». En travaillant majoritairement en mixage orienté objet, les ingénieurs du son apprécient enfin « ne pas avoir besoin de tasser le mixage dans un petit espace », ce qui les incite souvent à mixer en Dolby Atmos « avec beaucoup plus de dynamique » qu’ils ne le feraient en stéréo, tout en se conformant aux outils de mesures. De cette expérience du mixage stéréo, ils conservent en revanche la vérification nécessaire de la compatibilité aux autres formats. Bien qu’ils reposent leur travail sur la version originale stéréo, ils vérifient davantage la compatibilité de leur mixage avec les autres formats multicanaux (5.1, 7.1…). En particulier, vérifier la compatibilité en binaural demeure essentiel selon eux, car c’est dans ce format que les auditeurs au casque entendront leur produit, après l’encodage du master sur 2 canaux. Enfin, les ingénieurs du son exploitent la nouvelle dimension verticale pour « obtenir quelque chose de plus grand », former avec les enceintes du bas un véritable dôme sonore, pour parvenir à l’immersion recherchée. Finalement, avec l’apport déterminant du mixage orienté objet, ils voient le Dolby Atmos « en passe de devenir le principal medium d’écoute musicale multicanale ». À l’inverse du précédent format 5.1, le Dolby Atmos offre selon eux un « environnement sonore retranscrit intelligemment à partir des canaux latéraux et arrière, mais aussi des informations spatiales des objets sonores ». Dans notre étude, nous observerons en sections III.B.4. et III.C.4. les apports du remixage en son immersif pour une œuvre enregistrée en mono.

2. Le remixage en Dolby Atmos de masters monophoniques : l’exemple de Pet Sounds

1) Origine du projet

Le 2 juin 2023 est sorti une version remixée en Dolby Atmos de l’album Pet Sounds des Beach Boys, enregistré en mono en 1966. Ce projet unique est intervenu à la demande du groupe lui-même, qui a confié les bandes originales multipistes à Giles Martin, fils de George Martin le célèbre producteur des Beatles (Tamarkin, 2023). Pet Sounds marque un tournant dans l’approche d’enregistrement du groupe et a ainsi grandement influencé les Beatles dans leurs productions ultérieures (Lambert, 2008). Précédemment, Giles Martin avait déjà remixé en son immersif plusieurs albums des Beatles comme Sgt. Pepper’s Lonely Hearts Club Band (1967), Abbey Road (1969) puis Revolver (1966) (Tamarkin, 2023).

2) Intérêts et objectifs de remixage

Livrant son expérience, Giles Martin nous donne de précieuses clefs pour le remixage en son immersif de masters monophoniques des années 1960. Honoré de cette demande du groupe, il raconte comment son travail de remixage repose avant tout sur son amour inconditionnel de la version mono originale : « Sur mon bureau, la version mono tourne en boucle. Par essence, je pense que l’idée est de ne pas changer l’ADN de quelque chose mais plutôt d’améliorer l’expérience d’écoute, d’être vraiment à l’écoute de votre ressenti de fan et d’essayer de s’assurer d’honorer l’esprit de l’enregistrement » (Tamarkin, 2023). Ainsi, Martin a voulu penser comme un musicien du groupe, ressentir à travers la version originale leurs intentions. « Vous écoutez le mix mono original et vous essayez de débloquer ce qu’ils essayaient de faire. Vous ne pouvez pas être eux, mais vous essayez de comprendre. Il ne s’agit pas de technologie, il s’agit d’une chanson, et si une chanson vous fait ressentir quelque chose » (Cruse, 2023). Le producteur suit ainsi fortement la priorité musicale confiée par les ingénieurs du son en section I.B.1.3. Mais selon lui, respecter cette musique, c’est aussi voir toutes les « couleurs, les textures et l’imagination » qui composent les morceaux de cet album et qui méritent d’être mieux perçues dans un nouvel espace (The Beach Boys, 2023). « Placer ces sons dans un espace immersif signifie […] que vous pouvez entendre des instruments que vous n’avez jamais entendus auparavant », déclare Martin (The Beach Boys, 2023). Par ailleurs, il est conscient des habitudes d’écoute d’une génération actuelle « qui n’écoute pas de mono » (Cruse, 2023). Ainsi, pour respecter à la fois la musique et les préférences d’écoute d’aujourd’hui, il voit à travers le Dolby Atmos une solution : « La grande chose à propos de l’audio immersif est que vous pouvez avoir des racines au milieu et faire venir des voix autour de vous » (Cruse, 2023). Guidé également par la version stéréo mixée par Mark Linett en 1997, Giles Martin dévoile la démarche qu’il a entreprise et ses principaux objectifs de remixage pour Pet Sounds : « Ce que j’ai essayé de faire, c’est […] de trouver un sens à ce que c’est d’être dans le studio avec le groupe. Je pense que l’intimité est la clé » (Tamarkin, 2023). Par ces termes, Martin annonce l’un des grands enjeux que peut présenter l’évolution immersive d’un master mono original, le réalisme sonore. Il veut ainsi signifier que se sentir devant les musiciens en écoutant un remixage immersif peut pleinement contribuer à capter toute « l’imagination » musicale contenue dans cet album. Finalement, dans cette idée, Martin se sentirait « honoré et privilégié » si ce remixage permettait de ramener l’auditeur « au temps où il a entendu l’album pour la première fois » (Tamarkin, 2023). Démocratiser l’écoute de Pet Sounds, tel est donc avec ce projet immersif le souhait ultime des Beach Boys et de Giles Martin.

3. L’offre du Dolby Atmos au grand public : les plateformes de streaming audio

Examinons à présent à travers l’offre des plateformes de streaming audio, dans quelle mesure les consommateurs de musique ont aujourd’hui accès à des enregistrements mixés ou remixés en Dolby Atmos.

1) Le streaming audio, le medium plébiscité pour l’écoute musicale

L’écoute musicale constitue une activité du quotidien de plus en plus présente. D’après une étude menée par la Fédération internationale de l’industrie phonographique¹⁷ auprès de 44000 personnes du monde entier âgées de 16 à 64 ans (2022), l’écoute hebdomadaire musicale atteint en moyenne dans le monde 20,1 heures en 2022, contre 18,4 heures en 2021. En France, ce volume horaire est passé de 16,6 à 16,9 heures. Nous apprenons qu’en plus du bien-être que la musique provoque selon les personnes sondées, l’une des principales causes de cette croissance d’activité réside dans l’offre soumise. En particulier, les plateformes de streaming audio proposent un choix de musiques extrêmement vaste et varié, le tout à la demande, et sans publicité pour les abonnés. La part des usagers des plateformes de streaming audio (abonnés et non-abonnés) représente aujourd’hui 74% des personnes interrogées dans cette étude exercée dans 22 pays qui représentent 89% des revenus du marché mondial de la musique enregistrée (IFPI, 2022). Mais nous apprenons surtout, en termes de temps d’écoute, que l’écoute musicale par abonnement aux plateformes de streaming audio est le premier moyen d’écoute musicale en France (22%, à égalité avec la radio) et dans le monde (24%). Ces services sont donc à la fois le présent et l’avenir de la consommation de la musique enregistrée dans le monde.

2) L’introduction d’un catalogue musical en son immersif

D’après les statistiques données précédemment, il appartient tout logiquement aux différents services de streaming audio de proposer un catalogue d’enregistrements mixés en son immersif. Nous résumons dans le tableau 1 leur offre actuelle en la matière.

Plateforme de streaming audio	Dolby Atmos	Sony 360 Reality Audio	Stéréo
Tidal	X	X	X
Amazon Music	X	X	X
Apple Music	X		X
Spotify			X
Tencent Music			X
Deezer			X
Qobuz			X
YouTube Music			X

Tableau 1 : présence de contenus mixés en son immersif dans les catalogues musicaux proposés par les principales plateformes de streaming audio en juin 2023

Sur les 8 plateformes de streaming audio qui comptent le plus d’abonnés, 3 proposent des catalogues musicaux en Dolby Atmos (Tidal depuis 2020, Amazon Music et Apple Music depuis 2021). Tidal et Amazon Music s’ouvrent également à l’autre format immersif existant, le Sony 360 Reality Audio (Kagan, 2022). Concentrons-nous sur Apple Music, le deuxième service de streaming le plus utilisé dans le monde en examinant son catalogue Audio Spatial qui réunit plusieurs milliers de mixages et remixages en Dolby Atmos (Apple, 2023). Entre son introduction en juin 2021 et février 2022, le volume du catalogue a été multiplié par 7, dans plus de 20 genres différents (Singleton, 2022). Rien ne garantit toutefois que tous ces enregistrements aient fait comme Pet Sounds (section I.B.2.) l’objet d’un travail de remixage immersif approfondi.

En particulier maintenant, observons à travers l’offre du catalogue Audio Spatial d’Apple Music l’activité actuelle autour du remixage en son immersif de masters monophoniques de blues/R&B/soul des années 1950-60. Nous remarquons que la très grande majorité du catalogue ne concerne que des enregistrements postérieurs à 1980, donc stéréo (Apple, 2023). Et très souvent, ces enregistrements sont contemporains, auquel cas le master immersif sort en même temps que le master stéréo. Parmi les plus anciens artistes dont plusieurs morceaux ont été remixés en Dolby Atmos, citons Neil Young, The Police, Queen, Madonna, Earth, Wind and Fire, ou encore Michael Jackson. Seul le catalogue Audio Spatial Jazz contient un grand nombre d’enregistrements des années 1950-60 (Miles Davis, Wayne Shorter, Oscar Peterson, Art Blakey…), mais tous sont stéréo d’origine, et non mono. Rares sont donc encore les enregistrements monophoniques à avoir connu une transformation immersive. À notre connaissance, les seuls albums enregistrés en mono à avoir été remixés en Dolby Atmos sont ceux des Beatles et des Beach Boys que nous avons cités en section I.B.2.1. En outre, Apple Music (2023) propose un catalogue R&B immersif, mais il s’agit là du R&B contemporain qui, même s’il prend ses racines dans le R&B et la soul que nous avons présentés en section I.A.1.2. et I.A.1.3., a esthétiquement beaucoup évolué depuis l’explosion du hip-hop dans les années 1980-90. À partir de toutes ces données, nous constatons donc qu’il n’y a pas encore d’alignement entre à la fois les enregistrements les plus populaires de blues/R&B/soul et même les enregistrements monophoniques de tout genre musical, et leur présence dans le catalogue d’enregistrements remixés en Dolby Atmos de la plateforme Apple Music.

3) Une réussite commerciale mais encore masquée

Revenons dans notre cadre général et observons si l’introduction du catalogue Audio Spatial en 2021 a produit un effet déclencheur sur la part de marché d’Apple Music dans le domaine du streaming musical. Les éléments statistiques nous obligent à répondre négativement à cette proposition. Bien qu’Apple Music soit le deuxième service de streaming audio le plus plébiscité par le grand public à l’échelle mondiale, sa part de marché (13,7%) ne représente encore que la moitié de celle du leader Spotify (30,5%) (Mulligan, 2022). Or ce dernier, qui ne propose toujours pas de qualité audio lossless¹⁸ (Spotify, 2023), semble encore bien loin de vouloir s’ouvrir à l’audio immersif. Après l’introduction de l’Audio Spatial, Apple Music n’a pas vu sa part de marché augmenter entre 2021 et 2022, passant de 15% à 13,7% (Mulligan & Mulligan, 2022). Pourtant, Oliver Schusser, vice-président d’Apple pour Apple Music, affirme : « Nous avons maintenant plus de la moitié de notre base mondiale d’abonnés Apple Music qui écoute en Audio Spatial, et ce nombre augmente en fait très, très vite » (Singleton, 2022).

Pour encourager l’adoption du Dolby Atmos, plusieurs constructeurs comme Sony, Yamaha ou Apple lui-même incluent dans leurs casques audio l’option de head tracking¹⁹ et garantissent aux utilisateurs une sensation de réalisme immersif décuplée. Les Apple AirPods sont alors de loin en France les écouteurs sans fil les plus vendus en 2022, avec 53% de part de marché (Licata Caruso, 2022). Mais la même année, 8 des 10 smartphones les plus vendus dans le monde sont des Apple iPhone (Rastogi, 2023). Avec ces informations, il semblerait donc que l’atout pratique de l’audio sans fil et surtout la compatibilité avec les autres appareils Apple soient toujours aux yeux des consommateurs les deux principaux arguments à l’acquisition des écouteurs et casques Apple, loin du souci de l’écoute avec head tracking sur Apple Music.

C. La séparation de sources

1. Définition et applications

La séparation de sources est une technologie de traitement du signal capable de séparer les différentes sources (les instruments en musique) d’un master mono ou stéréo. Elle comporte diverses applications. Disposer des voix instrumentales séparées peut faciliter la transcription de partitions, pour arranger ou illustrer le travail d’un compositeur. En pédagogie également, la séparation de sources peut permettre à un interprète de retirer une partie jouée par un musicien de l’enregistrement, pour se substituer à lui et ainsi s’entraîner virtuellement à jouer une œuvre du répertoire classique/jazz²⁰ avec les autres instruments de l’ensemble, comme proposée par l’application NomadPlay (Chalot & Guittet, 2017). Pour l’indexation musicale, la détection de certains instruments favorise l’identification automatique du style musical (Richard et al., 2013). Enfin, traiter individuellement le son de chaque source dans un travail de remixage du morceau est l’application qui nous intéresse dans notre étude, en particulier pour des enregistrements dont les multipistes n’ont jamais existé, comme expliqué en section I.A.2.1. (Clavel, 2003).

2. Les deux modes de séparation de sources

1) Factorisation en matrices non négatives (NMF)

La factorisation en matrices non-négatives²¹ est un mode de séparation pour les sources émettant des sons harmoniques. Elle se charge de scinder le signal harmonique et le signal inharmonique du signal original, sous le nom de « séparation harmonique/percussive », pour réaliser ensuite une analyse harmonique (Müller, 2021).

a. La séparation harmonique/percussive préalable

Comme rappelé par Müller (2021) et illustré en figure 12, un signal harmonique est visible dans le sens horizontal d’un spectrogramme (représentation temps/fréquence) : sa fréquence fondamentale et ses harmoniques, multiples de la fondamentale, se superposent, et sa durée peut être étendue selon l’entretien du son par l’instrument. Un signal percussif se détecte lui dans le sens vertical : il se compose de toutes les fréquences à des niveaux distincts et sa durée est limitée.

*Figure 12 : Spectrogrammes divers. (a) Note jouée par une flûte (b) Sons de castagnettes (Müller, 2021).*

Considérons un bref signal comportant un son harmonique et deux sons percussifs, dont nous obtenons le spectrogramme par Transformée de Fourier à Court Terme (STFT). L’objectif de la séparation harmonique/percussive est alors de décomposer ce dernier en deux spectrogrammes semblables à la figure 12 (Müller, 2021).

*Figure 13 : (a) Fonction H détectant les composantes percussives. (b) Fonction P détectant les composantes harmoniques (Müller, 2021).*

Pour cela, deux fonctions de filtrage doivent être créées : une fonction H avec la fréquence k variable et le temps n fixe, pour prévenir d’un événement percussif. Et une fonction P avec la fréquence k fixe et le temps n variable, pour prévenir d’un événement harmonique. En faisant défiler chaque fonction sur son axe respectif (figure 13), on obtient par détection des maximas et après filtrage le spectrogramme des événements harmoniques et celui des événements percussifs.

Or l’intensité et la précision de chaque filtrage dépend du nombre de valeurs respectives. Ces spectrogrammes pseudo-harmonique Y^H et pseudo-percussif Y^P ne peuvent donc être retenus comme denrée fiable de séparation (Müller, 2021). De ceux-ci, on préfère générer deux masques binaires définis ainsi :

On applique les masques M^H et M^P directement au spectrogramme original pour obtenir le spectrogramme harmonique (figure 14c) et percussif (figure 14d). Par transformée STFT inverse, on obtient enfin séparément le signal harmonique et le signal percussif (Müller, 2021).

b. La décomposition matricielle du signal harmonique

Tous les harmoniques d’une note jouée par instrument surgissent puis disparaissent sensiblement en même temps. Selon les termes de Gaël Richard, spécialiste du traitement du signal audio, ils « s’activent » puis « se désactivent » simultanément entre eux (I’MTech, 2020). Avant de séparer les sources en jeu dans un enregistrement, la factorisation en matrices non- négatives permet d’abord de séparer toutes les notes jouées, toutes sources confondues. Elle décompose la matrice du signal harmonique en deux matrices : la matrice « dictionnaire », qui renseigne l’ensemble des notes et leurs harmoniques jouées, et la matrice « activations », qui dit à quel moment chacun d’eux intervient dans la séquence (figure 15) (Ewert & Müller, 2012). Comme le nombre et l’intensité des harmoniques joués définit le timbre d’une source, le modèle NMF regroupe les notes ayant un même profil harmonique et leur attribue une source. Ainsi, elle reconstitue individuellement chacune d’elles en remultipliant les deux matrices décomposées et en prenant soin de fixer à 0 toutes les activations des notes au profil harmonique différent, et donc jouées par d’autres sources (Ewert & Müller, 2012).

La NMF n’est pas seulement capable de séparer des sources. Ewert et Müller (2012) ont réussi à séparer la main droite et la main gauche d’un enregistrement monophonique de piano, en renseignant au modèle NMF la partition musicale exécutée dans l’extrait sonore. Mais cette séparation de sources informée ne donnant pas encore satisfaction, ils ont vu l’intérêt de demander au modèle NMF de représenter simultanément la matrice « dictionnaire » et la matrice « activations ». Pour l’aider à cela, ils lui ont transmis au préalable les informations temporelles MIDI du signal original, ce qui lui a permis d’effectuer à part l’analyse des fréquences.

*Figure 15 : Factorisation en matrices non-négatives : décomposition matricielle de la matrice originale X en une matrice « dictionnaire » W et une matrice « activations » H (Gover, 2019).*

c. Avantages et limites

La NMF présente plusieurs avantages. D’abord, elle ne demande pas de grandes capacités de calcul, tout s’opérant par analyse spectrale (Ewert & Müller, 2012). De plus, elle exploite sa capacité d’analyse harmonique pour isoler plus d’instruments de ce type que la méthode par apprentissage profond, que nous expliquerons en section I.C.2.2.

En revanche, son modèle de décomposition matricielle ne se limite qu’aux sons harmoniques, ce qui l’oblige au préalable à les séparer des sons inharmoniques ou percussifs, dont elle n’est pas en mesure de détecter ni d’isoler les sources en cause. Le modèle harmonique contient aussi une limite importante, puisque lorsqu’une même note est jouée par plusieurs instruments, il lui est difficile de distinguer quels harmoniques appartiennent à quel instrument. Par conséquent, il n’est pas rare que la séparation de sources par NMF laisse apparaître quelques interférences entre certaines sources soi-disant isolées (Liutkus et al., 2013).

2) Apprentissage profond

a. Notions et définitions

L’intelligence artificielle (IA) est un domaine de l’informatique visant à mimer l’intelligence humaine. En s’extrayant du domaine de la programmation dans lequel la machine esclave doit exécuter des tâches assignées, la machine d’intelligence artificielle apprend, à travers différents essais et erreurs, comme le ferait un cerveau humain. (Le Cun, 2019). Dans la plupart des applications, elle agit souvent dans une recherche de gain de temps pour l’être humain, se substituant souvent à lui, comme pour effectuer un diagnostic médical ou immobilier.

L’apprentissage automatique²² est l’un des principaux champs d’étude de l’IA. À partir d’une grande quantité de données qu’on lui fournit, un algorithme d’apprentissage automatique va constituer seul des modèles qui lui permettront de prédire un résultat (Le Cun, 2019). Dans le domaine audio, ses applications sont nombreuses : reconnaissance et classification de sons (voiture, chien, marteau), conversion de texte en discours et inversement, reconnaissance d’enregistrements commercialisés (ex : application Shazam) (Facciotto et al., 2017). L’opérateur évalue alors la différence entre ce qu’il sait ou souhaite faire, et ce que livre l’algorithme.

Sous-branche de l’apprentissage automatique, la machine d’apprentissage profond²³ est plus autonome et plus perfectionniste : elle réussit à identifier les erreurs qu’elle commet, les prend en compte pour recommencer son calcul et optimiser le résultat qu’elle offre (Le Cun, 2019). S’inspirant du modèle du cerveau humain, elle comprend un vaste réseau de neurones artificiels qui se réorganise sans cesse pour améliorer son rendement. Ce réseau, réparti en plusieurs couches communicantes, s’agrandit perpétuellement au cours de l’apprentissage pour définir son niveau d’expérience et ainsi son niveau de performance. Ainsi, par analogie à la plasticité synaptique du système neuronal humain, plus la machine reçoit de données et plus elle rencontre d’expériences différentes, plus elle sera performante. Quand l’algorithme d’apprentissage automatique traite plusieurs milliers de données, les réseaux de neurones en gèrent plusieurs millions, ce qui leur demande beaucoup de ressources GPU²⁴ et donc un temps de travail plus important (LeCun, 2016). Pour toutes ces raisons, l’apprentissage profond s’étend avec une efficacité exemplaire à de nombreux domaines d’application : reconnaissance vocale et faciale, traduction automatique des langues²⁵, reconnaissance d’objets ou de personnes sur une image²⁶, création d’une œuvre « à la manière de », véhicule autonome et donc, séparation de sources sonores (LeCun, 2016).

b. Séparation par apprentissage supervisé

Dans l’apprentissage automatique supervisé, la machine est guidée. En recevant de notre part le problème original et les résultats qu’elle doit en obtenir, elle cherche en continu au cours de son apprentissage à restreindre l’écart entre ceux-ci et ceux qu’elle obtient (Le Cun, 2019). Appliqué à la séparation de sources, nous définissons un cadre à la machine : nous lui fournissons un catalogue d’enregistrements contenant notamment chacun une batterie (ou des percussions), une basse (ou une contrebasse), et une ou plusieurs voix, et en guise de modèle d’apprentissage, chaque prise de son originale de ces sources en proximité (Schulze-Forster, 2021). En confrontant ces deux types d’information, la machine détecte des similitudes entre la plupart des masters : elle identifie une même source souvent prépondérante (la voix), une autre occupant essentiellement le bas du spectre (la basse), une autre percussive, sans harmonicité (la batterie), et le reste des sources sans réelle similarité. Cette phase d’identification est typique du réseau de neurones convolutif (CNN), qui apprend à extraire les caractéristiques de chaque objet pour en établir une classification qui lui permettra de le reconnaître à nouveau (Schulze-Forster, 2021). Pour affiner son analyse du signal entrant, la machine le lit à l’endroit et à l’envers. Puis elle apprend sur tous les masters reçus à isoler ces trois sources, suivant le modèle des fichiers multipistes.

Parmi les bases de données libres de droits pour encourager la recherche, citons la RWC Music Database qui regroupe les sons multipistes et informations MIDI de 315 œuvres de musique classique, jazz, instrumentale et populaire de divers pays du monde (Goto, 2002). Le critère du libre accès s’avère en effet essentiel car, pour l’apprentissage profond, plus le réseau de neurones se confronte à des esthétiques différentes, plus il se montrera performant lors d’une prochaine séparation. Initiée en 2013, la séparation de sources par apprentissage supervisé demeure aujourd’hui la méthode la plus employée pour séparer les sources d’un enregistrement, si toutefois celui-ci répond aux conditions que nous donnons ci-dessous (Schulze-Forster, 2021).

c. Avantages et limites

Tous les outils de séparation de sources actuellement disponibles sur le marché, dont trois seront présentés en section I.C.3., emploient une méthode de séparation par apprentissage supervisé. En effet, la découverte d’architectures de réseaux très performantes, l’accroissement de la puissance de calcul des processeurs graphiques et l’amélioration de la disponibilité des données d’entrée font sans cesse évoluer le modèle, donnant des résultats en progrès constant. C’est pourquoi, à l’inverse de la méthode par NMF, une séparation de sources effectuée par apprentissage profond offre pour n’importe quelle source une meilleure qualité de séparation que celle qu’on aurait opéré il y a quelques années. Le meilleur de l’IA en matière de séparation de sources est donc à venir (Miron et al., 2016).

En revanche, le modèle d’apprentissage supervisé englobe certaines limites, des prérequis que l’enregistrement doit détenir pour une séparation de sources réussie. Tout d’abord, les réseaux de neurones sont aujourd’hui entraînés pour ne séparer un enregistrement qu’en quatre stems : voix / basse / batterie / autres, le stem « autres » regroupant tous les signaux que l’outil n’a pas su isoler (Hennequin et al., 2020). Bien qu’elle soit une première avancée en matière d’apprentissage profond, cette limite empêche ainsi pour le moment les enregistrements de grandes formations²⁷ et certains styles musicaux aux instruments différents (jazz, musiques du monde) de bénéficier de ce procédé. De plus, même lorsque l’effectif instrumental répond aux exigences, le réseau de neurones a besoin d’une grande base de données audio pour apprendre à isoler. Or il n’est pas toujours aisé d’avoir accès aux multipistes d’enregistrements ayant des caractéristiques instrumentales et sonores proches de celui que nous voulons traiter (Schulze-Forster, 2021). Par exemple, pour séparer les sources d’un enregistrement de big band des années 1930-40, il faut trouver des enregistrements multipistes de big band avec une empreinte sonore similaire à celle des enregistrements de cette période (timbres et dynamique restreints, souffle, etc.). Or comme annoncé en section I.A.2.2., l’enregistrement multipiste ne naît que 20 ans après. Comme il implique la création d’une nouvelle base de données, ce cas constitue aujourd’hui l’un des principaux intérêts de la recherche en séparation de sources. Plus généralement, même pour les modèles actuels de séparation par apprentissage supervisé, il n’est pas rare que la machine éprouve des difficultés à isoler les sources d’un enregistrement dont l’équilibre ou les timbres sont différents de ceux sur lesquels elle a appris. En particulier, si un instrument est déjà mal reproduit ou trop discret dans le mixage original à cause d’une prise de son limitée, l’outil ne peut pas l’isoler et le rendre soudain plus défini. En outre, quand beaucoup de fréquences provenant de différentes sources se chevauchent, la séparation des sources peut grandement se compliquer (Schulze-Forster, 2021). Comme la machine apprend en essayant, elle laisse d’abord apparaître dans quelques stems quelques artefacts audibles en hautes fréquences, qui s’atténuent au fur et à mesure que le réseau de neurones se développe. Et comme elle agit individuellement sur chaque canal, séparer les sources d’un master stéréo est plus facile pour elle, profitant d’un premier démasquage spatial. Enfin, l’un des principaux enjeux du procédé concerne actuellement la réverbération. Non seulement celle-ci floute la source à laquelle elle appartient, mais elle masque également les autres sources. Pour certains modèles en apprentissage profond, elle peut complexifier la séparation, en particulier en queue de réverbération dont le niveau plus faible brouille son appartenance à telle ou telle source (Miron et al., 2016).

Cela dit, malgré les éventuels artefacts et manques révélés dans chaque source isolée, la séparation de sources par apprentissage profond n’occasionne aucune perte de signal, pas même le souffle d’un enregistrement. Ainsi, si l’on additionne toutes les sources séparées, on aboutit véritablement au master original qu’on a fourni à la machine. En d’autres termes, le masquage des sources, qui contribue en fait à ce que l’on perçoit d’elles dans le mixage original, se reforme. Dans une séance spécifique que nous organiserons, nous découvrions donc en section II.B.2.2. quelles sont les limites de la séparation de sources par apprentissage profond pour un remixage en son spatialisé, qui implique d’assembler les sources isolées.

3. Les logiciels de séparation de sources disponibles

1) Le moteur primaire de séparation : Spleeter (Deezer)

En 2019, le groupe de recherches de la plateforme de streaming musical Deezer lance Spleeter, un outil de séparation de sources reposant sur le fonctionnement de réseaux de neurones conçus et pré-entraînés avec l’outil d’apprentissage automatique TensorFlow (Hennequin et al., 2020). Prenant comme modèle la base de données musdb18 qui compte 150 morceaux de genres variés et leurs fichiers multipistes (au moins une batterie, une basse et des voix), il propose trois options de séparation : une séparation en 2 stems voix/accompagnement, une autre en 4 stems voix / basse / batterie / autres, et une en 5 stems en isolant en plus le piano. Avec Open-Unmix, Demucs et Nussl, Spleeter est l’un des premiers outils de séparation de sources en libre accès à publier les codes Python qui l’ont généré, afin de permettre à chacun de peaufiner l’apprentissage des modèles pré-entraînés avec TensorFlow, aussi en libre accès (Hennequin et al., 2021). Opérant une séparation en 4 stems jusqu’à 100 fois plus vite que le temps réel en utilisant un seul GPU (entraîné pendant une semaine), il est l’un des séparateurs les plus performants sur musdb18. Toute amélioration de résultat s’effectue par un nouveau codage (Hennequin et al., 2020).

2) L’édition spectrale manuelle : SpectraLayers (Steinberg)

À son origine en 2012 et pendant plusieurs années, le logiciel SpectraLayers est un outil d’édition et de restauration spectrale audionumérique qui permet de retirer ou de corriger directement sur spectrogramme certains défauts présents dans un enregistrement, comme des bruits acoustiques, des clics numériques, du souffle, des sons sibilants, une réverbération trop présente, etc. (Dobrev, 2020). En 2020, son éditeur Steinberg décide d’inclure dans la version 7 la fonctionnalité de séparation de sources, en reprenant les modèles pré-entraînés de Spleeter (Hennequin et al., 2021). Comme celui-ci, le logiciel est donc capable de diviser un master en 2, 4 ou 5 stems selon notre choix. Mais de manière très ergonomique, il offre à l’utilisateur la possibilité de prolonger et d’améliorer manuellement la séparation effectuée automatiquement. Lorsque l’on entend et l’on voit sur le spectrogramme d’un stem issu de la séparation, par exemple celui de la « Batterie », que certaines fréquences doivent normalement appartenir au stem « Voix », nous pouvons les encadrer précisément et les déplacer dans un nouveau stem que l’on crée et que l’on superposera au stem « Voix ». Ainsi, la voix retrouve un spectre plus complet et témoigne d’une amélioration de la qualité de séparation des sources. Ici, un stem est aussi appelé layer (calque), d’où le nom SpectraLayers et son idée de corriger puis superposer des calques spectraux. Par conséquent, cet éditeur spectral peut nous permettre d’obtenir une division de master en plus de 5 stems. En effet, la retouche manuelle des spectrogrammes peut aussi bien sûr s’appliquer au stem « Autres » qui contient souvent plusieurs instruments. Si ceux-ci présentent des profils spectraux suffisamment distincts, il nous est possible de les identifier, de les sélectionner et de les placer convenablement dans un nouveau calque réservé à chaque nouvelle source isolée. Nous expliquerons et illustrerons en section II.A.1.2. notre utilisation de cet outil.

3) La détection automatique des harmoniques : RipX (Hit’n’Mix)

À l’instar de SpectraLayers, RipX n’est initialement pas un outil de séparation de sources, bien que ses premières fonctionnalités s’en approchent et finissent même par servir le processus. À l’origine, Martin Dawe, son créateur, souhaite concevoir un outil capable de générer une partition musicale à partir d’un enregistrement polyphonique (Hit’n’Mix, 2023). Son premier souci est alors d’en séparer toutes les notes jouées. Après s’être heurté aux limites d’un modèle d’analyse spectrale similaire à la NMF (section I.C.2.1.), il commence à écrire un algorithme pour la détection automatique des hauteurs de notes, qu’il voit comme la clé de la réussite. Cet outil, capable de distinguer les hauteurs de différentes fréquences (fondamentales et harmoniques), en récolte également d’autres détails (amplitude, phase, variations de hauteur) qui lui permettent de relier chaque fréquence fondamentale à ses harmoniques. Ces informations deviennent si détaillées que Dawe essaie un jour à partir d’elles de resynthétiser chaque note. Malgré les premiers essais balbutiants, Dawe a un nouveau projet : pouvoir manipuler individuellement chaque note d’un enregistrement (modifier sa hauteur, sa longueur, ajouter un vibrato…). Il publie un premier logiciel, Hit’n’mix Play, qui permet non seulement ces manipulations mais aussi d’entendre chaque instrument de l’enregistrement. Mais il est conscient que la qualité de restitution des sons est largement en-deçà de l’exigence professionnelle. Ainsi pendant près de 10 ans, il se consacre à densifier son programme pour aboutir à une qualité audio digne d’un usage professionnel. En 2019, il fait paraître Hit’n’Mix Infinity, un outil hautement salué mais dont la qualité de séparation se heurte encore parfois au problème de chevauchement de fréquences de sources à l’unisson. Or, eu égard à l’actualité, Dawe constate que les tout récents modèles de séparation de sources conçus par apprentissage supervisé, dont Spleeter, se montrent plus robustes face à ce problème, pour isoler la voix, le piano, la basse et la batterie. Il décide donc de compléter son propre programme par une phase d’apprentissage automatique, le menant à la création d’un logiciel hybride, RipX (figure 16). Comme il a été formé à détecter les harmoniques des notes, l’algorithme de Dawe peut théoriquement isoler plus de sources (guitare, cordes) que les modèles actuels d’apprentissage profond, mais ceux-ci apprennent à réaliser des tâches délicates comme la distinction des harmoniques proches. Ces deux méthodes de séparation de sources viennent donc ici se compléter. Nous examinerons avec précision les fruits de ce mariage en section III.A.1.

*Figure 16 : Séparation des notes (fragments) et des sources (couleurs) par RipX*

II. Expérience n° 1 : remixage en son spatialisé de trois masters monophoniques des années 1950-60

Pour traiter en profondeur les deux grandes problématiques a et b introduites, l’expérience n°1 s’avère fondatrice. Elle vise à étudier et à comprendre les comportements de réflexion, d’écoute et de remixage d’ingénieurs du son, de musiciens et d’experts musicaux de la période 1950-60²⁸, face à des masters originaux d’enregistrements blues, R&B et soul de ces années. Reposant sur un entretien préliminaire, une écoute de masters originaux mono, puis une séance de remixage en son spatialisé, elle s’applique à répondre aux questions suivantes :

QR1 : Dans quelle mesure les participants jugent que le rendu sonore général de la version originale est en accord avec les caractéristiques musicales de la chanson abordée, qu’ils ont eux- mêmes listées préalablement ?

QR2 : Dans quelle mesure ingénieurs du son, musiciens et experts du répertoire musical ciblé modifient-ils le rendu sonore de masters de blues, R&B, soul produits dans les années 1950-60 dans le cadre d’une séance de remixage en son spatialisé ?

QR3 : Dans quelle mesure les participants jugent que le rendu sonore général de leur version partiellement remixée est en meilleur accord avec les caractéristiques musicales de la chanson traitée, qu’ils ont eux-mêmes listées préalablement ?

QR4 : Dans quelle mesure les choix de remixage des participants sont-ils cohérents avec leur conception de la relation entre une œuvre musicale et son esthétique sonore d’enregistrement dans le contexte des musiques écrites et enregistrées dans les années 1950-60 ?

Après avoir expliqué le travail de préparation et justifié le protocole de l’expérience, nous en présenterons puis en discuterons les résultats, avant de conclure.

A. Méthode expérimentale

1. Travail préliminaire : séparation des sources de 4 masters monophoniques des années 1950-60

Pour la séance de remixage, nous devons d’abord minutieusement isoler les signaux de quatre enregistrements monophoniques de la période ciblée, avant de les présenter aux participants.

1) Choix des 4 masters monophoniques

De cette période 1950-60, nous cherchons trois enregistrements de genres précis – blues, R&B et soul – et un quatrième de genre différent, qui servira d’enregistrement-test aux participants (section II.A.3.2.c.). Comme exposé en section I.C.2.2.c., chaque enregistrement doit valider, pour une séparation optimale des sources avec un outil d’apprentissage profond, les prérequis suivants :

Un effectif instrumental mesuré : voix, piano, claviers, cuivres, guitare (optimisation éventuellement possible pour les trois derniers), basse et batterie, au maximum. Pas d’autres instruments à cordes ou à percussion ;
Eviter les morceaux avec unissons et interventions simultanées, notamment entre voix et cuivres, voix et chœurs, piano et guitare ;
Une définition et une transparence correctes d’enregistrement, pour identifier aisément chaque instrument actif.

Après une revue d’écoute attentive et motivée par ces critères, nous avons choisi pour l’expérience n°1 de séparer les sources des quatre enregistrements monophoniques suivants :

m1. Wonder What is Wrong with Me – Lightnin’ Hopkins (1956) · Blues. Effectif : voix lead, guitare électrique, contrebasse, batterie

m2. Oh, Marie – Louis Prima (1959) · Jazz/R&B. Effectif : voix lead, chœurs, cuivres, piano, guitare, contrebasse, batterie

m3. B-A-B-Y – Carla Thomas (1966) · Soul. Effectif : voix lead, chœurs, cuivres, orgue, piano, guitare, basse, batterie

m4. Just Call Me Lonesome – Jim Reeves (1959) · Country [enregistrement-test] Effectif : voix lead, guitare solo, guitare rythmique, piano, contrebasse, batterie

Les trois premières chansons, aux atmosphères contrastantes, partagent des instruments semblables aux fonctions variées selon le genre. On peut donc supposer qu’elles suscitent des réflexions distinctes chez les participants, influencées par la relation singulière entre chaque esthétique sonore et chaque style musical enregistré. L’exception à noter est que les deux guitares dans la chanson country ne peuvent pas être dissociées, ce qui n’altère toutefois pas l’objectif d’essai de cet enregistrement. Nous donnons en annexe B1 toutes les informations relatives à ces quatre enregistrements.

2) Choix du logiciel de séparation de sources : SpectraLayers

Nous allons maintenant nous pencher sur la séparation de sources des trois enregistrements – sujets de l’expérience n°1 (m1, m2, m3), bien que l’enregistrement m4 ait subi strictement les mêmes opérations. Nous avons choisi pour cela l’outil SpectraLayers, présenté dans la section

I.C.3.2. En effet, la retouche manuelle de séparation que nous avons réalisée sur les différents calques de spectrogrammes s’avère être un atout de choix, particulièrement concernant les signaux d’instruments non séparés automatiquement, comme :

La voix et les chœurs dans le stem « Voix » d’Oh, Marie de Louis Prima et de B-A-B-Y de Carla Thomas ;
Le saxophone ténor solo, les cuivres et la guitare dans le stem « Autres » d’Oh, Marie ;
Les cuivres, la guitare et l’orgue dans le stem « Autres » de B-A-B-Y.

Plus généralement, notre retouche manuelle permet de prolonger et d’affiner la séparation résultante de l’apprentissage profond. En sélectionnant certaines fréquences ou groupes de fréquences de la source A, placées par erreur dans le stem de la source B lors de la séparation initiale, nous les avons réintégrées dans le stem de la source A, nouvellement créé ou préexistant. Le bénéfice est double : libérer tous les signaux utiles de certains masques et reconstituer les sources dispersées dans différents stems par le logiciel. De toute évidence, ce dernier aurait théoriquement dû effectuer ce travail, dont on déduit déjà une première limite du modèle de séparation de sources par apprentissage profond sans détection des harmoniques des notes.

Les figures 17 et 18 montrent respectivement de façon générale et fine l’efficacité de notre édition spectrale lorsque certaines empreintes fréquentielles se trouvent par erreur dans le stem d’une autre source. Les figures 19 et 20 témoignent, elles, d’une précision certaine de l’outil quand nous sélectionnons des fréquences appartenant à une même source pour en créer un nouveau stem, non généré par l’apprentissage profond. Dans la figure 20, nous avons récupéré une quantité importante d’harmoniques dans le stem « Autres » pour la « Voix » de Prima (dont le spectre s’est aussitôt reformé). Nous l’avons ensuite scindé en un stem « Voix » définitif et un nouveau stem « Sax dialogue ». À l’instar des sources, les possibilités de remixage semblent déjà se multiplier.

Toutefois, malgré sa capacité théorique à isoler le piano, la réalité diffère. La figure 21 révèle ce défaut, le stem « Piano » original de B-A-B-Y apparaissant très peu fourni car le signal de l’instrument se trouve en fait principalement dans le stem « Autres ». Certes notre retouche manuelle corrige facilement cet écart, mais elle montre encore les limites d’un système ne détectant pas les harmoniques des notes. Mais après l’une de nos tentatives, l’isolation du piano dans un morceau où l’instrument est plus présent donne des résultats plus probants. Il semblerait donc que l’équilibre des niveaux entre les sources du master influence la qualité de leur séparation.

À l’issue de ce long travail – une vingtaine d’heures passées par morceau –, nous avons obtenu pour chaque enregistrement-sujet le signal des sources suivantes :

*Tableau 2 : Comparaison de l’identité et du nombre de sources séparées avant et après retouche manuelle pour les trois enregistrements-sujets de l’expérience n°1*

Reste à savoir dans quelle mesure cette qualité de séparation permettra aux participants de l’expérience de réaliser leurs envies de remixage. Nous l’expliciterons dans la section II.B.2.2.

2. Préparation de l’expérience

1) Conception d’une interface simplifiée de remixage à l’usage des participants

Comme abordé dans la section II.A.3.1, notre expérience s’adresse à une majorité de participants non-ingénieurs du son, non-initiés au mixage. Il est donc primordial que l’interface de remixage que nous mettrons à leur disposition soit simplifiée et intuitive pour leur permettre de penser d’abord par la musique, notre principale motivation.

Pour cette séance de remixage, nous utiliserons SPAT Revolution, un logiciel professionnel de mixage 3D orienté objet, adapté à notre expérience. En effet, chaque Room (salle virtuelle) accueillera les sources de chaque morceau. Les quatre Room (3 morceaux-sujets + 1 morceau- test) resteront actives toute la séance, évitant ainsi toute manipulation complexe, en particulier lorsque nous passerons au remixage de la chanson suivante. La session SPAT unique à chaque participant agira en fond pour collecter et quantifier les manipulations sonores lui parvenant d’un contrôleur OSC, l’interface manipulée par le participant.

Nous avons ainsi contacté Nicolas Erard, employé à l’entreprise Flux Audio conceptrice de SPAT Revolution, pour concevoir ensemble une interface de contrôle spécialement adaptée au logiciel et à nos besoins. Après discussions, Nicolas a adapté les bases d’interaction entre SPAT Revolution et son interface de contrôle existante²⁹ avec l’application OSC³⁰ Open Stage Control³¹, pour nous guider dans la personnalisation de l’interface en fonction de nos besoins pour l’expérience. De nombreux éléments ont alors rapidement convergé entre nos exigences (facilité, lisibilité, efficacité) et les fonctionnalités offertes par SPAT via Open Stage Control. Nous avons ainsi défini ensemble trois caractéristiques concrètes de notre interface de remixage :

Une limitation à 4 paramètres de mixage fondamentaux : niveau, égalisation (3 égaliseurs bas/medium/aigu à facteur Q large et fixe), localisation 360°, niveau de réverbération
Une facilité de manipulation : tout paramètre est aisément modulable par la souris
- Une clarté de la présentation : présentation en tranches, cadres, légendes, couleurs

Après plusieurs modifications d’optimisation opérées à l’issue de deux pré-tests (section II.A.4.), l’interface de remixage sur Open Stage Control se présente comme ci-dessous :

Figure 22 : Interface de remixage de la chanson B-A-B-Y proposée aux participants de l’expérience n°1 — *Figure 22 : Interface de remixage de la chanson* B-A-B-Y *proposée aux participants de l’expérience n°1*

2) Conception d’une interface de récupération des données de remixage des participants

Afin d’apporter une réponse valide aux questions Q.R.2 et Q.R.4, et comme développé en section II.A.3.2.c., nous avons souhaité connaître le nombre et l’ordre des manipulations de remixage effectuées par le participant sur chaque morceau remixé. Avec l’aide de mon directeur de mémoire, nous avons donc créé une interface chargée de retranscrire ces informations dans un fichier texte. En voici l’architecture sous Max/MSP et un exemple de script livré en sortie :

À titre d’exemple, nous décodons ci-dessous les informations récupérées en figure 24 :

« Le 11/07/2023 à 18h09, l’ingénieur du son n°1 a manipulé dans cet ordre les paramètres de remixage suivants sur l’enregistrement de la chanson Wonder That is Wrong with Me : 1. Niveau de la voix lead / 2. Localisation de la guitare / 3. Niveau de réverbération de la guitare / 4. EQ bas de la batterie / 5. Niveau de la batterie / 6. Niveau de la batterie / 7. Niveau de réverbération de la voix / 8. Localisation de la batterie. »

Nous effectuerons à l’issue de chaque remixage une capture d’écran de l’interface de remixage qui complètera ce fichier pour nous assurer une certaine finesse d’analyse des résultats.

3) Lieu d’accueil et synoptique

C’est le plateau 1 du conservatoire – une salle équipée d’un dôme de 44 enceintes commandées par le logiciel de traitement et de diffusion multicanale AFC Image (Yamaha), et donc destinée au mixage en son immersif – qui nous accueillera avec les participants.

Nous avons donc abouti pour l’expérience n°1 au synoptique suivant :

*Figure 25 : Synoptique du dispositif pour l’expérience n°1*

En plus de sa grande stabilité, la station audio Reaper nous permet d’enregistrer dans une piste audio multicanale le remixage en son spatialisé de chaque participant, comme détaillé ici :

Figure 26 : Session Reaper de la chanson Oh, Marie au terme de l’expérience n°1, regroupant l’ensemble des remixages en son spatialisé des participants — *Figure 26 : Session Reaper de la chanson* Oh, Marie *au terme de l’expérience n°1, regroupant l’ensemble des remixages en son spatialisé des participants*

3. Protocole expérimental

Le protocole présenté ci-dessous est le résultat de quelques corrections apportées à l’issue de deux pré-tests, que nous renseignerons dans la section II.A.4.

1) Profils de participants

Cette expérience ne vise pas à juger les qualités de mixeur de chacun des participants, mais entend étudier leur attitude vis-à-vis d’enregistrements anciens. Afin de discerner d’éventuelles disparités de comportement, nous avons choisi de convier plusieurs profils de participants. Tous auront toutefois en commun une oreille musicale avisée, certains termes et questions pouvant être inaccessibles pour des personnes non musiciennes.

Les ingénieurs du son, avertis des contextes technologiques d’enregistrement de cette époque méritent toute notre attention pour discuter, écouter et remixer de tels enregistrements. Sur le plan musical, les mélomanes des années 1950-60 sont essentiels pour évoquer des chansons, des artistes et des enregistrements qui leur tiennent à cœur. Enfin les musiciens, créateurs musicaux, apportent une oreille et une sensibilité uniques et alignées sur l’essence musicale de notre étude.

Pour cette expérience n°1, nous avons donc invité par e-mail 8 ingénieurs du son, 8 musiciens et 8 experts du répertoire blues/R&B/soul des années 1950-60³². Tous répondent aux variables d’âge, de sexe, de niveau d’expérience en mixage et de connaissance du répertoire musical ciblé.

*Figure 27 : Données démographiques des participants de l’expérience n°1. (a) Sexe. (b) Âge.(c) Expérience en mixage. (d) Connaissance du répertoire blues/R&B/soul 1950-60.*

2) Déroulé de l’expérience

a) Entretien préliminaire semi-dirigé : le rapport conceptuel à l’œuvre musicale, à l’esthétique sonore d’enregistrement et à leur relation

Cette première phase d’échanges, visible en annexe B2, désire sonder le participant sur la pratique du remixage d’enregistrements passés. Après en avoir établi les fondations autour de la notion d’esthétique sonore (QA1) et de sa relation avec l’œuvre qu’elle a un jour enlacée (QA2), nous poursuivrons la discussion avec des questions plus ciblées (QA3, QA4) qui éclaireront notre sondage. Si le participant montre un intérêt au remixage d’enregistrements des années 1950-60, nous lui demanderons s’il pense à un aspect sonore particulier qu’il corrigerait sur la plupart des enregistrements de cette période (QA5). Nous retiendrons cette donnée pour la comparer ultérieurement avec la réponse donnée en QB6 ainsi qu’avec les choix de remixage effectués (voir section II.B.2.1.) pour chaque morceau de l’expérience. Lorsque cela se révélait pertinent ou nécessaire pour nos objectifs de recherche, nous avons parfois choisi de suivre le participant dans des explications plus détaillées, plus illustrées, afin de mettre en lumière des conceptions plus générales (principe de l’entretien semi-dirigé).

b) Questionnaire d’écoute du master original : les désirs sonores

La deuxième partie de l’expérience devient davantage active pour le participant. Nous lui faisons écouter au même niveau sonore le master original mono des chansons de Lightnin’ Hopkins, Louis Prima et Carla Thomas, sélectionnées en section II.A.1.1.).

Le questionnaire d’écoute que nous soumettons vise à comprendre dans quelle mesure la musique appelle le participant à lui souhaiter une quelconque modification sonore du master original. Il a aussi pour objectif, en vue de la partie III, de déterminer lequel des trois enregistrements originaux présente aux yeux des participants le rendu sonore global le moins en accord avec ce que représente selon eux l’essence du morceau en question.

Comme le montre l’intitulé des questions posées en annexe B3, nous avons précisément construit ce questionnaire autour de la motivation centrale de notre étude, l’œuvre, la musique.

La question QB1 est essentielle car plus le participant alimente sa réponse, plus il lui sera facile de répondre aux questions suivantes qui concernent certes l’aspect sonore mais toujours en étroite relation avec la chanson abordée. C’est pourquoi elle fait volontairement appel à des ressentis et des évocations très personnelles liées à la musique entendue.

Les questions QB2 à QB5, consacrées au rendu sonore, constituent le cœur de notre étude des comportements d’écoute face à des masters originaux des années 1950-60. Les participants y ont alors l’occasion en pratique de donner leur avis sur la relation entre une œuvre et l’esthétique sonore de son enregistrement. Pour tirer des résultats ciblés de ce questionnaire, nous faciliterons aussi l’analyse d’écoute des participants en la portant sur trois critères sonores essentiels en écoute critique d’enregistrement : le rendu de l’équilibre entre les sources (QB3), celui de leurs timbres (QB4) et celui de l’espace dont elles disposent dans l’image sonore (QB5). La question QB5 regroupe l’aspect mono de l’enregistrement, son relief, sa profondeur et la réverbération. Guidés par la composante musicale, les participants devront ajuster ces critères selon elle en évaluant dans quelle mesure le rendu sonore du master original convient à leur propre définition –stylistique, esthétique, historique – de la chanson (QB1). Enfin, nous identifierons les éventuels désirs sonores des participants en faveur de la chanson par la question QB6 qui, sans la nommer, constitue en fait un préambule à la proposition suivante de remixage.

Lors des écoutes, pour s’affranchir d’un potentiel effet d’ordre, nous avons choisi de contrebalancer l’ordre des trois masters écoutés d’un participant à un autre. Comme six ordres sont mathématiquement possibles, nous effectuerons chacun d’eux quatre fois pour l’expérience (6×4 = 24 participants).

c) Séance de remixage : les choix sonores

La phase pleinement pratique de l’expérience a enfin lieu. Nous invitons les participants à concrétiser leurs éventuelles envies de modifications sonores formulées pour chaque enregistrement en QB6, à travers une séance de remixage en son spatialisé spécialement configurée. Pour s’assurer d’un maximum de neutralité dans nos explications, nous leur demanderons de lire l’énoncé en annexe B4 avant de se lancer pleinement dans l’exercice.

À ce moment, nous introduisons aux participants l’interface de remixage présentée en section II.A.2.1. Avant qu’ils ne commencent à s’entraîner avec elle, nous prenons le temps de leur montrer comment chaque paramètre de remixage peut être aisément ajusté avec la souris. Après cela, tous les participants seront libres de leurs choix et de leurs actions.

Devant l’intérêt que peut susciter cette séance de remixage, il est important de rappeler l’objectif de recherche de la présente expérience : examiner les comportements d’écoute et, ici, de remixage des différents profils de participants sur trois enregistrements monophoniques des années 1950-60. Le but ultime n’est donc ni pour eux ni pour nous d’obtenir pour chaque chanson une qualité de remixage irréprochable, un rendu sonore « idéal » vis-à-vis de la musique, mais de savoir quelles sont les premières manipulations sonores qu’ils entreprennent pour y parvenir. C’est en ce sens que nous avons limité le nombre de manipulations de remixage possibles. Dans cette expérience n°1, les comportements et les choix musicaux priment sur la performance.

Figure 28 : Photographie d’une séance de remixage de l’expérience n°1 au plateau 1 du CNSMDP. (Chaque participant remixe debout ou sur chaise haute pour se situer à bonne hauteur d’enceintes. Les enceintes barrées ne sont pas utilisées).

d) Questionnaire d’autocritique du nouveau master avec entretien d’auto-confrontation individuelle : les conclusions

Après chaque remixage effectué suivant l’ordre des chansons de la phase d’écoute, nous demanderons au participant d’adopter un regard critique sur son propre master en le comparant au master original, toujours vis-à-vis de sa conception de l’œuvre. Notre objectif est de savoir dans quelle mesure les premières manipulations qu’il a pu effectuer le rapprochent déjà de son rendu sonore idéal pour la chanson (Q.R.3), telle qu’il l’a présentée en QB1. Plus précisément, des questions d’auto-confrontation individuelle s’intéressent ici pour chaque morceau, en observant l’état final de l’interface de remixage, à discuter de l’esprit de cohérence du participant entre ses désirs sonores formulés en QB6 et ses choix opérés dans la phase c). Nous les mêlons finalement à la phase d’autocritique du nouveau master pour former un questionnaire oral, disponible en annexe B5, que nous présentons volontairement comme le revers littéral de celui de l’écoute du master original, toujours centré sur l’œuvre.

La question QD6 du questionnaire d’autocritique s’avère essentielle sur le plan technologique et méthodologique. Elle nous permettra de savoir dans quelle mesure la retouche manuelle d’une séparation de sources opérée aujourd’hui par apprentissage profond et sans détection des harmoniques permet aux participants de réaliser leurs envies sonores. Ainsi, nous saurons dans quelle mesure ces perturbations éventuelles jouent un rôle dans leur évaluation du rendu sonore du nouveau master vis-à-vis de la substance musicale.

Suite à l’enchaînement remixage/questionnaire d’autocritique de chacun des trois enregistrements, l’expérience prend fin.

3) Collecte et analyse des données

Nous analyserons les réponses issues de l’entretien préliminaire et les réponses verbales au questionnaire d’écoute par théorie ancrée (Glaser & Strauss, 1967). En classant les termes et expressions prononcés par les participants en concepts généraux et sous-concepts, nous définirons les idées générales qui émergent de chacune de leur réponse.

Concernant les évaluations attribuées aux rendus sonores des masters originaux et remixés, nous les synthétiserons pour chaque morceau et chaque critère sonore en créant des boîtes à moustaches pour illustrer les variations des évaluations avant et après le remixage.

Nous reprendrons les informations fournies par l’interface Max/MSP présentée en section II.A.2.2. pour élaborer pour chaque morceau remixé le digramme en barres des manipulations et des paramètres de remixage les plus privilégiés par l’ensemble des participants.

Nous calculerons et renseignerons l’ensemble de ces résultats par chanson et par profil, ce qui nous permettra d’établir des comparaisons selon ces deux axes.

4. Pré-tests : corrections apportées au protocole initial

Pour évaluer la fiabilité et la fluidité du protocole avant les premiers tests, nous avons organisé deux pré-tests avec deux étudiants en fin de cursus FSMS.

Le premier d’entre eux visait à contrôler la fiabilité du protocole : l’intitulé, l’objectivité et l’enchaînement logique de toutes les questions, le réglage du niveau d’écoute identique à tous les morceaux, les conditions de remixage (interface, nombre précis de manipulations autorisé) et le fonctionnement de l’interface de récupération des données de remixage. Comme ce protocole est dense, nous avons demandé au premier étudiant de formuler ses remarques sur le contenu de l’expérience dès qu’elles lui apparaissaient. Ainsi, sans contrainte de temps, nous avons pu noter les ajustements protocolaires que nous avons réalisés pour la première séance :

Nous inviterons les participants à orienter chaque écoute d’un master original vers les éléments du questionnaire d’écoute : évocations et caractéristiques musicales de la chanson, rendu sonore global, rendu de l’équilibre, des timbres, de l’espace des différentes sources sonores vis-à-vis de la musique. Cette préparation s’avère précieuse, car ces questions sont peu souvent explorées pour des enregistrements passés ;
Nous effectuerons oralement les questionnaires d’écoute du master original et d’autocritique du nouveau master, pour permettre aux participants de partager immédiatement des impressions, que nous retranscrirons fidèlement en direct ;
Nous étendrons à 12 le nombre de manipulations de remixage autorisé, pour offrir aux participants une plus grande latitude d’exécution de leurs idées musicales et augmenter le nombre de choix liés à celles-ci ;
Afin de ne pas entraver les idées musicales des participants, ajuster successivement les potentiomètres d’égalisation (bas, medium, aigu) d’une même source sera compté comme une seule manipulation dans l’interface Max/MSP ;
Toujours pour satisfaire les envies sonores des participants, nous leur permettrons d’éventuellement modifier dans SPAT Revolution la longueur et la queue de réverbération pendant chaque remixage, sans que cela ne compte comme une manipulation. Bien que ces paramètres aient été initialement réglés par nos soins en fonction du morceau traité ;
Nous concevrons une session OSC et une session SPAT unique à chaque participant, afin d’en sauvegarder et d’en analyser les positions et valeurs finales des paramètres touchés.

Le second pré-test, qui a entériné les précédents ajustements, entendait quant à lui vérifier la fluidité du protocole, avec l’objectif de tenir cette riche expérience en un temps limité d’1h30. À l’issue de ce pré-test au rythme plutôt modéré, nous sommes finalement parvenus à une durée d’1h45. Nous nous sommes donc finalement fixés comme objectifs de test de passer maximum 15 min sur l’entretien préliminaire (phase a) et 15 min sur chaque chanson écoutée/critiquée (phase b) et remixée/critiquée (phase d).

B. Résultats expérimentaux : analyse par morceau et par profil

1. Analyse quantitative

Préambule : mesure du degré de participation à la séance de remixage

La très grande majorité des participants a adoré cette expérience car les questions et les manipulations mises en jeu leur ont ouvert de nouvelles perspectives d’approche dans leur propre domaine d’activité³³. Nous n’avions honnêtement pas prévu cet engouement. En particulier, aucun n’a été gêné par la longueur de l’expérience (1h45-2h), et certains l’ont même fait durer davantage pour enrichir la discussion dans les différents questionnaires et/ou profiter du temps de remixage. De prime abord, il est important de savoir dans quelle mesure les différents profils de participants se sont engagés dans cette session de remixage pour chacun des trois morceaux. Nous pouvons évaluer cet aspect en calculant la moyenne et l’écart-type du nombre de manipulations de remixage par morceau et par profil :

*Tableau 3 : Moyenne et écart-type du nombre de manipulations pour les trois chansons remixées*

Premièrement, avec une moyenne totale élevée et très resserrée du nombre de manipulations (10,42 / 10,5 / 10,33 pour chaque profil respectif, sur 12 autorisées), nous pouvons voir que tous les profils de participants ont joué le jeu du remixage, et de façon assez égale. Les ingénieurs du son sont bien pleinement engagés dans la démarche de remixage. De plus, de manière positive, les experts du répertoire ne sont pas si fermés à l’idée de se prêter au jeu des modifications sonores d’enregistrements qu’ils ont coutume depuis longtemps d’écouter.

En revanche, on aperçoit différents comportements de remixage lorsque l’on confronte les trois enregistrements. Assez nettement, c’est la chanson B-A-B-Y qui a connu en moyenne à travers la session le plus grand nombre de manipulations sonores (11,33) avec la plus faible dispersion (1,04). En détail, la moyenne très élevée et l’écart-type très bas du nombre d’opérations montrent pour tous les profils un premier intérêt pour modifier en faveur de cette chanson certains aspects sonores originaux. C’est aussi sur celle-ci que les ingénieurs du son et les experts du répertoire ont opéré le plus de manipulations. Nous verrons quelles sont-elles en section II.B.1.2.

1) Évolution des notes de rendu sonore vis-à-vis de la musique entre le master original et le master remixé de chaque participant

Figure 29 : Évolution en fonction du profil de participant des notes attribuées aux rendus sonores entre le master original et le nouveau master remixé des trois chansons : Wonder What is Wrong with Me (Lightnin’ Hopkins), Oh, Marie (Louis Prima) et B-A-B-Y (Carla Thomas). Légende : 1 colonne = 1 chanson // 1 ligne = 1 critère d’évaluation sonore

La figure 29³⁴ nous apportent six résultats majeurs sur les préférences de rendu sonore des participants entre le master original et le master qu’ils ont remixé :

R1 : L’enregistrement de la chanson de Louis Prima présente aux yeux des participants le rendu sonore original le plus en accord avec les caractéristiques musicales de la chanson. Nous discuterons en section II.C. de l’enregistrement au rendu sonore original entravant le plus le propos musical.

R2 : La version des chansons de Lightnin’ Hopkins et de Carla Thomas, remixée par chaque participant a selon tous les profils en moyenne un meilleur rendu sonore vis-à-vis de la musique que la version originale, tous critères sonores confondus.

R3 : En particulier, en plus d’être plus élevées en moyenne, les notes attribuées au rendu de l’espace des sources sonores des chansons de Lightnin’ Hopkins et de Carla Thomas sont plus homogènes dans les versions remixées que dans la version originale.

R4 : Chaque profil de participant s’accorde moins sur le rendu sonore général de la chanson Lightnin’ Hopkins que de celle Carla Thomas, pour la version originale et leur version remixée.

R5 : Les experts 1950-60 sont, en moyenne sur chacun des trois morceaux et vis-à-vis des caractéristiques musicales, plus satisfaits du rendu sonore de leur version remixée que de celui de la version originale, tous critères sonores confondus.

R6 : Les ingénieurs du son sont en moyenne les moins satisfaits du rendu sonore de leur version remixée de la chanson de Louis Prima, tous critères sonores confondus.

2) Paramètres et manipulations de remixage privilégiés

Nous considérons qu’une manipulation de remixage est « privilégiée » par les participants pour le remixage d’un morceau si elle est souvent pratiquée (nombre d’occurrences élevé) et si elle est prioritaire (faible ordre d’apparition). Pour chaque chanson remixée, nous avons donc représenté ces deux informations³⁵ au sein de la figure 30.

La figure 30b confirme le résultat R1 puisque le master original d’Oh, Marie n’est pas sujet à des manipulations correctives de remixage prédominantes. Les choix sont en effet davantage personnels, ce qui occasionne ce profil de graphe équilibré.

En revanche, conformément au résultat R2, les figures 30a et 30c révèlent clairement des manipulations de remixage privilégiées. Les participants les effectuent pour ajuster des aspects sonores du master original ne leur paraissant pas en totale symbiose avec la musique : le timbre et le niveau de la guitare et de la contrebasse pour le morceau de blues, le timbre de la basse et la position spatiale de l’orgue, du piano et des cuivres pour le titre de soul.

Figure 30 : Manipulations et paramètres de remixage privilégiés par tous les participants confondus lors du remixage de chaque chanson. (a) Wonder What is Wrong with Me (b) Oh, Marie (c) B-A-B-Y. (Légende : Nombre au-dessus d’une barre : nombre d’occurrences de chaque manipulation de remixage. Abscisses : manipulations de mixage ; Ordonnées : rapport nombre d’occurrences / ordre moyen d’apparition). — *Figure 30 : Manipulations et paramètres de remixage privilégiés par tous les participants confondus lors du remixage de chaque chanson. (a)* Wonder What is Wrong with Me *(b)* Oh, Marie *(c)* B-A-B-Y. *(Légende : Nombre au-dessus d’une barre : nombre d’occurrences de chaque manipulation de remixage.* *Abscisses : manipulations de mixage ; Ordonnées : rapport nombre d’occurrences / ordre moyen d’apparition).*

Figure 31 : Manipulations de remixage privilégiées par tous les participants confondus, tous morceaux remixés confondus. (Légende : Abscisses : manipulations de mixage ; Ordonnées : rapport nombre d’occurrences / ordre moyen d’apparition). — *Figure 31 : Manipulations de remixage privilégiées par tous les participants confondus, tous morceaux remixés confondus. (Légende : Abscisses : manipulations de mixage ;* *Ordonnées : rapport nombre d’occurrences / ordre moyen d’apparition).*

La figure 31 nous offre une vue d’ensemble des manipulations sonores privilégiées par les participants pour remixer des masters monophoniques de blues/R&B/soul des années 1950-60³⁶. Contrairement à la figure 30, nous n’y renseignons pas le nombre d’occurrences au-dessus de chaque barre de manipulation, par souci de lisibilité. En particulier, nous pouvons identifier la basse comme étant pour eux l’instrument-clé pour améliorer drastiquement le rendu sonore général en faveur du message musical.

*Tableau 4 : Paramètres de remixage privilégiés par les participants pour les trois chansons remixées*

Plus généralement et directement lié à nos deux problématiques qui concernent le remixage en son immersif, nous pouvons remarquer à travers le tableau 4 que la localisation à 360° constitue le paramètre de remixage le plus privilégié en moyenne sur les trois chansons par l’ensemble des participants pour s’approcher d’un rendu sonore idéal.

2. Analyse qualitative

1) Niveau de correspondance entre les réponses à l’entretien préliminaire et les choix de remixage

Pour traiter la question Q.R.4, intéressons-nous à présent aux conceptions des participants évoquées dans l’entretien préliminaire.

Tout d’abord, pour pouvoir parler ensuite du terme, nous avons cumulé toutes les réponses données aux questions QA1, QA2 et QA3 pour établir une définition médiane des participants de l’esthétique sonore d’un enregistrement musical : empreinte ou couleur sonore particulière perceptible sur l’enregistrement d’une œuvre musicale. Liée aux techniques d’enregistrement et aux modes sonores caractéristiques d’une époque, elle constitue le plus souvent un choix, opéré en lien étroit avec l’esthétique musicale de l’œuvre et partagé par l’ingénieur du son, le producteur de séance et les artistes, qui peuvent même parfois en être à l’initiative et créer la musique autour d’elle. Ce choix, parfois réfléchi en amont de l’enregistrement, intervient le jour de la séance (acoustique de studio, positionnement des musiciens, type et positionnement de micros) et lors du mixage (quel type de timbres, de plans sonores, de réverbération) dans le but prioritaire de servir le discours musical. Pouvant avoir un impact énorme sur notre perception postérieure de l’œuvre – variant selon le style musical – et se définir comme l’identité sonore du label ou de l’artiste, elle peut prétendre à devenir une référence pour d’autres enregistrements.

Figure 32 : Positionnement des participants sur le caractère dissociable ou indissociable d’une œuvre musicale et de son esthétique sonore d’enregistrement pour les musiques écrites et enregistrées dans les années 1950-60 (question QA3 de l’entretien préliminaire)

Figure 33 : Positionnement des participants sur le remixage d’enregistrements des années 1950-60 pour lesquels « le rendu sonore dessert selon eux la musique qui a été pensée et composée » (question QA4 de l’entretien préliminaire)

*Figure 34 : Aspect sonore que les participants favorables au remixage corrigeraient en priorité en faveur de certaines œuvres enregistrées dans les années 1950-60 (QA5)*

En accord avec cette définition de l’esthétique sonore, une large majorité de participants (75%) considère qu’elle peut être dissociée de l’œuvre musicale pour les productions des années 1950-60. La figure 32 illustre leurs perspectives sur cette question analysée par théorie ancrée.

Notons le désir exprimé par deux ingénieurs du son d’entendre en audio immersif certains enregistrements mono de cette période : un concert de Charlie Parker pour l’un, un album des Beach Boys pour l’autre. Cette dissociabilité entre l’œuvre et son esthétique sonore originale revêt un caractère essentiel pour valider notre approche centrée sur la musique : modifier la seconde sans altérer la première.

Mais justement, qu’en est-il du remixage aux yeux des participants ? 83% d’entre eux (20/24) sont favorables à la modification d’aspects sonores d’enregistrements des années 1950-60 qu’ils connaissent, pour lesquels l’esthétique sonore ou au moins son rendu joue en défaveur de l’œuvre, contrairement à la définition donnée précédemment. La figure 33 montre alors les aspects positifs, limitants et négatifs que relèvent les participants pour la pratique du remixage dans ce contexte.

Les principaux avantages incluent l’éclaircissement du discours musical par un nouvel espace sonore et le moyen de revitaliser certains enregistrements au profit du grand public. Cependant, une grande prudence nous est recommandée par les participants, qui implique de se renseigner sur la nature et l’origine des aspects sonores soi-disant gênants de ces enregistrements, et ensuite d’adopter une exigence de réalisation. En confrontant ces idées aux résultats de la figure 29, nous discuterons de cette question dans la section II.C.

Enfin, la figure 34 révèle les aspects sonores que les participants favorables au remixage souhaiteraient prioritairement modifier dans les enregistrements des années 1950-60, à travers divers exemples de leur choix. En particulier, élargir l’espace de ces enregistrements mono constitue l’un des deux désirs sonores les plus fréquemment exprimés.

Pour affiner notre étude des comportements, nous avons comparé les désirs sonores exprimés par ces participants lors de l’entretien préliminaire pour divers enregistrements de la période 1950- 60, dont cinq d’entre eux pour l’espace, avec leurs choix ultérieurs lors de la séance de remixage des trois chansons. La figure 35 nous donne donc pour chaque morceau remixé et chaque participant concerné deux informations sur les aspects sonores qu’il a annoncés à l’entretien préliminaire vouloir en priorité corriger sur divers enregistrements des années 1950-60 (QA5) : combien d’entre eux figurent en effet parmi les modifications sonores prioritaires souhaitées avant le remixage de chaque morceau (QB6), et combien d’entre eux font l’objet d’une manipulation de remixage et le cas échéant, à quel niveau de priorité. Par exemple, pour la chanson de Lightnin’ Hopkins, nous voyons que le musicien n°1 a suivi son envie préliminaire de revoir la balance des enregistrements de 1950-60 (QA5), puisqu’il a émis ce souhait de modification en écoutant le master original (cercle coloré) et qu’il l’a concrétisé au remixage en l’effectuant en première position (barre du graphe). Ou encore, pour cette même chanson, l’ingénieur du son n°7, comme dit à l’entretien préliminaire, a souhaité élargir l’espace sonore en écoutant le master original, pourtant il n’a fait aucune manipulation dans ce sens lors du remixage.

De cette figure, quatre éléments nous apparaissent importants. D’abord, les participants sont globalement cohérents entre l’entretien préliminaire et le remixage puisqu’au moins la moitié des envies sonores formulées sur divers enregistrements des années 1950-60 s’est vérifiée pour chacun des trois masters originaux écoutés avant la séance de remixage. Puis, avec 12 aspects sonores communs sur 18, c’est la chanson B-A-B-Y de Carla Thomas qui présente le plus haut niveau de corrélation entre les modifications sonores que les participants souhaitent pour elle et celles qu’ils désirent en général pour des enregistrements 1950-60. Tous les aspects sonores particuliers souhaités pour certains enregistrements de 1950-60 ont été manipulés lors du remixage de la chanson B-A-B-Y, contrairement aux autres chansons. Enfin, le paramètre de localisation spatiale est celui qui affiche le plus haut degré de corrélation entre les envies sonores générales pour des enregistrements 1950-60 et les envies sonores particulières pour chacun des trois morceaux écoutés.

Figure 35 : Niveau de correspondance entre les envies sonores formulées à l’entretien préliminaire pour des enregistrements des années 1950-60, les envies sonores pour chaque chanson de l’expérience n°1 et la priorité apportée à ces envies lors de la séance de remixage.

2) Limitations des signaux isolés sans détection des harmoniques pour le remixage en son spatialisé

Nous avons élaboré la figure 36 à partir des réponses des participants aux questions QD5 et QD6 du questionnaire d’autocritique du nouveau master. Elle nous offre une première évaluation pratique de la retouche manuelle de la séparation de sources par apprentissage profond sans détection des harmoniques, présentée en I.C.3.2. et opérée en II.A.1.2, pour un remixage en son spatialisé, expliquant certains résultats quantitatifs donnés en figure 29.

Les limitations ressenties dues à la qualité des signaux lors du remixage concernent des matières spectrales dépouillées, des interférences entre sources, des éléments non séparés, et varient selon le morceau. 54% des participants ont été limités par le signal de la basse de Lightnin’ Hopkins, car son absence d’harmoniques entravait leur envie de la redéfinir. Cela dit, tous ont reconnu que la prise de son instrumentale de 1954 était responsable de cette issue. Avec une même explication, 46% des participants ont déploré la présence aléatoire du signal du piano chez Louis Prima, qui défavorisait leur souhait d’augmenter son niveau. En revanche, seuls 13% des participants ont été limités pour remixer la chanson de Carla Thomas, ce qui leur a plus aisément permis d’entendre un master remixé plus fidèle à la musique (figure 29). Notons que 29%, 8% et 8% des participants souhaiteraient disposer des éléments séparés de batterie pour l’élargir dans chacune des trois chansons blues, R&B et soul. Finalement, 38%, 38% et 63% d’entre eux n’ont ressenti aucune limitation liée aux sources séparées et retouchées en amont, pour les remixages en son spatialisé des chansons de Lightnin’ Hopkins, Louis Prima et Carla Thomas. Cette donnée s’annonce cruciale en vue de la partie III.

*Figure 36 : Limitations relevées par les participants liées à la qualité des signaux des sources isolées pour le remixage des trois chansons : (a)* Wonder What is Wrong with Me, (b) Oh, Marie *et(c)* B-A-B-Y. Légende :

C. Discussion de l’expérience n°1 et conclusions

Cette expérience s’avère riche d’enseignements sur les comportements de réflexion, d’écoute et de remixage d’ingénieurs du son, de musiciens et d’experts musicaux du répertoire vis-à-vis des masters originaux d’enregistrements blues/R&B/soul des années 1950-60. Nous y avons donc analysé leur évaluation du rendu sonore des masters originaux (Q.R.1) et de leurs masters remixés (Q.R.3) vis-à-vis de la musique, leur engagement dans la séance de remixage (Q.R.2) et leur cohérence entre leurs réponses à l’entretien préliminaire et leurs choix de remixage (Q.R.4).

Dans leur réflexion, tous les profils de participants voient de nombreux intérêts à remixer aujourd’hui certains enregistrements de cette période, bien qu’ils n’en oublient pas de rappeler certains impératifs. La majorité, qui voit en cette pratique un atout majeur pour la musique, affirme d’abord que l’œuvre musicale peut évoluer librement sans l’esthétique sonore³⁷ issue des années 1950-60 sans que son essence ne soit menacée. Au contraire, le bénéfice du remixage serait selon eux essentiellement musical : clarification du discours, fidélité sonore, découverte de catalogues enregistrés, nouvelles perspectives de composition. Cela conforte ainsi notre idée de guider notre étude par la musique, l’œuvre pensée, composée et interprétée. Une minorité pense en revanche que le remixage n’aurait qu’une utilité technique. Toutefois, plusieurs participants signalent que ce processus, exigeant et nécessairement garant de la temporalité originale, doit être documenté. Cela implique de savoir si les aspects sonores que le remixeur souhaite modifier – même dans une démarche musicale – ont constitué le jour de l’enregistrement un choix esthétique réfléchi ou un défaut technique connu. Or les ingénieurs du son de l’expérience nous rappellent que les aspects sonores perceptibles dans un enregistrement d’époque résultent le plus souvent de contingences matérielles. Il semblerait donc que l’hypothèse du défaut technique soit d’après les participants intéressés la plus fréquente pour les enregistrements de ces années. Ainsi, nous pouvons réaliser l’envie de la majorité des participants de retravailler prioritairement la bande passante et l’espace sonore – paramètre qui nous intéresse – de certains masters originaux des années 1950-60.

Ensuite, comme l’atout du remixage semble principalement musical pour les participants, écouter et évaluer de ce point de vue le rendu sonore de trois masters originaux de blues/R&B/soul de la période concernée leur a paru certes inhabituel, mais réalisable, pertinent et parfois confortable. En effet, tous ont éveillé leur sensibilité musicale et parfois leur affection marquée et fortuite pour certaines de ces chansons, pour définir ce qui les caractérise et éventuellement ce en quoi elles les touchent. Guidés par cela, en réponse à notre question initiale Q.R.1, l’ensemble des profils – y compris les experts 1950-60 – n’ont pas hésité à juger qu’un de ces masters originaux présentaient un rendu sonore desservant la musique. Le rendu sonore de l’enregistrement de la chanson B-A-B-Y a été le plus vivement critiqué par rapport à ce que l’œuvre dégage aux yeux des participants. En particulier, c’est dans ce master original que le rendu des timbres et le rendu de l’espace des sources sonores divergent selon eux le plus de la musique. Nous apercevons là une première cohérence de résultats entre les comportements de réflexion des participants (souhait de corriger en priorité la bande passante et l’espace sonore de divers enregistrements des années 1950-60) et leur comportement d’écoute (souhait de bonifier les timbres et l’espace du master original de B-A-B-Y) en faveur de la composante musicale.

Enfin, les comportements de remixage des participants sont aussi riches d’observations. En réponse à la question Q.R.2, les trois profils se sont prêtés au jeu des manipulations sonores pour chacune des trois chansons traitées. Surtout, pour répondre à la question Q.R.3, ceux-ci ont par cette séance pratique réussi à se rapprocher de leur propre rendu sonore idéal de deux chansons sur trois (What is Wrong with Me et B-A-B-Y), ce qui constitue l’un des principaux gains de cette expérience. En particulier, le rendu de l’espace des sources sonores dans ces deux versions que les participants ont remixées profite selon eux enfin à la musique. Ainsi, nous pouvons commencer à répondre à notre grande problématique a : au contraire de la chanson Oh, Marie de Louis Prima, remixer en son immersif les masters originaux monophoniques des chansons Wonder What is Wrong with Me de Lightnin’ Hopkins et B-A-B-Y de Carla Thomas fait sens sur le plan artistique, dans la mesure où l’œuvre elle-même s’en trouve régénérée au regard des participants de tout profil. Pourtant, cette conclusion intervient même alors que la séparation de sources sans détection des harmoniques, à l’origine de cette expérience, détient encore une grande marge de progression pour satisfaire toutes les envies de remixage de chacun. Nous noterons en particulier la mauvaise tendance de l’outil à regrouper des signaux dissemblables au sein d’un même stem, ce qui, malgré notre retouche manuelle approfondie, laisse apparaître quelques artefacts ou manques fréquentiels pour certaines sources essentielles comme la basse. Par ailleurs, l’incapacité de ce modèle, que nous avons présenté en section I.C.3.2., à diviser les éléments internes de la batterie et des cuivres entrave certains désirs sonores importants liés à la construction d’un nouvel espace sonore pour l’œuvre. À ce propos, la volonté portée par les participants pour ce dernier paramètre est pleinement affirmée pour le remixage de masters monophoniques des années 1950-60 : c’est l’aspect spatial qui est privilégié pour répondre à leurs attentes sonores des trois chansons, avec en prime une correspondance maximale avec les souhaits préliminaires des participants concernés. Nous comprenons donc vis-à-vis de la problématique a que la notion immersive dans le contexte de ces enregistrements passés tient artistiquement toute sa place aux yeux des participants, en théorie comme en pratique. Nous retiendrons la grande cohérence dont ont fait preuve ces derniers depuis leurs conceptions évoquées jusqu’à leurs manipulations effectuées, ce qui répond à notre question Q.R.4.

Encouragés par les résultats positifs de cette expérience, nous souhaitons maintenant les exploiter pour proposer au grand public la possibilité d’écouter un master immersif représentatif de ceux réalisés par les participants pour l’une des trois chansons. En abordant dans la partie III les choix de remixage privilégiés en faveur de celle-ci, nous complèterons ainsi notre réponse à la problématique a et parviendrons à la problématique b.

III. Expérience n°2 : Ecoute comparative du master original et d’un master remixé en son immersif de la chanson B-A-B-Y (1966)

Pour compléter notre réponse à la problématique a et traiter la problématique b, nous avons conçu une deuxième expérience qui vise à évaluer la demande du grand public pour un master en son immersif d’une des trois chansons de l’expérience n°1. Elle tend à mesurer plus directement le degré de pertinence musicale, culturelle et historique de la pratique du remixage en son immersif des répertoires afro-américains des années 1950-60. Pour ce faire, en reprenant le plus fidèlement les envies et choix de remixage des participants de l’expérience n°1, nous avons remixé en son immersif la chanson qui, au vu de leur évaluation du rendu sonore original, récolterait a priori les plus grands avantages musicaux d’une telle restructuration sonore : il s’agit de B-A-B-Y de Carla Thomas. Plusieurs résultats de l’expérience n°1 rappelés ci-dessous sont alors venus motiver notre choix de chanson :

C’est elle qui présente selon les participants le rendu sonore original le moins en accord avec ses caractéristiques musicales (figure 29) ;
Tous les profils ont pensé en moyenne de cette chanson que leur version remixée affichait un meilleur rendu sonore vis-à-vis de la musique que la version originale (figure 29) ;
C’est la chanson pour laquelle les participants ont été les moins limités par la qualité des signaux isolés lors de la séance de remixage (figure 36) ;
Le paramètre spatial³⁸ est à la fois celui qui, aux yeux des participants, défavorise le plus fortement le master original de la chanson (figure 29) et celui qui affiche le plus haut degré de corrélation entre les envies sonores générales pour des enregistrements 1950-60 et les envies sonores particulières pour chacun des trois morceaux abordés (figure 35) ;
Tous les aspects sonores particuliers souhaités pour certains enregistrements de 1950-60 ont été manipulés lors du remixage de cette chanson, contrairement aux autres (figure 35).

Après avoir employé une autre méthode de séparation de sources et opéré ce remixage immersif de la chanson B-A-B-Y, nous avons organisé deux tests d’écoute comparative aux protocoles et aux objectifs complémentaires.

Le premier, réservé aux « producteurs » de musique (des ingénieurs du son, réalisateurs artistiques et producteurs musicaux), vise à répondre à la question suivante :

QR5 : Aux yeux experts d’ingénieurs du son, de réalisateurs artistiques et de producteurs musicaux, le présent master remixé en son immersif de la chanson B-A-B-Y de Carla Thomas, enregistrée en mono en 1966, présente-t-il aujourd’hui un intérêt culturel et musical d’être entendu par le grand public ? En outre, pourrait-il prétendre aujourd’hui à cohabiter avec le master original au sein du catalogue discographique de l’artiste et du label ?

Le second, ouvert aux « consommateurs » de musique (des musiciens, des non-musiciens et des experts musicaux du répertoire soul des années 1950-60), est dirigé vers ces questions :

QR6 : A travers laquelle des deux versions sonores – version originale ou version remixée – les participants éprouvent-ils le plus de plaisir à écouter la chanson B-A-B-Y de Carla Thomas ?

QR7 : Les consommateurs de musique seraient-ils enclins à écouter la version remixée en son immersif de la chanson B-A-B-Y plus souvent que la version sonore originale, si elle était publiée à ses côtés sur leur plateforme de streaming musical favorite ?

Ainsi, la question Q.R.5 nous permettra de parfaire notre réponse à la problématique a, quand les questions Q.R.6 et Q.R.7 alimenteront notre problématique b.

Nous consacrerons la première partie au remixage en son immersif de B-A-B-Y, la deuxième au test d’écoute pour « producteurs » et la troisième au test d’écoute pour « consommateurs ».

A. Remixage en son immersif de B-A-B-Y de Carla Thomas

1. Choix du logiciel de séparation de sources : RipX

Contrairement à l’expérience n°1 où l’étude des comportements prévalait, nous sommes à présent pour notre remixage dans une recherche de performance sonore, en vue de le présenter aux participants de l’expérience n°2 et d’apporter la réponse la plus aboutie à nos questions. C’est pourquoi, après comparaison des outils, nous avons choisi de séparer les sources de la chanson B- A-B-Y avec le logiciel d’apprentissage profond RipX, basé sur la détection des harmoniques des notes et présenté en section I.C.3.3. Pour affiner ce résultat, nous avons à nouveau conclu cette séparation en retouchant les spectrogrammes des sources sur SpectraLayers.

1) La détection des notes et des harmoniques, le facteur qualité décisif

Comme nous l’avons constaté en II.A.1.2., la séparation de sources que réalise SpectraLayers affiche plusieurs limites importantes. Au contraire, RipX écarte presque toutes ces limites grâce à l’apport déterminant de la détection des notes puis de leurs harmoniques.

Figure 37 : Visualisation spectrale de l’amélioration de la qualité de séparation des sources de B-A-B-Y entre la séparation de SpectraLayers retouchée manuellement et la séparation brute de RipX avant notre retouche manuelle — *Figure 37 : Visualisation spectrale de l’amélioration de la qualité de séparation des sources de* B-A-B-Y *entre la séparation de SpectraLayers retouchée manuellement et la séparation brute de RipX avant notre retouche manuelle*

D’abord, comme RipX relie chaque note à la source qui la joue, aucune interférence n’existe par exemple dans le stem « Voix » avec les autres sources (figure 37a), contrairement à celui délivré par SpectraLayers.

Ensuite, la détection des harmoniques de RipX offre une meilleure qualité subjective de séparation et de définition pour certaines sources sonores. La figure 37b illustre ce phénomène sur la basse, dont le rendu sonore original était le plus gênant au regard de la musique selon les participants de l’expérience n°1. Sans cette détection préliminaire, SpectraLayers nous avait obligé à retirer manuellement du stem « Basse » les interférences d’autres sources, et avec elles, le peu de son contenu harmonique disponible, limitant ainsi la bande passante supérieure de l’instrument à 1 kHz environ. RipX, en détectant ses harmoniques, a su isoler proprement la basse et surtout reformer son enveloppe sonore, redéfinissant toutes ses transitoires d’attaques avec une bande passante supérieure atteignant 3 kHz.

Le passage de la séparation de sources de SpectraLayers retouchée à la séparation brute de RipX permet les bénéfices suivants : une récupération des informations harmoniques et dynamiques de l’ensemble des sources, une stabilité harmonique et ainsi présentielle de tous les signaux au cours du temps, une forte réduction du nombre et de l’intensité des interférences entre les sources et ainsi une raréfaction des artefacts numériques.

Cependant, la détection des notes et des harmoniques a aussi révélé certains évènements indésirables. Comme le souffle de l’enregistrement n’est ni un signal harmonique, ni un signal inharmonique, RipX ne le détecte pas et n’en tient donc pas compte pour la séparation. En parallèle, lorsque les harmoniques aigus ont une intensité inférieure à celle du souffle, le logiciel n’est plus capable de les repérer et est donc forcé de les ignorer également. Toutefois, cette limitation dans le haut du spectre des signaux de batterie (cymbales), de piano et de chœurs ne nous a pas paru limitante en écoutant la séparation effectuée. La séparation qui en résulte paraît finalement fidèle à notre perception de la musique multi-instrumentale, dirigée vers le sens musical non bruité et concentrée sur les aspects harmoniques et dynamiques des instruments.

2) Disparition des limitations de remixage relevées à l’expérience n°1

Sur les 12 limitations relevées par les participants de l’expérience n°1 pour le remixage de B-A-B-Y basé sur la séparation effectuée et retouchée sur SpectraLayers, nous avons constaté que 9 avaient disparu dans la séparation de RipX, avant même notre retouche manuelle. Nous donnons en annexe C1 un tableau récapitulatif de l’amélioration progressive de la qualité des signaux isolés de la chanson, depuis la séparation brute de SpectraLayers jusqu’à la séparation de RipX retouchée sur SpectraLayers. La séparation avec RipX a permis trois avantages principaux.

Premièrement, les signaux issus de RipX se révèlent intrinsèquement mieux définis et plus constants. En les écoutant isolément, nous ressentons personnellement un contact beaucoup plus fort avec chaque interprète, grâce à la nouvelle définition des enveloppes dynamiques, expliquée précédemment. Par exemple, ce logiciel révèle le jeu et le groove du bassiste, tandis que certains participants déploraient le manque d’informations livrées par SpectraLayers. De même, le piano incomplet et inconstant donné par ce dernier laisse place grâce à RipX à un instrument ayant récupéré toute la partie de la main gauche, avec toutes ses attaques, et ce tout au long du morceau.

Deuxièmement, RipX a exaucé partiellement l’un des souhaits de remixage des participants de l’expérience n°1 en rendant la grosse caisse indépendante du reste de la batterie (figure 37c), avec une présence plus constante que dans la séparation de SpectraLayers. Nous avons dû cependant retoucher le stem « Kick » pour déplacer certaines interférences de caisse claire vers le stem « Batterie ». Avec ce stem supplémentaire, RipX fait passer de 8 à 9 le nombre de sources que nous aurons à disposition pour le remixage immersif de B-A-B-Y.

Finalement, RipX estompe tous les artefacts de SpectraLayers qui limitaient des participants pour élargir l’image sonore et égaliser certains instruments comme la basse, la guitare et le piano.

2. Ligne de conduite du remixage

Fort des résultats de l’expérience n°1, nous avons souhaité respecter au maximum les remarques et les actions des participants pour remixer à notre tour, cette fois-ci sans la moindre limitation, la chanson B-A-B-Y de Carla Thomas. De plus, nous avons retenu le discours de certains participants pendant l’entretien préliminaire, qui recommandaient une documentation avisée de l’enregistrement de la chanson avant de réaliser un tel travail.

1) Objectifs musicaux de remixage issus de l’expérience n°1

Fidèlement à la visée artistique de notre recherche, nos objectifs de remixage immersif de B-A-B-Y sont avant tout musicaux. Nous les désignons donc par les cinq caractéristiques musicales de la chanson les plus souvent mentionnées par les participants à la question QB1 de l’expérience n°1, que nous chercherons à favoriser au maximum : le groove³⁹, l’originalité de l’arrangement, la voix centrale, le genre soul et le label Stax.

Ces deux derniers traits caractéristiques ont une très forte signification sur le plan musical, culturel et historique, qui mérite de notre part de plus amples informations contextuelles. Dans l’Amérique ségrégationniste que nous avons exposée en section I.A.1., la ville de Memphis (Tennessee) concentre l’activité musicale la plus intense pour conter par les mots, les cris et le rythme, tous les drames sociétaux qui touchent la région. Au 926 East McLemore Avenue, Stax Records symbolise mieux que tous les autres labels soul cette affirmation d’identité noire. Il oriente volontairement sa musique vers toute cette population pour l’extraire des maux quotidiens. Le « son Stax », aussi appelé « Memphis Sound », se reconnaît parmi toutes les esthétiques sonores de labels par un aspect brut, tranchant et parfois rêche. En particulier, le son acoustique sec et brutal de la caisse claire d’Al Jackson, le batteur maison, impulse cette couleur sonore à tous les autres musiciens du studio (Bowman, 1997). L’un des experts 1950-60 nous a confiés que le master original de la chanson de Carla Thomas⁴⁰ sonnait étonnamment […] un peu plus pop que les autres enregistrements Stax. Lors de notre remixage immersif, nous tenterons dans un rappel culturel et historique de retrouver le cachet sonore Stax et nous analyserons à travers les questions posées aux participants de l’expérience n°2 dans quelle mesure cette démarche profite à l’œuvre.

2) Choix de remixage issus de l’expérience n°1

Ensuite, nous avons relevé puis analysé par théorie ancrée l’ensemble des remarques formulées aux questions QB3 à QB5 pour lister les manipulations de remixage à opérer prioritairement, concernant respectivement l’équilibre entre les instruments, leurs timbres et leur espace propre et environnant.

Figure 38 : Remarques des participants de l’expérience n°1 concernant le rendu sonore du master original de B-A-B-Y au regard de la musique. (a) Rendu de l’équilibre entre les sources (QB3). (b) Rendu du timbre des sources (QB4). (c) Rendu de l’espace des sources (QB5) Légende : — *Figure 38 : Remarques des participants de l’expérience n°1 concernant le rendu sonore du master original de* B-A-B-Y *au regard de la musique. (a) Rendu de l’équilibre entre les sources (QB3).* *(b) Rendu du timbre des sources (QB4). (c) Rendu de l’espace des sources (QB5) Légende :*

D’après la figure 38a, nous devrons intégrer davantage la voix et la basse dans le reste du groupe et augmenter particulièrement la guitare et la batterie⁴¹. La figure 38b indique quant à elle que nous devrons en priorité clarifier la basse⁴² et la batterie⁴³, qui empêchent selon les participants de ressentir tout le groove que contient l’œuvre. Comme désiré, nous redéfinirons également dans ce but l’ensemble des sources. Spatialement, selon la figure 38c, nous élargirons l’image de l’enregistrement et nous réduirons l’espace entre les différents plans sonores, en augmentant notamment la taille de chaque source dans un nouvel espace 3D. Nous moulerons alors ce dernier en cherchant à nous sentir immergés dans le studio A du label Stax, renvoyé par exemple au jour de la séance d’enregistrement.

*Figure 39 : Modifications sonores prioritaires qu’apporteraient les participants de l’expérience n°1 au master original pour que la chanson* B-A-B-Y *connaisse leur rendu sonore idéal (QB6)*

L’abandon de l’espace mono original de la chanson mérite de notre part une réelle considération historique, de laquelle nous tirerons notre justification. Comme nous l’avons expliqué en section I.A.3.1., les enregistrements des années 1950-60 étaient produits de telle manière à aligner le master publié sur le support d’écoute dominant à l’époque, le poste radio mono. Ainsi, conformément à notre responsabilité de nous renseigner sur sa nature créative ou subie, nous sommes en mesure d’affirmer que l’aspect mono du master original de B-A- B-Y n’a pas été décidé en 1966 par les acteurs de l’enregistrement (le producteur du label Jim Stewart, l’ingénieur du son Tom Dowd et les musiciens de la séance) dans un but artistique, mais par une contrainte technique à laquelle la musique a dû au contraire se plier⁴⁴. Toutefois, en observant la popularité de cette chanson dès le moment où elle a été publiée⁴⁵, nous pouvons constater que cette contrainte a été exploitée avec succès. Mais parce que notre étude donne la priorité à l’essence musicale des chansons, que 62,5% des participants de l’expérience n°1 mentionnent que l’aspect mono du master original est en fait limitant pour la chanson B-A-B-Y et qu’en spatialiser les sources constitue pour elle leur plus grand désir de remixage (figure 39), nous avons décidé pour notre propre remixage de nous affranchir de cette contrainte mono et de libérer les instruments de ce morceau dans un nouvel espace sonore immersif. Christophe Pirenne (1994) nous fait savoir que « l’essence de la musique soul repose sur l’expression et la transmission d’émotions et de sentiments très forts ». Tel est donc ce que nous espérerons que les participants de l’expérience n°2 ressentiront à l’écoute de notre master immersif de la chanson de Carla Thomas.

3) Compromis personnels

Comme ces différents désirs restent moyennés sur les 24 participants de l’expérience n°1, nous avons dû faire des choix sur la manière exacte d’effectuer ces opérations, en tenant comme ligne directrice les objectifs musicaux qu’ils nous donnent en section III.A.2.1.

Tout d’abord, pour produire le meilleur produit sonore possible, nous ne nous sommes fixés aucune limitation concernant le nombre de manipulations de remixage. Nous aurions pu nous ouvrir à de nouveaux paramètres de mixage, mais nous avons réalisé pendant notre travail que l’interface de remixage de l’expérience n°1 combinée à SPAT Revolution était en fait en mesure de répondre à tous nos besoins sonores.

Bien qu’en nous limitant à ces mêmes paramètres de mixage, nous avons ajusté précisément la fréquence de coupure de chaque égaliseur. Comme le facteur Q de l’égaliseur ne peut être modifié dans SPAT Revolution, ce travail s’avère essentiel pour redéfinir de manière appropriée chacune des sources sonores.

Mais avant cela, nous avons réfléchi à une disposition spatiale des sources la plus pertinente musicalement. Pour favoriser l’impression de réalisme⁴⁶ du studio d’enregistrement, nous avons décidé, telle une performance live⁴⁷, de placer tous les instruments devant nous (figure 40), tandis que tout l’espace latéral, arrière et supérieur allait être réservé à la réverbération immersive de SPAT Revolution. De plus, en gardant les instruments dans une même face de l’espace tridimensionnel, nous conservons l’esprit de groupe, cher aux studios Stax⁴⁸ et donc à cette chanson. Pour éviter un aspect trop ponctuel des sources et conserver la fusion musicale qui existe entre chacune d’elles, nous avons opté pour un mixage orienté objet avec objets stéréo. Et pour sentir de façon réaliste l’espace qu’occuperait chaque source, nous avons joué sur la largeur de chaque objet. En commençant notre travail, pour honorer l’objectif musical premier qu’est le groove, nous avons réuni au centre de l’image sonore les trois instruments qui en sont selon nous les garants : la voix (et chœurs), la basse et la batterie. Nous avons légèrement écarté ces deux derniers de part et d’autre de la voix, permettant un premier démasquage. Et pour illustrer l’originalité de l’arrangement, nous avons réparti le reste des instruments de part et d’autre de ce socle rythmique. Pour sentir la cohésion de la section rythmique, nous les avons placés ensemble à gauche de l’image. Et pour permettre aux cuivres de donner toute leur puissance sans menacer d’autres instruments, nous leur avons réservé le côté droit de l’image. En ajustant la position de chaque source, nous avons finalement toujours cherché à la démasquer des autres pour mieux percevoir son rôle dans l’arrangement, sans pour autant perdre le lien musical qu’elle entretient avec les autres. En écoutant l’avancée de notre remixage, nous avons compris que c’est cet équilibre de distances entre les sources, bien que compensé en niveau et en égalisation, qui serait la clef pour valoriser simultanément le groove et l’arrangement de la chanson.

Figure 40 : Dispositif du remixage en son immersif de B-A-B-Y en plateau 1 et espace accordé aux différentes sources sonores de la chanson — *Figure 40 : Dispositif du remixage en son immersif de* B-A-B-Y *en plateau 1 et espace accordé aux différentes sources sonores de la chanson*

Enfin, pour servir notre objectif de réalisme sonore, nous nous sommes aidés de photos et d’extraits vidéo montrant le studio A de Memphis pour imaginer et paramétrer une réverbération plausible du lieu. Nous avons ensuite proportionné le niveau de réverbération de chaque source à celui que cette dernière engendrerait de manière acoustique. Avec grande parcimonie pour respecter le style musical du morceau, les sources que nous avons le plus réverbérées sont donc la voix lead, les cuivres et la batterie.

Nous verrons en sections III.B.4. et III.C.4. dans quelle mesure notre remixage immersif de B-A-B-Y remplit les objectifs musicaux énoncés en section III.A.2.1.

B. Test d’écoute pour « producteurs » : valider la réalisation et discuter la pertinence du master remixé

Comme indiqué en préambule, nous organisons deux tests d’écoute comparative du master original et de notre nouveau master immersif de la chanson B-A-B-Y. Le premier test, destiné aux « producteurs », vise à évaluer l’intérêt musical et culturel de partager au grand public notre master remixé (Q.R.5). Pour nous garantir une équité entre les deux expériences et mesurer notre étude au plus grand nombre, nous n’avons invité à l’expérience n°2 aucun participant de l’expérience n°1. L’exception concerne les trois experts 1950-60 du test pour « consommateurs », faute d’avoir pu en trouver d’autres.

1. Profils de « producteurs » de musique

Pour y recevoir une expertise technique et musicale approfondie de notre master remixé, nous avons invité à notre test par e-mail 8 professionnels de l’industrie discographique : 5 ingénieurs du son, 2 réalisateurs artistiques et 1 producteur musical, dont les renseignements personnels sont donnés dans le tableau 5. Certains de ces participants comptent parmi les plus grands spécialistes du label Stax et de son esthétique sonore particulière, ou de la pratique du mixage musical en son immersif.

*Tableau 5 : Données démographiques des 8 participants « producteurs » de l’expérience n°2*

2. Déroulé et conditions du test

D’environ 45 min, le test pour « producteurs » se déroule en trois phases condensées.

Avant tout, nous présentons au participant le contenu et les objectifs de l’expérience, et nous nous assurons de sa bonne compréhension. Pour commencer, nous l’invitons à s’asseoir sur la chaise haute que nous avons placée au centre du système de diffusion, pour écouter le master original mono de B-A-B-Y. Nous l’appelons ensuite à répondre à un questionnaire électronique, que nous donnons en annexe C2, qui reprend exactement l’intitulé des questions QB2 à QB5 de l’expérience n°1. En effet, nous visons ici à évaluer le rendu sonore de chacun des masters par rapport aux caractéristiques musicales de la chanson : nous saurons des oreilles expertes des participants lequel des deux masters répond le mieux aux exigences de la musique sur chaque critère sonore (rendu sonore général, rendu de l’équilibre, des timbres et de l’espace des différentes sources). Pour éviter de fatiguer le participant, nous ne lui avons laissé qu’une seule case de justification pour toutes ces questions (QF5).

Puis nous lui proposons la même démarche pour notre master immersif de la chanson⁴⁹ : écoute / questionnaire. Le questionnaire est identique au premier, relatif à la musique. Nous permettons au participant de réécouter à volonté chacun des deux masters, de les confronter sur des extraits de leur choix, et de se déplacer librement dans la pièce pendant les écoutes.

Nous demandons ensuite au participant de comparer les deux masters sur trois aspects musicaux primordiaux. Deux d’entre eux, le groove (QH2) et l’arrangement (QH3), proviennent de l’expérience n°1. La question QH1, qui porte sur l’âme de la chanson, tient une place majeure pour notre égard déontologique de modifier un objet sonore existant. Elle nous aidera à alimenter notre question Q.R.5 et ainsi, notre problématique a. Grâce à ces trois questions, nous pourrons donc évaluer l’intérêt musical de l’existence du master immersif.

En conclusion, nous l’invitons à jouer le rôle d’un producteur musical dans les questions QI1 à QI5, qui nous offriront alors un éclairage avisé sur le potentiel culturel et commercial de notre remixage en son immersif de la chanson B-A-B-Y. Pour rappel, ce dernier exploite un dôme de 44 enceintes. Or il est quasiment certain qu’aucun participant ne dispose d’un tel système de diffusion. Nous avons donc ajouté dans les questions QI1 et QI2 la mention « toute considération matérielle exclue », qui supposerait de pouvoir entendre ce nouveau master via un support d’écoute bien plus usuel, le casque⁵⁰.

Ainsi, nous serons en mesure de répondre entièrement à la question Q.R.5.

Dès la phase d’écoute du master original jusqu’à la fin du test, nous nous asseyons à l’arrière de la salle pour perturber le moins possible le participant. Cependant, nous restons à tout moment à sa disposition pour répondre à ses questions.

*Figure 41 : Photographie du dispositif de l’expérience n°2 en plateau 1*

3. Collecte et analyse des données

Nous collecterons les notes attribuées par les participants aux questions QF1 à QF4 et QG1 à QG4 pour en tirer des boîtes à moustaches qui décriront l’évolution de chaque critère d’évaluation sonore vis-à-vis de la chanson, du master original au master immersif. Nous rassemblerons les justifications de ces notes, écrites par les participants en QF5 et QG5, pour les synthétiser dans un tableau évolutif, visible en annexe C3. Nous récupérerons l’ensemble des réponses fermées données à la question QH1 et suivantes, pour en dessiner un tableau statistique complet. Enfin, nous réunirons les réponses des participants aux questions QI3 et QI5, pour les figurer dans un tableau conclusif, visible en annexe C4.

4. Résultats

Figure 42 : Évolution des notes attribuées par les « producteurs » de l’expérience n°2 au rendu sonore général, au rendu de l’équilibre, des timbres et de l’espace des sources sonores de la chanson B-A-B-Y entre le master original et notre master remixé en son immersif — Figure 42 : Évolution des notes attribuées par les « producteurs » de l’expérience n°2 au rendu sonore général, au rendu de l’équilibre, des timbres et de l’espace des sources sonores de la chanson B-A-B-Y *entre le master original et notre master remixé en son immersif*

D’après la figure 42, les « producteurs » trouvent notre remixage en son immersif de

B-A-B-Y conforme à ce que suggère l’œuvre, et parfois davantage que le master original.

D’abord vis-à-vis de la chanson, ils donnent minimum en moyenne une note de 5/7 à chaque critère de rendu sonore de notre master remixé, qui témoigne donc d’un certain respect de l’écriture et de l’interprétation de l’œuvre. Par ailleurs, les participants jugent que notre master immersif offre pour 3 critères sur 4 un rendu sonore plus en lien avec la musique que le master original. Nous observons également une plus faible dispersion des notes en faveur de notre travail, sur tous les critères sonores. Bien que le rendu sonore général de B- A-B-Y ne progresse que très légèrement avec le master remixé, la plupart des experts sonores et musicaux se sont dits impressionnés par le changement dément provoqué par le master immersif, très beau, très chic, qui sonne, et surtout qui améliore et respecte le morceau, sans dénaturer le master original.

En vérité, ce sont les timbres et l’espace des sources qui profitent selon eux le plus de notre travail au regard de la musique. Leur rendu respectif passe ainsi de 4,375 à 5,25 et de 4,375 à 5,5 entre le master original et le master immersif. Le master remixé nettoie la vitre qui était entre le master original et l’auditeur, grâce à des instruments magnifiés, plus beaux comme le piano, plus clairs, plus agréables. La basse, dont le timbre confus entravait le plus la musique dans le master original lors de l’expérience n°1, est mieux définie, moins bourrue, plus constante tout au long du morceau, elle n’envahit plus et reste très présente sans écraser le son. Cependant, une minorité de participants nous ont révélé une batterie trop agressive, sans doute due au cachet Stax tranchant que nous avons tenté de lui redonner.

Quant à lui, le nouvel espace sonore, naturel, plus agréable et stable en se déplaçant selon les spécialistes du mixage en son immersif, a permis à la voix et aux autres sources de gagner de l’air, offrant à l’auditeur une meilleure impression de rendu de la dynamique du groupe et plus globalement une consommation plus directe, sans effort. Toutefois, certains participants ont été gênés par la batterie placée à droite de l’image, ou ont trouvé ce master immersif encore un peu trop frontal à cause d’une réverbération certes naturelle mais trop subtile. Ils ont donc été quelques-uns à souhaiter plus d’immersion.

En revanche, les participants ont été en moyenne moins convaincus musicalement par l’équilibre entre les sources dans notre master remixé que dans le master original. Les deux instruments relevés par une minorité de participants étant la voix trop en retrait, ce qui s’avère gênant par rapport à l’idée originale d’enregistrer pour la chanteuse , et la batterie avec une caisse claire qui claque trop parfois. Cela dit, le rendu global de l’équilibre des sources dans notre master immersif reste très correct avec une note de 5/7.

Tableau 6 : Vote des 8 « producteurs » de l’expérience n°2 pour la meilleure retranscription de l’âme, du groove et de l’arrangement de B-A-B-Y entre le master original et notre master immersif — *Tableau 6 : Vote des 8 « producteurs » de l’expérience n°2 pour la meilleure retranscription de l’âme, du groove et de l’arrangement de* B-A-B-Y *entre le master original et notre master immersif*

Tableau 7 : Expertise des 8 « producteurs » de l’expérience n°2 du potentiel culturel et commercial du master immersif de B-A-B-Y — *Tableau 7 : Expertise des 8* *« producteurs » de l’expérience n°2 du potentiel culturel et commercial du master immersif de* B-A-B-Y

Comme indiqué en tableau 6, les participants ressentent plus le groove de la chanson dans le master original, tandis que tous entendent l’arrangement de la chanson mieux servi par notre master immersif. En effet, l’un d’eux pense que dissocier [spatialement] basse et batterie fait perdre du groove à notre master immersif, quand un autre trouve que ce dernier donne plus à entendre l’arrangement, dont on entend tous les détails . Mais 75% des participants s’accordent à dire que les deux masters parviennent, certes différemment, à retranscrire à égalité l’âme, l’essence de la chanson.

Comme mentionné sur le tableau 7, les participants sont très partagés sur une envie du grand public que déclencherait notre master immersif d’écouter la chanson B-A-B-Y plus souvent qu’auparavant avec le master original. Ils le sont tout autant sur celle du grand public d’entendre en son immersif l’ensemble du catalogue du label Stax. D’un côté, certains émettent des doutes quant à la capacité et à la sensibilité du grand public à dissocier le rendu original et ce remixage très respectueux, et même à entendre l’élargissement de l’image. À l’inverse, un autre participant loue les qualités d’écoute du grand public, qui pourrait être déstabilisé par le changement de « contrat d’écoute » entre le master original et le master remixé, de cette chanson enregistrée il y a presque 60 ans. De l’autre côté, d’autres participants se réjouissent de l’existence de ce nouvel éclairage qui faciliterait l’accès de cette musique au grand public, en attirant beaucoup de curieux pour un genre toujours très populaire aujourd’hui.

En revanche, presque tous les participants déclarent qu’en tant que producteurs de label, ils engageraient les démarches pour commercialiser notre master immersif de B-A-B-Y. Bien que certains ne verraient dans le label Spatial Audio qu’un argument marketing qui ne révolutionnerait pas cette musique, d’autres disent que le master original et notre master remixé, au nouvel éclairage intéressant, pourraient cohabiter pour favoriser l’accès à cette musique et laisser les gens s’amuser à comparer les deux versions.

5. Conclusions

À la lumière de ces résultats, les professionnels de l’industrie discographique que sont les ingénieurs du son, les réalisateurs artistiques et les producteurs musicaux, valident la réalisation technique de notre remixage en son immersif de la chanson B-A-B-Y de Carla Thomas. Selon eux, le rendu sonore y est en accord avec la musique, et nettement plus que le master original sur le plan des timbres et de l’espace des différentes sources. La dimension immersive et réaliste aurait pu toutefois être plus marquée d’après certains participants.

Par ailleurs, la grande majorité de ces spécialistes du label Stax et du mixage en son immersif ne voient aucune perte d’âme de la chanson à travers notre master remixé. Au contraire, ils plébiscitent à l’unanimité ce produit fidèle et respectueux de l’œuvre pour percevoir tous les détails de l’arrangement musical. C’est là aux yeux de tous les « producteurs » le grand intérêt musical de remixer aujourd’hui en son immersif la chanson B-A-B-Y de Carla Thomas (Q.R.5, problématique a). Ils notent néanmoins dans notre travail une légère perte de groove par rapport au master original, dont la cause possible est l’éclatement des sources dans l’espace, qui a justement profité à l’arrangement.

Bien que notre remixage leur paraisse réussi et convaincant musicalement, les participants sont partagés entre l’optimisme et le doute quant à la demande du grand public pour ce type de reconstruction immersive de la musique, pour cette œuvre et pour le catalogue du label en général⁵¹. Toutefois, avec une intention culturelle de partager un nouvel éclairage d’une œuvre et de favoriser ainsi son accès, ou uniquement commerciale dans le marketing actuel autour du son 3D, ils seraient quasiment tous enclins, en tant que producteurs d’un label comme Stax Records, à commercialiser notre master immersif de B-A-B-Y et à l’installer aux côtés du master original (Q.R.5, problématique a).

C. Test d’écoute pour « consommateurs » : évaluer la demande du grand public pour le master remixé

Après la validation de notre remixage en son immersif de la chanson B-A-B-Y par un cercle de professionnels de l’industrie discographique, ce dernier test d’écoute comparative qui concerne les consommateurs de musique s’avère crucial. En enrichissant notre réponse à la problématique a et en abordant seul la problématique b, c’est lui qui va clore et décider de l’issue de notre étude du remixage en son immersif de masters monophoniques des années 1950-60. Nous chercherons avec lui à savoir à travers quelle version sonore (originale ou remixage) les consommateurs préfèrent écouter B-A-B-Y (Q.R.6) et s’ils écouteraient notre version remixée plus souvent que la version originale si elle était publiée à ses côtés (Q.R.7).

Par souci de compréhension de la part des participants, nous n’emploierons pas dans toute cette partie le terme « master », mais nous préférerons parler de « version sonore ».

1. Profils de « consommateurs » de musique

Pour que le grand public soit le plus densément représenté à notre test, nous y avons convié par message le maximum de personnes. Forts du succès provoqué par l’accroche, nous avons reçu 45 participants issus pour la plupart de notre réseau de connaissances⁵² : 21 musiciens, 21 non musiciens, et 3 des 8 experts 1950-60 de l’expérience n°1⁵³. Bien que nous souhaitassions une égalité entre chaque profil pour une distribution conforme⁵⁴, nous sommes parvenus à travers cette grande assemblée à remplir notre objectif premier de rassembler.

Quant aux non-musiciens, ce sont à la fois eux les plus grands consommateurs et les plus représentatifs du grand public. Leur présence nous est donc indispensable. Ensuite, nous avons conservé le profil des musiciens pour leur sensibilité auditive, dont le discours issu nous sera profitable. Enfin, le discours avisé des experts 1950-60 nous est tout aussi précieux que dans l’expérience n°1 vis-à-vis d’une chanson, B-A-B-Y (1966), qu’ils ont toujours entendue d’une manière et qu’ils vont entendre pour la première fois d’une autre. Nous réunissons en figure 43 les informations démographiques de ces participants.

Figure 43 : Données démographiques des « consommateurs » de l’expérience n°2. (a) Sexe. (b) Âge. (c) Écoute de la musique soul/R&B. (d) Connaît Stax. (e) Connaît le son Stax. (f) Connaît B-A-B-Y. — *Figure 43 : Données démographiques des « consommateurs » de l’expérience n°2. (a) Sexe. (b) Âge.* *(c) Écoute de la musique soul/R&B. (d) Connaît Stax. (e) Connaît le son Stax. (f) Connaît* B-A-B-Y.

2. Déroulé et conditions du test

D’une durée de 30 min, le test pour « consommateurs » se déroule en trois temps. Premièrement, nous accueillons le participant au plateau 1 du conservatoire et lui demandons de répondre sur ordinateur à quelques questions démographiques (QJ1 à QJ5 visibles en annexe C5). Après cela, nous l’invitons à s’installer sur la chaise haute que nous avons placée au centre du système d’écoute de la salle (voir figure 41). Nous lui décrivons oralement l’expérience qui l’attend et lui indiquons ce qu’il va devoir déterminer : laquelle des deux versions sonores qu’il va entendre d’un même enregistrement lui procure le plus grand plaisir d’écoute. Se faisant, nous préparons le participant pour qu’il soit dans le meilleur confort pour un exercice certes plaisant mais inhabituel pour lui, en particulier pour un non musicien, qu’il puisse faire confiance à son oreille critique pendant les deux écoutes qui vont suivre. Nous commençons par lui faire écouter en intégralité la version originale et notre version remixée de B-A-B-Y, sans parler entre les deux⁵⁵. Pour ne pas influencer le participant, nous ne lui évoquons pas avant la conclusion du test l’écoute d’une « version originale » et d’une « version remixée ». Nous craignons en effet qu’il perçoive négativement le terme « remixage », ou bien qu’il se montre complaisant envers notre version remixée s’il suppose que nous l’avons réalisée. Pour qu’il traite donc les deux versions à égalité et qu’il entende ce que chacune d’elles contient et renvoie de la musique, nous avons décidé dans notre discours et notre questionnaire de nommer « version A » la première version entendue et « version B » la seconde. En complément, pour nous affranchir d’un possible effet d’ordre, nous alternons secrètement entre chaque passage l’ordre d’écoute original/remixage. À l’issue des premières écoutes entières A et B et à tout moment du test, nous permettons au participant d’en effectuer d’autres à volonté sur des extraits précis qu’il pourra choisir, pour valider sa préférence.

Lorsqu’il la connaît, nous l’invitons à répondre sur ordinateur à notre questionnaire⁵⁶. Ce dernier, disponible en annexe C5, propose toute une série de questions, souvent à choix multiples pour simplifier la réflexion du participant et garantir la fluidité du test. Nous les avons posées dans un ordre logique mais par facilité pour lui, nous lui permettons de les traiter dans l’ordre de son choix. D’abord, la question QK1 nous permet de retenir les émotions naissantes éventuelles du participant après les deux écoutes, susceptibles de s’évaporer au fil du test. Servant directement notre question Q.R.6, les questions QK3 à QK5 dominent quant à elles notre questionnaire.

Ensuite, pour confirmer notre priorité de la musique et maintenir ainsi le lien avec les deux tests précédents, nous avons inclus dans le test pour « consommateurs » les questions QK6 à QK8, identiques aux questions QH1 à QH3 du test pour « producteurs », concernant l’âme, le groove et l’arrangement de la chanson. Nos questions inverses QK9 et QK10, les plus détaillées, demandent au participant une certaine attention d’écoute. C’est là que nous rappelons oralement à ce dernier la possibilité de comparer le rendu de certains instruments en réécoutant certains extraits, qu’il peut choisir ou que nous pouvons proposer. Bien que le participant puisse cocher plusieurs critères perceptifs pour une même source, nous lui précisons bien de n’en cocher un que lorsqu’il a une préférence significative pour l’une des deux versions. Notre question QK11 rejoint les questions QK6 à QK8 des principales caractéristiques musicales de la chanson B-A-B-Y. Avant la phase de conclusion de notre test, nous suggérons aux participants une réflexion temporelle sur chacune des deux versions sonores (QK12 à QK14). Notre objectif à travers cette question est de voir certains participants se sentir dans la même époque via les deux versions sonores.

Enfin, après avoir informé le participant de l’identité des versions A et B⁵⁷, nous concluons notre test par les questions QL1 et QL2⁵⁸ qui nous permettront de vérifier les hypothèses des « producteurs » émises en III.B.4., mais surtout de répondre directement à notre question Q.R.7 et à notre problématique b.

3. Collecte et analyse des données

Nous collectons les notes d’appréciation attribuées par les participants à la version originale et à notre version remixée de B-A-B-Y (QK3, QK4), pour en dessiner des boîtes à moustaches qui illustreront la moyenne et la dispersion d’appréciation de chaque version pour chaque profil. Nous rassemblons les réponses des participants aux questions QK5 à QK8 et QK11⁵⁹ pour constituer des digrammes circulaires qui révèleront la version sonore préférentielle des participants pour chaque aspect musical mentionné. Nous sommons toutes les grilles de cases remplies par les participants aux questions QK9 et QK10 pour construire pour chaque critère sonore un digramme en barres multiples qui renseignera leur version préférée pour le rendu de chaque instrument. Nous nous aidons de leurs justifications pour interpréter ce diagramme. Nous recueillons les réponses des participants aux questions QK12 et QK13 pour composer un digramme circulaire qui dévoilera la version qui plonge les participants dans l’époque la plus éloignée d’aujourd’hui, la plus proche de l’époque d’enregistrement. Enfin, nous retenons les réponses des participants aux questions QL1 et QL2 pour former deux diagrammes circulaires qui répondront à notre problématique b.

4. Résultats

Avant tout, la grande majorité des participants ont ressenti beaucoup de plaisir à participer à ce test d’écoute comparative, un exercice qui leur a paru certes nouveau, mais stimulant pour leur écoute de la musique en général.

Les figures 44 et 45 nous révèlent un plébiscite généralisé pour notre remixage en son immersif de la chanson B-A-B-Y de Carla Thomas. En effet, les participants « consommateurs » sont 62,2% à préférer écouter cette musique à travers notre version remixée. De plus, il ne s’agit pas simplement d’une attirance pour un nouveau type de rendu sonore pour un enregistrement des années 1960, comme indiqué sur la figure 45 qui montre un réel plaisir des participants à écouter cette chanson dans la version immersive (appréciation moyenne de 7,5/10), davantage que dans la version originale (6,6/10 de moyenne). Nous notons également les 11,1% des participants qui, par choix argumenté, disent aimer autant l’une que l’autre version. Reste une minorité de participants (26,7%) qui privilégient l’écoute de la version originale, ce qui vient vérifier le constat sonore négatif de celle-ci, rendu par les participants de l’expérience n°1 en section II.B.1.1.

Figure 44 : Version préférentielle des « consommateurs » de l’expérience n°2 entre la version originale et notre version remixée en son immersif de B-A-B-Y sur chaque caractéristique musicale de la chanson. (a) Général. (b) Âme. (c) Groove. (d) Arrangement. — *Figure 44 : Version préférentielle des « consommateurs » de l’expérience n°2 entre la version originale et notre version remixée en son immersif de* B-A-B-Y *sur chaque caractéristique musicale de la chanson. (a) Général. (b) Âme. (c) Groove. (d) Arrangement.*

*Figure 45 : Appréciation de la chanson* B-A-B-Y *par les « consommateurs » de l’expérience n°2 à l’écoute de la version originale et de notre version remixée en son immersif*

Sur le plan des principales caractéristiques musicales de la chanson énoncées par ceux – ci en section III.A.2.1., les « consommateurs » estiment à 57,8% ressentir plus de groove dans notre version remixée. Ils viennent ainsi contredire l’avis des « producteurs » en section III.B.4., qui désignaient la version originale. De plus, ils sont 71,1% à penser que notre version immersive met mieux en valeur l’arrangement de la chanson. Enfin, bien que les avis soient plus partagés, les participants sont toujours plus nombreux à juger que notre réalisation retranscrit le mieux l’âme de la chanson (44,4% contre 35,6% pour la version originale).

Figure 46 : Version préférentielle des « consommateurs » de l’expérience n°2 entre la version originale et notre version remixée en son immersif de B-A-B-Y du rendu de chaque instrument pour chaque critère perceptif. (a) Présence. (b) Timbre. (c) Place dans l’espace. — *Figure 46 : Version préférentielle des « consommateurs » de l’expérience n°2 entre la version originale et notre version remixée en son immersif de* B-A-B-Y *du rendu de chaque instrument pour chaque critère perceptif. (a) Présence. (b) Timbre. (c) Place dans l’espace.*

Dans le détail, la figure 46 nous apprend que les « consommateurs » n’ont la plupart du temps pas de préférence particulière pour le rendu sonore des différents instruments. Toutefois, certaines tendances se révèlent importantes.

D’abord, parmi les trois instruments qu’ils ont pensés oralement être les garants de l’âme et du groove de la chanson⁶⁰, les participants sont les plus nombreux à préférer dans notre version remixée la présence de la voix⁶¹, et la présence et la place dans l’espace de la batterie. En revanche, ils sont très partagés concernant le timbre de la voix. La plupart d’entre eux (36%) le préfèrent dans la version originale, et d’autres (31%) dans notre version remixée. Cependant, en observant leurs justifications, nous remarquons qu’ils ne s’accordent pas sur ce qu’ils entendent : pour certains, la voix est plus présente ou bien plus agressive dans la version originale, et pour d’autres dans notre version remixée. En revanche, une tendance forte se dégage de la figure 46. Tous les participants ayant une préférence pour la présence et la place dans l’espace des instruments l’accordent très largement pour tous ceux-ci à notre version immersive. En particulier, la nouvelle présence des instruments⁶² a ravi de nombreux participants, grâce au nouvel espace propre qui apporte un vrai relief à l’ensemble. L’un des experts 1950-60 s’est réjoui de notre scène sonore pour pouvoir enfin chanter la partie de guitare et compter le nombre de cuivres : deux sax et une trompette. Plus globalement, 6 « consommateurs » ont aimé à travers notre version ressentir l’impression d’être dans le live, leur permettant de plus vivre la musique. Pour confirmer cette sensation de réalisme⁶³, l’un des experts 1950-60 nous a avoué retrouver enfin [ce qu’il attendait] du son d’Al Jackson, le batteur maison : il est un des co-fondateurs du son Stax, nous dit-il, c’est donc logique qu’il apparaisse comme cela, [avec] la soudaine brutalité du coup de caisse claire . À ce propos, de façon tout à fait surprenante, 3 des 5 participants connaissant le son Stax nous déclarent qu’il est le mieux retranscrit dans notre version remixée. Un autre expert 1950 -60, spécialiste du genre et du label, nous avance même alors que si un mixage en stéréo [de B- A-B-Y] avait été conçu à l’époque⁶⁴, cela aurait tout à fait pu être celui-là.

Figure 47 : Version sonore plongeant les « consommateurs » de l’expérience n°2 dans l’époque la plus éloignée d’aujourd’hui, la plus proche de l’époque d’enregistrement de la chanson

Nous arrivons à présent à la perception de la temporalité des versions sonores par les participants (figure 47). Pour rappel, bien qu’ils puissent s’en douter, ceux-ci ne savent pas qu’ils entendent la « version originale » et une « version remixée », et encore moins laquelle des deux versions A et B dissimule la version originale. De façon logique, c’est uniquement à travers cette version originale que la majorité des participants (53,3%) se trouvent baignés dans l’époque d’enregistrement de la chanson, qu’ils identifient souvent bien comme étant les années 1960. Les indices sonores ne leur manquent pas : un aspect plus brut, moins subtil, moins aéré de la version originale, au contraire de la modernité de notre version remixée, ressentie par la spatialisation des instruments. Mais par-dessus tout, nous sommes agréablement surpris par les 22,2% de participants qui ne se sentent plongés dans l’époque d’enregistrement que dans notre version immersive, pensant alors être la version originale. Nous n’avions pas prévu une telle perception de la part de ces participants, qui entendent dans notre version une sorte de grain musical qui correspond à leurs attentes imaginaires et les met ainsi en confiance. Ils ont été en fin de test très agréablement surpris de leur confusion⁶⁵ et ne pensaient pas que ce genre de technique de mixage existait , capable de donner un grain à une musique, comme si elle datait de plusieurs décennies . Enfin, la même part de participants (22,2%) dit se sentir dans la même époque à travers les deux versions entendues, les années 1960. Selon eux, même avec l’éclatement des sources de notre version immersive, le son très caractérisé de la moitié du XX^e siècle reste palpable. L’un des experts 1950-60 nous a même confié que le réalisme de notre version lui offrait un voyage temporel vers l’époque d’enregistrement.

Figure 48 : Envie des « consommateurs » de l’expérience n°2 d’écouter grâce à notre version remixée : (a) la chanson B-A-B-Y plus souvent qu’avec la version originale ; (b) le reste du catalogue du label Stax dans les mêmes conditions sonores — *Figure 48 : Envie des « consommateurs » de l’expérience n°2 d’écouter grâce à notre version remixée : (a) la chanson* B-A-B-Y *plus souvent qu’avec la version originale ; (b) le reste du catalogue du label Stax dans les mêmes conditions sonores*

En conclusion d’après la figure 48, les « consommateurs » sont une très large majorité (68,9%) à avoir désormais envie d’écouter la chanson B-A-B-Y avec notre version remixée, plus souvent qu’avec la version originale. En particulier, 82% des participants qui connaissent la chanson et 75% des participants qui écoutent souvent ou tout le temps de la musique soul/R&B pour leur plaisir, ressentent cette même envie. L’une des non musiciennes nous confie⁶⁶ être ébahie de découvrir que le positionnement des instruments joue à ce point sur les émotions procurées, quand l’un des experts 1950-60 nous indique qu’on aurait rêvé faire la chose pour ces artistes merveilleux de Memphis, Tennessee, et leur faire écouter . Par ailleurs, 86,7% des participants de notre test désireraient entendre le même type de transformation sonore sur l’ensemble du catalogue discographique du label Stax. En particulier, 87,5% des plus grands consommateurs de soul/R&B partagent ce désir.

5. Conclusions

En définitive, le remixage en son immersif de la chanson B-A-B-Y que nous avons opéré en section III.A. a conquis une large majorité de « consommateurs » de notre test, tant par rapport à la version originale que pour leur propre appréciation de la musique.

La plupart d’entre eux ressentent plus de plaisir à écouter cette chanson dans notre version immersive que dans la version originale, répondant ainsi à notre question Q.R.6. En attribuant à notre production une meilleure mise en valeur du groove et de l’arrangement musical, et même une meilleure retranscription de l’âme de la chanson, les « consommateurs » nous ont désigné leurs trois intérêts musicaux de remixer en son immersif la chanson de 1966 de Carla Thomas (problématique a). À leurs yeux, la musique s’épanouit dans son nouvel espace sonore qui revalorise la présence de tous les instruments et leur offre des timbres plus clairs et plus dignes du son du label Stax. En outre, bien que la majorité se sente davantage dans les années 1960 à travers la version originale, un groupe notable s’y retrouve tout autant en écoutant notre version immersive. Mieux, certains participants sont saisis par le réalisme sonore de celle-ci, qui les place soudain virtuellement devant les musiciens du groupe, en concert ou entre les murs du studio d’enregistrement.

Finalement, les « consommateurs » sont une très large majorité à éprouver l’envie d’écouter dans leur vie quotidienne la chanson B-A-B-Y plus souvent avec notre version remixée en son immersif qu’ils ne l’ont fait avec la version originale, répondant ainsi à notre question Q.R.7. Et ils sont encore plus nombreux à désirer entendre le reste du catalogue Stax, que beaucoup ne connaissent pas, dans des conditions de restructuration sonore similaires. Que le grand public exprime son envie de découvrir avec ce mode sonore un répertoire qu’il ne connaît pas suffisamment selon lui, incarne pleinement l’intérêt culturel du remixage en son immersif d’enregistrements monophoniques des années 1950 -60 (problématique a). Cela vient alors confirmer l’hypothèse des « producteurs » les plus optimistes sur la curiosité et l’engouement du grand public actuel pour ces reconstructions immersives d’enregistrements monophoniques. Néanmoins, pour répondre à notre problématique b, cet engouement ne vient pas combler une envie particulière des « consommateurs » actuels vis-à-vis des enregistrements anciens, car depuis longtemps, ils ont inévitablement appris à apprécier la musique au milieu des marqueurs temporels des versions originales. Simplement, d’après notre test, non seulement leur apprentissage ne les a pas enfermés dans une seule esthétique sonore possible pour la musique soul des années 1960, mais celle que nous avons adoptée dans notre version immersive a fait croître leur attachement à la musique, qu’ils ont pu pour la première fois apprécier dans son entièreté.

D. Discussion de l’expérience n°2 et conclusions

Cette seconde expérience nous apporte de forts enseignements sur le degré de pertinence musicale, culturelle et historique de la pratique du remixage en son immersif de masters monophoniques du répertoire soul des années 1950-60.

Initialement, les bienfaits d’une telle pratique sont musicaux. Comme nous l’avions pressenti en préambule, la chanson B-A-B-Y de Carla Thomas, dont le rendu sonore original a été le plus vivement critiqué par les participants de l’expérience n°1, a largement bénéficié de notre remixage en son immersif, d’après les participants de l’expérience n°2. Les premiers participants en sont à l’origine. En effet, nous avons retenu les principales caractéristiques musicales de l’œuvre qu’ils nous ont adressées, nous permettant de tracer notre direction de remixage. Nous avons noté leurs envies sonores dominantes vis-à-vis de la chanson, sur le plan du rendu de l’équilibre, des timbres et de l’espace des sources, et nous avons repris les manipulations de remixage qu’ils avaient amorcées pour les réaliser. À l’occasion d’une écoute comparative au cours de laquelle nous les avons invités à jouer le rôle d’un « producteur » de label, des professionnels de l’industrie discographique ont validé notre travail de remixage, respectueux de la chanson et lui offrant des timbres et un espace plus favorables à son expression. Lors d’une autre écoute comparative, les « consommateurs » de musique, que sont non musiciens, musiciens et experts musicaux 1950-60, comme les « producteurs », nous ont explicitement désigné le grand intérêt musical de remixer en son immersif des masters monophoniques des années 1950-60 : mettre en lumière l’arrangement d’une chanson (problématique a). En effet, certains éléments qui étaient dissimulés dans la version originale de B-A-B-Y sont soudain apparus aux oreilles de tous ces participants de manière claire et directe dans le nouvel espace de notre version immersive. Au contraire des « producteurs », les « consommateurs » y ont même mieux ressenti un autre aspect de la chanson : le groove. Cependant, l’observation des « producteurs » vérifie la nôtre pendant notre remixage. Comme le groove repose sur la fusion entre les instruments et que l’arrangement peut être éclairé par un éclatement spatial, il est difficile dans un remixage en son immersif d’améliorer réellement les deux aspects à la fois. C’est pourquoi nous avions choisi d’ouvrir l’espace conformément aux désirs des participants de l’expérience n° 1, et d’optimiser le groove en revoyant le niveau et le timbre de la basse et de la batterie, comme ils nous l’avaient également suggéré. Mais ce sont bien ces deux aspects musicaux réunis, qui constituaient alors notre direction de remixage tracée par les participants de l’expérience n°1, qui ont conduit la grande majorité des « consommateurs » à aimer écouter B-A-B-Y avec notre version immersive, plus qu’avec la version originale. Simultanément, cette majorité confirme l’expertise des « producteurs » sur le respect de l’œuvre dont fait preuve notre remixage. La recherche documentaire que nous avons effectuée sur l’identité du label Stax dans le contexte musical et politique des années 1960 nous a été très précieuse. Elle nous a aidés à éclairer l’œuvre sans la dénaturer, à changer drastiquement le rendu sonore du master original tout en respectant le style de la chanson et les intentions originelles des musiciens et des arrangeurs. Au vu des résultats des deux tests d’écoute comparative, nous y sommes parvenus.

Ainsi, par la musique, le remixage en son immersif de masters monophoniques des années 1950-60 trouve son intérêt culturel. Les « consommateurs », en montrant leur envie d’écouter de manière immersive B-A-B-Y comme le reste du catalogue Stax, répondent à l’adhésion des « producteurs » de commercialiser notre produit. La grande majorité de ces « consommateurs » exprimant cette envie nous ont avoué dans le même temps ne connaître que très vaguement le répertoire de ce label légendaire. La perspective pour eux serait ainsi alléchante : le découvrir en intégralité et avec le même plaisir d’écoute (problématique a).

Tandis que la question culturelle s’intéresse à la relation entre l’auditeur et les œuvres, la question historique pourrait concerner celle entre l’auditeur et les interprètes. Certains résultats de notre ultime test montrent cette tendance. Les « consommateurs » n’éprouvent pas d’envie particulière vis-à-vis des enregistrements anciens (problématique b), car ils se sont naturellement formés à l’idée que ceux-ci ne peuvent exister que dans leur apparence originale mono. Pourtant, en découvrant à travers notre test que cette démarche est en fait techniquement possible, ils sont surpris et fascinés. Plusieurs participants nous ont confié en écoutant notre version immersive avoir l’impression de se sentir virtuellement devant les musiciens, en concert ou sur le plateau du studio d’enregistrement. Bien que ces sensations de réalisme soient ici minoritaires, nous pensons juste et responsable de les prendre au sérieux dans le cadre du remixage en son immersif de masters monophoniques des années 1950 -60. En effet, les « producteurs » nous ont spontanément affirmé que la dimension immersive de notre nouveau master aurait pu être plus forte. Mais pensons au fait que, pour renforcer sa présence, nous pourrions continuer d’affiner les contours acoustiques de l’espace que nous souhaitons recréer en lien étroit avec le style musical. Alors ces participants immergés pourraient être en fait bien plus nombreux. Finalement, la large majorité des « consommateurs » conquis par la spatialisation des instruments d’une chanson enregistrée en 1966 s’accompagne de la sensibilité de certains participants au réalisme de notre master remixé pour nous indiquer le chemin à suivre des futurs travaux en matière de remixage immersif de masters monophoniques des années 1950-60 : préciser et renforcer vraiment l’immersion. Au regard de l’expérience n°2, nous sommes en mesure d’affirmer que le grand public semble prêt. De cette manière, si ces nouveaux produits réalistes et immersifs intègrent leurs habitudes d’écoute, ils créeront un espace commun entre deux époques distantes de plus de 60 ans, atout historique majeur pour les générations actuelles.

Discussion générale

Notre étude démontre l’intérêt musical, culturel et historique de remixer aujourd’hui en son immersif des masters monophoniques de blues/R&B/soul des années 1950-60. Pour cela, nous avons conçu deux expériences complémentaires : la première, qui évaluait les comportements de réflexion, d’écoute et de remixage de 24 participants face à des masters originaux de cette époque, nous a indiqué celui dont le rendu sonore défavorisait le plus le message musical, à savoir la chanson B-A-B-Y de Carla Thomas ; nous l’avons donc remixé en son immersif et l’avons soumis à 8 professionnels de l’industrie phonographique et 45 consommateurs de musique dans une seconde expérience d’écoute comparative avec le master original. D’abord, pour deux des trois morceaux du répertoire ciblé proposés à l’expérience n°1, les participants ont jugé en moyenne que le rendu sonore de leur version remixée servait davantage le propos musical que la version originale. Puis dans l’expérience n°2, les professionnels de l’industrie phonographique ont révélé le respect de l’œuvre originale dont faisait preuve notre version remixée en son immersif de B-A- B-Y, quand les consommateurs l’ont en grande majorité préférée à la version originale et seraient désormais prêts à écouter cette chanson plus souvent ainsi.

Plus précisément, les consommateurs éprouvent beaucoup de plaisir à entendre dans notre version remixée tout ce que la chanson B-A-B-Y comprend et véhicule d’un point de vue musical et émotionnel. Grâce au nouvel espace immersif introduit, comme les professionnels de l’industrie phonographique, ils ont aimé mieux percevoir les instruments qui constituent l’arrangement. Cet attrait confirme l’analyse de Giles Martin, qui a tout récemment remixé en son immersif l’album Pet Sounds des Beach Boys : « Placer ces sons dans un espace immersif signifie […] que vous pouvez entendre des instruments que vous n’avez jamais entendus auparavant. Ils sont dans l’enregistrement, mais ils sont maintenant dans un espace où vous pouvez les identifier » (The Beach Boys, 2023). En outre, selon les consommateurs, notre version remixée retranscrit mieux l’âme de la chanson, ce qui vient confirmer l’expertise des professionnels de l’industrie phonographique sur le respect de l’œuvre. « Les gens n’écoutent jamais de la technologie, ils écoutent de la musique », affirme Martin (Tamarkin, 2023). De même, nous n’avons pas souhaité faire un remixage technologique, mais musical de B-A-B-Y. Les résultats positifs de l’expérience n°2 viennent donc approuver l’intérêt pour la musique de penser réciproquement par elle lors du remixage, et bien avant déjà. Certes le rendu sonore du master original découle du magnétophone 2 pistes utilisé et du mixage de 8 voies effectué en direct. Mais la majorité des participants de l’expérience n°1 jugent que ces failles entravent le message musical des interprètes.

Par ailleurs, les moyens d’écoute du grand public ont bien évolué depuis les années 1960, et le casque, très usuel aujourd’hui, ne semble pas encourager les auditeurs à écouter de la musique en mono. Si l’on souhaite que ces trésors musicaux afro-américains traversent les époques, il serait opportun de l’adapter aux moyens d’écoute actuels. Nous suivons ainsi le discours de Martin : « Il y a une génération qui n’écoute pas de mono, alors comment respectez-vous cela ? » (Cruse, 2023). Comme les labels l’ont fait dans les années 1960 en privilégiant le master mono pour encourager le plus grand nombre d’écoutes à la radio, nous pourrions tout autant aujourd’hui satisfaire le grand public en lui proposant à la mesure de son medium favori un master binaural après réduction du master immersif. C’est là la politique menée par Apple avec ses catalogues musicaux en Dolby Atmos. Mais plutôt que de ne réserver ceux-ci qu’aux enregistrements stéréo, il serait aujourd’hui opportun de se pencher sur le cas des enregistrements mono. En effet, bien que nous le pensions encore améliorable, notre remixage en son immersif de B-A-B-Y a provoqué chez plusieurs participants une immersion si forte que pour la première fois en écoutant cette chanson de 1966, ils se sont sentis devant les musiciens entre les murs du studio d’enregistrement. Cette sensation a capté leur imaginaire, et leur a donné envie, comme bien d’autres, d’écouter les autres chansons du label Stax dans les mêmes conditions. L’intérêt culturel du remixage en son immersif de masters monophoniques des années 1950-60 est donc prolongé par un intérêt historique, puisque cette pratique, via la sensation de réalisme, pourrait permettre de construire pendant trois minutes un pont virtuel entre le moment actuel d’écoute et le jour d’enregistrement d’une chanson. Cette idée rejoint celle de Martin lorsqu’il a remixé Pet Sounds : « Ce que j’ai essayé de faire, c’est d’être plus proche de l’enregistrement […] et de trouver un sens à ce que c’est d’être dans le studio avec le groupe » (Tamarkin, 2023). Bien que les participants immergés auraient peut-être été plus nombreux si nous avions basé notre remixage sur la construction d’une scène sonore réaliste, ce phénomène donne en tout cas une réelle indication sur le potentiel perceptif de l’approche immersive. Notre étude illustre enfin la grande avancée aujourd’hui que représente la séparation de sources par apprentissage profond. Celle-ci satisfait un désir, celui de se réapproprier le son des enregistrements anciens, aux bandes multipistes alors inexistantes.

Grâce à sa détection décisive des harmoniques du signal, RipX nous a permis de remixer B- A-B-Y sans la moindre limitation, et le démasquage spatial des sources n’a pas fait ressortir d’artefact issu de la séparation. Pourtant, avant de le découvrir, nous avions opté pour l’outil SpectraLayers, pensant alors que retoucher aussi précisément les spectrogrammes des sources allait nous offrir un meilleur résultat de séparation que tous les autres outils automatiques du marché. Cette orientation spontanée, qui peut s’expliquer par notre expérience manuelle d’ingénieur du son, a conduit à une limite de notre étude, celle de ne pas avoir utilisé RipX en vue de l’expérience n°1. Cependant, découvrir successivement ces deux outils nous a permis d’approfondir notre connaissance de l’état de l’art de la séparation de sources et de choisir chaque outil en fonction de nos besoins. En particulier, si nous n’avions pas découvert l’éditeur SpectraLayers, nous n’aurions pas pensé pouvoir optimiser par retouche manuelle la séparation livrée par RipX, ultime étape qui a ouvert la voie de notre remixage final.

Par ailleurs, pour faciliter et donc améliorer encore la séparation de sources de RipX, nous aurions pu plutôt lui fournir le master stéréo de B-A-B-Y. Comme celle-ci a été enregistrée sur un magnétophone 2 pistes, toutes les sources sont totalement situées sur le canal gauche ou droit de la stéréo. Cette image sonore offre un démasquage avantageux entre les sources, ce qui permettrait donc pour elles une séparation plus aisée, plus proche encore d’une véritable bande multipiste. Par exemple, les accords secs de guitare confondus avec la caisse claire dans le master mono, auraient été mieux séparés depuis le master stéréo, où ils le sont déjà dans l’image.

Mais ces deux limitations n’ont ni entravé nos objectifs musicaux de remixage de B-A-B-Y, ni altéré les choix de remixage des premiers participants. En profitant des outils actuels de séparation de sources, nous sommes d’ailleurs finalement heureux d’avoir pu réaliser dans l’expérience n°1 le projet de Clavel (2003, p.5) de « proposer à [ceux-ci] d’effectuer [eux-mêmes leur] opération de mixage en [leur] laissant la possibilité de placer les sons à [leur] convenance ».

Avec les progrès constants des techniques de séparation de sources et l’engouement pour l’audio immersif, les perspectives de recherches s’avèrent exaltantes. Remixer en son immersif d’autres répertoires, d’autres époques d’enregistrement, en désigne sûrement une. En particulier, mesurer la grandeur acoustique d’un big band des années 1930-40 et se sentir soudain devant cette masse de musiciens est un projet crédible, mais hautement exigeant. Pour l’apprentissage supervisé, cela impliquerait de constituer un catalogue d’enregistrements de big band multipistes, caractérisés par un souffle, des timbres, un espace et une dynamique typiques de cette époque. Et recueillir une part de réalisme induirait d’améliorer sensiblement la bande passante originale. Parmi les méthodes actuelles d’apprentissage profond, les réseaux adverses génératifs (GAN) se démarquent. Ils peuvent générer de nouvelles données en analysant les modèles existants, redéfinir ainsi une image, en créant de nouveaux pixels à partir des pixels voisins. Il serait alors stimulant d’observer dans quelle mesure ce réseau est capable de créer de nouveaux harmoniques aux sources d’un enregistrement ancien. L’apprentissage profond peut-il donc créer l’illusion sonore ? Pour Yann Le Cun (2019), l’un des inventeurs de l’apprentissage profond, le réseau GAN est « l’idée la plus intéressante des 10 dernières années en matière d’apprentissage automatique ».

Conclusion

En constatant que les enregistrements de blues, R&B, soul des années 1950-60 ne sont plus aussi largement écoutés qu’autrefois, notre étude vise à évaluer le sens musical, culturel et historique de les remixer aujourd’hui en son immersif, et à savoir si cette pratique répond en effet à une envie des consommateurs actuels vis-à-vis de ces enregistrements. Finalement, elle démontre l’intérêt musical, culturel et aussi historique de cette pratique, qui ne répond certes pas à une envie particulière des consommateurs, n’ayant pas eu connaissance de son existence, mais qui suscite en eux un vif intérêt au regard de la musique.

Pour y parvenir, nous avons lié deux expériences. La première visait à observer les comportements de réflexion, d’écoute et de remixage de 24 ingénieurs du son, musiciens et experts du répertoire ciblé, face à trois masters originaux des années 1950-60. Sur deux morceaux, les résultats ont montré que leur version remixée présentait en moyenne un rendu sonore plus favorable à la musique que la version originale. À l’aide d’un outil de séparation de sources détectant les harmoniques, nous avons alors réalisé un remixage en son immersif l’une de ces deux chansons, que nous avons présenté dans une seconde expérience. Un premier test d’écoute comparative avec le master original visait à mesurer l’intérêt musical et culturel de présenter notre remixage au grand public. Huit professionnels de l’industrie phonographique ont jugé notre version respectueuse de l’œuvre originale, et le nouvel espace sonore éclairant musicalement. Presque tous ces experts du label ou du mixage immersif ont affirmé qu’ils la commercialiseraient s’ils dirigeaient un label. Un second test comparatif demandait à 45 consommateurs de musique leur préférence d’écoute entre les deux versions. La majorité, qui a préféré écouter notre remixage, a été ravie d’entendre tout ce que cette chanson contenait. Comme les professionnels, ils ont vu le grand intérêt musical du remixage immersif : valoriser l’arrangement qui a été pensé pour une œuvre en donnant une place nouvelle à tous les instruments. Un intérêt culturel ressort également, puisque les consommateurs ont été très nombreux à exprimer l’envie d’écouter cette chanson plus souvent en son immersif qu’en mono, et de découvrir ainsi le reste du catalogue du label. L’atout historique de cette pratique réside enfin dans l’illusion de certains d’avoir été projetés devant les musiciens de l’enregistrement. Remixer en son immersif des masters monophoniques peut donc établir pendant trois minutes une passerelle entre deux époques lointaines. Tous nos objectifs de recherche ont été atteints, bien que, si nous l’avions découvert plus tôt, nous aurions pu utiliser dès l’expérience n°1 l’outil RipX, avec lequel nous avons séparé les sources de cette chanson. Toutefois, cela n’a pas faussé nos résultats. Toujours guidé par un sens musical, ce procédé peut être étendu à d’autres catalogues d’enregistrements et bientôt des effectifs plus denses, grâce aux progrès constants des systèmes de séparation de sources par apprentissage profond.

Bibliographie

Apple. Audio Spatial, 2023. https://music.apple.com/us/curator/apple-music-audio- spatial/1564180390?l=fr-FR

Ausseil, D., Contamine, C.-H., & Chapoullié, D., La Route du blues. Éditions d’Art J. P. Barthélémy, 1995.

Barry, E. D., High-fidelity sound as spectacle and sublime, 1950–1961. Dans Sound in the Age of Mechanical Reproduction, pp.115-138, 2010. DOI: 10.9783/9780812206869.115

Bas-Rabérin, P., Le blues moderne, 1945-1973. Paris: Albin Michel, 1973.

Bode, H., History of electronic sound modification. Dans Journal of the Audio Engineering Society, 32(10), pp.730-739, 1984.

Bowman, R., Soulsville, U.S.A.: The Story of Stax Records. New York: Schirmer Books, 1997. Cabanillas, R., Mixing Music In Dolby Atmos [Capstone Projects and Master’s Theses].

California State University, Monterey Bay (Fresno, États-Unis), 2020.

Chalot, C., & Guittet, H., NomadPlay : FAQ, 2017. https://www.nomadplay.app/fr/faq Clavel, C., Séparation des sons musicaux. Approche bayésienne et méthode de Monte-Carlo [Stage DEA ATIAM]. Télécom Paris (Paris-Saclay, France), 2003.

Cogan, J., & Clark, W., Temples of sound : Inside the great recording studios. San Francisco: Chronicle Books, 2003.

Cruse, R., Les « Pet Sounds » séminaux des Beach Boys arrivent dans le mix Dolby Atmos de Giles Martin. Dans Maison Du Jeu !, 2023.

Dolby, Webinar 1/3 : Introduction Dolby Atmos [Vidéo], 2020. https://www.youtube.com/watch?v=naTJwllCmCw

Dolby, Webinar 3/3 : Mixage Dolby Atmos [Vidéo], 2021. https://www.youtube.com/watch?v=rGCngKQOxpw

Dobrev, L., SpectraLayers 7: More AI, less clicks for Steinberg’s spectral editor. Dans Gearnews, 2020.

Erard, N., La spatialisation dans le spectacle vivant : Quelles différences entre la chaîne audio de sonorisation d’un spectacle traditionnel et d’un spectacle spatialisé ? [Mémoire FSMS]. CNSMDP (Paris, France), 2020.

Ewert, S., & Müller, M., Using score-informed constraints for NMF-based source separation. Présenté à la IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) à Kyoto, Japon, 2012. DOI: 10.1109/ICASSP.2012.6287834

Facciotto N., Troiani E., Martinez M. J., Source Identification and Classification of Acoustic Emission Signals by a SHAZAM Inspired Pattern Recognition Algorithm. Présenté l’International Workshop on Structural Health Monitoring (IWSHM) à Palo Alto, États-Unis, 2017. DOI: 10.12783/shm2017/13989.

Garofalo, R., Crossing Over : From Black Rhythm & Blues to White Rock’n’Roll. Dans Rhythm and Business: The Political Economy of Black Music, Kelley, N., New York: Akashit Books, pp.112-137, 2002.

Gilotaux, P., La fabrication des disques. Dans Groupe d’Acoustique Musicale (28), 1967. Glaser B. G., & Strauss A. L., The Discovery of Grounded Theory: Strategies for Qualitative Research. Piscataway: Aldine Transaction, 1967.

Gordon, R., Respect Yourself: Stax Records and the Soul Explosion. Bloomsbury Publishing USA, 2013.

Goto, M., RWC Music Database, 2002. https://staff.aist.go.jp/m.goto/RWC-MDB/ Gover, M., Score-Informed Source Separation for Choral Music [Master Thesis]. McGill University (Montréal, Canada), 2019.

Guralnick, P., Sweet Soul Music: Rhythm & Blues et rêve sudiste de liberté. Paris: Editions Allia, 2003.

Hennequin, R., Khlif, A., Voituret, F., & Moussallam, M., Spleeter: A fast and efficient music source separation tool with pre-trained models. Dans Journal of Open Source Software, 5(50), 2020.

Hennequin, R. & al., Spleeter by deezer, 2021. https://github.com/deezer/spleeter Hit’n’Mix, History of Audio Separation 2001 to Now, 2021. https://hitnmix.com/2023/07/17/history-of-audio-separation/

Hofstein, F., Le rhythm and blues (coll. Que sais-je ?), Paris: Presses universitaires de France, 1991.

I’MTech, Gaël Richard, chercheur du son. Dans I’M Tech, 2020.

International Federation of the Phonographic Industry (IFPI). Engaging with Music, 2022. Jolibert, B., Le blues et sa musique. Dans Expressions (20), pp.171 187, 2002.

Kagan, A., How To Listen to Immersive Audio. Dans Sonarworks Blog, 2022.

Kimizuka, M., Historical Development of Ma0gnetic Recording and Tape Recorder. Dans

Survey reports on the systemization of technologies, vol.17, pp.185-273, 2012.

Lambert, P., Brian Wilson’s Pet Sounds. Dans Twentieth-Century music, vol.5(1), pp.109-133, 2008. DOI: 10.1017/S1478572208000625

Le Cun, Y., L’apprentissage profond, une révolution en intelligence artificielle. Dans La lettre du Collège de France, (41), p.13, 2016.

Le Cun, Y., Quand la machine apprend : La révolution des neurones artificiels et de l’apprentissage profond. Paris: Odile Jacob, 2019.

Lemesle, P., Il était une fois… La T.S.F. : Les Années 60…, 2015. https://radio- passion.pagesperso-orange.fr/annees60/frameannees60.htm

Licata Caruso, D., Les insolentes ventes d’écouteurs sans-fil portées par les AirPods d’Apple. Dans Le Parisien, 2022.

Liutkus, A., Durrieu, J.-L., Daudet, L., & Richard, G., An overview of informed audio source separation. Présenté au 2013 14th International Workshop on Image Analysis for Multimedia Interactive Services (WIAMIS) à Paris, France, 2013. DOI: 10.1109/WIAMIS.2013.6616139 Mercier D. & al., Le livre des techniques du son (4^e ed.). Paris: Dunod, 2010.

Miron, M., Carabias-Orti, J. J., Bosch, J. J., Gómez, E., & Janer, J., Score-informed source separation for multichannel orchestral recordings. Dans Journal of Electrical and Computer Engineering, (11), p.1-19, 2016. DOI: 10.1155/2016/8363507

Müller, M., Fundamentals of Music Processing : Using Python and Jupyter Notebooks (2^nd ed.). Cham: Springer, 2021.

Mulligan, M., Music subscriber market shares Q2 2021. Dans MIDiA Research, 2022. https://www.midiaresearch.com/blog/music-subscriber-market-shares-q2-2021 Mulligan, M., Music subscriber market shares 2022. Dans MIDiA Research, 2022. https://www.midiaresearch.com/blog/music-subscriber-market-shares-2022

Pirenne, C., Vocabulaire des musiques afro-américaines. Paris: Minerve, 1994.

Poole, A., The strange career of Jim Crow archives: Race, space, and history in the mid- twentieth-century American south. Dans The American Archivist, vol.77(1), pp.23-63, 2014. Rastogi, H., Apple First to Capture 8 Spots in List for Global Top 10 Smartphones. Dans Counterpoint Research, 2023.

Rémond, A., L’enregistrement magnétique : Vers la bande magnétique et le magnétophone. Dans Radiofil Magazine, (69), pp. 16-25, 2015.

Richard, G., Sundaram, S., & Narayanan, S., An overview on perceptually motivated audio indexing and classification. Dans Proceedings of the IEEE, vol.101(9), pp.1939-1954, 2013. Ripani, R. J., The New Blue Music : Changes in Rhythm & Blues, 1950-1999. Jackson: University Press of Mississippi, 2006.

Rumsey, F., & McCormick, T., Son & enregistrement. Paris: Eyrolles, 2002.

Schulze-Forster, K., Informed audio source separation with deep learning in limited data settings [PhD Thesis]. Institut polytechnique de Paris (Palaiseau, France), 2021.

Simon, G., Vers une salle d’écoute dédiée à la musique spatialisée [Mémoire FSMS]. CNSMDP (Paris, France), 2018.

Singleton, M., Apple Music’s Spatial Audio Strategy Is Paying Off With More Listeners, Major Releases. Dans Billboard, 2022.

Spotify. Qualité Audio, 2023. https://support.spotify.com/fr/article/audio-quality/

Stotzer, S., VisualAudio : Caractéristiques matérielles des disques phonographiques. Dans

Département d’informatique, Université de Fribourg, 2003.

Tamarkin, J., ‘Pet Sounds’ in Dolby Atmos: Respect the feelings. Dans Tidal Magazine, 2023. The Beach Boys, Giles Martin introduces The Beach Boys’ ‘Pet Sounds’ in Atmos [Vidéo]. https://www.youtube.com/watch?v=2drX6yEhktg

Thornton, M., Dolby Atmos – Remastering Music – An Introduction [Vidéo], 2020. https://www.production-expert.com/home-page/2020/1/6/remastering-music-in-immersive- audio

Woods, C., Development Arrested: The Blues and Plantation Power in the Mississippi Delta. New York: Verso Books, 2017.

Annexes

Annexe B1 : Expérience n°1 – Informations relatives aux enregistrements sélectionnés

Wonder What is Wrong with Me – Lightnin’ Hopkins (1956), du répertoire blues

Compositeur, parolier : Lightnin’ Hopkins

Enregistrée en avril 1954 aux studios ACA à Houston, Texas

Sortie chez Ace Records sous ce titre, puis chez Herald Records sous le titre

Lightnin’ Don’t Feel Well

Disques :[45T] Wonder What is Wrong with Me / Bad Boogie, Ace Records [Ace 516], mai 1956 [45T] Lightnin’ Don’t Feel Well / My Little Kewpie Doll, Herald Records [H-520], mai 1958

Labels : Ace Records / Herald Records ISWC : ACA 45-3313

Lightnin’ Hopkins – voix, guitare Donald Cooks – basse

Ben Turner – batterie

Oh, Marie – Louis Prima (1959), du répertoire jazz/R&B

Compositeurs : Eduardo di Capua, Alfred Mazzucchi Parolier : Vincenzo Russo, Louis Prima

Enregistrée aux studios Capitol à Los Angeles, Californie, pour le film Hey Boy! Hey Girl! de David Lowell Rich, sorti le 5 août 1959

Album : [33T] Music from the Soundtrack of the Columbia Picture “Hey Boy! Hey Girl!” [T- 1160]

Label : Capitol Records Producteur : Voyle Gilmore ISWC : T-902.878.576-4

Louis Prima – voix, trompette

with Sam Butera & The Witnesses:

Sam Butera – saxophone ténor, chœurs Lou Sino – trombone, chœurs

Robert J. Carter – piano

Bob Roberts – guitare, chœurs

Antony Liuzza – basse, chœurs Paul Ferrara – batterie

B-A-B-Y – Carla Thomas (1966), du répertoire soul

Compositeur : Isaac Hayes Parolier : David Porter

Arrangeurs : Booker T. Jones, Steve Cropper

Enregistrée les 18-19 juillet 1966 aux studios Stax à Memphis, Tennessee

Sortie en 45T [S-195] le 27 juillet 1966, puis en 33T dans l’album Carla [S-709] en octobre 1966 Label de production : Stax Records

Label de distribution : Atlantic Records Ingénieur du son : Tom Dowd Producteur : Jim Stewart

ISWC : T-070.232.055-5

Classement : N°3 R&B / N°14 pop

Carla Thomas – voix, chœurs with Booker T. & the MG’s :

Booker T. Jones – orgue Hammond Steve Cropper – guitare

Donald “Duck” Dunn – basse Al Jackson Jr. – batterie

and The Memphis Horns : Wayne Jackson – trompette

Andrew Love – saxophone ténor Floyd Newman – saxophone baryton

Just Call Me Lonesome – Jim Reeves (1959), du repertoire country [test de remixage]

Compositeur et parolier : Rex Griffin

Enregistrée le 19 décembre 1958 aux studios RCA Victor à Nashville, Tennessee

Sortie en septembre 1959 dans l’album Songs to Warm the Heart [LSP-2001] Label : RCA Victor

Ingénieur du son : Bob Farris Producteur : Chet Atkins

Jim Reeves – voix, guitare Chet Atkins – guitare Floyd Cramer – piano Bob Moore – basse Buddy Harman – batterie

Annexe B2 : Expérience n°1 – Questions de l’entretien préliminaire semi-dirigé

QA1 : Comment définiriez-vous l’« esthétique sonore » d’un enregistrement musical ? Que vous évoque ce terme ?

QA2 : En général, comment considérez-vous la relation entre une œuvre musicale et l’esthétique sonore choisie pour son enregistrement ?

Comment considérez-vous la relation entre l’esthétique sonore choisie et notre perception postérieure de l’œuvre enregistrée ?
Selon vous, à quoi ressemblerait l’esthétique sonore qui serait dans une « relation idéale » avec l’œuvre musicale qu’elle doit embrasser ? Vous pouvez brièvement illustrer vos propos par un exemple d’artiste ou d’enregistrement dans lequel vous pensez que cette relation est idéale, et un autre dans lequel vous pensez qu’elle ne l’est pas.

Plaçons-nous dès à présent dans le contexte des musiques écrites et enregistrées dans les années 1950⁶⁷ (Ray Charles, Ella Fitzgerald, Miles Davis, Art Blakey, Muddy Waters, Elvis Presley, Little Richard, Johnny Cash, The Chordettes, Edith Piaf, Georges Brassens…).

QA3 : Comment pensez-vous cette même relation ?

Conceptuellement, l’œuvre musicale et l’esthétique sonore qui a été choisie pour son enregistrement sont-ils selon vous deux éléments aujourd’hui dissociables ou indissociables ? Pouvez-vous illustrer vos propos par un exemple d’artiste ou d’enregistrement qui vous est familier ?

Si cela n’est déjà fait, pensez à un enregistrement de musiques dites « actuelles » que vous connaissez des années 1950, pour lequel le rendu sonore, voire l’esthétique sonore dans son ensemble, dessert selon vous la musique qui a été pensée et composée.

Imaginez qu’il en soit possible de modifier le rendu sonore dans le but d’optimiser la relation œuvre/esthétique.

QA4 : Quel regard porteriez-vous sur cette pratique ?

Cela impliquerait-il de toucher à l’œuvre musicale elle-même selon vous ? Si oui, qu’en pensez-vous ?

QA5 : Si vous aviez la possibilité d’en modifier certains aspects sonores, le feriez-vous ?

→ Oui : dans quel(s) but(s) ? Travailleriez-vous avec l’idée d’une certaine fidélité vis- à-vis de l’œuvre musicale originale, vis-à-vis de l’esthétique sonore originale, ou bien en toute indépendance ? Pensez-vous à un aspect sonore en particulier ?

→ Non : pourquoi ?

Annexe B3 : Expérience n°1 – Questionnaire d’écoute du master original

QB1 : Qu’entendez-vous dans cette musique ? Qu’est-ce qui y est important pour vous ? Que vous inspire-t-elle ? Quelle image, quel sentiment vous vient en l’écoutant ? Vous pouvez par exemple évoquer le genre, le style, les instruments, le tempo, les nuances, le caractère… et toute considération personnelle.

QB2 : Comment évaluez-vous le rendu sonore de ce master original, au regard du morceau et de ses caractéristiques musicales précédemment évoquées ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Expliquez brièvement votre notation.

QB3 : Comment évaluez-vous le rendu de l’équilibre entre les différentes sources sonores, au regard du morceau et de ses caractéristiques musicales ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Expliquez brièvement votre notation.

QB4 : Comment évaluez-vous le rendu du timbre des différentes sources sonores, au regard du morceau et de ses caractéristiques musicales ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Expliquez brièvement votre notation.

QB5 : Comment évaluez-vous le rendu de l’espace des différentes sources sonores, au regard du morceau et de ses caractéristiques musicales ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Expliquez brièvement votre notation.

QB6 : Finalement, si à vos yeux la relation œuvre/esthétique sonore n’est ici pas idéale, et si vous en aviez la possibilité, quelles modifications sonores prioritaires apporteriez-vous pour que ce morceau connaisse selon vous son rendu sonore idéal ? N’hésitez pas si possible à en préciser le but.

Annexe B4 : Expérience n°1 – Enoncé de la séance de remixage en son spatialisé

Selon votre convenance, vous allez avoir la possibilité de modifier certains aspects sonores de ces trois enregistrements précédemment entendus.

Les sources de chaque enregistrement ont alors été préalablement séparées par un dispositif technique spécifique, afin de vous permettre d’agir individuellement sur chacune d’elles pour cette séance personnelle de remixage.

Phase d’entraînement

Tout d’abord, vous disposez d’un temps illimité pour prendre connaissance des outils qui sont face à vous et qui vous permettront, si vous le souhaitez, d’effectuer selon votre convenance un remixage de ces trois extraits musicaux des années 1950-60. Porté sur un enregistrement-test de musique country, ce temps d’entraînement vous est réservé pour vous familiariser avec la présente interface, et en particulier avec l’action des 4 paramètres de mixage qui vous sont proposés pour chaque source sonore :

Gain (= volume)
Egalisation spectrale (= timbre)
Localisation spatiale
Niveau de réverbération

Chacun de ces paramètres influe sur un aspect sonore précis et facilement audible de la source envisagée. Pour entendre leur impact respectif distinctement, vous pouvez par exemple les poussez à leurs extrêmes.

Ne passez donc à la phase suivante que lorsque vous vous sentez bien à l’aise avec l’outil en main, et que vous avez bien entendu et intégré l’action de ces paramètres de mixage.

Phase de réalisation : remixage des morceaux A, B et C

Une fois l’outil bien en main et le morceau A bien en tête, la phase de remixage commence.

Une règle se présente à vous : vous avez jusqu’à 12 manipulations pour remixer ce morceau selon vos envies. La manipulation d’un paramètre est comptabilisée à partir du moment où vous commencez à en manipuler un autre, et ainsi de suite. Donc par exemple : si vous modifiez le gain d’une source en plusieurs fois d’affilée, cela sera compté comme 1 manipulation. En revanche, si après cela vous décidez de modifier le niveau de réverbération pour cette même source et que vous recorrigez ensuite le gain, l’ensemble sera compté comme 3 manipulations (gain – réverbération – gain). Le seul contre-exemple est le suivant : toucher successivement aux différents potentiomètres d’égalisation d’une même source ne comptera que comme 1 manipulation.

Important : si tel est votre choix, vous pouvez très bien signifier que vous avez terminé votre remixage sans même avoir atteint ce nombre de 12 modifications.

Vous pouvez à tout moment et librement déplacer la tête de lecture pour vous concentrer sur les sections du morceau qui vous intéressent.

Cette séance unique n’est pas un examen, mais une expérience : il n’y a donc ni bon, ni mauvais choix. Sentez-vous simplement vous-même, et surtout, faites-vous plaisir !

Annexe B5 : Expérience n°1 – Questionnaire d’autocritique de chaque nouveau master remixé par les participants

QD1 : Comment évaluez-vous le rendu sonore de ce nouveau master, que vous venez de produire, au regard du morceau et de ses caractéristiques préalablement évoquées ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Pouvez-vous brièvement expliquer votre notation et le but de vos manipulations de remixage ? Lesquelles sont particulièrement à vocation corrective ?

Lesquelles sont particulièrement à vocation esthétique ?

QD2 : Comment évaluez-vous le rendu de l’équilibre entre les différentes sources sonores, au regard du morceau et de ses caractéristiques ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Expliquez brièvement votre notation.

QD3 : Comment évaluez-vous le rendu du timbre des différentes sources sonores, au regard du morceau et de ses caractéristiques ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Expliquez brièvement votre notation.

QD4 : Comment évaluez-vous le rendu de l’espace des différentes sources sonores, au regard du morceau et de ses caractéristiques ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Expliquez brièvement votre notation.

QD5 : Avez-vous été perturbé(e) par un quelconque élément durant :

l’écoute du master original du morceau ? Précisez si possible.
le remixage du morceau ? Précisez si possible.
l’écoute de votre propre master ? Précisez si possible.
un autre moment de l’expérience ? Précisez si possible.

QD6 : Le processus préalable de séparation de sources a pu restituer des signaux incomplets ou endommagés par divers artefacts. Vous ont-ils perturbé(e), limité(e) dans vos différents choix de remixage ? Illustrez vos propos le cas échéant.

QD7 : Avez-vous d’autres remarques que vous souhaitez formuler pour ce morceau ?

Annexe B6 : Expérience n°1 – Retours généraux

Légende : IS = Ingénieur du son / M = Musicien / P = Expert 1950-60

Participant	Retour général de l’expérience n°1
IS1	Pas l’habitude de me poser ces questions, qui m’ont finalement animée.
IS2	Expérience intéressante. C’est une pratique très utile et fructueuse pour modifier l’équilibre général et certains timbres. Mais la qualité des signaux limite fortement la possibilité d’élargir l’image sonore de ces masters. La génération d’harmoniques sur ces signaux pourrait ouvrir le champ des possibles sur l’aspect spatial.
IS3	–
IS4	–
IS5	Expérience vraiment intéressante, très cool. Analyser et critiquer ce qu’on fait. Je me rends compte que ce n’est pas simple d’enregistrer des vieux enregistrements. Exercice ludique, c’est agréable. Seule frustration : 12 manipulations. Je me rends compte ici que le bouton « solo » ne sert à rien ici. L’interface de remixage est bien.
IS6	Vos choix de morceaux sont bien, à la fois peu et beaucoup de sources. J’ai été très surpris sur les morceaux R&B (première fois que je vois une piste dégradée (piano) apporter au mix musicalement ET esthétiquement) et soul (amélioration très rapide du rendu sonore avec si peu de manipulations et de paramètres, très agréablement surprenant). J’ai été intéressé par cette expérience, qui me confirme que le bouton « solo » devrait été banni. On s’en fout comment une source sonne seule. Le bouton « mute », lui, est beaucoup plus musical, on doit le conserver, car c’était avec celui-ci qu’on se rend compte de l’apport de la source dans l’arrangement musical.
IS7	Très sympa, on devrait faire ça plus souvent. Le fait de mixer change la perception par rapport à une phase d’écoute.
IS8	C’était marrant !
M1	–
M2	Très rigolo !
M3	–
M4	–
M5	Super ludique. Super intéressant. C’est un terrain sur lequel je vais peu avec la parole. Cette expérience me permet de revoir beaucoup de termes, d’être précis dans ce que je dis. L’outil de remixage est instinctif, ce qui permet de se concentrer sur l’essentiel et rend l’écoute plus fine et plus directe, ce qui est très important, c’est cool.
M6	C’est fou de sentir qu’on peut isoler un instrument et l’entendre seul… La séparation de sources serait très utile pour retranscrire des partitions, « repiquer un solo ». J’en ai rêvé plein de fois dans ce but musical, pour savoir dans l’orchestre ce qui fait que ça groove autant, « chercher les fonds de sauce », pour pouvoir le réappliquer à l’identique dans un autre morceau, une composition personnelle. Il faudrait à la limite refaire les mêmes défauts à la prise, pour préparer ce processus de son. C’est un outil pédagogique fabuleux. Retoucher le son d’enregistrements passés m’intéresse, il est vrai…
M7	C’était trop bien !
M8	Très riche expérience, qui permet d’analyser ses propres analyses.
P1	J’attendais ce genre d’expérience depuis longtemps. Je m’attendais un petit peu à cela, j’étais un peu excité. Cela a tout à fait répondu à mes attentes. J’avais connaissance de la chose [la séparation de sources], mais je n’avais jamais pu remixer des œuvres de cette époque, que je connais bien. Je pourrais rester pendant longtemps devant la machine à remixer …
P2	Expérience intéressante ! Je comprends la nécessité de limiter les outils pour le remixage. La séparation de sources ne permet pas encore de remixer en profondeur ou au moins selon nos envies…
P3	Mon idée de ne pas toucher à la mono d’un master mono s’est confirmée à travers cette expérience. Cela doit rester mixé et écouté en mono, si l’on s’appuie sur le même objet d’origine (au contraire d’un réenregistrement).
P4	Le son, cela me passionne. Cette salle est un laboratoire, c’est super. Voir qu’on peut améliorer le rendu sonore, cela m’intéresse beaucoup, même sur des enregistrements plus récents.
P5	Très intéressant. Avec ces exemples, je me rends compte que c’est intéressant d’avoir ces outils pour remixer. La technologie de séparation est impressionnante, cela pose des questions sonores et éthiques qu’on ne se posait pas avant, parce que ce n’était tout simplement techniquement pas possible.
P6	Vous atteignez toutes mes capacités à travers vos questions après l’écoute des masters originaux : vos questions sont très bonnes, c’est très intéressant. Heureusement que je n’ai pas cet outil à la maison, je ne dormirais plus ! Je serais plus addict à cela qu’aux jeux vidéo, on joue à l’apprenti sorcier ! (rires)
P7	Cela peut être un très bon outil pour la pédagogie d’oreille, pour les personnes qui apprennent la musique. Super intéressant.

Super intéressant. Cela donne envie de bidouiller pour voir comment on peut changer ces rendus. J’ai toujours tendance à penser qu’il manque quelque chose en mono, un manque de relief, d’espace. Cela est lié à mes pratiques d’écoute car j’écoute beaucoup au casque. L’audio immersif m’a déjà fasciné dans quelques expériences passées, j’ai voulu appliquer cela ici à ma manière.

Annexe C1 : Expérience n°2 – Tableau récapitulatif de l’amélioration progressive de la qualité des signaux isolés de la chanson B-A-B-Y de Carla Thomas

Stem/Source	SpectraLayers brut	SpectraLayers retouché	RipX brut	RipX retouché
Global	Souffle conservé	–	Souffle retiré	–
	Aucune perte de signal	–	Perte d’harmoniques aigues (cymbales/piano/chœurs)	–
	Spectre entièrement conservé	–	Coupure des fréquences >20 kHz	–

Voix	Cohabitation avec orgue/cuivres	Peu d’interférences orgue	Cohabitation avec orgue	Faibles interférences orgue
	Interférences batterie	Interférences batterie/piano/guitare/cuivres	Aucune interférence	–
	Présence de souffle	–	Aucun souffle	–
	Réverbération perçue	–	Peu de réverb perçue	–

Cuivres	[Stem « Autres »] Cohabitation avec piano/orgue/guitare / Interférences basse	Pas de cohabitation	[Stem « Strings »] Cohabitation avec orgue/guitare	Pas de cohabitation
		Interférences guitare/batterie	–	Faibles interférences guitare
		Spectre légèrement plus complet que RipX	Spectre rarement plus complet que SpectraLayers	Spectre moins complet que SL retouché / Spectre incomplet à 2’20 car mélange accord guitare

Orgue	[Stem « Autres »] Cohabitation avec cuivres/piano/guitare / Interférences basse	Pas de cohabitation	[Stem « Strings »] Cohabitation avec cuivres/guitare	Pas de cohabitation
		Peu de transitoires		Transitoires un peu plus nombreuses

Piano	Quasiment aucun signal, fréquences parasites	Piano sans main gauche, donc étriqué vers l’aigu	Piano complet, récupération de la main gauche	–
		Instabilité de la réponse du signal isolé (alors qu’ostinato)	Stabilité de la réponse du signal	–
		Transitoires manquantes en tutti	Transitoires récupérées en tutti	–

		Artefacts	Très peu d’artefacts	–
		Interférences basse/batterie/voix	Aucune interférence	Faibles interférences cuivres
		Récupération du souffle en intro	Aucun souffle repris	–

Guitare	[Stem « Autres »] Cohabitation avec cuivres/piano/orgue / Interférences basse	Aucune cohabitation	Cohabitation avec cuivres	Pas de cohabitation
		Interférences voix	Interférences piano/orgue/basse	Faibles interférences cuivres
		Spectre incomplet (bas, harmoniques) / Instrument parfois méconnaissable	Spectre complet	Spectre plus dense que SpectraLayers retouché (bas, harmoniques) / Instrument net

Basse	Enveloppe floue (pas d’attaque, pas de release)	Enveloppe floue (pas d’attaque, pas de release) / Aucune perception du jeu du bassiste	Enveloppe beaucoup plus définie (perception attaque/release) / Perception du jeu et du groove du bassiste	–
	Interférences cuivres/orgue/piano/ guitare/kick	Interférences minimes kick	Interférence orgue	Aucune interférence
		Irrégularité harmonique du signal	Régularité harmonique du signal	–

Batterie	Stem Percussions unique	Stem Percussions unique	Stem Kick (interférences snare) Stem Drums Stem Percussions	Stem Kick (aucune interférence) Stem Drums (« Drums » + « Percussions »)
	Interférences voix/cuivres/orgue/ guitare	Interférences harmoniques voix/guitare	Interférences orgue/guitare	Brèves interférences guitare (sur les coups de snare)
		Coups de kick inégaux en niveau	Coup de kick égaux en niveau	–
		Irrégularité harmonique du signal (snare)	Régularité harmonique du signal (snare)	–

Annexe C2 : Expérience n°2 – Questionnaire du test d’écoute pour « producteurs » Bienvenue à ce test d’écoute comparative ! Pour vous connaître un peu mieux…

QE1 : Vous participez en tant que…

□ Ingénieur(e) du son □ Réalisateur(rice) artistique □ Producteur(rice) musical(e) QE2 : Quel âge avez-vous ?

QE3 : Connaissez-vous le label Stax Records ?

□ Oui □ Non

QE4 : Connaissez-vous le « son Stax », aussi appelé « Memphis Sound », caractéristique du label Stax Records ?

□ Oui □ Non

QE5 : Connaissez-vous le format audio Dolby Atmos ?

□ Oui □ Non

QE6 : Pratiquez-vous le mixage en son immersif ?

□ Oui □ Non

Ecoute du master original de B-A-B-Y

QF1 : Après cette écoute, comment évaluez-vous le rendu sonore global du master original B-A- B-Y, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QF2 : Comment évaluez-vous le rendu de l’équilibre entre les différentes sources, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QF3 : Comment évaluez-vous le rendu du timbre des différentes sources, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QF4 : Comment évaluez-vous le rendu de l’espace des différentes sources, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QF5 : Pouvez-vous expliquer en quelques mots vos notations et vos impressions du rendu sonore du master original de la chanson B-A-B-Y, au regard de ce que suggère selon vous la musique ?

QF6 : Avez-vous été perturbé(e) par un ou des éléments sonores extérieurs durant l’écoute du master original ?

Ecoute du master remixé en son immersif de B-A-B-Y

QG0 : Quelles sont vos toutes premières pensées générales au sortir de cette seconde écoute ? (Facultatif)

QG1 : Comment évaluez-vous le rendu sonore global du master remixé de B-A-B-Y, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QG2 : Comment évaluez-vous le rendu de l’équilibre entre les différentes sources dans le master remixé, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QG3 : Comment évaluez-vous le rendu du timbre des différentes sources dans le master remixé, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QG4 : Comment évaluez-vous le rendu de l’espace des différentes sources dans le master remixé, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QG5 : Pouvez-vous expliquer en quelques mots vos notations et vos impressions du rendu sonore du master remixé de la chanson B-A-B-Y, au regard de ce que suggère selon vous la musique ?

QG6 : Avez-vous été perturbé(e) par un ou des éléments sonores extérieurs durant l’écoute du master remixé ?

Comparons les deux masters…

QH1 : Selon vous, l’âme (soul) de la chanson est…

□ mieux retranscrite dans le master original □ mieux retranscrite dans le master remixé

□ également retranscrite dans les deux masters □ Je ne sais pas

QH2 : Lequel des deux masters entendus vous fait le plus ressentir le groove de la chanson ?

□ Le master original □ Le master remixé □ Les deux à égalité □ Je ne sais pas

QH3 : Selon vous, lequel des deux masters entendus met le mieux en valeur l’arrangement de la chanson ?

□ Le master original □ Le master remixé □ Les deux à égalité □ Je ne sais pas

Conclusion

QI1 : Toute considération matérielle exclue, pensez-vous que le master remixé en son immersif donnerait envie au grand public d’écouter la chanson B-A-B-Y plus souvent qu’avec la version originale ?

□ Oui □ Non □ Je ne sais pas

QI2 : Toute considération matérielle exclue, pensez-vous que le master remixé en son immersif donnerait envie au grand public d’écouter dans les mêmes conditions sonores le reste du catalogue du label Stax ?

□ Oui □ Non □ Je ne sais pas

QI3 : Pouvez-vous justifier ces deux dernières réponses ?

QI4 : Si vous étiez le producteur de Stax ou d’un autre label, engageriez-vous les démarches pour commercialiser ce master remixé en son immersif de la chanson B-A-B-Y ?

□ Oui □ Non □ Je ne sais pas

QI5 : Pouvez-vous justifier votre réponse ?

QI6 : Merci de votre participation à ce test d’écoute ! Souhaitez-vous ajouter quelque chose ?

Annexe C3 : Expérience n°2 – Commentaires des « producteurs » sur le rendu sonore du master original et celui de notre master remixé en son immersif de la chanson B-A-B-Y

Légende : IS = Ingénieur du son / RA = Réalisateur artistique / PM = producteur musical

Spécialiste de Stax Records / * Spécialiste du mixage en son immersif

Participant	Commentaire du master original	Commentaire du master remixé
IS1	Les timbres m’ont dérangé à cause de leur hétérogénéité : certains très durs (voix, cuivres) d’autres très mous, effacés (piano, drums). Les espaces sont très différents entre les sources (piano et drums lointains). Le propos musical passe mal à	Wow ! Assez impressionnant. Le groove passe très bien, les sources sont équilibrées. Les timbres sont plus agréables mais ils restent souvent pauvres et parfois agressifs. La saturation de la voix est moins gênante mais continue de me sortir de la musique

	cause des « défauts » de mix, de prises et de support. Si le morceau reste agréable, c’est grâce à l’ancrage historique de cette musique et de ce son. La saturation et le souffle m’ont aussi parfois sorti de la musique.	parfois. Le placement dans l’espace « stéréo » complimente le groove. La réverbération est subtile, naturelle et agréable. Au tout début du morceau on entend des artefacts sur la basse mais rapidement ils disparaissent et on est dans la musique. Solo de cuivres à droite trop fort et snare au même moment trop fort aussi. Le mix devient assez déséquilibré et l’énergie trop à droite.
IS2*	Compte tenu du format, la balance des sources est super, on entend tout bien, malgré une voix très devant et peut-être un peu trop dynamique, le propos musical est là pour moi. Parfois, la voix est un peu rêche et certains éléments se perdent mais ça ne change pas la musique pour moi.	Le rendu sonore a gagné en précision, le son est plus clair. Le piano semble plus beau, c’est mieux pour le coup. Mais je trouve que la dissociation basse / batterie fait perdre du groove, et la batterie placée à droite fait perdre le fil car trop agressive. Ce qui est super, c’est l’air gagné et le respect de la musique dont fait preuve le mixage en format immersif. Mais il est sobre, il aurait peut-être fallu prendre plus de parti sur la spatialisation de certaines choses.
IS3*	Enregistrement conforme à ce que l’on peut attendre de Stax. Les défauts que l’on pourrait noter après une écoute analytique font partie de la signature sonore du label, c’est donc tout à fait conforme.	Avec cette musique et cette interprétation, on est en attente de quelque chose de bien précis, et là, il nous est proposé autre chose. Cela peut être perturbant car on n’est plus dans le « contrat d’écoute » initial. Cela donne par contre un nouvel éclairage pour cette musique. C’est presque autre chose. Mieux ou moins bien, ce n’est à mon sens pas la question. On peut considérer qu’écouter ces musiques sous ce nouvel angle apporte réellement quelque chose d’intéressant au même titre qu’il est intéressant d’écouter des versions plus ou moins datées d’œuvres de musique classique. Impression d’un rendu moins dynamique (peut-être moins de groove ?) que la version mono. Plus équilibré spectralement. Donne plus à entendre l’arrangement. On en entend bien tous les détails.
IS4*	J’aime le master original au regard de la façon dont la musique était censée sonner à cette époque avec leur type de support (l’esthétique sonore fait corps avec la technologie utilisée). Dans une approche d’écoute réaliste en concert, les timbres et l’espace sont en deçà des performances que peuvent donner ce genre d’instruments joués en groupe.	De l’espace et de l’air. Super boulot, ça sonne. Bravo pour la séparation des sources, on n’entend aucun artefact. L’esthétique de production est conservée (avec ses défauts sur les timbres mais ça fait partie du truc) mais avec l’espace frontal en plus. Il n’y a pas de démasquage spatial car il n’y avait pas de masquage avant, même en mono (merci à l’arrangement et au démasquage fréquentiel déjà réalisé sur le mix original). C’est juste plus agréable et ça reste stable avec les déplacements (mais la mono était stable aussi ;-). L’immersion est quasi absente dans le sens où il n’y a pas (ou très peu) de sensation de pièce ajoutée par les surrounds. C’est donc pour moi un master surtout frontal immersif avec quasiment pas d’immersif (ou en tout cas pas assez perceptible).
IS5	Cet enregistrement me donne l’impression que beaucoup d’éléments de cet enregistrement ont été contraints par la technique. À mon sens les enregistrements d’Isaac Hayes pour Stax sont autrement beaucoup plus qualitatifs (certes ils sont plus récents) et représentatifs du son Stax. Il n’en reste pas moins que ce style de musique est ancré dans une époque et donc tous les « défauts » ou imperfections techniques des enregistrements de cette époque sont intrinsèquement liés à la musique.	Tout est mieux pour moi sauf une chose. Plus de place à la voix, c’est bien. Meilleur équilibre entre les différents éléments de l’orchestration. La ligne de basse est mieux définie, moins bourrue, et plus constante tout au long du morceau. L’espace aussi est plus agréable, on a moins le sentiment que tout le monde est ou veut être au premier plan. Le côté négatif : la batterie à droite est une étrangeté pour moi, car cela place l’enregistrement de la chanson à un autre moment de l’histoire de la musique enregistrée (une certaine époque où ingénieurs du son et producteurs expérimentaient la stéréo). Est-ce que la version remixée a toujours le son Stax ? Musicalement oui, mais d’un point de vue historico- culturel, je me pose la question.
RA1	Avec de la stéréo sur certains éléments, on profiterait mieux de l’arrangement. Le son est splendide mais manque d’aigus sur certaines sources (orgue, cymbales).	Impressionnant. C’est très beau. Je suis moins dans l’écoute de la voix principale que dans la version originale. En revanche j’ai une meilleure impression de rendu de la dynamique du groupe, des espaces. Je perçois mieux les arrangements. J’ai plus

		l’impression d’une captation live où j’identifie le placement des instruments. Je trouve cependant l’ensemble un peu trop large (orgue trop à gauche, piano trop loin de basse/batterie, qui ne fait plus bloc avec eux comme dans la version originale). On a les mêmes « marqueurs » esthétiques (rimshot de snare très fort, peu de réverb, équilibres de l’orchestre, timbre vintage saturé). Les timbres me semblent plus beaux. Version très chic donc pour moi.
RA2*	Excellent rendu de la spatialisation grâce au mix. On retrouve l’atmosphère enfumée d’un club, dont un enregistrement tel que celui-ci est une tentative de reproduction.	Le master remixé à la fois améliore et respecte le morceau, je trouve cela très bien fait. C’est un « gadget » intelligemment utilisé, car il ne cherche pas à dénaturer l’original. Au contraire, j’y vois une grande fidélité. Je pense que l’autre avantage est de nettoyer la « vitre sale » qui était entre le master original et l’auditeur. Je pense que ce master nous permet de voir à quel point une écoute est subjective, et à quel point notre cerveau recrée entièrement l’espace dans la version originale. La spatialisation reçue ici se fait naturellement, la consommation est plus directe, il y a moins d’efforts à faire. Je trouve tout de même cela un peu trop frontal, j’aurais aimé avoir des éléments sur les côtés, avoir plus d’immersion. Je trouve aussi les cuivres un peu trop au centre, j’aurais aimé les entendre plus à droite.
PM1*	La basse est trop envahissante. Je suis habitué à la mono pour cette musique. La source du master est importante : numérisé ? disque ? Beaucoup de différences déjà entre rendu un 45T et un 33T.	Le changement est dément… Les instruments sont magnifiés. La batterie est beaucoup plus mise en avant (caisse claire claque trop parfois). La basse est plus agréable, elle n’envahit plus, elle est très présente sans écraser le son. Elle remplit enfin son rôle. Meilleure distinction des instruments. Mais le grand point gênant : la voix est trop en retrait. Cela est gênant par rapport à l’idée originale de l’enregistrement : enregistrer pour la chanteuse. Si ces enregistrements sont disponibles au grand public, il faut absolument renseigner qu’il ne s’agit pas du master original mais d’un master retravaillé. Ce master remixé me rappelle beaucoup ce qu’on pouvait obtenir à partir des égaliseurs Hi-Fi de l’époque, surtout au niveau des aigus très surélevés.

Annexe C4 : Expérience n°2 – Avis des « producteurs » sur le potentiel culturel et commercial de notre master remixé en son immersif de la chanson B-A-B-Y

Légende : IS = Ingénieur du son / RA = Réalisateur artistique / PM = producteur musical

Spécialiste de Stax Records / * Spécialiste du mixage en son immersif

Participant	Avis sur le potentiel culturel du master remixé en son immersif de B-A-B-Y	Avis sur le potentiel commercial du master remixé en son immersif de B-A-B-Y
IS1	Son global moins repoussant, moins daté. On est beaucoup plus facilement dans la musique et pas dans les défauts sonores. Musique soul toujours très populaire aujourd’hui. Catalogue Stax très bon (j’imagine).	Mode du multicanal grand public en ce moment (binaural, Apple).
IS2*	Je ne sais pas à quel point le grand public est sensible et est capable de dissocier le rendu entre la mono et ce remixage car il est très respectueux ce qui est super mais la spatialisation reste quand même assez discrète. À moins de les sensibiliser à ce genre de format pour qu’ils aient déjà un élément de comparaison et qu’ils comprennent le gain en termes d’espace et de dynamique.	Je ferais changer certaines choses mais c’est quand même intéressant de donner une nouvelle relecture et de le partager.

IS3*	Je ne sais pas répondre car le public pourrait être déstabilisé par le changement de « contrat d’écoute », mais en même temps pourrait être intéressé par ce nouvel éclairage de cette musique. Par contre, je pense que dans le cadre d’une écoute au casque, il y aurait sans doute un vrai avantage à avoir une version spatialisée de ces musiques uniquement disponibles en mono, qui me semblent plus gênantes à écouter au casque qu’aux enceintes.	Apporter un nouvel éclairage sur une musique me semble toujours intéressant.
IS4*	L’immersion n’est pas assez flagrante pour un public lambda. Tout juste entendrait-il l’élargissement de l’image. Un public mélomane et passionné de ce label serait enthousiaste avec ce remix, un public lambda pas sûr…	Le label Spatial Audio serait juste un argument commercial mais ça ne révolutionne pas ce genre de musique (qui sonnerait toujours avec ces timbres un peu fragiles, ce qu’un public lambda entend).
IS5	Musicalement, les modifications sonores apportent un plus à la chanson. Mais encore une fois, je ne suis pas sûr que le grand public y soit très sensible (le mp3 128kb a malheureusement encore de beaux jours devant lui, je pense).	Marketing…
RA1	–	L’éclairage apporté me semble très intéressant, j’imagine que la VO et cette version pourraient cohabiter.
RA2*	Je pense que le master remixé faciliterait l’accès de cette musique au grand public. S’ils peuvent découvrir cette musique ainsi, tant mieux !	Si cela favorise l’accès à cette musique aux gens qui ne la connaissent pas, oui bien sûr ! Et on pourra toujours avoir accès au master original, donc quel est le problème ? J’aimerais bien que cette version remixée existe. Je pense que j’écouterais plus volontiers la version originale, mais cela m’amuserait d’accéder aux deux versions pour les comparer.
PM1*	Cela va attirer beaucoup de curieux, tant mieux !	Cela permettrait d’éveiller la curiosité des gens, la connaissance de ce répertoire !

Annexe C5 : Expérience n°2 – Questionnaire du test d’écoute pour « consommateurs »

Bienvenue à ce test d’écoute comparative !

Pour vous connaître un peu mieux…

QJ1 : Quel âge avez-vous ?

QJ2 : Vous êtes…

□ un homme □ une femme

QJ3 : A quelle fréquence écoutez-vous de la musique soul/rhythm and blues ?

□ Jamais □ Rarement □ Occasionnellement □ Souvent □ Tout le temps

QJ4 : Connaissez-vous le label Stax Records ? En voici quelques artistes : Otis Redding, Sam & Dave, Rufus Thomas, Carla Thomas, Johnnie Taylor, The Staple Singers…

□ Oui □ Non

QJ5 : Connaissez-vous le « son Stax », aussi appelé « Memphis Sound », caractéristique du label Stax Records ?

□ Oui □ Non

Placez-vous sur la chaise haute…

[Ecoute des deux versions sonores A et B]

Après ces deux écoutes

QK1 : Quelles sont vos toutes premières pensées générales au sortir de ces deux écoutes ? (Facultative)

QK2 : Connaissez-vous cette chanson ? Il s’agit de B-A-B-Y, interprétée par Carla Thomas en 1966 pour le label Stax.

□ Oui □ Non

QK3 : Comment aimez-vous cette chanson telle que vous l’avez entendue dans la version A ?

0	1	2	3	4	5	6	7	8	9	10
Pas du tout										Follement

QK4 : Comment aimez-vous cette chanson telle que vous l’avez entendue dans la version B ?

0	1	2	3	4	5	6	7	8	9	10
Pas du tout										Follement

QK5 : A travers laquelle des deux versions sonores entendues préférez-vous écouter la chanson B- A-B-Y de Carla Thomas ?

□ La version A □ La version B □ Les deux à égalité, par choix

□ Les deux à égalité, par indifférence □ Je ne sais pas

QK6 : Selon vous, laquelle des deux versions sonores entendues retranscrit le mieux l’âme (soul) de la chanson ?

□ La version A □ La version B □ Les deux à égalité □ Je ne sais pas

QK7 : Laquelle des deux versions sonores entendues vous fait le plus ressentir le groove de la chanson ?

□ La version A □ La version B □ Les deux à égalité □ Je ne sais pas

QK8 : Selon vous, laquelle des deux versions sonores entendues met le mieux en valeur l’arrangement de la chanson ?

□ La version A □ La version B □ Les deux à égalité □ Je ne sais pas

QK9 : Appréciez-vous plus le rendu sonore de certains instruments dans la version A que dans la version B ? Si oui, lesquels ?

Pouvez-vous détailler vos réponses ?

QK10 : Appréciez-vous plus le rendu sonore de certains instruments dans la version B que dans la version A ? Si oui, lesquels ?

Pouvez-vous détailler vos réponses ?

QK11 : Si vous connaissez le « son Stax », laquelle des deux versions sonores entendues en désigne selon vous la plus fidèle illustration ?

□ La version A □ La version B □ Les deux à égalité □ Je ne sais pas

□ Je ne connais pas le son Stax

QK12 : A quelle époque vous sentez-vous en écoutant la version A ? QK13 : A quelle époque vous sentez-vous en écoutant la version B ?

QK14 : Pouvez-vous en donner les causes ?

Comment appréhendez-vous cette différence (ou similitude) d’époques ressenties depuis une même interprétation musicale ?

QK15 : Avez-vous été perturbé(e) par un ou des éléments sonores extérieurs pendant l’écoute de la version A ?

QK16 : Avez-vous été perturbé(e) par un ou des éléments sonores extérieurs pendant l’écoute de la version B ?

Information : la version A (ou B) est la version sonore originale de la chanson / la version B (ou A) en est une version remixée.

Conclusion

QL1 : Toute considération matérielle exclue, pensez-vous que la version remixée vous donnerait envie d’écouter la chanson B-A-B-Y plus souvent qu’avec la version originale ?

QL2 : Toute considération matérielle exclue, pensez-vous que la version remixée vous donnerait envie d’écouter dans les mêmes conditions sonores le reste du catalogue du label Stax ?

QL3 : Merci de votre participation à ce test d’écoute ! Souhaitez-vous ajouter quelque chose que vous n’avez pas dit ?

Annexe C6 : Expérience n°2 – Commentaires de fin d’expérience des « consommateurs »

Légende : P = Expert 1950-60 / M = Musicien / NM = Non musicien

Participant	Commentaires de fin d’expérience des « consommateurs »
P1 (= P8 Test 1)	Beau travail !
P2 (= P1 Test 1)	Bravo et encore bravo ! On aurait rêvé faire la chose pour ces artistes merveilleux de Memphis Tennessee, et leur faire écouter !
P3 (= P5 Test 1)

M1
M2
M3
M4
M5
M6
M7	L’espace les amis, l’espace !
M8
M9
M10	C’est intéressant déjà de comparer différentes versions, mais là de voir même au sein du même morceau, des différences à l’écoute, c’est bluffant. Ça fait réfléchir sur l’importance du matériel d’écoute. Par exemple pour mon cas personnel, si quelqu’un découvrait l’opéra sur un enregistrement bon mais avec un mauvais matériel, alors il n’apprécierait peut-être pas à sa juste valeur l’œuvre ou même dans ce cas le genre ! Donc très important.

M11	Je préfère garder le côté original pour comprendre l’objet artistique de l’époque et non pas vu de 2023.
M12
M13
M14
M15	J’étais concentré sur le timbre des instruments dans la première écoute [remixée], parce que je m’attendais à trouver là les différences entre les deux versions. Après, j’ai changé mon écoute, je me suis aperçu de l’espace, de la présence des instruments et du souffle, ce qui m’a aidé à décider finalement. Cela a été positif d’avoir changé d’écoute et de m’être concentré sur d’autres paramètres. Les questions m’ont aidé à cela.
M16
M17	J’ai été surpris par le fait que la version A soit le remix, mais très agréablement, car ce dernier rajoute de l’âme et du caractère au morceau, et permet de faire mieux entendre l’arrangement.
M18	Etonnement positif quant à découvrir que la version que je croyais être l’original est en fait le remixage, bon travail de mixage !
M19
M20
M21	Bravo

NM1
NM2
NM3	C’était passionnant merci beaucoup
NM4
NM5
NM6	Eh ben c’est ouf ! Je pensais instinctivement que la version studio originale était la première [remixée] et je ne pensais pas que ce genre de technique de mixage existait.
NM7	J’aurai imaginé que la version B [remixée] était l’original, cela a été surprenant d’apprendre l’inverse. Même si une fois l’information donnée, cela fait sens, la version B [remixée] me semblant plus moderne et plus équilibrée. Découvrir que le positionnement des instruments joue à ce point sur les émotions procurées est dingue. Il y a une vraie douceur, une sensibilité et en même temps de la puissance dans cette seconde version [remixée] qui est étonnante. Cela donne envie de mieux comprendre et d’écouter différemment la musique et donne des clefs d’analyse qui sont précieuses pour pouvoir profiter encore mieux des instruments, du rythme et des petits chamboulements que cela crée dans le ventre. Alors un grand merci pour cette découverte.
NM8
NM9	Merci
NM10	C’était trop bien 🙂
NM11	C’était une drôle expérience. Merci beaucoup !
NM12	J’ai été surprise de voir que la version A [remixée] était une version remixée, je pensais l’inverse. Notamment par rapport à la place plus assumée de l’orgue dans la version B [originale] qui, à mon sens, rend l’écoute plus intéressante et change totalement le style de la musique (ça la rend plus contemporaine). Je trouve ça très étonnant que la version B [originale] date des années 60, je dois avoir une vision trop cliché du style de musique de cette époque.
NM13	Merci beaucoup c’était super ! (Vive l’orgue)
NM14	Bon travail !
NM15	Surprise d’apprendre que la version B est l’originale, un peu « mono », mais logique quand on sait pourquoi. Je serais curieuse d’entendre la version A [remixée] avec une bonne qualité d’écoute et la version B [originale] dans ma cuisine sur la radio.
NM16	Merci
NM17
NM18	Je tombe des nues d’apprendre que la version B est la version originale. Je trouve ça surprenant qu’on puisse donner un tel « grain » à une musique remixée, comme si elle datait de plusieurs décennies. C’est une surprise positive.
NM19
NM20	Vive la version B [remixée], on sent beaucoup plus le groove et le rôle de chaque instrument !
NM21

Remerciements

Je tiens à remercier profondément Valentin Bauer, mon directeur de mémoire qui, par son écoute et son engagement, a été mon moteur pendant un an. Je lui dois énormément.

Merci à tous les ingénieurs du son, réalisateurs artistiques, producteurs, professeurs, musiciens, non musiciens, journalistes, disquaires, pour leur précieuse participation à l’une des deux expériences, leur sincère intérêt, et toutes les informations essentielles qu’ils m’ont transmises. J’y ai fait là des rencontres importantes que je ne suis pas près d’oublier.

Merci aux chercheurs et développeurs qui m’ont accordé de leur temps pour me confier des clefs de compréhension dans un domaine d’étude captivant et que je ne connaissais pas.

Merci à Nicolas Erard et à François Longo pour leur aide et leur disponibilité.

Merci à l’ensemble de l’équipe pédagogique de la FSMS qui m’a beaucoup appris et m’a donné toutes les clefs pour réaliser de merveilleux projets artistiques, visuels et sonores dans cette formation unique en son genre. Une mention spéciale à Olivier Montagnon, Justine Huet, Virginie Evennou et Denis Vautrin, qui m’ont offert tous les moyens pour mener à bien ce mémoire.

Merci à ma famille, mes parents pour leur soutien important pendant ces quatre années.

Et un remerciement très spécial à celle qui, par son écoute, sa patience, sa tendresse, a été d’un soutien de tous les instants durant plus d’une année.

L’Arrivée d’un train en gare de La Ciotat (1896) de Louis Lumière, restaurée en 4K et 60 i/s par Denis Shiryaev : https://www.youtube.com/watch?v=gwSw_WLgekE ↩︎
Chants de travail. ↩︎
Il s’inspire du titre It Must Be Jesus des Southern Tones pour écrire I Got A Woman (1954). ↩︎
Dès 1943, les techniciens allemands parviennent même à enregistrer des concerts sur une bande contenant deux pistes, permettant déjà une reproduction stéréophonique. Au sortir de la guerre, l’URSS retrouve à Berlin des centaines de bandes, mais seulement trois stéréophoniques (Rémond, 2015). ↩︎
Pour la suite de notre étude, nous abrégerons parfois le terme « monophonique » par « mono ». ↩︎
Le magnétophone bipiste contient une bande dont les deux pistes sont séparées par un intervalle de garde qui garantit une diaphonie minimale entre elles. À l’inverse, il est impossible de ne traiter qu’une seule des deux pistes d’un magnétophone stéréo, destiné à générer un master (Rumsey & McCormick, 2002). ↩︎
Réenregistrement. ↩︎
Le label de R&B/soul Atlantic Records est en 1958 le premier studio à posséder un enregistreur 8 pistes, mais rarement avec l’idée de pratiquer l’overdubbing (Moorman, 2003). ↩︎
Smokestack Lightnin’ (1956, Chess Records) : https://www.youtube.com/watch?v=PnXTpkugcHo ↩︎
Ole Man Trouble (1965, Volt Records) : https://www.youtube.com/watch?v=oKsiukdz0xI ↩︎
Hound Dog (1956, Peacock Records) : https://www.youtube.com/watch?v=ucqhmFyzMgs ↩︎
Mess Around (1953, Atlantic Records) : https://www.youtube.com/watch?v=u37gVPLpRNE ↩︎
Beaucoup de labels de blues/R&B/soul continuent de travailler avec des enregistreurs 2, 3 ou 4 pistes. ↩︎
Ain’t No Mountain High Enough (1967, Motown) : https://www.youtube.com/watch?v=7PItshAEAC4 ↩︎
« L’usine à tubes », le surnom de Motown Records. ↩︎
SPAT Revolution : https://www.flux.audio/project/spat-revolution/ ↩︎
International Federation of the Phonographic Industry (IFPI). ↩︎
Sans perte. Perte générée par l’échantillonnage des données audio. ↩︎
La scène sonore suit les mouvements de la tête. ↩︎
Souvent, les sources séparées des enregistrements de jazz sont les fichiers multipistes eux-mêmes, car la stratégie de prise de son en proximité le permet. ↩︎
Non-negative matrix factorization (NMF). ↩︎
Machine learning. ↩︎
Deep learning. ↩︎
Graphics Process Unit : processeur graphique. ↩︎
Natural Language Processing (NLP) en anglais. ↩︎
Computer vision en anglais. ↩︎
Marius Miron (2016) a élaboré une méthode de séparation de sources d’un orchestre symphonique par apprentissage supervisé et informée de la partition. Pour s’affranchir de la contrainte de réverbération des enregistrements existants et donc pour concevoir sa propre base de données pour l’apprentissage du réseau (mixages stéréo et sons isolés), il a réenregistré individuellement chaque section de l’orchestre et en a reconstitué artificiellement un mixage stéréo. Cette innovation a été intégrée par l’application The Orchestra, qui permet désormais d’entendre isolément chaque section de l’orchestre. ↩︎
Ces experts sont des personnes connaissant bien le répertoire blues/R&B/soul des années 1950-60 pour l’avoir abondamment écouté, sans forcément en connaître parfaitement toutes les références. Ils en connaissent surtout l’esprit de la musique. Ils ne peuvent pas être ingénieurs du son mais musiciens. ↩︎
Spat Revolution Remote : https://www.flux.audio/project/spat-revolution-remote/ ↩︎
Open Sound Control. Langage de transmission unidirectionnelle de données en temps réel entre plusieurs logiciels, possiblement actifs sur plusieurs appareils numériques (ordinateur, smartphone, synthétiseur…). ↩︎
Open Stage Control : http://openstagecontrol.ammd.net/ ↩︎
Afin de bien distinguer les profils et leurs comportements, les experts 1950-60 ne peuvent pas être ingénieurs du son. Cependant, afin de recruter plus facilement, ils peuvent être musiciens. ↩︎
Voir retours généraux des participants de l’expérience en annexe B6. ↩︎
Faites à partir des réponses aux questions QB2 à QB5 (II.A.3.2.b.) et QD1 à QD4 (II.A.3.2.d.). ↩︎
Provenant du fichier texte généré par l’interface présentée en II.A.2.2. ↩︎
Un aperçu seulement, car nous n’entendons pas recouvrir la totalité des répertoires musicaux ciblés avec ces trois seuls enregistrements. ↩︎
Voir définition donnée par les participants en section II.B.2.1. ↩︎
Prépondérant dans un remixage en son immersif ↩︎
Qualité rythmique qui incite à bouger, à danser. ↩︎
Surnommée “The Queen of Memphis Soul”. ↩︎
Au-delà du masquage des sources engendré par la mono, ces défauts de balance peuvent s’expliquer par le fait que l’ingénieur du son Tom Dowd a dû mixer en direct les 8 entrées micro sur 2 mixettes 4 voies Ampex 3761, à cause d’un simple magnétophone stéréo en sortie, le Scully 280. ↩︎
La limitation à 8 entrées micro a obligé l’ingénieur du son Tom Dowd à ne placer qu’un seul micro par instrument, ce qui a pu créer des inégalités de qualité de captation entre divers instruments. ↩︎
Nous pourrons ainsi nous rapprocher du son Stax de la batterie, dont notre référence sera Tramp (1967), interprétée par la même Carla Thomas en duo avec Otis Redding, au tempo proche. ↩︎
Grâce à son magnétophone stéréo Scully 280, Stax a aussi publié un master stéréo de B-A-B-Y mais qui n’a en fait pas été à l’origine du succès de la chanson, révélée comme tous les autres hits par la radio. ↩︎
Classée n°3 des meilleures ventes de disques R&B et n°14 des meilleures ventes de disques pop US. ↩︎
Envie spatiale formulée par deux ingénieurs du son de l’expérience n°1 (figure 38c). ↩︎
Caractéristique musicale mentionnée par un ingénieur du son de l’expérience n°1. ↩︎
Jim Stewart, fondateur de Stax Records : « Il n’était question que de coopération et d’implication totale. Il n’y avait aucune limite imposée à l’apport de chacun. Il n’y avait pas parmi nous de producteur au sens qu’a pris aujourd’hui ce terme. Les crédits disaient juste : « Produit par l’équipe Stax. » » ↩︎
Bien que nous informions le participant qu’il écoutera d’abord le master original, puis le master remixé, nous ne lui disons ni comment ni par qui ce dernier a été généré, afin qu’il conserve sa neutralité et continue de guider sa critique des masters par la musique. ↩︎
En vérité, à l’aide de SPAT Revolution, nous transposons actuellement en binaural le remixage immersif de B-A-B-Y que nous avons réalisé sous le dôme de haut-parleurs du plateau 1. ↩︎
Nous vérifierons cette hypothèse des « producteurs » dans le test « consommateurs » en section III.C.4. ↩︎
Ceci explique le déséquilibre démographique entre les différentes classes d’âge (figure 43b), qui est la contrepartie d’inviter beaucoup de participants à notre expérience, en particulier des musiciens. ↩︎
Faute de pouvoir obtenir davantage d’experts 1950-60, après de multiples tentatives de recrutement auprès de divers musiciens, disquaires et dans les groupes spécialisés des réseaux sociaux. ↩︎
Moins essentielle que pour l’expérience n°1 qui comparait les comportements des différents profils. ↩︎
Il est important que le participant puisse conserver sa concentration pour mémoriser tous les aspects positifs et négatifs qui lui sont apparus dans la première écoute et les confronter dans la seconde. ↩︎
Durant tout le test, nous nous plaçons en retrait dans la salle pour altérer le moins possible la relation entre la musique et l’auditeur (figure 41). ↩︎
Nous avons créé un questionnaire pour chaque ordre d’écoute : A (original) / B (remixage) pour la moitié des participants, A (remixage) / B (original) pour l’autre moitié. ↩︎
« Toute considération matérielle exclue » comporte le même sens que dans le test pour « producteurs ». ↩︎
Si suffisamment de participants connaissent le son Stax. ↩︎
Responsables de l’âme et du groove de la chanson, d’après les remarques orales des « consommateurs ». ↩︎
Corrigeant ainsi l’aspect « mal intégrée dans le groupe » soulevé dans l’expérience n°1 (figure 38a). ↩︎
Guitare et batterie manquaient de présence dans la version originale d’après l’expérience n°1. ↩︎
Permise aussi par RipX, qui indirectement a retiré le souffle de l’enregistrement (section III.A.1.1.). ↩︎
Une version stéréo a bien été exportée et publiée par le label Stax en 1966, mais très différente de notre présente version immersive (espace très latéralisé, aucune source au centre de l’image sonore, etc.). ↩︎
5 de ces participants ont préféré écouter notre version remixée, 4 la version originale et un a autant aimé l’une que l’autre. ↩︎
Voir l’intégralité des commentaires de fin d’expérience en annexe C6. ↩︎
Nous avons décidé de réduire cette question aux seules années 1950, car l’aspect mono de l’enregistrement, essentiel à notre propos, est de moins en moins fréquent dans les années 1960 (premières commercialisations stéréo en 1958). ↩︎

juin 4, 2026

Optimisation de la diffusion des basses fréquences face au problème de voisinage
Par : Julie Grisel

Formation Supérieure aux Métiers du Son

Directeur de mémoire : David Rousseau Septembre 2017

Résumé

La technologie des enceintes de sonorisation permet aujourd’hui de délivrer de grandes puissances dans les très basses fréquences. En parallèle, la quantité de basses dans les styles musicaux n’a fait que croître au cours de l’histoire. Du fait de l’augmentation progressive du niveau sonore en basse fréquence, les nuisances sonores sur le voisinage se sont aussi multipliées.

Par ailleurs, les salles de concerts sont souvent situées dans des bâtiments anciens et l’amélioration de l’isolation acoustique engendre dans la plupart des cas, une reconstruction quasi-totale de la structure (réalisation d’une « boîte dans la boîte »). Cette solution très onéreuse est rarement envisageable et souvent impossible structurellement. Nous nous tournons donc vers l’optimisation des systèmes de diffusion et nous nous focalisons sur la question suivante :
« Comment rendre directive la diffusion des basses fréquences pour limiter l’impact sur le voisinage et concentrer l’énergie sur le public ? ».

Aujourd’hui, l’usage de systèmes directifs, parce qu’il est récent, est difficile à appréhender et le paramétrage est souvent simplifié et donc réducteur. La méthodologie de recherche consiste donc à démystifier l’effet « preset magique » afin de mieux comprendre les bases physiques qui régissent le phénomène physique de directivité.

Afin d’enlever toute zone d’ombre dans la conception du système, et d’éliminer les spécificités des caissons de basse (« subwoofer »¹) industriels, nous avons décidé de construire nos propres subwoofers, au comportement le plus simple possible.
Nous avons également programmé un logiciel de simulation afin d’avoir une souplesse d’analyse et de pouvoir automatiser des processus de comparaison non disponibles sur les logiciels commerciaux. Ceci nous a permis de pouvoir simuler puis mesurer avec une grande flexibilité les différentes configurations que nous voulions tester.

Afin de pouvoir qualifier les résultats, la première étape a été de mettre au point un système et une méthodologie de mesure juste et reproductible dans les basses fréquences. Après avoir optimisé les subwoofers et validé les simulations en champ libre, nous nous sommes confrontés à l’influence de la salle, nettement plus complexe. Dans un deuxième temps, nous avons mis en pratique ce savoir lors de situations de concerts, utilisant des systèmes de sonorisation de grande ampleur.

Les résultats les plus efficaces observés lors de notre étude montrent que dans tous les cas la rigueur et la méthodologie de mesure dans les basses fréquences sont indispensables. L’optimisation du système consiste à créer une réjection dirigée sur les zones à protéger. Plus le nombre d’enceintes disponibles est grand plus il est facile de le rendre directif. Les systèmes directifs en minimisant l’énergie sur les murs, engendrent moins de modes de résonance et améliorent la qualité du son sur le public et sur le voisinage. En particulier, les assemblages dont le retard correspond à la distance entre les sources permettent d’optimiser les deux critères en même temps.

Le nouveau décret apporte une nette progression notamment dans la prise en compte de la protection auditive des enfants. Il réaffirme également la nécessité de protéger en tous points, ce qui au regard des pratiques actuelles était effectivement nécessaire. Cependant, si l’objectif de protéger dans les basses fréquences est primordial, son application va nécessiter une refonte totale des techniques de diffusion et des pratiques musicales. Par la complexité de mise en œuvre, il peut être craint que l’effort financier soit trop important pour les petits lieux, et que l’accroche techniquement nécessaire des subwoofers en hauteur augmente nettement les problèmes de voisinage. En l’absence d’une règlementation prenant en compte les basses fréquences (63Hz), la protection du public qui nécessite l’accroche des subwoofers en hauteur risque de se faire au détriment du voisinage.
Mots clefs : basses fréquences ; difficultés de mesure ; directivité ; voisinage ; qualité sonore ; cardioïde ; règlementation ; logiciels de simulation

Avant Propos

Genèse du sujet de mémoire et problématique

C’est au cours de mes expériences en sonorisation que j’ai réalisé la difficulté de maîtriser les niveaux sonores dans les basses fréquences, tout d’abord en termes de couverture sur le public, mais aussi vis-à-vis de la règlementation et du voisinage. Les exigences d’homogénéité et de couverture, et influences des salles sur la propagation des basses fréquences constituent des phénomènes physiques et technologiques extrêmement complexes. Ils sont d’autant plus complexes qu’ils sont multi variables et intrinsèquement imbriqués. Peu d’outils et d’ouvrages aujourd’hui permettent d’avoir une vue d’ensemble des problématiques de mesure nécessaires à la caractérisation et à l’optimisation d’un système dans les basses fréquences. J’ai donc souhaité décomposer les différents paramètres permettant d’optimiser le système en éléments simples, comprendre leur fonctionnement, puis les synthétiser dans le sens de la meilleure optimisation possible entre qualité du son sur le public et protection des riverains.

Introduction

Contexte et problématique

Au tout début des concerts amplifiés, la technologie des enceintes et des amplificateurs ne permettait pas d’atteindre des niveaux élevés dans les très basses fréquences. Ces dernières années, les progrès technologiques et l’évolution de la musique actuelle (techno, rock…) ont fait apparaître un niveau sonore croissant dans les graves. Or, beaucoup de salles de spectacle exploitent des bâtiments historiques. Leur structure n’a jamais été pensée pour isoler les niveaux en très basse fréquence et il est souvent quasiment impossible de faire évoluer les bâtiments. Ces trente-cinq dernières années, le niveau sonore en basse fréquence ayant progressivement augmenté, la gêne sur le voisinage a augmenté proportionnellement. Les décrets se succèdent dans le but d’assurer aussi bien la protection auditive du public que la santé des riverains, en 1998 et tout dernièrement en août 2017. Malheureusement, les limitations associées aux basses fréquences ne permettent pas de faire un concert et les décrets présentent des manques notamment dans l’absence de prise en compte des très basses fréquences pour le voisinage. Il y a urgence ! En effet, l’ancien et le nouveau décret engendrent d’importantes difficultés d’application et les salles de concert se retrouvent en difficulté dans la capacité d’appliquer le texte. Faire perdurer l’activité culturelle et le bien-vivre ensemble nécessite de mettre en œuvre des solutions conciliant attente des spectateurs, protection auditive et respect des riverains….

Améliorer l’isolation étant une opération extrêmement coûteuse et souvent structurellement impossible, nous avons décidé de concentrer notre étude sur des solutions touchant à l’optimisation des systèmes de sonorisation eux-mêmes. L’idée est de mettre en avant des solutions permettant de concentrer l’énergie sur le public et de limiter les émissions vers le voisinage. En effet, rendre directifs les systèmes de sonorisation permet généralement de diminuer le niveau sonore dans le voisinage d’une proportion équivalente à multiplier par quatre l’épaisseur des murs. Cette optimisation est donc fondamentale car peu coûteuse en relatif au coût des travaux. Aujourd’hui, cette solution est rarement utilisée, car acousticiens et sonorisateurs ont tendance à travailler chacun de leur côté alors que la solution que nous mettons en évidence nécessite un travail commun de ces deux professions.

Plan

Nous commencerons par décrire dans la revue de littérature les problématiques de mesure des basses fréquences et quelles solutions permettent d’obtenir des mesures représentatives. La maîtrise de la directivité étant au cœur des solutions permettant de respecter l’absence de trouble vis-à-vis du voisinage, nous décrirons quelques configurations fondamentales permettant d’atteindre ces objectifs. Nous rappelons à la fin de cette partie le contenu du contexte réglementaire en vigueur.
Dans un deuxième temps, nous poursuivrons en donnant une description théorique des solutions permettant de créer de la directivité dans les basses via la programmation d’un logiciel de simulation. Nous validerons par la mesure en laboratoire (hangar) le modèle théorique en se confrontant à l’influence de la salle et aux difficultés de mise en œuvre associées.
Vous trouverez à la fin du mémoire un exemple pratique permettant de mettre en avant les résultats concrets qu’il est possible d’obtenir grâce à ces techniques.

Cadre
- Fréquentiel :
  Ce mémoire de recherche se focalise sur les basses fréquences générées dans les installations de sonorisation par les enceintes de renfort de grave, les « subwoofers » (appelés subs par la suite). La plupart des constructeurs donnent comme limite inférieure en basse fréquence des subs entre 25 Hz et 30 Hz, et 100 Hz pour la limite supérieure. Nous nous focaliserons donc sur l’intervalle de 25 à 100 Hz.
- Solutions d’optimisation
  Le mémoire ne traite pas des solutions relatives aux isolations acoustiques des bâtiments. C’est une opération très coûteuse et rarement possible pour les salles. Nous nous sommes donc concentrés sur l’optimisation des systèmes de diffusion dans les basses fréquences. Concentrer l’énergie sur la zone utile constituée par le public se réalise en créant une directivité. Le but n’était pas de tester l’ensemble des installations possibles mais de se focaliser sur quelques configurations fondamentales. Et enfin de se rendre compte des difficultés de mesure et donc d’optimisation.
- Types de lieux
  Notre étude concerne les évènements dans des salles moyennes à grandes (à partir de 300 places) ainsi que les concerts en plein air.
  L’objectif du mémoire n’était pas de détailler la méthodologie propre à la réalisation d’une étude d’impact acoustique. Nous nous sommes focalisés sur la maîtrise des concerts de grande ampleur de type festivals, qui n’ont pas les mêmes impératifs que ce qu’exigerait la réalisation d’une étude d’impact pour un bar ou une boîte de nuit. Les techniques qui sont décrites sont plus complexes et plus coûteuses mais permettent une meilleure gestion des niveaux sonores dans les infrabasses.
- Protection du public
  Il est important de noter que le décret traite aussi bien de la protection auditive du public que de celle du voisinage. En effet, l’augmentation de niveau très significative de ces dernières années rend la protection auditive du public primordiale. Cependant, l’optimisation des systèmes de diffusion vis-à-vis de la protection du voisinage est un sujet déjà très complexe. Nous nous sommes ainsi focalisés sur la partie protection du voisinage.
Abréviations utilisées dans ce mémoire

c : vitesse de propagation du son (344 m/s)
λ : longueur d’onde de la fréquence considérée
Sub : subwoofer (enceinte de renfort de grave)
Cardio : configuration cardioïde
Cardio natif : configuration cardioïde dont la distance entre les sources vaut λ/4
HP : haut-parleur
Omni : Omnidirectionnel

Revue de littérature

A. Les basses fréquences dans le contexte actuel.

Trois évolutions simultanées ont contribué à l’augmentation du niveau des basses fréquences dans les concerts amplifiés.

1. Contexte musical : évolution du niveau des basses fréquences au cours des 20 dernières années

Dans son mémoire de recherche en 2010, Pierrick Saillant [23] effectue un comparatif des balances spectrales sur une trentaine d’enregistrements répartis entre 1980 et 2010. Ses analyses permettent d’obtenir des informations sur l’évolution des habitudes d’écoute. « On observe que les productions actuelles contiennent plus de graves que les productions effectuées il y a une vingtaine d’années. Cette différence est reproduite dans le domaine de la sonorisation. Les systèmes de diffusion doivent être capables de produire plus de basses fréquences». La musique électronique en particulier, est en explosion depuis les années 1995 et est caractérisée par une forte accentuation de la rythmique et des lignes de basses.

2. Contexte technologique : un matériel de sonorisation de plus en plus puissant

D’un point de vue technologique les systèmes ont aussi beaucoup évolué. Dans le tableau ci-dessous, nous avons comparé à l’aide des documentations techniques [28] des fabricants, des haut-parleurs historiques et récents. Dans l’infrabasse, la pression générée est proportionnelle au volume d’air déplacé. On calcule donc le volume d’air déplacé par la formule :

𝑣𝑜𝑙𝑢𝑚𝑒 = 𝑇𝑎𝑖𝑙𝑙𝑒 𝐻𝑃 * 𝐷é𝑝𝑙𝑎𝑐𝑒𝑚𝑒𝑛𝑡 𝑐ô𝑛𝑒

Ce tableau met en évidence qu’un HP actuel est capable de déplacer environ 10 fois plus de volume d’air que l’historique 416-8A.

Nous donnons également ci-dessous quelques ordres de grandeur de subs récents.

Les subwoofers récents peuvent comporter plusieurs HPs. Ils ont plus de capacité de débattement et supportent beaucoup plus de puissance. Le T21 atteint un niveau sonore de
146.5 dB SPL à 1 m !…

3. Contexte sociologique : recherche de sensations lors des concerts « live »

« To be played at maximum volume »². La puissance sonore parce qu’elle favorise l’immersion et qu’elle provoque un déconditionnement participe à l’expérience d’écoute de la musique (Guibert, 2007, [11]).

« Aujourd’hui, ce qui motive les jeunes à assister à des concerts, c’est la recherche de sensations physiques générées par les basses et les infrabasses. Car ce qu’on appelle « le gros son », c’est-à-dire le son très charpenté avec énormément de basses, permet de ressentir de fortes compressions, surtout au niveau de la cage thoracique et de l’abdomen, sensations qu’ils n’ont pas et qu’ils n’auront jamais avec leurs écouteurs, leur casque ou leur chaîne HIFI. […] » (David Rousseau, 2006, [21]).

« La puissance sonore favorise l’immersion dans la musique. Lorsqu’on arrive sur le lieu d’où émane le son amplifié, on est brusquement coupé de l’environnement perceptif antérieur. Le bruit accapare l’appareil sensoriel en mobilisant l’ouïe, mais aussi le toucher (on ressent le son par le corps) et provoque un déconditionnement. Cette présence physique du son reconditionne l’auditeur à une expérience onirique. Le volume sonore élevé rend difficile la parole et transforme les rapports sociaux. Il donne à la matière sonore une épaisseur qui le rapproche des arts plastiques tridimensionnels. » (Gérôme Guibert, 2007, [11])

La recherche des forts volumes sonores n’est pas nouvelle. C’est un phénomène sociologique qui ne peut être ignoré et qui participe à l’expérience d’écoute de la musique dans notre société. Cependant, si les techniques d’amplification apparaissent déjà dans les années 30, les niveaux que l’on peut atteindre aujourd’hui en basse fréquence sont extrêmement élevés. Il est donc d’autant plus nécessaire pour la santé du public que celle du voisinage d’apprendre à bien maîtriser les basses fréquences pour permettre le bien-vivre ensemble et la protection auditive.

4. Pourquoi les basses fréquences posent elles problème chez les riverains?

Isolement des bâtiments vis-à-vis des basses fréquences émergeant des concerts de musique amplifiée.

L’impact des nuisances dues aux musiques amplifiées peuvent être extrême : « [Lors d’]évènements musicaux comme des festivals ou rave parties, sorties en discothèques […] les basses fréquences sont tellement fortes qu’elles font vibrer les vitres aux alentours. » (CIDB, 2014, [3]).

« Il faut savoir que, dans les basses, on a d’une part, le coup de pied, c’est-à-dire le toum toum de la grosse caisse qui se situe entre 50 et 63 Hz et d’autre part, la nappe de graves en continu qui se situe entre 30 et 40 Hz, ce qui, d’ailleurs, n’est pas perçu par le système auditif. L’autre problème, c’est qu’il y a vingt ans, on envoyait 20 décibels de moins qu’aujourd’hui. Quand on sait qu’un DJ diffuse systématiquement du 140 dB(C) – le dB(C) tient compte des basses fréquences –, cela laisse perplexe ! On atteint donc de très forts niveaux sonores!» (David Rousseau, 2006, [21]).

Or, un niveau d’émission aussi important et centré sur les fréquences comprises dans la bande d’octave 63 Hz ou 30 Hz est catastrophique en termes d’impact sur le voisinage. En effet, l’isolation pour ces bandes de fréquence est très difficile à obtenir.

« Les parois, qu’il s’agisse des murs, du plafond ou de plancher, vibrent davantage à certaines fréquences qu’à d’autres. Plus une paroi vibre, plus elle est perméable au passage des sons et plus la pièce s’agrandit. Si par hasard, la fréquence de résonance naturelle d’une paroi coïncide avec la résonance de la pièce, les propriétés isolantes deviennent très médiocres, voire quasi-inexistantes. On observe ce phénomène avec les cloisons de doublage acoustique en panneaux de plâtre mince. Par exemple, une cloison en BA13 disposant d’un plénum de 10 cm rempli de laine de verre, résonne à 63 Hz. Adossée à un mur en parpaing creux de 20 cm, le doublage censé améliorer l’isolement, le dégrade de 7 décibels, passant de 39 dB (courbe verte) à 32 dB seulement (courbe rouge). Si la pièce possède une dimension physique de 2,58m (plafond) ou 5,16m, la dimension acoustique sera 2,68m (f1=63Hz) ou 5,36m (f2 63Hz). En supposant que la résonance amplifie le niveau de pression de 6dB à cette fréquence, l’isolation ne sera plus que 26 décibels (courbe bleue)». (Lafont, [15]).

Figure 1 : La courbe verte représente l’affaiblissement du mur en parpaing creux. La courbe rouge représente l’affaiblissement de l’ensemble mur + doublage. Les performances se dégradent en dessous de 85Hz. La courbe bleue tient compte de la résonance de la pièce. (Lafont)

Ces matériaux étant couramment utilisés dans les habitations standards, et les niveaux dans la bande 63 Hz étant de plus en plus marqués dans les musiques actuelles, les conséquences en termes d’isolement sont donc terribles.

Effets sur la santé

L’exposition au bruit dans l’environnement urbain est difficile à évaluer à cause de l’exposition à des nuisances multiples. Les impacts sur la santé sont à considérer car les effets peuvent nuire à l’état de bien-être mental, physique et social de la population. « On constate […], en restant au plus près des réponses des enquêtés, d’une part que les sonorités graves semblent perçues autant, si ce n’est plus, par le corps que par les oreilles ; d’autre part qu’elles sont assimilées à des bruits pénibles, qui relèvent de la nuisance sonore. Il est frappant que les enquêtés aient presque tous répondu dans ce sens, alors que ce n’était pas la question qui leur était posée. » « Les bruits graves remplissent donc l’espace, mais avant tout, ils remplissent, ils envahissent les oreilles (assourdissant), la tête (entêtant, lancinant), le corps tout entier (perçus par tout le corps) » (Guastavino C. & Cheminée, P, 2003, [10]).

Les basses fréquences dans l’environnement sonore peuvent ainsi entrainer des perturbations du sommeil, des dépressions, et bon nombre d’autres effets secondaires.

« S’il est difficile d’établir un lien direct de cause à effet entre l’état de santé des personnes s’adressant au CIDB et les nuisances sonores – de nombreux facteurs tels que la solitude ou un handicap physique peuvent interagir –, il est en revanche indéniable que les personnes confrontées à des problèmes de bruit sont en souffrance, physique ou mentale, pour la plupart depuis longtemps. Ce constat, les psychologues du CIDB le font de manière quotidienne à travers leur mission d’écoute et de conseil. Certains plaignants, à bout de souffle, en larmes ou au bord de la crise de nerfs, sont d’autant plus désemparés qu’ils ont entrepris pour la plupart de nombreuses démarches mais en vain.» (CIDB, [3])

Les contextes musicaux, sociaux et technologiques ont fait apparaître un niveau sonore croissant dans les graves. Les choix de conception des systèmes de diffusion sont très étendus, complexes et leurs conséquences, aux vues des puissances mises en jeu, doivent être maîtrisées. Pour maîtriser un système il faut pouvoir le caractériser et donc le mesurer.

B. Problématiques de mesure des basses fréquences

1. Contraintes dues à la salle

1.1 Modes de résonance dans une salle

Lorsque du son est diffusé dans une pièce, les ondes sonores vont rencontrer des obstacles : murs, scène, objets de toute taille. Une partie de l’onde sonore va être absorbée tandis que l’autre partie va être réfléchie ou diffusée. En fonction de la taille de la longueur d’onde (λ) par rapport à la taille de l’obstacle, les réflexions vont être différentes :

Figure 2 : (A) un obstacle très petit devant la longueur d’onde (B) un obstacle plus grand que la longueur d’onde (Everest F. Alton, [5])

Dans la figure (A), l’obstacle est si petit par rapport à λ qu’il n’influence pas la propagation du son. Le son ne le voit pas et le contourne. En revanche, dans la figure (B), les dimensions de l’obstacle font plusieurs longueurs d’onde. Cela a pour effet de créer une zone d’ombre derrière l’obstacle qui tend à être irradiée par le front d’onde des sources qui rencontrent l’obstacle. Cela met en évidence que l’impact d’un objet, d’une forme, sera très différent en fonction de la fréquence observée. Pour les basses fréquences, on peut approximer qu’un objet de moins de 1 m n’a pas d’impact significatif sur la propagation du son.

Les longueurs d’onde des basses fréquences (25 Hz – 100 Hz) soumises à notre étude s’étalent de 13m80 à 3m40, et sont donc souvent proportionnelles aux dimensions des salles (longueur, hauteur de plafond, diagonales…). Les ondes vont être réfléchies par les parois, se propager dans plusieurs directions et interférer avec leurs propres réflexions circulant dans le sens inverse.
« Lorsque deux trains d’ondes se propageant en sens contraire se rencontrent, il se forme des ondes stationnaires. Les ondes stationnaires sont formées par des zones où l’air est soumis à des mouvements de compression et de décompression qui ne se déplacent pas. Ces zones sont situées à une distance l’une de l’autre égale à la moitié de la longueur d’onde des signaux qui la produisent. Ce sont des ventres, mouvements de compression maximale, et des nœuds acoustiques où ils sont nuls» (Besson R. & Alary J., 2007, [2])

Figure 3 : Cas en 2D d’ondes stationnaires entre deux parois rigides et réfléchissantes (Jouhaneau J., 1992, [13])

Ainsi, pour une longueur d’onde donnée, en partant du point de réflexion, on rencontre un ventre à λ/4 et à 3λ/4 et un nœud à λ/2. Dans cette figure on note également que les modes font intervenir les fréquences propres et leurs harmoniques physiques.

Figure 4 : Vue dans l’espace. Modes axiaux 1D (a), Modes tangentiels 2D (b) et modes obliques 3D (c) (Jouhaneau J., 1992, [13])

Les différentes fréquences auxquelles le phénomène apparaît s’appellent les modes propres de la pièce ou fréquences de résonance. Les modes propres dépendent directement de la géométrie de la salle. Il apparait alors de très fortes différences de niveaux sonores entre les ventres (max) et les nœuds (annulations).

Nous avons simulé à l’aide du logiciel CARACAD, l’effet d’un haut-parleur situé dans l’angle d’une pièce de petites dimensions. Voici ci-dessous une sélection de modes propres apparaissant lors de la simulation.

Figure 5 Modélisation par le logiciel CAD des modes propres pour une petite salle

Pour rappel,
- entre deux murs espacés d’une distance L, les fréquences propres seront : 𝑓𝑛 = 𝑛 * 𝑐/2𝐿
- Pour une salle parallélépipédique de dimensions Lx, Ly et Lz, on a :
l, m et n sont 3 entiers relatifs associées respectivement aux dimensions x, y et z ([20]).

1.2 Sources Image

Lorsque l’on positionne un haut-parleur dans une salle, son rayonnement est en partie réfléchi par les murs selon les mêmes lois que l’optique géométrique (lois de Descartes).

Les distances de parcours entre le son direct et le son réfléchi contre le mur (D1, et D2) ne sont pas les mêmes. Ainsi, le rayon réfléchi arrive avec un décalage de temps au microphone. Il va donc apparaître un phénomène d’interférence dit de « filtre en peigne » qui va varier en fonction de la fréquence, du retard de propagation et du niveau de la réflexion par rapport au son direct.

Dans le cas du schéma ci-dessus, on obtient : D1 = 10.05 m et D2 = 11.18 m. le décalage entre les deux impulsions émises par chaque sub vaut 3,28 ms. On affiche le résultat dans le logiciel Spectralab et on observe le filtrage en peigne correspondant :

Figure 6 : Filtrage en peigne de deux impulsions décalées de 3.28 ms et convoluées avec du bruit rose-jaune (1 impulsion), rouge (2 impulsions décalées de 3.28 ms)

Un tel phénomène physique est donc catastrophique en termes de mesure. On peut remarquer la présence de nombreuses annulations en amplitude alors que le micro est soumis aux réflexions de la paroi.

Dans cet exemple, nous avons relevé un premier ventre à 315 Hz et un premier nœud à 152 Hz. En effet, on obtient la fréquence du premier nœud lorsque les deux impulsions sont espacées de λ/2 (ici 1/(3,28 * 2 * 10−3) soit 152 Hz environ).

L’écart maximal mesurable entre les valeurs de sommation et d’annulation les plus fortes peut atteindre 30 dB, d’où la nécessité de mesurer en plusieurs points. D’un point de vue de la mesure, il est toujours préférable de mettre le microphone au sol pour éviter ces effets de filtre en peigne et obtenir des résultats plus caractéristiques. En moyenne, si le microphone est à 1,30 m du sol, le filtrage en peigne intervient dans le haut grave.
D’un point de vue homogénéité du son dans la salle, si l’on met l’enceinte contre la paroi, la source image est très proche, et donc la directivité n’est pas modifiée dans les basses. En revanche, dès que l’on éloigne un peu l’enceinte, l’effet de filtrage en peigne devient non négligeable. En pratique, trois cas se présentent :
- Si le subwoofer est le plus possible collé au sol ou au mur :
  Ceci permet de bénéficier d’un minimum de distance entre la source image et la source réelle. La directivité est hémisphérique et l’on gagne +6 dB de rendement sous réserve que la hauteur naturelle du sub soit petite vis-à-vis de la longueur d’onde (pour 100 Hz par exemple, la hauteur du sub ne doit pas dépasser 1m13 pour éviter des filtrages en peigne. En effet, 120° à 100 Hz correspond à 1m13 cf. le cercle des phases au paragraphe suivant). On obtient donc un gain de 6 dB sans engendrer de modification majeure de la directivité. Cependant, se rapprocher des murs sur un sujet où l’on tient compte du voisinage n’est pas une bonne idée … !
- On place le subwoofer à une distance de 1m70 du sol afin de créer une directivité verticale. En effet, le dipôle formé par le subwoofer et la source image annule l’énergie vers le plafond (cf. figure 7)
Figure 7 : Exemple d’une implantation cardioïde où la hauteur des subwoofers a été choisie pour que la source image générée par sol annule l’énergie vers la toiture.

À partir du moment où la distance entre le point d’écoute et la paroi est importante (par exemple la source image crée par le mur de derrière), l’impact dans les basses fréquences est fondamental. Si l’on reprend l’exemple ci-dessous mais « retourné », le mur générant la source image devient le mur derrière le sub et il se produit alors une annulation à 50 Hz au point d’écoute…
- Si le sub est très loin du sol : les effets ne sont pas déterminés facilement mais il apparait de forts phénomènes constructifs et destructifs (filtres en peignes). Nous rappelons donc encore une fois la nécessité de mesurer en plusieurs points.
Pour comprendre ce phénomène, il faut étudier les influences de trois grands paramètres :

La Phase

La longueur d’onde d’une sinusoïde peut être reliée au cercle trigonométrique.

Figure 8 : Phase et longueur d’onde (Pietquin D. 2008, [18])

Si l’on additionne deux ondes de même fréquence et de même niveau en augmentant la phase entre ces deux signaux, comment les ondes s’additionnent-elles ?

Figure 9 : Cercle des phases et valeurs d’annulation pour deux signaux de même niveau (Van Veen M., 2008, [24])

Figure 9, on observe que tous les décalages de phase compris entre 0° et 120° permettent de gagner entre 0 et 6 dB. En revanche, dès que l’on dépasse 120°, on perd de 0 à -∞ dB (hors phase).

Le Niveau relatif des signaux directs et réfléchis

Figure 10 : niveaux de sommation en fonction du niveau relatif et de la phase entre les deux signaux (Mc Carthy B., 2016, [24]) (NB : « ripple » signifie maximum de variation entre l’addition et la soustraction)

Il faut distinguer 3 comportements en fonction de la différence de niveau (offset) entre le son direct et le son réfléchi :
- 0 dB < offset < 4 dB : Zone de filtrage en peigne (« Combing zone ») : les phénomènes d’annulation et de sommation sont très importants. Ils peuvent varier de +6 dB à – 60 dB. Ces valeurs sont déterminées par le déphasage entre les deux signaux (cf. cercle des phases de la figure 9)
- 5 dB < offset < 10 dB : Zone de Transition les phénomènes de filtrage vont varier entre +4 dB et – 8 dB.
- 11 dB < offset : Zone d’isolation : le niveau de l’onde réfléchie étant plus de
  10 dB moins fort, les effets du filtrage sont minimes. Les signaux sont décorrélés.
Le Temps

Jusqu’à présent nous n’avons pas spécifié de valeur de retard. Un décalage de temps donné crée un décalage de phase différent à chaque fréquence.

Plus le décalage en temps augmente plus la première fréquence atteinte par le filtrage en peigne est basse. Par exemple, pour 1 ms de décalage, on aura un premier maximum d’annulation à 500 Hz (180°). C’est 360° à 1 000 Hz (premier maximum) mais aussi 720° à 2 kHz. Tous les maximums se retrouveront pour tous les multiples de 1 kHz, et les minimums à tous les multiples de 500 Hz…

Par conséquent, il faut faire très attention aux positionnements des enceintes près des murs. Celles-ci génèrent un filtrage en peigne dans les zones de diffusion à proximité et le placement du microphone de mesure peut s’avérer très difficile à optimiser.

Figure 11 : zones de sommation en fonction des fréquences et du décalage temporel (McCarthy B., 2016,[6]])

1.3 Impact du positionnement des sources sur l’excitation des modes propres

L’impact du positionnement de la source est crucial. En effet, son positionnement détermine quels sont les modes propres qui vont être excités.

Courbe de réponse et positionnement dans la salle

Figure 12 : Courbe de réponse d’un HP dans 3 situations différentes : Chambre anéchoïque (1), Angle d’une cabine en bois (2), Centre de la cabine en bois (3) (Rossi M., 2007, [20])

On observe sur la figure 12, de grandes irrégularités des courbes de réponse 2 et 3 par rapport à la 1, manifestant des pics et des creux selon les excitations des modes. On remarque aussi une différence d’amplitude assez marquée entre les réponses dans la cabine et la réponse en salle anéchoïque.

2. Comment mesurer les basses fréquences ?

2.1 Signaux de mesure

Les quatre principaux signaux utilisés pour caractériser un système sont : le bruit rose, la musique, le balayage en fréquence (« sweep »), et les séquences MLS.

Bruit Rose

C’est un signal aléatoire dont l’intensité de chaque portion de bande d’octave est constante. Cela permet de se rapprocher de la perception de l’oreille qui est logarithmique. Le bruit rose donne un spectre plat quand il est analysé par un analyseur de spectre standard (sonomètre par exemple).

Avantages :
- Ce signal est très simple d’utilisation. En effet, lorsqu’il est nécessaire de faire des moyennes aussi bien spatiales que temporelles, le bruit rose est relativement constant sur tous les facteurs possibles.
Inconvénients :
- Il nécessite une très forte dynamique d’émission pour avoir un rapport signal sur bruit suffisant. pour que le bruit de fond ne perturbe pas la mesure, il faut que le bruit généré par les enceintes soit largement supérieur.
- Mélange le signal et les distorsions
- Ne fournit pas d’information temporelle
- Nécessite des mesures longues
Musique

Avantages :
- La musique actuelle étant naturellement beaucoup plus compressée que le bruit rose, le facteur crête est beaucoup plus faible et permet donc de générer beaucoup plus d’énergie pour la même dynamique maximum (que le bruit rose).
- Elle permet de faire en plus une mesure dans les conditions réelles d’exploitation et de mettre en évidence des phénomènes vibratoires associés à la dynamique du signal.
Inconvénients :
- Ce signal doit être utilisé avec beaucoup de précaution, l’usage de plusieurs morceaux est indispensable pour maximiser la répartition en fréquence.
« Sweep »

C’est un signal qui balaye toutes les fréquences nécessaires pendant une durée prédéfinie. Si les signaux sinusoïdaux sont employés depuis longtemps en audio et en mesures acoustiques, ce n’est que depuis une vingtaine d’années que les progrès informatiques ont permis d’étendre leur usage : grande amélioration des mesures de réponses impulsionnelles, de distorsion et de systèmes à la fois non linéaires et non invariants dans le temps. Le « sweep » permet de gagner un rapport signal sur bruit inatteignable avec la méthode MLS, car il permet de s’affranchir de la distorsion harmonique due aux non-linéarités du haut-parleur. (Farina, A., 2007, [7])

Comme il est très difficile de générer beaucoup d’énergie en 1s, l’idée est de répartir le sweep sur plusieurs secondes, puis de reconvoluer le signal mesuré. (Il est impossible d’envoyer 10 000 W en 1s mais facile d’envoyer 1 W pendant 10 000 secondes…) En reconvoluant le signal mesuré, on ramène toute l’énergie mesurée fréquence par fréquence en un seul instant.

Figure 13 : Gain en SNR³ en fonction de temps de mesure du sweep en relatif à une mesure en bruit rose (Rousseau D.,[22])

Plus le temps de mesure est grand (Figure 13), meilleure est l’amélioration du rapport signal sur bruit. Dès 3 s de mesure, on gagne 20 dB par rapport à un bruit rose.

Avantages :
- Il permet de mesurer le niveau et la réponse impulsionnelle en même temps, de s’affranchir des bruits constants, et du bruit de fond. Un « sweep » de 47 s permet un gain de 33 dB de SNR par rapport à un bruit rose de même durée… Le « sweep » permet de mesurer avec virtuellement 2000 fois plus de puissance…
- Il permet de vérifier la reproductibilité et de connaître intrinsèquement le rapport signal/bruit de chacune des mesures
Inconvénients :
- Nécessite un dépouillement plus complexe
- La mesure en plusieurs points nécessite soit de faire plusieurs mesures discrètes et d’en faire la moyenne, soit d’utiliser un système multi micros.
Signal MLS

Maximum Length Sequence. C’est une séquence binaire pseudo aléatoire permettant d’extraire la réponse impulsionnelle. Dans la pratique, il s’agit d’un signal que l’on pourrait confondre avec un bruit rose s’il est préalablement refiltré, mais qui permet par un traitement informatique de retrouver une réponse impulsionnelle si le système est invariant.

Avantages :
- Il permet de gagner artificiellement du rapport signal bruit mais de façon moins importante que le « sweep ».
- Le son du signal MLS est un son relativement peu dérangeant pour l’audition là où le
  « sweep » présente des séquences caractéristiques de sons d’ovnis….
Inconvénients :
- Inutilisable à très grande distance car une variance du temps de propagation de groupe rend inopérante la reconstruction de l’impulsion.
- Usage plus compliqué car nécessite le bon choix des critères du traitement du signal (taille et type de la fenêtre).
2.2 Techniques d’analyse

i. Pondérations et perception des basses fréquences par l’oreille humaine

La mesure des basses fréquences doit prendre en compte le comportement de l’oreille humaine. En effet, l’oreille humaine n’est pas aussi sensible aux basses fréquences qu’aux sons médiums ou aigus émis à la même pression acoustique. Le schéma ci-dessous reproduit les courbes d’isosonie de Fletcher et Munson (1933) qui représentent la sensibilité moyenne de l’oreille pour la plage des fréquences audibles. Ces courbes indiquent, pour chacune des fréquences du spectre audible, le niveau de pression acoustique (SPL pour Sound Pressure Level) nécessaire à la perception d’une même intensité par un être humain. D’où le terme « courbe d’égale (iso)sensation sonore (sonique) ».

Figure 14 : Courbes isosoniques (Fletcher et Munson, 1933)

Cela signifie que les sons graves demandent plus de niveau sonore que les sons aigus pour être perçus à la même intensité. Ce phénomène est très marqué à faible niveau. Par exemple pour avoir la même sensation sonore de 30 dB SPL à 1000 Hz, il faut mettre +30 dB à 50 Hz. Même à fort niveau ce comportement reste vrai même s’il est fortement atténué : à 100 dB SPL il faut toujours 10 dB de plus à 50 Hz qu’à 1000 Hz.

Il est possible d’approcher ce comportement relatif au fonctionnement de l’ouïe humaine à l’aide de filtres de pondération pour un niveau donné. Il existe quatre filtres de pondération. Pour notre étude nous nous concentrerons sur les filtres A et C qui sont stipulés dans les règlementations pour la mesure de niveaux en salle et sur le voisinage.

Une pondération fréquentielle c’est « la différence entre le niveau du signal indiqué sur le dispositif d’affichage et le niveau correspondant d’un signal d’entrée sinusoïdal permanent d’amplitude constante, cette différence étant spécifiée dans [la] norme en fonction de la fréquence » (NF EN 61672-1, Electroacoustique et sonomètres, Juin 2003). Dans la réglementation, les pondérations A et C sont définies par la norme CEI 61672-1 sous la forme de tableaux de coefficients à appliquer aux mesures par octave ou tiers d’octaves.

Figure 15 : Pondérations A B C D définies par la norme CEI 61672-1

La formule définie dans la norme et permettant de calculer en décibels, les pondérations C et A est la suivante :

𝐶1000 et 𝐴1000sont des constantes de normalisation, en décibels, qui représentent les gains électriques nécessaires pour obtenir des pondérations A et C égales à 0 dB à 1 kHz. Pour la pondération C, deux pôles sont situés à la fréquence f1 pour les basses fréquences et deux pôles sont situés à la fréquence f4 pour les fréquences élevées. La pondération A est réalisée en ajoutant à la pondération C deux filtres passe-haut du premier ordre couplés, dont les pôles sont les fréquences f2 et f3.

Voici un extrait des coefficients fournis dans les tableaux de la norme et calculés grâce aux formules ci-dessus. Ils sont volontairement plus détaillés dans les basses fréquences :

La pondération A correspond à la sensibilité de l’oreille pour les sons purs à faible volume, et donne donc peu d’importance aux basses à l’inverse de la pondération C. Physiquement parlant, les pondérations A et C reproduisent approximativement sous forme inversée les courbes d’isosonies (Le Haut Conseil à la Santé (figure 16 ci-dessous) met en évidence que la courbe 40 phones se rapproche de la pondération A et que celle de 100 phones correspond environ à la pondération C).

Figure 16 : courbe du champ auditif et de pondération acoustique (HCSP, [26])

ii. FFT et analyse en bande fine

1. Résolution fréquentielle de FFT

La transformée de Fourier Rapide (Fast Fourier Transform) est le principal outil mathématique utilisé pour l’analyse de spectre fréquentiel dans beaucoup de logiciels. Son paramétrage doit être choisi très précisément pour la mesure en basse fréquence. La Transformée de Fourier permet de passer du signal audio temporel à l’analyse de sa composition dans domaine fréquentiel (amplitude et phase) et inversement.

Figure 17 : Source: getting started with Smaart 7.2

Figure 18 : Influence de la taille de la FFT sur la résolution fréquentielle (Van Veen M., 2017, [24])

La fenêtre d’analyse de la FFT sélectionne une partie du signal dont la taille détermine le nombre de points d’analyse. Plus la fenêtre d’analyse est grande plus la résolution fréquentielle entre deux points diminue.

« Le traitement commence par le remplissage d’une mémoire de taille donnée (généralement une puissance de 2. Par exemple, un bloc de N = 1024 = 2^10 échantillons temporels) qui sera la base temporelle d’analyse. Ces N échantillons temporels seront ensuite passés dans un algorithme de calcul FFT » (01dB, [27]).

La durée de remplissage des N échantillons dans la mémoire correspond à la durée minimale pendant laquelle il faut observer le signal pour pouvoir l’analyser (c’est-à-dire sa sélectivité temporelle). Si l’on échantillonne à la fréquence Fe et que l’on doit prendre Ne échantillons, il nous faudra attendre un temps T = Ne/Fe secondes (1024 points à 44.1 kHz = 23 ms).
La résolution fréquentielle obtenue est B = Fe/Ne Hz (1024 points à 44.1 kHz = 43 Hz). Cela signifie que l’on a un point d’analyse tous les 43 Hz, donc un seul point pour l’analyse de toutes les fréquences graves.

Pour les basses fréquences, il est donc important de prendre une taille de FFT largement plus grande que 1024. Il est typique d’utiliser une fenêtre de 65000 points pour une fréquence d’échantillonnage de 44.1KHz.

« Le produit BT = Fe/Ne * Ne/Fe =1. Si l’on veut mesurer un signal avec une résolution de 1 Hz, il nous faudra l’examiner pendant au moins 1 seconde, avec une résolution de 2 Hz pendant 0.5 s, 0.5 Hz pendant 2 s, et ce quelque soit l’instrument de mesure utilisé. Les limites de résolution temporelle et de résolution fréquentielle sont données par le produit BT= 1.» (01dB, [27]).

Il y a un donc compromis entre la résolution fréquentielle et temporelle, il faut adapter la fenêtre d’analyse à la nature du phénomène observé. Un phénomène stable pourra être décrit avec une grande précision fréquentielle en prenant une taille de FFT importante, par contre un signal relativement variant devra être observé avec une taille de FFT courte si l’on souhaite pouvoir visualiser sa variation temporelle. Dans ce compromis, quand on observe un phénomène aléatoire, il est souvent plus simple d’utiliser une technologie en bande de filtres plutôt qu’une technologie FFT du fait des artefacts de mesure (c’est en ce sens que la norme n’autorise pas l’utilisation de la FFT pour les sonomètres de classe 1). Caractériser l’enveloppe demande de faibles tailles de FFT, alors que caractériser sa fréquence demande une grande taille de FFT.

2. Limites de la FFT

Cependant, le signal que l’on cherche à mesurer est un signal physique réel, non prédictible. Il est à priori non périodique… « Monsieur le baron Fourier indique de travailler sur un temps infiniment long, sauf si la fonction est périodique. Aucune mémoire n’est suffisamment importante pour accueillir la totalité du signal ! Le fait de limiter la durée d’observation à un bloc de longueur donnée entraîne comme conséquence de considérer notre signal comme périodique, de période égale à la durée d’observation (la longueur du bloc temporel) » ([27]).

Figure 19 : Analyse des discontinuités introduites dans le signal temporel lors de l’utilisation d’une fenêtre rectangulaire (01dB, [27])

« Cette périodisation artificielle crée des discontinuités dans le signal temporel. De telles discontinuités dans le domaine physique correspondent à des énergies infinies. […] [Le signal étant numérisé], la discontinuité ne se traduit pas par un saut à énergie infinie mais par un saut de pente plus ou moins raide, donc une énergie plus ou moins importante qui vient s’ajouter au signal. En fait on vient de regarder notre signal avec une fenêtre rectangulaire, c’est à dire que l’on a ouvert les yeux de l’analyseur à un moment donné dans la vie du signal, que ses yeux sont restés ouverts pendant la durée d’observation et que brutalement, ils se sont refermés à la fin de l’observation. L’analyseur a taillé dans le vif le signal. Il n’a respecté aucune périodicité. » (01dB, [27])

Pour éviter les discontinuités introduites par une telle fenêtre, impliquant des erreurs d’estimation de l’énergie portée par le signal, on impose à l’analyseur d’utiliser d’autres fenêtres temporelles.

3. Fenêtrage

Nous ne détaillons pas tous les types de fenêtres utilisés dans le calcul de la FFT, mais nous nous concentrons sur les deux fenêtres les plus standards et utilisées par la suite pour les analyses des données.

« La définition d’une fonction utilisable en tant que fenêtre de pondération doit suffisamment déformer le signal temporel pour le rendre périodique tout en respectant suffisamment le signal pour que les résultats trouvés restent représentatifs. » (01dB, [27]) Beaucoup de fenêtres temporelles existent et font un compromis entre l’optimisation de l’erreur maximale commise sur le niveau mesuré et la résolution fréquentielle. Par exemple, Blackman-Harris est très adaptée au repérage fréquentiel, « Flat-Top » est adaptée à la quantification de l’énergie et donc à la mesure de niveau… Les fenêtres seront donc à choisir en fonction du type de signal analysé et du compromis désiré.
La fenêtre de Hanning est de loin la plus utilisée et optimise bien le compromis résolution fréquentielle / résolution en amplitude.

Figure 20 : Effet de la fenêtre de Hanning sur une fonction (01DB, 1996, [27])

La fenêtre de Hamming est dérivée de la fenêtre de Hanning (même utilisation), mais l’accent a été mis sur la résolution fréquentielle (donc au détriment de la résolution en amplitude). Elle est à conseiller lors de la recherche de la fréquence « exacte ».

4. « Overlap »

Pour un analyseur donné, il faut choisir le pourcentage d’« overlap » entre deux fenêtres d’analyse. Plus les fenêtres sont imbriquées, plus l’on est précis dans notre analyse mais plus cela nécessite de la puissance de calcul.

iii. Conversion en affichage par bandes de fréquences

Une fois la taille de FFT choisie, on découpe le spectre en bandes de fréquences afin d’améliorer la lisibilité des données et se rapprocher du phénomène d’intégration de l’audition humaine.
L’idée est d’appliquer au signal des filtres normalisés par bandes à largeur relative constante Δƒ/ƒ (c’est-à-dire dont la bande passante est proportionnelle à leur fréquence centrale).
Il existe trois grands types de résolution d’affichage : par bande d’octave (sonomètres par exemple), par tiers d’octave (la plupart des appareils de mesure le proposent), ou bande fine (résolution variable en fonction de l’analyseur, par exemple 1/48).
Dans le cas d’une analyse de mesures d’un sub en salle, et donc soumis à des phénomènes acoustiques complexes vus précédemment, il est nécessaire d’affiner la résolution d’affichage afin de pouvoir mettre en évidence ce qui relève des modes propres. On utilise alors l’analyse en bandes fines. Elle sert à caractériser les problèmes.

Figure 21 : fréquences (Hz) en tiers d’octave et octave (Mario Rossi, 2007, [20])

Si l’on veut obtenir un résultat quantitatif, le tiers d’octave est un très bon moyen de visualiser le résultat. Par exemple, pour un signal présentant des tonalités marquées (trompette) l’affichage en octave et en tiers donne :

Figure 22 : spectre en bande d’octave, tiers d’octave et 24e d’octave de la trompette jouet de Toutankhamon (Mario Rossi, 2007, [20])

2.3 Techniques de prise de son : robustesse des mesures en basse fréquence

Comme expliqué précédemment, lors d’apparition d’ondes stationnaires, il apparait des nœuds et ventres de vibrations pour les fréquences dont la demi-longueur d’onde est multiple de la distance interparois. Les basses fréquences soumises à notre étude étant précisément les fréquences concernées par les ondes stationnaires, il apparait donc que si l’on place un microphone de mesure sur un nœud de vibration, le niveau observé sera nul alors qu’un quart de longueur d’onde plus loin le niveau atteindra un maximum. Il est donc très facile de faire une erreur de mesure s’il l’on place un microphone fixe dans une pièce.

Le tableau ci-dessous réalisé par David Rousseau et Igor Prade montre les écarts de mesure pour une position fixe du microphone à l’émission (local contenant les enceintes) et à la réception (pièce adjacente). Les mesures ont été réalisées sur 4 types de signaux différents (bruit rose, techno 40 Hz, techno 50 Hz, techno 63 Hz).

On remarque que plus l’on descend en fréquence, plus l’écart de mesure est important. L’écart maximum à 63 Hz peut atteindre 24 dB (12 dB à l’émission et 12 dB à la réception) ce qui est colossal aux vues des exigences des législations.

Comment mesurer si les écarts de mesure dus à la position du microphone sont si importants ? Il faut multiplier le nombre de points de mesure pour diminuer la probabilité de tomber sur la seule et unique valeur d’un nœud de vibration de la fréquence mesurée. La question qui découle immédiatement de ce système de mesure est celle du nombre de microphones qu’il faut employer. Cela diffère-t-il pour chaque fréquence ?

Dans leur étude « Estimation de la robustesse des mesures à 63 Hz », David Rousseau et Igor Prade ont effectué l’expérience suivante. Dans une salle fermée type cave, 4 morceaux de musique ont été joués, et 11 mesures ont été réalisées par morceaux à l’aide de 4 sonomètres Solo 01dB. Les valeurs retenues correspondent donc à la moyenne des 4 morceaux et sont donc basées sur 44 mesures.

« Fixe » : sonomètre immobile durant la mesure.

« en 8 » : On fait une forme de 8 sur 1m environ afin de moyenner dans l’espace

« moy de 5 » : moyenne énergétique de 5 points au hasard.

Analyse des résultats :

La comparaison de plusieurs mesures en 1 point donne des résultats de niveaux sonores totalement aléatoires pouvant approcher une variance de plus de 14 dB pour un écart type proche de 4 dB. L’énergie fournie dans les basses fréquences (octave 63 Hz) est donc techniquement difficile à évaluer ou estimer.

En revanche, l’usage d’un système à plusieurs microphones, ou la mesure en plusieurs points (en simultané ou en séquentiel) permettent de réduire ces différences dans les résultats. En effet, le fait de moyenner énergétiquement 4 points répartis aléatoirement dans la pièce (à 1 mètre minimum des parois) permet d’obtenir une fiabilité sur les mesures à 63 Hz équivalente à celles réalisées actuellement à 125 Hz en fixe (pour une même variance de 3).

On peut conclure que sur la base d’un écart type de 1,5 dB et un écart maximum d’environ 7 dB (statistiques réalisées sur 55 000 échantillons), la moyenne dans l’espace (« en 8 ») et la moyenne multi micros sur 5 positions permettent de mesurer les octaves 63 Hz et 125 Hz avec la même fiabilité.
Voici ci-dessous la description de ces deux techniques de façon plus détaillée.

iv. Mesures mobiles ou « Moyenne spatiale »

La mesure s’effectue en continu avec le sonomètre en main et en déplaçant le microphone tant sur le plan horizontal que vertical dans toute la pièce.

Contraintes techniques : durant la mesure, une attention particulière sera à apporter lors du déplacement dans le local afin qu’il ne soit pas source de bruit pouvant perturber le relevé en cours (Exemple : parquet qui craque sous les pas). La hauteur du microphone de mesure ne devra pas être fixe, notamment afin d’éviter le mode 1 de la hauteur du local. Une durée minimum de 2 minutes est nécessaire.

Pour chaque mesure, il s’agit de bouger en continu le microphone autour de sa position jusqu’à ce que la mesure soit stabilisée.

v. Mesures fixes ou « multi micros »

Il s’agit de positionner plusieurs microphones de mesure. 4 ou 5 points sont nécessaires notamment pour la mesure à 63 Hz. Il faut ensuite en calculer la moyenne énergétique. Une durée de mesure de 1 minute est suffisante. Deux méthodes sont possibles :

La méthode FFT a pour avantage de nécessiter moins de ressources de calcul. En revanche, comme vu dans § 2.2.ii, les fenêtres de pondération introduisent des erreurs de calcul. La méthode par bande de filtres est simple à utiliser, comporte peu d’erreurs mais nécessite un processing plus important. La FFT permet également d’accéder facilement à l’analyse en bande fine, alors que la bande de filtre ne le permet que très difficilement.

La connaissance des difficultés de mesure dans les basses fréquences permet de caractériser le système de diffusion. Une fois le système caractérisé, il faut pouvoir maîtriser la diffusion des basses fréquences et limiter les émergences sur le voisinage. La directivité permet de concentrer l’énergie sur le public. De nombreux travaux ont déjà été synthétisés sur la manière de créer de la directivité avec des subwoofers. Nous donnons ici des informations sur les configurations que nous allons ensuite simuler dans le logiciel, puis vérifier via les mesures au hangar et dans la pratique sur un concert.

C. Configurations standards

1. Cardioïde

« En disposant deux enceintes l’une derrière l’autre, écartée d’une distance d (entre les faces avant), et en retardant l’enceinte avant de τ = d/c (c, vitesse du son dans l’air), on obtient des interférences modulées par la fonction cardioïde : 1 − cos(θ). La première annulation à l’arrière a lieu à la fréquence f1 dont la longueur d’onde λ1 est égale au quart de la distance
d. » (Pierrick Saillant, 2010, [23]).

La méthode la plus théorique consiste à placer une distance entre les sources correspondant au quart de la longueur d’onde de la fréquence d’accord. Cette configuration sera appelée dans la suite du mémoire « NATIVE ». Toutes les autres variations de distance entre les subs correspondent à des configurations dites non natives.

2. Cardioïde à gradient

Une autre possibilité d’accord de la configuration en cardio consiste à utiliser le hors phase en même temps que le délai. Le principe consiste à utiliser le hors phase pour la réjection arrière, tandis que le délai assure la sommation à l’avant. La valeur du délai correspond à la distance entre les subs.

Figure 23 : Configuration cardioïde à gradient (Bob Mc Carthy, 2016, [6])

3. End Fire

Le End Fire consiste à aligner plusieurs sous-ensembles cardioïdes les uns derrière les autres.

Figure 24 : Configuration End Fire (Bob Mc Carthy, 2016, [6])

D. Décrets réglementaires relatifs aux nuisances sonores

1. Définitions essentielles

Pour comprendre les réglementations il est tout d’abord nécessaire de définir quelques termes et concepts physiques essentiels.

Unités de mesure des niveaux dans la règlementation

Tous les niveaux réglementés se mesurent à l’aide d’un sonomètre intégrateur homologué (Norme AFNOR NF S 31-109). En effet, la Transformée de Fourier Rapide (FFT) n’est pas utilisée car elle n’est exacte que pour des signaux impulsionnels. Pour des signaux réels elle commet une approximation. On utilise donc un sonomètre comportant des bandes de filtre normalisées. Dans la première partie nous avons vu que le niveau de pression acoustique brut ne correspond pas à la perception sonore humaine ; pour cela, des pondérations de type A et C sont nécessaires. Lors de la mesure d’un niveau, les sonomètres appliquent tout d’abord cette pondération fréquentielle A ou C à l’aide d’un filtre, puis, ils calculent la moyenne énergétique équivalente du signal (Leq,T exprimé en dB). C’est un indice énergétique. En considérant un son stable ou fluctuant perçu pendant une durée T, le niveau énergétique équivalent représente le niveau de bruit constant qui aurait été produit au même point de mesure et durant la même période.

« […] Un son véhiculant une énergie W pendant un temps t est équivalent à un son d’énergie W/2 pendant un temps 2t.» (Meyer-Bisch C., 2005, [16])

À partir des niveaux pris comme référence pour la santé au travail, soit 85 dBA sur 8 h nous avons calculé des équivalences de dose perçues dans le tableau ci-dessous. « Valeurs d’exposition supérieures déclenchant l’action de prévention prévue à l’article R. 4434-3, au 2° de l’article R. 4434-7, et à l’article R. 4435-1. Niveau d’exposition quotidienne au bruit de 85 dB(A) sur 8 h » ([25])

Figure 25 : échelle des niveaux de bruits nocifs pour l’audition (dB A) en comparaison iso-énergétique.

Si l’échantillonnage a été effectué avec une pondération fréquentielle (A par exemple), le niveau équivalent, sera alors exprimé en dB(A) et symbolisé par LAeq,t. Ce niveau est très régulièrement utilisé comme indicateur de gêne. On observe en effet, dans la pratique, une bonne corrélation entre cette valeur et le risque auditif ressentie par un individu exposé au bruit. Le dBA n’a pas été crée pour la règlementation sur les risques auditifs. En revanche, c’est le seul indice historique pour lequel il existait beaucoup de données épidémiologiques.

Définitions des termes réglementaires associés à la protection du voisinage

Considérons la situation standard d’une boîte de nuit et d’une habitation adjacente. Les niveaux sont mesurés à l’aide d’un sonomètre en Leq. Définissons les variables suivantes :

Musique = niveau d’émission à l’intérieur de la boîte de nuit

Emergence

Définition officielle

Article R.48-4 du Code de la santé publique :

«La différence entre le niveau de bruit ambiant, comportant le bruit particulier en cause, et celui du bruit résiduel constitué par l’ensemble des bruits habituels, extérieurs et intérieurs, dans un lieu donné, correspondant à l’occupation normale des locaux et au fonctionnement normal des équipements.»

Figure 21 : Analyse à 500 m des niveaux enregistrés à l’octave 40 Hz par le sonomètre sur un concert

Sur la figure 21, nous avons exporté des enregistrements de sonomètre effectués sur un concert pour illustrer les différents termes règlementaires.

Annexe [Les pièges à éviter lors de la mesure de l’isolement]

2.1 Listes des articles visant les diffuseurs de musique amplifiée

Quels sont les articles en vigueur pour les établissements diffusant à titre habituel de la musique amplifiée?

Remarque : Les règlementations distinguent le voisinage contigu et non mitoyen. «Dans les textes il est question de contiguïté et non de mitoyenneté. Tous les espaces mitoyens à un autre sont contigus mais tous les espaces contigus ne sont pas mitoyens. La contiguïté est à interpréter en termes de ponts acoustiques possibles entre le local d’émission et celui de réception. Par exemple, une ou des basses fréquences peuvent se transmettre par un conduit de ventilation qui est fixé au niveau d’un dernier étage. La transmission vibratoire se faisant par un accrochage de la fréquence de résonance du conduit (et de ses harmoniques), va impacter uniquement le dernier étage et non le 1ᵉʳ étage. Il y aura bien contiguïté car les vibrations se transmettent effectivement comme si l’appartement du dernier étage était mitoyen du conduit, ce qu’il est effectivement au niveau des accroches du conduit, ce dernier étant une extension et donc faisant partie intégrante du local d’émission.»⁴
[Décrets] en Annexe

Un nouveau décret est apparu le 7 Août 2017.Quelles sont les dispositions réglementaires de ces deux décrets et quelles sont leurs différences ?

2.2 Le décret fondamental n°98-1143 du 15 décembre 1998 et le nouveau décret n°2017-1244 du 7 août 2017

Exemples d’application des termes correctifs

Les termes correctifs font appel à la notion de dose de perturbation. En quelque sorte, plus la durée d’exposition est longue moins on autorise de dépassement.
- Une discothèque qui diffuse de 23H00 à 5H00 : durée cumulée = 6 heures
Période nocturne :

Tolérance d’émergence en niveau global (habitation contigües et non contigües) ≤ 3 dB(A) + terme correctif (6h = 1 dB(A)) = 4 dB(A)
- Un bar qui ouvre de 9 heures à 2 heures du matin et qui diffuse de la musique amplifiée sans interruption.
Période diurne : Le bar fonctionne en période diurne de 9h00 à 22h00, soit une durée cumulée = 13 heures

Tolérance (habitation contigües et non contigües) ≤ 5 dB(A) + terme correctif (6° = 0dB(A))= 5 dB(A)

Période nocturne : Ce même bar qui fonctionne, en période nocturne, débute la soirée à 22H00 pour fermer à 2H00, durée cumulée = 4 heures (un peu moins car il commence à fermer plutôt vers 1H45)

Tolérance (habitation contigües et non contigües) ≤ 3 dB(A) + terme correctif (5° = 2 dB(A))= 5 dB(A)

Clause spécifique aux enfants

Du fait de l’augmentation très importante des niveaux sonores et des pratiques à risques, le nouveau décret rajoute également une clause pour les enfants : « Lorsque ces activités impliquant la diffusion de sons amplifiés sont spécifiquement destinées aux enfants jusqu’à l’âge de six ans révolus, ces niveaux de pression acoustique ne doivent pas dépasser 94 décibels pondérés A sur 15 minutes et 104 décibels pondérés C sur 15 minutes»

Mise en œuvre

« Dans le cas où l’isolement du local où s’exerce l’activité est insuffisant pour respecter ces valeurs maximales d’émergence, l’activité de diffusion de musique amplifiée ne peut s’exercer qu’après la mise en place d’un limiteur de pression acoustique réglé et scellé par son installateur.»

Exigences d’application

Il est imposé aux lieux concernés par le décret, de faire une étude d’impact acoustique chargée de faire l’inventaire des problèmes d’isolation et des travaux d’isolations nécessaires. Si les valeurs d’isolation données par l’étude d’impact ne permettent pas de respecter les niveaux d’émergence : l’installation d’un limiteur est exigée. (Limiteur global ou par bande)

« L’étude acoustique ayant permis d’estimer les niveaux de pression acoustique, tant à l’intérieur qu’à l’extérieur des locaux, et sur le fondement de laquelle ont été effectués, par l’exploitant, les travaux acoustiques nécessaires. La description des dispositions prises pour limiter le niveau sonore et les émergences aux valeurs fixées par le présent décret, notamment par des travaux d’isolation phonique et l’installation d’un limiteur de pression acoustique»⁵

Un limiteur est un appareil inséré à la sortie de la console de mixage et limitant le niveau du signal sonore.

Quelles peines encourues ?

Pour le dépassement des niveaux en salle et des valeurs d’émergence (article R571-96) :
- Amende de 1 500 euros et/ou confiscation du matériel de sonorisation
- En cas de récidive : amende (3 000 euros) et/ou fermeture administrative de la salle.
- Si plainte au civil de la part des riverains : tribunal
Nota Bene important

À l’heure d’écriture de ce mémoire, la nouvelle règlementation n’est toujours pas fixée.

« L’interprétation des textes va être clarifiée par une note interministérielle avant sa mise en application en 2018. Dans l’immédiat, à partir du moment où [l’ancien texte] n’a pas été officiellement abrogé, sa validité perdure. (Quoiqu’il arrive, les niveaux à l’émission, pour le respect des 3 dB d’émergence par bandes d’octave pour les habitations contiguës, sont habituellement calculés par rapport aux taux d’isolement des locaux, donc que ce soit reconduit ou pas, la technique d’approche des bureaux d’étude restera la même, qu’elle soit officielle ou pas).»⁶

E. Problématique

Revue de littérature et mesure des basses fréquences

La propagation des basses fréquences à l’intérieur d’une salle est un phénomène physique très complexe et les techniques de mesures associées sont rarement décrites autrement que dans une vision universitaire. Il manquait donc une description pratique des méthodes à appliquer, et ce vis-à-vis de la protection du voisinage.

Revue de littérature et optimisation des systèmes de diffusion

Par ailleurs, les pratiques standard visent à optimiser l’énergie sur le public et à garantir un son sur scène acceptable. Il est par contre très rare d’associer à ces deux précédents critères la protection du voisinage. Il s’agit de montrer que l’on peut trouver une technique de diffusion permettant à la fois de garantir la qualité du son l’ensemble scène et public, et la protection du voisinage.

Ainsi, la caractérisation des systèmes vis-à-vis des problèmes de voisinage est rarement vue dans son ensemble et il manquait une synthèse des différentes techniques de mesure et de création de la directivité permettant d’offrir une vision globale au lecteur.

Revue de littérature et règlementation

Enfin, les textes légiférant sur les niveaux sonores sont très difficilement accessibles et compréhensibles car ils relèvent d’une méthodologie spécifique au domaine du droit qu’un technicien ou un ingénieur du son n’est pas à même d’appréhender facilement. De plus, dans leur rédaction actuelle, les textes présentent des incohérences technologiques qui rendent impossibles leur usage sans une interprétation qui demande d’importants retours d’expérience. Il est par exemple spécifié dans le 98-1143 un niveau sonore de 120 dB crête en tous points accessible au public alors que cette contrainte est impossible à mettre en œuvre lors d’un concert (explication détaillée dans le III. Discussion §A). Il est donc fondamental de connaître les us et pratiques qui ne sont pas décrits dans un document mais qui font appel à une expertise des professionnels du métier.

« Comment rendre directive la diffusion des basses fréquences pour limiter l’impact sur le voisinage et concentrer l’énergie sur le public ? ».

Objectifs, questions de recherche et approche méthodologique

Les objectifs de ce mémoire s’adressent aux ingénieurs du son sonorisateurs, acousticiens, caleurs systèmes, étudiants et tous ceux qui sont confrontés à des problèmes de voisinage liés à une sonorisation. Pour ce faire, ce mémoire offre des éléments de réponse aux questions de recherche suivantes :
1. Les règlementations anciennes et nouvelles sont-elles adaptées à la protection du voisinage ?
2. Comment mesurer de façon fiable les basses fréquences pour optimiser les systèmes de diffusion au regard des problèmes de voisinage ?
3. Comment choisir la configuration de subs la plus adaptée ?
4. En pratique, quelle est la procédure à adopter pour optimiser un système vis-à-vis du voisinage ?
Méthodologie de recherche :

Nous avons dans un premier temps cherché à définir une méthode de mesure juste et reproductible dans les basses fréquences. La méthode s’appuie sur la multiplication du nombre de points de mesure pour l’obtention de moyennes énergétiques.
Dans le but d’éliminer les spécificités des subwoofers industriels, nous avons décidé de construire nos propres subwoofers, au comportement le plus simple et prévisible possible. Leur taille très compacte a permis de se rapprocher le plus possible d’une source théorique et d’obtenir les résultats les plus généraux possibles.

Nous avons également programmé un logiciel de simulation afin d’avoir une souplesse d’analyse et de pouvoir automatiser des processus de comparaison non disponibles sur les logiciels commerciaux. Ceci nous a permis de pouvoir simuler puis mesurer avec une grande flexibilité les différentes configurations que nous voulions tester. Les mesures et simulations ont été confrontées aux logiciels actuels pour s’assurer de la validité des résultats obtenus. Les configurations de subs testées s’appuient principalement sur les études de Bob McCarthy.

Après avoir optimisé les subwoofers et validé les simulations en champ libre, nous nous sommes confrontés à l’influence de la salle, nettement plus complexe.

Enfin, nous avons mis en pratique les simulations ainsi que notre méthodologie de mesure lors de situations de concerts, utilisant des systèmes de sonorisation de grande ampleur.

Le sujet n’était pas de produire des données statistiques sur la qualité perçue mais plus de donner les bases théoriques et pratiques qui permettent au praticien de garantir un résultat optimal le plus vite possible.

Nous nous sommes intéressés à des mesures quantitatives du niveau sonore afin d’estimer les performances des différentes configurations. L’information qualitative résulte plus du traitement des données permettant d’évaluer la préservation de la réponse intrinsèque du système. La frontière entre qualitatif et quantitatif n’apparait pas simplement sur les problématiques de sonorisation car tout est lié. La méthode de recherche est donc mixte.

I. Optimisation de la directivité pour la maîtrise des basses fréquences dans l’environnement.

A. Logiciel d’agencement de plusieurs subs

1. Les logiciels de simulation et leurs limites

Spécificité relative aux marques d’enceintes

Le logiciel Soundvision produit des simulations spécifiques au constructeur. Par exemple, du fait de la spécificité constructeur du SB28⁷, la simulation par le logiciel Soundvision pour ce subwoofer à 100 Hz n’est pas omnidirectionnelle. En programmant notre propre logiciel, nous voulions nous rapprocher le plus possible d’un modèle théorique, afin de faciliter la compréhension des simulations.

Figure 26 : Simulation Soundvision à 100 Hz d’un SB28

Nécessité d’un affichage synthétique de la directivité par fréquence

Soundvision affiche un résultat de directivité pour une fréquence donnée ou bien pour une plage de fréquence dont il fait la moyenne énergétique. Ceci ne permet donc pas d’identifier les problèmes de lobes, fondamentaux dans la maîtrise de la directivité, de façon rapide. Prenons un exemple pour une configuration de 2 subwoofers espacés de 3,40 m.

Figure 27 : 2 subs espacés de 3m40. Nécessité d’une visualisation par fréquence pour comprendre les lobes de directivité

Dans la figure ci-dessus, la visualisation de 20 à 100 Hz ne présente pas de lobes de directivité tandis que les vues fréquence par fréquence font apparaître les lobes de directivité.

La nécessité d’avoir une vue synthétique des directivités pour chaque fréquence sur une seule et même image est ainsi un besoin décisif qui nous a poussé à concevoir notre propre logiciel.

Efficacité des relevés de données

Pour évaluer l’efficacité en amplitude d’une directivité, il faut mesurer les niveaux à 0°, 90° et 120° (directivité dans l’axe sur le côté et réjection à l’arrière). Sous Soundvision cela signifie que pour une configuration donnée, il faut pour chaque fréquence :
- Simuler la configuration à la fréquence mesurée
- Mesurer chaque point à la main
- Exporter les données
- recommencer le tout pour la nouvelle fréquence d’analyse.
Par exemple, pour un cardio simple, relevons 3 points à 50 Hz :

Cette procédure est beaucoup trop longue par rapport aux objectifs de notre étude.

Pour résumer, les problématiques suivantes nous ont poussés à développer ce logiciel :
- La volonté de se rapprocher du modèle théorique et de s’affranchir des spécificités fabriquant
- Le temps nécessaire à l’export des données.
- La visualisation séquentielle rend difficile la synthèse du phénomène par rapport à une visualisation instantanée des répercussions, pour chaque fréquence.
- Mettre en œuvre des concepts théoriques dans le logiciel de simulation pour mieux les appréhender, ce qui est essentiel pour pouvoir développer une capacité d’analyse des systèmes existants.
- Avoir une flexibilité totale dans le choix des éléments que l’on souhaite analyser.
2. Simulation des configurations

2.1 Méthode

i. Hypothèses préliminaires

La simulation utilise des sources considérées comme parfaitement pulsantes et omnidirectionnelles.
Le niveau de référence étant arbitraire, la directivité d’encastrement n’influe pas sur les calculs tant que la différence de distance entre la source image et la source réelle est faible (un sub unique ne voit pas sa directivité modifiée, par contre une ligne de subs verticale doit être considérée comme faisant deux fois sa longueur quand elle est posée au sol et crée un dipôle quand elle est placée en l’air à faible hauteur §I.1.2 « Source Image »). En effet, la hauteur du centre acoustique d’un caisson standard de 46 cm est d’environ 30 cm. Ce qui veut dire que le sub et sa source image se comportent comme deux subs espacés de 60 cm. Or, deux subs espacés de 60 cm ont un comportement omnidirectionnel dans la gamme des basses fréquences du sub. Comme le montre la figure ci-dessous, la simulation est omnidirectionnelle dans la gamme de fréquence qui nous intéresse (≤ 100 Hz).

Figure 28 : Courbes de directivités en fonction des fréquences et de l’angle d’observation pour deux subs espacés de 60 cm⁸

Par ailleurs, l’objectif est d’avoir un raisonnement simple même si la réalité est effectivement plus compliquée. La majorité des logiciels de simulation raisonnent sans les effets de sol pour des commodités d’interprétation.

ii. Fonctionnement du logiciel

Fonctionnement du logiciel pour un cas particulier à 2 subs que l’on peut facilement généraliser.

Le résultat de la simulation est calculé en coordonnées polaires. L’ensemble des points simulés sont situés sur le cercle de rayon la distance d’observation et de centre O, centre acoustique de la configuration simulée.

Pour chaque point du cercle, on calcule les distances de parcours D1 et D2 par le théorème de Pythagore.

Puis, chaque sub émettant une impulsion, on calcule :
- L’atténuation des impulsions due à la distance de parcours du son.
- Le retard total, somme du retard physique lié à la différence de temps de parcours (D2 – D1) au point P et du retard numérique de la configuration cardioïde.
- Le décalage en échantillon correspondant au retard.
- La FFT.
- Puis, on affichage la FFT en phase et en amplitude dans deux graphiques différents.
Nous résumons dans le programme écrit en pseudo-code le déroulé de l’algorithme.

Variables utilisateur :

Distance Observation
List_Freq (liste des fréquences à analyser) Fs (fréquence d’échantillonnage)
Tps (taille de la fenêtre d’analyse)

Pour tous les angles

Pour tous les subs

Calcul de la distance de propagation du point d’analyse au sub Calcul de la distance de parcours
Calcul de l’atténuation
Niveau = -20 log10(Distance)

Calcul du retard de propagation
Retard = Distance/Célérité + Retard Source(Sub)/Célérité;
Calcul du nombre d’échantillons correspondant au retard Decalage_Echantillons = Retard * Fs

On place une impulsion décalée du retard dans la fenêtre d’analyse Impuls(Decalage_Echantillons) = Amplitude;

End

FFT = FFT (Implusions_Subs)

Data_SPL_Angle = 20 log10 (abs (FFT (List_Frequences)) (amplitude de la FFT) Data_Phase_Angle = FFT_Phase (List_Frequences) (angle de la FFT)

End

Pour tous les angles

Calcul de la phase relative entre la phase pour 0° et la phase du point recherché

Data_Phase_Angle = Valeur_O_Degrés – Data_Phase_Angle

End

Ceci nous permet d’obtenir trois graphiques différents :
- Vision surfacique de la directivité pour la fréquence de notre choix.
- Vision polaire de la directivité pour toutes les fréquences.
- Limitations liées à la phase.
Prenons l’exemple concret d’une configuration cardioïde. Calcul des distances, atténuations et retards pour P à α = 120°

Calcul D1 et D2 :

Atténuation : on prend comme référence de niveau, le niveau à 1 m et on calcule en relatif :

𝑁𝑖𝑣𝑒𝑎𝑢_𝐷1 = −20 log10(49.26) = −33.85 𝑑𝐵
𝑁𝑖𝑣𝑒𝑎𝑢_𝐷2 = −20 log10(50.74) = − 34.10𝑑𝐵

Retard dû à la distance de parcours et au retard numérique :

Ainsi au point P, les deux impulsions arrivent avec
- Impulsion du sub 1 : -33.85 dB d’atténuation et 143 ms de retard
- Impulsion du sub 2 : -34.10 dB d’atténuation et 152 ms de retard
On calcule la FFT de la somme de ces impulsions décalées de l’équivalent en échantillons de ce retard. On récupère dans une matrice les informations d’amplitude et de phase pour toutes les fréquences à ce même point P.

L’algorithme répété pour tous les points P du cercle de rayon R permet d’obtenir les courbes de directivité en fonction de la fréquence et de l’angle : il permet donc de regrouper sur un seul et même graphique l’ensemble des diagrammes polaires, pour chaque fréquence. L’objectif du logiciel de simulation était justement d’afficher le comportement pour toutes les fréquences « en un clic », et pouvoir observer en un seul coup d’œil l’apparition des lobes parasites des structures complexes.

La phase est affichée de la même façon car pour chaque point calculé la FFT donne en même temps l’information en amplitude et en phase.

Enfin, si l’on reprend le même algorithme en coordonnées cartésiennes, et en considérant une fréquence donnée, on obtient une vue surfacique proche de la vue usuelle des logiciels du commerce tels que Soundvision (cf. §ii suivant). Cette fois-ci, on calcule le résultat non pas pour les points d’un cercle autour de la configuration, mais pour toute une surface.

Figure 29: Explication de la vue synthétique des directivités en fonction des fréquences pour tous les angles

iii. Modélisation des configurations et comparaison avec Soundvision

Pour vérifier la validité de notre logiciel, nous avons vérifié que nos résultats étaient conformes à la théorie, puis nous les avons comparés à ceux d’un logiciel commercial comme Soundvision.⁹

Figure 30 : Vérification de la simulation par Sound vision (gauche) et notre logiciel Schouf : vue surfacique à 50 Hz

iv. Configurations simulées

Focalisation sur la configuration Cardioïde

Procédure
1) Configurations cardioïdes par calage en retard
1. Nous simulons tout d’abord le cas permettant d’avoir la configuration cardioïde la plus théorique possible, c’est-à-dire un cardio dont la distance entre les sources correspond à λ/4. On appellera NATIVE cette configuration. Dans la pratique, la fréquence d’accord la plus efficace est de 50 Hz ce qui demande un espacement entre les subs de 1.7 m.
2. Les situations de la vie pratique amènent souvent à des distances entre les subs différentes de λ/4 (cardio dit non natif). Par exemple, il est fréquent que l’espacement physique existant entre la scène et le public ne permette pas de placer les subs à 1m70 de distance… Nous simulons donc dans un deuxième temps plusieurs configurations non natives en faisant varier la distance intersub entre 0 et λ/2 m. Nous en avons sélectionné 5, qui permettent d’avoir une visualisation représentative de l’évolution du comportement cardioïde en fonction de la distance entre les sources.
  2) Configurations cardioïdes par la méthode des gradients (cf. Revue de littérature C.§3)
3. Nous simulons le cas d’un cardio espacé de 0.85 m. Le sub arrière est hors phase et retardé. De la même manière que pour les cardios par calage en retard, nous simulons plusieurs gradients en faisant varier la distance entre les subs de
  0.75 m à 1.5 m.
4. Nous généralisons pour différentes distances entre les subs en suivant le tableau de Bob Mc Carthy [6].
Algorithme de construction des cardios non natifs : Quel retard numérique faut-il rentrer ?

Pour obtenir la rejection à l’arrière, les signaux sonores doivent arriver en opposition de phase à l’arrière du cardio. Ainsi, la somme des retards physique et numérique vaut λ/2 à 50 Hz à l’arrière.

Soit c la célérité du son On a :

Distance_Intersub + c / Retard_Numérique = λ/2

Ainsi :

Retard_Numérique = (1(2*50Hz) – Distance_Intersub/c)*c

Ce calcul est généralisable à n’importe quelle fréquence d’accord du cardio.

Procédure de construction des cardios par gradient

Le délai numérique à insérer correspond à la distance intersub. Dans tous les cas de figure le sub arrière est mis hors phase. Les différents cas simulés sont :

Simulation de la configuration « End Fire »

On simule un End Fire de 5 boîtes, espacées de 1.7 m chacune. Cela revient à positionner 4 cardios les uns derrière les autres.

Simulation de la ligne

1) Ligne de 4 subs répartis sur une longueur d’onde (6.8 m)
2) Ligne de 9 subs répartis sur une longueur de façon à observer l’influence de l’augmentation du nombre de sources
3) Ligne de 4 subs répartis sur une demi-longueur comme exemple de configuration à éviter…

Simulation du cardio dipolaire

Le cardio dipolaire est formé de deux ensembles cardioïdes en parallèle (cf. p88). Il est fréquent de voir apparaître cette configuration. Nous l’avons donc simulée.

Procédure d’analyse des résultats des cardios non natifs.
Pour évaluer l’efficacité d’action d’un cardio vis-à-vis de la qualité du son sur le public et du voisinage il faut définir plusieurs critères d’analyse.

¹⁰

L’angle d’ouverture habituellement utilisé dans les documents des fabricants n’est pas un critère adapté aux assemblages en basse fréquence à partir du moment où beaucoup de lobes de directivités apparaissent. Nous essayons de montrer par ce logiciel que ces angles d’ouverture sont variables en fonction de la fréquence, et qu’il est compliqué de pouvoir ramener ce critère 3D en 2 valeurs numériques. C’est justement l’utilité du logiciel de simulation qui permet de visualiser ce critère pour toutes les fréquences : p77-78, pour un exemple simple, l’angle de réjection n’est plus un critère valable à partir de 2 m de distance entre les subs.

La quantité de rejection à l’arrière n’est pas un critère d’analyse car sur ce modèle théorique elle est uniquement dépendante de la distance d’observation.

Distance d’observation : Nous avons calculé sous Matlab quelle était l’erreur d’évaluation en fonction de distance de mesure. L’algorithme consiste à calculer la distance à partir de laquelle les subs sont au même niveau à l’arrière. C’est une des conditions majeures pour que le son s’annule.

Nous plaçons la distance d’observation à 50 m de façon à avoir le moins d’erreur de mesure. Par ailleurs, plus la distance de mesure est grande, plus le niveau de réjection mesuré est important. Nous avons donc programmé sous Matlab les niveaux de réjection théoriques d’un cardio natif en fonction de la distance de mesure.

On observe sur les figures ci-dessous que plus l’on s’éloigne du cardio, plus la réjection est importante.

50 m est donc à la fois la distance permettant de faire un minimum d’erreur de mesure, et d’observer la réjection maximum.

Nous rappelons que tous les résultats sont interprétés en détail dans la partie discussion (III §C.)

2.2 Résultats

v. Focalisation Cardioïde

1. Cardio Natif

2. Configurations cardioïdes Non Natives

Nous expliquons de façon détaillée pour ce résultat les critères d’analyse définis dans la partie Méthodes. Par la suite, la plupart des résultats sont donnés sous forme de tableaux.

Calcul du gain à l’avant du cardio (0°)

Calcul de la largeur fréquentielle de la réjection
- Calcul de la courbe de réjection (Courbe de réponse avant – Courbe de réponse arrière) en fonction de toutes les fréquences.
- On regarde à partir de quelles fréquences autour de 50 Hz, on obtient une réjection de
  -6 dB.
Calcul de l’angle de réjection

Figure 34 : Courbe de directivité à 50 Hz en fonction de l’angle

L’angle de réjection n’est pas un critère significatif pour cette configuration. En effet, un critère prenant comme hypothèse de base que la directivité s’exprime à -6 dB n’a plus de sens, car le niveau dans l’axe est déjà 6 dB inférieur à celui produit à 90°. Le critère angulaire n’est adapté qu’à un rayonnement ne comportant qu’un lobe principal. Le système se comportant de plus en plus en rayonnement dipolaire, l’énergie sur le côté devient très importante (formation de lobes à 90°). A la fréquence de coupure de 76 Hz, on affiche le résultat surfacique pour visualiser l’apparition des lobes.

Dans les deux tableaux qui suivent, merci de lire les deux pages comme sur du A3.

Généralisation des résultats des configurations cardioïdes à retard pur

Résultats en termes d’angles de réjection (largeur de réjection). Ce critère permet de visualiser la zone de voisinage qui sera couverte par la réjection.

Dans un premier temps, nous avons calculé la courbe de répartition de l’énergie générée à 50 Hz pour tous les angles en fonction de la distance entre les subs. Ceci nous a permis d’estimer l’énergie générée pour toutes les distances intersubs.

Energie dans l’axe

Dans un deuxième temps, nous avons calculé à partir de la courbe précédente l’énergie relative à la réponse observée dans l’axe. On est donc en mesure de caractériser le lobe de directivité qui permet de déduire la largeur de l’angle de rejection, estimé à -6 dB.

On observe bien qu’à mesure que l’on écarte les subs le comportement devient dipolaire et il se forme des lobes sur les côtés. Le critère de largeur angulaire ne devient plus pertinent.
En revanche, en deçà de 2 m entre les subs environ, la largeur de réjection varie de 180° de couverture pour la distance intersub la plus petite (très grande largeur de réjection), à 120° pour 2 m de distance inter sub.

Résultats principaux
- Une configuration cardioïde est active sur une octave au maximum
- Diminuer la distance inter sub permet d’élargir la réjection mais au dépend de la quantité à l’avant et de la qualité du son. En effet, le gain de sommation et la fréquence de coupure de la courbe de réponse avant s’abaisse à mesure que l’on s’éloigne du natif.
- Augmenter la distance intersub entraine l’apparition de lobes sur les côtés. On ne peut plus parler de largeur angulaire de réjection. De la même manière la qualité de la réponse impulsionnelle diminue fortement.
3. Cas du cardioïde par gradient

Résultats principaux du cardioïde par gradient
- Plus de réjection sur les côtés et sur l’arrière
- À l’arrière, réjection constante quelque soit la fréquence.
- A l’avant, moins d’énergie que le cardio natif et courbe de réponse filtrée : déformation de la réponse impulsionnelle dans les très basses fréquences Par exemple, on obtient -6 dB à 35Hz sur la courbe de réponse avant. La déformation de la réponse impulsionnelle engendre une différence de timbre entre un paquet de subs en omni et le cardio ainsi réalisé. De plus, les pertes de 6 dB à 35 Hz nécessite de doubler la quantité de subs pour obtenir la même énergie sur le public.
Généralisation des résultats des configurations cardioïdes en gradient

Résultats principaux de la généralisation des résultats des configurations cardioïdes à gradients
- Réjection forte en amplitude et constante en fréquence : très intéressant d’un point de vue protection du voisinage…
- Réponse en fréquence avant : filtrage important de la courbe de réponse avec très forte perte de niveau SPL à l’avant, notamment dans l’infrabasse. La qualité du son pour le public en pâtit grandement….
vi. “End Fire”, 5 subs espacés de 50 cm

Gain à l’avant :

+13.9 dB (nous avons 5 subs donc à l’avant la somme vaut 20*log10(5) = 13.9 dB)

Figure 35 : Directivité à 50 Hz de l’End Fire 5 boites

D’après la figure 35, la largeur angulaire de réjection vaut 180°.

Résultats principaux End Fire 5 subs espacés de 50 cm :
- Réponse Impulsionnelle dans l’axe : Parfaite
- Largeur de réjection fréquentielle : Large Bande (24 Hz à 177 Hz)
- Réponse fréquentielle à l’avant : Parfaite.
- Les zones hors phase étant très faibles en énergie, l’End Fire a l’avantage de ne pas créer de lobes de directivité très marqués quand il est additionné avec un autre système. Très directif dans le haut mais pas très directif dans le bas du spectre
vii. Ligne

1. Comparaisons pour la configuration ligne

Résultats principaux :
- Dans l’axe les courbes de réponse sont droites
- En dessous de 30 Hz le comportement est omni (mais à cette fréquence il rare de pouvoir générer beaucoup de puissance).
- Autant d’énergie à l’avant qu’à l’arrière.
- L’angle d’ouverture se resserre avec la fréquence dans le haut grave. On observe la formation d’un faisceau à mesure que la fréquence augmente. Si l’on cherche une homogénéité du son sur le public, il faut donc faire attention à la gamme de fréquence utilisée.
- Plus on augmente le nombre de HPs moins on a de lobes parasites.
2. Ligne de 9 avec une ligne de 9 derrière en cardio

Pour pallier le lobe arrière on insère une ligne cardioïde de 9 subs, derrière la ligne de 9 subs utilisée précédemment.

LIGNE de 9 couplée à un cardio en phase

Résultats principaux :
- On annule les lobes sur les côtés
- À l’arrière, il reste quelques lobes, c’est normal, le cardio n’est actif que sur une octave maximum.
3. Cardio dipolaire
- Dès que l’on dépasse l’octave autour de 50 Hz, le comportement devient extrêmement modal
- Certains paquets dont l’énergie est importante sont hors phase avec le système principal dès que l’on n’est plus dans la zone de la fréquence d’accord.
- Il est donc fondamental de n’utiliser ce système que pour des bandes passantes restreintes afin que les lobes parasites plus hauts en fréquence ne viennent pas perturber la sommation avec le système principal.
B. Mesures en « laboratoire » (hangar) et vérification des simulations

1. Méthode

1.1 Conception et fabrication d’un subwoofer adapté à l’étude des réseaux de subs

Les fabricants cherchant à se différencier les uns des autres, et ayant pour objectif d’obtenir des subs reproduisant un maximum de niveau sonore, utilisent dans la majorité des cas des configurations en « Bass reflex », afin de maximiser le niveau de pression au regard du débattement du haut-parleur. La contrainte d’une fréquence d’accord suffisamment basse pour un système Bass reflex engendre des volumes de charge¹¹ très importants. Il n’y a donc pas de subwoofer capable de générer de l’infrabasse dans des petites dimensions. En effet, la seule technologie standard qui le permette consiste à placer le haut-parleur dans un caisson clos. En effet, accorder l’évent en très basse fréquence est impossible à réaliser dans un petit volume. Le clos n’étant pas adapté à reproduire de forts niveaux sonores nécessaires pour la sonorisation, on ne trouve pas de sub très compact capable de descendre en fréquence.

Nos besoins étaient très largement différents des considérations standards : la puissance n’a pas besoin d’être importante pour effectuer les mesures, mais il était fondamental de se rapprocher d’un modèle théorique omnidirectionnel. Ceci nécessite que les dimensions physiques des subs utilisés soient les plus petites possibles afin de limiter les effets des parois.

De plus, le fait d’utiliser des modèles clos permet après égalisation de la courbe de descendre aussi bas en fréquence que nécessaire tant que le débattement limite du haut-parleur n’est pas atteint.

Nous avons donc décidé de construire les subs les plus compacts possibles, et restant omnidirectionnels jusqu’à plus de 100 Hz. Nous avons également utilisé des 38 cm à fort débattement capables de générer un spectre plat jusqu’à 20 Hz. Le modèle de HP utilisé a été conçu pour fabriquer des caissons de basse de Home Cinéma, par nature beaucoup plus compacts qu’un sub dédié à la sonorisation de forte puissance. Nous avons donc respecté les préconisations du fabricant pour la définition du volume de charge le plus adapté.

1.2 Procédure

i. Taille de la salle de mesure

Les mesures ont été effectuées dans le Hangar de menuiserie dans lequel les subs ont été fabriqués.

Dimensions de la pièce : 26m (longueur) * 15m (largeur) * 6.5m (hauteur)

ii. Procédure de mesure en lien avec les problématiques de mesure BF

1) Signal de test

Un signal de bruit rose était joué dans les subs pour la mesure des configurations car il permet le moyennage dans l’espace. Pour la mesure de la courbe de réponse du HP, nous avons utilisé un sweep.

Afin d’estimer auditivement la qualité perçue nous utilisions un « kick » filtré à 100 Hz.

Nous nous sommes également assurés d’avoir un rapport signal sur bruit de 40 dB minimum afin d’assurer la précision et la fiabilité de la mesure.

2) Paramétrage de l’analyseur

Nous avons utilisé le logiciel Spectralab pour analyser les résultats.

Taille de la FFT : 524288 samples équivalent à une résolution fréquentielle de 0.084 Hz pour la fréquence d’échantillonnage de 44100 Hz

Fenêtre de Pondération : Hamming car elle est considérée comme l’une des plus générales.

Affichage : En fonction des besoins nous avons sélectionné la bande fine pour caractériser les phénomènes acoustiques complexes, et le tiers d’octave pour des valeurs plus quantitatives. En bande fine, la résolution d’affichage était au 1/48eme d’octave.

Averaging : infinite (moyennage sur toute la durée de la mesure)

3) Système de prise de son

a. Calibration de la mesure
- Compensation de la courbe de réponse du microphone
Nous avons utilisé un microphone de référence MBC550 préalablement étalonné par le LNE (Laboratoire National d’Essai) pour calibrer mon microphone de mesure (Superlux ECM 999).

Nous avons mesuré la courbe de réponse des deux micros et nous avons appliqué dans le logiciel la compensation fréquentielle permettant que le microphone économique affiche la même courbe de réponse que le microphone de référence.
- Calibration des niveaux
À l’aide d’un calibrateur 01dB générant 94 dB SPL à 1 kHz, nous avons étalonné le logiciel de mesure afin qu’il nous affiche des niveaux cohérents avec la réalité physique. Cette étape, même si elle peut paraître superflue, est fondamentale pour analyser a posteriori les mesures et notamment dans l’estimation des perturbations liées au bruit parasite.

b. Position du microphone

Dans la zone des basses fréquences, la position du microphone est déterminante sur le résultat (par exemple si l’on se trouve dans un nœud de vibration) comme vu précédemment dans la partie revue de littérature B§2.3. Afin que les mesures soient reproductibles sans d’importants moyens tels que le multi micro, nous avons choisi la méthode de moyennage spatial. Nous avons déplacé en continu le microphone de mesure autour de sa position pendant 2 minutes, en horizontal et en vertical sur une envergure de 2/3 m. Cela était plus représentatif de ce qu’il était possible d’obtenir à partir du matériel de mesure standard.

c. Distance de mesure

Le point de repère est toujours le centre acoustique de la configuration testée.

À l’intérieur de la salle de mesure

Il était nécessaire de faire un compromis entre les 3 paramètres suivants :
- La taille du système mesuré (certaines configurations de subs peuvent s’étaler sur une dizaine de mètres) : le micro ne doit pas être trop près car l’effet de proximité des subs les plus proches fausseraient la mesure.
- La distance critique : pour avoir des mesures facilement analysables il faut placer le micro de telle sorte qu’il ne soit pas dans la zone du champ réverbéré.
- Taille de la pièce
Afin d’évaluer la distance de mesure rappelons le programme Matlab conçu dans la partie précédente, calculant la variation de l’erreur de mesure en fonction de la distance du micro pour la configuration cardioïde. La distance entre les subs est fixée à 1.7 m.

On observe que l’on a 3 dB d’erreur en se plaçant à 4 m du centre de la configuration testée. Dans un premier temps, nous avons effectué les mesures à 4 m pour voir l’impact en proximité dans une zone potentielle d’écoute. Puis, nous avons mesuré à 12 m de distance, contre le mur afin de visualiser le gain à espérer vis-à-vis des problèmes de voisinage.

A l’extérieur :

Les zones de voisinage immédiates adjacentes au Hangar ne nous ont pas permis de placer le micro à une distance très éloignée du système pour observer l’impact sur un voisinage lointain. Bien qu’étant en extérieur, nous n’étions pas en champ libre. Ainsi, les murs des habitations adjacentes ont également influencé la mesure. Ceci était très intéressant car cela permettait d’observer une situation réelle (il est rare d’être en champ libre) et de mettre en évidence les difficultés de mesure. Pour éviter l’impact des sources images, nous nous sommes placés en proximité immédiate des murs de l’atelier. Ainsi, la source image n’engendre plus de filtrage en peigne et n’engendre qu’une modification du niveau sonore, sans modifier la directivité ou la réponse en fréquence dans la gamme étudiée. Par ailleurs la courbe affichée précédemment est théorique. En pratique nous allons voir dans cette partie l’influence des murs et de la salle sur la distance de mesure.

4) Utilisation des symétries

Nous avons vérifié le caractère omnidirectionnel de nos subwoofers. Après avoir validé l’absence de directivité jusqu’à 100 Hz, le retournement des HPs pour la mesure à l’arrière n’était plus nécessaire. En effet, la courbe de directivité entre l’avant et l’arrière variait de moins de 1 dB.
Par ailleurs, pour des raisons de rapidité et surtout pour pouvoir évaluer l’impact du réglage pur à configuration identique, les mesures avant/arrière ont été effectuées en intervertissant les retards c’est-à-dire en tournant logiciellement le système de 180°.

iii. Procédure de simulation des configurations

1) Vérification du caractère omni des subs fabriqués pour ces mesures
- Courbe de réponse
  Il s’agit dans un premier temps de mesurer la courbe de réponse des subs fabriqués dans l’atelier. En effet, nous devons avoir le comportement en fréquence le plus plat possible, pour que nos simulations ne s’appliquent pas au cas particulier de nos subs mais puissent être étendues à d’autres dispositifs. Cela était possible grâce au fait qu’il n’était pas en Bass Reflex. Il avait donc un seul centre d’émission. Pour ce faire, nous avons égalisé la courbe mesurée grâce à l’égaliseur du processeur DCX2496.
- Vérification du caractère omnidirectionnel
  Du fait de sa propre taille, un sub n’est pas omnidirectionnel pour toutes les fréquences. Or, les subs conçus pour cette expérience ont justement été construits de très petit format de façon à ce qu’ils aient un minimum de directivité due à la diffraction et donc qu’ils soient nativement le plus constant possible. Afin de ne pas mesurer les réflexions nous avons décidé de mesurer la réponse en fréquence du HP à 1m50, en face, à 90° et à l’arrière. Nous nous sommes placés à l’extérieur du Hangar de façon à s’affranchir au maximum des réflexions sur les murs.
  NB : Il est important de noter que le rapport signal sur bruit est très difficile à avoir dans l’infra grave. Ceci justifie de nouveau la construction de subs dont les HP ont un débattement important, ce qui permet d’augmenter le niveau du signal généré.
2) Fréquence de réjection

Dans la plupart des configurations, nous avons choisi comme fréquence de réjection la fréquence de 50Hz, autrement dit, on « accorde » les subs à 50 Hz. En effet, c’est à cette fréquence que l’on envoie le plus d’énergie dans le sub (fréquence centrale) et donc, il est important de centrer la réjection sur cette fréquence.

3) Focalisation Cardioïde

Il est impossible de tester l’ensemble des configurations pour des raisons pratiques évidentes. Après avoir simulé dans la partie précédente les configurations essentielles pour la maîtrise de la directivité, nous nous sommes concentrés pour cette partie en laboratoire sur le cardio natif, non natif principalement et de façon moins détaillée sur l’End Fire et la Ligne.
- Cardio natif
Il s’agit d’espacer les subs d’un quart de la longueur d’onde à 50Hz (1.7m) puis de retarder le sub avant de cette distance (1.7/340) de façon à ce que l’onde se propageant à partir du sub avant annule le sub arrière en arrivant avec un décalage de la demi-longueur d’onde à 50Hz.

Cette configuration est testée en extérieur et en intérieur. Puis, nous avons effectué une moyenne des valeurs de réjection obtenues sur plusieurs configurations.
- Cardio non natif
Les configurations testées sont :
– Distance intersub = 1m70, Frejection = 40 Hz
– 2 configurations cardioïdes pour des subs espacés de 70 cm, Fréjection = 50 Hz (HP1 HP2 puis HP2 et HP3)

Nous avons utilisé une méthode empirique de calage du cardioïde non natif par l’optimisation de la réjection en faisant varier le retard manuellement.

On raisonne directement sur l’annulation en réjection. On fait jouer les deux subs sans retard et sans phase. On regarde le spectrogramme. Le retard atteint la bonne valeur lorsque l’on obtient la meilleure annulation sur la bande 40 – 63 Hz. Il est important lors d’un réglage de ce style de connaître les ordres de grandeur des retards que l’on doit trouver afin d’éviter de procéder à un calage sur un multiple de 2pi.

Dans un premier temps, on conserve la distance intersub de 1m70 et l’on essaie d’accorder le cardio à une autre fréquence. Dans un deuxième temps on modifie la distance intersub et on essaie de garder la fréquence d’accord à 50 Hz.
- End Fire
  On espace 6 subs de 50 cm, puis 70 cm et 1 m.
Exemple pour 50 cm :

On réajuste les retards à chaque fois que l’on modifie la distance entre les subs
- Ligne
6 subs collés (longueur totale de 2m50), puis 5m10, puis 7m30.

On compare les mesures dans un second temps avec un « stack¹² » de 6 subs omnis pour avoir une référence de niveaux. Pour une configuration ligne, les mesures sont toujours trop près des hauts parleurs aux vues des longueurs des lignes. On se place sur la porte ou sur le mur car c’est ce qui arrive chez les voisins.

1.3 Analyse des résultats

Pour plus de lisibilité de certains résultats, nous avons développé un programme Matlab d’affichage des analyses spectrales issues de Spectralab, en bande fine et en tiers d’octave. Pour le tiers d’octave, les données étant exportées en bande fine, nous avons réalisé la somme énergétique des valeurs mesurées par bande fine.

2. Résultats

Nous rappelons que les interprétations détaillées des résultats sont dans la partie discussion III. C§3

2.1 Mesure de la courbe de réponse du sub

i. Mesure

Avant de mesurer la courbe de réponse, nous avons mesuré le niveau bruit de fond et de bruit électrique. En moyenne le signal est 60 dB au-dessus du bruit de fond. De plus, à 2 kHz, on remarque que c’est le bruit de fond électrique qui domine. Nous avons donc augmenté le gain d’entrée du signal pour que le bruit de fond natif de la carte soit plus faible.

Figure 36 : Courbe de réponse du sub (verte) et mesure des bruits électriques (jaune) et du bruit de fond (rouge)

ii. Egalisation

On égalise les subwoofers grâce au DCX de façon à avoir une courbe de réponse plate. Les valeurs nécessaires afin de rendre la courbe de réponse la plus plate possible ont été les suivantes à titre indicatif :

L’objectif étant d’avoir une courbe plate de 20 à 200 Hz, le plus efficace a été de traiter la bosse à 68 Hz correspondant à la fréquence d’accord du caisson, en la corrigeant avec un facteur de Q large sur l’égaliseur.

Figure 37 : Egalisation de la courbe de réponse (jaune) et superposition sur la courbe de réponse native (verte)

Adaptation de la courbe théorique afin d’en permettre l’écoute.

Afin que les écoutes subjectives soient cohérentes avec la bande passante utilisée en standard, nous avons limité par une bande passante à 20 Hz et à 100 Hz. Le filtre à 20 Hz permettait d’éviter de casser les haut-parleurs en lui faisant prendre du débattement excessif, et le filtre à 100 Hz permettait de focaliser notre écoute sur les zones de fréquence recherchées.

Figure 38 : insertion des filtres coupe-bas et coupe-haut.

Jusqu’où le sub est-t-il omnidirectionnel ?

Pour notre étude, nous avons voulu vérifier que notre sub est bien omni jusqu’à 100 Hz pour que les conclusions de nos expérimentations soient les plus générales possibles.
Après l’égalisation et le filtrage, nous avons vérifié que la valeur du bruit de fond n’avait pas d’impact sur les mesures. À titre d’information, le rapport signal sur bruit (SNR) était supérieur à 40 dB.

Lors de la manipulation, on remarque que lorsque l’on tourne l’enceinte pour effectuer la mesure à 90°, le niveau des très basses fréquences a diminué alors que 20 Hz est sensé être parfaitement omnidirectionnel. En réalité, le centre acoustique n’étant plus au niveau de la membrane du HP comme ce que l’on pourrait penser intuitivement, il est courant de mal l’estimer dans la mesure de directivité.

Figure 39: erreur de mesure due au défaut d’estimation de la position du centre acoustique.
Mesure en face du HP (violet) et sur le côté à 90° (jaune)

Il est très difficile de déterminer précisément la position du centre acoustique d’un sub. La méthode que nous avons suivie fut donc de déplacer le sub jusqu’à obtenir les mêmes niveaux de fréquences infrabasses puisque constructivement parlant, un sub est forcément omni à ces fréquences. Après décalage de quelques cm du sub nous avons pu vérifier le caractère omni du sub jusqu’à 100 Hz. On observe quelques bosses et creux par rapport aux mesures précédemment effectuées en proximité. Ceux-ci sont dus aux réflexions des murs extérieurs au hangar.

2.2 Focalisation sur la configuration cardioïde

i. Mesure du cardioïde natif
1. Cardio en extérieur
Mesure à 4 m de distance :

Figure 40 : courbes de réponse avant (vert) et arrière (bleu) du cardio natif en intérieur

Le résultat en bande fine, exporté sous Matlab donne 9 dB de réjection à 50 Hz. On remarque également que la mesure devient très sensible aux réflexions des ondes sonores contre le mur qui créent des interférences et des annulations dans la courbe de réponse.

On affiche ensuite le résultat en tiers d’octave afin de pouvoir donner une valeur moyenne de la réjection autour de 50 Hz et de rendre le résultat plus lisible.

On observe que la réjection au tiers d’octave à 50 Hz est très faible : en moyenne 8 dB. C’est un exemple de difficulté de mesure. On ne place pas le micro suffisamment loin pour observer une réjection importante.

Mesure à 12 m de distance :

On observe une réjection nettement plus importante, de 19 dB à 50 Hz. Le cardio se mesure donc en champ lointain.

L’analyse en tiers donne en moyenne 12.5 dB de réjection sur le tiers d’octave à 50 Hz.

La réjection obtenue est de 12 dB. On observe que le cardio se met en place sur une plus grande distance que la distance théorique. Également, la présence des murs adjacents et des immeubles aux alentours créée un champ réverbéré qui diminue l’efficacité de la réjection.
1. Cardio en intérieur
  a. Ça ne marche pas…
On raisonne par l’absurde en créant volontairement une configuration mettant en évidence les problématiques de placement des sources sonores dans une salle.
Positionnement problématique d’une configuration cardioïde dans la salle.

Figure 41 : configuration cardioïde native sans réjection car positionnée en proximité du mur. Courbe avant (rouge), arrière (violet)

Les subs sont en configuration cardioïde standard pour 50 Hz. On les place proches d’un mur de façon à créer des sources images qui vont engendrer des modifications de la directivité (filtrage en peigne…) et de mettre en évidence la nécessité de positionner correctement les sources dans la salle. On remarque en effet, une absence de différence de niveau entre l’avant et l’arrière. Il y a bien une annulation mais valable à la fois pour l’avant et pour l’arrière, alors que nous devrions observer une réjection. Le cardio ne fonctionne pas, et ce précisément à cause de la salle. Ceci souligne la difficulté de positionnement d’un système et la nécessité de mesurer l’installation.

b. Mesure à 4 m, au centre de la pièce

Figure 42 : avant (rouge)/arrière (blanc) et côté 90° (jaune)

Lorsque le micro est positionné à l’arrière du système cardioïde, à 4 m, on mesure 15 dB de différence par rapport au niveau situé à l’avant à 50 Hz. On s’aperçoit donc que la configuration cardioïde est efficace en réjection arrière mais que son fonctionnement est limité : la mesure sur le côté à 90° ne montre que 1.5 dB d’atténuation par rapport à la mesure frontale. En termes de voisinage, cette configuration ne marche pas sur les côtés. La simulation sous Soundvision montre au contraire que sur les côtés le signal est 3 dB moins fort. La salle, et les réflexions contre les murs augmentent le niveau mesuré et l’on n’obtient pas 3 dB. Cette configuration ne fonctionne donc pas si la zone à protéger est uniquement à l’arrière.

Par ailleurs, nous avons vu dans la partie précédente que le cardio devait se mesurer en champ lointain. Ici, on obtient une forte valeur de réjection de 15 dB en champ assez proche (4 m) par rapport à la mesure en extérieur à la même distance (4 m). Cette valeur de réjection est proche de la valeur théorique.

Ceci est une illustration des sensibilités de positionnement des sources dans un lieu donné. En effet, la salle permet, pour ces positionnements de HP et pour cette configuration une réjection de 15 dB à 50 Hz cohérente avec la théorie, alors que la valeur en extérieur sensée être moins soumise aux réflexions donne une valeur inférieure.

Mettre en place une configuration cardioïde s’essaie, s’ajuste et se mesure, mais n’est ni prévisible ni mesurable de façon simple. Il existe malgré tout une part d’aléatoire due à la complexité globale du phénomène.

c. Mesure à 12 m, contre le mur

Cette mesure a été effectuée pour la configuration cardioïde à une autre position. On mesure en moyenne spatiale à 12 m.

Figure 43 : subs cardioïdes avant (vert)/arrière (bleu)

Figure 44 : tiers d’octave

La réjection est de 8 dB à 50 Hz alors que nous avions 15 dB à 4 m pour la position précédente. Cette différence de résultat est normale et s’explique assez facilement car la prise de mesure a été effectuée contre le mur. L’impact des résonances du local devient donc fondamental, ce qui atténue l’efficacité de la réjection.

Moyennage du résultat pour plusieurs sources

Le positionnement de la source impactant de façon non négligeable les valeurs de réjection obtenues, nous avons effectué la mesure à 12 m en multipliant le nombre de positions en configuration cardioïde pour obtenir un indice statistique permettant de mettre en avant la robustesse liée à la position dans l’espace. (6 subs espacés de 1,70 m et mesurés 2 par deux).

(Les subs sont orientés vers le haut de façon à trouver le centre acoustique plus facilement)

Nous calculons sous Matlab une valeur moyenne de la réjection et pouvons donner un ordre de grandeur valide pour cette pièce.

Figure 45 : comparaison avant/arrière de cardio à différentes positions

Moyenne des 4 mesures à 50 Hz : 8.3 dB de réjection

Écart type des 4 mesures à 50 Hz : 2.3 dB

En moyenne, on crée bien un cardio dont la réjection est de 8.3 dB à 50 Hz bien que le local soit très résonnant.

ii. Configuration cardioïde pour un écartement différent du quart de la longueur d’onde

Dans un premier temps, on conserve la distance intersub de 1m70 et l’on essaie d’accorder le cardio à une autre fréquence (40 Hz). Dans un deuxième temps, on conserve cette fois ci la fréquence d’accord à 50 Hz, et on modifie la distance intersub.
1. Cardioïde d=1m70 Frejection = 40 Hz
Pour accorder les deux subs à 40 Hz, nous avons validé par la méthode empirique que l’on retrouvait bien le calcul théorique du retard numérique.

On ajoute à la configuration précédente (1m70 de retard entre les subs) des retards par pas de 50 cm jusqu’à 3 m.

On observe en bande fine pour plus de précision sur la réjection

On observe que l’on ne parvient pas à produire la même réjection à 40 Hz qu’à 50 Hz. L’annulation se décale bien en fréquence au fur et à mesure que l’on ajoute les retards, mais on n’arrive pas à atteindre 40 Hz avec une réjection propre. On s’aperçoit donc qu’en pratique il existe une limite au changement de la fréquence de réjection pour une distance fixe. Dans cet exemple précis, au-delà d’un retard de 3 m, l’effet cardioïde n’était plus visible.
1. 2 configurations cardioïdes pour des subs espacés de 70 cm, Faccord = 50 Hz (HP1 HP2 puis HP2 et HP3)
La fréquence centrale est conservée, mais la distance entre les subs est de 70 cm. On fait varier le retard progressivement pour accorder le cardio à 50 Hz.

Dans le cas précédent l’écart était de 1,70 m, et nous n’arrivions pas à établir la réjection en faisant varier le retard. En revanche, cette configuration où l’écart entre les subs est réduit (70 cm) nous laisse penser que le fait de diminuer la distance entre les subs facilite la mise en place de la réjection. Plus les HP sont proches plus leurs courbes de réponse ont des comportements modaux similaires et plus il est facile de mettre en œuvre un cardio.

2.3 End Fire

i. End Fire 6 boîtes espacées de 50 cm On place les 6 HP espacés de 50cm de membrane à membrane.

Figure 46 Analyse en bande fine End Fire 6 boîtes avant (rouge) arrière (vert)

On observe bien que la réjection n’est plus accordée à une seule fréquence mais que la réjection est très large bande. On observe en moyenne 10 dB de réjection sur l’ensemble du spectre.

Dans ce cas, il est aussi visible que la multiplication du nombre de sources a diminué le comportement modal de la réponse à l’avant. Cependant, on observe encore quelques accidents.

À l’écoute, l’effet de réjection ne fonctionne pas bien sur les côtés. A l’avant, nous nous sommes rendu compte de la difficulté d’évaluer le niveau de gravité du fait du phénomène de masquage sonore par les hautes fréquences. En revanche, à l’arrière, comme l’annulation est pleine bande mais moins forte, l’oreille a en moyenne plus de sensation sonore d’annulation.

ii. End Fire 6 boîtes espacées de 70 cm

Figure 47 : End Fire 70cm avant-arrière (violet/vert) en 1/3 octave

On a en 8 dB en moyenne de réjection sur le haut du spectre (jusqu’à 200 Hz) Comparaison des courbes 50 cm et 70 cm:

Figure 48 : 50cm avant/arrière (violet/vert) 70cm avant/arrière (blanc/rouge), bruit de fond (jaune)

PS : Par rapport aux comportements très modaux observés pour les configurations cardioïdes simples, l’End Fire à 70 cm a homogénéisé le tiers d’octave 63 Hz en multipliant le nombre de sources.

iii. End Fire 6 boites espacées de 1 m

Figure 49 : End Fire 1m avant et arrière (jaune/vert)

A l’oreille, on remarque que la réjection sur les côtés (90°) est meilleure mais que le comportement devient modal. La réjection devient plus efficace dans le bas du spectre que dans le haut. 12 dB dans la zone 40/50 Hz.

Pour résumer, plus l’End Fire est long, plus la directivité augmente sur le côté. Plus le nombre de HP est important, meilleur est le comportement en haute fréquence à l’avant. Cependant, au-delà d’un écartement de 70 cm, le haut grave redevient perturbé. En pratique, en fonction des situations, on cherche à faire un compromis entre le haut et le bas de spectre. Généralement, on met un espacement de 70 cm.

2.4 Ligne de 6 subs collés sur 2m50

Figure 50 : ligne de 6subs de 2m50 de long avant / côtés (violet/vert)
- Beaucoup de réjection au niveau des fréquences aiguës (attention l’export est sur une échelle plus large)
II. Validation pratique sur un concert de grande ampleur anticipé

Lors du festival « Jazz à la Villette » (31/08/2017), il s’agissait de mettre en application, sur un exemple pratique de grande ampleur, la méthodologie de mesure dans les basses fréquences au service de l’optimisation du système de diffusion vis-à-vis du voisinage.

A. Méthode

La méthode suit les étapes du tableau de synthèse en annexe.

1) Identification des «voies de propagation» (fuites acoustiques)

Une cartographie de la Grande Halle de la Villette a été effectuée ces dernières années et a montré que la toiture présente des fuites acoustiques au niveau du raccord avec les « chiens assis ». Ainsi, la première optimisation a été de modifier le rayonnement du Line Array, naturellement omni en basse fréquence, en rajoutant une ligne de caissons de basse afin de le rendre cardioïde. L’optimisation consiste donc à orienter la réjection vers le plafond, de façon à exciter cette zone le moins possible.

2) Validation des choix d’optimisation du système de diffusion par la simulation.

Une configuration a donc été étudiée pour limiter l’impact du festival sur le voisinage et donc maximiser l’isolement apparent (différence intérieur de la salle / extérieur de la salle). Nous avons simulé les configurations à l’aide du logiciel Soundvision. En effet, le matériel utilisé étant spécifique à L-Acoustics, le choix de ce logiciel était plus adapté.

3) Définition de la zone de mesure des nuisances sonores

Il faut placer le système de mesure au plus près des zones de voisinage les plus concernées par les nuisances. La cité A est située à environ 200 m de la Grande Halle, et à 90° du système de diffusion. Cet emplacement géographique correspond bien à la zone la plus impactée par le système de diffusion de la salle de concert. Les chiens assis sont aussi orientés vers cette zone.

4) Utilisation d’un dispositif de mesure conforme aux méthodes de mesure dans les basses fréquences chez les voisins.

Nous avons utilisé le système de mesure déjà mis en place par la Grande Halle à la cité A. Il s’agit d’un système multi micros permettant de mesurer les basses fréquences de façon représentative (voir détails ci-dessous)

5) Mise en place d’afficheurs de niveaux et d’un réseau de communication

Nous avons installé un réseau de communication entre la zone de mesure des émergences et la salle où se déroulait le festival, pour avoir en temps réel et simultanément, l’affichage des niveaux en salle et chez les riverains.

Puis, nous avons installé dans la salle de concert, ainsi qu’à la cité A des afficheurs de niveaux par bande.

6) Optimisation de chaque sous-groupe d’éléments de diffusion

Par la mesure, et via le réseau de communication et les afficheurs installés à l’étape 5, nous avons pu mesurer l’impact de chaque élément de diffusion par un aller et retour en temps réel

entre les émergences sur les riverains, et les réglages en salle. Il s’agissait d’optimiser l’isolement apparent pour limiter l’impact des émergences chez les voisins.

7) Mesures et interaction entre le sonorisateur et l’acousticien pendant le concert

Nous avons utilisé un analyseur en bande fine à la cité A en plus du dispositif de mesure, de façon à avoir des informations précises sur les fréquences émergentes dans le voisinage. Ceci nous a permis, pendant le concert, de donner en temps réel à l’ingénieur du son des informations précises sur les fréquences problématiques.
N’ayant pas participé aux étapes 1 et 3 du processus méthodologique, nous détaillerons les résultats des parties 2, 4, 5, 6 et 7. Voici les résultats.

B. Résultats

i. Validation des choix d’optimisation du système de diffusion par la simulation

Les optimisations envisagées par le festival ont été les suivantes :

1) Limiter l’envoi de son sur les zones présentant l’isolement le plus faible.

La tête de la façade était formée par l’ensemble cardioïde K1 Sub et VDOSC¹³ (Line Array).

Figure 51 : simulation Soundvision 40-63Hz VDOSC seul et VDOSC + K1 sub

La simulation sous Soundvision confirme l’efficacité de la réjection sur le plafond.

2) Limiter l’envoi de son à 90° du système dans la direction des zones de voisinage à protéger.

Le choix de la configuration en ligne a été privilégié pour rejeter à 90°. En effet, si la longueur de la ligne fait une longueur d’onde à 50 Hz, il y aura une annulation sur les côtés à cette fréquence. (cf. partie I). Cependant dans les fréquences haut grave, la ligne devient très directive et engendre un point de focalisation qui porte sur de très longues distances.

Figure 52 : Soundvision ligne de subs entre 80 Hz et 100 Hz sur une échelle de 500 m

Par conséquent, il a été décidé de modifier la structure de la ligne en créant une forme de V sur les côtés et d’éviter le peigne de directivité. L’objectif est d’avoir un point focal au niveau du mixeur plutôt qu’en champ lointain.

Figure 53 : forme de V pour les SB28 sur les côtés

Pour mieux illustrer l’efficacité en termes de réjection à 90°, nous avons simulé sous Soundvision sur une échelle de 500 m l’impact des subs au sol pour un niveau usuel de 108 dBC à la console. Et nous avons ensuite comparé cette simulation à l’impact qu’aurait un line Array de SB28 suspendu afin de se rendre compte de l’efficacité du système directif.

Figure 54 : comparaison entre SB28/KS28 au sol et SB28 accrochés (dessous) sur une échelle de 500m

ii. Installation du dispositif de mesure

Détails de l’installation

Mesures à 200 m :

Comme vu dans la première partie, il faut multiplier le nombre de points de mesure en basse fréquence. L’installation comporte 8 microphones de mesure calibrés (MBC550) et répartis sur une longue distance en extérieur. La multiplication de nombre de sondes permet ainsi de s’affranchir des lobes de directivités crées par le système et la structure de la grande halle, et des interactions des ondes sonores avec l’environnement proche.

Les 8 microphones sont ensuite récupérés dans une carte son reliée à un ordinateur comportant un analyseur développé par David Rousseau. Celui-ci effectue la moyenne énergétique des 8 micros par tiers d’octave en appliquant des filtres passe bande à 48 dB par octave. L’analyseur affiche les résultats en tiers d’octave. Il effectue également une recherche de cohérence entre les microphones. Si l’un des microphones est perturbé (personne qui passe à côté en parlant) son signal n’est pas pris en compte dans la moyenne pour ne pas la fausser.

iii. Installation d’un réseau de communication

La surveillance des niveaux sonores ne peut se faire sans mettre au point un réseau de communication. En effet, il faut pouvoir connaître ce qui se passe au même moment en salle et au point d’observation à 200m. La connaissance de ces deux informations permet alors de mesurer l’impact d’un réglage ou d’une modification du niveau en salle sur les émergences observées dans le voisinage. Nous avons donc crée un réseau de communication permettant de connaître en temps réel ce qui se passait à la cité A et dans la salle.

Pour ce faire, le routeur à la cité A transmet les analyses de l’afficheur via le réseau en fibre jusqu’à la salle de concert « Nef Nord » de la Villette. Nous avons installé un pont wifi avec un émetteur et récepteur 5GHz de façon à pouvoir établir un réseau de communication accessible jusqu’à la console. Lors des concerts, la présence du public peut affecter la transmission des ondes wifi. Par conséquent, le pont en 5GHz permet de créer une liaison sans fil très directive et garantir sa robustesse à toute heure car l’émetteur et les récepteurs sont placés en hauteur sur des zones sans public. Nous avons disposé à la console un premier ordinateur qui relayait les mesures effectuées à la cité A en tiers d’octave. On installe également à l’intérieur de la salle, devant la console, un système de mesure relié à un deuxième ordinateur pour l’affichage des niveaux par bande d’octave (conformément à la règlementation, l’octave est choisie comme référence). Ce deuxième ordinateur est lui même relié au réseau « son ». Ainsi, les deux afficheurs de niveaux sont accessibles dans les 2 lieux (cité A et salle de concert) à tout instant.

iv. Calage système et mesures de l’impact sur le voisinage

Sans alignement temporel, toutes les optimisations pensées lors du choix de design du système de sonorisation peuvent ne pas fonctionner. En effet, les enceintes peuvent s’annuler au point d’écoute et créer une directivité catastrophique. (Ex : rayonnement de façon erratique dans toutes les directions du fait d’un mauvais alignement entre les deux lignes de subs qui s’opposent au lieu de s’additionner).

Nous avons eu la chance d’assister au calage système pendant lequel j’ai pu utiliser notre dispositif de mesure pour évaluer l’impact des réglages sur les émergences sonores à 200 m.
Nous ne détaillons pas ici les réglages du calage système mais nous vérifions, pour chaque élément l’impact sur le voisinage grâce aux micros positionnés à la cité A.

Ensemble cardioïde K1 Sub et VDOSC :
- Impact sur le voisinage
Le calage du cardioïde a été effectué pour que la sommation à l’avant soit la plus optimale possible (6 dB) et que la réjection soit orientée à l’arrière sur le plafond.

Il a également été nécessaire d’égaliser le K1 sub à 35 Hz et 70 Hz, fréquences qui résonnaient avec le plafond.

Une fois le calage effectué nous avons vérifié l’influence de l’ajout des K1 subs par rapport au VDOSC seul sur le voisinage aux bandes de fréquence 40 Hz, 50 Hz et 63 Hz.

NR : équivalent perçu en très basse fréquence

À partir de 16h42, on coupe les K1 subs et on n’observe pas de différence de niveau majeure.

Sur la durée de la mesure, la moyenne énergétique donne 63 dB à 50 Hz avant et après la coupure des K1 Subs.

Le couplage VDOSC et K1SUB permet donc une somme de 6 dB en salle dirigé sur le public et n’envoie pas plus d’énergie chez les voisins en relatif au VDOSC seul. Nous avons environ 64 dB au tiers d’octave 50 Hz.
- Homogénéité de la répartition sonore dans la salle
Le calage étant effectué au point FOH¹⁴, nous avons donc vérifié que ce réglage ne fonctionnait pas qu’en un seul point. À l’aide de bruit rose, nous avons mesuré en moyenne spatiale la courbe de réponse de l’ensemble VDosc + K1 sub sur l’ensemble de la surface. Le résultat en bande fine exporté depuis Spectralab sous Matlab donne :

On remarque qu’il n’y a pas d’accident majeur sur la courbe de réponse et que la sommation est effective sur l’ensemble de la surface. Par ailleurs, l’ajout des K1 Sub a permis d’aplatir la courbe de réponse à 50 Hz, ce qui donne une sensation de graves plus profonde.

Influence de la ligne de subs au sol :
- Impact respectif de la tête et des subs
¹⁵

Pour toutes les fréquences l’isolement apparent est moins bon pour les têtes. On a 4 dB de plus chez les voisins avec les têtes qu’avec les subs au sol. C’est donc la tête dans son ensemble qui crée le plus de nuisance sonore par rapport à la ligne de subs.

Le caractère écrêté de la réponse des têtes seules s’explique car le plafond est plus excité. Par conséquent il apparait plus de résonances pour les têtes que pour les subs au sol.
- Impact des KS28 sur la ligne de subs SB28
L’adjonction des KS28 ne modifie pas les émergences en relatif à ce qui est déjà produit par le SB28. La réjection sur le côté de la ligne est donc très efficace. L’agrandissement de la ligne au sol permet bien d’obtenir plus de pressions sur le public sans augmenter la gêne sur le voisinage.

v. Mesures pendant le concert

À l’aide d’une carte son et d’un ordinateur autonome en énergie, nous avons réalisé un spectrogramme mobile. Celui-ci nous a permis d’afficher en bande fine et en temps réel l’évolution des niveaux sonores sur plusieurs zones de voisinage autour de la Villette.

Observations

Quelques émergences à 87 Hz sont apparues pour plusieurs groupes. Il s’agissait donc d’une émergence du système de diffusion et non propre au mixage. Le dialogue par téléphone avec l’ingénieur système tout au long du concert a permis de demander des rectifications au niveau des fréquences qui émergeaient le plus en extérieur.

Figure 56 : 22H54 De la Soul – 87Hz

Nous avons récupéré les enregistrements de l’évolution temporelle des niveaux sonores après le concert.

On observe que l’optimisation du système a permis de respecter pour toutes les bandes sensibles (40 Hz, 50 Hz, 63 Hz) le seuil de 65 dB fixé préalablement comme objectif.

Résultats principaux
- Optimiser le système en concentrant l’énergie sur le public et limitant l’impact sur le voisinage est souvent issu d’un compromis. Dans notre cas pratique, les éléments du système de diffusion qui émergent le plus sont le grave des têtes. Le calleur système, en coopération avec l’ingénieur système ont donc essayé de limiter le plus possible l’usage du grave des têtes pour le répartir plus sur les subs. Or, très vite, si l’on diminue de façon trop importante la quantité de grave dans les têtes, la diffusion devient très focalisée (l’aigu est très localisé sur les têtes et le grave tout en bas au sol). Il a donc fallu faire un compromis entre efficacité et qualité.
- S’il faut parfois faire un compromis, l’optimisation du système pour le voisinage permet dans d’autres cas d’augmenter significativement la qualité du son pour le public. Pour ce cas particulier, la création d’un cardio au niveau des têtes de diffusion permet de gagner 6 dB sur le public, d’obtenir un grave plus rond (courbe de réponse qui redevient presque plate) sans modifier le niveau d’émergence à l’extérieur. De même l’ensemble KS28 et SB28 rajoute 6 dB sur le public sans rajouter d’émergence.
- C’est avant tout le dialogue avec le sonorisateur qui permet d’arriver au meilleur des compromis. Le contrôle des niveaux sonores est souvent perçu comme contraignant et bridant. Lorsqu’un dialogue constructif est mis en place avec l’acousticien, tout le monde peut trouver un compromis avantageux pour le public et les voisins en même temps. Dans notre cas pratique c’est grâce à l’étude sur les émergences que le sonorisateur peut gagner 6 dB sur le public sans craindre d’augmenter les nuisances sonores. Il est donc important d’arriver en amont des balances de façon à pouvoir optimiser la répartition des subs et le calage système. Puis, pendant le concert, la mise en place d’un réseau de communication Wifi permettent au sonorisateur de connaitre en temps réel les bandes de fréquences concernées par les émergences. De même pour l’acousticien qui a également accès aux informations de la salle et de l’extérieur et qui peut en même temps contrôler les niveaux en bande fine. L’affichage en bande fine donne des informations extrêmement précises sur les fréquences à traiter (valeur en Hz de la fréquence, niveau et largeur de l’égalisation). L’ajustement effectué par l’ingénieur système est donc spécifique à une fréquence et non à la bande de fréquence concernée, ce qui optimise la qualité du son pour le public. Dans ce cas précis, cela réduit les résonnances sur le plafond tout en ayant un impact très limité sur la qualité du son sur le public.
- C’est donc possible de gagner du niveau dans les salles. 10 dB dans une salle de jauge moyenne, et dans ce cas précis très optimisé 20 dB comparé au système non optimisé
III. Discussion

A. Les règlementations anciennes et nouvelles sont-elles adaptées à la protection du voisinage ?

Les musiques actuelles ont fortement évolué ces dernières années et aux vues des puissances mises en jeu la protection auditive du public et du voisinage sont devenues primordiales. Si la protection auditive du public n’est pas le sujet direct du mémoire, il est important de comprendre que ces décrets traitent aussi bien de la santé du public que des nuisances sur le voisinage. Nous donnons tout de même un bref rappel du contexte, essentiel à la compréhension du nouveau décret.

Depuis plusieurs années, le HCSP (Haut Conseil de la Santé Publique) alerte sur les niveaux en basses fréquences auxquels le public est exposé. Dans le rapport « Expositions aux niveaux sonores élevés de la musique : recommandations sur les niveaux acceptables de septembre 2013 » [26], on peut lire : « Les bruits d’exposition riches en basses fréquences engendrent non seulement des atteintes auditives localisées à des fréquences basses mais aussi dans la plage des fréquences conversationnelles […]. Si l’encoche sur la bande de fréquence de 6000 Hz est fréquente sur les sujets exposés au bruit, les pertes auditives mises en évidence sur les fréquences graves constituent un phénomène nouveau, et résultent très probablement des niveaux sonores excessivement élevés dans les basses fréquences ».

Plusieurs études ont en effet observé depuis longtemps que les basses fréquences à très forte intensité pouvaient induire des surdités permanentes mais sur des fréquences moyennes éloignées de plusieurs octaves. Pour citer quelques exemples fournis par le HCSP :
- Jerger et al. (1966) ont observé chez dix-neuf sujets humains qu’une exposition à 22 Hz à des niveaux de 119 – 144 dB SPL, soit 69 – 94 dB A, provoquait une perte de 10 à 22 dB de 3 000 à 8 000 Hz.
- Patterson et al. (1977) observent chez des sujets humains qu’une bande d’octave centrée sur 63 Hz et d’un niveau de 120 dB A pendant quatre heures produit des pertes maximales vers 1 000 – 3 000 Hz.
Ces études ont mis en évidence la nécessité de prendre en compte l’impact sanitaire sur l’audition du public des niveaux sonores élevés dans les basses fréquences. L’ancienne règlementation n’était pas appliquée sur tous les critères pour les raisons que nous allons exposer ci-dessous et le rapport du Haut Conseil de la Santé Publique a conduit à l’écriture d’un nouveau décret le 7 août 2017.

1. Problèmes suscités par l’ancien décret 98-1143

La réglementation qui était en vigueur (décret 98-1143) imposait un niveau de pression acoustique limité à 105 dBA sur 10 à 15 minutes ainsi qu’un niveau de 120 dB crête.

Niveau moyen

Tout d’abord, le niveau sonore continu équivalent pondéré A n’est pas adapté pour prendre en compte les effets du bruit à des niveaux élevés dans les basses fréquences (cf. Revue de littérature §B.2.2 i. Pondérations et perception des basses fréquences par l’oreille humaine) Du fait de l’augmentation des niveaux sonores comprenant une très forte contribution de l’énergie sonore dans les basses fréquences (faiblement pondérée dans les mesures règlementaires actuelles utilisant la pondération en dBA) et des effets sanitaires suspectés dus aux basses fréquences, il fallait élargir le champ d’application de l’ancien décret et utiliser la pondération en dBC. Le dBC est apparu comme un moyen simple pour la limitation en basse fréquence.

Niveau crête

« Un niveau crête à 120 dB était systématiquement dépassée alors que le niveau équivalent en continu de 105 dBA était respecté. » (HCSP, 2013, [26])

Le niveau crête « […] représente le niveau de pression acoustique maximal mesuré sur un intervalle de temps très court de l’ordre de quelques millisecondes. Cet indicateur permet de caractériser les bruits impulsionnels notamment ceux générés par les instruments tels que la batterie »¹⁶. L’indicateur LAeq,t en tant que moyenne énergétique, gomme les pics d’amplitude de courte durée observés durant la période considérée. Un niveau à 105 dBA correspond plutôt à un niveau crête de 137 dB … Pour donner un ordre de grandeur, dans la figure ci-dessous, voici un relevé d’un sonomètre placé à la console, située à 60 m des premiers subs, lors d’un festival en plein air. Pour un niveau moyen de 99,7 dBA, on a 132,9 dB crête donc, pour 105 dBA on obtient environ 137 dB Crète.

Figure 57 : Export du logiciel 01dB, utilisé à la console lors d’un festival (les courbes ont été lissées sur un Leq 1 minute)

Par ailleurs, dans les petites salles, il est beaucoup plus difficile de gérer les limitations de pression acoustique. En effet, du fait de la proximité du public par rapport à la scène et le niveau important de champ réverbéré dans la pièce, le niveau de 102 dBA est systématiquement dépassé pour les premiers rangs avant même de mettre en route le système de sonorisation ! Une batterie à elle seule peut atteindre 105 dBA sur plusieurs secondes sans sonorisation.

Fréquences prises en compte par le décret et problèmes de voisinage

Le décret 98-1143 ainsi que le décret de 2006 ne prévoient des limitations que pour les bandes d’octave à partir de 125 Hz. Or les musiques électroniques et actuelles concentrent l’énergie dans l’octave 63 Hz qui n’est pas prise en compte dans la règlementation. Ces fréquences sont justement les fréquences les plus polluantes pour les riverains.

Voici ci-dessous un schéma simplificateur résumant la plupart du temps le résultat de l’étude d’impact d’un établissement diffusant de la musique amplifiée. Il met en évidence que les basses fréquences qui sont les plus fortes en salle sont les moins bien isolées. Il y a donc une contradiction entre les besoins et la nature des matériaux utilisés.

Dans la partie Revue de littérature §4, Lafont insiste sur la difficulté d’isoler les basses fréquences. L’ensemble formé par une plaque de BA13 et un mur lourd en parpaing creux est utilisé dans la grande majorité des habitations. « Par exemple, une cloison en BA13 disposant d’un plénum de 10 cm rempli de laine de verre, résonne à 63 Hz. Adossée à un mur en parpaing creux de 20 cm, le doublage sensé améliorer l’isolement, le dégrade de 7 décibels […]». (Lafont, [15])

Si l’on reprend plus précisément cet exemple :

A 63 Hz, la cloison en BA 13 résonne et se comporte comme un système masse-ressort. Ainsi, si l’on veut diminuer la fréquence de résonance pour améliorer l’isolement à 63 Hz, il faut soit augmenter la masse surfacique de la cloison, soit augmenter l’espace d’air entre le mur et la cloison. Mettre un grand espace entre les deux parois engendre une très forte perte de place, et augmenter significativement la masse surfacique provoque des problèmes structurels importants (modification des fondations du bâtiment souvent nécessaire). L’absence de règlementation pour la bande de fréquence 63 Hz est donc particulièrement problématique en termes de protection du voisinage… Pourquoi n’est elle pas prise en compte ? Comme montré dans la partie « problématiques de mesures dans les basses fréquences », ces fréquences sont difficilement mesurables. L’erreur de mesure dans les basses fréquences peut aller jusqu’à 24 dB à 63 Hz si l’on cumule les erreurs de mesure à l’émission et à la réception. La solution la plus simple pour pallier à ces erreurs consiste à utiliser des moyennes spatiales mais à l’heure actuelle il n’existe pas de norme qui décrive une manière simple de mesurer les basses fréquences.

Nous rappelons aussi l’importance des impacts sur la santé suite à l’exposition à des nuisances importantes et régulières. Les basses fréquences dans l’environnement peuvent entrainer des perturbations du sommeil, des dépressions, et bon nombre d’autres effets secondaires (cf. Revue de littérature, §effets sur la santé). « Certains plaignants, à bout de souffle, en larmes ou au bord de la crise de nerfs, sont d’autant plus désemparés qu’ils ont entrepris pour la plupart de nombreuses démarches mais en vain.» (CIDB, [3])

Étude d’impact et pose du limiteur de niveau

Comme beaucoup de salles de concert sont dans des bâtiments historiques, elles n’ont pas été conçues pour isoler les infrabasses des musiques actuelles. La seule solution pour isoler en infrabasses est d’utiliser des structures lourdes totalement découplées dont la masse surfacique est d’environ 500 kg/m².¹⁷ Les solutions constructives étant très couteuses voire structurellement impossibles, le premier paramètre à améliorer consiste à positionner et à rendre directif quand cela est possible le système de sonorisation. En dernière limite, quand toutes les autres voies ont été optimisées, la règlementation impose la mise en place d’un limiteur de pression acoustique¹⁸, pour garantir la tranquillité du voisinage et protéger l’audition du public. Quelles sont les problématiques associées à cette solution ?
- Pour les grandes salles de concert, le sonorisateur utilise souvent plusieurs sorties de console de façon à pouvoir régler séparément le niveau des front fills¹⁹, de la façade, des subs, … Or les limiteurs n’agissent que sur deux entrées, ce qui le rend incompatible avec les grosses structures.
- Les applaudissements générant un niveau supérieur à la réglementation, ils déclencheront inéluctablement le limiteur et ce, indépendamment des niveaux de diffusion en salle.
- Les limiteurs normalisés correspondant à la norme NF31-122 (AFNOR 2003, ICS : 17.140.01) et actuellement disponibles utilisent une technologie VCA (contrôle de gain automatique) qui ne savent réagir qu’après la perturbation. Cette action postperturbation engendre donc deux problèmes majeurs : les crêtes ne sont pas atténuées instantanément et le gain à l’instant t est maîtrisé par son passé. Par conséquent, sur des musiques dont la dynamique n’est pas constante (live), il apparait des effets de pompage très problématiques à l’usage. Malheureusement seuls les limiteurs à action multi bandes et à traitement instantané de la dynamique peuvent être adaptés au live. Il n’existe cependant pas sur le marché de limiteurs exerçant ces fonctions, et seuls des limiteurs sur mesure permettent de les réaliser. De plus, la plupart des limiteurs du commerce se contentent de moduler le niveau global en fonction des mesures de niveau par bande. L’utilisation de structures plus complexes telles que de vrais limiteurs multi bandes associées a des enregistreurs homologués, ne sera possible que lorsque la nouvelle norme NF31-122 (janvier 2017) sera mise en application (limiteurs de type classe 3)²⁰. La solution physique consiste à séparer le signal par bandes de fréquences, et traiter la dynamique séparément. Dans un deuxième temps, on recompose le signal en passant préalablement chacune des bandes dans des filtres permettant d’éliminer la distorsion créée par la limitation brute et de remettre en phase toutes les bandes.²¹
- Enfin, si l’isolement est insuffisant en basse fréquence, le niveau sonore ne permet pas d’exploiter le lieu, ce qui rend l’usage du limiteur incompatible avec l’exploitation. Plutôt que de mettre un limiteur qui rendrait le lieu impropre à sa destination finale, il convient donc de chercher une solution dans le système de diffusion, par la maîtrise de sa directivité, lorsque cela est possible.
Conclusion sur les points problématiques du décret 98-1143

En raison du coût et des impossibilités structurelles de réaliser des travaux dans certains bâtiments pour s’affranchir des infrabasses, bon nombre de salles ne peuvent pas respecter la règlementation. Certains exploitants ont réalisé des travaux d’isolation mais sont encore confrontés aux problèmes de voisinage. Outre l’impossibilité de produire un concert avec 120 dB crête, les fréquences infrabasses (notamment à 63 Hz) ne sont pas prises en compte alors qu’elles traversent toutes les structures et constituent la gêne principale pour les riverains. Par ailleurs, la pose du limiteur est souvent insuffisante à la protection des riverains, et les travaux sont très onéreux. L’optimisation des installations de sonorisation par la création de directivité dans les basses fréquences est donc dans ce contexte fondamentale pour que les salles puissent continuer leur activité sereinement. Le limiteur ne peut pas être une solution unique. Elle doit être pensée avec une optimisation du système de diffusion.

Du fait de l’augmentation de l’énergie sonore dans les basses fréquences et des effets sanitaires suspectés, un nouveau décret est paru tout récemment en août 2017. Il étend le champ d’application du 98-1143 de diffusion en lieu clos à la diffusion en plein air et intègre des spécificités de niveaux à ne pas dépasser pour les enfants.

2. Le nouveau décret 2017-1244

En partant de l’analyse du décret dans la revue de littérature, nous mettons en évidence les difficultés d’exploitation d’une règlementation à 102 dBA et 118 dBC en tous points accessible au public, estimés sur une moyenne de 15 minutes.

Ce décret a été conçu dans l’objectif de protéger le public lors des concerts les plus critiques en termes de niveau sonore en basse fréquence, par exemple les concerts de musique électronique en plein air. Dans les festivals ou dans les discothèques, la musique est souvent très compressée, sa diffusion s’effectue avec de très forts niveaux en basse fréquence, et sur des durées très importantes. Si la baisse de niveau est primordiale, il faut cependant qu’elle reste dans des proportions exploitables. Sur le schéma et les calculs ci-dessous, on raisonne en niveau de pression. Le temps n’intervient pas dans les calculs. Le but de ces figures est de montrer les problèmes d’homogénéité des niveaux sonores. Ces calculs sont vrais pour des simulations en champ libre, dans des cas tels que les festivals de plein air.

Dans une configuration standard, l’obligation de respecter un niveau sonore de 118 dBC en tous points accessible au public, engendre soit de placer des barrières de sécurité à une très grande distance de la scène soit d’accrocher les caissons quand cela est possible, malgré tous les effets négatifs sur le voisinage que cela va engendrer.

Voici ci-dessous l’explication détaillée de ces implications.

2.1 Illustration des impossibilités difficultés techniques de mise en œuvre

i. Cas des subs au sol

Positionnons un subwoofer à 20 m de la console de mixage. En général les barrières se placent à environ 2 m des subs. Quel est donc le niveau sonore mesuré au point mixeur? Nous effectuons les calculs en champ libre, ce qui correspond au cas pratique d’un festival en plein air.

Calculons l’atténuation du niveau sonore due à la distance parcourue par le son pour les deux points de référence : la barrière et le point mixeur. Comme pour la programmation du logiciel de simulation, tout est basé sur un niveau relatif dont la référence est à 1 m du sub.

Atténuation_barrière = 20 * log10(Distance_Barrière)
= 20*log10(2)

Atténuation_mixeur = 20 * log10(Distance_Mixeur)

= 20*log10(20)

Atténuation_relative = Atténuation_barrière – Atténuation_mixeur
= 20 dB

Ainsi,

Niveau_mixeur = Niveau_Barrière – Attenuation_relative = 98 dBC

Pour le calcul en dBA, le rayonnement n’étant pas omnidirectionnel, la loi de propagation n’est pas simple. Nous avons donc utilisé Soundvision afin de simuler l’homogénéité créée par un Line Array en hauteur.

En respectant le nouveau niveau règlementaire de 102 dBA et en accrochant à 10 m de haut les Line Array, on obtient 98 dBA au niveau de la console de mixage, soit seulement 4 dB de différence avec le niveau le plus exposé. Dans une configuration standard, il y a donc une différence d’homogénéité de 16 dB entre le dBA et le dBC lorsque les subs sont posés au sol. La perte liée à la propagation sphérique des basses engendre une très grande différence de balance tonale²² entre les personnes à proximité des subs et le point moyen sur le public. Le respect des niveaux règlementaires engendre donc des niveaux équivalents en dBC et dBA (98 dBC et 98 dBA à la console), ce qui musicalement parlant, est perçu comme un son très agressif.

Actuellement, il est courant de mesurer plus de 118 dBC à la console. S’il est effectivement important de diminuer les niveaux sonores maximums actuellement générés sur le public, il est en revanche compliqué d’imposer une baisse de 20 dB au sonorisateur. C’est un saut beaucoup trop important pour qu’il soit physiquement réalisable et applicable.

Comme démontré dans l’exemple précédent, s’il est aujourd’hui courant d’obtenir une homogénéité correcte du dBA sur tout le public, en utilisant le système en ligne source Line Array, il est par contre quasiment impossible d’avoir le même résultat pour le dBC en laissant les subs au sol. Le dBC étant essentiellement constitué dans les musiques actuelles par les basses fréquences générées par les caissons de basse, il est donc nécessaire d’éloigner les subs du public. L’accroche en hauteur devient donc obligatoire.

ii. Cas des subs en hauteur

L’usage montre qu’un niveau de concert perçu comme minimaliste demande des niveaux sonores de l’ordre de 96 dBA sur l’ensemble du public. Positionnons la console à 50 m (cas usuel dans un festival de grande ampleur). Il faut accrocher les subs à 14 m de haut pour respecter 118 dBC en tous points accessibles au public. Accrocher des subs à 14 m de hauteur est la plupart du temps physiquement impossible.

Nous détaillons le calcul de la hauteur d’accroche pour une distance de barrière usuelle à 2 m et un niveau à la console de 96 dBA. On prend comme valeur de balance tonale 10 dB ce qui correspond à un cas pratique usuel.

Vous trouverez ci-dessous un abaque permettant de voir la hauteur du sub nécessaire en fonction de la distance avec les barrières pour 99 dBA à la console et 50 m de distance entre les subs et le mixeur.

Nous concluons qu’en utilisant qu’un petit stack omni de subs le décret n’est pas applicable, car soit la hauteur d’accroche des subs est trop importante, soit la distance des barrières de sécurité est trop importante.

Afin d’essayer de diminuer la hauteur d’accroche, essayons d’utiliser deux stacks en hauteur (subs stéréo) espacés de 16 m. On obtient donc +6 dB sur la ligne centrale, et moins de niveau en dessous de chaque sub en relatif au sub seul suspendu. On aperçoit ci-dessous d’importants phénomènes constructifs et destructifs entraînant une grande perte de qualité sonore sur le public.

Figure 58 : Simulation Soundvision à 50 Hz de deux stacks de 2* SB28 espacés de 16m sur une échelle de 500 m

Une des solutions consiste à suspendre des grandes lignes de subs comme l’exemple ci-dessous, des End Fire, ou des arcs subs²³. Dans ce tableau, il faut suspendre 14 K1 Subs à 10 m pour obtenir une couverture homogène.

Nous arrivons donc à la conclusion que ce système coûte excessivement cher car il nécessite beaucoup d’enceintes et des structures d’accroche complexes.

Outre la difficulté technologique d’accrocher les subs, si l’on considère le point de vue scénographique, la taille des subwoofers est incompatible avec la visibilité minimale nécessaire pour le public.

Ce raisonnement s’applique également dans le cas d’une salle. Même si les modes de résonance contribuent à rendre le système plus homogène, il sera tout de même nécessaire d’accrocher les subs en hauteur pour respecter le nouveau décret. La proximité avec le plafond risque d’augmenter très fortement les nuisances sonores chez les riverains.

2.2 Impossibilité d’effectuer les mesures de niveau max dans le public

La réglementation imposant 118 dBC en tous points accessibles au public il faut donc effectuer la mesure de niveau au point le plus fort se situant généralement dans la fosse où le public est le plus énergique. Effectuer des mesures avec un sonomètre par nature fragile et coûteux au milieu d’une foule déchaînée parait donc extrêmement difficile.

2.3 Nécessité d’effectuer des mesures en plusieurs points impossibles avec le matériel existant

La majorité des systèmes de sonorisation de grande ampleur utilisant des subs séparés nécessitent un point de mesure physiquement différent pour le dBA et pour le dBC. Le niveau maximum en dBC sera mesuré en proximité des subs. En effet, à cet emplacement, les subs généralement accordés en passe bande à 63 Hz avec une pente de 24 dB par octave, la courbe de réponse de la mesure en dBC reproduit la courbe de réponse du sub. La mesure en dBC devient donc homogène avec la mesure en basse fréquence. À cette position, le Line Array est extrêmement directif et son maximum est situé plus loin. Le niveau maximum en dBA sera mesuré dans le champ direct des enceintes médium aigues ou au niveau du point central de sommation. Il y a donc des cas où il sera nécessaire d’utiliser un système composé au minimum de 2 microphones afin de surveiller respectivement le dBA et le dBC.

Actuellement, seuls des limiteurs sur mesure sont susceptibles d’effectuer ces mesures en multipoints mais il n’existe pas de systèmes commerciaux standards adaptés à cette contrainte.

2.4 Influence de la scène et du public sur le respect des niveaux en tous points

Les instruments sur scène émettent à eux seuls des niveaux sonores supérieurs à 102 dBA. Par conséquent, un limiteur dont le microphone de mesure sera placé au devant de la scène zone typique du maximum d’émission sonore, sera entièrement maîtrisé par le niveau sonore sur scène.

De plus, l’influence du public (cris, applaudissements…) est très souvent largement supérieure à 102 dBA.

De même que pour le précédent décret, on aura donc entre l’impact de la scène et le bruit du public un limiteur donc le comportement n’est plus relié au niveau de diffusion en salle.

Le niveau de scène et le public court-circuitant le niveau généré par le système de sonorisation, le limiteur se mettra en défaut et coupera le son du système de sonorisation.

3. Synthèse

Si le 120 dB crête dont l’objectif était de protéger le public dans les basses fréquences n’a jamais pu être appliqué, il est important de comprendre que le nouveau critère de 118 dBC en tous points ne sera pas non plus compatible avec la réalisation d’un concert sans de coûteux aménagements. Il risque donc comme le précédent, de ne pas être respecté, et ce au détriment de la protection du public. Cela serait particulièrement dommageable car il est urgent de limiter les niveaux sonores actuels.

Malheureusement, la protection du public qui nécessite l’accroche des subs en hauteur, risque de se faire au détriment de celle du voisinage car le 63 Hz n’est pas pris en compte dans la règlementation. Par ailleurs, une baisse aussi importante du dBC risque de réserver certaines pratiques musicales à des concerts de très grande ampleur, ce qui est dommage vis-à-vis de la diversité culturelle.

L’objet des questions de recherche suivantes se concentrent sur l’optimisation par la directivité des systèmes de diffusion. Une des problématiques majeures dans l’optimisation des systèmes consiste à les caractériser. Il est donc fondamental de commencer par définir des méthodes de mesure permettant de caractériser réellement les performances des systèmes de diffusion.

B. Comment mesurer de façon fiable les basses fréquences pour optimiser les systèmes de diffusion au regard des problèmes de voisinage ?

1. Méthodes de mesure

Synthèse sur les méthodes de mesure :

Techniques de mesure en moyenne spatiale et temporelle :

Les basses étant modales il faut faire plusieurs points de mesure. 3 solutions se présentent :
- Soit on se déplace dans la pièce en faisant une moyenne Leq pendant 2 min
- Soit on mesure plusieurs points discrets pendant au moins 30s et on en fait une moyenne statistique
- Soit on utilise la technique multi micros en sweep
Méthode de mesure de niveaux sonores :
- Cas simple où l’on a beaucoup d’émergence : on mesure en bruit rose avec un sonomètre en se déplaçant dans l’espace pendant minimum 2 minutes.
- Cas où l’émergence n’est pas suffisante : l’usage d’un échantillonnage de musique permet de générer des niveaux plus forts.
- Cas extrême (très peu d’émergence) : les mesures en sweep permettent de gagner jusqu’à 34 dB de rapport signal / bruit en mesurant en plusieurs points ou en utilisant un système multi micros.
- Il est aussi fréquent de pouvoir utiliser un échantillonnage de musique, par exemple plusieurs répétitions pour pouvoir faire les mesures d’isolement. Cela permet de faire l’étude d’impact en interférent un minimum avec la mise du système de sonorisation.
Spécificités des techniques d’optimisation du système :
- Utiliser les techniques de calage temporel pour mettre en phase le système de diffusion.
- Ne pas oublier la distance de mesure. Les configurations cardioïdes s’optimisent à grande distance. Il faut placer le micro de mesure au lointain.
- Mesurer l’impact de chaque élément du système de diffusion séparément, en bande fine chez le voisin, puis l’impact de l’ensemble. Hiérarchiser les impacts de chacune des boîtes.
- Mettre en place un retour en temps réel des mesures d’émergence sur le voisinage.
Spécificités des mesures chez les voisins :

Pour bien choisir les endroits où l’on mesure les émergences. Il faut se baser sur :
- La directivité du système.
- Le choix de l’emplacement présentant le bruit de fond le plus constant possible et une émergence significative (supérieure à 15 dB ou 20 dB pour toutes les bandes de fréquence où l’on souhaite imposer une limitation).
- Privilégier les architectures défavorisantes (habitations hautes et grandes surfaces réfléchissantes) qui amplifient naturellement le son.
- Se méfier des impacts des conditions atmosphériques (vent) : faire particulièrement attention aux rafales de vents. Faire des moyennes statistiques.
- Lors des concerts, utiliser un analyseur en bande fine pour connaitre précisément les bandes de fréquences qui posent problème et pouvoir faire un retour en temps réel à l’ingénieur système. Il est pratique de fonctionner par fonction de transfert afin de pouvoir faire la mesure au droit des fenêtres des riverains et non à l’intérieur des bâtiments afin d’éviter tout dérangement.
- Ne pas oublier de faire une moyenne spatiale. Insistons encore une fois, les basses se mesurent toujours en plusieurs points.
2. Tableau récapitulatif

C. Comment choisir la configuration de subs la plus adaptée ?

1. Tableau de synthèse sur la configuration cardioïde

Nous synthétisons l’ensemble des résultats sur la configuration cardioïde dans le tableau ci-dessous.

2. Tableaux de synthèse généraux

Sur le tableau et les courbes ci-dessous, on peut voir que seul l’End Fire est constant en fréquence et permet une sommation parfaite. 50 Hz 70 Hz 100 Hz.

Bilan des résultats fondamentaux
- Seules les configurations où le retard compense la distance physique à l’avant permettent de garantir que dans l’axe toutes les réponses impulsionnelles seront parfaitement synchronisées dans le temps et qu’il n’y aura donc pas de déformation de timbre.
- Plus on a de subs moins on a de lobes
- Un cardio avec les deux HPs en phase ne peut pas être utilisé sur plus large qu’une octave. Il faut donc utiliser un preset d’enceinte qui coupe le plus bas possible.
- Le gradient procure de très fortes réjections sur une très large bande passante, mais a l’inconvénient d’engendrer des distorsions de la réponse impulsionnelle.
- Dans le cas où la bande passante du sub se limite à une octave et où l’on ne veut aucune déformation de la réponse impulsionnelle, il faut utiliser un cardio natif. Si l’on cherche à maximiser la réjection pour toutes les fréquences, l’emploi du gradient est plus efficace au détriment de la qualité du son à l’avant. L’End Fire, lorsque son encombrement est admissible, il cumule bonne sommation, réjection large bande, et qualité de la réponse impulsionnelle.
3. Interprétation des résultats des mesures dans le hangar

Les mesures en laboratoire nous ont permis de vérifier les résultats fournis par les simulations informatiques. Par ailleurs, cette expérience a surtout permis de mettre en évidence un critère d’analyse supplémentaire spécifique à la robustesse de chaque configuration vis-à-vis des interactions avec une pièce.
- Configuration cardioïde : OUI, le cardio marche dans une pièce !
Un cardio se mesure en champ lointain et moyenné dans l’espace ! Il faut trouver un compromis entre la distance permettant au cardio de se mettre en place et rester dans le champ direct prédominant vis-à-vis du champ réverbéré.

Il faut trouver un compromis entre la qualité de la réponse impulsionnelle et la réponse modale de la pièce. La configuration cardioïde accordé à λ/4 sonne mieux mais est plus assujettie aux modes de résonnance de la pièce. En effet, la distance entre les sources de 1m70 augmente les chances d’exciter différents modes dans la pièce. Nous avons remarqué que les hauts parleurs sont assujettis à une réponse modale dans la pièce qui varie en fonction de leur position. Ils n’ont donc ni la même courbe de réponse ni la même courbe de phase. Il est important pour créer un cardioïde que les deux HPs excitent les mêmes modes, qu’ils aient la même énergie et que la phase soit bien inversée au point de réjection arrière. Le comportement modal de la pièce pourrait donc être un des phénomènes fondamentaux expliquant la complexité de mise en œuvre des cardioïdes en salle.

Lorsque l’on combat les modes il faut essayer de les contrer : il existe différents types de position et différents types de cardio. Rapprocher les subs offre plus de possibilités et permet d’obtenir plus facilement une réjection mais cette facilité se paie au prix d’une moins bonne sommation en puissance ainsi qu’une réponse impulsionnelle déformée. Parfois, il vaut mieux mettre une distance plus petite et créer la directivité.

La mesure permet de se rendre compte de ces difficultés, c’est un compromis à trouver. Il faut ajuster en fonction des lieux
- End Fire
  
  Il permet bien d’augmenter la largeur fréquentielle de la bande de réjection
  
  Il est moins assujetti aux phénomènes de modes de la pièce
  
  Il permet quand il est relativement long de maîtriser l’énergie sur le côté
  
  Il a par contre l’inconvénient majeur d’être difficile à mettre en œuvre de par ses dimensions physiques.
- La ligne
  
  Très directive sur les côtés
Bilan : Comment faire quand la pièce est difficile ?
- Si le cardio espacé de λ/4 ne marche ne pas ou s’il n’est pas mécaniquement implémentable : il faut trouver une configuration les subs s’annulent à l’arrière mais qui ne soit pas trop mauvaise à l’avant. Rapprocher les subs offre plus de possibilités et permet d’obtenir plus facilement une réjection mais cette facilité se paie au prix d’une moins bonne sommation.
- Si le système veut avoir une fréquence de coupure plus élevée, le cardioïde n’est plus adapté et il faut absolument utiliser un End Fire ou un système en gradient malgré la déformation de la réponse impulsionnelle qu’ils engendrent.
- Plus on augmente le nombre de sources, plus le système de diffusion peut imposer son front d’onde, et être moins sujet aux modes de résonance de la salle. Par ailleurs, une fois de plus, le fait d’avoir construit des subs de petite taille facilite le système à s’affranchir de la salle.
Dans la réalité, il est souvent difficile de multiplier le nombre de sources. Si tel est le cas, par exemple si l’on a que deux subs, quelles seraient les solutions ?

L’égalisation et les niveaux peuvent permettre de gagner en réjection arrière. La méthode consiste à obtenir l’annulation en égalisant les HPs et en modulant le gain, de telle sorte que leur courbe de réponse soit identique en niveau et en fréquence dans la zone 40/63 Hz que l’on souhaite rejeter. On traite séparément les deux HPs puis on vérifie l’annulation. De façon imagée, l’un des HPs va faire le signal et l’autre l’annulation.

D. En pratique, quelle est la procédure à adopter pour optimiser un système vis-à-vis du voisinage ?

1. Méthode Globale

Il faut identifier la localisation des zones de voisinage à protéger ainsi que les parois les plus sensibles de la salle étudiée.

Il s’agit ensuite de choisir l’orientation du système et la configuration de subs qui permet de minimiser l’énergie sur les zones précédemment identifiées.

Pour ce faire, la première étape consiste à trouver dans le tableau précédent la configuration qui parait naturellement la plus adaptée, et qui soit physiquement réalisable. Une fois le principe physique établit, il est pratique d’utiliser les logiciels de simulation afin de réadapter le système de diffusion aux particularités du lieu (couverture du public, gradins…)

On installe ensuite la configuration choisie. On mesure chacun des éléments séparément chez les voisins et on optimise la directivité de chacun des sous groupes de diffusion séparément.

Puis, on ajuste les niveaux globaux en relatif afin de diminuer l’impact des éléments les plus problématiques.

Afin de respecter un niveau d’émergence adapté, il convient de placer un afficheur de niveaux permettant d’indiquer les niveaux sonores à ne pas dépasser. Il peut prendre trois formes différentes ;
- Soit un retour en temps réel de mesure de niveau sonore directement chez les riverains (cas idéal mais rarement applicable).
- Soit à partir d’une mesure effectuée à l’endroit le plus proche possible des riverains, accessible mais non perturbée par les éléments extérieurs (cas le plus souvent optimal)
- Soit à partir des niveaux mesurés en salle et donc les valeurs sont fixées par l’étude d’impact (cas le plus simple mais très impacté par les changements de configuration de diffusion et par les conditions atmosphériques.
Dans tous les cas, rien ne remplacera le dialogue humain : le retour en temps réel avec le sonorisateur pour maîtriser le son généré permet l’optimisation la plus qualitative possible. En effet, le son d’un limiteur n’est pas satisfaisant (cf. limitations des décrets Partie A Discussion). Par ailleurs, le dialogue avec les voisins, le fait de prêter une oreille à leurs problématiques est essentiel.

Dans tous les cas, nous rappelons l’absolue nécessité d’utiliser plusieurs points de mesure pour définir les niveaux en basse fréquence.

2. Tableau de synthèse de la procédure

3. Zoom sur le mémoire de recherche

Optimisation des systèmes de diffusion pour la protection du voisinage

Contributions
- Contributions intellectuelles
  
  Synthèse et limites des configurations cardioïdes afin de rendre leur usage plus instinctif.
  
  La compréhension du système et la méthode de mesure permettent de créer de la directivité dans les salles. Cette solution représente un gain significatif face au problème d’isolation actuelle liée à la structure des bâtiments.
- Contribution pratique
  
  Proposition d’une méthode de mesure synthétique pour l’optimisation des systèmes de diffusion dans les basses fréquences vis-à-vis du voisinage.
- Contributions technologiques
  
  Programmation d’un logiciel de simulation permettant notamment la production d’un tableau de synthèse des configurations pour mieux comprendre leur fonctionnement et donc leurs limites.
  
  Construction de subs compacts et clos visant à mesurer de façon plus précise les configurations.
Aujourd’hui, les notions de directivité vis-à-vis des problèmes de voisinage sont peu abordées dans le métier pour plusieurs raisons : peu de liaison directe s’établissent entre l’acousticien qui sait ce qui se passe chez les voisins et le sonorisateur à l’intérieur de la salle de concert, lors de la conception des salles ou de leur exploitation. L’objectif est de relier les deux métiers pour trouver une solution commune. Le sonorisateur ne peut pas se contenter d’un limiteur et il est très difficile pour les acousticiens d’isoler dans les basses fréquences. Par ailleurs, établir une bonne relation avec le voisinage est également fondamental pour trouver les bonnes solutions. La communication est donc fondamentale et seule une vision globale permet d’obtenir de vrais résultats.

Techniquement parlant, une fois la communication établie, la solution consiste à comprendre les faiblesses de la salle et à créer de la directivité pour maximiser l’isolement apparent. En pratique, l’optimisation est compliquée et ne peut se faire que si l’on traite séparément les problèmes pour pouvoir in fine viser à l’optimisation globale. Pour caractériser il faut savoir mesurer. Le problème majeur que constitue l’estimation des basses ne peut se résoudre que par du moyennage spatial ou de la mesure multi micros. Lorsque l’on applique des méthodes de mesure par moyennage, on passe d’un système qui parait chaotique à un phénomène caractérisable.

Il est courant, dans les petites salles d’avoir un gain de 5 à 8 dB, et jusqu’à plus de 20 dB pour les configurations dans les grandes salles ou en plein air.

Les salles sont tellement variables que nous avons souhaité avoir des résultats et des méthodes d’optimisation généralisés sans s’attacher à des cas particuliers. C’est en mesurant dans la salle et chez les voisins les configurations de subs que l’on a sélectionnées que l’on peut se rendre compte si elles fonctionnent, s’il faut les déplacer ou en utiliser d’autres (par exemple rajouter des sources pour imposer plus le front d’onde etc.) Il n’y a pas de réponse toute faite, l’optimisation se fait par allers et retours successifs (cf. schéma de synthèse p 158).

Limitations
- Créer une directivité ne peut évidemment s’appliquer que dans des cas où le voisinage est sur les côtés ou à l’arrière du système de diffusion. Si la zone à protéger est localisée en face du système, les techniques étudiées dans ce mémoire ne permettent pas de résoudre le problème.
- Il aurait été bien de faire une étude plus approfondie sur d’autres techniques de mise en phase pour la création directivité : passe tout, gradient, lignes de subs ou End Fire à fréquence de coupure progressive.
- Il n’a pas été possible par manque de moyens et de temps de rechercher à fournir des informations statistiques sur la qualité perçue des différentes configurations car cela aurait été le sujet d’un mémoire autonome.
- L’objectif du mémoire n’était pas de détailler la méthodologie propre à la réalisation de l’étude d’impact. Nous nous sommes focalisés sur la maîtrise des concerts de grande ampleur de type festivals, qui n’ont pas les mêmes impératifs que ce qu’exigerait la réalisation d’une étude d’impact pour un bar ou une boîte de nuit. Les techniques qui sont décrites sont plus complexes et plus couteuses mais permettent une meilleure gestion des niveaux sonores dans les infrabasses
- Le temps disponible dans le hangar était très limité. J’aurais aimé pouvoir faire plus de points de mesure pour valider les résultats de façon plus rigoureuse. Il aurait été également intéressant de pouvoir comparer la directivité intrinsèque du sub avec d’autres modèles du commerce (manque de temps également).
Apport Personnel
- Ce mémoire m’a permis de passer de connaissances théoriques à une connaissance appliquée tant d’un point de vue des concepts associés à la physique du son que d’un point de vue pratique. J’ai pu développer une capacité d’analyse et de synthèse vis-à-vis de la maîtrise des phénomènes de directivité, indispensable dans la vie pratique pour être à la fois efficace et créatif.
- J’ai pris conscience lors de retours de riverains pendant les expériences pratiques, des conséquences psychologiques engendrées par les problèmes d’émergence. J’ai réalisé à quel point la communication humaine était fondamentale dans résolution de problèmes dont on a parfois l’impression qu’ils sont insolubles quand on les limite à des critères purement techniques.
- Plus qu’un mémoire, ce travail de recherche m’a donné envie de poursuivre dans cette voie. Mon orientation première se dirige vers la sonorisation mais il me semble que concilier un travail d’optimisation des systèmes de sonorisation vis-à-vis du voisinage et sonorisation en elle-même serait un alliage passionnant permettant de relier ces deux domaines si interdépendants.
Perspectives

Pour les différentes configurations de subs, il aurait été profitable de pouvoir écouter dans des cas concrets et avec un processus d’auralisation les réponses impulsionnelles dans la zone d’écoute, afin de pouvoir associer aux différentes configurations un critère qualitatif permettant de discriminer la qualité de la réponse impulsionnelle des différentes configurations. Aujourd’hui seules les configurations où le retard compense la distance physique, permet de s’affranchir de cette étude, car il est réaligne temporellement toutes les réponses impulsionnelles de chaque sub.

Références

[1] AUFFRET, M., Rapport « Préventions des traumatismes sonores des musiques électro-amplifiées». Paris: CNRS, février 1998

[2] BESSON, R., ALARY, J., Sonorisation et prise de son (4e ed). Paris: Dunod, 2007

[3] CIDB, Le coût sanitaire, économique et social du bruit. Dans Echo Bruit, Numéro Hors série, 2014

[4] DESCHAUX, R., Cours d’Acoustique du Bâtiment. Repéré à http://www.acgrenoble.fr/lycee/roger.deschaux/documents/Cours/Acoustique/Acousti que-Cours_1.pdf

[5] EVEREST, F. ALTON, Master Handbook of Acoustics (4e ed). New York: McGraw-Hill Professional, 2001

[6] McCARTHY, B., Sound Systems Design and Optimization (3e ed). New York et Londres:
Focal Press, 2016

[7] FARINA, A., Advancements in impulse response measurements by sine sweeps. Dans la 122e convention AES, le 5–8 2007 Mai, Vienne, Autriche

[8] FARINA, A., MULLER, S., MASSARANI, P., Transfer-Function Measurement with Sweeps. Dans JAES, Vol. 49, N° 6 pp. 443, 2001

[9] FINAND, F., La diffusion acoustique. Repéré à http://www.acouphile.fr/diffusion.html
[10] GUASTAVINO, C., CHEMINEE, P., Une approche psycholinguistique de la perception des basses fréquences : Conceptualisations en langue, représentations cognitives et validité écologique. Article publié dans la revue Psychologie Française, 48 (4), pp. 91-101, 2003

[11] GUIBERT, G. Sociologie du volume sonore dans les musiques amplifiées. Dans Echo Bruit, n°116, Musiques amplifiées et gestion du risque auditif, mars 2007

[12] JOUHANEAU J., Notions élémentaires d’acoustique, électroacoustique. Paris: Lavoisier,
Tec & Doc, 1999

[13] JOUHANEAU, J., Acoustique des salles et sonorisation. Paris: Lavoisier, Tec & Doc, 2003

[14] LEIPP, E., Acoustique et Musique. Montreuil: Mines Paris Teich, 2010

[15] LAFONT, JP., Résonances stationnaires : l’influence des parois sur le calcul des fréquences modales. Repéré à http://www.lafontaudio.com/dossiers/limites.htm

[16] MEYER-BISCH, C., Les chiffres du bruit. Dans Médecine et Sciences, vol. 21, p.546-550 mai 2005

[17] PION, J., Les musiques amplifiées dans l’agglomération parisienne face au problème des nuisances sonores. Université de Reims, 2002

[18] PIETQUIN, D., Phase notions essentielles. Repéré à https://www.techniquesduson.com/phase1.html, 2008

[19] ROSSI, M., Traité d’électricité. tome 21, Electroacoustique, Presses Polytechniques et Universitaires Romandes, 1993

[20] ROSSI, M., Audio. Presses Polytechniques et Universitaires Romandes, 2007

[21] ROUSSEAU, D., La mesures des basses fréquences engendrées par les musiques amplifiées. Présenté aux Rencontres Acoustique & Technique à Paris, France, le 05 et 06 juin 2015

[22] ROUSSEAU, D., Retour d’expérience sur les mesures basses fréquence d’origine musicale, 63Hz.fr

[23] SAILLANT, P., Les dispositifs de reproduction des fréquences les plus basses en sonorisation. ENS Louis Lumière (Paris, France), 2010

[24] VAN VEEN, M., Calibration & Design Techniques for Modern Sound Systems the Hague. Présenté à la conférence à MVV Seminar, Den Haag, Hollande, le 6 – 11 Février 2017

[25] SERVICE DE SANTE AU TRAVAIL, Le Bruit, les principaux aspects réglementaires. Repéré à http://www.cihl45.com/index.php/les-risques-physiques/le-bruit-les-principaux-aspects-reglementaires, le 16 février 2015

[26] HCSP (Haut Conseil de la Santé Publique), Expositions aux niveaux sonores élevés de la musique : recommandations sur les niveaux acceptables. Repéré à http://www.hcsp.fr/explore.cgi/avisrapportsdomaine?clefr=378, Février 2013

[27] 01dB Industries, DUMAS J., LAMBERT F., Analyse Fréquentielle premier niveau.
Paris, le 05 septembre 1996

[28] DOCS HP ET SUBS
ADAMSON, Document technique T21. Repéré à https://adamsonsystems.com/Support/Downloads/SPEC_SHEETS/SUBS/T21_Techni calData.pdf
ALTEC, Document technique 416-8A, http://www.yesterdays-tech.com/Altec/416-8A.pdf
BCSPEAKER, Document technique 21 Pal, http://www.bcspeakers.com/en/products/lf-driver/21-0/1/21ipal
L-A COUSTICS, Document technique KS28. Repéré à http://www.l-acoustics.com/admin/product_files/KS28_SPS_FR_1.0.pdf

Quelques sites Internet de Référence

CIDB : http://www.bruit.fr/ AGISON : http://agi-son.org/ LEGIFRANCE : https://www.legifrance.gouv.fr/
LAFONT AUDIO ACOUSTIQUE & DESIGN : http://www.lafontaudio.com/

Annexes

A. Glossaire

Bass trap : matériau, généralement passif, absorbant les basses fréquences.

Balance tonale : différence de niveau en dB entre le dBA et le dBC

dB : décibel. Le dB exprime le niveau de pression sonore par rapport à la plus faible intensité d’un son perçue par l’oreille humaine. Cette unité s’inscrit sur une échelle logarithmique.

Cardio NATIF : configuration cardioïde dont la distance entre les sources vaut λ/4. λ étant la longueur d’onde de la fréquence d’accord de la configuration.

Cardio NON NATIF : configuration cardioïde dont la distance entre les sources est DIFFERENTE de λ/4. λ étant la longueur d’onde de la fréquence d’accord de la configuration

End-Fire Array : réseau dont la directivité est maximale dans la direction d’alignement des transducteurs.

Line Array : réseau linéaire d’enceintes acoustique permettant d’augmenter la zone de couverture du public.

L1 : niveau dépassé pendant 1 % du temps (bruit maximal).

L10 : Niveau dépassé pendant 10 % du temps : il indique le niveau moyen de bruit qui émerge du bruit de fond.

L90 : Niveau dépassé pendant 90 % du temps ; indique le « bruit de fond ».

Leq : Indice énergétique, niveau de bruit équivalent. En considérant un bruit variable perçu pendant une durée T, le Leq représente le niveau de bruit constant qui aurait été produit avec la même énergie que le bruit réellement perçu pendant cette durée. Le Leq s’exprime en dB.

MLS : Maximum Length Sequence. C’est une séquence binaire pseudo aléatoire permettant d’extraire la réponse impulsionnelle

LFE (Low Frequency Effect) : canal réservé aux basses fréquences (10-120 Hz). Sa présence est généralement précisée par le terme « .1 » (exemple système 5.1).

Réponse Impulsionnelle : Lorsque l’on met en entrée d’un système une impulsion (Dirac), la réponse impulsionnelle est la sortie qui est obtenue. Dans un système réel, la sortie n’est en général plus une impulsion, mais un signal décroissant proportionnellement à la durée de réverbération de la pièce. La réponse impulsionnelle permet la représentation d’un système en fonction de son entrée et de sa sortie uniquement.

Sonomètre : Appareil destiné à la mesure des niveaux de pression acoustique, pondérée ou non, dans le domaine des fréquences audibles, suivant des applications déterminées. (Norme NF S30-101. Septembre 1973. Vocabulaire de l’acoustique)

Subwoofer : caisson de graves ou caisson de basses sont des termes désignant les enceintes chargées de reproduire les fréquences inférieures à 80 Hz.

Sweep : signal audio qui balaye toutes les fréquences audibles entre 20 Hz to 20 kHz en dans un espace de temps donné. Lorsque l’échelle est logarithmique, émettre un sweep entre 20 Hz et 40 Hz (une octave) ou entre 10kHz et 20kHz prend la même durée. Dans le cas d’une échelle linéaire, l’octave 20/40Hz sera beaucoup plus rapide et égalisera la durée entre 10 kHz to 10.02 kHz.

B. Les pièges à éviter lors de la mesure de l’isolement

Attention Piège !

Le bruit particulier, c’est le niveau mesuré chez le voisin lorsque la boite de nuit est en activité. Il comprend donc le bruit que fait la musique chez le voisin ET le bruit résiduel habituel. Comme la mesure est effectuée en niveau énergétique équivalent, si le bruit de la musique chez le voisin est aussi fort que le bruit résiduel, alors les signaux se somment a +3 dB. Ainsi on mesure 3 dB d’émergence et non 0 dB. La règlementation vise justement à avoir un niveau de bruit de fond au même niveau que celui généré par la musique, ce qui donne 3dB d’émergence.

Par conséquent, il faut faire très attention lorsque l’on calcule l’isolement (atténuation du son du fait des murs). En pratique, deux cas se présentent :
- Emergence > 10 dB
  Isolement ≈ Musique – Bruit Particulier
- Emergence < 10 dB
  Il faut soustraire la compensation issu de l’addition en niveau énergétique du bruit résiduel avec le bruit de la musique chez le voisin :
  Isolement = Musique – Bruit Particulier + Correction
Nous avons calculé sous Excel à partir de quelles valeurs le bruit résiduel devient négligeable en relatif au bruit particulier. Puis dans un deuxième temps, quelles sont les valeurs des compensations à appliquer dans le cas contraire.

Soit « Bruit Sono » la variable définissant le niveau de bruit généré par la musique de la boîte de nuit chez le voisin sans bruit de fond. On calcule le bruit particulier et la correction à appliquer pour un écart croissant entre BR et Bruit Sono²⁴.

Figure 59 : calcul du bruit particulier et de la correction à appliquer pour un écart croissant entre BR et Bruit Sono

On voit qu’à partir d’une émergence de 10 dB, la correction devient négligeable. Donc si BR est 10 dB moins fort que le bruit de la sono, alors Isolement ≈ Musique – Bruit Particulier

Dans la plupart des situations pratiques, l’isolement permet de calculer le niveau maximum d’émission pour un établissement. La procédure consiste à :
- mesurer le bruit de fond chez le voisin la nuit.
- De manière à éviter toute nuisance sonore, on mesure le bruit particulier en journée.
  
  On émet un bruit rose dans la salle de concert
  
  Emergence > 10 dB
  
  Isolement = Musique – Bruit particulier
  
  3 dB < Emergence < 10 dB et BR stable
  
  Isolement = Musique – Bruit particulier + Correction
  
  Si Emergence < 3dB ou que le bruit de fond est instable
  
  On fait des statistiques avec différents bruits musicaux à différentes périodes
  
  Dans le cas ou la mesure est trop perturbée, on utilise un sweep (plus complexe d’interprétation mais permet de gagner jusqu’à 30dB sur un bruit rose)
- Ainsi Niveau_Max = BDF + Isolement car quand les deux niveaux sont équivalents on a bien 3dB d’émergence.
Exemples concrets :
- Cas où le bruit résiduel n’est pas négligeable devant le Bruit Sono
On mesure : 90 dB en salle, 30 dB de BR, 32 dB de bruit particulier. Le bruit résiduel est stable.

Le Bruit particulier est 2 dB plus fort que le Bruit Résiduel, ainsi la correction est de 2,33 dB il y a donc un Bruit de Sono égal à 30 – 2,33 = 27,67 dB Donc l’isolement vaut = 90 – 27,67 = 62,33 dB

Figure 60 : Calcul du Bruit Sono pour un écart croissant entre le Bruit Particulier et le BR
- Cas où le bruit résiduel est négligeable
  99dB dans la salle, 45dB de bruit particulier et 20 dB de bruit résiduel. Le bruit particulier est 25 dB au dessus du bruit résiduel, ainsi il est négligeable (cf. 1e tableau).
Donc Isolement = Musique – Bruit Particulier = 99 – 45 = 54 dB

Par exemple, si le Bruit Particulier mesuré est 4 dB plus fort que le Bruit Résiduel, alors le Bruit sono sera 1.80 dB plus fort que le bruit résiduel.

En dessous de 0.5 on estime que la correction est négligeable. Ce qui correspond bien aux 10 dB que l’on a trouvé précédemment.

Utilisations de l’isolement et de l’émergence

En pratique, l’isolement est utilisé pour les études d’impact de nuisance sonore Par exemple pour calculer les niveaux limites applicables la nuit car il permet de mesurer de jour l’isolement et de mesurer le bruit de fond de nuit. Exemple d’une mesure, pour une boîte de nuit, quel est le niveau maximum applicable la nuit ?
Par exemple si l’on calcule un isolement de 30 dB d’atténuation et que l’on a un bruit de fond mesuré la nuit de 40 dB. Le niveau limite à l’émission sera de 40+30 = 70 dB avec 3 dB d’émergence (deux signaux : arrivée + BDF qui s’additionnent se somment à 3 dB)

C’est l’émergence qui est explicitement formulée dans la règlementation, car c’est elle qui reflète et caractérise la gêne occasionnée. Dans les textes de loi que l’on décrit plus précisément ci-dessous, elle est limitée à 3 dB par bande de fréquence et 3 dB A. Cette valeur est déjà très importante ! En effet, prenons un kick qui joue à chaque seconde pendant une durée 100 ms. Un niveau énergétique équivalent se calcule sur une seconde. Comme une seconde contient 10 fois 100 ms, on a donc dix fois plus d’énergie sur 100ms que sur 1s. Par conséquent on a 10 dB de gain en niveau crête en plus des 3dB d’émergence. Ainsi on obtient 13 dB Crête de Kick !

C. Décrets

D. Documents techniques enceintes

E. Limiteur

Limiteur standard AMIX SNA70-3

Figure 61 : limiteur SNA 70 AMIX

Figure 62 : mis en place à La Grande Halle de la Villette

Remerciements

Je tiens à remercier chaleureusement David Rousseau pour son aide dans mon travail de recherche. J’ai beaucoup appris à ses côtés aussi bien en termes de connaissances techniques qu’en méthodologie scientifique.

Merci infiniment à Laurent Burrus pour sa disponibilité et les moyens mis en œuvre pour la réalisation de la partie pratique du mémoire.

Je remercie toute l’équipe de la grande Halle et particulièrement Benoît Weber.

Merci à Igor Prade, Florent Fourmy pour leur participation lors des mesures et leurs conseils. Le CIDB pour l’accès à son espace documentaire extrêmement complet.
Je remercie tous les ingénieurs du son et directeurs techniques qui ont donné de leur temps pour mon mémoire.
Pour finir, je remercie mes proches pour leurs relectures, leurs conseils et leur soutien.

Notes
1. On utilise le terme « subwoofer » dans le milieu professionnel pour caisson de basse. Nous emploierons ce terme tout le long du mémoire ↩︎
2. David Bowie, 1972 ↩︎
3. SNR : Signal Noise Ratio : Rapport signal sur bruit ↩︎
4. Interview d’un inspecteur de salubrité, intervenant formateur auprès du CIDB sur la thématique «nuisance sonore » ↩︎
5. Article 5 du décret 98-1143 ↩︎
6. Interview d’un inspecteur de salubrité, intervenant formateur auprès du CIDB sur la thématique «nuisance sonore » ↩︎
7. SB28 : subwoofer L-Acoustics. Documents techniques en annexe ↩︎
8. Ce graphique est expliqué plus précisément par la suite. ↩︎
9. Nous avons appelé notre logiciel de simulation Schouf qui signifie « regarde » en arabe. ↩︎
10. Définition précise dans le glossaire ↩︎
11. Volume de charge = volume interne de l’enceinte ↩︎
12. Pile de subs ↩︎
13. La directivité est liée à l’assemblage mais vous trouverez les fiches techniques des K1 Sub, VDOSC et SB28 en annexe ↩︎
14. Point FOH (Front Of House) : point localisant la console de mixage dans la pièce ↩︎
15. Ensemble des enceintes constituant la façade ↩︎
16. AUFFRET, M., Rapport « Préventions des traumatismes sonores des musiques électro-amplifiées», CNRS, février 1998. ↩︎
17. DESCHAUX, R., Cours d’Acoustique du Bâtiment, Repéré à http://www.ac-grenoble.fr/lycee/roger.deschaux/documents/Cours/Acoustique/Acoustique-Cours_1.pdf ↩︎
18. Limiteur en annexe ↩︎
19. Renfort de sonorisation de faible puissance pour les auditeurs placés juste devant et dans l axe de la scène ↩︎
20. Nous n’avons pu avoir une information précise sur la date d’applicabilité de la nouvelle norme au moment de la rédaction car elle n’a pour le moment pas encore été visée dans les textes règlementaires. ↩︎
21. Rousseau D., Gestion des graves vers l’environnement, JAES, 28/10/2010 ↩︎
22. Différence entre le niveau en dBA et en dBC ↩︎
23. Plusieurs enceintes espacées ou non sur lesquelles on applique des retards créant virtuellement un arc. Retarder les enceintes extérieures permet de réduire le lobe présent au centre du système et d’augmenter la cohérence aux extrémités du système. ↩︎
24. BP = 10 * log10 (10^ (Bruit Sono/10) + 10^ (BR/10)) et Correction Isolement = BP – BR ↩︎
juin 3, 2026

Perception subaquatique : adaptation de l’écoute stéréophonique en petit bassin

CONSERVATOIRE NATIONAL SUPÉRIEUR DE MUSIQUE ET DE DANSE DE PARIS, FORMATION SUPÉRIEURE AUX MÉTIERS DU SON, MÉMOIRE DE FIN D’ÉTUDES

Photographie de couverture: ***Résonance d’une goutte d’eau à 30,5 HZ***, ***Alexander Lauterwasser***

Présenté par: Soutenu en: ETIENNE OURY, Juin 2008

Dirigé par: CORSIN VOGEL

0. Introduction

L’eau recouvre 70% de notre planète, et elle est habitée par une multitude de sons. Dans ce milieu, la lumière se propage très mal et la vue ne tient qu’une place minime. C’est donc l’ouïe qui est le sens le plus développé chez les habitants des mers. Les mammifères marins sont là pour nous le rappeler : une baleine entend dans la bande de fréquence 10 Hz – 200 kHz, et elle est capable d’entendre un chant d’une de ses voisines à des dizaines de kilomètres à la ronde. Notons au passage que sur 2000 chants de baleines enregistrés dans le golfe du Saint- Laurent en 2005, seulement 2 étaient simultanés… Comme quoi les baleines sont des êtres civilisés qui ne se coupent jamais la parole.

Partant du constat que la musique est pour beaucoup de personnes un moment de relaxation et de détente, et que les supports d’enregistrement actuels nécessitent que l’auditeur soit placé à un point d’écoute précis (le sweet spot), écouter de la musique sous l’eau peut s’avérer une expérience très intéressante. Si l’on restreint l’étude à une utilisation domestique, c’est-à-dire un volume de petite taille (une piscine privée, ou même une baignoire), nous avons là une situation qui réunit les points suivants : temps libre, détente, point d’écoute (dans une baignoire)… et bien sûr immersion.

L’intérêt de cette démarche est avant tout de voir s’il est possible d’optimiser l’écoute de musique enregistrée en stéréo (format d’écoute le plus utilisé) et d’apprécier le rendu musical de différents styles de musique. Cela permettrait de répondre à la question suivante: est-il possible d’apprécier sous l’eau un enregistrement prévu pour une écoute aérienne, ou faut-il repenser la musique autrement, en termes de composition mais aussi de mixage.

Les études sur ce sujet sont peu nombreuses, et il n’existe pratiquement pas d’études alliant les aspects physiques, perceptifs et musicaux du sujet. Les études psychoacoustiques sont réalisées en champ libre pour des applications en pleine mer. Il est donc très difficile de prévoir comment va se comporter un bassin. De plus, ces études utilisent essentiellement des stimuli simples (fréquences sinusoïdales pures, bruit blanc), et ne permettent pas de tirer des conclusions quant à la restitution des timbres. Enfin, certaines études montrent qu’il est possible de localiser sous l’eau (Savel, 2001; Bernaschina, 2003), alors que certaines personnes qui sont habituées à écouter de la musique sous l’eau soutiennent que l’on perçoit de la monophonie (discussions lors du Salon de la Piscine et du Spa, nov. 2007). Ce mémoire va donc tenter d’apporter des éléments de réponse à ces questions en abordant l’écoute subaquatique d’un point de vue scientifique et acoustique, mais aussi psychoacoustique et musical.

1. État de l’art

1.1. Historique

Le milieu aquatique est très propice à la propagation d’ondes sonores. Les humains se sont d’ailleurs intéressés au son dans l’eau depuis longtemps. Aristote et Pline le Jeune se demandaient déjà si les poissons entendaient. Dans la Chine antique, les pêcheurs localisaient les bancs de poissons en écoutant le bruit de la mer à l’aide d’une tige de bambou dont l’une des deux extrémités plongeait dans l’eau, pratique qui existe encore dans certaines tribus de Malaisie. Léonard de Vinci avait aussi remarqué que « si l’on se place sur son bateau immobile et si l’on place le bout d’un long tube dans l’eau et l’autre extrémité sur son oreille, on entendra les bateaux éloignés ».

Les premières études scientifiques ont été menées en 1810 dans le port de Marseille par le physicien français François- Sulpice Beudant qui arrive à déterminer la valeur de propagation de 1500 m/s à l’aide d’une cloche et d’un stéthoscope. En 1826, sur le Lac Léman, Jean- Daniel Colladon réalise les premières grandes expériences sur la propagation acoustique.

Fig.1: Jean-Daniel Colladon sur le Lac de Genève (d'après J.C. Cailliez) — Fig.1: Jean-Daniel Colladon sur le Lac de Genève *(d’après J.C. Cailliez)*

En 1869, Jules Verne écrira:

« Les moindres Bruits se transmettaient avec une vitesse à laquelle l’oreille n’est pas habituée sur terre. En effet, l’eau est pour le son un meilleur véhicule que l’air, et il s’y propage avec une rapidité quadruple. (…)Des bruits profonds, nettement transmis par ce milieu liquide, se répercutaient avec une majestueuse ampleur. »

Jules Verne,

Vingt Mille Lieues Sous Les Mers

Les premières applications de l’acoustique sous- marine sont envisagées à la fin du XIXᵉ siècle afin de guider les navires transatlantiques aux abords des côtes américaines à l’aide d’émetteurs sonores. Par la suite, la construction des sous-marins fait apparaître un nouveau besoin : repérer les sous- marins en plongée. Le premier sonar est inventé en 1915 par Paul Langevin, et les sonars américains causeront la perte des sous- marins allemands en 1943.

1.2 Recherches scientifiques actuelles

Depuis ce temps, la recherche en acoustique sous- marine est essentiellement restreinte à l’étude des fonds marins et à des applications militaires : détection de sous- marins et de mines.

Les premières études psychoacoustiques sont menées dans les années cinquante, en marge néanmoins des études pour le milieu aérien. Des sous- mariniers appelés « Oreilles d’Or » se sont spécialisés dans la reconnaissance des sons subaquatiques. Il s’agit dans un premier temps de retranscription dans le domaine aérien de sons subaquatiques. Ensuite, des études sur la perception subaquatique montrent assez vite que les mécanismes de l’oreille sont altérés (Sivian, 1947).

Enfin, de nos jours, les recherches ont lieu avant tout au sein de l’armée américaine, mais aussi au LMA (Laboratoire de Mécanique et d’Acoustique) de Marseille, et au laboratoire IFREMER (Institut Français de Recherche pour l’Eploitation de la MER) à Brest. Sophie Savel a présenté une thèse en 2001 sur la localisation auditive subaquatique avec pour objectif d’améliorer l’orientation des plongeurs à l’aide de balises sonores, et François Bernaschina a présenté un travail sur le même sujet en 2003 à Genève.

1.3 La musique subaquatique

Les études scientifiques sont toujours menées avec des signaux sinusoïdaux, quelquefois des bruits blancs, mais guère plus. Si l’on cherche à obtenir des informations sur le rendu musical sous l’eau, c’est vers les compositeurs qu’il faut se tourner. Michel Rédolfi (« La Citta Liquida », Venise 2006, ou « Oniris- The Dream Tank », Nuit Blanche, Paris 2006) donne des explications très intéressantes sur la perception subaquatique car elles sont exprimées d’un point de vue musical et artistique. Il explique notamment que les timbres subaquatiques sont perçus comme médium/aigus (500- 5000 Hz) ce qui leur confère une fragilité cristalline. La perception est monophonique, à l’intérieur du crâne. Il explique qu’il existe un masquage temporel de 50 ms qui masque les premières réflexions et donnent l’impression de champ direct permanent. Selon lui, le milieu aquatique se prête à une musique éthérée, et nécessite qu’elle soit pensée différemment et composée spécialement pour le milieu aquatique.

Noêl Canivenq, fondateur de la société Aquamusique, avance l’hypothèse du « massage intra », soit « la conjonction de deux écoutes: l’une, traditionnelle, amplifiée via l’oreille, et l’autre, corporelle, et non-décodée par l’oreille mais ressentie par le corps sous forme d’une vibration ayant pour origine une tension alternative modulée ».

2. Cadre théorique

Certaines données scientifiques ont été vérifiées à partir des expériences menées dans ce mémoire. Elles seront exposées dans la partie 4.7. Il n’est traité ici que des recherches effectuées a priori.

2.1 Éléments d’acoustique sous-marine

2.1.1 Caractéristiques du milieu

2.1.1.1. Masse Volumique

L’eau a pour masse volumique:

p_eau =1000 kg/mx

Celle-ci ne varie quasiment pas en fonction de la température, du moins dans la gamme 20°C – 40°C qui nous intéresse (température classique de « baignade »). Le cas de l’eau salée peut être mentionné car il existe de plus en plus de piscines salées. La masse volumique de l’eau salée est p_mer =1030 kg/mx

2.1.1.2. Célérité

La vitesse de propagation de l’onde est imposée par les caractéristiques du milieu. L’eau étant un fluide incompressible, la célérité c dépend de la masse volumique p et du module d’élasticité E de ce milieu. Elle est donnée par la relation :

Avec E=2,25.10⁹ Pa , ce qui donne:

c=1500 m.s^—¹

La vitesse de propagation augmente avec la salinité de l’eau et avec sa température (+3 m.s^—1 par degré).

2.1.1.3. Impédance acoustique

Nous pouvons ensuite obtenir l’impédance acoustique caractéristique de l’eau :

Z _eau=p_eau c=1,5. 10⁶ Pa.s.m^—1

Cette impédance est beaucoup plus élevée que celle de l’air. L’impédance de l’air est Z _air =360 Pa.s.m^—1 à 20°C (soit un rapport de 3 500). Comme l’eau est un fluide incompressible, sa densité se rapproche plus des matériaux solides, et aussi de la densité du corps humain. Les impédances sont proches et cela va entraîner des changements dans la transmission des ondes d’un milieu à l’autre. Dans l’eau, les ondes sonores traversent le corps humain et celui-ci est perçu comme transparent par l’onde.

2.1.1.4. Facteur d’amortissement

Voici un tableau du facteur d’amortissement a en fonction de la fréquence:

f (kHz)	0,1	0,3	1	3	10	30	100	300	1000
a (dB/km)	0,001	0,01	0,07	0,1	1	5	30	100	500

Dans le spectre audible on remarque que les pertes sont minimes en fonction de la distance parcourue. L’atténuation sera donc entièrement due aux pertes par divergence (cf § suivant) et aux pertes par transmission au niveau des parois.

2.1.2 Les ondes élastiques de compression

Les ondes acoustiques dans les liquides et les gaz obéissent aux mêmes lois de la mécanique des fluides. Comme pour le milieu aérien, on peut donc partir de l’équation de d’Alembert pour déterminer la pression acoustique p :

Pour une propagation dans une seule direction, l’équation devient :

et admet comme solution :

avec f ₀, la fréquence de l’onde sinusoïdale.

Lorsque l’on considère la propagation selon les trois directions de l’espace supposé isotrope, on montre que la solution est une onde sphérique d’équation :

avec une décroissance en 1/r de l’amplitude de l’onde, soit -6 dB par doublement de distance.

L’intensité acoustique I à une distance R du point d’émission est donnée par la relation:

L’intensité acoustique est une grandeur homogène au carré de la pression acoustique. Elle décroit donc en 1/r² soit -3 dB par doublement de distance.

2.1.3 Échelle de mesure et pression de référence

L’unité de mesure utilisée sera toujours le décibel, et l’abréviation « log » signifie logarithme de base 10. Lorsque l’on souhaite parler d’un niveau absolu de pression, il est nécessaire d’avoir une pression de référence. Sous l’eau, celle- ci n’est pas 20 µPa comme dans l’air (seuil d’audition à 1 kHz) mais de 1µPa, soit 26 dB de plus que pour l’air.

p_ref=1.10^—6 Pa

On ne parle donc plus de dB SPL (Sound Pressure Level), mais de dB SL (Sound Level), à ne pas confondre avec le dB SL (Sensation Level) utilisé en psychoacoustique.

2.2 Perception auditive en milieu aérien

Cette partie a pour objectif d’expliquer brièvement le fonctionnement de l’oreille, ainsi que les facteurs de localisation. En effet, si les mécanismes des différentes parties des oreilles jouent un rôle dans la perception aérienne classique, ce n’est plus vraiment le cas sous l’eau.

2.2.1 Fonctionnement de l’oreille humaine

Fig.2: Schéma de l'oreille (d'après D. Pickard) — Fig.2: Schéma de l’oreille *(d’après D. Pickard)*

2.2.1.1. L’oreille externe

L’oreille externe est composée du pavillon (pinna) et du conduit auditif externe.

Elle joue un rôle d’amplification pour certaines bandes de fréquences :

La forme du pavillon permet d’amplifier un signal sonore de 10 à 15 dB vers 5 kHz.
Le conduit auditif externe amplifie le signal de 15 à 20 dB vers 2 kHz.

2.2.1.2. L’oreille moyenne

L’oreille moyenne va du tympan à la fenêtre ovale en passant par les osselets qui sont au nombre de trois: le marteau, l’enclume et l’étrier. Elle comprend aussi la trompe d’Eustache, qui permet de rétablir la même pression de part et d’autre du tympan grâce à sa communication avec le pharynx.

La chaîne des osselets est solidaire du tympan. La transmission est donc solidienne et elle joue le rôle d’adaptation d’impédance. Le rapport des surfaces entre le tympan et l’étrier est de 20 pour 1. Si l’on ajoute un effet de levier engendré par les osselets, la pression se retrouve multipliée par 26, soit une hausse de 30 dB environ. Cela nous donne la fonction de transfert suivante:

Fig.3: Fonction de transfert de l'oreille moyenne (Nedzelnitsky 1980) — Fig.3: Fonction de transfert de l’oreille moyenne *(Nedzelnitsky 1980)*

2.2.1.3 L’oreille interne

L’organe principal de l’oreille interne est la cochlée. C’est là qu’opère la transduction mécanique/électrique. Elle joue le rôle d’analyseur de spectre grâce à la membrane basilaire. Les fréquences s’étalent des aigus aux graves sur cette membrane à rigidité décroissante en forme d’escargot. Elles sont transmises à des cellules ciliées situées dans l’organe de Corti. Les influx nerveux sont ensuite envoyés au cerveau et sont traités dans le système auditif central.

Fig 4: Cochlée
(d'après R. Pujol) — Fig 4: Cochlée
*(d’après R. Pujol)*

Fig.5: Membrane basilaire
(d'après S. Blatrix) — Fig.5: Membrane basilaire
*(d’après S. Blatrix)*

2.2.2 Écoute binaurale

2.2.2.1 Définition

L’écoute binaurale est la capacité de percevoir un stimulus sonore dans les deux oreilles. La localisation se fait par différence interaurale d’intensité (DII), et de temps ou de phase (DIT).

2.2.2.2 Différences interaurales de temps

Les différences interaurales dites de temps correspondent à une différence de temps d’arrivée, ce qui équivaut à une différence de phase. On trouvera donc dans la littérature les deux termes pour désigner les DIT.

La différence de temps d’arrivée peut être calculée pour une source provenant de l’infini (approximation valable pour une distance grande par rapport aux dimensions de la tête) de façon suivante:

Fig.6: Calcul des DIT, modélisation de Woodworth

Dans la modélisation de Woodworth, la tête est modélisée par une sphère. La différence de temps d’arrivée de l’onde aux deux oreilles est :

Δ t= Δ d / c= r (α+sin α) / c

La différence de phase permet de localiser si la longueur d’onde de l’onde incidente est grande devant la différence de marche Δ d, c’est-à-dire pour les basses fréquences (jusqu’à 1,5 khz).

2.2.2.3 Différences interaurales d’intensité

Les différences d’intensité (DII) se produisent car les ondes sonores sont partiellement diffractées par la tête, de telle sorte que le signal atteignant l’oreille opposée à la source est atténuée. Ces différences sont donc propres à chaque individu,

et on peut les mesurer en réalisant une fonction de transfert de l’oreille, appelée HRTF (Head- Related Tansfer Function).

Fig.7: Evolution de la différence d'intensité en fonction de la position de la source sonore aux fréquences 200 Hz, 1 kHz, 4 kHz et 6 kHz
(d'après Fedderson, Sandel, Teas et Jeffress) — Fig.7: Evolution de la différence d’intensité en fonction de la position de la source sonore aux fréquences 200 Hz, 1 kHz, 4 kHz et 6 kHz
*(d’après Fedderson, Sandel, Teas et Jeffress)*

Les aigus étant plus diffractés par la tête, les DII permettent donc de localiser plutôt les hautes fréquences à partir de 1,5 kHz. On peut ainsi définir des domaines fréquentiels de localisation qui privilégient l’une ou l’autre méthode:

DIT∈1,5kHz∈DII

2.2.2.4 Localisation dans le plan azimutal

Dans le cas d’une écoute stéréophonique, quel que soit l’espacement des enceintes, celles- ci se trouvent dans le plan azimutal. Voici quelques expériences psychoacoustiques concernant la localisation dans le plan azimutal.

En 1796, Venturi met en évidence des confusions avant/arrière. En 1877, Ralegh note des confusions entre positions symétriques par rapport à l’axe des oreilles : cela crée des cônes de confusion dont l’axe de symétrie est celui des oreilles.

Le MAA (Minimal Audible Angle) a été étudié par Mills à partir de 1958 : il caractérise le pouvoir séparateur du système auditif dans le plan azimutal.

Fig.8: MAA pour des son purs à 0°, 30°, 60° et 75° (Mills, 1972) — Fig.8: MAA pour des son purs à 0°, 30°, 60° et 75° *(Mills, 1972)*

L’oreille arrive à séparer des sons purs dans le plan azimutal espacés de 1 à 3 degrés pour une source frontale, et les performances se dégradent vers l’axe des oreilles (cône de confusion). Les performances se dégradent aussi vers 2 kHz (le son est toujours perçu à l’avant) et vers 8 kHz (le son est perçu en haut).

2.2.3 Indices monauraux

Les cavités pavillonnaires de l’oreille externe créent des réflexions et des résonances. Cela induit une amplification de certaines fréquences (cf § 2.2.1.1.).

La géométrie des pavillons implique également des réflexions du signal incident : une partie de ce signal est réfléchie vers le conduit auditif avec un certain retard. De ce fait, l’addition du signal primaire et de ces réflexions constitue un indice supplémentaire de localisation qui permet notamment de résoudre des ambiguïtés avant/arrière.

2.3 Perception auditive en milieu subaquatique

Sous l’eau, le mode de conduction des ondes sonores est totalement différent du milieu aérien ; cela va entraîner notamment des pertes de sensibilité (au sens des décibels), et des changements dans les mécanismes de localisation.

2.3.1 Mode de conduction

La forte impédance de l’eau (Z_eau =1,5. 10⁶ Pa.s.m^—1 ) est responsable de la perte des mécanismes de l’oreille externe et de l’oreille moyenne. L’énergie est alors transmise à l’oreille interne par conduction osseuse de la boîte crânienne.

2.3.1.1 Détérioration des mécanismes de l’oreille

À partir du milieu du XXᵉ siècle, des travaux montrent l’inactivité des mécanismes de l’oreille (Sivian, 1947, Hamilton, 1957). Trois raisons sont avancées:

Z_eau=Z_pavillon : les pavillons ne jouent plus leur rôle d’amplificateur.
Le canal auditif se trouve rempli d’un liquide ayant une vitesse de propagation importante. Cela provoquerait un raccourcissement du canal, et donc un abaissement des ∆t.
L’onde qui arrive aux osselets n’est plus correctement transformée. Hollien (1973) explique cela de la façon suivante: dans l’air, le son se propage sous forme haute amplitude/faible force (Af), alors qu’en milieu liquide, c’est une propagation faible amplitude/haute force (aF). L’oreille moyenne ope$re dans l’air en convertissant la force du signal pour que celui- ci soit proche des propriétés du liquide cochléaire. Ainsi, les adaptations d’impe#dance implique#es dans l’audition ae#rienne sont du type Af-aF. Mais si l’oreille est immerge#e, les transformations subies sont de type aF-Af-aF, a$ cause de la présence d’eau dans le canal en amont des osselets. L’oreille moyenne aurait une fonction de réduction d’énergie dans l’air qui ne pourrait pas être maintenu dans l’eau…

On pourrait aussi penser que c’est la transition eau/air (bulle d’air dans l’oreille) qui ne s’opèrerait pas, mais il se trouve qu’on entend aussi bien avec de l’eau jusqu’au tympan (Hollien & Brandt, 1969). L’expérience a aussi été menée lors de ce mémoire et elle invalide l’hypothèse de la transition eau/air.

2.3.1.2 Conduction osseuse et conduction du crâne

Notre squelette, et particulièrement notre crâne, rentrent en résonance aussi bien dans l’air que dans l’eau. L’énergie est transmise à l’oreille interne via l’os temporal (os pair du crâne situé au niveau de la tempe). Les basses fréquences notamment sont ressenties physiquement à fort niveau en aérien. Seulement, dans l’eau, les seuils de perception de l’oreille sont 30 à 50 dB plus élevés que les seuils de perception « crâniens », ce qui fait que la perception par conduction osseuse prend le dessus dans notre perception.

2.3.1.3 Conséquences sur la sensibilité auditive

Les seuils de sensibilité subaquatiques sont donc de 30 à 50 dB supérieurs aux seuils aériens. La perte de l’amplification par le pavillon et le conduit auditif mettent donc la perception « crânienne » au même niveau que la perception par les oreilles (cf expériences oreilles bouchées/débouchées § 4.6.4). Ces seuils montent encore lorsque le crâne est recouvert d’une capuche, et ils augmentent aussi en fonction de la profondeur.

Le seuil de la douleur sous l’eau est d’environ 160 dB, mais il faut être prudent en pratique car on ne sait pas à quel point des vibrations puissantes (de basses fréquences notamment) peuvent avoir un impact sur le crâne.

2.3.2 Mécanismes de localisation

Les rares études consacrées à la localisation auditive subaquatique ont abordée le sujet à partir d’une estimation théorique de la taille des indices spatiaux, en prenant en compte la célérité et l’impédance de l’eau. D’après cette estimation, les propriétés acoustiques de l’eau causent une telle dégradation des indices de localisation que les auditeurs immergés devraient être incapables de localiser des sources.

Néanmoins, des études récentes ont montré que des plongeurs arrivaient à localiser de façon convenable et bien supérieure au hasard (S. Savel, 2001; F. Bernaschina, 2003), ce qui permet d’aborder les tests à venir avec un certain optimisme.

2.3.2.1 Différences interaurales de temps

La célérité dans l’eau étant de 1500 mètres par seconde, les différences interaurales de temps (DIT) sont divisées par 4,5. Il faut rajouter à cela le fait que la distance à prendre en compte n’est plus la distance interaurale (environ 18 cm) mais la distance inter- cochléaire (10 cm) et qu’il n’y a plus de contournement du crâne puisque les ondes traversent le cerveau, soit un rapport 9 entre les DIT aériennes et subaquatiques.

Pour une onde arrivant avec une incidence θ par rapport à l’axe de la tête, la différence inter- cochléaire de temps est donc donnée par:

Voici une courbe qui compare le modèle aérien et le modèle subaquatique:

Fig.9: Comparaison des DIT aériennes et subaquatiques (Savel, 2001) — Fig.9: Comparaison des DIT aériennes et subaquatiques *(Savel, 2001)*

Les DIT subaquatiques sont largement inférieures aux DIT aériennes. On retrouve le rapport 9 entre les mesures sous l’eau et hors de l’eau pour un même azimut.

2.3.2.2 Différences interaurales d’intensité

La tête étant « transparente » sous l’eau, il ne peut théoriquement pas y avoir de différence interaurale d’intensité. Cela supposerait, si l’on prend en compte uniquement la perception « crânienne », qu’on localiserait uniquement grâce aux DIT, c’est-à-dire que les basses fréquences seraient localisables, mais pas les aigus. Mais on ne peut pas affirmer que la perception par les oreilles ne fonctionne plus. Si les oreilles jouent encore un rôle, il se peut que les DII existent encore.

2.3.2.3 Localisation dans le plan azimutal

Une des hypothèses serait que les DIT sont perçues comme dans le milieu aérien et qu’un angle réel serait diminué d’un rapport 5 à 10. Ce qui veut dire qu’une base stéréophonique classique de 60° serait ramenée à 10° environ. Il faudrait donc se mettre quasiment entre les enceintes pour pouvoir localiser sous l’eau.

Fig.10: Angle subaquatique de 120° perçu comme un angle de 20° en aérien

Quoi- qu’il en soit, Fenstein a montré que l’angle minimum audible (MAA) subaquatique était en moyenne de 15° dans l’axe frontal pour des sons sinusoïdaux, et que les performances pouvaient augmenter et atteindre 10° pour des sons complexes et des sinus basse fréquence (Feinstein, 1973)

Sophie Savel a réalisé des tests en 2001 sur la localisation dans le plan azimutal (Savel, 2001). Les plongeurs étaient assis dans une nacelle à 3 mètres de profondeur en Mer Méditerrannée et ils étaient entourés de 8 haut- parleurs répartis régulièrement sur le plan azimutal (0°, 45°, 90°, 135°, 180°, -45°, -90°, -135°). Elle a notamment déduit de ses expériences que les oreilles contribuaient à améliorer la localisation, même si elles n’amplifiaient pas les signaux. L’oreille joue donc encore un rôle dans la perception. Il est donc recommandé de faire des expériences avec les oreilles dégagées. De plus, des mouvements de tête augmentaient de manière significative le pourcentage de bonnes réponses et levaient l’ambiguïté avant/arrière.

2.4 Écoute musicale en petit bassin, contribution acoustique du bassin

2.4.1 État de la recherche

La recherche concernant l’audition dans un bassin rempli d’eau est inexistante, et il est très difficile de prévoir a priori comment va se comporter un tel bassin. Les recherches psychoacoustiques ne portant que sur des expériences en champ libre, à notre connaissance, aucune recherche rendue publique n’a été menée à ce jour sur le sujet.

Les commentaires susceptibles de pouvoir nous aider sont ceux des personnes qui pratiquent régulièrement des écoutes subaquatiques. Le compositeur Michel Redolfi explique que pour lui, les premières réflexions sont masquées car elles nous reviennent avant 50 ms (effet Haas), et que cela donne une impression de champ direct. Les mélomanes subaquatiques parlent de son précis et intracrânien, ce qui correspond plutôt à une acoustique sèche.

2.4.2 Éléments d’acoustique des salles

Voici quelques formules fondamentales d’acoustique des salles. Le tableau suivant donne deux résultats selon l’approche de Sabine ou d’Eyring.

(a : coefficient d’absorption, S : surface, St : surface totale, V : volume)

2.4.3 Adaptation au milieu subaquatique

En suivant la même démarche qu’en aérien, il est possible de déterminer par l’expérience des coefficients d’absorption pour les parois du bassin. En tenant compte de la nouvelle célérité, la formule d’Eyring deviendrait:

et ce, seulement au-dessus de la fréquence de Schroeder qui augmenterait. C’est donc une démarche hasardeuse.

Une certitude, cependant est que l’échange à la surface est quasiment nul car l’impédance de l’eau est beaucoup plus élevée que celle de l’air. Toutes les ondes sont donc réfléchies à la surface (facteur de transmission : 0,005). Il existe donc une quantité non négligeable de premières réflexions dans un bassin. De plus, une musique diffusée sous l’eau n’est presque pas audible de l’extérieur, et cela peut être intéressant car un milieu isolé est alors créé.

Lors d’une écoute réalisée dans le SPA musical proposé par Aqua Musique en novembre 2007, j’ai pu constater la présence de nombreux modes propres. Ils peuvent être dus aux dimensions restreintes du SPA, mais aussi à des phénomènes plus complexes de vibration mécanique du fait de l’incompressibilité de l’eau.

Il semble donc prudent d’attendre les commentaires des tests avant d’avancer des théories sur le champ acoustique sous l’eau.

3. Problématique et cadre expérimental

Cette partie traite de la méthodologie qui a conduit à l’élaboration des tests à partir de la problématique du mémoire, et des aspects pratiques nécessaires au bon déroulement de ces tests.

3.1 Problématique

3.1.1 Écoute musicale en bassin

La problématique principale de ce mémoire, comme elle a été mentionnée dans l’introduction, est de travailler sur une écoute la plus représentative possible d’une écoute domestique : piscine privée ou baignoire. C’est seulement dans le cadre d’une écoute confortable avec un auditeur plutôt statique qu’une écoute musicale peut être étudiée et optimisée. Dans l’optique d’expériences avec un nombre suffisant de sujets, le lieu idéal est un petit bassin de piscine municipale (6 mètres par 12 généralement).

3.1.2 Écoute stéréophonique

Même s’il s’agit avant tout de faire une étude sur la perception subaquatique au sens large, à commencer par des questions concernant le ressenti physique et la restitution musicale, la question de la localisation est majeure. Il existe à l’heure actuelle une véritable contradiction entre les études scientifiques qui affirment qu’il est possible de localiser sous l’eau et les personnes qui ont l’habitude d’écouter sous l’eau et qui soutiennent que l’écoute est monophonique. Il semblait donc intéressant de faire quelques expériences sur ce sujet.

Pour le format de diffusion, la stéréo a été choisie pour plusieurs raisons. Tout d’abord, il est très difficile de placer un système multicanal dans une piscine. De plus, les résultats positifs n’étant même pas garantis pour une simple écoute stéréophonique, il serait hasardeux de s’attaquer au multicanal. Enfin, c’est le format le plus employé et qui offre le plus large choix d’enregistrements à diffuser.

3.1.3 Sur une comparaison avec l’écoute aérienne

La problématique d’une comparaison avec un système stéréophonique hors de l’eau, la ne sera pas abordée. En effet, la perception subaquatique est trop différente de la perception traditionnelle.

Plutôt que de comparer avec le milieu aérien, il s’agit d’optimiser une écoute sous l’eau en partant du ressenti des participants et de chercher à valider un système stéréophonique nouveau.

3.2 Partenariat avec Aqua Musique

3.2.1 Domaine d’activité

Aqua Musique est une société franco- espagnole qui développe des haut-parleurs subaquatiques. Elle est fournisseur officiel de l’équipe de France de natation synchronisée, et elle a équipé plus de 15 000 piscines. Elle développe aussi des accessoires pour l’écoute subaquatique comme des nattes de flottaison.

Récemment, cette société est entrée dans une ère nouvelle avec la naissance du SPA musical, une baignoire spécialement dédiée à l’écoute subaquatique (fig 11).

3.2.2 Les haut-parleurs H062m

Ces haut- parleurs sont la version mobile d’Aqua Musique (voir fiche technique en annexe 7.1.2). Les courbes de réponses sont disponibles en annexe 7.1.2. Le système est le même que pour un haut- parleur classique, avec une membrane fixée sur une bobine mobile. L’ensemble est moulé dans un matériau plastique étanche. Un boîtier fusible de 2 ampères (bleu foncé sur la photo) placé à l’extrémité du câble isole les parties sous tension de l’installation (amplificateur) de l’eau afin d’éviter l’électrocution.

Fig. 12: Haut-parleur subaquatique H062m

Deux haut- parleurs ont été utilisés pour les expériences (un jaune et un rouge).

3.2.3 Les attitudes d’écoute

L’aide d’Aqua Musique a été précieuse pour ce qui est des attitudes d’écoute. En effet, il y a plusieurs façons d’écouter sous l’eau. Le rendu n’est pas le même en fonction de la position de l’auditeur. On peut aussi bien écouter sur le dos en faisant la planche, sur la ventre à la surface, sur le ventre au fond du bassin, assis au fond du bassin. Cela dépend aussi des appréhensions de chacun.

Pour cela, outre les masques et les tubas prêtés par la piscine, Aqua Musique a mis à disposition des nattes de flottaison qui permettent une écoute en surface, sur le dos, particulièrement adaptée pour ceux qui se sentent moins à l’aise dans l’eau, ou qui ne souhaitent pas rester en apnée.

3.3 La Piscine Mathis

C’est dans le petit bassin de la piscine Mathis, 15 rue Mathis dans le XIXᵉ arrondissement de Paris, que se sont déroulés les tests.

Ce bassin fait 6 mètres de large, 12 mètres de long, et le fond est incliné dans le sens de la longueur. La pente est d’inclinaison régulière. La profondeur est de 55 cm d’un côté et de 1,30 m de l’autre. Des marches permettent de rentrer dans l’eau à l’endroit où l’eau est à 55cm. Cela représente un volume de 66,6 m³ et une surface totale de 128 m² de parois (200 m² en comptant la surface de l’eau).

Fig. 14: Schéma du petit bassin de la piscine Mathis

3.3.1 Choix de la piscine

Il fallait avant tout rechercher une piscine avec un petit bassin qui simule le mieux possible une piscine privée. Le choix a été motivé par la proximité avec le Conservatoire National Supérieur de Musique de Paris d’où venaient une grande partie des participants. La piscine Mathis (Métro Crimée) répondait à ces critères. La profondeur d’eau limitée était un atout dans le sens où les participants n’avaient pas à faire d’effort pour flotter et pouvaient se consacrer pleinement à l’écoute.

De plus, le petit bassin se trouvait tout près de locaux pouvant être utilisés (infirmerie, vestiaire pour handicapés), ce qui a permis d’installer une mini- régie à l’abri des éclaboussures et des jets d’eau intempestifs provoqués par certains utilisateurs de tubas…

3.3.2 Les séances de tests

Sachant que de nouvelles questions allaient arriver au fur et à mesure des expériences, il a été décidé de faire une première série de tests comprenant des mesures physiques du bassin ainsi qu’un premier questionnaire afin de donner des pistes de recherches pour la suite. Après observation des résultats de ce premier test, une deuxième série a été programmée avec des nouveaux points à étudier.

Il a été très compliqué d’arriver à trouver des créneaux horaires pour faire les tests. Entre les horaires d’ouverture au public, les plages réservées aux scolaires, et celles réservées aux clubs, nous avons réussi à dégager des créneaux aux dates suivantes :

	*Date*	*Horaires*	*Motif*
Premier test	Vendredi 22 février	13h- 16h	Mesures physiques & 1er questionnaire
Deuxième série de tests	Jeudi 13 mars	14h- 16h	2ᵉ questionnaire
	Vendredi 14 mars	14h- 16h	2ᵉ questionnaire
	Jeudi 20 mars	14h- 16h	3ᵉ questionnaire
	Vendredi 21 mars	14h- 16h	4ᵉ questionnaire

3.4 Déroulement des tests

3.4.1 Description des tests

Il a été convenu que la durée des tests serait d’une heure. Les sujets peuvent difficilement rester statiques dans l’eau plus longtemps sans ressentir le froid.

Il fallait ensuite trouver un moyen de faire remplir à chaque participant un questionnaire à chaud. Les données auraient été moins précises si le questionnaire avait été rempli après la séance. Les séances ont donc été découpées en quatre parties de 15 min environ. Pendant 10 min, les participants faisaient des écoutes dans le bassin, ensuite ils avaient 5 min pour répondre aux questions de la dernière partie écoutée (les questionnaires étaient répartis sur le bord de la piscine à proximité des serviettes pour éviter les flaques et laisser le questionnaire à peu près lisible).

3.4.2 Sujets

Durant cette série de tests, 41 questionnaires ont été remplis, 6 personnes étant passées aux deux séries, cela représente 35 individus âgés de 19 à 43 ans. Les sujets possèdent pour la plupart une formation musicale de haut niveau et/ou une formation d’ingénieur du son.

Il était demandé à chaque participant en début de questionnaire s’il était ingénieur du son ou en formation, et s’il appréhendait un peu le milieu ou s’il se sentait comme un poisson dans l’eau.

3.4.3 Contenu du premier questionnaire

Les questionnaires sont disponibles dans leur intégralité en annexe (cf. § 7.3).

Une attention particulière a été apportée à la formulation des questions dans les questionnaires. Les questions sont ouvertes, posées de façon la plus objective possible, afin que les sujets soient libres de répondre comme ils l’entendent, avec leur propre vocabulaire.

Les principaux thèmes sont abordés ici afin d’avoir une vision globale des expériences, et de voir l’évolution d’un questionnaire à l’autre. (Les nouveautés (bleu) par rapport aux questionnaires précédents et les parties inchangées (orange) sont en couleur).

3.4.4 Contenu du deuxième questionnaire

On notera pour la suite que la première partie est quasiment inchangée. En effet, l’expérience étant nouvelle pour beaucoup, il est nécessaire de passer par une phase de découverte et de familiarisation.

3.4.5 Contenu du troisième questionnaire

On peut voir que l’étude sur la localisation est améliorée

3.4.6 Contenu du quatrième questionnaire

Dans ce quatrième questionnaire, la partie sur la dynamique est abandonnée. L’étude sur la localisation est encore améliorée et elle intègre maintenant une nouvelle partie sur la position d’écoute optimale.

4. Expérimentation

Les mesures réalisées à l’aide de l’hydrophone lors de la première séance ont permis de caractériser l’acoustique du bassin. Les résultats sont exposés au point suivant. Les tests perceptifs sont ensuite résumés et analysés. La totalité des réponses des sujets est disponible en annexe.

4.1 Mesures physiques

4.1.1 Description du matériel de mesure

Lors de la première séance d’expérimentation, quelques mesures ont pu être menées afin de mesurer l’acoustique du bassin et les caractéristiques des haut-parleurs. Ces mesures ont été faites à l’aide de sinus glissants de 30 secondes (générés à l’aide du logiciel Altiverb), et de bruit blanc (généré sur le logiciel Pyramix).

Si l’on cherche à déterminer les « facteurs limitants » de la chaîne audio en termes de qualité, ce sont sans aucun doute les haut- parleurs. Il était donc inutile de chercher à utiliser le matériel le plus performant possible. L’utilisation de matériel Hi-Fi se rapproche d’ailleurs d’une écoute domestique telle qu’on peut la retrouver sur des installations de ce genre. L’hydrophone qui captait le signal étant omnidirectionnel, il était positionné la tête en bas et attaché sur des « frites » en mousse. Il pouvait donc être déplacé à loisir.

4.1.2 Résultats

La remarquable linéarité de la réponse en fréquence de l’hydrophone (voir annexe 7.1.1) permet de n’imputer les résultats qu’aux haut-parleurs et au bassin.

4.1.2.1 Mesures à 1 mètre

La première mesure réalisée est celle d’un sweep de 30s à un mètre et avec un seul haut- parleur. Cela permet d’obtenir le champ acoustique généré par le couple enceinte/acoustique du bassin. Une analyse spectrale réalisée sur Wavelab permet de le visualiser, et permet aussi de comparer les résultats obtenus en fonction des deux méthodes (les fichiers audio ont été calibrés grâce à une impulsion avant chaque sweep).

Fig. 17: FFT du sweep dans le bassin à 1 m.

Cette transformée de Fourier montre un spectre audible très « chaotique ». On note deux bosses de fréquences très marquées vers 120 Hz et entre 400 et 700 Hz. L’hydrophone était positionné à 50 cm de la surface. Cette courbe correspond à ce qu’ont ressenti certains sujets, en particulier à la surface (voir parties suivantes). Elles sont probablement dues à des modes de résonance du bassin (cf. § 4.7), d’autant plus que ces bosses n’apparaissent pas sur les courbes de réponses mesurées en annexe (cf §7.1.2.3).

On peut noter aussi que le bruit de fond est assez élevé dans une piscine municipale (en dessous de 20 Hz, il s’agit uniquement de bruit de fond). Il est dû à la filtration du bassin que nous n’avons pu stopper.

L’amplificateur délivrant une puissance telle que le haut-parleur soit proche de la saturation, on en déduit que la dynamique disponible avec le matériel d’expérimentation se limite à 35/40 dB.

Cette courbe est à comparer avec la FFT du sweep émis:

Fig.18: FFT du sweep original généré par Altiverb

La courbe théorique devrait être plate puisque qu’un sinus glissant est sensé balayer le spectre de manière uniforme. Or, on voit qu’il existe notamment une atténuation dans les aigus…, contrairement à la transformée de Fourier d’un bruit blanc comme le montre la courbe ci-dessous :

Fig. 19: FFT du bruit blanc généré par Pyramix

Voici une comparaison de la mesure du bassin avec le sweep d’une part, et avec le bruit blanc d’autre part.

Fig. 20: Comparaison du sweep (en haut) et du bruit blanc (en bas) à 1 m

On remarque que les deux courbes sont assez ressemblantes si ce n’est qu’on observe une bosse dans le haut du spectre avec le bruit blanc. Cela peut être dû à deux facteurs :

Le sweep avait une baisse dans les hautes fréquences: on le retrouve ici.
Le niveau de diffusion ayant été calibré pour le sweep, le bruit blanc a probablement fait saturer le haut- parleur. Le spectre instantané d’un bruit blanc étant large bande, la puissance efficace est plus élevée à niveau de diffusion égal.

4.1.2.2 Mesures à 8 m

Par comparaison avec le milieu aérien, ce point de mesure est situé dans le champ réverbéré. Il devrait donc permettre de juger de la contribution réelle du bassin.

Fig. 22: Comparaison du sweep à 1 m (en haut) et du sweep à 8 m (en bas)

Les courbes permettent difficilement de tirer une conclusion. Elles sont en effet très ressemblantes, et la légère hausse entre 1,5 kHz et 2,5 kHz est probablement due à la présence de clapotis sur la fin de la mesure. Le peu de différence indique néanmoins qu’on a bien 2 modes de résonance du bassin.

4.1.2.3 Mesures dans une baignoire

Le champ acoustique a aussi été mesuré dans une baignoire. Il s’agit d’une baignoire classique, qui est posée sur des pieds (elle n’est donc pas moulée).

L’analyse spectrale du sweep obtenu montre la très grande « activité vibratoire » de la baignoire. Lors de l’expérience, le sweep était audible aussi fort dans l’eau que hors de l’eau. Il y a deux grands pics vers 100 Hz et vers 4 kHz. En effet, lors des écoutes en baignoire réalisées en marge des expériences à la piscine Mathis, nous avons pu nous rendre compte de l’aspect très « creusé » du spectre, avec beaucoup de basses, peu de médiums, et beaucoup d’aigus (4 kHz- 10 kHz).

4.1.2.4 Implémentation dans l’altiverb

Des réponses impulsionnelles (IR) du bassin ont été déterminées à partir des différents sweeps diffusés dans le bassin. Elles ont été obtenues par déconvolution (il s’agit en fait d’une nouvelle convolution du sweep original avec celui enregistré dans le bassin).

Cinq réponses impulsionnelles ont été implémentées (en mode mono to mono):

A 1 mètre dans l’axe du haut- parleur
A 1 mètre à 45° par rapport à l’axe du haut- parleur
A 1 mètre à 90° par rapport à l’axe du haut- parleur
A 8 mètres dans l’axe des hauts parleurs
Dans une baignoire classique

Fig. 25: Implémentation des IR dans l'Altiverb — Fig. 25: Implémentation des IR dans l’Altiverb

Cela donne une bonne idée du résultat. Même si le mode de perception n’est plus le même, on ressent quand même le resserrement du spectre qui était caractéristique sous l’eau. Les haut-parleurs semblent assez peu directifs, on perçoit néanmoins une légère perte dans les aigus à 45° et à 90°. À 8 mètres, même s’il y a quelques modifications, on garde en effet l’impression d’être dans un champ direct des enceintes, enfin dans la baignoire, le déséquilibre spectral est flagrant. Les bosses de résonance sont très prononcées, mais le rendu garde toujours l’aspect « aquatique » perçu dans la piscine Mathis.

4.2 Introduction aux tests perceptifs

Comme certains points ont été abordés lors de plusieurs séances, voici un tableau récapitulatif des différents points étudiés ainsi que du nombre de personnes qui y ont répondu:

Les expériences sont regroupées par thème, sans tenir compte de l’ordre chronologique des séances de tests. Les points étudiés sont néanmoins exposés dans le même ordre que celui utilisé dans chaque questionnaire.

4.3 Ressenti physique

Cette première question (la toute première du questionnaire) est très importante car elle concerne le premier ressenti des participants après avoir écouté plusieurs extraits de styles différents. Il leur était demandé de réfléchir plus spécialement au ressenti physique mais aussi de donner leurs impressions générales. De ce fait, certains éléments relatifs aux questions ultérieures sont déjà donnés. Les aspects spectraux sont vus dans la partie suivante (partie 4.4).

4.3.1 Analyse

Pour ce test, les auditeurs pouvaient se déplacer à loisir dans le bassin et essayer différentes attitudes d’écoute. Les descriptions du ressenti permettent d’accéder à une représentation mentale des sujets et à leur façon d’aborder l’expérience. Elles ont été retranscrites dans le tableau suivant telles que les 41 participants les ont notées dans le questionnaire. Elles sont classées par ordre décroissant d’apparitions dans deux catégories : points positifs et neutres/points négatifs. Seuls les mots de racine commune ont été assemblés (ex. surpris/surprenant) ou les synonymes vraiment proches (ex. détendant/relaxant).

*Points positifs ou neutres*				*Points négatifs*
Agréable	18	Détendant/ Relaxant	3	Pas de localisation/ Mono	9
Ressenti physique/ Dans le corps	10	Enorme/ Terrible	2	Ressenti physique des basses gênant	5
Ressenti physique/ Dans le corps	10	Douceur/ Pas agressif	2	Ressenti physique des basses gênant	5
Dans la tête	6	Etrange	2	Désagréable à fort niveau	3
Immersion/ Entouré	6	Amusant/ Sympa	2	Inhomogène	2
Surpris	5	Pur	1	Fatiguant	2
Différences oreilles bouchées ou non	4	Pas de bruits extérieurs	1	Est-ce que c’est dangereux pour le cœur?	1
Différences oreilles bouchées ou non	4	On se sent bien	1	Est-ce que c’est dangereux pour le cœur?	1
Comme au casque	3	Écoute naturelle	1	Pas assez fort	1
Même oreilles bouchées	3	Original	1	Bruit du tuba gênant	1
On perçoit la reverb originale	3	Partout	1
On perçoit la reverb originale	3	Propre	1

Pour ce qui est du ressenti physique, 74 remarques sont positives, contre 23 négatives, qui plus est si l’on considère que le fait de ne pas localiser est un point négatif. En effet, une véritable question se pose quant à l’utilité de la localisation (cf. discussion § 4.6.).

C’est donc pour beaucoup de participants une expérience « agréable », « surprenante ». Beaucoup de sujets ne s’attendaient pas à ce que la perception subaquatique fonctionne aussi bien. D’ailleurs, sur les 11 personnes qui ont participé au premier test, 6 sont revenues lors de la deuxième série…

Le ressenti dépend aussi de la familiarisation avec le milieu. En effet, les commentaires négatifs ont pour la plupart été écrits par des sujets qui se considéraient comme peu à l’aise dans l’eau. Leur appréhension s’est donc traduite par une crainte vis-à-vis des vibrations.

4.3.2 Conclusions

Il s’agit donc d’une expérience très positive pour la plupart des sujets. C’est une expérience nouvelle, qui est « surprenante » et « agréable ». Les sujets sont

« immergés » et ils « perçoivent la musique physiquement », « dans la tête ». Ces « vibrations » peuvent néanmoins s’avérer « gênantes » dans les basses fréquences et à fort niveau. Enfin la « localisation semble impossible », le son étant perçu « dans le crâne ».

4.4 Rendu spectral, musical et dynamique

4.4.1 Rendu spectral

Comme pour le ressenti physique, le rendu spectral était une des pistes d’écoute lors de la première partie de chaque séance. Les réponses sont donc diverses et variées. Elles traduisent de nouvelles sensations et le vocabulaire employé par chacun et important. Cette partie sera donc traitée comme celle sur le ressenti physique, avec un tableau recensant les mots employés par les sujets et leur fréquence d’apparition. Les participants pouvaient de nouveau se déplacer dans le bassin.

*Points positifs ou neutres*		*Points négatifs*
+ de basses au fond	12	Trop de graves	9	Résonances gênantes	1
³ en fonction de la profondeur	8	Pas assez de graves	9	Extrêmement changé	1
³ en fonction de la profondeur	8	Pas assez d’aigus	7	Basses agressives	1
³ en fonction de la position	7	Les mediums moches en surface	7	Son téléphonique	1
³ en fonction de la position	7	Les mediums moches en surface	7	Aigus trop doux	1
Voix pop bien rendue	3	Trop d’aigus	6	Provenance floue	1
Audible	2	Pas assez de médiums	4	Mauvaise précision	1
Reconnaissable	2	Bande passante réduite	4	Filtrage en peigne	1
Écoute de qualité	2	Timbres modifiés	4	Sourd	1
Intelligibilité	2	Saturation/ distorsion	4
Timbres conservés	2	Manque de clarté	2
+ fort près des parois	2	Étouffé/émoussé	2
Large spectre	1	Lointain	2
Fin	1	Inégal/ Déséquilibré 2

Pour ce qui est du rendu spectral, les remarques sont formulées avec la perception aérienne comme référentiel, d’où la présence de nombreuses modifications spectrales qui peuvent apparaître comme « négatives » (62 % des remarques). La perception du timbre sous l’eau est donc très différente de celle en milieu aérien. Il est aussi intéressant de voir qu’il y a souvent une impression et son contraire (trop de graves/pas assez de graves, ou pas assez d’aigus/trop d’aigus). Bien sûr, ce sont des termes assez vagues mais cela montre bien que c’est une approche totalement nouvelle et assez difficile à décrire.

Néanmoins, deux points mis en évidence lors de ce test peuvent expliquer ces contradictions. Il s’agit des différences en fonction de la profondeur (8 fois mentionnées) ainsi que des différences en fonction de la position (7 fois mentionnées). Cela met en évidence le fait qu’un bassin est un volume inhomogène, et que la perception varie en fonction de la position (même indépendamment de la distance aux hauts- parleurs). Les auditeurs ont donc répondu différemment en fonction de leur attitude d’écoute et de leur position dans le bassin. Un fait à peu près certain est qu’il y a beaucoup de médiums à la surface et beaucoup de basses au fond.

4.4.2 Rendu musical

À la question « Trouvez-vous que certains extraits sont moins bien restitués que d’autres ? », 38 sujets ont répondu « oui », soit 93% des participants.

Comme tous les sujets n’ont pas écouté les mêmes extraits, le tableau suivant regroupe les données des différents tests et permet d’établir un classement subjectif des extraits qui ont été perçus comme ayant « le moins bon rendu »:

*Genre musical*	*Moins bon rendu*	*Sujets* *interrogés*	*Pourcentage*
Classique	31	41	73 %
Electro	7	41	17 %
Voix Parlée	2	11	18 %
Jazz	1	11	9 %
Techno	2	11	18 %
Chant grégorien	11	28	39 %
Pop	1	28	3%

Les raisons principales évoquées pour expliquer le mauvais rendu de certaines musiques sont :

La dynamique de certains extraits qui est très mal restituée sous l’eau, ce qui est vrai pour la musique classique (notamment pour l’extrait symphonique qui était un grand crescendo orchestral).
Les extraits qui demandent de la finesse au niveau de la restitution des timbres, ainsi que de la richesse spectrale. Les transitoires étaient altérées dans l’orchestre.
Pour la techno et l’électro, les raisons avancées étaient souvent des basses qui étaient désagréables et trop présentes. Ce sont d’ailleurs les mêmes personnes qui ont été sensibles aux vibrations et aux basses fréquences lors de la question sur le ressenti physique.

Lors du premier test, les très bons résultats concernant l’intelligibilité de la voix parlée (10 sur 11 ont tout compris, et le dernier a presque tout compris) ont permis d’abandonner des idées de tests d’intelligibilité pour les séances ultérieures, la qualité d’écoute étant globalement très bonne.

4.3.3 Rendu dynamique

Le premier test avait permis de mettre en évidence le fait qu’une grande dynamique était mal restituée lors d’une écoute subaquatique, d’où l’idée d’un test sur la compression.

Deux extraits (un jazz et un classique) ont été diffusés à trois reprises, dans la version originale, avec une compression de 2:1 (Seuil: -40 dBFS, Attaque: 10 ms, Release: 300 ms) et avec une compression de 10:1 (mêmes réglages). Les trois extraits étaient diffusés dans un ordre pris au hasard et il était demandé aux participants d’identifier les versions. La notion de compression étant délicate pour certains, seuls les résultats des ingénieurs du son (ou ingénieurs du son en devenir) sont exposés ici :

Pour l’extrait Jazz, il y a eu 73 % de bonnes réponses (le probabilité de donner la bonne réponse en répondant au hasard est de 16,6 %). C’était un morceau qui était déjà compressé par ailleurs. Par contre, pour l’extrait classique, il n’y a eu que 46 % de bonnes réponses, alors que les versions compressées à 10:1 en auraient fait bondir plus d’un en aérien. De plus, si l’on considère que deux personnes ne se sont pas prononcées pour l’extrait classique, le pourcentage de réussite passe à 40 %. Cela reste néanmoins supérieur au hasard.

La perception de la dynamique semble donc très limitée sous l’eau. Quant à savoir s’il peut être intéressant de compresser des œuvres avec une grande dynamique, les réponses sont partagées. Certaines personnes ont estimé que la compression était nécessaire sur certains extraits (classique notamment) alors que d’autres pensaient que dans un contexte moins bruyant, une grande dynamique aurait pu être intéressante.

4.4.4 Conclusions

Cette première approche avec l’écoute subaquatique a rencontré un vif intérêt et a permis de fixer les points suivants :

4.5 Contribution du bassin

4.5.1 Acoustique du bassin

Une première expérience sur l’acoustique du bassin a été faite lors de la première série de tests. Comme les références sur la question manquaient cruellement, les questions étaient d’ordre général. Il était demandé aux 11 participants de prêter attention aux notions de champ proche, de champ lointain et de distance critique.

Les enceintes étaient disposées à mi-hauteur, là où il y avait 1m 30 de profondeur, et dirigées vers le reste du bassin. Par analogie avec le modèle aérien, une partie de la piscine était dans un champ supposé proche (près des haut- parleurs), l’autre partie était dans un champ supposé diffus.

La première question posée après 10 minutes d’écoute était :

« Peut-on adapter la théorie aérienne sous l’eau et considérer qu’il y a un champ direct et un champ réverbéré ? »

Sur 11 participants, 7 ont pensé que c’était impossible. Il leur semblait que le « rapport son/direct son réverbéré ne changeait pas », qu’il n’y avait « aucun espace ». La seule différence entre une position proche et une position lointaine était une différence de niveau. Certains sujets ont aussi remarqué que le volume augmentait à proximité des parois.

Ceux qui ont dit que la théorie aérienne pouvait s’appliquer parlaient néanmoins de réverbération « sèche », « assez neutre » ou encore d’« acoustique peu réverbérante ». Les différences entre son direct et son réverbéré étaient perçues comme des modifications spectrales.

Pour tous les sujets qui ont répondu à la question (9 sujets), le point d’écoute optimal se trouvait être dans la zone où il y avait le plus de niveau sonore.

Fig. 27: Zone d'écoute préférentielle — Fig. 27: Zone d’écoute préférentielle

Enfin, un point intéressant qui correspond à la théorie est que la présence de personnes entre l’auditeur et les enceintes ne modifie en rien la perception. Le corps est donc bien perçu comme transparent par l’onde. Cette question était nécessaire au premier test afin de savoir si les écoutes devaient être individuelles ou non par la suite.

4.5.2 Homogénéité du bassin

Lors de la deuxième série de tests, une expérience a été menée pour essayer de caractériser l’inhomogénéité du bassin, et plus particulièrement les différences en fonction de la profondeur qui avaient été mises en évidence lors du premier test.

Deux extraits de 30 s chacun (classique puis jazz latino) ont été diffusés à deux reprises avec deux positionnements d’enceintes différents.

Les participants devaient écouter au fond du bassin et en surface afin de noter les différences entre les 2 placements d’enceintes. Ils devaient ensuite essayer de déterminer une position d’écoute et un positionnement d’enceintes préférés.

Les résultats pour ce qui est des différences de perception en fonction de la profondeur vont dans le même sens que lors des impressions générales à la première question:

Plus de basses au fond et plus fort
Médium renforcé en surface
Immersion meilleure au fond

Néanmoins, la position des enceintes joue un rôle non négligeable:

Plusieurs personnes trouvent que les enceintes en surface donnent un rendu plus homogène.
Les personnes en faveur des enceintes au fond font ressortir une meilleure définition ainsi qu’un gonflement des basses agréable.

Peut- on alors déterminer un couple « position d’écoute/placement d’enceintes » qui serait optimal?

Fig. 29: Position d'écoute, placement des enceintes — Fig. 29: Position d’écoute, placement des enceintes

On voit que les résultats sont assez variés, et dépendent des goûts de chacun.

Néanmoins, certaines lignes ressortent :

Préférence pour une écoute au fond (64 %)
- avec les enceintes en surface (équilibre, immersion)
- avec les enceintes au fond (volume, immersion, plus de basses)
Lors d’une écoute en surface il vaut mieux mettre les enceintes au fond (si par exemple les enceintes sont encastrées).
Certaines personnes ont proposé d’elles- même une version intermédiaire (trop de graves au fond, pas assez en surface)

4.5.3 Conclusions

Les expériences relatives au champ acoustique dans le bassin permettent de tirer les conclusions suivantes:

4.6 Localisation

Les tests de localisation subaquatiques ont été très surprenants. Les adeptes de l’écoute subaquatique affirment que la perception est mono, dans la tête. Une autre question se posait : « Quel intérêt avons-nous à localiser ? » En effet la sensation interne, qui est « laissée pour compte après la naissance » (N. Canivenq), serait peut-être affaiblie en cas de localisation. Les trois points suivants montrent l’évolution qu’ont connu les questionnaires afin d’arriver à des résultats probants.

4.6.1 Localisation frontale

Lors du premier test, quatre extraits ont été proposés:

Un extrait symphonique diffusé uniquement à gauche ou uniquement à droite (4 fois le même extrait, dans l’ordre G, G, D et D)
Un extrait de maracas qui passait d’une enceinte à l’autre (aucun indice sur le nombre de changements, le chemin parcouru était G, D, G, D et puis Centre)
Un extrait de Rock (une guitare à gauche, l’autre à droite)
Un extrait de musique symphonique (pour essayer de distinguer des plans sonores)

Les 11 sujets étaient placés sur la ligne médiane (autant que possible vu le manque de place).

Fig. 30:
Placement des auditeurs — Fig. 30: Placement des auditeurs

Les réponses correctes sont uniquement les séquences reconnues dans leur totalité. La réponse G,D,G,D était considérée comme bonne pour les maracas.

Les résultats sont donc très bons (resp. 64 % et 73 % de bonnes réponses), la réponse aléatoire se situant à 12,5%. De plus, ce ne sont pas les mêmes sujets qui n’ont pas trouvé chacune des séquences : en effet, 3 de ceux qui n’ont pas trouvé l’extrait symphonique se sont rapprochés du plan des enceintes pour les maracas et ont donné la bonne réponse. Les réponses sont en effet meilleures pour les personnes situées devant. Certains ont même trouvé cela « facile ». Cela confirme l’idée que l’angle d’écoute sous l’eau est beaucoup plus élevé qu’en aérien, pour obtenir de bons résultats (cf § 2.3.2.3)

Après discussion, il a été mis en évidence qu’on localisait « par hémisphère », mais que cela restait une perception intra- crânienne.

Par contre pour les extraits plus complexes, les réponses sont nettement plus mitigées. En effet, les rares personnes qui ont entendu les guitares en stéréo dans l’extrait Rock ont avoué avoir été influencés car c’est une pratique fort courante, ou encore parce qu’ils connaissaient le morceau. Et en ce qui concerne l’extrait symphonique, personne n’a pu répondre, ou alors c’était encore une fois par connaissance avouée de la disposition d’un orchestre symphonique.

4.6.2 Localisation dans le plan des enceintes

4.6.2.1 Séances du 13 et 14 mars 2008

Comme la localisation se fait par hémisphère, les résultats devraient être maximisés dans le plan des enceintes. C’est ce qui a été fait lors de ces deux séances.

Les 13 sujets passaient par quatre au maximum, en carré, entre les deux enceintes.Les extraits étaient diffusés par ordre de complexité croissante:

Un duo de guitares acoustiques (pané G/D)
« Bang Bang » de Nancy Sinatra (guitare électrique à droite, voix à gauche)
Un extrait électro (voix panées, sons tournants)
Un extrait symphonique (la difficulté ultime, une fois de plus)

Les réponses s’affinent nettement lorsqu’on se trouve dans le plan des enceintes. Par contre, pour ce qui est de l’intérêt de la localisation, les voix ne sont pas unanimes : 55 % pensent que c’est intéressant, 45 % pensent que cela ne vaut pas la peine. Cela dit, les sceptiques vis-à-vis de la stéréophonie existent aussi pour les écoutes aériennes…

4.6.2.2 Séances du 20 et 21 mars

Pour vraiment entendre quelle était la contribution de la stéréo par rapport à la mono, il a été décidé lors des deux dernières séances de diffuser d’abord chaque extrait en mono, puis en stéréo.

Les résultats ne sont pas meilleurs en termes de localisation avec une écoute monophonique au préalable. Au contraire, les résultats sont moins bons, mais c’est probablement lié au fait que plusieurs sujets n’étaient pas ingénieurs du son. Par contre, les sujets se sont accordés à dire que la stéréo donnait un meilleur rendu (surtout pour la musique classique). Les mots qu’ils ont employés sont restitués par fréquence d’apparition :

Sensation d’espace	4	Précision	1
Aéré	3	Largeur	1
Plus de définition	2	100 fois meilleur	1
Clarifie	2	Plus Ample	1
Profondeur	1	Mieux	1
Enveloppement meilleur	1	Ça respire	1
Plus agréable	1

Ces réponses sont collectées sur les 17 personnes qui ont pu comparer chaque extrait en mono et en stéréo.

4.6.3 Point d’écoute

Une dernière question est survenue suite aux résultats précédents. Maintenant que l’apport de la stéréo a été démontré, rien ne nous oblige à localiser complètement à 180°. Trois sujets ont même dit que la localisation les fatiguait. De plus, nous sommes plus habitués à écouter de la musique en position frontale. Il s’agirait donc de trouver un compromis entre localisation et confort d’écoute et d’essayer de définir un point d’écoute optimal. Cela permettrait de valider l’hypothèse théorique selon laquelle l’angle d’écoute est environ 6 fois plus grand en aérien (cf. § 2.3.2.3).

La formulation de la question il est vrai suggérait une réponse en retrait par rapport à l’axe des enceintes. Voici néanmoins ce que les participants ont noté :

Fig. 31: Point d'écoute optimal — Fig. 31: Point d’écoute optimal

Lorsque l’auditeur n’est plus dans le plan des enceintes, la sensation d’espace est quand même bonne avec une diffusion stéréo, et la localisation est encore possible (le test de localisation frontale l’avait partiellement démontré). Il est donc possible de choisir une position d’écoute plus frontale. Les sujets disent que l’on « perd en définition », mais on « gagne en confort ». La définition peut cependant être améliorée en orientant les enceintes dans l’axe de l’auditeur (forte directivité des enceintes (cf § 4.1.2.4, et page 94).

4.6.4 À propos des oreilles bouchées

Lors de la dernière séance, les sujets ont pu écouter avec une indication supplémentaire : oreilles bouchées ou oreilles libres. Il se trouve que la perception est changée lorsque les oreilles sont bouchées. Certainesw personnes l’avaient d’ailleurs noté dans les premières impressions:

Le son est plus défini
On a une perte de niveau dans les basses fréquences
On perd une partie de la sensation d’espace

Cela signifie que les mécanismes de l’oreille jouent quand même un rôle dans la perception subaquatique. La perception solidienne serait doublée d’une perception

« classique », essentiellement dans les basses fréquences, et cela créerait un nouvel espace. La contribution sonore des oreilles serait analysée avec un certain retard par rapport à la perception « crânienne », et c’est ce qui créerait cette nouvelle sensation d’espace.

Ces résultats vont dans le sens de la théorie : puisque les éléments de localisation sont donnés par les différences interaurales de temps, ce sont bien les basses fréquences qui donnent la sensation d’espace (cf. § 2.3.2.1). Cela confirme aussi les résultats de Sophie Savel qui avait noté que les mécanismes de l’oreille jouaient un rôle dans la localisation (cf. § 2.3.2.2).

La sensation d’espace, de réverbération liée au bassin ne serait donc essentiellement qu’une illusion due à notre double perception.

4.6.5 Conclusions

Cette conclusion récapitule les points importants concernant la localisation:

4.7 Recherche post-expérimentale

Les études ci-dessous ont été effectuées a posteriori, après analyse des tests perceptifs, afin d’essayer de faire concorder les dires des participants et les résultats scientifiques.

4.7.1 Étude modale

4.7.1.1 Pour la piscine Mathis

La forme du bassin étant presque parallélépipédique, une étude modale peut apporter des éléments de réponse quant au champ acoustique mesuré dans le bassin.

Les modes sont susceptibles de s’installer :

Dans la largeur (entre les parois de 6m)
En hauteur (entre l’eau et le fond). Il existe une pente d’inclinaison très faible, mais cela comprend les deux plus grosses surfaces du bassin
Dans la longueur, mais les marches du petit bain cassent le parallélisme

L’étude des premiers modes axiaux avec une célérité de 1500 m/s donne:

Le mode suivant la longueur n’est en effet pas présent dans le bassin, par contre, les modes de 125 et 680 Hz correspondent exactement aux deux bosses trouvées avec le sweep à 1 m (il y avait 1m 10 de fond environ au niveau de la prise). Ces modes sont hauts en fréquence en comparaison avec les modes d’acoustique des salles. Cela est dû à la célérité du son dans l’eau qui est 5 fois plus élevée que dans l’air. Le mode qui s’installe en hauteur est même plus fort que celui de la largeur puisque la surface est très réfléchissante.

Néanmoins, on remarque sur le sweep à 8m que la bosse qui correspond au mode propre en hauteur reste à peu près dans la même zone de fréquence, alors qu’elle devrait être plus haute en fréquence (vers 900 Hz pour h=85 cm) ce qui laisse quelques doutes. De plus, on devrait quand même apercevoir des raies correspondant aux modes (0,2,0) à 250 Hz, (0,3,0) à 375 Hz, (0,4,0) à 500 Hz et (0,5,0) à 625 Hz, ce qui n’est pas le cas.

On peut cependant formuler l’hypothèse suivante:

4.7.1.2 Pour la baignoire

Les dimensions de la baignoire sont approximativement de 145 cm dans la longueur (à mi-hauteur), 50 cm dans la largeur (à mi-hauteur toujours), et elle était remplie d’eau à hauteur de 30 cm environ.

L’étude des premiers modes axiaux avec une célérité de 1500 m/s donne:

On remarque que cette fois, l’analyse modale ne donne aucun résultat valable puisque les deux bosses mesurées étaient à 100 Hz et à 4 kHz (cf. § 4.1.2.3). Ces modes tombent en plein dans la zone creusée du spectre. Il s’agit donc bien de phénomènes vibratoires complexes de la structure, plutôt que de modes acoustiques.

4.7.2 Acoustique des matériaux

L’extrême sécheresse de l’acoustique ajouté au fait que la musique s’entend à plusieurs mètres du bassin lorsque l’on pose son oreille contre le sol, a fait germer quelques pistes de recherche en acoustique des matériaux. De plus, la largeur des bosses de présence relevées avec l’hydrophone ne peut pas être due uniquement à des modes propres (la bosse de présence serait plus sélective). D’où l’idée de partir des caractéristiques physiques des matériaux.

La piscine est considérée comme entourée de béton. L’impédance acoustique d’un matériau tel que le beton est :

Z_beton=p_beton c_beton

La masse volumique du béton varie en fonction de la qualité. Pour un béton ordinaire on peut prendre:

p_beton=2200kg.m^—3

Pour ce qui est de la vitesse, elle varie aussi en fonction de la quantité de bulles d’air enfermées dans le béton. Pour un béton ordinaire :

c_beton=3200m.s^—1

soit :

Z_beton = 7.10⁶ kg.m^—2.s^—1

Le facteur de transmission est :

La moitié de l’onde est transmise! En comparaison, le facteur de transmission air beton est 1.10^—4, soit un rapport 3500.

Le libre parcours moyen d’une onde entre deux parois étant :

l_m= 4V / S_beton =2,10 m

En 10 ms, l’onde a parcouru 15 mètres environ. Son amplitude est (1—0,35)⁶=0,075 par rapport à l’amplitude initiale, soit une perte de 23 dB ! Et cela, sans compter les pertes en 1/r dues à la divergence sphérique. Le bassin serait donc un espace anéchoïque, excepté à la surface.

De plus, dans les matériaux solides, le transport d’énergie se fait aussi par ondes transversales, ou ondes de cisaillement, et non plus uniquement par l’onde acoustique longitudinale. Le bassin rentrerait donc en vibration. Cela installerait des résonances aux fréquences qui correspondent aux dimensions du bassin. Il ne s’agit plus de modes au sens acoustique avec des réflexions et une notion temporelle de la résonance, mais d’un état de résonance établi, d’où une deuxième hypothèse:

Les courbes de réponse mesurées à l’Ifremer de Toulon montrent de plus que ces vibrations dépendent de l’encastrement du bassin. Autant le bassin de la piscine Mathis rentre facilement en vibration car il n’est pas ancré dans le sol (une salle des machines se situe juste en dessous), autant le bassin d’essai de l’Ifremer vibre peu car il est en bord de mer et les ondes peuvent donc « s’échapper » vers le large (cf § 7.1.2).

5. Discussions, conclusions et perspectives

5.1 Synthèse des différentes expériences

Lors de chaque expérience, le premier quart- d’heure étaitdestinéé à la familiarisation des sujets avec ce nouveau milieu et cette nouvelle façon d’écouter de la musique.

Ce qui est ressorti de ces premières impressions subaquatiques est que la musique est vraiment ressentie physiquement, organiquement, grâce aux vibrations transmises par l’eau. Les oreilles ne fonctionnent pas sous l’eau de la même manière qu’en aérien. Le son est perçu à l’intérieur de la tête, ce qui augmente l’effet d’immersion qui existe par nature sous l’eau. Les ondes traversent d’ailleurs le corps humain, et le nombre de personnes dans l’eau ne modifie donc pas le champ acoustique dans le bassin;

Plusieurs remarques ont porté sur le rendu spectral. Il est en effet différent en fonction de la position de l’auditeur en profondeur. A distance équivalente des haut-parleurs, il existe une bosse dans les mediums lors d’une écoute en surface, alors que les basses sont renforcées au fond du bassin. De ce fait, les non- linéarités du spectre relevées à l’aide d’un hydrophone sont certes imputables à la réponse en fréquence des haut- parleurs, mais aussi aux caractéristiques du bassin, qui est un milieu inhomogène.

Pour la plupart des participants, les différents styles de musique n’ont pas le même rendu sous l’eau. Le milieu aquatique restitue très mal les dynamiques, et les finesses de timbre ne sont pas toujours perçues. La restitution d’instruments acoustiques est assez délicate.

La contribution acoustique du bassin est originale : ce dernier ne donne aucune impression d’espace, et l’auditeur a l’étrange sensation d’être en permanence dans le champ direct des enceintes, même lorsqu’il est à l’autre bout du bassin. Les seuls indices de l’éloignement par rapport aux haut- parleurs sont des différences de niveau. En plus des différences liées à la profondeur d’écoute citées plus haut, le bassin possède une empreinte acoustique : une bosse de présence entre 100 et 120 Hz, ainsi qu’une bosse vers 600, 700 Hz. Ces deux bosses de présence correspondent aux deux premiers modes axiaux dans le sens de la largeur et de la hauteur. Ils sont néanmoins perçus comme une coloration du son direct et non comme une réverbération. La position d’écoute ainsi que l’emplacement des enceintes est très important car la perception en est vraiment modifiée.

Contrairement aux premières impressions, la localisation sous l’eau est possible. Nous avons sous l’eau l’impression de localiser par hémisphère de cerveau. Cela induit une localisation optimale dans le plan des enceintes, avec un espacement d’enceintes de 180 degrés. La localisation ne marche que pour des morceaux avec des sources très latéralisées. Cependant une écoute stéréophonique apporte une réelle sensation d’espace, comme si les sources se répartissaient dans le cerveau, ce qui augmente l’intelligibilité de la musique et le confort d’écoute.

Enfin, les oreilles semblent quand même jouer un rôle dans la perception subaquatique. Le rendu des basses fréquences est modifié. Lorsque nos oreilles sont dégagées, elles donnent une sensation d’espace supplémentaire grâce à ce nouvel apport de basses fréquences. La perception classique additionnée avec un léger retard à la perception « crânienne » créerait une illusion d’espace.

5.2 Perspectives de recherche

Ce mémoire permet de proposer des idées diverses afin d’optimiser une écoute subaquatique.

Tout d’abord, lestestst perceptifs et les mesures réalisées dans le bassin permettent d’établir plusieurs pistes pour améliorer le système de diffusion et pour l’adapter au volume dans lequel il est immergé:

La courbe de réponse du système peut être linéarisée, afin de rétablir une écoute plus naturelle, minimisant ainsi les résonances engendrées par le bassin.
Les résonances engendrées par les vibrations du bassin peuvent être atténuées grâce à une étude sur la composition des matériaux. Les formes de bassin peuvent aussi jouer un rôle et atténuer ces résonances.
Un travail sur la diffusion stéréophonique ainsi que sur le positionnement des haut- parleurs peutaugmenterr la qualité de la perception, notamment si la position de l’auditeur est fixe.
Un traitement en fonction de la profondeur est aussi envisageable afin de rendre le champ acoustique plus homogène.

Des pistes de recherche sont aussi lancées pour créer de la musique prévue spécialement pour ce milieu:

Les morceaux qui ont le meilleur rendu sont ceux qui ont un spectre très large et creusé dans le bas- médium.
Le bassin ayant peu ou pas d’acoustique, les morceaux qui offrent déjà une grande sensation d’espace et de réverbération sont très bien restitués.
Les sources gagnent à être panoramisées dans une image sonore, et elles sont d’autant mieux définies qu’elles ont des timbres différents.
Les morceaux doivent avoir une dynamique assez réduite, excepté si le bruit ambiant est vraiment bas, ce qui est loin d’être le cas dans une piscine municipale.

Le résultat peut être aussi intéressant dans l’autre sens : donner une sensation de morceau aquatique lors d’une diffusion aérienne. Les réponses impulsionnelles du bassin permettent d’implémenter une écoute subaquatique dans des logiciels de réverbération à convolution, et donnent donc un rendu spectral très fidèle à la réalité, même si la sensation est évidemment différente.

5.3 Éléments thérapeutiques

Même si ce n’est pas le sujet du mémoire, l’écoute subaquatique gagne aussi à être étudiée à des fins thérapeutiques. En effet, les bienfaits de l’eau sont utilisés dans bien des domaines médicaux (thalassothérapie, rééducation, pédiatrie…), et ses vertus relaxantes ne sont plus à démontrer. L’écoute subaquatique peut donc ouvrir un nouvel univers de bien- être, un « massage musical » (N. Canivenq, Auamusique).

5.4 Epilogue

« Ça marche! » Comme l’ont si bien décrit certains des sujets qui ont participé avec enthousiasme à ce mémoire, la diffusion musicale sous l’eau fonctionne tout à fait. Les résultats des expériences réalisées donnent de nouvelles pistes pour optimiser une telle écoute et permettre à tout un chacun d’allier deux grands plaisirs terrestres : la musique et le bain.

6. Bibliographie

Blauert (1997), Spatial Hearing :The psychophysics of human sound localization, revised edition, The MIT press

Bernaschina F. (2003), Localisation spatiale acoustique en milieu subaquatique, Thèse présente#e a$ la faculté de Psychologie et des Sciences de l’Éducation de l’Université de Genève

Cailliez J.C.(2005), « Jean Daniel COLLADON (1802-1893) », www.pionnair-ge.com

Feddersen W. E., Sandel T. T., Teas D. C. et Jeffress L. A. (1957), « Localization of high-frequency tones », Journal of the Acoustical Society of America, vol. 29

Feinstein S. (1973), « Acuity of the human sound localisation response underwater », Journal of the Acoustical Society of America, vol. 53

Grau G. (1996), Principes de l’hydroacoustique, Océanis, Documents océaniques vol 22-4, ed. Institut océanographique

Hamilton P. M. (1957), « Underwater hearing thresholds », Journal of the Acoustical Society of America, vol. 29

Hollien H. (1971), « Underwater sound localization in humans », Journal of the Acoustical Society of America, vol. 53

Hurtado A. (2006), Cours d’acoustique des salles, FSMS 2e année

Jouhaneau J. (1994), Notions élémentaires d’acoustique, électroacoustique, Acoustique appliquée, CNAM, ed. Tec & Doc

Landau L., Lifchitz E.(1990), Physique théorique, tome 7 : Théorie de l’élasticité, Ed. MIR, Moscou

Lesueur C. (1988), Rayonnement acoustique des structures, Ed. Eyrolles

Lurton X. (1998), Acoustique sous-marine, présentation et applications, Ingénierie et technologie, ed. IFREMER

Lurton X., Augustin J.M. et Voisset M. (2001), « La cartographie sous-marine », in. Le monde des sons, Pour la Science, Dossier N°32, Juillet/Octobre 2001

Mercier D. (2001), Le livre des techniques du son, notions fondamentales, Coll. Audio-Video, 3e édition, ed. Dunod

Mills, A.W. (1958), « On the minimum audible angle », Journal of the Acoustical Society of America, vol. 30

Poitrenaud N. (2006), Cours d’Acoustique et Sonorisation, FSMS 2e année

Potter J. (2001), « Le bruit de l’océan », in. Le monde des sons, Pour la Science,

Dossier N°32, Juillet/Octobre 2001

Rayleigh Lord J. W. (1877). « Acoustical observations », Phil. Mag.

Salin D., Martin J. (1999), La mécanique des Fluides, Sciences 128, ed. Nathan Université

Savel S. (2001), Localisation Auditive Subaquatique: d l’idendification des mécanismes impliqués à la démonstration de la plasticité du système auditif et à l’application sur les plongeurs, Thèse, ed. Atelier National de reproduction des Thèses

Sivian L. J. (1947), « On hearing in water vs. hearing in air », Journal of the Acoustical Society of America vol. 19.

Urick R.J. (1983), Principles of underwater sound, 3^rd edition, Peninsula pub.

Venturi, J. B. (1796),.Considérations sur la connaissance de l’étendue que nous donne le sens de l’ouïe, Mag. Encycl.

Vogel C. (1999) Etude se#miotique et acoustique de l’identification des signaux sonores d’avertissement en contexte urbain, Thèse ed. Atelier National de reproduction des Thèses

Vogel C. (2005), Cours de Psychoacoustique FSMS 1e année

7. ANNEXES

7.1 Documentation technique, p.67

7.1.1 Hyprophone DPA 8010, p.67
7.1.2 Le haut-parleur H062m, p.69
- 7.1.2.1 Description, p.69
- 7.1.2.2 Conditions expérimentales, p.70
- 7.1.2.3 Réponses en fréquence, p.71
- 7.1.2.4 Directivité, p.72
- 7.1.2.5 Discussions, p.73

7.2 Disques d’écoute, p.74

7.2.1 Pour le 22 février 2008, p.74
7.2.2 Pour les autres séances, p.75

7.3 Questionnaires, p.76

7.3.1 Pour le 22 février 2008, p.76
7.3.2 Pour le 13 et 14 mars 2008, p.80
7.3.3 Pour le 20 mars 2008, p.83
7.3.4 Pour le 21 mars 2008, p.84

7.4 Réponses des sujets, p.87

7.4.1 Ressenti Physique/Rendu spectral et musical, p.87
7.4.2 Acoustique du bassin/ Homogénéité, p.94
7.4.3 Dynamique/ Compression 98
7.4.4 Localisation, p.99

7.1 Documentation technique

7.1.1 Hyprophone DPA 8010

7.1.2 Le haut-parleur H602m

7.1.2.1 Description

7.1.2.2 Conditions expérimentales

Trois haut- parleurs de type H062m ont été mesurés le 29 septembre 2008 dans le bassin d’essai du laboratoire IFREMER à la Seyne- sur-Mer, près de Toulon. Ils seront nommés par la suite HP1, HP2 et HP3.

Le bassin d’essai est une fosse de 10 mètres sur 15 avec une profondeur de 6 mètres. Un amplificateur de marque Faze a été utilisé (la réponse en fréquence a été mesurée en sortie pour évaluer la contribution de l’ampli dans la chaîne audio). Pour toutes les mesures, les réglages de l’amplificateur sont identiques. Un hydrophone B&K 8103 a été utilisé pour ces mesures. Le signal excitateur est un sweep de 30 secondes généré par Altiverb, comme pour les mesures dans la piscine Mathis.

FFT du sweep après d'amplification — FFT du sweep après d’amplification

FFT du bruit de fond dans le bassin d'essai — FFT du bruit de fond dans le bassin d’essai

7.1.2.3 Réponses en fréquence

Les mesures sont prises à un mètre du haut- parleur, à 2m 50 de profondeur.

HP2 à 1 mètre dans l'axe — HP2 à 1 mètre dans l’axe

7.1.2.4 Directivité

C’est le HP3 qui est représenté ici. Les mesures sont effectuées à 0°, 45° et 90° à 1 mètre.

7.1.2.5 Discussions

Les trois premiers modes axiaux de ce bassin sont aux fréquences 50 Hz, 75Hz et 135 Hz et ils n’apparaissent pas sur les courbes de réponse. Les fréquences 50Hz et 75Hz sont en dessous de la bande passante des haut- parleurs, et la fréquence de 135 Hz (correspondant à la profondeur d’eau de 5,50m) n’apparaît pas.

De plus, le bassin se situe à proximité de la mer et est construit dans une terre gorgée d’eau, ce qui laisse supposer que la transmission des ondes dans le sol se fait assez bien.Il est donc bien ancré et a une activité vibratoire moins importante que le bassin de la piscine Mathis. Le bassin peut être considéré comme relativement neutre, avec une « empreinte acoustique » faible (cf hyp n°2 page 59) et les courbes de réponse mesurées sont donc imputables en grande partie aux haut- parleurs.

Les mesures sont assez différentes d’un haut- parleur à l’autre, notamment le HP2. Les HP1 et 3 sont plus proches, et leurs courbes de réponse réelles (après compensation par rapport à la sortie de l’amplificateur) sont exposées ci-dessous :

Réponses réelles des HP 1 et 3

De 350Hz à 5kHz, les points restent dans une fourchette de 10 dB, par contre les deux haut- parleurs ont une bosse de présence dans le bas médium (entre 100 et 300Hz) et ont une perte prononcée dans les aigus (-12 dB par octave à partir de 5kHz) avec des pics (+10dB) à 8k, 11k et 15kHz..

On remarque enfin que les haut-parleurs sont peu directifs dans le plan horizontal : les courbes dans l’axe, à 45° et à 90° sont quasiment identiques.

7.2 Disques d’écoute

7.2.1 Pour le 22 février 2008

CD D’ÉCOUTE	TRACK
Ecoutes Première Partie
RESSENTI PHYSIQUE / RENDU SPECTRAL / POSITION
D’ECOUTE
Chant du Rossignol- Stravinski	8
All I Need- Air	9
Voix Parlée- Recette des truffes au chocolat	10
Blue in Green- Miles Davis	11
Three Little Birdies- Chemical Brothers	12
Ecoutes Deuxième Partie
ÉTUDEE DU CHAMP ACOUSTIQUE / POINT D’ECOUTE
Passion selon St Matthieu- Bach	13
Tell It Like It Is-Art Blackey	14
Ecoutes Troisième Partie
LOCALISATION STEREOPHONIQUE
Premier espacement d’enceintes
Back In Black- AC/DC	15
Symphonie n°3- Honnegger, écoute aléatoire G/D (4 chgmts)	16
(pause)
Symphonie n°3- Honnegger	16
Maracas n°1	17
Deuxieme espacement d’enceintes
Back In Black- AC/DC	18
Symphonie n°3- Honnegger, écoute aléatoire G/D (4 chgmts) (pause)	19
Symphonie n°3- Honnegger	19
Maracas n°2	20

7.2.2 Pour les autres séances

Pour les deux dernières séances, les morceaux de la dernière partie étaient mono pendant 45 secondes, puis les mêmes extraits étaient diffusés en stéréo pendant encore 45 secondes.

CD D’ÉCOUTE	TRACK
Ecoutes Première Partie
Gustav Holst – Mars, Les Planètes	1
Sting – Hounds of Winter	2
Chant Grégorien – La tradition du chant grégorien	3
Laurent De Wilde – Moaning	4
Écoutes Deuxième Partie
Vivaldi – Griselda	5
Michel Camillo – One More Once	6
Ecoutes Troisième Partie
Brad Mehldau – Blackbird VO	7
Brad Mehldau – Blackbird HC	8
Brad Mehldau – Blackbird LC	9
Stravinski – Le Chant Du Rossignol HC	10
Stravinski – Le Chant Du Rossignol VO	11
Stravinski – Le Chant Du Rossignol LC	12
Ecoutes Dernière Partie
Dialogue Gauche/Droite	13
Mediterranean Sundance – Di Meola, Di Luca, Mc Laughlin	14
Nancy Sinatra – Bang Bang	15
Chemical Brothers – Lost in the K-Hole	16
Gustav Holst – Mars, Les Planètes	17
Bonus Chant Grégorien – La tradition du chant grégorien	18&19

7.3 Questionnaires

7.3.1 Pour le 22 février 2008

7.3.2 Pour le 13 et 14 mars 2008

7.3.3 Pour le 20 mars 2008

7.3.4 Pour le 21 mars 2008

7.4 Réponses des sujets

Les réponses de chaque participant sont exposées ici. D’une part, il aurait été difficile de mettre chaque questionnaire en entier (150 pages en tout), et d’autre part l’écriture manuscrite ainsi que certaines allusions auraient nuit à l’anonymat de certains. Les réponses sont donc triées par questions, indépendamment de chaque questionnaire, et chaque participant est appelé « sujet N », N allant de 1 à 41. L’ordre chronologique de passage est respecté, ce qui donne la répartition suivante:

22 février 2008	Sujets 1 à 11
13&14 mars 2008	Sujets 12 à 24
20 mars 2008	Sujets 25 à 30
21 mars 2008	Sujets 31 à 41

7.4.1 Ressenti Physique/Rendu spectral et musical

Questions:

Quelles sont vos premières sensations, vos impressions générales?

Comment pouvez-vous décrire le rendu spectral et la restitution des timbres?

Sujet 1: Qualité bien supérieure à celle que j’imaginais. Extraits très reconnaissables. La conduction osseuse donne un ressenti très étrange, ainsi que la localisation qui n’est pas possible. Rendu différent selon la profondeur à laquelle on se trouve. Restitution des timbres: est dans la plupart des cas très reconnaissable, également en classique, jazz, plus compliqué sur les sons électro. Voix parlée très audible, on reconnaît même la personne qui parle. Rendu spectral: difficilement descriptible, meilleures sensations dans le grave.

Sujet 2: Ça marche!! De la douceur, pas d’agressivité. « son téléphonique », gêné par les bruits ambiants. Bande passante de téléphone?

Sujet 3: Ecoute agréble, la son est mono dans la tête. En surface (méthode d’écoute plus simple) les graves et les médiums sont très filtrés.

Sujet 4:Physiquement, le fait de devoir rester la tête bien immergée n’est pas super confortable pour moi… mais:

le buit du tuba est gênant
le fait de n’entendre vraiment que la musique diffusée est très agréable, sensation d’immersion totale.

Spectralement: assez déséquilibré, bosse vers 100 (dimensions de la piscine peut-être). Il manque le haut évidemment…& pas mal de bas aussi. Impression qu’au fond c’est mieux (que la surface est plus « médiums »). Il y a un temps d’adaptation (1 ou 2 extraits). Pas de sensation de localisation.

Sujet 5 : Étonné, je ne pensais pas qu’on percevait un spectre si large.L’image stéréo me semble inexacte. Tout est localisé à l’intérieur de la tête Impression générale excellente. C’est énorme, Etienne t’es le meilleur. Bande passant réduite. Bcp de basses lorsqu’on est en contact avec le fond du bassin. Peu d’aigus, impression qu’on écoute derrière une porte…

Sujet 6: Le son n’est pas très fort. Les basses sont désagréables surtout (air et le jazz). Globalement, c’est agréable et relaxant d’avoir cette musique sous l’eau. Rendu spectral: gêne dans les basses qui sont fortes par rapport aux autres sons, on a la sensation que le haut du ventre résonne. Les timbres sont bien reconnaissables.

Sujet 7 : Expériencee agréable, « bonne » diffusion mais pas homogène, en fonction de la localisation (profondeur) et de la hauteur d’eau. Phénomènes bizarres dans les coins. Rendu spectral inégal ++ dans le haut médium et aigus. Surtt pour les basses (7 pour le classique), présente pour electro et techno: agressivité très proche du fond.

Sujet 8 : Écoute agréable, assez naturelle. Les sons sont « à l’intérieur de la tête » et l’écoute globale fait penser à une écoute au casque. Les bosses qui cognent sont bien ressenties physiquement! C’est plutôt agréable, à voir si ce n’est pas fatiguant à long terme. Étonnant aussi : on perçoit très bien la reverb originale, beaucoup beaucoup plus qu’en écoute aérienne, c’est surprenant. Spectre variable selon la profondeur au niveau des basses: proche de la surface on en perd. Médium grave un peu absent.

Sujet 9: C’est agréable d’écouter de la musique sous l’eau, mais cette ambiance semble assez incontrôlable en localisation. Les timbres sont extrêmement changés. Assez reverb « plate »

Sujet 10: Comme au casque, écoute interne, à l’intérieur de la tête. J’entend mieux les oreilles bouchées (ou alors c’est que j’atténue la conduction osseuse en pressant le crâne…) (rendu spectral et restitution des timbres). Pas mal ! Je trouve que les basses ont du mal à être présentes (on n’a pas le ressenti du choc, comme avec un sub). C’est assez fin mais semble toujours un peu lointain (niveau?)

Sujet 11: Jue suis surprise par autant d’intelligibilité, d’aiguës… etc. Par contre on ressent la musique dans tout notre corps. C’est assez désagréable à fort niveau (techno) (on se demande si le cœur ne fait pas n’importe quoi) on sent que ça ne passe pas forcément par les oreilles car lorsqu’on met la tête hors de l’eau, on n’entend plus mais on sent. Intelligibilité, suffisamment d’aigus pour un son correct. Par contre les graves sont BEAUCOUP trop forts. (tessiture de la contrebasse) et du coup c’est insupportable. En gros ça manque de médium.

Sujet 12: C’est surprenant, on a l’impression d’écouter au casque. L’image a l’air centrale et quand je tourne sur moi- même, je n’ai pas la sensation d’avoir le son qui tourne… Super sur le kick de Sting. J’ai l’impression que c’est un peu « trop » doux dans l’aigu. La zone basse par contre dépend de la profondeur + que de l’endroit o on se trouve dans la piscine. C’est agréable de façon générale.

Sujet 13 : Écoute assez facile et agréable. De grandes différences de timbre, d’intensité et de ressenti physique (vibrations sur le corps) selon la position dans le bassin: très intéressant. Le grace très « bouilli » à la surface de l’eau et en règle générale partout dans le bassin, excepté à proximité du fond et le long des côtés (murs). Les aigus et le ht med se transmettent beaucoup mieux. Les caractéristiques de rythme et des instruments se distinguent de moins en moins bien en s’éloignant des HP.

Sujet 14: Terrible. Bravo pensait pas que ça pouvait marcher aussi bien!! En surface « nasillard » le mieux: dans le fond, coins de la piscine +grave (dès qu’on est près d’une paroi!! le meilleur rendu spectral: totalement immergé et = on veut du grave, plus on se rapproche du fond.

Sujet 15: Sensations agréables mais déroutantes: pas de source précise (sauf très près des enceintes). Le son entoure. Variations en fonction de la profondeur. Bande passante limitée, les transitoires sont écrasées (sensible sur le classique). Rendu inhomogène selon la position dans l’eau.

Sujet 16: Sensations agréables!! Entourée de musique, sans pour autant ressentir précisément sa provenance ( à moins d’être proche des HP) On reconnaît aisément le genre musical, néanmoins: par exemple les basses et les sons percussifs du morceau de variété passent aussi par des sensations physiques, et sont rendus bcp + important que les autres composantes du morceau. Intelligibilité des voix moyenne… Dans l’ensemble: précision moyenne (que ce soit des paroles ou des jeux instrumentaux).

Sujet 17: C’est agréable. Au fond on ressent mieux les basses. A la surface c’est plus équilibré, moins de niveau. Hors de l’eau on perçoit surtout les basses physiquement par le corps resté dans l’eau. La variété et l’électro passent mieux: sons = courts, percussifs, rythmés: rendu moins flou. Rendu spectral: + on va au fd = on perçoit les basses. Dans l’eau à la surface on entend que les aigus, on ressent les basses aussi physiquement. Les timbres sont bien conservés pas de sensations désagréables (à la surface l’image sonore est moins bien définie).

Sujet 18: Wahouu! Etrange sensation que cette omniprésence du son quelle que soit la direction dans laquelle on écoute: il est en nous. (d’ailleurs on l’entend aussi oreilles bouchées) Localisation intérieur du crâne. Très variable en fonction de l’endroit:

pas de basses et de médiums en surface
augmentation de la bande passante si on va plus en profondeur, qui va jusqu’à une très bonne restitution des basses… Fréquence de coupure 100 Hz environ?

Sujet 19: Agréable et surpris en bien par la qualité globale de restitution « propre ». Aigu clair mais peut faire un peu penser au résidu de son entendu l à l’extérieur d’un casque. Quand trop de graves, peut être agressant physiquement. Bonne perception des reverbs. Bas et bas médium pas précis, voire même bourdonnant et gênant physiquement. Médium en retrait. Aigu présent précis et plutôt agréable.

Sujet 20: C’est original et amusant de pouvoir écouter de la musique sous l’eau. Mauvais voire médiocre dans le bas du spectre, moyen – dans le medium. Aigus: moyen, dépend de l’emplacement dans la piscine. Violon peu audible ou uniquement en attaque franche. Instruments sonores tels que la trompette passent assez bien.

Sujet 21 : Agréable, le son est audible. On perçoit les ondes au maxi lorsqu’on est entre les haut- parleurs. Le son est clair, meilleur rendu au fond.

Sujet 22 : l’impression globale est la sensation d’homogénéité du volume. Lorsque l’on se déplace, l’amplitude change peu (sauf si on s’approche beaucoup des haut- parleurs évidemment).Une fréquence ressort dans les médiums (do au milieu du piano). Le son est assez sourd (peu d’aigus, et les basses gonflées.

Sujet 23 : Un son étouffé. Je pensais avoir une écoute plus claire. Pas de son régulier dans tout le bassin, pas de son englobant. L’intensité varie peu selon l’endroit de la piscine, en profondeur, mais de peu. De manière générale les basses sont très présentes excepté pour le morceau classique. Là où il y a peu d’eau, j’ai plus ressenti les vibrations.

Sujet 24 : J’imaginais que l’eau était l’endroit idéal pour écouter de la musique, malgré la double sensation auditive et celle des vibrations, j’ai trouvé que ça manquait de clarté. On entend bien plus les graves à la surface et la musique devient plus homogène en profondeur.

Sujet 25 : La sensation d’immersion est vraiment agréable. Sur le classique, brouillon dans le médium filtrage en peigne.

Sujet 26 : Impression générale agréable, comme un poisson. Spectre manquant beaucoup de médium. Basses augmentent en se rapprochant du fond. Mode audible dans le grave (surtout sur la basse variété).

Sujet 27 ; Surprenant, bonne surprise d’ailleurs… Sensation d’enveloppement entre les HP. Bon ressenti des basses, même avec la tête hors de l’eau. Timbre un peu déformé, devient plus nasal… Le timbre change selon la position d’écoute (entre les HP, en face, pas en face).

Sujet 28 : Sensations agréables des vibrations corporelles dues au son. Vibrations fortement ressenties au niveau des reins et des fesses. Manque de basse globalement. L’extrait du symphonique c’est catastrophique : timbres méconnaissables.

Sujet 29 : La musique est partout, et surtout dans la tête. Il n’y a que là où il y a très peu de fond (loin des enceintes) qu’on entend moins, et encore. Pas trop de remarques à faire pour le rendu spectral. Les aigus sont assez désagréables (oreilles qui « grésillent »). Les timbres semblent un peu « émoussés ».

Sujet 30 : On a une très bonne immersion, j’ai senti une petite différence en me bouchant les oreilles (un peu moins d’aigus). Bien mais on perçoit les résonances gênantes surtout sur le chant grégorien.

Sujet 31 : (deuxième impression) C’est toujours agréable, mais la 1ère surprise passée, le son est moins top… Très variable selon l’emplacement : près des enceintes beaucoup de grave qui traîne et bave entre les enceintes beau medium mais moins de grave et moins d’aigus (comme à travers une petite paroi).

Sujet 32 : Plus fort près des parois et au fond. Bonne température de l’eau, siège confortable, fil ennuyeux pour passer avec le tuba. Beaucoup de basses, surtout près des coquilles Saint- Jaques. Aigus bien rendus au niveau du timbre mais il faut les chercher. Reverb bien rendue pour le grégorien.

Sujet 33 : Le son est très « pur » (comme une écoute dans un casque). Surtout au fond du bassin. J’ai l’impression qu’il y a une légère distorsion.

Sujet 34 : Surprise. Agréable Détendant Envie de faire la planche et de rester immobile. Plongé dans la musique on n’entend pas du tout le bruit extérieur (il y a un groupe bruyant dans l’autre bassin). Étonnamment complet. J’ai l’impression de tout entendre, des basses aux aigus. Il me semble que ce qui passe le moins bien est le grave. Dans la musique classique, le vrombissement des violons n’est pas clairement audible et provoque un peu de saturation.

Sujet 35 : Sympa d’entendre la musique. Bien sûr pas d’image stéréo. Sonne pas très bon par contre. Sting marche très bien, Holst moche. Graves, à la proximité de l’enceinte, pas si t’es loin. A la surface, pop beaucoup des aigus, pas de fondament. Holst, beaucoup de rumble dans les graves ! Vers 1kHz, tout est plus fort, à la surface, son est « loin ».

Sujet 36 : Une sensation de gêne lors de l’audition des graves (cf sensation dans une boîte de nuit avec des basses surpuissantes). Spectral : graves surdimensionnés. Médiums assez bien définis, aigus relativement audibles. Timbres : instrumentaux amplifiés sonnent bien, mieux qu’acoustiques, et que la voix, les cuivres à l’orchestre sont toujours aussi présents…

Sujet 37 : Immersion géniale, + de bas au fond et médium bizarre en surface, Sting passe ++. Pb des oreilles. Oreilles bouchées : son filtré dans le bas, et aigus acides ! Le bas passe par les oreilles !

Sujet 38 : Je me sens bien. On entend très bien. On entend mieux près des enceintes. C’est agréable, surprenant. Globalement, c’est un peu assourdi (surtout les graves, par exemple dans l’électro) (même pour le chant grégorien…). On entend un peu moins les aigus ? La voix (pop) me semblait bien « rendue ». (pop= la mieux ?)

Sujet 39 : Classique : pas assez fort, difficile à dire. Le reste, cool ! Tjrs mono dans la tête. Le masque atténuerait-il la sensation ? (il comprime la tête donc amortit les vibrations). Les basses : impression de « saturation » au niveau des enceintes. L’aigu : s’amorti à mesure que l’on s’enfonce en profondeur : + haut = meilleur équilibre spectral. + bas = moins bon équilibre, peu de haut. Collé au sol = tout se brouille (ça se joue à qq centimètres). Les BF perception difficile de la hauteur, et manque la sensation de choc comme en sono.

Sujet 40 : Pas de sensation de localisation. « environnement sonore », pour moi, meilleures sensations sans masque ni accessoires, plutôt assez immergée (meilleur enveloppement), plus de basses au fond ? Rendu spectral frustrant sur la symphonie (manque de définition et de clarté des timbres) globalement, spectre assez bas-medium.

Sujet 41 : 1. Très agréable sur certains extraits. 2 Assez fatiguant de rester assez de temps en apnée pour avoir le temps d’écouter. La bande passante est réduite en haut (& un peu en bas) Le bas tourne parfois. Timbres « pincés » dans le symphonique. Timbres agréables ds pop (par ex. la voix) & grégorien.

Question : Quelle est votre position d’écoute préférée ? (22fev. 2008)

Sujet 1 : Au fond contre le sol

Sujet 2 : Dans le plan des enceintes : grave et volume Sujet 3 : Au fond du bassin, mais c’est difficile à tenir

Sujet 4 : Vers le fond car : plus de niveau, plus équilibré mais il faut bien se vider les poumons.

Sujet 5 : Plat ventre près du fond. Sensation physique.des basses

Sujet 6 : Allongé sur le dos à l’horizontale

Sujet 7 : Près du fond en eau peu profonde Sujet 8 : Sur le ventre la tête bien immergée Sujet 9 : Près des enceintes

Sujet 10 : N’importe, pourvu qu’on ne soit pas trop près d’une des deux enceintes par rapport à l’autre.

Sujet 11 : Assis par terre avec l’eau au niveau des oreilles

Question : Si elle est différente (de la position d’écoute), quelle est celle qui donne la meilleure écoute ?

(22 fév. 2008)

Sujet 1 : + de détails dans le fond mais pas la plus homogène

Sujet 2 : pas trop loin des enceintes

Sujet 5 : Plat ventre, 50 cm du fond Sujet 10 : j’attends la suite…

Sujet 11 : la même

Question : Si certains morceaux sont moins bien rendus que d’autres, pouvez-vous expliquer pourquoi ?

Sujet 12 : (Symphonique) Peut-être la dynamique. Comme ma nage était elle-même dynamique (je me suis pas mal baladé), je perdais un peu le fil.

Sujet 13 : (Pop) Une prédominance de HM&aigus dans les marqueurs de tempo (over head…), la voix est bien restituée.

Sujet 14 : (Symphonique, chant) moins bien mais ça marche quand même vachement. Trop grande dynamique, passage piano un peu flou. Peu de transitoires, ça définit moins bien. (sympho) trop d’instruments, on perçoit plus facilement si y a juste K+Sn+Bass+Gt+Voix. moins de choses qui s’entrelacent

Sujet 15 : (symphonique, chant) le fait d’entendre de fortes modulations du spectre est gênant sur le chant, et les transitoires manquent au classique.

Sujet 16 : (symphonique) Ts les instrus sont noyés (sans jeu de mot…), je perçois difficilement les différences de timbre globalement

Sujet 17 : (chant) les sons sont trop tenus, masse sonore pas bien définie, brouillée

Sujet 19 : (symphonique) manque de dynamique, médium en retrait, cordes notamment sonnent petit. (electro) bas gênant, trop inhomogène avec le reste du spectre

Sujet 20 : (symphonique, chant) pas vraiment, peut- être pourrait- on adapter les enregistrements pour le subaquatique adapter la dynamique (les – grdes possible) et les fréquences (pas trop de bas medium +de graves et + d’aigus.

Sujet 21 : (symphonique) Symphonie très douce, feutrée

Sujet 23 : (symphonique) trop de finesse dans l’interprétation ou trop de complexité pour les instruments utilisés.

Sujet 26 : (symphonique, chant) Pas de sensation de salle, localisation intra crânienne. Dynamique peu audible

Sujet 31 : (symphonique) trop de dynamique sur le classique, on n’entend correctement que les fortissimi.

Sujet 32 : (symphonique, chant) Parce que la pop et l’électro ont besoin de moins de précision dans le spectre car plus rythmique, et moins de dynamique globale. Les graves sont trop présents, grandes dynamiques (classique)

Sujet 34 : (symphonique, chant) je pense que les instruments se détachent d’avantage les uns des autres. il s’agit plus de sons séparés (que l’on reconnaît individuellement) que d’un ensemble sonore.

Sujet 35 : (symphonique) rumble dans les graves, on entend presque que du bruit. Quand ça devient fort on n’a aucune transparence.

Sujet 36 : (chant) rendu du timbre vocal beaucoup moins fidèle dans l’eau. Musique qui demande une plus grande finesse d’écoute.

Sujet 37 : (symphonique) il faut vraiment être dans un calme supérieur pour apprécier les nuances.

Sujet 38 : (electro) les sons dans l’eau sont « bizarres », (problème de timbre) le chant grégorien pas très clair…(en même temps c’est plus ou moins des fréquences et des timbres proches ?) (j’ai mal écouté l’extrait symphonique)

Sujet 39 : (symphonique) niveau (mastering ?)

Sujet 40 : (symphonique, électro) Peut- être lié aux habitudes d’écoute. On entend souvent du grégorien dans des grandes églises très réverbérantes, donc avec le même type de sensation d’immersion, et on écoute de la pop sur n’importe quel système d’écoute (enfin moi personnellement, donc je suis moins exigeante au niveau spectral que pour du symphonique par exemple.

Sujet 41 : (symphonique) + pop :des sons artificiels= moins déformés. Pas d’espace réel, pas de problème. – symphonique : n’était pas assez fort… Trop complexe et comme il n’y a plus d’espace tout se chevauche comme en mono. Timbres trop altérés. + chant : le signal est bien rendu fréquentiellement & il y a un espace (une reverb) qui rend assez bien dans ce cas là.

7.4.2 Acoustique du bassin/ Homogénéité

Question : Pouvez-vous caractériser l’acoustique du bassin ?

Sujet 1 : Je ne suis pas sûr d’arriver à différencier la part de responsabilité entre ma position d’écoute et l’acoustique du bassin, sur ce que je perçois dans l’eau. Je ne peux donc pas caractériser l’acoustique du bassin.

Sujet 2 : Relativement sec, mais de bonne qualité

Sujet 3 : le champ direct est bien perçu entre les enceintes, mais dès le triangle équilatéral, on a beaucoup de champ diffus.

Sujet 4 : En fait je ne perçois AUCUN espace. La seule « signature » du bassin est cette bosse vers 100Hz (aussi dans les médiums sur les chœurs de l’extrait classique c’était un peu désagréable). Tout ce que je perçois c’est : 1. un changement de niveau (+ près + fort). 2 ; une direction (perte du haut et du bas si je ne suis pas en face). Je ne perçois tellement aucun espace que si je suis loin, j’arrive à imaginer que les HP sont juste à côté de moi et moins fort.

Sujet 5 : Difficilement. On a une différence de niveau en fonction de la distance, et une différence de spectre (pertes de basses et d’aigus en s’éloignant).

Sujet 6 : Plus on va profond plus la sensation d’enveloppement est grande dans la zone « champ proche », on a des sortes de saturation sur les sons forts.

Sujet 7 : Acoustique inhomogène. Peu voir pas réverbérante.

Sujet 8 : Difficile, elle est assez neutre j’ai l’impression. Le son diffus manque juste de pêche et d’extrêmes graves aigus.

Sujet 9 : On a une acoustique qui ressemble un peu à une plate. C’est- à-dire : des aigus claquants et réverbérés assez fortement. Pas d’extrême basse, des basses plutôt colorées, tout comme l’ensemble du spectre.

Sujet 10 :Difficile, la vitesse du son dans l’eau est rapide… Cependant, il y a certains points qui marchent vraiment bien. Pas de notion de réverbération, mais de niveau oui.

Sujet 11 : Le rapport son direct son réverbéré ne varie à aucun moment. Par contre il y a des endroits où il y a globalement un peu plus de niveau.

Question : Avez-vous d’autres remarques ? (partie acoustique du bassin, 22 fév. 2008)

Sujet 1 : Questionnaire assez difficile, je répond par ressenti. Sujet 2 : Il me faut plus de temps pour me faire une idée désolé.

Sujet 5 : L’extrait classique est déjà bien réverbéré, ne nous donne pas d’info sur l’acoustique du bassin. Ceci dit, je n’arrive pas à percevoir d’acoustique sur les autres extraits.

Sujet 8 : La perception change quand on tourne la tête dans le plan horizontal ou dans l’axe du corps. Par contre la localisation est très difficile voire impossible. J’ai perçu de fortes résonances dans le Bach (sur des fréquences de la voix, 2-4kHz). Je ne sais pas si elles viennent des enceintes, de l’acoustique du bassin ou autre.

Sujet 9 : Le son paraît plus grave au centre de la piscine (nœud de résonance ?) la perception solidienne du son est très agréable (vibration des basses dans la tête), et ne dépend pas trop de la position.

Sujet 10 : Etonnant, les bruits humais sont faibles par rapport à la musique !! (bruit de nage, d’eau etc…) Localisations sonnent vers le haut de la tête, un peu vers l’arrière (filtrage ?)

Sujet 11 : Les vaguelettes font de l’aigu en plus, pas autant que ce à quoi je m’attendais, mais quand même un peu. Pas eu le courage de regarder en profondeur, du coup ce que je dis n’est valable qu’à proximité de la surface.

Question : Percevez-vous une différence entre une écoute en surface et une écoute au fond du bassin ?

Sujet 12 : Plus de basse au fond, plus naturel en surface (c’est moi qui suis au fond ou en surface)

Sujet 13 : Une écoute en surface est toujours moins précise et moins agréable qu’une écoute au fond. A la surface, l’éloignement par rapport à l’axe diminue très rapidement la bonne qualité d’écoute.

Sujet 14 : Surface : nasillard. La tête à 30 cm sous l’eau, bosse de 1 à 2kHz assez marquée. Au fond : bosse dans le grave.

Sujet 15 : Différences de spectre : + de basses au fond. Différences du niveau global.

Sujet 17 : À la surface, on perd des basses et de l’intensité : aigus agressifs. Tout au fond : excès de basses, résonances, vibrations

Sujet 19 : En surface, perte de médium et grave boueux. A mi-hauteur, plus équilibré, grave plus propre. Au fond, à nouveau grave boueux, sensation de plus de niveau, mieux qu’en haut, mais un peu comme si on était calé à un mur dans l’air

Sujet 21 : saturation des basses HP en surface et aigus atténués.

Sujet 22 : en surface, on est gêné par les « clapotis », alors qu’en immersion, forcément la restitution est sans parasite, par ailleurs, plus on s’approche du fond plus les graves prennent le dessus.

Sujet 23 : L’écoute est plus forte au fond du bassin. On perçoit mieux les basses (pour les morceaux salsa) et les aigus pour le classique.

Sujet 24 : oui pour le classique la musique est plus limpide, le rendu est plus proche d’une écoute en surface, avec le nid sonore que la piscine peut offrir

Sujet 26 : Nette différence au niveau des basses (+ de basses au fond) si les enceintes sont au fond (trop de basses même)

Sujet 27 : oui 1. Plus on va au fond, plus on arrive à s’affranchir du son extérieur. 2. plus de basses au fond en général.

Sujet 29 : oui, moins « agressif » comme son quand on est en surface, plus agréable. 2 remarques : 1 :le deuxième extrait rend beaucoup mieux que le premier (l’opéra sous l’eau, c’est bof). 2 : En surface on entend les bruits ambiants de la piscine (enfants) alors qu’on ne les entend pas du tout au fond.

Sujet 30 : Au fond on a plus de basses et là on est plus cohérents (en phase ?) En surface, on est un peu détimbré.

Sujet 31 : beaucoup plus de niveau et de grave au fond du bassin à condition d’équilibrer la pression des oreilles au fond !!!

Sujet 32 : + de basses au fond (trop quand enceintes au fond)

Sujet 33 : On entend un peu l’extérieur quand on est à la surface mais le son paraît plus clair, d’où senti plus de graves au fond du bassin.

Sujet 34 : Oui, son plus « plein », plus « enveloppant » en profondeur. Sujet 35 : En bas il y a bien sûr d’autres résonances (modes je crois)

Sujet 36 : L’écoute au fond avec compensation des tympans permet une meilleure définition, surtout dans le medium et l’aigu lorsque les enceintes sont à la surface.

Sujet 37 : En surface, toujours pb de réflexions des mediums. Au fond, équilibré mais manque de corps.

Sujet 38 : Au fond on entend plus fort, mais j’ai l’impression qu’on n’entend pas tout ? On avait un plus grand spectre plus en surface, mais on perd en « puissance ».

Sujet 39 : Le mieux, c’est quand on est placé à mi-hauteur (je l’ai déjà dit à sujet 41, mais il n’est pas d’accord)

Sujet 40 : Oui a priori plus de basses au fond du bassin, plus de définition en surface.

Sujet 41 : J’ai l’impression que lorsqu’on écoute vers la surface, il y a comme une sorte d’accentuation des modes dans les médiums (comme l’apparition d’une mini- acoustique, une réflexion peut- être).

Question : La position des enceintes en hauteur a-t-elle une influence sur ces différences ?

Sujet 12 : Complètement, effet tuning avec gros loudness (100- 200 Hz) qd on est au fond, et en surface, le timbre est moins équilibré (médium 800 Hz renforcé)

Sujet 13 : Faiblement, le champ d’écoute entre les deux HP est plus localisé quand les HP sont en bas. Les localiser en haut n’améliore pas ce phénomène.

Sujet 14 : oui : le rendu des graves est beaucoup plus important avec les enceintes au fond du bassin mais c’est un peu moins défini.

Sujet 15 : oui : résultat plus homogène avec les enceintes en haut. Avec les enceintes en bas, forte différence spectrale entre haut et bas.

Sujet 16 : HP au fond : + grande homogénéité globalement, mais petite amélioration quand on est vers les 2/3 de la profondeur. Pas de préférence entre au fond et à la surface. HP en haut : Attaques molles et peu de précision quand on écoute à la surface. + on se rapproche du fond, + le son est précis et clair : + de dynamique, + de différence entre les sons.

Sujet 17 : Oui je trouve que les enceintes en hauteur augmentent la différence d’homogénéité du spectre et de l’intensité. Enceintes au fond : la musique paraît plus présente on est plus imprégné.

Sujet 18 : Oui a niveau de diffusion égal, le niveau m’a semblé plus important avec les HP posés au fond. Impression que la restitution est plus linéaire avec les HP en surface. Excitation de certains modes propres avec les HP posés au fond.

Sujet 19 : Meilleur équilibre avec les enceintes au fond, mais semble plus homogène hormis extrême grave avec les enceintes en haut.

Sujet 21 : Pour les aigus, meilleure perception. (au fond)

Sujet 22 : Les basses gonflées lorsque les enceintes sont au sol.

Sujet 23 : Oui , l’écoute est marquée par les basses, le son est plus diffus. Sujet 24 : J’imagine que oui

Sujet 26 : Dans les basses en hauteur il manque ce tapis. Si enceintes en hauteur, les diff sont moins perceptibles entre une écoute surface et fond.

Sujet 27 : + de basses lorsque les enceintes sont au fond avec perte de medium lorsqu’on va au fond. Le son est plus précis lorsque l’on reste entre les enceintes dans leur axe de directivité.

Sujet 29 : Que les enceintes soient au fond ou en surface, c’est toujours au fond que le son est le plus fort. Par contre c’est possible que le son soit plus homogène lorsque les enceintes sont au fond (mais c’est très vague comme impression).

Sujet 30 : On entend plus les détails quand on est à la même hauteur que les enceintes

Sujet 31 : La position près de la surface me paraît plus homogène car le son est meilleur en surface. (au fond, c’est assez proche de la position au fond de l’eau).

Sujet 32 : Non, tjs plus de basses au fond, mais plus de basses globalement pour les enceintes au fond. (spectre petit pour une écoute surface (enceintes surface)

Sujet 34 : Oui, lorsqu’elles sont au fond du bassin, on a la sensation que le son est plus fort. J’ai trouvé les basses saturées

Sujet 35 : oui comme j’ai essayé de décrire en haut.

Sujet 36 : Oui, grande différence de rendu global des dynamiques pas musicales au fond (les enceintes), l’écoute est bien meilleure, mais les basses sont surdimensionnées.

Sujet 37 : Carrément ! Enceintes au fond plus de niveau, notamment en écoutant en surface.

Sujet 38 : Enceintes en bas, on entend encore plus fort quand on est au fond, j’ai l’impression que les enceintes en surface améliorent la qualité (la puissance) de l’écoute en surface.

Sujet 39 : J’ai l’impression que ça change moins (que c’est plus homogène en fonction de la hauteur) avec les enceintes en bas, au fond mais bon.

Sujet 40 : J’ai eu l’impression qu’une position des enceintes au fond du bassin accentuait le côté « boumy ». Moins de définition et plus de basses globalement. (Mais c’est peut-être dans ma tête !!)

Sujet 41 : Difficile à dire, peut-être plus de basses quand les HP sont au fond : le son paraît alors moins medium…

Question : Percevez-vous une éventuelle directivité des enceintes ? Pouvez-vous évaluer un angle de directivité ?

Sujet 13 : HP près du fond du bassin je dirais un angle de 60° environ.

Sujet 14 : Bof, qd in se décale, on sent des résonances selon la position, genre des modes selon l’angle.

Sujet 15 : Oui, on perçoit une directivité, mais de là à la chiffrer.

Sujet 16 : Pas de là à définir un angle de directivité ! Disons que dans l’axe des 2 enceintes, on a plus de niveau et de son… c’est plutôt égal partout ailleurs.

Sujet 18 : Oui, surtout au niveau du bas medium (étonnamment ?) 45° Sujet 22 : Non pas vraiment

Sujet 23 : NON Sujet 24 : NON

Sujet 26 : Environ 30° (+/- 15°), en étant proche des enceintes. Sujet 27 : environ 90°.

Sujet 28 : Non

Sujet 30 : La directivité dans l’aigu me paraît très étroite (+/-20°, difficile à estimer)

7.4.3 Dynamique/ Compression

Question : Pensez-vous qu’il soit intéressant de compresser certaines musiques sous l’eau ?

Sujet 12 : Pas eu le temps d’écouter, mais en tout cas ça marche plus sur Sting que sur de la musique classique…

Sujet 13 : Non, je pense que plus om compresse un morceau, moins l’écoute sous l’eau est précise. On a ce sentiment de bouillie, les fréquences ce mélangent.

Sujet 14 : oui : un peu classique trop de dynamique. Non, si on peut rester immobile sous l’eau pour écouter sans perturbation.

Sujet 15 : Oui car certains pics sont très désagréables.

Sujet 16 : Classique : je ne vois pas beaucoup de différence, en même temps, j’étais gênée dans la première partie par les nuances faibles du sympho… Ok pourquoi pas un peu de compression. Jazz : non ! à la compression des trois extraits, je préfère de loin le 2e.

Sujet 17 : Les basses rendent mieux un peu compressées, mais trop de compression rend l’image plate – vivante, les son plus aigus sont moins intéressants (piano par exemple).

Sujet 18 : À part protéger les HP…

Sujet 21 : Par rapport à un phénomène de distorsion de basses, la compression peut devenir un facteur limitant de qualité d’écoute.

Sujet 22 : Pas vraiment

Sujet 26 : Sincèrement non ! Les différences sont difficilement perceptibles. Sujet 27 : Pour l’extrait classique, la compression détériore beaucoup le signal,

moins bonne compréhension de la musique, mauvaise intelligibilité. Pour le jazz, les différences sont moins flagrantes.

Sujet 28 : Peut-être moins pour le classique.

Sujet 29 : Je ne suis pas sûre que ce soit lié à la compression, mais dès qu’il y a un orchestre et surtout beaucoup de violons, le classique sonne un peu soupe. D’un autre côté, dès qu’on s’éloigne un peu de la surface, il y a très peu de bruits qui viennent parasiter la musique. Tout est net, et la compression n’apporte peut-être pas grand- chose (surtout pour le jazz).

Sujet 30 : J’ai l’impression que les forts niveaux font mal plus vite que dans l’air, donc oui pour protéger les oreilles. J’ai aussi l’impression que les Haut- parleurs saturent vite, donc oui à cause de la qualité des HP

7.4.4 Localisation

Troisième partie 22 fév. 2008 :

Sujet 1 : AC/DC : pouvez-vous donner des éléments de localisation ? Caisse claire ?

Connaissiez-vous ce mix auparavant ? oui Extrait symphonique : DDGG

Extrait symphonique stéréo, percevez-vous des plans sonores ? Pas du tout Extrait de maracas : GDGD facile à localiser

Sujet 2 : AC/DC : pouvez-vous donner des éléments de localisation ? NON Connaissiez-vous ce mix auparavant ? non

Extrait symphonique : CCCC

Extrait symphonique stéréo, percevez-vous des plans sonores ? Localisé dans la tête ??

Extrait de maracas : Droite

Sujet 3 : AC/DC : pouvez-vous donner des éléments de localisation ? Non Connaissiez-vous ce mix auparavant ? non

Extrait symphonique : DDGG

Extrait symphonique stéréo, percevez-vous des plans sonores ? Extrait de maracas : GDGDG, pas de problème

Sujet 4 : AC/DC : pouvez-vous donner des éléments de localisation ? Non, éventuellement j’entends les guitares doublées donc je les sépare G/D parce que je connais ?

Connaissiez-vous ce mix auparavant ?oui Extrait symphonique : DDGG

Extrait symphonique stéréo, percevez-vous des plans sonores ? Pas vraiment de localisation sur l’image diffusée.

Extrait de maracas : très difficile à localiser, ponctuel, mais partout en même temps. Ça me fait penser : 1. Aux effets de phase qui rendent la localisation difficile. 2. Quand tu diffuses le même signal sur les 5 HP en 5.1.

Sujet 5 : AC/DC : pouvez-vous donner des éléments de localisation ?non Connaissiez-vous ce mix auparavant ?oui

Extrait symphonique 😕 J’étais derrière

Extrait symphonique stéréo, percevez-vous des plans sonores ? Extrait de maracas : GDGD

Sujet 6 : AC/DC : pouvez-vous donner des éléments de localisation ? non

Connaissiez-vous ce mix auparavant ? non

Extrait symphonique : DDGG position milieu du groupe

Extrait symphonique stéréo, percevez-vous des plans sonores ? Extrait de maracas : GDGD

Sujet 7 : AC/DC : pouvez-vous donner des éléments de localisation ? Très rapidement, semblant de localisation de guitares

Connaissiez-vous ce mix auparavant ? Extrait symphonique : GGGG

Extrait symphonique stéréo, percevez-vous des plans sonores ? non Extrait de maracas : Au point proche, localisation possible GDGD

Sujet 8 : AC/DC : pouvez-vous donner des éléments de localisation ? Peut-être la guitare à gauche ?

Connaissiez-vous ce mix auparavant ? non

Extrait symphonique : DDGG (j’étais à 2m du plan des enceintes). Extrait symphonique stéréo, percevez-vous des plans sonores ? Extrait de maracas : GDGDC

Sujet 9 : AC/DC : pouvez-vous donner des éléments de localisation ? J’étais à peu près à 2m du bord de la piscine, tout est un peu flou.

Connaissiez-vous ce mix auparavant ?oui Extrait symphonique : DDGG

Extrait symphonique stéréo, percevez-vous des plans sonores ? Aucun plan sonore Extrait de maracas : J’entend tout sur la droite, sauf le dernier sur la gauche.

Sujet 10 : AC/DC : pouvez-vous donner des éléments de localisation ?

Connaissiez-vous ce mix auparavant ?non Extrait symphonique : DDGG (j’étais derrière)

Extrait symphonique stéréo, percevez-vous des plans sonores ? Extrait de maracas : GDGD (j’étais devant)

Sujet 11 : AC/DC : pouvez-vous donner des éléments de localisation ?non Connaissiez-vous ce mix auparavant ?non

Extrait symphonique : DDG ?

Extrait symphonique stéréo, percevez-vous des plans sonores ?

Extrait de maracas : GDGDCentre Ouais, on sent que ça se déplace mais pfou ! Faut être concentré.

Question : Pouvez-vous donner des éléments de localisation ?

Sujet 12 : Duo Guitaristes : Localisation des QR OK

Bang Bang : voix à gauche (jaune) et guitare à droite. Je me suis éloigné du centre vers le bord, ça marche encore.

Chemical Brothers : HH à droite (j’ai eu l’impression), puis synthé qui se ballade clairement. J’ai pas fait attention aux voix.

Mars Gustav Holst : Trompette à gauche légèrement (jaune)

Sujet 13 : Duo Guitaristes : 1ère gt jaune, 2e guitare rouge Bang Bang : Voix jaune, guitare rouge

Chemical Brothers : Bass Drums centre, Voix 1 HP jaune, Voix 2 HP rouge, Key se ballade

Mars Gustav Holst :

Sujet 14 : Duo Guitaristes : oui 1 gt solo rouge Bang Bang : Nancy vers jaune, gt vers rouge

Chemical Brothers : Rythmique Mono FX se promènent Mars Gustav Holst : Violons vers rouge, cuivres vers jaune

Sujet 15 : Duo Guitaristes : 1 guitare de part et d’autre Bang Bang : Voix côté jaune

Chemical Brothers : Rien si ce n’est plus de basses côté rouge Mars Gustav Holst : Répartition normale d’orchestre

Sujet 16 : Duo Guitaristes : Je galère pr les guitares… y en avait combien ?

Bang Bang : guiatre d’un côté, voix de l’autre

Chemical Brothers : Batterie à 30°, 1 voix de chaque côté, pas de mémoire pour le reste… Rien de très flagrant pour moi quoi.

Mars Gustav Holst : oulala ! Gros Pb… C’est très large et l’harmonie est à droite. Je devais être face vers l’arrière.

Sujet 17 : Duo Guitaristes : Guitare aigue à droite, + grave à gauche. Percus Bang Bang : Voix à gauche guitare à droite

Chemical Brothers : Voix à droite, mvt gauche droite (je crois). Batterie, je ne me souviens plus, pt-être plutôt centré

Mars Gustav Holst : Position orchestre classique Violon à gauche, cuivres percus à droite

Sujet 18 : Duo Guitaristes : 1 gtr de chaque côté

Bang Bang : Voix sur hp jaune (très clairement) gtr sur hp rouge (un peu moins c) Chemical Brothers : Globalement mono, élément mélodique en arpège (genre mélotron) se baladant g/d

Mars Gustav Holst : Globalement mono, violons un peu sur HP jaune

Sujet 19 : Duo Guitaristes : Deux Gt 1J 1R Bang Bang : Voix a Gauche J guitare droite R Chemical Brothers : Scratch mvt

Mars Gustav Holst : violon et cor enceinte R

Sujet 20: Duo Guitaristes : bof Bang Bang : voix à droite, reste ?

Chemical Brothers 😕

Mars Gustav Holst : violon légèrement à gauche Timbale/ Cor à droite

Sujet 21 : Duo Guitaristes :

Bang Bang : On entend bien les guitaristes dialogues G/D

Sujet 22 : Duo Guitaristes : Deux guitare, une à gauche une à droite Bang Bang : Nancy, jaune, guitare rouge

Chemical Brothers : La voix et le clavier qui se balade de droite à gauche

Sujet 23 : Duo Guitaristes : guitare plutôt ampli jaune Bang Bang : Voix ampli rouge/ musique ampli jaune

Chemical Brothers :Voix ampli jaune/ Instrument ampli rouge Mars Gustav Holst : désespérément mono

Sujet 24 : Duo Guitaristes : Droite

Bang Bang : voix à gauche, instrument à droite Chemical Brothers : à droite

Mars Gustav Holst : au centre et à droite

Sujet 25 : Duo Guitaristes : Ok, un à gauche, l’autre à droite Bang Bang : idem

Chemical Brothers : Pas flagrant. OK pour les voix G/D, pas pour le synthé Mars Gustav Holst : Un peu plus d’air en stéréo, sur réponse cuivres

Sujet 26 : Duo Guitaristes : au début, rythmique rouge, mélodie jaune Bang Bang : Gtr plus large, voix également Gt vers l’enceinte rouge Chemical Brothers : Voix comme avec un traitement HRTF

Mars Gustav Holst : Difficile à définir, mais incomparablement mieux en stéréo

Sujet 27 : Duo Guitaristes : 1ère gt sur rouge Bang Bang : Nancy sur rouge

Chemical Brothers : Mvt Rouge- Arrière- Jaune sur les voix

Sujet 29 : Duo Guitaristes : 1 guitare à J, 1 gt à R Bang Bang : Nancy est à Jaune

Chemical Brothers : Aucune idée pour la localisation, mais c’est carrément mieux en stéréo.

Mars Gustav Holst : C’est un peu de la soupe dans l’eau, cuivres à jaune

Sujet 30 : Duo Guitaristes : 1 guitare de chaque côté, solo à J, rythmique à R Bang Bang : Nancy est à J, la guitare à R

Chemical Brothers :Difficile à localiser

Sujet 31 : Duo Guitaristes : Gauche/Droite assez bien définie Bang Bang : voix jaune, guitare rouge

Chemical Brothers : ? déplacements rouge vers jaune ?

Mars Gustav Holst : Localisation difficile mais sensation d’espace

Sujet 32 : Duo Guitaristes : Gt grave sur R aigue sur J (+ de sensation d’espace)

Bang Bang : Voix sur jaune

Chemical Brothers :Bruitages sur rouge

Mars Gustav Holst : Violons, cors sur R, tp sur J Sujet 33 : Bang Bang : voix côté jaune

Sujet 34 : Duo Guitaristes : Je ne perçois pas l’origine gauche ou droite des sons.

Bang Bang : Idem

Chemical Brothers : Le son grave est très saturé dans les deux cas, encore plus en stéréo

Mars Gustav Holst : Petit son, un peu saturé en mono et beaucoup en stéréo. Très mauvaise qualité d’écoute (je me demande si je n’ai pas les oreilles bouchées).

Sujet 35 : Duo Guitaristes : Localisation guitares vers gauche et droite, le son général est plus transparent.

Bang Bang : Gt d’un côté, voix de l’autre côté, donc localisation Chemical Brothers : pas trop stéréo

Mars Gustav Holst : résonant vers 1 kHz, et pas qu’en mono, localisation pas trop.

Sujet 36 : Duo Guitaristes : Impossible de localiser Bang Bang : Idem

Chemical Brothers : Idem Mars Gustav Holst : Idem

Sujet 38 : Duo Guitaristes :

Bang Bang : La voix côté jaune, le guitariste plutôt rouge (mais bouge un peu) Chemical Brothers : les graves plutôt jaune, voix 1 jaune, Voix 2 rouge

Mars Gustav Holst : Impression des cuivres graves plutôt jaune. J’ai localisé plusieurs sons, mais comment l’écrire ?

Sujet 39 : Duo Guitaristes : Il y a de l’espace, mais difficile à décrire Bang Bang : fille à droite, le reste plus au milieu

Chemical Brothers : Il y a de l’espace mais difficile à décrire

Mars Gustav Holst : les cuivres sont facilement localisables, le reste moins

Sujet 40 : Duo Guitaristes : Bonne stéréo, large sur dialogues guitares

Bang Bang : Basses floues, bonne localisation en fin d’extrait, dans les voix gauche/droite

Chemical Brothers :

Mars Gustav Holst : Localisation assez floue. Impression de largeur sur l’orchestre

Sujet 41 : Duo Guitaristes : Clairement g/d, même quand on s’éloigne

Bang Bang : les sons sont artificiels (pas acoustiques je veux dire, dc c’est plus difficile de percevoir un espace, donc de localiser

Chemical Brothers : ? encore plus dur, Par contre dans la version mono,on entend vraiment les masquages du mono.

Mars Gustav Holst : Cette fois j’ai l’impression de percevoir une image avec un peu de profondeur… (illusion ?), par contre, pas de G/D

Question : Avez-vous des remarques concernant la localisation ?

Sujet 12 : C’est moins évident que dans l’air, mais on y arrive, même loin des HP (dans l’axe)

Sujet 13 : Je trouve dans cet exercice, la localisation est relativement facile à distinguer.

Sujet 14 : Ça marche bien !!

Sujet 16 : Ce n’est pas évident mais c’est possible.

Sujet 17 : On la ressent vraiment dans la tête : côté gauche ou droit qui résonne, c’est étrange comme sensation, pas habituel mais sympa.

Sujet 18 : Des questionnements …! Les règles doivent être différentes Les Δt sont peut-être plus importants que les Δi ? Donc à établir.

Sujet 19 : Meilleure en immersion qu’en surface !!

Sujet 20 : PAN à 100% marche bien, du stéréo mélangé moyen

Sujet 23 : De manière générale, la musique est plutôt englobante et je distingue mieux la provenance des voix.

Sujet 26 : La stéréo, c’est plus aéré ! C’est ça l’avantage de localiser un minimum.

Sujet 27 : Rendu 100 fois meilleur en stéréo.

Sujet 28 : Bien meilleure restitution de l’espace, sensation d’enveloppement, et meilleure précision en stéréo.

Sujet 29 : La stéréo est plus agréable

Sujet 31 : La localisation est très floue, par contre la sensation d’espace est largement meilleure en stéréo (peut- être le problème de repli de la stéréo en mono est-il à incriminer)

Sujet 32 : Il y a une énorme différence lorsqu’on bouche les oreilles : le son devient plus précis et avec moins de graves, la reverb de la piscine doit être perçue via le conduit auditif…

Sujet 33 : La stéréo donne plus d’espace, de sensation de volume, de reverb, même si on ne détermine pas la localisation. Même sensation de « respirer » que l’écoute hors de l’eau (mono/ stéréo)

Sujet 34 : la localisation est plus spatiale qu’en aérien, j’ai eu l’impression d’entendre des bruits en haut et en bas en plus de droite et gauche.

Sujet 35 : J’ai eu du mal à localiser sur l’exemple du dialogue (j’ai dû me concentrer), et sur les autres morceaux, une sensation globale, mais impossible de localiser. Le son stéréo semble plus fort, plus « ample »

Sujet 36 : Je localisais pas grand- chose. Orchestre : presque rien. Selon moi, la localisation n’a pas d’importance dans la piscine, plutôt il faut essayer d’améliorer le son en général, et trouver une solution pour essayer d’avoir un son à peu près égal/ pareil dans tout le bassin.

Sujet 37 : Grosse différence de dynamique et de définition entre mono et stéréo au profit de la stéréo.

Sujet 38 : Je localise peu précisément (est difficile à retranscrire sur papier).

Sujet 39 : C’est un peu comme au casque mais moins large. Il faut que cela soit marqué pour être prégnant.

Sujet 40 : Localisation des basses assez floues.

Sujet 41 : Je crois que pour bien localiser il faut que gauche et droite soient bien séparés (rien au centre) que les sons soient plutôt acoustiques et plutôt simples.

Question : Avez-vous des remarques pour finir ?

Sujet 8 : La musique dans l’air ça sonne c’est clair, dans l’eau c’est beau.

Sujet 12 : C’est super. Bosse dans le bas medium (200, 300Hz) faiblesse un peu dans les aigus, mais c’est agréable.

Sujet 23 : L’écoute sous l’eau demande de la concentration et peu d’activité physique.

Sujet 28 : Expérience très agréable physiquement, détente et massage corporel.

Sujet 31 : Le son est essentiellement dans la tête (surtout oreilles bouchées) avec un espace autour (oreilles débouchées) qui brouille un peu, surtout pour niveau fort.

Sujet 32 : Il finit par faire froid (d’où écriture tremblante). Oreilles bouchées= moins de graves.

Sujet 33 : J’ai senti des différences importantes dès que ma tête était complètement immergée.

Sujet 34 : C’est quand je suis entre les enceintes que le son est le plus distordu.

Sujet 35 : Je ne me sentais pas trop bien dans l’eau à cause de manque d’air et mal aux yeux donc en pratique, pour le confort dans une piscine, on veut se détendre, se relaxer plutôt, c’est-à-dire on veut rester à la surface – là, symphonique ne marche pas, la variété marche mieux, rumble dans les graves. Si on bloque les oreilles avec les doigts, la différence entre bloqué et ouvert n’est pas du tout très grande en comparaison avec dans l’air.

Sujet 36 : Boucher les oreilles coupe les graves de façon spectaculaire (cf. chemical brothers).

Sujet 39 : oreilles bouchées, on perd les graves mais on éclairci le discours, débouchées, on a + de niveau : intéressant. À voir aussi la fréquence de résonance dans le bassin : ça brouille le bas, pb de sensation de hauteur, ça bave, ça sature.

Sujet 40 : Oreilles bouchées : pas de localisation, perte de toutes les basses.

Remerciements

Merci à Corsin Vogel, mon directeur de mémoire, qui m’a accompagné tout au long de l’année avec enthousiasme et clairvoyance.

Merci à Noël Canivenq, fondateur de la société Aquamusique, qui a cru en ce projet, et qui m’a prêté le matériel nécessaire au déroulement des tests. Son aide a aussi été précieuse pour trouver une piscine pour les expériences.

Merci à Bernard Boulet, de la Fédération Française de Natation, et au personnel de la piscine Mathis, pour leur accueil et leur disponibilité. Merci plus particulièrement à Mme Linh Do, la responsable du Service du Sport de Proximité de la ville de Paris.

Merci à Cédric Joder, qui a attrappé une bonne bronchite en m’aidant à faire des expériences préliminaires dans ma baignoire, et qui est quand même revenu à la piscine par la suite.

Merci enfin à tous ceux qui se sont mouillés dans ce projet, et qui m’ont rendu des questionnaires tout trempés, à peine lisibles mais fort intéressants.

Dans l’ordre alphabétique : Romain Allender, Alexis Anerilles, Elise Boisseau, Julien Bourdin, Virginie Burgun, Natacha Canton, Sophie Canton, Sebastien Chonion, Baptiste Chouquet, Clément Damès, Jeanne Delacroix, Mariette Girard, Camille Giuglaris, Mireille Faure, Pierre Favrez, Aurélie Ferrière, Axelle Ferrière, Géraldine Foucault, Julien Hulard, Cédric Joder, Laurent Malys, Aurélie Martin, David Menke, Pierre Merle, Cyrille Métivier, Sylvain Morizet, Matthias Muracciole, Christian Oury, Aude- Marie Piloz, Benjamin Ribolet, Roland Seilhes, Corsin Vogel, Jacques Warnier

juin 2, 2026

La texture en musique : sa contribution pour la composition, l’apprentissage de la musique et ses effets sur la perception et la cognition des enfants sourds implantés

UNIVERSITÉ DE BOURGOGNE FRANCHE-COMTÉ : ÉCOLE DOCTORALE SEPT (Société, Espace, Pratiques, Temps) LEAD UMR 5022

Doctorat de MUSICOLOGIE par Sandrine PERRAUDEAU

Introduction

Au cours de la deuxième moitié du XXᵉ siècle, l’émergence de la notion de texture a ouvert de nouvelles perspectives en matière de composition et d’appréhension de la musique. Le terme apparaît dans le discours de musiciens, analystes, compositeurs et musicologues, chacun lui donnant sa propre définition : nous le trouvons chez Ligeti « Textur » (en langue allemande) dans plusieurs articles de référence¹, chez Peter Niklas Wilson à propos de Ligeti (1992)² et de façon beaucoup plus systématique chez les anglo-saxons avec l’ouvrage « Analytic Approaches to Twentieth-Century Music » de Joel Lester (1989)³ notamment. L’exploration de nouveaux territoires sonores au cours du XXe siècle a bouleversé la perception des auditeurs et des compositeurs, habitués aux règles syntaxiques énoncées dans le cadre du système tonal. Les compositeurs ont alors envisagé l’écriture sous un angle nouveau : l’élargissement de l’instrumentarium (particulièrement dans les familles des vents et percussions), l’emploi de nouvelles techniques instrumentales et vocales, l’influence de la musique électroacoustique fonctionnant avec des masses sonores et des trames autour de l’écriture instrumentale, ainsi que le recours aux nouvelle technologies ont permis de développer une réflexion innovante autour de la matière sonore et de sa spatialisation.

« La musique de demain sera spatiale. »⁴ À cette déclaration du compositeur Edgar Varèse, Zao Wou-Ki, son ami de toujours, répondra en réalisant un tableau « hommage », un an avant la mort du musicien en 1964. Dans cette toile, nous pouvons voir une texture singulière, laissant suggérer la

« collision entre les sons », recherchée par Varèse, où Zao Wou-Ki jouera avec des effets picturaux et des masses colorées grâce à l’utilisation de multiples techniques, de l’aplat au graphisme le plus brut. D’une certaine manière, le tableau produit une partition visuelle engageant une musicalité. Zao Wou-Ki déclarait lui-même : « Vaincre la surface était devenu mon obsession, un défi qui me posait de nombreux problèmes. […] Ainsi, d’une peinture du sentiment, j’étais passé à une peinture de l’espace. »⁵

Figure 1 : Hommage à Edgar Varèse – 25.10.64, de Zao Wou-Ki, (225 x 345 cm), Musée cantonal des Beaux-Arts de Lausanne, 1964. — Figure 1 : *Hommage à Edgar Varèse – 25.10.64*, de Zao Wou-Ki, (225 x 345 cm), Musée cantonal des Beaux-Arts de Lausanne, 1964.

De même, la réflexion du compositeur, théoricien et musicologue, Hugues Dufourt nous semble particulièrement intéressante d’être mentionnée afin de mieux comprendre le contexte :

En 1970, la scission du sonore et du musical était totale. Les musiciens emportaient avec eux le formalisme, les règles, la syntaxe, les lois de la combinatoire, mais ils n’avaient plus prise sur un monde sonore en pleine effervescence. De leur côté les électroacousticiens libéraient les puissances du son, réabsorbant dans de larges trames le bruit, les sonorités complexes et le raz de marée des mixtures inharmoniques. Mais sans accès à l’écriture, ils ne pouvaient formaliser intégralement leurs opérations ni par conséquent contrôler leurs trouvailles. Tel était le dilemme : ou bien une écriture condamnée à fonctionner à vide, dans l’autarcie des systèmes formels ; ou bien une production sonore effective, mais frappée d’une inintelligibilité de principe.⁶

Dès lors, la sensibilité auditive évolue, elle se focalise sur les transitoires d’attaque et d’extinction, les oscillations, le grain, la rugosité et résonancence. À ce propos, la texture bouleversera les codes de l’écriture instrumentale et vocale avec pour représentants des compositeurs comme Morton Feldman, György Ligeti, Gérard Grisey, Iannis Xenakis et Hugues Dufourt. Les musicologues ont alors élargi leur palette analytique en s’emparant de la notion de texture. Les œuvres sont analysées en termes de trames, de lignes, d’étendue spectrale, de masses, de densité, de rugosité, etc. Le musicologue américain Leonard Meyer dans son ouvrage de référence Emotion and Meaning in Music (1956)⁷ consacre un chapitre entier à la texture. L’approche essentielle de ce dernier a permis de mettre en lumière les processus cognitifs et émotionnels de la musique, en faisant référence au jeu des tensions et détentes induites par la matière musicale. Dans ce contexte, « la texture correspond à l’émergence de propriétés à un niveau supérieur. On peut imaginer qu’elle est la manifestation d’un processus d’auto-organisation guidé par diverses contraintes cognitives et attentionnelles. Le cerveau procéderait à des choix, des groupements, des hiérarchies selon des contraintes attentionnelles et mnémoniques et selon l’acculturation et les stratégies d’écoute de l’auditeur. »⁸ Mais c’est surtout les études dans le cadre de « l’analyse de scène auditive », compilées dans le célèbre ouvrage de Bregman, qui vont apporter un cadre théorique à l’analyse de la texture (1990).⁹

Au regard de tout cela, comment étudier et comprendre les fondements cognitifs de la perception de la texture ? Il nous semble intéressant de voir également comment nous pourrions utiliser la texture pour l’analyse d’œuvres de musique contemporaine.

« J’imagine être au bord d’un lac où tout est paisible, lisse. » Ce témoignage d’enfant sourd n’est pas isolé quand il s’agit d’expliquer leur savoir-faire pour classer des textures musicales. Pour certains, la texture est assimilée à une « onde visuelle » qui serait la réunion entre « le sentiment et le mouvement ». Dans notre enseignement au quotidien, l’intérêt porté pour la matière sonore et sa perception chez des enfants sourds nous a toujours fasciné et interrogé : car d’une part, le fait d’écouter de la musique contemporaine ne les rebute pas du tout, contrairement à leurs camarades normo-entendants du même âge, elle semble même stimuler leur imagination, d’autre part, leur musicalité se traduit spontanément par le mouvement car elle est le produit intérieur et instinctif imaginé par leur conscience visio-spatiale tout à fait singulière. Cette capacité d’entrer en résonance corporelle avec des contenus musicaux ou avec les gestes de l’autre nous a permis de changer de point de vue et de remettre en cause notre enseignement pour nous diriger vers des méthodes axées sur les aspects psychomoteurs de l’apprentissage et de l’expression musicale. L’utilisation du corps comme premier instrument repose sur des principes pédagogiques énoncés dans les années 1920 avec des pédagogues comme Jacques-Dalcroze, Orff et Martenot notamment. Ces méthodes actives musicales nous semblent tout à fait adaptées à des enfants sourds. Partant de cela, l’ensemble de nos travaux de recherches ont tenté de comprendre et d’expliquer leur perception de la texture et leur attrait pour la musique contemporaine. Est-ce que la texture ne serait pas un formidable levier pour l’éducation musicale de ces enfants ?

Dans un premier temps, nous nous sommes donc consacrés à faire une revue de la texture d’un point de vue pluridisciplinaire. Par exemple, en synthèse d’image, une texture correspond à une région dans une image numérique ayant des caractéristiques homogènes. Ces caractéristiques sont par exemple un motif basique qui se répète, ou des caractéristiques fréquentielles. Ici, une texture est composée de textels, l’équivalent des pixels. En science des matériaux, et en particulier en métallurgie, la texture désigne une orientation cristalline préférentielle, par rapport à une distribution isotrope des orientations. En science des aliments, la texture est l’ensemble des propriétés rhéologiques (résistance à l’écoulement) et de structure (géométrie et surface) d’un produit alimentaire perceptible par les mécano-récepteurs, les récepteurs tactiles et éventuellement les récepteurs visuels et auditifs. En peinture, la texture désigne la consistance de la toile ou du support sur lequel est réalisée l’œuvre.

Puis, dans notre second chapitre, nous exposerons la texture du point de vue des musicologues et compositeurs, pour définir ensuite les principes d’organisation auditive qui permettent de comprendre sa perception (chapitre 3).

Après l’exposition des implications de la texture d’un point de vue pluridisciplinaire, musicologique et cognitiviste, nous aborderons son statut auprès des enfants sourds. Pour cela, dans notre quatrième chapitre, nous présenterons la surdité et ses conséquences sur leur développement ainsi que les différents moyens de réhabilitation existants. Au regard des multiples travaux expliquant les bienfaits de la musique sur notre cerveau (Kirschner et al., 2009¹⁰ ; Herholz et al., 2012¹¹ ; Tillmann et al., 2014¹² ; Bigand, 2018¹³), nous postulons que la musique pourrait être un outil de stimulation auditive pertinent pour ces enfants. Selon Jacques-Dalcroze, « on n’écoute pas uniquement la musique avec les oreilles, on l’entend résonner dans le corps tout entier, dans le cerveau et dans le cœur. »¹⁴ C’est particulièrement cette écoute corporelle qui nous intéresse aujourd’hui et qui nous a poussé à enseigner la musique tout autrement. Il suffit de penser à la percussionniste et compositrice sourde Evelyn Glennie qui explique : « entendre plus avec son corps qu’avec ses oreilles »¹⁵. Sa déficience auditive lui a permis de mieux comprendre la musique qu’elle aime et de mieux s’y connecter. Elle est le sujet du documentaire Touch the Sound, qui explore cette approche peu conventionnelle et intriguante de la percussion.¹⁶

Dans la première partie du cinquième chapitre, nous nous sommes attachés à donner notre point de vue sur cette notion en proposant deux axes : un axe vertical qui correspondrait aux dimensions de la texture, la densité versus aéré, l’étendue, la couleur, le bruit, etc. et un axe horizontal qui lui se conformerait à la trame, la dimension temporelle, le grain ou la nature (strié ou lisse), etc. C’est pourquoi il nous a semblé intéressant de présenter dans le cadre de ce travail de recherche, quatre analyses texturales à l’aide de l’informatique, en nous limitant aux techniques de visualisation du signal audio. Puis la deuxième partie se focalisera sur les résultats de nos deux expérimentations menées autour de la perception de la texture chez des enfants sourds implantés versus enfants et adultes normo-entendants.

Toute notre démarche musicale auprès des enfants sourds s’est largement nourrie des « méthodes actives » entièrement centrées sur l’enfant, comme celles de Orff, Jacques-Dalcroze, Martenot, etc., que nous détaillerons dans notre dernier chapitre. Chercher tout ce qui permet à l’enfant d’acquérir ce qui lui est nécessaire : recherche par tâtonnement, exploration du mouvement, le corps comme premier instrument. Comme l’écrit si justement Monique Désy Proulx, « la musique nous lie les uns aux autres. En chantant, en jouant ou en dansant à plusieurs, nous ressentons en même temps les mêmes émotions, ce qui nous révèle à quel point nous sommes semblables et nous faisons partie d’un tout. »¹⁷ La musique est avant tout source de plaisir, de sensations, d’expressivité et de création. C’est dans cette perspective que nous avons élaboré nos expérimentations en suggérant que la texture permettrait de stimuler l’expérimentation d’autres pratiques pédagogiques, davantage liées à la découverte du corps, de l’expression du mouvement et de la voix dans toutes ses potentialités.

Chapitre 1 : La texture d’un point de vue pluridisciplinaire

Pour tenter de construire une réflexion intéressante autour de la notion de texture, il nous semble nécessaire de proposer un état de l’art afin de montrer son importance dans des domaines fort variés, car dans notre environnement, la texture est omniprésente. Elle contient des informations visuelles importantes sur un objet et nous permet de distinguer les animaux, les plantes, les aliments et les tissus. Cela fait de la texture une partie importante de l’apport sensoriel que nous recevons chaque jour. Dans les arts visuels, la texture est la qualité de surface perçue d’une œuvre d’art. C’est un élément de conceptions bidimensionnelles et tridimensionnelles qui se distingue par ses propriétés visuelles et physiques perçues.¹⁸ Du point de vue de la recherche, les textures sont classées en textures tactiles et visuelles. Les premières, également appelées textures réelles ou textures physiques, sont des variations de surface comme la fourrure, le sable et les surfaces lisses de la toile, du métal, du verre, ou encore du cuir. La texture physique se distingue de la texture visuelle par une qualité physique qui peut être ressentie au toucher.¹⁹ La texture visuelle est l’illusion de la texture physique. Chaque matériau a sa propre texture visuelle. Les photographies, les dessins et les peintures utilisent une texture visuelle pour représenter de manière réaliste et avec interprétation leur matière. Nous parlerons également dans ce chapitre des textures physiques telles que la géologie, l’anatomie et de l’immensément grand avec la cosmologie. La métaphore du tissu associée à la littérature ou aux arts plastiques questionnera la notion de texture. De plus, l’aspect multidimensionnel de la texture dans la cosmétique et dans la science des aliments sera tout autant abordé dans ce chapitre.

Au demeurant, il s’agit de proposer un parcours autour de la notion de texture à travers une lecture pluridisciplinaire.

1. La texture en cosmologie

En cosmologie, la texture est un défaut topologique de l’univers. Le cosmologiste, Neil Turok est un grand pionnier dans ce domaine. Il a émis une théorie nouvelle sur l’origine du Big-bang. Il propose que le Big Bang ne représente juste qu’un stade d’un cycle infiniment répété de l’expansion de l’Univers et de ses contractions. Ainsi, cela implique que ni le temps ni l’univers n’ont de commencement ni de fin. Des physiciens pensent que cette théorie mérite que l’on s’y intéresse car les équations sur les lois qui régissent l’univers vont à l’infini. Le scientifique est proche de la Théorie des Cordes, développée par Edward Witten, en 1995.

Les défauts topologiques tels que les textures et les cordes cosmiques (à ne pas confondre avec les cordes de la théorie des cordes) sont des structures hypothétiques présumées stables qui se seraient formées dans les premiers instants de l’univers. Les théories impliquant la formation de défauts topologiques prédisent qu’ils seraient apparus à l’issue de la période inflationnaire. Ces textures expliqueraient la formation des grandes structures.

Joseph Silk nous explique que la texture correspondrait à un nœud topologique tridimensionnel. Il considère que le cas des textures est particulièrement intéressant :

Dès lors que la distance parcourue par la lumière depuis le big-bang devient comparable au rayon d’une texture, celle-ci s’effondre et emporte avec elle toute la densité d’énergie associée. Lorsque sa taille atteint environ 10-30 centimètres, le nœud se défait. Ce phénomène s’accompagne de l’émission d’une salve de particules interagissant faiblement connues sous le nom de « bosons de Goldstone ». La densité d’énergie associée à la texture et à la couche en expansion de ces bosons pousse la matière ordinaire environnante, qui forme alors les structures

que l’on observe aujourd’hui. La matière ambiante répond par des fluctuations en densité qui conduisent à la formation de galaxies, d’amas de galaxies et de structures plus vastes encore.²⁰

Néanmoins pour le moment, depuis les observations du satellite Cobe, les modèles basés sur des cordes cosmiques et les textures sont considérés en général comme non viables. Les observations ne permettent pas d’expliquer majoritairement l’apparition des grandes structures de l’Univers à partir de zones de surdensité créées par des cordes cosmiques, ou en liaison avec les textures. Mais cela ne veut pas dire qu’il n’en existe pas ! Simplement, leur rôle ne peut être que très minoritaire.

2. La texture et l’anatomie

L’anatomie humaine se divise en deux grandes parties : l’anatomie physiologique qui étudie les organes sains, et l’anatomie pathologique qui étudie les organes malades. « Lorsque l’anatomie s’occupe de toutes les qualités des organes qu’on peut observer sans les diviser, elle prend le nom d’Anatomie des formes, des connexions, ou d’Anatomie descriptive. Quand elle s’occupe de leur texture intime, elle est désignée sous le nom d’Histologie ou d’Anatomie de texture. »²¹

Aujourd’hui, l’Histologie fait référence à l’étude des tissus biologiques. Elle étudie la structure de ces tissus à un niveau microscopique et permet de comprendre leur fonctionnement normal ou pathologique. Elle se situe au carrefour de la biologie cellulaire, de l’anatomie, de la biochimie et de la physiologie. Le terme de tissu désigne un ensemble de cellules présentant une structure semblable et remplissant une (ou des) fonction commune. Un tissu peut être un tissu simple ou un tissu composé. Dans le corps humain, il existe quatre tissus simples ou primaires : le tissu épithélial, le tissu conjonctif, le tissu musculaire et le tissu nerveux. Un tissu composé est une combinaison de tissus simples associés morphologiquement et fonctionnellement.

Ainsi, « la plupart de nos organes contiennent des tissus des quatre groupes primaires, la disposition de ces derniers au sein de l’organe, avec la participation d’éléments vasculaires et d’éléments nerveux, déterminant sa structure et ses capacités fonctionnelles. »²²

Figure 2 : Description générale des quatre tissus fondamentaux.²³

3. La texture en géologie

La texture, observable au microscope, concerne la disposition élémentaire des minéraux, définie par leur taille (granulométrie), leur forme et leur arrangement. La texture d’une roche est comme une empreinte digitale car elle nous renseigne sur son environnement de formation.

Nous distinguons ci-après une liste des principales textures souvent associées à des roches magmatiques et métamorphiques.²⁴ Toutefois la variété des textures est si grande qu’il n’est pas envisageable dans le cadre de notre recherche d’en faire un catalogue exhaustif.

3.1. Les roches magmatiques

Texture phanéritique (ou grenue) : concerne les roches magmatiques dont le grain est visible à l’œil nu. La taille des minéraux varie entre 1 et 5 mm et sont le plus souvent équigranulaires. La texture phanéritique indique un refroidissement lent du magma. Le granit en est l’exemple le plus courant.

Texture aphanitique : concerne les roches magmatiques qui ne montrent pas de cristaux visibles à l’œil nu, ni même au microscope. La taille de ces minéraux est généralement plus petite que 1 mm.

Texture vitreuse : cela correspond aux roches magmatiques qui sont entièrement ou en grande partie constituées de verre.

Texture pegmatitique : texture d’une roche magmatique ayant des minéraux de dimension centimétrique, décimétrique ou exceptionnellement métrique. La texture pegmatitique indique un refroidissement très lent du magma.

3.2. Les roches métamorphiques

Texture granoblastique : C’est une texture sans orientation des minéraux. Les roches sont formées de minéraux en granules, comme par exemple les quartzites et les marbres.

Foliation : Texture avec orientation des minéraux. Alternance de lits de minéraux différents. La roche présente des feuillets alternés de divers minéraux, tantôt clairs, tantôt sombres.

Schistosité : C’est une texture avec orientation privilégiée des minéraux. Disposition orientée des minéraux en plans parallèles, plus ou moins marqués.

Depuis longtemps en géologie-géophysique, l’analyse quantitative de textures a pu fournir des informations essentielles sur l’histoire des déformations des roches et pour interpréter l’anisotropie observée dans la propagation sismique.²⁵ L’obtention de matériaux texturés a subi, de fait, un essor sans précédent. Il nous semble par conséquent important de faire le point sur les textures cristallographiques.

4. Texture et Cristallographie

La cristallographie est la science qui se consacre à l’étude des substances cristallines à l’échelle atomique. Les propriétés physico-chimiques d’un cristal sont étroitement liées à l’arrangement spatial des atomes dans la matière. Elle étudie la formation, la croissance, la forme extérieure, la structure interne, et les propriétés physiques de la matière cristallisée. Après avoir fait partie de la minéralogie, la cristallographie est devenue, depuis la fin du XIXᵉ siècle, une science indépendante apte à pouvoir mener l’étude de la morphologie, de la texture et de la structure des cristaux. Elle est le fondement de plusieurs autres domaines, dont la physique, la chimie, les mathématiques, la biophysique, la métallurgie en général, l’électronique, etc. Comme le souligne l’historien Denis Guthleben, « En pénétrant la structure des matériaux, la cristallographie a ouvert un champ immense de connaissances. Et ce champ n’a fait que s’élargir à mesure de l’amélioration des générateurs de rayons X, puis de la découverte de nouvelles méthodes pour l’étude de structures toujours plus complexes. »²⁶ Cette science trouvait déjà ses racines dans la philosophie grecque antique avec Platon et ses disciples, en grande admiration devant la perfection de la forme de ces cristaux.

Dans ce domaine, la texture est la description de la forme, des dimensions, et de l’orientation mutuelle des monocristaux dans un matériau polycristallin (constitué d’un ensemble de monocristaux) comme un métal, une poudre, un sol, une céramique, etc. La diffraction des rayons X ou des neutrons permet d’accéder à cette texture. Il apparaît essentiel aujourd’hui de développer un maximum de techniques afin de caractériser au mieux la texture pour une bonne maîtrise des propriétés d’usage des matériaux.²⁷

Figure 10 : Exemples de résultats de l’analyse quantitative de texture magnétique présentés sous la forme de figures de pôles directes.²⁸

Dans le domaine de la science des matériaux, un grand nombre de travaux ont pour objectif de décrire et d’optimiser le comportement macroscopique des métaux et alliages, à partir de la caractérisation et de l’analyse de leur microstructure et de leurs mécanismes fins de déformation. Pour cela, les scientifiques ont alors besoin de mesurer la texture, les déformations, pour suivre au plus près le comportement du matériau étudié. Nous ne détaillerons pas ici les différents principes des mesures de ces textures, car ce domaine d’étude scientifique fort complexe n’est pas le nôtre.

5. Texture et sciences des aliments

La texture et la sensation en bouche sont des propriétés sensorielles fondamentales des aliments. Datant d’un siècle environ, l’analyse de la texture des aliments est un domaine scientifique qui a réellement pris son essor au début des années 1960, notamment grâce aux travaux de R.H. Scott Blair et A.S. Szczesniak.²⁹ La définition donnée par Szczesniak en 1998 est la plus représentative :

La texture est la manifestation sensible et fonctionnelle des propriétés structurales et mécaniques des aliments, détectées par les sens de la vision, l’ouïe, ainsi que le toucher et les perceptions kinesthésiques.³⁰

L’analyse de la texture dépendra donc de la sensation ressentie lorsque ce produit est mis en bouche avant son ingestion. « Un des premiers travaux de l’analyse de texture va consister à nommer ces sensations le plus objectivement possible, c’est-à-dire à interpréter un champ sensoriel par la parole. »³¹ La texture est un des critères principaux utilisés par les consommateurs pour juger de la qualité et de la fraîcheur des produits. Dans le domaine alimentaire, la texture est considérée essentiellement comme une propriété sensorielle et regroupe un grand nombre de termes. Nous pouvons citer, entre autres, la tendreté pour la viande, l’onctuosité ou la fermeté pour des fromages, l’aspect collant pour des pâtes ou encore les caractères craquant, friable, dur et croustillant pour des biscuits, etc.

Figure 11 : Exemples de différents types de textures alimentaires.

Le développement de nouvelles textures peut être considéré comme une source d’innovation majeure pour le secteur alimentaire. Lors de la dégustation, la texture est appréciée en trois phases : une phase d’attente, de mastication et de déglutition. Au cours de cette dernière phase, les informations de textures peuvent être de nature très variée. Selon ses caractéristiques de surface, la texture peut se révéler rugueuse, lisse, fibreuse, humide, grasse, etc. Elle peut avoir des caractéristiques mécaniques primaires comme la dureté, l’élasticité, la viscosité, etc., ou encore des caractéristiques géométriques telles que la granulosité ou la forme et l’arrangement des particules dans le produit en question.

Divers travaux autour de l’évaluation sensorielle de la texture ont démontré l’importance des sensations acoustiques pour la perception du croustillant.³² La hauteur du son émis lors de la morsure et de la mastication nous permet par exemple de différencier le croustillant (bruit aigu, correspondant à une fréquence élevée) du croquant (bruit grave, correspondant à une faible fréquence). Les stimulus auditifs ont donc une importance capitale dans la perception de la texture.

Quant à la vue, elle nous permet d’anticiper la texture de l’aliment qui va être consommé : elle nous prépare à mordre avec une vigueur appropriée.

Ainsi, tous les sens sont concernés : le toucher lors de la prise du produit et dans la mise en bouche, la vue lors du choix, l’ouïe lors de la mastication. Le goût et l’odorat interviennent également dans notre perception des différentes saveurs. Le goût permet d’identifier les substances chimiques sous forme de solutions par l’intermédiaire de chémorécepteurs. Quant à l’odorat, il permet de détecter les substances chimiques volatiles.³³

De plus, il existe également des méthodes instrumentales. Elles révèlent de la rhéologie. Il existe trois grandes catégories de mesures de la texture : des méthodes fondamentales (mesure de la viscosité, de la dureté, de la résistance ou de la fragilité d’un matériau alimentaire), des méthodes empiriques basées sur trois principes fondamentaux de la déformation (la flexion, le cisaillement et la compression) et enfin les méthodes imitatives (imitation de l’action des dents par exemple).³⁴ L’analyse instrumentale peut conforter l’analyse sensorielle dans le cadre du respect de certaines réglementations, voire en matière d’innovation.

6. La cosmétique et la texture

La texture d’un produit est une notion complexe et multidimensionnelle. Comme nous l’avons exposé précédemment pour le domaine alimentaire, avec la définition de Szczesniak notamment (1963), elle peut être définie de manière similaire pour l’évaluation de produits cosmétiques. Ainsi, la perception de la texture de produits cosmétiques, types crème ou lait, peut être divisée en 4 étapes, correspondant à l’ensemble des sensations perçues au fur et à mesure qu’elles apparaissent lors de l’évaluation d’un produit (Schwartz, 1975³⁵ ; Civille & Dus, 1991³⁶) :

L’apparence, comprenant les propriétés visuelles d’un produit avant toute manipulation,

Le pick-up, correspondant aux propriétés sensorielles du produit perçues avant application, lorsque le produit est prélevé dans son contenant,
L’application ou pénétration, comprenant les propriétés du produit développées durant son application sur la peau,
L’apparence résiduelle et la sensation au toucher, correspondant aux effets visuels, tactiles, olfactifs et kinesthésiques du produit sur la peau, après application.

Ainsi, la perception globale de la texture est rendue possible par l’intégration de nombreux stimuli rendant compte de cette muldimensionnalité.³⁷

Le secteur de la cosmétique adapte les textures de ses produits et innove avec des expériences sensorielles surprenantes. L’efficacité d’un produit de soin cosmétique passe aussi par sa texture. D’ailleurs, les acteurs de ce marché l’ont très bien compris. Depuis quelques années, l’innovation dans ce domaine consiste à créer des textures à transformation : par exemple, une mousse qui se transforme en huile, une crème qui devient un masque caoutchouteux ou encore un gel qui se métamorphose en mousse pétillante. Toutes ces années de recherche scientifique payent et donnent des résultats tout à fait surprenants.

Figure 12 : Exemples de différents types de textures en cosmétique.

7. La texture et l’image

La texture est une caractéristique importante pour la segmentation de divers types d’images, que ce soit de l’imagerie médicale, agronomique ou industrielle. Parmi les principaux éléments d’interprétation du message visuel pour un observateur humain, nous pouvons citer les contours, la couleur, la forme, etc… Le système visuel humain se révèle extrêmement performant pour caractériser les textures en utilisant des termes comme lisse versus rugueuse, fine versus grossière, granuleuse versus fibreuse, régulière versus irrégulière, etc. Nous verrons que ces termes seront également pertinents pour l’analyse de la texture musicale.

De manière générale, nous pourrions dire que l’analyse de l’image consiste à extraire un certain nombre de propriétés caractéristiques puis de les exprimer sous forme paramétrique. Par conséquent, les divers paramètres calculés vont permettre de décrire, de caractériser, de segmenter et d’analyser les images. Selon la situation, l’analyse sera tantôt globale ou locale. Malgré son importance en traitement d’images, la texture ne présente pas de définition précise universelle à ce jour.³⁸

Un grand nombre de méthodes existe pour la discrimination de textures. Cependant, il est possible de les regrouper en deux grandes familles : les méthodes statistiques et les méthodes structurelles. Dans la première, représentée entre autres par les nombreux travaux d’Haralick dans ce domaine, la texture est considérée comme étant un phénomène à deux dimensions. Les caractéristiques requises sont obtenues par des approches telles que les matrices de co-occurence, la fréquence spatiale, la corrélation ou les modèles paramétriques.³⁹

Quant aux méthodes structurelles, elles caractérisent la texture par des primitives élémentaires appelées texels et par l’arrangement spatial de ces primitives. Même si elles sont apparemment plus proches de la manière dont le système visuel opère, les méthodes structurelles sont souvent plus complexes que les méthodes statistiques. Elles réagissent de manière aléatoire quand elles rencontrent des textures faiblement structurées comme l’herbe, le feuillage ou la laine par exemple.⁴⁰

Gagalowicz propose une synthèse des deux approches en considérant « la texture comme une structure spatiale constituée de l’organisation de primitives (ou motifs de base) ayant chacune un aspect aléatoire ».⁴¹ Il semblerait que l’approche statistique soit mieux adaptée à une approche neuronale notamment. « En effet, l’expérience montre que les réseaux de neurones présentent leurs pleines potentialités lorsqu’il s’agit de traiter des données floues, bruitées, partiellement incohérentes. Lorsque les données à traiter sont de haut niveau (ce qui sera le cas avec une approche structurelle), une approche système expert est généralement supérieure. De plus, un grand nombre de textures naturelles peuvent être vues comme des champs aléatoires. »⁴²

La création de plusieurs bases de données d’images de « textures couleur » démontre l’intérêt grandissant de la communauté scientifique concernant l’analyse de celles-ci. La nécessité de disposer de bases de références communes témoigne de cette importance. La base Brodatz est devenue la base de référence des textures monochromes par exemple.⁴³

Figure 13 : Extraits de textures de la base de Brodatz.

La base VisTex est une autre collection d’images couleur de textures représentatives de ce que l’on peut trouver dans le monde réel.⁴⁴ L’étude de la texture des objets d’une image peut avoir des objectifs très divers : obtenir des informations sur la nature d’un objet, segmenter l’image en régions homogènes, améliorer la qualité de l’image (restauration), identifier la texture afin de la réduire à un ensemble de paramètres (compression d’images) etc…

8. La texture et la photographie

En photographie, la texture se définit comme un outil visuellement dynamique qui sert à accentuer les grains de la surface d’un objet. Elle est la structure même de la matière dont les éléments ne sont pas distinguables à l’œil nu. Ainsi, par extension, une texture désigne toute image représentant une surface d’aspect irrégulier qui ne représente rien d’autre que cette matière. C’est pourquoi la texture se rattache davantage au sens du toucher qu’à celui de la vue, car une photo de texture réussie est une photo que l’on a envie d’effleurer. La lumière est essentielle pour rendre compte de la texture. Selon Jacques Fontanille, la texture et sa relation avec la lumière est entièrement déterminée par la dichotomie représentation versus ostension et s’incarne dans le concept de « lumière-matière ».⁴⁵ Dans le cas de la texture ostensive, la lumière rencontre les différentes discontinuités de surface et produit des ombres. Dans l’autre cas, la lumière représente les différences tonales. Ce qui ne relève pas du tout de la même perception, l’une est bien réelle tandis que l’autre est fictive. La texture serait comme une « fiction du matériau de l’objet (verre, métal, etc.)» pour reprendre une expression de la sémioticienne Anne Beyaert.⁴⁶

La texture d’une photographie dépendra aussi de la pellicule utilisée. Selon la nature du grain, le rendu de la texture sera très différent : un photographe choisira toujours sa pellicule en fonction de l’environnement dans lequel ses photos seront prises, c’est-à-dire avec peu ou beaucoup de lumière et en fonction du type de texture qu’il désirera obtenir. La taille du grain photographique dépend de la sensibilité du film à la lumière. Moins un film est sensible, plus son grain sera fin. La sensitométrie permet de mesurer de manière scientifique la réaction d’une pellicule à la lumière, le seuil de sensibilité à partir duquel elle réagit et d’en tracer la courbe. Cette sensibilité est codifiée par la norme ISO (International Standards Organisation) qui regroupe les deux anciens systèmes les plus utilisés : ASA (American Standards Association) et DIN (Deutsches Institut für Normung).

Dans un souci de conserver ou d’archiver des photos, la composition de la texture est primordiale afin de connaitre l’origine d’une photographie d’art notamment. Pour s’assurer de l’authenticité ou de l’origine d’une photographie d’art, les conservateurs de musée ou les experts spécialisés examinent une à une les oeuvres, et les comparent à des photographies de référence.

Figure 14 : Berenice Abbott, Soap Bubbles, 1945-46, New York. — Figure 14 : Berenice Abbott, *Soap Bubbles*, 1945-46, New York.

L’inspection des caractéristiques visuelles et tactiles de la texture du papier photographique permet de s’assurer que deux photos différentes ont bien été tirées sur des feuilles produites par un même fabricant, grâce à l’utilisation d’une quantification de l’évolution de la rugosité de la texture sur tout un continuum d’échelle.⁴⁷ La texture de la surface du papier photographique est une caractéristique essentielle de sa fabrication, de sa commercialisation et de son utilisation.

9. La texture et le texte

Dans ce contexte, de façon générale, la texture correspond à la manière de disposer les différentes parties d’une œuvre (poème, texte, etc.). Plus précisément, le linguiste Jean Michel Adam, auteur de nombreux ouvrages de linguistique textuelle, s’est particulièrement intéressé à cette notion de texture.

Figure 15 : Schéma général de la Textualité de Jean Michel Adam.⁴⁸

Rappelons que la problématique du texte renvoie à la problématique de la parole chez Saussure notamment⁴⁹, comme le souligne le sémanticien François Rastier :

La façon la mieux éprouvée de réduire Saussure, c’est d’en faire un théoricien de la Langue, alors même que la valeur est déjà un phénomène contextuel, et qu’il envisageait explicitement dans ses cours deux linguistiques complémentaires, celle de la langue et celle de la parole.⁵⁰

Pour Adam, le discours est une pratique discursive qu’il faut étudier dans sa dimension communicationnelle-discursive, d’une part, et dans sa dimension textuelle, plus purement linguistique, d’autre part. « C’est ce qu’illustrent les deux parties du schéma général de la textualité (cf. figure ci-dessous) et de la discursivité, parties aussi inséparables, pour reprendre l’analogie saussurienne, que le recto et le verso d’une feuille de papier. »⁵¹

Jean Michel Adam explique que la grammaire de phrase et la grammaire de texte sont responsables de ce qu’il appelle la « texture phrastique et transphrastique » (cf. schéma ci-dessous).

Figure 16 : Plan d’organisation de la texture.⁵²

Pour le philosophe Jacques Derrida, la notion de texture est fondamentale. Il nous conduit à voir la texture du texte et la texture du sens en utilisant trois métaphores : la métaphore géologique de la « couche », la métaphore textile du « tissu » et de la « couture », et enfin la métaphore organique de la « greffe ». Toutes ces métaphores sont intimement liées, donc impossible de les traiter séparément.⁵³ Joseph Igor Moulenda nous relate que pour Derrida, « la structure du sens et du langage en général, est semblable à celle d’un tissu, composée d’un enchevêtrement inextricable de fils. »⁵⁴ Cette métaphore du « tissu » est très importante pour le philosophe car « tissu veut dire texte ».⁵⁵ Comme aucun tissu n’est tissé d’un seul fil :

C’est donc à la manière d’un tissu que Derrida décrit la texture d’un texte comme rapport irréductible et inextricable de différents fils entrelacés les uns sur les autres, agissant les uns sur les autres et jamais les uns sans les autres. Tout ceci se fait de la manière dont se tisse une toile d’araignée. Derrida dresse d’ailleurs un parallèle entre les notions de tissu, de toile, d’étoffe, de voile, en voyant en elles un seul trait commun, le tissage. A ce titre, aucun prélèvement, aucun démêlage, aucun isolement de fils n’est possible.⁵⁶

Finalement, le tissu comme support, matière ou modèle traverse toute l’histoire des arts : que ce soit en philosophie sous la forme de métaphore chez Derrida ou comme nous le verrons dans le chapitre suivant, sous forme d’analogies dans d’autres disciplines artistiques. Françoise Bort et Valérie Dupont l’ont magnifiquement démontré dans leur ouvrage Textes, texture, textile. Variations sur le tissage dans la musique, les arts plastiques et la littérature :

La racine étymologique qui lie la notion de texte au champ lexical du tissage établit un jeu d’échos entre la patience de Pénélope à défaire et refaire son ouvrage et le travail même du poète et l’image du tissage surgit encore, tout naturellement, dans la terminologie de Derrida pour définir ce qui fait l’essence même d’un texte.⁵⁷

10. La texture et les textiles

Depuis toujours, dans chaque région du monde existe des tissus, des textiles divers et variés, fabriqués selon des processus plus ou moins élaborés. Ces procédés de fabrication proviennent de deux matériaux naturels, à savoir les matériaux d’origine animale ou végétale. Dans la première catégorie, « nous pouvons citer la laine, la soie, la peau, les tendons, les écailles de poisson et les plumes. Les matières végétales correspondront au coton, lin, chanvre, ramie, graines, écorce. »⁵⁸ Aujourd’hui, les fibres synthétiques que nous connaissons, sont obtenues par synthèse moléculaire. À chaque matière est associée une action particulière : tissage, peignage, traction, tension, etc. Toutes ces manipulations correspondent à un grand nombre de traitements produit par les hommes de tout temps et de toutes origines sur des fibres naturelles, cultivées ou artificiellement produites.⁵⁹ Erik Orsenna en témoigne dans son ouvrage Voyage Aux Pays du Coton : Petit Précis de la Mondialisation :

« Pour comprendre les mondialisations, celles d’hier et celle d’aujourd’hui, rien ne vaut l’examen d’un morceau de tissu. Sans doute parce qu’il n’est fait que de fils et de liens, et des voyages de la navette ».⁶⁰ De cette façon, la texture d’un tissu est déterminée par la fibre, le fil, la structure (c’est-à-dire le tissage, le tricot, etc.) et la finition. Les fibres sont les plus petits composants d’un tissu, néanmoins leurs caractéristiques influencent considérablement la texture. Par exemple, la laine donne généralement des textures douces tandis que le lin donne des textures nettes. De courtes longueurs de fibres discontinues ou de longues fibres continues à filaments, sont torsadées pour former des fils. Le type de fibre, leur procédé d’assemblage et la quantité de torsion du fil peuvent être modifiés pour produire différentes textures.

La structure du tissu peut être tissée (ensemble de fils insérés à angle droit par rapport à un autre ensemble qui est tendu), tricotée (série de points de boucle interbloquants), non tissée (bande de fibres synthétiques comme la résine, la chaleur et la pression, ou l’aiguilletage), ou d’autres constructions telles que le feutre ou la dentelle. La manière dont les fils sont combinés dans la structure du tissu détermine des aspects de texture tels que le poids, la souplesse, la fermeté ou la compressibilité, ainsi que les caractéristiques de stabilité ou d’étirement du tissu.

L’artiste américaine Sheila Hicks, sculptant le textile depuis plus de 50 ans, a fait l’objet d’une magnifique exposition au Centre Pompidou à Paris, au printemps 2018. Certaines propriétés de la matière textile, à savoir la texture et la couleur qui attirent les regards, vont devenir les points centraux du travail de cette artiste. On peut remarquer combien la texture du textile participe du sentiment de la couleur.

Figure 17 : Sheila Hicks, The Silk Rainforest (fils de soie), 1975, silk, linen, and cotton, (243.8 x 685.8 x 7.6 cm), Smithsonian American Art Museum. — Figure 17 : Sheila Hicks, *The Silk Rainforest* (fils de soie), 1975, silk, linen, and cotton, (243.8 x 685.8 x 7.6 cm), Smithsonian American Art Museum.

La perception sensible du coloris teint est totalement différente de ce qui se rencontre dans d’autres arts : l’artiste n’utilise pas les pigments, comme un peintre, mais des matières le plus souvent déjà colorées dont l’éblouissement dépend de la nature du matériau. Les différences de teintes seront multiples puisqu’un même colorant n’imprègnera pas de la même manière de la laine, du coton, du lin ou de la soie. Elle explique d’ailleurs ceci à propos de ses installations :

Le textile est un moyen incomparable pour construire le dialogue avec l’autre. Chacun peut venir ici, s’asseoir, commencer la conversation tout en manipulant des fibres. Il n’y a pas une bonne manière de faire ou une mauvaise. Vous pouvez tisser de manière incorrecte et quelque chose en sortira, un « bâtard » très intéressant. Bien sûr les couleurs et les textures sont très importantes dans ce que je fais. Il y a un aspect expérimental. Il y a de l’humour mais c’est aussi une chose sérieuse. Il faut faire l’effort de comprendre comment ça fonctionne.⁶¹

Les gestes de tisser, de broder, de coudre etc., se retrouvent dans le travail d’un grand nombre d’artistes venant d’horizons très différents, que ce soit chez Ghada Amer, Mona Hatoum ou encore Hella Jongerius.

Figure 18: Mona Hatoum, Pom Pom City, 2002, Natural wool, (5,1 x 365,8 cm), The Barbara Lee Collection of Art by Women. — Figure 18: Mona Hatoum, *Pom Pom City*, 2002, Natural wool, (5,1 x 365,8 cm), The Barbara Lee Collection of Art by Women.

L’artiste libanaise Mona Hatoum aime travailler les matériaux et employer des techniques traditionnelles comme la broderie, le tissage sur métier, la pratique des nœuds.

L’exposition Entrelacs, une recherche tissée de l’artiste néerlandaise Hella Jongerius se déroule en ce moment à la Fondation Lafayette Anticipations à Paris (du 7 juin-8 septembre 2019). Elle a conçu tout un projet autour du textile et du tissage. Hella Jongerius compte aujourd’hui parmi les figures les plus importantes du design international. Au sein du Jongeriuslab, basé à Berlin, ses recherches théoriques et expérimentales portent conjointement sur la couleur, le matériau et les textures explorées à l’infini. Dans ces méandres de textiles, des morceaux hybrides de différentes épaisseurs et textures – tressés, rembourrés ou effilochés provoquent une vibration qui frôle l’illusion perceptive. Dès cette installation monumentale et radicale, l’ambition de la designer Hella Jongerius est annoncée : transformer la fondation Lafayette Anticipations en un immense atelier explorant les riches et nombreuses potentialités du fil. Ainsi, les visiteurs sont amenés à suivre la designer et son équipe dans l’entièreté du bâtiment : un métier monumental de 16 mètres de haut nous accueille dès le hall d’entrée.

Figure 19: Vue d’exposition : Hella Jongerius, Entrelacs, une recherche tissée (2019), Lafayette Anticipations, Paris © Valentin Le Cron. — Figure 19: Vue d’exposition : Hella Jongerius, *Entrelacs, une recherche tissée* (2019), Lafayette Anticipations, Paris © Valentin Le Cron.

Au 1er étage, trois personnes actionnent simultanément un second métier, sans couture, en vue de créer des objets textiles en trois dimensions. Avec lui, on découvre l’une des particularités de cette exposition : ouvrir l’atelier au public pour y montrer toute la journée, les designers en plein travail. Le métier Jacquard, au deuxième étage, explore quant à lui une technique tout à fait contemporaine : la création de tissages à partir de fichiers numériques, où chaque pixel se transpose en croisure de fil.

Figure 20: Vue d’exposition : Hella Jongerius, Entrelacs, une recherche tissée (2019). — Figure 20: Vue d’exposition : Hella Jongerius, *Entrelacs, une recherche tissée* (2019).
Lafayette Anticipations, Paris © Roel van Tour.

11. La texture des peintres

Kandinsky, dans son célèbre cours du Bauhaus, expose son système d’analogies sensorielles :

Le jaune est dur et piquant ; le bleu, doux et simple. Le jaune est résistant contrairement au bleu qui se rapproche du velours. Le jaune évoque l’écharde, le clou, le couteau et l’épine. Son goût est acide tandis que celui du bleu, insipide, rappelle la figue fraîche. L’odeur du jaune pique comme l’oignon, le vinaigre ou les acides. Le bleu, en revanche, est aromatique comme la violette. S’il est un son, le jaune aigu et pénétrant, chanterait comme un canari. La fanfare est jaune mais les sons profonds du bleu s’apparentent à l’orgue.⁶²

Deux grandes oppositions naitront de sa théorie des couleurs : chaleur versus froideur et clarté versus obscurité. Ici Jaune versus Bleu. Au-delà des qualités spirituelles et mystérieuses de la couleur, des pratiques artistiques nouvelles apparaissent au XXᵉ afin de souligner « sa texture et sa chair ».⁶³ Le peintre travaille sa couleur, manipule sa pâte, sa matière à l’effigie d’un sculpteur avec sa glaise. Tous les deux adaptent leurs outils et leurs gestes à l’effet désiré. Ils transcrivent visuellement une sensation tactile. L’épaisseur de la couche pigmentaire redonne à la peinture toute sa matérialité. Chez Monet, Cézanne, ou chez Van Gogh, la texture devient une véritable priorité. Il suffit de penser à Nuit étoilée où les couleurs vives et les textures épaisses des arbres et des bâtiments semblent palpiter de vie. Ce tableau révèle les coups de brosse expressifs et puissants du peintre hollandais. En effet, l’énorme spirale centrale semblable à une vague, envahit cette œuvre. Van Gogh a certainement voulu faire référence à l’astronomie très en vogue à cette époque pour laquelle il vouait une véritable passion. Des astrophysiciens ont d’ailleurs constaté que les étoiles et la lune représentées dans La nuit étoilée correspondaient à la configuration céleste visible à Saint-Rémy-de-Provence le 25 mai 1889. Ici, Vincent Van Gogh applique une texture rugueuse d’une manière irréelle pour rendre une image émotionnellement active et esthétiquement dynamique à l’extrême.

D’ailleurs, fasciné par la peinture de Van Gogh et notamment par la texture émanant de ses toiles, Henri Dutilleux a été complètement séduit en découvrant Nuit étoilée par l’atmosphère s’en dégageant. Ainsi, il a composé en 1978, Timbres, Espace, Mouvement. Ce « mouvement » singulier qui agite le ciel correspond à un des éléments fondateurs transposé dans la musique du compositeur. C’est du reste ce qu’il a choisi de faire en l’incluant dans le titre de son œuvre :

Dans Timbres, Espace, Mouvement […] que j’ai écrit en 1978 pour l’Orchestre de Washington, j’ai composé très rapidement, au contraire de mes habitudes, mais avec une extrême rigueur dans le choix de la formule orchestrale. Mon inspiration a été une toile de Van Gogh, La nuit étoilée, où l’espace et la vie se trouvent dans le délire des étoiles. Ma composition n’est pas une illustration du tableau, mais j’ai éliminé les violons et les altos de mon orchestre afin de recréer ce mouvement d’espace, ce choc émotif. Je me suis peu à peu aperçu que le graphisme de ma partition reprenait les spirales, les nébuleuses de la toile.⁶⁴

Figure 21 : Vincent Van Gogh, Nuit étoilée, 1889, huile sur toile, (73 X 92 cm), Musée d'art moderne à New-York. — Figure 21 : Vincent Van Gogh, *Nuit étoilée,* 1889, huile sur toile, (73 X 92 cm), Musée d’art moderne à New-York.

Nous pouvons relever un grand nombre de correspondances entre ces deux œuvres. Les combinaisons infinies de textures et de couleurs orchestrales sont corrélées magnifiquement avec les couleurs employées par le peintre. Cependant Dutilleux n’a cessé de vouloir s’en détacher :

Je désirais écrire quelque chose qui évidemment ne serait pas, servilement, une illustration musicale. Je trouve que la musique doit rester à sa place, ne pas être reléguée au second rôle ; d’autre part, c’est un peu faire »de l’art sur l’art » et Van Gogh se suffit à lui-même. […]C’est étrange de penser que lui, Paul Jenkins, peintre new-yorkais, a entendu cette œuvre, Timbres, Espace, Mouvement ; il a écouté des enregistrements et, à partir de là, il a imaginé quelque chose de très différent de l’original, bien sûr… Il m’a un peu, si vous voulez, délivré de cette obsession de Van Gogh : en écoutant cette musique, je pensais toujours à lui.⁶⁵

À son tour, le peintre new-yorkais, Paul Jenkins, s’est lui-même inspiré de Timbres, Espace, Mouvement pour une de ses toiles. Le fait de s’inspirer d’une œuvre qui s’inspire elle-même d’une autre, démontre cette singulière et infinie correspondance entre les arts et souligne son alchimie. L’importance de la texture dans l’art visuel du XXᵉ est considérable. Anne Beyaert nous éclaire sur ce sujet dans son article, Texture, couleur, lumière et autres arrangements de la perception.⁶⁶ Cette critique d’art, spécialisée en sémiotique dans l’art du XXᵉ siècle et les médias (photo-journalisme et image numérique), en souligne la portée. Selon la description de Fernande Saint-Martin, une autre sémioticienne, d’un côté, la texture est une « fiction du monde » offerte à la perception, de l’autre, c’est une propriété de la surface. Elle explique :

[…] l’art figuratif a […] largement exploité les possibilités fictionnelles de la représentation de l’expérience tactile par l’élaboration de textures picturales dissociées de leur référence. Souvent, une matière relativement lisse donnera, par le jeu des tonalités, des éclairages, des glissements entre formes et couleurs, l’illusion de textures rugueuses, chaotiques, poilues, etc.⁶⁷

Cette conception de la texture se rapproche sans ambiguïté de celle définie par le Groupe μ. Dans leur célèbre Traité du Signe Visuel (1992)⁶⁸, les chercheurs belges abordent la texture selon trois grandes modalités : le support, la matière et la manière. Ainsi, selon la nature du matériau (pigments en poudre, liant, résines encre, etc.), le support (sur bois, verre, toile, carton, papier etc.) et les différentes techniques utilisées par l’artiste, les résultats seront multiples. La texture varie donc indéfiniment en fonction de ces trois éléments.

Il suffit de penser à Jackson Pollock (1912-1956) qui a utilisé entre autres la technique de projection, qui consiste à projeter de la peinture à distance sur un support. Jackson Pollock tient véritablement une place à part dans l’Action Painting (peinture gestuelle).

Figure 22: Jackson Pollock dans son atelier.

Ce terme fut utilisé pour la première fois par le critique d’art, Harold Rosenberg dans l’article American Action Painters, publié dans le numéro de décembre 1952 d’Artnews :

A un certain moment, les peintres américains […] commencèrent à considérer la toile comme une arène dans laquelle agir, plutôt que comme un espace dans lequel reproduire, recréer, analyser ou “exprimer” un objet réel ou imaginaire. Ce qui devait passer sur la toile n’était pas une image, mais un fait, une action.⁶⁹

Au demeurant, Jackson Pollock fait le choix de s’exprimer sur des toiles de très grands formats, nécessaires pour la réalisation de sa technique appelée le dripping. Même si la paternité de ce terme ne lui revient pas complètement, car d’autres l’ont expérimenté avant lui, comme Miró ou Picabia notamment, cette technique artistique lui est finalement attribuée.

Pour cela, ce que l’on distingue sur la figure 22, Pollock utilise des boîtes avec des fonds percés qui lui permettent de répartir la peinture sur sa toile, tout en superposant des coulures obtenues par un bâton qu’il trempe et sort d’un récipient dans une sorte de transe chamanique. En fin de compte, ses gestes sont au service de la texture, de la matière. C’est une véritable chorégraphie : cette technique picturale implique le mouvement du corps tout entier.

Willem de Kooning se rapproche de Pollock dans sa peinture avec ses coups de pinceaux très spontanés. Il est un des plus grand maître de l’expressionnisme abstrait. Comme beaucoup d’œuvres de De Kooning datant de la fin des années 1940 et des années 50, la série des Woman est remarquable pour sa texture et son illusion de profondeur, qui résulte en grande partie des matériaux choisis par l’artiste.

Figure 23: William De Kooning, 1952, Woman II, huile et fusain sur toile, (149.9 x 109.3 cm). — Figure 23: William De Kooning, 1952, *Woman II,* huile et fusain sur toile, (149.9 x 109.3 cm).

Comme dans d’autres œuvres de l’époque, De Kooning se plaît à ajouter à ses peintures des matériaux grossiers et granulaires, accentuant la rugosité de ses toiles. Des échantillons pigmentaires ainsi que des analyses microscopiques ont permis de révéler qu’il avait mélangé du quartz, probablement du sable et des petits cailloux.

Dans une autre démarche tout aussi singulière, le Colorfield, littéralement « champ coloré », émergea en réaction ou parallèlement à l’Action Painting. Ce terme fut utilisé pour la première fois par le critique d’art Clement Greenberg, dans son célèbre essai, Modernist Painting (1960).⁷⁰ Il y développe l’idée selon laquelle la peinture se doit de retrouver son intégrité par l’aspect minimaliste et conceptuel de la démarche d’artistes comme Mark Rothko, Barnett Newman ou encore Adolph Gottlieb.

Figure 24: Barnett Newman, Onement III (1949), huile sur toile, (182.5 x 84.9 cm), Musée d'Art Moderne à New-York. — Figure 24: Barnett Newman, *Onement III* (1949), huile sur toile, (182.5 x 84.9 cm), Musée d’Art Moderne à New-York.

Cette autre école du geste amène un sentiment de profondeur, une sorte d’expérience spirituelle. De son côté, la sémioticienne Anne Beyaert définit la texture comme une « répétition d’unités produisant une discontinuité tonale ».⁷¹ Cette conception est intéressante car elle permet de dégager la texture de toutes les connotations d’épaisseur qui lui sont attachées : « une texture peut être épaisse et satisfaire une conception « matiériste » à la façon de Tàpies, par exemple, mais elle peut tout aussi, sans sacrifier sa définition, présenter la fine granulosité d’une peinture de Rothko ».⁷²

Figure 25: Mark Rothko, Orange and Yellow (1956), huile sur toile, (231.1 x 180.3 cm), Albright-Knox Art, Buffalo (États-Unis). — Figure 25: Mark Rothko, *Orange and Yellow* (1956), huile sur toile, (231.1 x 180.3 cm), Albright-Knox Art, Buffalo (États-Unis).

Elle poursuit en soulignant que « Dubuffet s’est efforcé de rendre compte de cette coopération qui caractérise la texture en peinture. »⁷³ « L’art doit naître du matériau et de l’outil et doit garder la trace de l’outil et de la lutte de l’outil avec le matériau. L’homme doit parler mais l’outil aussi et le matériau aussi ».⁷⁴ La texture correspondrait ici à « la trace ».

Avant de terminer ce chapitre, il nous semble important de mentionner un autre illustre représentant de la texture-matière, Pierre Soulages. Pendant des décennies, il a travaillé avec un même et unique noir, qu’il a nommé « l’outrenoir ». Il l’applique à la brosse et au spalter pour dessiner la matière, lui donner une texture. C’est la lumière qui donne toute sa force au travail de Soulages : elle accroche la peinture et, à travers les différentes textures créées, dessine d’infinies variations. Le spectateur est également impliqué dans cette perception de la texture car les reflets du tableau changent avec ses déplacements. La mobilité du spectateur a pour effet de multiplier les points de vue et contribue à élargir l’espace de rencontre entre le spectateur et la peinture.

Figure 26: Pierre Soulages, Peinture, 9 mars 2014, Acrylique sur toile, (57 × 81 cm), © Pierre Soulages, Photo : Vincent Cunillère, Courtesy Galerie Karsten Greve Köln, Paris, St Moritz.

Chapitre 2 : Texture et musique du point de vue musicologique classique

Selon Thomas Messenger, la notion de texture serait apparue dès l’époque de la Renaissance. Des compositeurs de la période Tudor, tels que Robert Fayrfax (1464-1521), Nicholas Ludford (1485-1557) ou encore John Taverner (1490-1545), pensent déjà la texture dans leur écriture, sans pour autant se référer au concept. Ici elle serait plus comparable à l’idée de « couleur ». Cette association Texture-couleur est utilisée pour apporter des éléments d’analyse dans la messe de Fayrfax : « La messe de Fayrfax composée durant les vingt premières années du XVIᵉ siècle montre une utilisation très sophistiquée du traitement de la texture-couleur, ce qui a une importance vitale pour la compréhension de la structure à quatre mouvements de la messe », selon Messenger.⁷⁵

Ce terme est tout à fait novateur, ce qui pourrait expliquer le temps qu’il a fallu pour le définir. Il n’apparaît pas dans les dictionnaires de référence que nous connaissons, comme dans le Oxford English dictionary (1933) ni dans le Grove Dictionary of Music and Musicians (1954), ni dans l’Encyclopédie Fasquelle (1958-1961). Ce sera seulement dans les années 1980 qu’une première définition claire de la texture sera énoncée dans le New Grove Dictionnary of Music and Musicians, édité par Stanley Sadie : « Texture is a term used loosely when referring to any of vertical aspect of a musical structure, usually with regards to the way in which individual parts or voices are put together ».⁷⁶ Cette définition tardive est probablement corrélée avec le plein essor de la musique contemporaine.

Au sein de ce courant, la texture décrirait la manière dont les éléments d’une chose se combinent, s’interconnectent ou s’entrelacent. Elle se réfère tant à la structure d’un corps ou d’une œuvre (forme) qu’à la disposition ou à l’interaction entre les particules qui le constituent (procédures), ou encore à la nature de celles-ci (paramètres). D’un point de vue linguistique, le terme « texture » ne comporte aucun antonyme. Il se présente comme un substantif associé à des adjectifs tels que « transparente », « claire », « foncée », « uniforme », « dense », « opaque », « rugueuse », « âpre », « diaphane » etc., et apparaît le plus souvent associé au concept de timbre. Si la polysémie de ce dernier nous permet d’approcher les qualités physiques d’un son et les aspects sémantiques d’une pièce ou d’un fragment musical, l’analyse des propriétés de la trame d’une texture polyphonique suscite une certaine ambiguïté conceptuelle.

1. La texture comme combinaison de lignes musicales : Dunsby, Benward and Saker, Berry, Lester

De manière générale, la texture concerne la manière dont les parties individuelles ou les voix sont assemblées (Benward & Saker, 2003).⁷⁷ Quatre types de textures émergent de cette définition :

La monophonie ou monodie : une seule voix, un chant à l’unisson ou à l’octave, un solo d’instrument monodique.
La polyphonie : superposition de deux ou de plusieurs voix indépendantes formant un ensemble homogène. L’indépendance porte principalement sur les mouvements mélodiques.
L’homophonie : plusieurs voix émises à l’unisson strict, avec aussi parfois des doublures à l’octave.
L’hétérophonie : superposition d’une mélodie à ses propres variations (nuances, ornements, légers décalages rythmiques, mélismes étendus, etc.). Ce type de texture est courante dans la musique orientale et africaine. Elle peut être utilisée comme procédé d’improvisation notamment dans le jazz.

Par exemple dans le Scherzo de la Sonate en si majeur pour piano de Schubert, nous pouvons retrouver plusieurs types de textures s’enchaînant rapidement.

Figure 27: Texture monophonique (mesures 1 à 4).

Figure 28: Texture homophonique (mesures 5 à 10).

Figure 29: Texture polyphonique (mesures 11 à 20).

La monodie et la polyphonie correspondent plus à la dimension horizontale de l’écriture. Leur organisation est linéaire comme dans l’écriture contrapuntique (canon et fugue). En revanche, l’homophonie et l’hétérophonie se rapportent à la dimension verticale, elles privilégient la pensée harmonique (cf., exemple de Schubert).

Afin d’illustrer au mieux notre propos, voici d’autres exemples présentés dans Music: In Theory and Practice de Benward & Saker⁷⁸:

– Texture monodique :⁷⁹

– Texture polyphonique : ⁸⁰

– Texture homophonique :

Plusieurs théoriciens ont tout particulièrement développé cette notion de texture. Dans son ouvrage Analytic Approaches to Twentieth-Century Music,⁸¹ Joel Lester envisage les origines de la texture chez Mozart et chez Malher. Chez Dyson,⁸² l’écriture contrapuntique de Bach est un modèle textural exemplaire. Même approche chez Larry Starr de l’université de Washington mais autour de la musique de Bartok.⁸³ Quant à Piston, dans son traité d’orchestration,⁸⁴ il a dénombré sept types de textures différentes : unisson orchestral, mélodie et accompagnement, mélodie secondaire, écriture en parties, texture contrapuntique, texture en accords, texture complexe.

Wallace Berry lui consacre un chapitre entier dans son ouvrage Structural functions in music (chapitre 2). Il considère que « la Texture est en partie conditionnée par le nombre de ses composants intervenant simultanément ou de manière consécutive, ses qualités étant déterminées par les interactions, interrelations ainsi mises en jeu ».⁸⁵ À partir d’exemples musicaux éclectiques allant de la Renaissance avec Josquin Desprez jusqu’à la musique du XXᵉ avec Elliott Carter, Berry envisage différents cas de progression, récession et variation de texture en tant que facteurs structurels. Il explique que ces différents cas peuvent s’appliquer aussi bien au rythme qu’à l’espace, à la densité, à la délinéation de la forme, voire au style.⁸⁶

Berry a distingué l’aspect qualitatif de la texture de ses aspects quantitatifs. Pour cela, il a établi une typologie en dix catégories : polyphonique, homophonique, harmonique (accords avec des voix souvent homorythmiquement liées), doublure (homorythmiquement, homodirectionnellement et homointervalliquement associées), miroir (homorythmiquement, homointervalliquement associées), miroir (homorythmique, homointervalliquement, contradictoire), hétérophonique (homodirectionnel et hétérointervallique), hétérorythmique, sonorité (caractère sonore global), contrepoint (interaction interlinéaire) et monophonique (une seule voix).⁸⁷

Quant à Charles Rosen, dans son ouvrage sur Schœnberg, il énonce « les innovations de textures les plus remarquables du compositeur autrichien qui intéressent trois aspects différents de cette notion à savoir : le rythme, la couleur orchestrale et l’espacement ou au contraire le resserrement de l’harmonie. »⁸⁸

2. La texture du point de vue des compositeurs

2.1. Arnold Schoënberg (1874-1951)

Dans son essai Du Spirituel dans l’art, le peintre Kandinsky affirme que « l’audition des couleurs est tellement précise qu’on ne trouverait certainement personne qui tente de rendre l’impression de jaune criard sur les basses d’un piano ou compare le carmin foncé à une voix de soprano. »⁸⁹ Le foisonnement de ses réflexions synesthésiques trouve évidemment de multiples échos dans les innovations techniques de l’époque, qui permettent l’entrée en jeu de la lumière dans la quête de visions sonores. À travers ces mots, Vassily Kandinsky nous révèle sa conviction au sujet des étroites résonances existant entre les arts. Une très belle rétrospective a particulièrement mis en évidence cela, au Centre Pompidou Metz en 2017, où de nombreuses textures sonores ont été intimement liées aux arts plastiques, depuis l’héritage du Bauhaus notamment (école d’art dont l’enseignement est basé sur le décloisonnement des pratiques artistiques et techniques). Un parcours Musicircus, en hommage à John Cage, a été créé par Emma Lavigne et Anne Horvath, commissaires de cette exposition : « D’Alexander Calder à Arman, de Marcel Duchamp à Yves Klein, de Nicolas Schöffer à Cerith Wyn Evans, l’exposition est traversée de flux, dans un esprit de jubilation qui convoque et réactive l’esprit de l’œuvre collective et chaotique Musicircus de John Cage créée en 1967, où tout musicien est invité à jouer ou à performer dans une totale liberté au sein d’un orchestre ouvert à tous. »⁹⁰ Selon elles :

Parmi les nombreuses métaphores musicales employées par Kandinsky, le concept de « contrepoint » est décisif dans l’analyse de la composition, art de combiner la forme et la couleur. Réalisée au Bauhaus, Accent en Rose révèle la grammaire picturale esquissée alors par l’artiste,

inspiré par son dialogue permanent avec Arnold Schœnberg qui le sensibilise à la théorie musicale.⁹¹

Figure 34: Vassily Kandinsky, Akzent in Rosa (Accent en Rose), 1926, — Figure 34: Vassily Kandinsky, *Akzent in Rosa (Accent en Rose)*, 1926, Huile sur toile, 100,5 x 80,5 cm, Centre Pompidou, Musée Nationale d’Arts Modernes, Paris.

Ainsi, l’opposition jaune-bleu est ici équilibrée grâce à la présence du cercle rose, rassurant et apaisant, tout en déplaçant la composition vers le haut, créant une tension qualifiée par Kandinsky de « lyrique ». Schoënberg échangera une longue et précieuse correspondance avec son ami Kandinsky (1911-1936). Ensemble, chacun à leur manière, ils ont concrétisé leur idée de « l’Audition Colorée ».⁹² Le drame musical, Die glückliche Hand (« La main heureuse ») de Schoënberg (1913) et Der gelbe Klang (« La Sonorité Jaune ») de Kandinsky (1909) illustrent singulièrement leur amitié et la richesse de leurs points de vue artistiques à travers une correspondance marquante pour l’Histoire des Arts.⁹³ Philippe Albéra traite justement de la texture chez Kandinsky et Schoënberg au sujet de Die glückliche Hand.⁹⁴

2.2. Claude Debussy (1862-1918)

Dans un autre registre, nous pensons tout particulièrement à Claude Debussy, qui est sans conteste le compositeur du tournant du XIXᵉ siècle qui trouva une grande partie de son inspiration dans le domaine des arts visuels. D’emblée, lui aussi, il s’intéressa aux artistes les plus en marge des académismes en cours : Degas, Whistler, Turner, Redon, Camille Claudel. « Moi qui aime les images presque autant que la musique », s’écrie Debussy dans une lettre, et cette déclaration, si singulière chez un musicien, exprime le rôle central de l’inspiration visuelle dans sa création. Dans les années 1890, il fréquente assidûment les milieux symbolistes en pleine ébullition. Aux Mardis de Mallarmé, il rencontre Whistler, Verlaine et les jeunes poètes du groupe symboliste. Dans le programme des premières auditions de son triptyque symphonique Nocturnes, Claude Debussy parle de « l’agonie grise, doucement teintée de blanc » pour introduire Nuages, la première des trois pages.⁹⁵

Figure 35: James Abbott McNeil Whistler, Nocturne: Blue and Silver – Chelsea (1871), Huile sur toile, 50 x 60.8 cm, Tate Britain, London. — Figure 35: James Abbott McNeil Whistler, *Nocturne: Blue and Silver* – *Chelsea* (1871), Huile sur toile, 50 x 60.8 cm, *Tate Britain*, London.

Son écriture texturale, impressionniste, proche de la conception texture-couleur décrite en ce début de chapitre avec la messe Fayrfax, est directement inspirée d’un tableau de Whistler. Chez Debussy, le rêve, les associations d’images, se substituent à la cohérence traditionnelle du discours musical. Avant de penser écriture, il pense sonorités, espaces sonores. « Je veux chanter les paysages intérieurs » disait-il.⁹⁶

Nous savons que Debussy est une des références majeures de Pierre Boulez (1925-2016) car il est fréquemment cité dans ses écrits. Boulez le considère comme l’un des pères de la modernité musicale. Il s’est intéressé tout particulièrement à la conception de la forme chez Debussy :

Ce que nous trouvons chez le dernier Debussy, c’est un sens, d’abord de la forme vécue non plus comme architecture. Mais c’est la forme dans laquelle, pour la comprendre, on doit passer au travers. En somme, une espèce de forme tressée, par tuilage des objets qui la composent. Il y a, chez Debussy, un souci constant du renouvellement du matériel sonore à partir soit d’un intervalle, soit d’une idée génératrice formant ce matériau. Certes dans les études, on trouve des pièces conçues suivant une architecture déjà assimilée. Quelques études, en particulier, sont construites sur la forme bien connue ABA, mais dans la plupart, la forme se crée au fur et à mesure de son engendrement.⁹⁷

Lorsque Boulez commente l’œuvre de Debussy, il déclare qu’« on pourrait parler là encore de narration, mais ce serait une narration très condensée, […], elliptique par essence ».⁹⁸ Les écrits de Debussy ont énormément influencé les écrits de Boulez. Laurent Feneyrou, dans Debussy au miroir des écrits de Boulez⁹⁹, en fait une analyse détaillée. Boulez se sert singulièrement de Debussy pour annoncer son propre programme esthétique. Boulez a également été un grand interprète de la musique de Debussy tout d’abord en tant que pianiste, notamment au début des années soixante en duo avec Yvonne Loriod, puis bien sûr, en tant que chef d’orchestre. Jeux et Iberia figurent dans son tout premier concert symphonique donné, le 16 juin 1956 à Caracas, avec l’orchestre symphonique du Venezuela. Un enregistrement radio historique de ce concert a d’ailleurs été conservé. Suivront de nombreux enregistrements dédiés à la musique de Debussy, grâce à son contrat avec la maison de disque CBS.

Dans Jeux (poème dansé, 1913), appelée « la forme tressée ou tissée » par Boulez, l’organisation générale est aussi instantanée qu’homogène dans son développement. L’analyse d’Herbert Eimert, publiée en 1959, rejoint la pensée de Boulez. Il considère que « le caractère « sériel » de Jeux dépend de la façon dont ornement, tempo, mètre, dynamique, timbre et texture participent de manière égale aux configurations de la forme ».¹⁰⁰ Boulez l’enregistrera à deux reprises : en 1966 avec le New Philharmonia et en 1995 avec l’orchestre de Cleveland.

2.3. Pierre Boulez (1925-2016)

Dans son livre Le pays fertile : Paul Klee,¹⁰¹ Pierre Boulez condense ses réflexions autour des principes de composition du peintre et la nourriture que ceux-ci ont pu apporter à sa composition musicale. Dans son analyse de la peinture de Paul Klee, il établit des liens entre structure et composition musicales. Ce qui donna naissance en 1952 à une pièce musicale intitulée Structure 1a, inspirée du tableau de Paul Klee Monument à la limite du pays fertile, organisé en barres parallèles avec parfois une rupture qui réintroduit le chaos dans l’équilibre structural. Ainsi, les relations entre peinture et musique sont d’abord de nature structurale, avec cette différence que la perception d’un tableau est toujours globale puis s’oriente vers le fond ou les détails.

Comme l’écrit le musicologue Robert Piencikowski :

Le premier livre de Structures pour deux pianos (1952) marque une étape importante non seulement dans l’évolution de Pierre Boulez, mais également dans le développement de la conscience musicale occidentale, par l’extension du phénomène sériel aux quatre composantes sonores (hauteurs, durées, attaques, intensités) et la fonctionnalité de la conception sérielle désormais responsable de l’espace acoustique et formel à l’intérieur duquel elle est destinée à se mouvoir.¹⁰²

Figure 36: Monument en pays fertile, Paul Klee, 1929, Aquarelle, Centre Paul-Klee (Zentrum Paul-Klee) de Berne, Suisse. — Figure 36: *Monument en pays fertile*, Paul Klee, 1929, Aquarelle, Centre Paul-Klee (Zentrum Paul-Klee) de Berne, Suisse.

Ce dernier propose une analyse de l’œuvre en s’appuyant sur la première division du mode de valeurs et d’intensités d’Olivier Messiaen :

Ia. Brève succession de séquences exposant différents éclairages possibles du matériau sériel réduit à sa plus simple expression.
Ib. Vaste opposition de textures faisant alterner une trame dépouillée avec des développements à densité croissante jusqu’à l’épuisement de la matière sonore.
Ic. Concluant sur un flux rapide et ininterrompu de figures imprévisibles.

Figure 37: Structures pour deux pianos. — Figure 37: *Structures pour deux pianos*.

Ici, la série se transpose sur elle-même et l’objet sonore définit l’espace dans lequel il évolue. Car si l’objet sonore entretient des relations inharmoniques avec ses composantes, l’espace acoustique sera relatif. Il s’agit véritablement de démultiplier l’instrument, le piano, grâce à ses propriétés acoustiques. Structure Ia est souvent présentée comme l’exemple de l’école de Darmstadt et l’apogée de l’impasse du modernisme dans une rationalisation extrême : le sérialisme total. Il existe de nombreuses analyses approfondies sur les compositions de Boulez, dont plusieurs touchent des idées esthétiques. La première étude majeure de l’un de ses travaux est l’analyse de Structure Ia en 1958 de Ligeti.¹⁰³

Les théorisations bouléziennes seront concrétisées dans Penser la musique aujourd’hui ¹⁰⁴ en 1963, résumant l’ensemble des techniques d’écriture utilisées dès 1949. Boulez insiste sur la notion de texture afin de définir les critères de combinaisons ou d’arrangements des organismes sériels. Il décrit avec beaucoup de détails l’hétérophonie, la structure la plus éloignée de nos habitudes, dans un souci d’expliciter le caractère fragile des dimensions traditionnelles du vertical et surtout de l’horizontal, le régime sériel polarisant la perception vers l’oblique. En effet, Boulez cherche à s’éloigner de la typologie classique afin d’introduire de nouvelles catégories qui lui permettent de classer toutes les combinatoires imaginables.

Jusqu’à ma rencontre avec Klee, je ne raisonnais qu’en musicien, ce qui n’est pas toujours le moyen de voir clair. C’est parce qu’un problème identique avait été simplifié de manière exemplaire par Klee que j’ai été amené à réfléchir autrement, sous un autre angle. Et il me semble possible, avec un élargissement de l’hétérophonie, d’appliquer ses idées sur la perspective.¹⁰⁵

De ce fait, Boulez considère deux dimensions : d’une part, la dimension dans laquelle se produisent les événements (horizontale, verticale, diagonale), et d’autre part, celle qui se rapporte au type d’utilisation des événements (individuel, collectif). Il utilise ces deux paramètres afin d’élargir son écriture. Il distingue le contrepoint libre (horizontal-individuel/collectif) du contrepoint rigoureux (horizontal-individuel/individuel), ainsi que l’harmonie fonctionnelle de l’harmonie non fonctionnelle.¹⁰⁶

2.4. György Ligeti (1923-2006)

L’esthétique de György Ligeti, l’un des premiers compositeurs à employer le terme texture dans ses écrits théoriques, prend sa source dans une critique du sérialisme. Ainsi, s’exprimant sur Apparitions et Atmosphères, dans un entretien avec Peter Varnai, en 1978, Ligeti déclarait explicitement avoir écrit ces œuvres en complète réaction au sérialisme et à l’aléatoire de Cage. Tout comme la conception de Lewis Rowell que nous détaillerons dans le chapitre sur la texture comme matière, le compositeur hongrois recourt à la métaphore du « tissage » lors de son analyse détaillée de Structure Ia pour deux pianos de Boulez :

À l’écoute de cette composition, donc, se déploie une structure en trame d’un tissage plus ou moins grossier ou fin d’une perceptibilité auditive changeante. Elle consiste en une quantité de “points” sonores intelligemment ordonnés qui s’assemblent pour constituer des fils d’une épaisseur variable, qui parfois se profilent et parfois se fondent. Les fils à leur tour sont tissés de manière plus ou moins serrée. […] Vu de plus près, c’est l’aspect de la détermination, de la régularité qui prédomine ; à distance, en revanche, la structure – résultat de nombreuses régularités distinctes – se présente comme quelque chose d’extrêmement variable et fortuit, comparable à l’éclairage clignotant du réseau d’enseignes lumineuses de la rue d’une grande ville.¹⁰⁷

Dans sa propre musique, Ligeti emploie différents types de textures qui constituent à la fois le matériau mélodique des parties instrumentales (traité le plus souvent en contrepoint) et le matériau harmonique des superpositions verticales. Ses textures sont variées, transformées, grâce à plusieurs procédés techniques opérant sur l’ambitus, la densité, le degré de changement, la fusion ou l’individualisation des parties instrumentales. Au demeurant, Pierre Michel souligne l’importance des aspects dynamiques de cette « écriture en trame » en partant cette fois-ci du premier mouvement du Concerto de Chambre (1969/70). Le musicologue distingue deux familles de textures qui se dégagent à l’audition : « l’une, caractéristique de la première partie, faite de lignes instrumentales savamment mêlées au point qu’il est souvent impossible de distinguer les timbres individuels (même lorsqu’il y a peu d’instruments) et l’autre, caractéristique de la seconde partie, représentée par des textures beaucoup plus éclatées et agitées où les instruments ressortent nettement de l’ensemble (mais le plus souvent de façon très ponctuelle). »¹⁰⁸ Nous reviendrons plus longuement sur cette œuvre dans notre cinquième chapitre, car nous proposerons une analyse de la texture du troisième mouvement du Concerto de Chambre.

Quelques années plus tôt, Ligeti compose son œuvre manifeste Atmosphères, pour orchestre, en 1961 : « Ma musique donne l’impression d’un courant continu qui n’a ni début ni fin. Sa caractéristique formelle est le statisme, mais derrière cette apparence, tout change constamment… »¹⁰⁹ Il ne recherche ni mélodie ni harmonie, mais des couleurs sonores dans une musique « statique » dont la densité est héritée de Bartòk. Clusters, micro-changements, micro-intervalles, micro-polyphonie transforment, sans césure, une matière sonore perpétuellement mouvante. Ce travail sur la matière sonore, les textures et le rapport au temps se retrouve dans la plupart de ses œuvres. Le compositeur cherche un équivalent musical aux leçons de peinture de Paul Cézanne, où la couleur remplace les contours, et où les contrastes de poids et de volumes engendrent les formes.

Figure 38: Paul Cézanne, Le Lac bleu, 1896, Huile sur toile, 65x81 cm, Institut Courtauld à Londres. — Figure 38: Paul Cézanne, *Le Lac bleu*, 1896, Huile sur toile, 65×81 cm, Institut Courtauld à Londres.

Dans son entretien avec Pierre Michel en 1981, Ligeti soulignait l’importance de la texture dans son écriture : « […] je pense toujours en voix, en couches, et je construis mes espaces sonores comme des textures, comme les fils d’une toile d’araignée, la toile étant la totalité et le fil l’élément de base. […] Si vous me demandez : « Pourquoi le canon ? », je vous répondrai : pour l’unité horizontale/verticale. »¹¹⁰

De plus, Marc Chemillier aborde d’une façon très détaillée et inventive les textures de Ligeti à partir de l’œuvre Melodien (1971, pour petit orchestre) en parlant de « logique des textures » directement inspirée des règles de la croissance minérale ou organique.¹¹¹

2.5. Morton Feldman (1926-1987)

De même, Morton Feldman (1926-1987) a toujours entretenu des liens étroits avec les arts visuels. Célestin Deliège souligne le fait que pour Feldman, « Il ne s’agissait plus de composer mais de projeter le son dans le temps, comme le geste pictural dont il était témoin, projetait la couleur sur la toile. »¹¹² Projection 1 pour violoncelle solo (1950) témoigne de ses influences artistiques. Il est vrai qu’il a toujours tissé des liens professionnels et amicaux avec des peintres de l’expressionnisme abstrait new-yorkais. C’est d’ailleurs John Cage qui le présentera à Pollock, de Kooning et Rothko, ce qui influencera considérablement son travail de compositeur. Ces rencontres donneront naissance à des pièces comme Music for the film Jackson Pollock (1951), de Kooning (1961), Rothko Chapel (1971). Très souvent, Feldman aimera employer des termes relevant du domaine de l’image pour faire référence à sa musique, préférant parfois, comme nous l’avons vu avec Deliège, utiliser des gestes plus appropriés à un peintre qu’à un musicien. Du reste, il se plaît à nommer ses œuvres « des toiles de temps » teintées « d’empreintes musicales ». De plus, l’artiste nous relate ceci : « J’avais appris que plus on compose ou on construit, plus on empêche le temps non encore troublé de devenir la métaphore de contrôle de la musique. »¹¹³ De façon systématique, Feldman préfère utiliser une terminologie visuelle pour décrire sa musique. Son intérêt pour la peinture ainsi que pour les tapis du Moyen-Orient lui permettra de développer un vocabulaire singulier. Des problématiques telles que la surface, le relief, la texture, les structures, le degré de symétrie des matériaux, etc., toutes ces questions contribueront à définir l’esthétique de ses œuvres. Son approche de la texture y est tout à fait singulière. D’ailleurs pour exemple, en introduction à la partition de Coptic Light (1985), Felman écrit ceci :

Ayant un intérêt avide pour toutes les variétés de tissages du Moyen-Orient, j’ai récemment contemplé les étonnants tissus coptes anciens à l’exposition permanente du Louvre. Ce qui m’a frappé dans ces fragments d’étoffes colorées, c’est la façon dont ils transmettent l’atmosphère essentielle de leur civilisation. Transposant cette idée dans un autre domaine, je me suis demandé quels aspects de la musique depuis Monteverdi pourraient restituer leur atmosphère, si on les écoutait dans deux mille ans. Selon moi, l’analogie serait une des figures instrumentales de la musique occidentale. Telles sont quelqu’unes des métaphores qui occupaient mes pensées tandis que je composais Coptic Light.¹¹⁴

La texture y est tout particulièrement dense, serrée car toutes les familles d’instruments jouent tout du long ensemble formant un tissage orchestral complexe, comme le « tissage de la musique » décrit par Lewis Rowell. (Cf. partitions en annexes)

Nous nous sommes particulièrement intéressés à cet espace particulier qu’est Rothko Chapel (1970). C’est une pièce pour alto, célesta, percussions, chœur, soprano et alto, une œuvre destinée à être jouée dans l’édifice qui abrite quatorze grandes toiles du peintre disparu en 1970. À partir d’un dessin de Rothko, l’architecte Phil Johnson s’est occupé de la construction de cette structure minimaliste que représente cette grande salle octogonale. Selon le critique d’art Vladimir Safatle

« Tous les tableaux de Rothko dans la chapelle sont marqués par la manifestation d’une hétérogénéité interne au champ même de chaque couleur. Aucun champ chromatique n’est plat. Tous sont marqués par des oppositions et des conflits qui dévoilent une conscience de la dissolution de l’unité. »¹¹⁵ A sa manière, Feldman a bien compris tout cela car dans ses textures, nous percevons bien ces champs sonores remplis de micro-variations.

Figure 39: Vue intérieure de la chapelle (Thomas Struth for The New York Times). — Figure 39: Vue intérieure de la chapelle (Thomas Struth for *The New York Times*).

De plus, Rothko réussissait à amincir la matière jusqu’à ce que les particules de pigments soient dissociées de la fine pellicule et adhèrent à la surface de façon à laisser la lumière pénétrer la couche de peinture. Le procédé spécifique de Rothko pour préparer ses toiles a été décrit par Youssef Ishaghpour : « En variant les textures, les gradations tonales et la profondeur des couches, en expérimentant des degrés de transparence avec des mixtures d’huile, de tempéra à l’œuf et du diluant, Rothko portait ses couleurs au seuil de la désintégration pour créer leur luminosité. »¹¹⁶ En effet, dans une émission radio consacrée à Rothko sur France Culture, Une vie, une œuvre, présentée par le journaliste Matthieu Garrigou-Lagrange, le plasticien invité Didier Mencoboni, décrivait ce mélange tempera à l’œuf, procédé de la Renaissance, et pratiqué par Piero Della Francesca, comme étant une préparation secrète à laquelle Rothko « ajoutait de l’acrylique pour obtenir des couleurs lumineuses d’une grande finesse. »¹¹⁷

Joseph Delaplace affirme que « la prise en compte très précise de la lumière, dans le travail de Rothko, trouve une réplique musicale dans la gestion de l’intensité chez Feldman. De même, l’utilisation de la brosse et du chiffon, le travail sur les frontières entre différentes zones picturales, peuvent être mis en relation avec le gommage de l’attaque de certains sons, ainsi qu’avec la suppression après-coup de matériaux sonores. »¹¹⁸ C’est un remarquable travail autour de la texture. A propos de la distribution des toiles dans la chapelle, Rothko avait précisé qu’« il n’était pas intéressé par un caractère symétrique ou asymétrique quelconque, mais plutôt par des proportions et des formes ».¹¹⁹ Selon Steven Johnson, qui a fait l’une des premières analyses musicales de Rothko Chapel, la « symétrie et l’asymétrie jouent un rôle majeur en tant que thème narratif » dans la spatialisation des toiles.¹²⁰

Il en fait une remarquable description :

La chapelle présente une progression d’états affectifs mis en mouvement entre deux arcs symétriquement liés. La progression commence avec un état de statisme neutre, continue à travers des états de plus en plus sombres et tragiques, pour finalement arriver à des états brillants, élevés. Le triptyque de l’abside nord et le panneau sud – les seules images isolées (sans une contre-représentation en face) – forment un axe. Le triptyque fonctionne comme point d’origine car il est face à l’entrée et parce que l’abside, encastrée six pieds à partir des murs, reçoit la plupart de la lumière zénithale. Étant donné que les panneaux extérieurs du triptyque (nord) contiennent le même pourpre noirâtre et le panneau central un pourpre légèrement éclairé, le triptyque est en soi symétrique. (…) La chapelle arrive à un obscur climax avec la forme en croix établie par les presque identiques triptyques Est et Ouest, où le noir profond prédomine.¹²¹

Figure 40: disposition des panneaux dans la chapelle.¹²²

Ainsi, que ce soit en termes de forces utilisées, d’équilibre, de timbre et de texture, le choix instrumental de Feldman fut tout autant conditionné par l’espace de la chapelle que par les peintures. Feldman explicite son rapport à l’espace de la chapelle : « L’image plastique de Rothko va droit jusqu’au bout de la toile, et je voulais atteindre le même effet avec la musique ; c’est-à-dire qu’elle emplisse l’espace global, de forme octogonale, et qu’elle ne puisse pas être entendue à une certaine distance ».¹²³ Feldman a également conçu la forme musicale de sa pièce d’après la chapelle :

Le rythme d’ensemble des peintures de Rothko, telles qu’il les a disposées, créait une continuité sans faille. Tandis qu’il était possible, avec les peintures, de répéter couleurs et gammes tout en maintenant un intérêt dramatique, je sentais que la musique devait appeler une série de sections enchaînées fortement contrastées. Je voyais une procession immobile semblable aux frises des temples grecs.¹²⁴

Alex Ross souligne dans son ouvrage de référence The Rest is Noise que « la fixité apparente de Rothko Chapel incite à se concentrer sur des détails qui semblent insignifiants, de telle sorte que le moindre changement est perçu comme un véritable cataclysme : un simple chromatisme descendant dans une ligne de basse suffit à donner le frisson. »¹²⁵ Cette œuvre empreinte de spiritualité, est certainement la plus personnelle et la plus émouvante de Feldman. « Comme Messian, Feldman s’attachait à créer par sa musique une sorte d’ailleurs spirituel […].¹²⁶

2.6. Iannis Xenakis (1922-2001)

Au début des années soixante, l’ancienne fascination pour le sérialisme et la musique aléatoire a laissé une grande place à l’intérêt des compositeurs pour la texture, le son, la matière sonore. Avec Metastasis (1954) et Pithoprakta (1955-1956), Xenakis fut l’un des pionniers de la musique de textures. En ce sens l’analyse de Pithoprakta du compositeur Panayiotis Kokoras¹²⁷ nous semble particulièrement intéressante. Le but de Pithoprakta était de fusionner les sons individuels en un ensemble cohérent. Kokoras propose une analyse en s’appuyant sur les travaux de Bregman¹²⁸ et de McAdams.¹²⁹ L’un des facteurs les plus importants, qui affectent la perception des textures, dépend de la fusion de composants séparés du passage musical. Une telle fusion est possible dans certains cas. Les propriétés principales, qui favorisent la fusion dans un passage musical, comprennent les densités d’attaques et les similarités timbrales des sons joués. Ce dernier élément comprend diverses caractéristiques spectrales des sons. De plus, le registre des parties instrumentales et leur gamme dynamique favorisent la fusion texturale. Il serait intéressant d’analyser les différents types de texture musicale utilisés dans Pithoprakta en fonction de leur degré de fusion ou de séparation. Xenakis a certainement été l’un des premiers compositeurs à utiliser de façon systématique la fusion entre la matière et la forme. Makis Solomos qualifie le produit de cette fusion forme/matériau de « sonorité ». Il propose une tout autre analyse de Pithoprakta qui nous semble intéressante de citer.

Figure 41 : Pithoprakta : description globale des transformations progressives. — Figure 41 : *Pithoprakta* : description globale des transformations progressives.¹³⁰

Le musicologue insiste sur le fait que Xenakis métamorphose continuellement les textures sonores par des transformations continues ou discontinues de toutes sortes. Le compositeur explore des textures bruitées avec des techniques instrumentales singulières comme des coups sur la caisse des cordes par exemple pour conduire progressivement l’auditeur vers des sons purs avec les harmoniques finales. Ses œuvres sont réellement conçues comme des expériences perceptives du son. Il proposera des expériences de l’espace en architecture, des expériences visuelles-sonores avec les polytopes. Il nous semble intéressant de mentionner ce qu’écrit Xenakis à propos du son justement :

Le son en acoustique s’analyse en équations physico-mathématiques (il est une vibration élastique de la matière) qui se mesurent : intensité, couleur, temps. Dans la couleur entrent la hauteur, les harmoniques, les sons additifs et soustractifs, les ondulations, etc. Par conséquent, le son est une grandeur quantitative. Mais dès qu’il franchit le seuil de l’oreille, il devient impression, sens, grandeur qualitative par conséquent. La psychophysiologie de la musique n’est pas encore une science. Le bon compositeur pourra exprimer les sens qu’il désire.¹³¹

Solomos écrit sur cette dichotomie quantitatif/qualitatif. Pour le musicologue, l’aspect qualitatif reste flou dans sa définition, alors que l’aspect quantitatif est clairement explicité, à savoir le son. « Celui-ci n’est plus défini comme un simple niveau d’articulation, un matériau neutre. Posé comme le lien entre toutes les musiques, il constitue pour Xenakis le « fond même » de la musique : son fondement, pourrait-on ajouter. »¹³²

Le travail d’Anne-Sylvie Barthel-Calvet autour de la conception texturelle chez Iannis Xenakis apporte un autre éclairage de perspective analytique.¹³³

3. La Texture comme matière

Une autre compréhension de la texture fut développée par certains théoriciens de la musique, dans le souci d’analyser les œuvres après 1945. Ainsi, la texture est tantôt comparée à un grain, une toile, ou bien à une surface ou une nappe (Morgan, 1991¹³⁴, Smith-Brindle, 1966). Voici ce qu’écrit à ce sujet le compositeur britannique Smith-Brindle :

Texture, en un sens, peut être définie comme structure, ou arrangement des parties constituantes. Toutefois, bien que l’on puisse parler de texture contrapuntique, le genre précis ou la nature du contrepoint ne peut être décrit par une telle terminologie. On se réfère au caractère général du son, plutôt qu’au type précis de construction. La définition alternative de texture comme « grain, réseau, surface ou nappe » est plus juste. Elle définit le « sentiment » extérieur de la musique, plutôt que la structure interne. Les adjectifs habituellement utilisés en relation avec la texture musicale confirment cette définition rude, lisse, épais, fin, chaud, froid, lourd, riche, maigre, léger, soyeux, velouté, dentelé toutes décrivent des sensations extérieures.¹³⁵

De la même manière, Jonathan Dunsby, dans son article Considerations of Textures, écrit à ce sujet : « Lewis Rowell écrit à propos de la distinction entre focus et interaction, entre économie et saturation, entre le mince et le dense, entre le lisse et le rugueux, dans lequel on peut discerner l’étymologie du terme musical « texture » au sens physique. »¹³⁶ En effet, Lewis Rowell a dédié dans son chapitre Values, un sous chapitre sur la texture dans son ouvrage de référence Thinking about Music : An Introduction to the Philosophy of Music où il caractérise la texture comme étant « le tissage de la musique » si on conçoit celle-ci comme « une surface esthétique » ou comme « la fibre (les hauteurs, l’axe vertical, la simultanéité) et la trame (le temps, l’axe horizontal, la séquentialité) du tissu musical. »¹³⁷ Nous en avons montré un exemple dans Coptic Light de Morton Feldman précédemment. Comme le suggère Robert Erickson, dans Sound Structure in Music (chap.6 Timbre in Texture) bien que la texture puisse être avant tout considérée comme une description de la sensation d’un objet, l’interaction imaginée ou tangible de la sensation avec sa matière, c’est aussi un moyen de décrire l’aspect tactile des mondes sonores.

La texture dénote toujours une qualité globale, la sensation des surfaces, le tissage des tissus, l’apparence des choses. Les mots pour les modalités sensorielles visuelles et tactiles sont souvent adaptés aux descriptions des sons et de leur combinaison: acéré, rugueux, terne, lisse, mordant, clair, brillant, cassant, grossier, épais, mince, sec, diaphane, aéré, effilé, flasque, fluide, vaporeux, pailleté, granuleux, dur, brumeux, lourd, glacé, incomplet, déchiqueté, limpide, liquescent, luxuriant, doux, trouble, souple, décontracté, ondulant …¹³⁸

Le point de vue de Robert Strizich est très spécifique et nous apparaît également important d’être mentionné :

À mon avis, nos concepts, définitions et termes traditionnels sont inadéquats pour la discussion et l’analyse de nouvelles textures dans la musique de l’après-Seconde Guerre mondiale. En effet, une grande partie de la musique écrite depuis 1945 est complètement hors de la portée de la terminologie analytique standard, principalement parce que beaucoup de ces travaux utilisent exclusivement des textures et des procédures de textures qui s’écartent significativement des pratiques conventionnelles.¹³⁹

Après avoir analysé plusieurs exemples de textures dans la musique après 1945, Strizich propose une typologie où les textures sont regroupées en trois grandes catégories générales : polyphonie complexe (disjointe, multicouches), textures pointillistes (trois types nommés a, b, c) et texture de masse (nuage, polyphonie dense, micropolyphonie, bandes de fréquences). Les textures sont caractérisées selon leur densité verticale (opacité relative ou transparence) et leur composition constitutive (homogénéité ou hétérogénéité).

Dans la création de musiques populaires enregistrées, l’organisation des timbres et des textures est une préoccupation essentielle, car elle est déterminante dans l’appréciation des auditeurs, plus que les hauteurs ou le rythme. Plusieurs études ont d’ailleurs montré que les musiques pop étaient davantage appréciées pour leur sonorité, pour leur couleur, que pour leur structure¹⁴⁰ Les outils de l’analyse musicale traditionnelle ne sont pas toujours appropriés pour dégager les éléments intéressants de la musique populaire (Tagg, 1979¹⁴¹, Middleton, 1990¹⁴², Lacasse, 2000¹⁴³). Richard Middleton soutient que « Les musicologues qui s’intéressent aux musiques populaires doivent entendre l’harmonie autrement, repenser l’analyse rythmique, porter une attention particulière aux nuances de timbres et aux fluctuations de hauteurs et saisir les textures et les formes en les associant aux caractéristiques d’un genre et à des fonctions sociales. » ¹⁴⁴

Quant au musicologue Albin Zak, il définit la texture comme la qualité du son qui réside dans les relations créées par l’interaction des éléments constitutifs d’une piste. Cette qualité générale est le caractère général des gestes musicaux. Il comprend entre autres le timbre, la dynamique, le rythme, l’ambiance, la gamme de hauteur, l’espace harmonique et le placement spatial des sons constitutifs. Le concept de texture musicale chez Zak est multiforme et bien adapté à l’analyse des enregistrements rock.¹⁴⁵ Son travail commence à partir du studio d’enregistrement, où il se demande quels effets esthétiques pourraient être obtenus par les manipulations que les preneurs de son appliquent dans le processus d’enregistrement.¹⁴⁶ Au sujet de la musique populaire, Simon Zagorski-Thomas nous expose le lien entre le développement des technologies et la complexification de notre univers sonore :

Le développement des technologies peut avoir une influence, de plusieurs façons, sur le caractère des sons enregistrés. Par exemple, une série de modifications techniques sur un produit peut générer une plus large palette d’options sonores, comme le démontre le développement des technologies liées aux microphones ou des compresseurs dynamiques depuis des années.¹⁴⁷

Certains auteurs ont explicité l’importance du timbre et de la texture au sein du mix en fonction de leur importance hiérarchique. C’est le cas d’Allan Moore qui a proposé un modèle représentant un espace virtuel en trois dimensions afin de désigner les principaux paramètres d’un mix.¹⁴⁸ « La Sound-Box de Moore et Dockwray est un modèle de représentation de l’espace stéréophonique interne d’un enregistrement musical. »¹⁴⁹ Elle se présente comme un pavé droit (qui représente la scène virtuelle (Cf. figure ci-après). Nous pouvons y placer les différentes sources sonores du titre en fonction de leur emplacement dans la stéréophonie. C’est actuellement le modèle de représentation le plus employé lorsque nous effectuons des analyses d’espaces internes dans les œuvres phonographiques. Selon Moore, « Bien que l’analyse musicale soit normalement l’analyse de la partition, une analyse du Rock ne peut suivre cette même procédure. Elle doit se référer au « Primary text », qui est, dans ce cas, ce qui est entendu. »¹⁵⁰

Figure 42: Exemple de la Sound Box d'Allan Moore : Cliff Richard, Congratulations. — Figure 42: Exemple de la *Sound Box* d’Allan Moore : Cliff Richard, *Congratulations*.¹⁵¹

Ce modèle a le mérite d’offrir une terminologie pratique qui décrit les aspects considérés prioritaires dans l’agencement d’un mix : soit la répartition des fréquences et la localisation spatiale notamment. De ce fait, grâce à l’importance que revêt le son, de nombreux grands producteurs verront le jour tels que Phil Spector, George Martin, Brian Eno, Quincy Jones, etc.

William Moylan développe dans The Art of Record Production¹⁵² , une méthode de transcription tout à fait adaptée pour analyser la texture dans la musique populaire. Cet ouvrage propose un cadre de référence et un vocabulaire qui permet de décrire les principaux paramètres importants dans la production de ce type de musique, à savoir les caractéristiques de l’espace, le contour, l’enveloppe spectrale et l’intensité. L’approche de Moylan se révèlera une source d’inspiration pour Lacasse, notamment autour du concept de « mise en scène phonographique ». Celle de Lacasse apporte une vision intéressante pour l’étude du traitement sonore de toutes formes de sons enregistrés, malgré le fait que son approche s’intéresse particulièrement au traitement de la voix.¹⁵³ Cette réflexion autour de la notion de texture à travers les propos d’analystes, compositeurs et musicologues, nous apporte un éclairage intéressant sur les multiples façons de se l’approprier. D’une part, nous avons pu comparer et confronter des points de vue divers, notamment, chez les anglo-saxons avec l’ouvrage Analytic Approaches to Twentieth-Century Music de Joel Lester,¹⁵⁴ et celui de Wallace Berry, Structural Functions in Music. D’autre part, chez les français, les articles de référence de Marc Chemillier, Jean-Baptiste Barrière et Anne-Sylvie Barthel-Calvet, réunis dans la revue Analyse musicale, réalisé et coordonné par Pierre Michel, ont bien évidemment enrichi notre vision de la texture.

Chapitre 3 : Principes d’organisation auditive et perception de la texture

Différentes étapes de traitement de l’information auditive ont été distinguées (McAdams et Bigand, 1993).¹⁵⁵ L’une d’elles semble directement reliée à la notion de texture : l’analyse des scènes auditives. En effet, notre environnement auditif quotidien est composé de mixtures de sources sonores diverses. La complexité des scènes auditives et la densité des textures acoustiques auxquelles nous sommes régulièrement confrontés, nous empêche de tout traiter de manière pertinente. Pour des sujets sourds, ce traitement demande un entrainement spécifique pour obtenir des résultats significatifs. Nous développerons ultérieurement cette question. C’est pourquoi un apprentissage spécifique devra être mis en place de façon régulière afin d’améliorer leurs performances. L’analyse de scènes auditives s’avère cruciale pour comprendre au mieux le monde environnant. La psychologie cognitive a décrit des principes fondamentaux pour la perception visuelle, ainsi que pour la perception auditive, notamment des règles de groupement que nous détaillerons dans notre second sous-chapitre sur l’analyse de scènes auditives chez Bregman¹⁵⁶ et Mc Adams.¹⁵⁷ Dans une perspective Gestaltiste, l’organisation perceptive procède par ségrégations des différents flux sonores. « La formation des flux est un phénomène complexe dont les nombreuses recherches de Bregman ont permis l’analyse. »¹⁵⁸ En guise d’introduction, nous expliciterons en quoi consiste la théorie de la Gestalt. La notion de fond/figure a surtout été repris d’un point de vue compositionnel et musicologique, dans des domaines comme l’orchestration ou le mixage notamment. La perception visuelle est la mieux connue car la plus étudiée. Les lois de l’organisation perceptive sont les règles qui imposent de voir des éléments de notre environnement comme un tout. Lorsque nous voyons un objet, nous en voyons simultanément la forme, la couleur, la texture, les contours, la position et éventuellement le mouvement. L’approche essentielle de Meyer (1956) a permis de mettre en lumière les processus cognitifs et émotionnels de la musique. Le fonctionnement de la musique repose sur les lois générales relatives aux relations de tension/détente. Les structures cognitives, en lien avec ces phénomènes de tension/détente, ont été formalisées sur la plan théorique et expérimental (Bigand, 1993¹⁵⁹, 2006¹⁶⁰, 2009¹⁶¹ ; Bigand, Parncutt et Lerdahl, 1996¹⁶²). Selon Emmanuel Bigand (2009), ce type de relations serait d’ailleurs, un aspect central de l’écoute musicale, permettant de lier intimement cognition et émotion.

1. La théorie de la Gestalt

1.1. Définition

Gestalt est un terme relativement complexe qui n’a pas vraiment d’équivalent dans les autres langues. En français, ce terme désigne tout autant la théorie de la forme, la gestalt-théorie, qu’une thérapie comportementale humaniste : la gestalt-thérapie. Gestalten en allemand, signifie mettre en forme, donner une structure signifiante. Gestalt désigne un ensemble ou une totalité organisé qui transcende ses parties constituantes. En musique, des parties d’une mélodie sont perçues dans une succession ou une séquence temporelle, mais ces parties sont perçues comme un tout, ou une Gestalt.

1.2. Historique

Au début du XXᵉ siècle, ont émergé deux courants opposés : le behaviorisme et la psychologie de la forme. Il est important de noter que la psychologie cognitive dès la fin des années 1940, par ses fondements objectifs et formels, les remplacera et continue aujourd’hui à définir le cadre théorique des recherches en psychologie. Néanmoins, les théories du formalisme et de la Gestalt sont utiles pour comprendre la perception et l’expérience musicales car ce sont des principes primordiaux qui ne dépendent pas seulement d’une époque donnée. Nous verrons comment cette théorie a inspiré certains compositeurs et musicologues au cours de ce chapitre.

Conduit par Max Wertheimer¹⁶³, Kurt Koffka¹⁶⁴ et Wolfgang Köhler¹⁶⁵, la psychologie de la forme est un courant d’idées qui se développa en Allemagne dans les années 1920 et 30. Ils émigrèrent par la suite aux États-Unis, à cause de la montée du nazisme en Allemagne. La théorie de la Gestalt trouve cependant son origine avant le début du XXᵉ siècle. Ce fut le philosophe autrichien Christian Von Ehrenfels qui développa cette théorie dans son article de 1890 « Über Gestaltqualitäten » (sur les qualités de formes). La question centrale réside dans le fait d’affirmer que le tout est supérieur à la somme des parties. Nous percevons d’abord un objet de façon globale avant d’en voir les parties constituantes. En musique par exemple, lorsque nous nous rappelons d’une mélodie, nous nous souvenons de sa structure globale et non d’une suite successive de notes prises isolément. De plus, la reconnaissance d’une mélodie est possible malgré l’altération de nombreux paramètres, comme la hauteur, le tempo ou le timbre. Les lois de la Gestalt, que nous détaillerons ci-après, mettent en forme une mélodie, grâce à une diversité de moyens sans qu’elle perde néanmoins son identité.

Ainsi, ces propriétés dites « émergentes » sont omniprésentes dans tout ce qui nous entoure : un visage est plus qu’une paire d’yeux, un nez et une bouche par exemple.¹⁶⁶ En France, Köhler sera de loin le plus connu grâce à son ouvrage publié chez Gallimard, La psychologie de la forme. L’ouvrage de Paul Guillaume (1878-1962), également intitulé La Psychologie de la forme, paru chez Flammarion à la veille de la Seconde Guerre mondiale reste encore à ce jour un ouvrage de référence pour certains psychologues.¹⁶⁷ Merleau-Ponty, également, ne cessera tout au long de sa vie de penser la forme. Dans La structure du comportement, son projet est de construire une véritable philosophie de la forme qui serait en quelque sorte le prolongement de la psychologie de la forme.¹⁶⁸

1.3. Perception : une approche systémique

D’après la théorie de la Gestalt, comme nous venons de le décrire, nous percevons essentiellement des formes globales et non des détails. Notre cerveau réalise très rapidement une synthèse, un assemblage qui rend l’ensemble compréhensible et cohérent. L’observateur cherche à percevoir une « bonne forme ». Ainsi, il va regrouper des données similaires afin d’y chercher une continuité. Prenons le cas des étoiles : lorsque nous admirons le ciel étoilé, notre cerveau s’organise de telle manière à percevoir des groupes et à les structurer. Il essaie d’en dégager des formes. L’étoile, unité première, sera associée à d’autres étoiles pour s’organiser en forme (gestalt), ce qui correspondra à la constellation. Cette approche, telle qu’elle a été définie par la Gestalt est systémique. C’est-à-dire multiple et globale.

1.4. Les principes de la Gestalt dans le domaine visuel

« La théorie de la Gestalt propose des lois pour rendre compte de la formation des groupements et des configurations. »¹⁶⁹ Claude Bonnet explique qu’une « scène visuelle se compose de formes et de surfaces que l’organisme doit discriminer les unes des autres. Phénoménalement, certains éléments vont ensemble en ce qu’ils appartiennent par exemple au même objet. »¹⁷⁰

Voici les principales lois de la Gestalt : bonne forme, continuité, proximité, similitude, destin commun et clôture. Ces mêmes lois seront reprises par Albert S. Bregman au sujet de l’analyse de scènes auditives. Nous reviendrons en détail sur ces principes perceptifs s’appliquant également dans le domaine auditif et comment ils peuvent être illustrés à l’aide de la musique.

– Loi de la bonne forme ou prégnance : c’est le principe fondamental de la Gestalt. Nous préférons les choses simples, claires et ordonnées. Selon cette loi, les éléments s’organisent en une forme plutôt qu’une autre. C’est le cas par exemple des figures géométriques simples comme le carré, le cercle ou le triangle formant ensemble l’icône du Bauhaus.

Figure 43: Illustration de la loi de prégnance.

– Loi de la continuité : notre œil suit les lignes que nous percevons. Lorsque la proximité des éléments visuels est importante, nous les voyons dans une continuité comme s’ils ne formaient plus qu’une seule et unique partie.

Figure 44: Illustration de la loi de continuité.

Loi de proximité : les éléments les plus proches sont spontanément associés à un même groupe. Dans cet exemple, la série de points consécutifs sera perçue comme étant un enchaînement de séries de deux points.

Figure 45: Illustration de la loi de proximité

Le groupement par similarité : Nous avons tendance à regrouper les éléments qui se ressemblent. Notre cerveau regroupe ces éléments semblables ayant des traits communs (forme, taille, couleur, etc.).

Figure 46: Illustration de la loi de similarité.

Loi de destin commun : Lorsqu’un ensemble d’objets se déplace dans une direction commune, cet ensemble est perçu comme appartenant à un même groupe. Ces éléments n’ont pas nécessairement besoin de bouger pour qu’on leur attribue une synchronicité. Le plus important, c’est la destination commune.

Figure 47: Illustration de la loi de destin commun.

Dans cette photo, le mouvement de ce groupe d’oiseaux va dans la même direction.

Loi de Clôture : comme pour la loi de la bonne forme, la loi de clôture cherche la simplicité. Elle est l’opposé du résultat de la loi de prégnance, car nous simplifions un ensemble, en un groupe de formes simples. Tandis qu’avec la loi de clôture, nous remplissons les vides d’une forme ou d’un ensemble de formes pour former un tout cohérent.

Figure 48: Illustrations de la loi de clôture avec notamment le célèbre logo de l’ONG pour la protection de la nature WWF (World Wildlife Fund).

Comme nous l’avons souligné précédemment, ces lois de l’organisation perceptive n’interviennent pas seulement pour la vision mais également pour l’audition. Quand nous écoutons une œuvre musicale, nous avons alors tendance à regrouper les sons similaires. Il est intéressant de remarquer que le groupement par similarité a été exploité par les musiciens compositeurs bien avant qu’il soit étudié par les psychologues. On a aussi tendance à regrouper les sons qui se suivent très rapidement dans le temps. Il s’agit d’un groupement par proximité. L’apport intéressant des gestaltistes à travers les lois de l’organisation perceptive est d’avoir montré que la perception n’est pas une copie du réel mais possède ses propres lois d’organisation pouvant conduire à des rajouts ou à des suppressions dans le réel perçu.

Nous verrons dans le chapitre suivant, à travers les travaux de Bregman notamment, que les principes de l’analyse de scènes auditives, semblent mettre en évidence des principes analogues aux principes de groupements décrits par les psychologues gestaltistes. Nous nous appuierons majoritairement sur le cadre de référence théorique proposé par Bregman.

2. Analyse de scènes auditives : Bregman et McAdams

La psychoacoustique se révèle être un outil puissant pour comprendre comment le système auditif parvient à classifier les sources sonores et à les séparer. Les sons que nous percevons proviennent généralement d’un ensemble de sources acoustiques. Les ondes acoustiques émises par chacune de ces sources se propagent jusqu’à l’entrée de l’oreille où elles se combinent pour former un signal sonore unique appelé « mixture ».¹⁷¹ Cette mixture sonore qui atteint nos oreilles doit être interprétée par notre système auditif. Lorsque nous sommes entourés de signaux sonores provenant de différentes sources, ce qui entre dans l’oreille est un agrégat de vibrations complexes où toutes les sources sont entremêlées. Le rôle du système auditif est alors de déterminer ce qui appartient à quoi, et de bâtir une image cohérente du monde sonore environnant. En résumé, l’analyse de scène auditive se réfère à la capacité des auditeurs à analyser des scènes acoustiques complexes en objets cohérents. Selon Laurel Trainor, cette aptitude auditive aurait des fondements très anciens dans l’évolution.¹⁷²

La situation d’écoute la plus courante correspond à une situation où l’auditeur cherche à comprendre ce qu’un locuteur dit alors que ses paroles sont noyées dans un bruit de fond. C’est l’effet « Cocktail Party »¹⁷³ qui a été décrit en 1953 par Colin Cherry où il étudie l’attention auditive à l’aide d’un protocole d’écoute dichotique qui sera réutilisé plus tard par Diana Deutsch. Il consiste à faire entendre des signaux acoustiques distincts à chaque oreille à l’aide d’écouteurs. Pour Deutsch, cette situation artificielle d’écoute permettra la découverte d’illusions auditives, alors que pour Cherry il s’agit d’appréhender le pouvoir inhibiteur dans une situation de filtrage d’information. Nous reviendrons sur les illusions perceptives avec les travaux notamment de Pressnitzer dans notre quatrième sous-chapitre.

Les questions sur cette capacité essentielle de la perception auditive sont bien plus anciennes : Helmholtz s’interrogeait déjà sur notre capacité à percevoir les qualités individuelles des instruments de l’orchestre.¹⁷⁴ « Selon lui [Helmholtz], l’observateur met en œuvre des lois perceptives qui donnent naissance à l’interprétation la plus efficace de l’environnement. Ce type de raisonnement pourrait expliquer pourquoi les lois gestaltistes ont été élaborées. »¹⁷⁵ Pour réaliser cette analyse, l’auditeur utilise des informations qui doivent caractériser les différentes sources acoustiques qu’il tente d’isoler. C’est la représentation perceptive de ces traits acoustiques que l’on appelle « indices perceptifs ». Grâce à ces indices, l’auditeur peut séparer la mixture en flux auditifs. Pour parvenir à effectuer cette séparation, Bregman rend compte des processus d’analyse des scènes auditives, qui expliquent les lois décrites intuitivement par les gestaltistes : bonne forme, continuité, proximité, similitude, destin commun et clôture. Avec la collaboration du musicologue James Wright (1987)¹⁷⁶, Bregman introduit la notion essentielle de « propriété émergente ». Steve McAdams nous explique à ce sujet que « les propriétés des événements émergent de la fusion simultanée des informations acoustiques alors que les propriétés des flux émergent de l’intégration séquentielle des événements. »¹⁷⁷

Vingt années de recherches sont alors réunies et publiées sous l’intitulé Auditory Scene Analysis : Perceptual Organization of Sound ¹⁷⁸, où Bregman condense tous les principes de l’analyse de scènes auditives (ASA) sur les bases de deux grandes classes de mécanismes : les mécanismes de ségrégation simultanée, qui traitent les événements sonores simultanés et les mécanismes de ségrégation séquentielle, qui traitent les événements sonores ne se recouvrant pas dans le temps. En étudiant ces mécanismes, certaines caractéristiques acoustiques permettant à des sons d’être séparés ont pu être associées à des variables ou fonctions auditives. Ainsi, il a été montré que la sélectivité fréquentielle était un des facteurs déterminants pour la perception de la hauteur fondamentale. Outre la clarification de nos connaissances sur le fonctionnement de l’appareil auditif, ces études ont ouvert des pistes de réflexion pour améliorer la réhabilitation des malentendants, et plus particulièrement en milieu bruyant. Bregman explique :

Forgée par des informaticiens dans le domaine de la vision […] l’« analyse de scènes » désigne la stratégie par laquelle l’ordinateur regroupe l’ensemble des propriétés visibles – pourtours, textures de surface, couleurs, distances, etc. – d’un même objet. Ce processus permet de déterminer la forme globale et les propriétés correctes d’un objet. Par analogie, l’analyse de scènes auditives est le processus réunissant en une unité perceptive l’ensemble des signaux provenant, dans une période de temps donnée, d’une seule source sonore de l’environnement.¹⁷⁹

Les processus d’organisation séquentielle suivent plutôt les principes de similarité et de continuité alors que les processus d’organisation simultanée reposent surtout sur le principe de destin commun.

Bregman propose également une autre catégorisation de ces mécanismes. Lorsque le processus de groupement/séparation se fait en groupant les éléments qui partagent un même indice, nous parlons plutôt de processus « primaire ». Ce type de processus est communément étudier comme bottom-up (ascendant), c’est-à-dire que l’information permettant la ségrégation circule de la cochlée vers le cerveau. Ces mécanismes devraient permettre d’exploiter de façon automatique les indices extraits par les voies auditives primaires. Par contre, il ne faudrait pas mettre de côté une possible contribution de processus basés sur des schémas de type top-down (decendants). Ce type de mécanisme doit permettre d’exploiter nos connaissances a priori des sons qui nous sont familiers. L’auditeur effectue un aller-retour entre les étapes perceptives élémentaires et les processus de traitement de haut niveau (représentations mentales, prise de décision, inférence, interprétation).

Stephen McAdams résume sous forme d’organigramme les cinq processus de traitement de la reconnaissance auditive :

Figure 49 : Schémas des étapes de traitement qui interviennent dans la reconnaissance et l’identification.¹⁸⁰

2.1. Le groupement simultané

Les mécanismes du groupement simultané reflèteraient le mieux notre capacité à comprendre la parole dans le bruit par exemple. Spontanément, les auditeurs groupent ensemble les composants acoustiques simultanés qui commencent et s’arrêtent en même temps. Les fréquences entendues sont liées harmoniquement. Nous sommes par exemple capables de fusionner les harmoniques d’un saxophone pour former une image auditive cohérente et reconnaissable de l’instrument.¹⁸¹

Les processus de ce type de groupement font appel aux indices suivants :

L’harmonicité : lorsqu’un ensemble de sons présente des fréquences harmoniques (multiples entiers de la fréquence fondamentale), celles-ci fusionnent. La perception de la hauteur en est un bon exemple, car toutes les harmoniques fusionnent en une seule hauteur. Ce processus « consiste plus en l’annulation d’un masque harmonique qu’en l’extraction d’une cible harmonique. »¹⁸²
La localisation : « le système auditif tend à grouper les éléments acoustiques de même provenance spatiale et à séparer ceux qui proviennent d’azimuts différents »¹⁸³. Le système auditif utilise donc des processus de localisation pour l’analyse des scènes auditives. La spatialité s’avère être un indice majeur dans l’acte d’écoute d’un individu entouré d’autres personnes conversant.
Le synchronisme des attaques et des chutes : les sources concurrentes sont rarement synchrones (sons commençant, variant et se terminant simultanément). Ainsi, une asynchronie d’attaque donnera l’impression d’une perception d’objets multiples.
Le synchronisme de modulation : quand plusieurs sources simultanées sont concurrentes, les sons modulés en amplitude et/ou en fréquence de façon identique sont regroupés.

2.2. Le groupement séquentiel

Comme le souligne le musicologue Philippe Lalitte, « le groupement séquentiel se fonde soit sur le principe de similarité ou de continuité des évènements (hauteur, timbre, sonie ou position spatiale), soit sur le principe de proximité temporelle entre les évènements. »¹⁸⁴ L’organisation séquentielle crée certains aspects de l’expérience musicale comme le rythme et la mélodie.

Le premier principe est la similarité : le système auditif interprète deux évènements sonores évoluant dans le temps comme appartenant à deux sources sonores distinctes si les sons appartiennent à deux régions fréquentielles éloignées comme une flûte et un piano par exemple. Cet éloignement conduit de fait, à la perception de timbres différents. Par contre si les sons sont proches du point de vue fréquentiel, il ne percevra qu’une seule source. Les tâches de streaming sont le plus souvent utilisées pour l’étudier.¹⁸⁵ Enfin, deux événements séparés dans l’espace seront plus facilement séparés en flux distincts que deux évènements rapprochés. Il peut donc s’agir d’une similarité de hauteur, de timbre, de position spatiale, de sonie, etc.
Le deuxième principe est associé à la proximité temporelle : le rythme et le tempo jouent également un rôle important dans la perception de l’organisation auditive séquentielle. Selon Bregman et Campbell, si une suite de six sons est présentée lentement, on entendra un seul flux auditif de six notes ; a contrario, si le tempo est rapide, une fission perceptive se produit et deux flux de trois sons seront perçus.¹⁸⁶ Les indices temporels sont donc mobilisés dans ce processus qui s’établit suivant les modifications des propriétés acoustiques des événements acoustiques au cours du temps.

2.3. Le groupement segmentationnel

McAdams distingue un groupement supplémentaire impliqués dans la formation d’une scène auditive, à savoir le groupement segmentationnel ou segmental.¹⁸⁷

Figure 50: Différents types de groupements et leurs effets perceptifs.¹⁸⁸

Ce groupement affecte le « découpage » des flux en unités musicales plus larges, telles que les motifs, les phrases et les thèmes. Les principes de similarité et d’invariance (tonalité, mode, métrique, rythme, harmonie, texture…) et le principe de familiarité (ce que l’auditeur a déjà entendu au cours de la pièce musicale notamment) sont employés dans ce groupement par segmentation. Dans ce contexte, les processus de groupement auditif sont impliqués dans de nombreuses pratiques d’orchestration, notamment la fusion de timbres d’instruments due à un groupement simultané, la ségrégation de mélodies basée sur des différences de timbre dans le groupement séquentiel, et des échanges de type réponse ou écho par le biais de contrastes orchestraux pour le groupement segmentationnel. Tout comme dans le groupement séquentiel, il met en œuvre également les principes de similarité et d’invariance (tonalité, mode, harmonie, métrique, rythme, texture…) et le principe de familiarité (ce qui a déjà été entendu au cours du déroulement d’un morceau ainsi que les reprises).

Dans une perspective analytique, on pourrait rapprocher la dimension verticale de la texture du groupement simultané et la dimension horizontale des groupements séquentiel (échelle temporelle locale) et segmental (échelle temporelle plus large). Dans la musique après 1945, et notamment dans les musiques qui accordent une importance majeure au timbre, à la texture et à l’espace, le groupement segmentationnel correspond à des qualités sonores émergentes telles que la densité (opacité vs transparence), l’étendue (large vs étroite), le centre de gravité tonal (léger vs lourd), la brillance (clair vs sombre), la dissonance sensorielle (rugueux vs soyeux) pour la dimension verticale. Alors que la striation (pulsé vs lisse), la régularité (fluide vs saccadé), la vitesse (rapide vs lent), la stabilité (mouvant vs statique) et la densité temporelle (aéré vs compact) illustrent plutôt la dimension horizontale.

2.4. Les processus de concurrence entre ces trois groupements

Nous avons énoncé précédemment chez Bregman et McAdams, les différents principes perceptifs concernant les groupements simultanés, séquentiels et segmentationnels. En musique, ces trois ensembles de principes opèrent en même temps afin de créer une représentation mentale cohérente avec la conduite des sources sonores de notre environnement.¹⁸⁹ Le processus d’analyse de scène auditive est considéré comme réussi lorsque l’image auditive formée est cohérente en séparant correctement chaque source et chaque flux auditif. Cependant, il peut arriver que les indices ne soient pas cohérents entre eux ce qui conduit à tromper le cerveau qui fait alors émerger une image auditive ne correspondant pas aux sources et aux flux du monde physique, et qui, par voie de conséquence, crée des ambiguïtés perceptives ou des chimères auditives. Le phénomène de concurrence a été étudié par Bregman et Pinker.¹⁹⁰ Ils ont élaboré des stimuli sonores afin de comprendre comment interagissaient ces principes d’organisation séquentielle et simultanée. Il en résulte que plusieurs principes opèrent en compétition : d’une part, la proximité fréquentielle (sons conjoints) concernant l’organisation séquentielle et d’autre part l’harmonicité et le synchronisme des attaques pour l’organisation simultanée. En musique, d’autres principes peuvent potentiellement entrer en concurrence comme la comodulation des fréquences et des amplitudes ainsi que la proximité des timbres. Une autre étude du musicologue Wright et de Bregman a montré comment les compositeurs et théoriciens du XVIᵉ siècle se servaient intuitivement de ces principes d’organisation auditive dans leurs compositions¹⁹¹. Par exemple, les principes du contrepoint soulèvent les mêmes problématiques qu’ont rencontré Bregman et Pinker, car nous retrouvons une compétition entre synchronisme harmonique et proximité mélodique. Nous reparlerons de cela en détail dans notre chapitre sur les liens entre la texture, l’ASA et les illusions auditives.

3. Application des principes de la Gestalt à la musique

3.1. Chez Meyer

Dans son ouvrage, Emotion and meaning in music¹⁹², Léonard B. Meyer, en exposant le fondement musical essentiel de la musique tonale, à savoir la relation tension/détente au cœur des émotions, est véritablement le premier à intégrer les principes psychologiques de la gestalt à un discours sur la musique. Bien que son travail soit centré sur l’aspect émotionnel, il s’agit assurément d’un travail d’analyse musicale et non pas d’esthétique. C’est justement cette caractéristique qui rend son travail exceptionnel et fait de lui un pionnier. Il tente de se distinguer du courant dominant de l’analyse de la musique de son époque en intégrant le sujet ou la perception et non pas seulement l’objet, c’est-à-dire la partition. « Les théoriciens de la musique, en règle générale, se sont attachés à élucider la grammaire et la syntaxe de la musique plutôt que les significations ou les expériences affectives auxquelles elle donne lieu. »¹⁹³

Nous pensons tout particulièrement aux travaux d’Ernst Kurth, avec notamment Musikpsychologie écrit en 1931.¹⁹⁴ Ce dernier ouvrage publié par le théoricien vise à jeter les fondements de la psychologie de la musique, prolongeant la « Tonpsychologie » de Carl Stumpf et synthétisant les trois grand livres grâce auxquels Kurth s’est fait connaître : le premier sur Bach, le deuxième sur Wagner et le dernier sur Bruckner. Il s’est d’ailleurs beaucoup intéressé à la musique de Debussy car cette nouvelle écoute, totalement affranchie du modèle cognitif propre à la musique tonale, ne s’applique plus à l’accord pris isolément mais aussi à la succession des accords. Ce qui signifie que cette succession d’accords entendue ne s’inscrit plus dans un réseau de relations syntaxiques gouvernés par un principe général, celui de la logique tonale, mais forme une progression qui justifie sa seule couleur, sa texture propre.¹⁹⁵ Kurth parlait déjà de « flux de forces » parcourant la matière acoustique et de « traits sonores fusionnés » pouvant être déchirés par « des lignes qui ressortent »¹⁹⁶, ce qui n’est pas sans rappeler la notion de texture chez Meyer.

La grande originalité de Meyer a été d’appliquer les grands principes de la Gestalt dans le domaine de l’écoute musicale et non pas seulement dans celui de l’audition. L’écoute musicale s’inscrit alors dans un véritable processus communicationnel. Ainsi les notions de style et d’acculturation inscrivent ce processus dans une dimension culturelle et écologique, multipliant ainsi les paramètres pertinents dans l’étude de l’écoute musicale. Meyer va donc considérer les principes de groupement dans les termes d’une « attente perceptive ». Dans son deuxième chapitre, il nous explique que « les attentes nées de la nature même des processus mentaux humains sont toujours conditionnées par des possibilités et probabilités inhérentes aux matériaux et à leur organisation tels qu’ils se présentent dans un style musical donné. »¹⁹⁷ Car, selon Meyer, l’émotion musicale serait le résultat de nos attentes : elles peuvent être provisoirement inhibées, voire complètement frustrées. Nous pouvons dire que Meyer adapte ici à l’écoute musicale, la loi de la continuité, puisque ces attentes déterminent la valeur affective que l’auditeur attribue à la musique. Selon le philosophe Gaston Bachelard, « l’action musicale est discontinue, (et) c’est notre résonance sentimentale qui lui apporte la continuité. »¹⁹⁸ La continuité s’exprime comme une tendance au prolongement de l’organisation la plus simple. Une « bonne continuation » est celle qui est attendue.

Afin d’expliquer cela, le musicologue américain se réfère aux travaux de Koffka et à la Gestalt en nous renseignant sur la texture musicale notamment et pour démontrer comment le fonctionnement des structures musicales (rythme, régularité, symétrie) est à la base de l’évocation des émotions, en contribuant à la satisfaction de l’esprit (loi de prégnance). Par exemple, Meyer souligne la nécessité d’une répartition figure-fond dans le domaine visuel, tandis que dans « l’espace auditif, en musique, il n’y a pas de fond établi ; il n’existe pas de stimulation continue et nécessaire par rapport à laquelle toutes les figures devraient être perçues ».¹⁹⁹ Selon lui, notre cerveau est capable d’organiser de multiples façons les données que nous percevons. Pour cela, il énonce cinq manières distinctes :

Une figure unique sans fond, comme une composition pour instrument seul,

Plusieurs figures sans fond, comme une polyphonie où nous percevons clairement les différentes parties séparément,
Une figure accompagnée par un fond, comme les textures homophoniques du XVIIIᵉ et XIXᵉ,
Un fond seul, comme dans l’introduction d’une œuvre,

Une superposition de petits motifs similaires sans être identiques, comme dans les textures hétérophones.²⁰⁰

3.2. Chez James Tenney et Larry Polansky

A la suite de Meyer, d’autres musicologues se sont intéressés à la théorie de la Gestalt et en ont tiré des fondements pour élaborer leurs propres théories analytiques. Par exemple dans le modèle de James Tenney et Larry Polansky²⁰¹, les auteurs proposent quatre niveaux hiérarchiques de la Gestalt temporelle :

Element : il n’est pas divisible perceptuellement en plus petite unité.

Clang : correspond à une succession de deux éléments, ou plus.

Segment : correspond à une succession de deux Clang, ou plus.

Section : correspond à une succession de deux segments, ou plus.

La pièce entière correspond quant à elle à un autre niveau.

Dans cet article, Tenney et Polansky ont réalisé une analyse segmentationnelle de Densité 21,5 de Varèse en comparant avec celle de Nattiez. La seule pièce pour instrument soliste de Varèse, Densité 21,5, crée en 1936, est sa pièce la plus jouée et la plus représentée de son catalogue discographique. Elle est également sa pièce la plus analysée. L’analyse de Nattiez, une des plus complètes sur le sujet, repose sur une analyse paradigmatique.²⁰² Il a mis en évidence notamment l’alternance systématique des mouvements intervalliques ascendants et descendants. Quant à Tenney et Polansky, ils se basent sur deux lois de la Gestalt-theory afin d’établir des critères de segmentation perceptivement plausibles, tels que la proximité temporelle et la similarité intervallique : « La formation perceptuelle des

Gestalt temporelles à n’importe quel niveau hiérarchique est déterminée par un certain nombre de facteurs de cohésion et de ségrégation, dont les plus importants sont la proximité et la similarité. »²⁰³

Figure 51: Extrait de l'analyse de Tenney et Polansky, p. 222. — Figure 51: Extrait de l’analyse de Tenney et Polansky, p. 222.

Les différentes lois de la Gestalt sont repérées spontanément par l’auditeur. Elles lui permettent de grouper et de séparer les flux auditifs. Les expériences référées à ces modes de discrimination ont été synthétisées par Diana Deutsch.²⁰⁴ Célestin Deliège explique à ce sujet : « De telles règles ne sont sans doute pas limitatives des normes de groupement, mais leur seule énumération constitue un guide précieux pour la psychologie, la pédagogie, mais surtout, on voudrait l’espérer, pour la composition musicale : leur apparente consistance et leur universalité semblent pouvoir inspirer une démarche imaginative. » ²⁰⁵

3.3. La Théorie Générative de la Musique Tonale (TGMT)

En 1973, le compositeur Leonard Bernstein donne une série de conférences à Harvard et appelle les chercheurs à proposer une grammaire musicale comparable à la théorie de la « grammaire générative » de Noam Chomsky. Ce dernier propose une nouvelle théorie du langage basée sur le postulat d’une grammaire universelle par définition dépourvue de contraintes sémantiques. En réponse à cela, dès l’année suivante, l’institut de technologie du Massachusetts, le célèbre MIT, organise un séminaire sur musique et langage où le compositeur musicologue Fred Lerdahl s’associe au linguiste Ray Jackendoff pour proposer une théorie générative de la musique tonale.²⁰⁶ Cette théorie, appelée TGMT, travaille également sur la question de groupement des structures musicales selon les principes de la Gestalt. Cette théorie propose un ensemble de règles formelles expliquant comment les auditeurs pourraient dégager la structure d’une pièce de musique sous forme d’une hiérarchie d’événements. Il est important de souligner qu’autant Meyer que Lerdahl et Jackendoff partagent l’idée selon laquelle une pièce de musique tonale possède une structure fortement hiérarchisée où chaque évènement s’intègre dans un réseau de relations. La TGMT décrit la façon dont les processus mentaux d’un « auditeur expérimenté » répondent à la structure musicale, reprenant l’idée du linguiste américain Chomsky d’un « parleur écoutant idéal ». Les unités de base de la grammaire musicale de Lerdahl et Jackendoff correspondent à des notes ou à des accords, alors que nous parlons de phonèmes en langage. Le développement de cette théorie a été influencé par la théorie d’Heinrich Schenker (1935), notamment par le concept des structures sous-jacentes à la surface musicale.²⁰⁷ Sa théorie s’apparente également à la théorie de la Gestalt, qui lui est contemporaine, et plus généralement, elle se rattache au développement de la phénoménologie et du structuralisme du début du XXᵉ siècle.

Ainsi, quatre types de structures sont définies et décrivent l’organisation d’une pièce de musique :

La structure de groupe (« grouping structure ») : l’auditeur perçoit un ensemble de notes qu’il regroupe intuitivement en unités de différentes longueurs. Ces unités proposent une hiérarchie de groupements mélodico-rythmiques : motifs, périodes, phrases, etc…

Figure 52: Exemple de représentation de la structure de groupe avec le début du *Scherzo* de *la Sonate* de Beethoven *opus 2, n°2,* Extrait de Lerdahl and Jackendoff (1983), p. 15.

Les accolades représentent les différents groupes d’éléments et leur hiérarchie.

La structure métrique (« metrical structure ») : à partir de la pulsation, l’auditeur dégage une hiérarchie d’accents qui dépend de la mesure, tels que les temps forts et les temps faibles.

Figure 53: Exemple de représentation de la structure métrique avec le début de la Symphonie en sol mineur de Mozart. Extrait de Lerdahl and Jackendoff (1983), p. 23.
Dans la représentation des structures métriques de la TGMT, le nombre de points verticaux indique le niveau hiérarchique : plus il y a de points, plus le niveau est fort. Les premiers temps de chaque mesure sont des temps forts : 4 points dans la représentation de la structure métrique. — Figure 53: Exemple de représentation de la structure métrique avec le début de la *Symphonie en sol mineur* de Mozart. Extrait de Lerdahl and Jackendoff (1983), p. 23.
Dans la représentation des structures métriques de la TGMT, le nombre de points verticaux indique le niveau hiérarchique : plus il y a de points, plus le niveau est fort. Les premiers temps de chaque mesure sont des temps forts : 4 points dans la représentation de la structure métrique.

La réduction des trames temporelles (« time-span reduction ») : elle s’appuie sur les deux niveaux hiérarchiques précédents pour former un arbre temporel avec plusieurs niveaux d’enchâssements.

Figure 54: Représentation des structures de groupe et métrique de l’Ouverture du Menuet de la Symphonie n° 104 de Haydn. Extrait de Lerdahl and Jackendoff, p. 26. — Figure 54: Représentation des structures de groupe et métrique de *l’Ouverture du Menuet de la Symphonie n° 104* de Haydn. Extrait de Lerdahl and Jackendoff, p. 26.

La TGMT repose sur l’interaction entre structures de groupes et structures métriques. Celle-ci peut conduire à certaines ambiguïtés, notamment dans un contexte d’écoute de musique contemporaine. Les structures métriques et de groupement servent à l’auditeur à hiérarchiser les événements en laps de temps afin de déterminer quels événements sont les plus importants structurellement parlant. C’est là qu’intervient la notion de réduction empruntée à la théorie de Schenker : certaines notes sont ornementales, d’autres sont structurelles. Cependant, Lerdahl et Jackendoff ne reprennent pas à leur compte l’idée que toute composition est prolongation d’une structure fondamentale (Ursatz).

– La réduction prolongationnelle (« Prolongational Reduction ») : elle est fondée sur l’augmentation ou la réduction de la tension tonale. Elle exprime les relations de tension et de détente entre les éléments musicaux ainsi que la stabilité des événements en termes de continuité et de progression, de degré d’ouverture et de fermeture.

Figure 55 : Exemple d'une réduction prolongationnelle de Là ci darem la mano de Don Giovanni de Mozart : les branchements à droite représentent les éléments de tension et ceux de gauche la détente, extrait de Lerdahl and Jackendoff, p. 200. — Figure 55 : Exemple d’une réduction prolongationnelle de *Là ci darem la mano* de *Don Giovanni* de Mozart : les branchements à droite représentent les éléments de tension et ceux de gauche la détente, extrait de Lerdahl and Jackendoff, p. 200.

Ces deux dernières catégories sont essentiellement basées sur le principe de la stabilité tonale.

Figure 56: Analyse générative de la première phrase de l’Aria des Variations Goldberg de Bach. — Figure 56: Analyse générative de la première phrase de *l’Aria des Variations Goldberg* de Bach.

Pour chacune de ces structures, la TGMT définit un nombre limité de règles permettant de prédire les structures hiérarchiques perçues par les auditeurs : règles de bonne formation, règles préférentielles et règles transformationnelles.

En conclusion, la TGMT a posé un cadre de référence dans l’étude de la perception musicale en décrivant des principes de structuration des événements musicaux au cours du temps. Cette théorie repose sur un ordre très précis d’opérations. Emmanuel Bigand en a proposé une représentation schématique :

Figure 57: Représentation schématique de la TGMT (d'après E. Bigand, 1994) — Figure 57: Représentation schématique de la TGMT (d’après E. Bigand, 1994).²⁰⁸

La TGMT a révolutionné la recherche en sciences cognitives de la musique en servant de base théorique à de nombreuses études expérimentales (Bigand²⁰⁹, Deliège²¹⁰, Krumhansl²¹¹). Selon Sloboda notamment, cette théorie marque l’âge de maturité de cette discipline.²¹² Elle a permis une meilleure compréhension de la perception des structures syntaxiques de la musique tonale, néanmoins la TGMT a complètement laissé de côté les aspects sonores de la musique : dynamique, timbre, texture et espace. Cela reste une vision très graphocentrique de la musique.

Afin de visualiser l’ensemble de la TGMT, voici le diagramme général proposé par les auteurs :

Figure 58 : Diagramme général de la théorie de Lerdhal et Jackendoff.²¹³

3.4. Le modèle Implication-Réalisation de Narmour

Eugene Narmour, disciple de Léonard Meyer, développe le concept d’implication proposé par ce dernier. Pour cela, Narmour propose une théorie de la cognition des structures mélodiques simples sous le nom de Implication-realization model.²¹⁴ Ce modèle d’implication-réalisation s’inspire lui aussi des principes d’organisation de la psychologie de la Gestalt. Cette théorie postule deux systèmes perceptuels distincts: les systèmes d’implication mélodique ascendants et descendants. Tandis que les principes des premiers sont considérés comme étant câblés, innés et universels, les principes des seconds sont censés être appris et donc dépendants de l’expérience musicale. Ce modèle est centré sur les intervalles. En particulier, les petits intervalles mélodiques impliquent un processus (l’intervalle réalisé va dans le même sens que l’intervalle implicatif et sera de taille similaire), tandis que les grands intervalles mélodiques impliquent un renversement (l’intervalle réalisé est dans une direction différente de celle de l’intervalle implicatif et est de taille plus petite). Bien que ce modèle soit présenté de manière très analytique, il a une pertinence psychologique car il avance des hypothèses sur des principes de perception généraux qui sont spécifiés de manière précise et quantitative et peuvent donc faire l’objet d’une investigation empirique (Krumhansl, 1995²¹⁵; Schellenberg, 1996²¹⁶, 1997²¹⁷ ). Narmour considère que la tonalité est un intervalle de seuil assumant la fonction d’un intervalle petit ou grand (c’est-à-dire impliquant un prolongement ou un renversement) en fonction du contexte. Les cinq principes sur lesquels se base Narmour sont : la « direction liée au registre », la « différence d’intervalle », le « retour au registre », la « proximité », et la « fermeture ».

De ce fait, Narmour développe ses arguments à partir d’un ensemble d’axiomes de base, presque sous la forme d’une preuve mathématique. Il interprète finalement la mélodie comme un assemblage de structures mélodiques élémentaires pouvant être identifiées à plusieurs niveaux hiérarchiques. Les structures mélodiques individuelles ne comprennent que quelques notes séquentielles et sont supposées émerger d’implications mélodiques déterminées de manière innée. Narmour insiste sur le fait que les principes fondamentaux d’implication qui génèrent une structure mélodique sont déterminés de manière innée et reflètent les lois de la Gestalt. Cette affirmation suggère que le modèle devrait être applicable à toutes les mélodies : tonales occidentales, post-tonales, pré-tonales et non occidentales.

Enfin, le modèle de Narmour a été une source d’inspiration pour plusieurs autres modèles d’attentes musicales qui ont repris en partie les principes sur lesquels il est basé ( Schellenberg et al., 2002²¹⁸ ; Margulis, 2005²¹⁹; Pearce & Wiggins, 2006²²⁰).

4. Application de l’ASA dans la musique

Les principes de l’analyse de scènes auditives ont été utilisés pour l’analyse de la texture musicale, quelles que soient les périodes dans l’histoire de la musique. Comme l’a affirmé Bregman bien que l’organisation de la texture puisse résulter d’un style musical particulier « elle est basée sur l’organisation générale de l’audition ».²²¹ Dans la littérature scientifique, il n’existe que relativement peu de travaux appliquant les principes de l’ASA à la musique. David Huron (1989)²²² a proposé une catégorisation des quatre textures de base en se fondant sur la co-modulation de fréquence (mouvement similaire ou parallèle) et sur la synchronie des attaques. Dans son récent ouvrage, Voice leading, The Science behind a Musical Art. (2016),²²³ nous détaillerons comment Huron a étudié les bases perceptives de la conduite des voix en s’appuyant sur les principes de l’ASA.

4.1. L’analyse de la texture dans Eight Lines de Steve Reich (1983)

Steve Reich a posé les fondements de son esthétique dans son ouvrage de référence Music as Gradual Process (1968)²²⁴ dans lequel il explique ceci : « Je veux pouvoir entendre le processus se produire tout au long du déploiement sonore de la musique. Pour faciliter une écoute d’une grande précision, le processus musical doit être extrêmement progressif. »²²⁵ Il s’agit du premier texte théorique de la musique minimale répétitive dont la critique et les études consacrées à Reich, se sont le plus inspirées :

Je ne veux pas parler du processus de composition, mais plutôt de morceaux de musique qui sont, littéralement, des processus. Le trait pertinent des processus musicaux, c’est qu’ils déterminent simultanément l’ensemble des détails note après note et la totalité de la forme. Ce qui m’intéresse, ce sont les processus que l’on puisse percevoir. Je veux être à même d’entendre un processus dans son déroulement sonore. Pour que l’écoute soit fine et précise, un processus musical devrait se produire très graduellement.²²⁶

Nous utiliserons pour mettre en avant les propos du compositeur, l’œuvre Eight Lines, où la texture et les processus sont singulièrement fusionnés. De plus, Philippe Lalitte souligne le fait que « La texture est l’un des moyens privilégiés par Steve Reich pour manipuler des indices perceptifs afin de créer des fusions ou des ségrégations de flux auditifs, des patterns virtuels, des percepts bistables et des attentes musicales. »²²⁷

Eight Lines a été composée entre 1978 et 1983, et créé par le Steve Reich Ensemble, orchestre exclusivement destiné à sa musique, qu’il a fondé en 1966. Elle a été écrite pour deux quatuors à cordes, deux pianos, deux flûtes et piccolo, deux clarinettes en si bémol et deux clarinettes basses. Cette pièce se compose de procédés canoniques et implique la déconstruction et la reconstruction de motifs répétés.

L’écoute d’une pièce musicale implique des processus perceptifs et des focus attentionnels différents selon l’échelle de temps concernée (locale, intermédiaire ou globale). La texture est l’un des moyens privilégiés par Steve Reich pour manipuler des indices perceptifs afin de créer des fusions ou des ségrégations de flux auditifs, des patterns virtuels, des percepts bistables et des attentes musicales.²²⁸

Philippe Lalitte a proposé une analyse centrée sur l’écriture de la texture chez le compositeur minimaliste américain Steve Reich pour qui le souci d’induire des stratégies d’écoute spécifiques chez l’auditeur est primordial. En accord avec la description de la texture proposée par Bregman, dans l’analyse de scènes auditives²²⁹, Lalitte nous expose une analyse pertinente basée sur trois niveaux hiérarchiques différents :

« Les primitives de la texture à échelle de temps locale »,

« La stratification et échelle de temps intermédiaire »,

« Le regroupement de plusieurs types de textures à une échelle de temps globale ».

Concernant le premier niveau, Reich favorise une ambiguïté perceptive en multipliant les instruments et les timbres identiques, ce qui aboutira à une ambiguïté sur la position des temps forts, et à l’émergence d’un flux auditif dans le registre grave. « À une échelle de temps locale, la texture des primitives est donc conçue pour produire des ambiguïtés perceptives ou des patterns virtuels (non écrits dans la partition) qui offrent à l’auditeur différentes possibilités d’orienter son écoute. »²³⁰ Selon Deutsch, en référence à la règle de proximité de la Gestalt psychologie et aux travaux sur l’ASA de Bregman :

La proximité est une puissante loi d’organisation dans la perception des structures de hauteur des sons. C’est particulièrement vrai pour des séquences de notes présentées à un tempo rapide. Lorsque les notes d’une telle séquence sont issues de registres de hauteurs différentes, l’auditeur perçoit deux lignes mélodiques en parallèle, l’une qui correspond aux notes les plus aiguës, l’autre aux notes les plus graves. Les compositeurs ont fréquemment exploités ce phénomène perceptif.²³¹

C’est pourquoi dans le cas des parties de piano combinées d’Eight Lines, le cerveau tend à regrouper les notes les plus graves des deux parties de piano. (Cf figure ci-dessous, les cellules entourées de pointillés). Ce flux émergeant n’est pas écrit spécifiquement sur la partition, c’est pourquoi nous pouvons parler d’illusions auditives. Nous développerons cette notion dans notre chapitre suivant dédié à ce sujet.

Figure 59: Pianos 1 & 2, altos et violoncelles (chiffre 9), extrait de Philippe Lalitte.²³²

Dans le second niveau hiérarchique, l’échelle temporelle semi-globale correspond à ce que l’on pourrait nommer un « présent perceptif élargi ». Philippe Lalitte fait ici référence au « présent perceptif » défini par Paul Fraisse comme étant un acte mental unifié, indispensable à la perception du successif.²³³ Selon Lalitte, « le procédé de remplacement graduel des silences par des notes se situe dans un temps semi-global qui pourrait correspondre au « présent perceptif élargi ». Ce procédé consiste à ne pas présenter un pattern complet dès son apparition dans la pièce, mais à le construire note après note jusqu’à sa complétude. » Dans cette œuvre, Philippe Lalitte souligne le fait que Reich compose la texture en offrant à l’auditeur différentes possibilités de focalisation auditive. À une échelle temporelle semi-globale, en utilisant des procédés tels que le remplacement des silences par des notes, l’étirement temporel d’accords, les fondues d’entrée et de sortie ou la répétition sans changement d’une mélodie, Reich agit sur le degré de prégnance des patterns qui seront perçus, selon la stratégie d’écoute choisie, comme une figure ou un fond.

Pour finir, dans la troisième partie de cette analyse, au sujet du regroupement de plusieurs types de textures à une échelle de temps globale, selon le compositeur, « le trait sans doute le plus intéressant, cependant, consiste en ce que la transition entre les sections a été rendue aussi peu abrupte que possible, par des chevauchements entre les parties, ce qui fait qu’il est parfois difficile de savoir quand une section finit et quand la suivante commence ».²³⁴ En effet, le fait de délimiter précisément les frontières à l’audition, en raison des chevauchements de sections, se révèle être fort complexe. Philippe Lalitte nous explique que « la transition entre les sections est réalisée avec la technique du fondu d’entrée ou de sortie qui fait progressivement émerger ou disparaître une ou plusieurs strates de la texture. » Ainsi Reich, grâce aux éléments de continuité, de retour, de renouvellement ou de rupture qui jalonnent sa pièce, induit chez l’auditeur des phénomènes d’attente et de tension/relâchement, largement décrit par Leonard Meyer.

4.2. Voice leading, The Science behind a Musical Art de David Huron

Dans Voice leading ²³⁵, David Huron fournit une explication scientifique en démontrant pourquoi certaines textures musicales sont plus convaincantes que d’autres pour l’oreille humaine. En s’appuyant sur les règles de l’analyse de scènes auditives, Huron développe une argumentation convaincante sur les principes fondamentaux du système auditif humain régissant la perception des textures musicales. Les musiciens et les auditeurs doivent pouvoir entendre le mieux possible les voix d’une polyphonie, d’un motet, d’une fugue, d’une symphonie, etc. Une texture claire, avec des parties distinctes, qui ne se masquent pas ou qui ne fusionnent pas facilite la ségrégation des flux auditifs et donc la construction mentale d’une image auditive cohérente. Si un musicien choisit de créer une musique dans laquelle deux ou plusieurs parties ou voix simultanées sont destinées à être perçues distinctement, certaines règles de préférences doivent être observées. Huron souligne que les règles du contrepoint ne se sont pas formées de manière arbitraire, elles correspondent aux principes de l’organisation auditive humaine. Au total, douze principes de l’analyse de scène auditive sont évoqués : tonicité, fusion harmonique, masquage auditif, continuité, proximité de la hauteur, co-modulation de la hauteur, asynchronisme des attaques, densité limitée, différenciation du timbre, localisation de la source, attention et attente.

De plus, Huron a établi 37 règles préférentielles de conduite des voix, parmi lesquelles :

La règle d’étendue : préférer les notes situées entre Mi 1 et Sol 4, centrées autour de Ré 3.

La règle du son soutenu : préférer des sons continus ou en succession serrée, avec peu de longs silences.
La règle d’espacement : préférer un espacement large entre les notes les plus graves d’un accord.
La règle des intervalles parallèles : éviter les unissons, quintes et octaves parallèles.

La règle des attaques asynchrones : préférer des attaques asynchrones entre les voix.

La règle du mouvement conjoint : éviter les grands intervalles.

La règle de préparation oblique : à l’approche d’un unisson, d’une quinte ou d’une octave, il est préférable de conserver la même hauteur dans l’une des voix, etc.

Dans ce livre, Huron revient sur le concept d ’« attention », introduit par l’auteur une décennie plus tôt, pour expliquer comment, parmi de nombreux autres principes de perception, les auditeurs peuvent se concentrer sur différents niveaux de la structure musicale hiérarchique (Huron 2007).²³⁶ Nous reviendrons longuement sur ce concept au cours du chapitre dédié aux émotions.

Par exemple, nous savons que la séparation des sources sonores est l’un des moyens les plus efficaces d’améliorer la ségrégation des flux (Divenyi et Oliver 1989)²³⁷. Bien que ce principe soit assez évident dans les œuvres électroacoustiques, il a été beaucoup moins exploré dans les périodes précédentes, à l’exception remarquable des œuvres antiphonales de Giovanni Gabrieli. Le terme de « Cori Spezzati », littéralement « chœurs rompus », était utilisé pour décrire la division des effectifs utilisés (voix et/ou instruments) et la séparation dans l’espace des groupes qui en résultent. Cet effet antiphonal est caractérisé par un aller-retour alternatif du son, d’un bout à l’autre de la pièce, ou d’un haut-parleur à l’autre sur une chaîne stéréo. Dans la Venise de la fin du XVIᵉ et du début du XVIIᵉ siècle, Giovanni Gabrieli a largement utilisé cet effet en divisant le chœur en deux afin de créer une sorte de polychoralité. Cette disposition s’est répandue après la publication des « Salmi spezzati » d’Adrien Willaert (1550) dont les deux groupes étaient installés dans les deux tribunes d’orgue de la basilique Saint-Marc à Venise. Pour des raisons pratiques, Huron développe ce principe en soulignant le fait que les musiciens ont besoin d’un bon retour visuel et auditif pour pouvoir jouer ensemble.

Ainsi, Voice leading permet de créer des outils d’analyse et de conception de scènes musicales allant au-delà des règles de la musique instrumentale occidentale canonique. Les œuvres de Tristan Murail (Gondwana et L’esprit des Dunes) en sont des exemples typiques.²³⁸ Ces œuvres bénéficient en particulier d’une analyse de la musique fondée sur la perception et une analyse de la texture où la ségrégation des flux est révélée grâce à un renouvellement de l’espace sonore. Dans Gondwana (1980, pour grand orchestre), Murail s’appuie sur le modèle de la synthèse par modulation de fréquence, inventé par le compositeur John Chowning, « pour constituer des champs harmoniques et développer des processus d’interpolation entre divers spectres instrumentaux. »²³⁹ L’idée principale est de transformer un son de cloche en un son de trombone. Dans L’esprit des Dunes (1993-94) pour onze instruments et sons de synthèse, Philippe Lalitte nous relate le fait qu’une « grande part de la magie qui émane de L’Esprit des dunes provient de ces illusions sonores qu’a su distiller Murail au sein de sa partition. On croit entendre des sons réels – le vent, la tempête, des voix -, mais ce ne sont que des mirages, des sons entièrement synthétisés dont l’ambiguïté ne fait que renforcer l’impression de mystère. »²⁴⁰

4.3. Le monde du studio d’enregistrement

Dans une tout autre perspective, les principes de l’ASA peuvent être appliqués aux techniques de l’enregistrement musical. Par exemple, une des techniques importantes utilisées par l’ingénieur du son est l’emplacement spatial des nombreuses pistes enregistrées dans deux, trois, ou plusieurs haut-parleurs espacés. L’un des aspects de l’art du mixage consiste à décider quelles pistes enregistrées seront mélangées dans le même haut-parleur, ou seront séparées en plusieurs haut-parleurs, etc. Les solutions sont multiples. Dans cette perspective, Woszczyk et Bregman (2005)²⁴¹ nous explique qu’il serait normal de postuler qu’en mélangeant deux sons A et B, dans le même haut-parleur ou dans tous les haut-parleurs, ils se mélangeront aisément et si on désire les mélanger dans des haut-parleurs séparés, ils seront perçus comme plus distincts. Cependant, séparer deux sons stables dans l’espace ne les rend pas plus faciles à séparer. La séparation spatiale semble fonctionner en accentuant la ségrégation qui repose sur d’autres différences entre les sons. De façon judicieuse, leurs attaques ne se chevauchent pas exactement dans le temps, leurs hauteurs ne changent généralement pas en parallèle. Par conséquent, Bregman et Woszczyk soulignent le fait que l’ingénieur du son peut utiliser efficacement les différences spatiales pour séparer les signaux, en particulier lorsqu’ils diffèrent par leurs caractéristiques temporelles et lorsque leur différence de distance ou de séparation angulaire est grande.

Dans le quatrième chapitre sur le filtrage et l’équalisation, ces chercheurs mettent en avant que :

Le groupement séquentiel des sons est affecté par leurs timbres : cela signifie que l’oreille pourra plus facilement suivre le même instrument ou la même voix au fil du temps si son timbre est unique. Le timbre peut affecter la perception de deux manières : (a) en fournissant des fonctionnalités que l’auditeur peut suivre volontairement dans le temps; et (b) en influençant le regroupement automatique des sons dans une séquence. Il n’est pas du tout certain que chaque fonctionnalité autorisant le suivi volontaire constitue également une base pour le groupement séquentiel automatique.²⁴²

Chaque instrument musical a une structure de formant distincte, qui lui fournit une « signature auditive » pouvant être suivie dans le temps. Cependant, la structure transitoire (début et décalage) ainsi que l’enveloppe dynamique et les fluctuations sont également très importantes pour l’identification et le suivi d’une source sonore. De plus, la « luminosité », la « netteté » et la « rugosité » sont des caractéristiques d’identification essentielles. L’utilisation de filtres et d’égaliseurs peuvent jouer un rôle dans l’accentuation des différences de luminosité et peuvent modifier l’équilibre spectral des formants et des transitoires.

Dans le cas de la synchronisation temporelle (chapitre 5)²⁴³, Woszczyk et Bregman parle de l’intérêt de l’utilisation de « l’effet rubato » où l’ingénieur du son peut décaler dans le temps certaines pistes par rapport à d’autres. Par exemple, retarder ou avancer une piste par rapport aux autres pendant la post-production peut être utilisé pour synchroniser des pistes enregistrées sans synchronisation avec d’autres. Cela peut augmenter l’intégration perceptuelle du groupe d’instruments lorsque cela est souhaité notamment. Les auteurs ont l’espoir que les recherches dans ce domaine aideront les ingénieurs du son à améliorer leur technicité.

Nous avions déjà abordé la question de l’enregistrement musical dans notre chapitre précédent, avec entre autre le modèle de la Sound Box d’Allan Moore, et l’analyse de la texture chez Zak et Moylan où les principes de groupement chez Bregman et McAdams (1979)²⁴⁴ ont été repris dans leurs travaux. Dans son ouvrage Understanding and Crafting the Mix : The Art of Recording²⁴⁵, William Moylan nous expose sa conception du son et de l’enregistrement en se focalisant dès le début sur la nature acoustique du son et de ses différents paramètres physiques. Il poursuit en décrivant comment notre système auditif transforme ce son lors de l’écoute et quelles sont les implications pour notre perception. Dans son troisième chapitre, il est question de forme et de structure musicale, d’organisation et de hiérarchie sonore. En s’inspirant de la théorie de l’analyse de scène auditive de Bregman, Moylan met particulièrement en avant les caractéristiques timbrales, qu’il nomme « sound quality », car selon lui, elles peuvent déterminer si une source sonore pourra se détacher des autres ou au contraire se fondre dans un ensemble. Il a recours à des modes de transcription alternatifs qui reflètent concrètement les préoccupations d’un créateur de musique pop. Pour l’étude des timbres et des textures, Moylan avait déjà exposé cette méthode d’analyse dans The Art of Record Production en 1992.²⁴⁶ Cet ouvrage propose un cadre de référence et un vocabulaire qui décrit les principaux paramètres considérés dans la production de musiques populaires enregistrées tels que les caractéristiques de l’espace, le contour, l’enveloppe spectrale et l’intensité. Sa démonstration est appuyée par une série de graphiques décrivant ces paramètres à partir de la manière dont l’auditeur ou le créateur devrait les percevoir. Voici un graphique illustrant la perception des distances fréquentielles pour chaque strate sonore de la pièce « A Day in the Life » :

Figure 60: Évaluation des distances des strates sonores de la pièce A Day in the Life des Beatles — Figure 60: Évaluation des distances des strates sonores de la pièce *A Day in the Life* des Beatles

Un autre psycho-acousticien William Yost a fourni une liste similaire en décrivant ces indices de fusion : la séparation spectrale, le profil spectral, l’harmonicité, la séparation temporelle, la synchronisation des attaques et des chutes ainsi que les modulations d’amplitude et de fréquence.²⁴⁷

5. Texture, ASA et illusion auditive

« La vie a besoin d’illusions, c’est-à-dire de non-vérités tenues pour des vérités. » Friedrich Nietzsche (1844-1900), Le livre du philosophe.

Notre connaissance du monde est façonnée par nos sens qui nous renseignent sur notre environnement. Mais nos sens peuvent être trompés. La question des illusions est au cœur de l’approche occidentale depuis l’antiquité. Les illusions auditives ont commencé à susciter l’intérêt des communautés scientifiques et musicales, essentiellement à partir de la seconde moitié du XXème siècle. Par définition, « la perception est une interaction de l’information extraite du monde par les sens avec des connaissances déjà acquises sur ce monde. Lorsque ces deux types d’informations ne coïncident pas, une illusion perceptive en résulte. »²⁴⁸ Au tout début des années cinquante, les recherches de George Miller et Joseph Licklider²⁴⁹, de Richard Warren²⁵⁰ ont mis en évidence les phénomènes de nature illusoire, notamment les effets de continuité et de complétion ou l’effet « Picket Fence ».

Figure 61: Illustration de l’effet de continuité.

Par exemple pour illustrer l’effet de continuité, lorsqu’un son pur est coupé par un ou plusieurs silences, il sera logiquement perçu comme interrompu. Par contre, lorsque des bruits d’intensité supérieure à celle du son pur remplacent le silence, le son semble ne pas s’interrompre (a) et l’alternance de sons purs et de bruits brefs génère le même effet (b). Et lorsque le son pur se poursuit pendant le bruit et s’arrête en même temps que lui, le son pur paraît s’arrêter quand le bruit commence (c).

En 1957, la naissance de la synthèse sonore par ordinateur sous l’impulsion de Max Mathews²⁵¹ marque un tournant capital dans l’histoire des illusions auditives.²⁵² Le premier programme de synthèse Music III (1959) est réalisé par une équipe de la Division Recherche de la Bell Telephone Laboratories dirigée par Mathews, dont fait partie le compositeur Jean-Claude Risset : l’informatique musical est née. Cette synthèse par ordinateur donne l’accès au « son organisé » dont Edgar Varèse rêvait depuis le début du XXème siècle. Au demeurant, le compositeur s’est véritablement passionné pour ces travaux.

Il nous semble important de mentionner une œuvre singulière de Varèse, Poème électronique (1958), quelquefois nommée L’homme et la machine, même si elle a été totalement conçue de manière analogique (magnétophone) et non pas avec des ordinateurs. Varèse utilisa des voix, des cloches, de l’orgue, un ensemble de free jazz (avec Charlie Mingus, Teo Macero, etc.) ainsi que des sons électroniques à travers une série de filtres, modulateurs en anneau, distorsions, fondus et diverses manipulations de la bande magnétique telles que mises à l’envers et changements de vitesse. Cette pièce musicale a été composée pour le spectacle « lumière, couleur, rythme, son, image » conçu par Le Corbusier et Xenakis (en tant qu’architecte) dans le cadre de la construction du Pavillon Philips à l’exposition universelle de Bruxelles en 1958. Théoriquement divisé en sept séquences, l’ouvrage place le spectateur au centre d’émotions et de sensations visuelles, fruit d’une collaboration fructueuse entre photographes, cinéastes, éclairagistes, tandis que l’électroacoustique permettait à Varèse de déclencher une composition sonore et mobile conçue en fonction de l’espace. Il fut composé en 3 pistes, et spécialement conçu pour le lieu où il devait être joué sur 450 haut-parleurs. Grâce à la synthèse sonore, explique Jean-Claude Risset, il est devenu possible de « faire surgir des illusions en construisant des structures sonores spécialement conçues pour faire jouer certains mécanismes perceptifs ».²⁵³ De même, Ligeti s’est passionné pour la musique-machine. Avec des œuvres comme Poème symphonique pour 100 métronomes et Continuum pour clavecin, Ligeti a créé des illusions auditives. Joseph Delaplace nous relate que « l’utilisation des mécanismes qui se détraquent […] montre l’importance que revêt pour Ligeti la question d’une musique- machine ».²⁵⁴ Lorsque Ligeti compose Poème symphonique pour 100 métronomes en 1962, Pierre Michel nous explique que « les décalages et transformations dus à la superposition de différents tempi, ainsi que les illusions d’accélération et de ralentissement qui en résultent auront une influence capitale sur la conception rythmique de certaines œuvres ultérieures. »²⁵⁵ Dans Continuum pour clavecin, crée en 1968, Ligeti joue délibérément sur ces trompe-l’oreille en proposant une organisation perceptive basée sur la ségrégation des flux auditifs.²⁵⁶ Cette œuvre a fait l’objet de nombreuses analyses : nous pensons tout particulièrement à celle d’ Emilios Cambouropoulos et Costas Tsougras²⁵⁷ et à celle de Douglas, Noble et McAdams²⁵⁸, plus récente, basées sur les principes de l’ASA de Bregman. Ces principes nous semblent un point d’entrée fondamental pour une analyse approfondie de la texture musicale et pour comprendre la façon dont l’auditeur la perçoit. Le fait d’utiliser une seule valeur rythmique répétée régulièrement à un tempo extrêmement rapide permet à Ligeti d’opérer des subtils changements de hauteurs de manière imprévisible, brisant cette régularité rythmique initiale. En s’appuyant sur les recherches de son temps en psycho-acoustique, Ligeti postulait que pour qu’une succession de notes jouées au clavecin soit perçue comme un continuum sonore, le nombre de notes devait être de 18 par seconde.²⁵⁹

Selon Douglas et al., d’autres facteurs entrent en ligne de compte dans la perception de ce continuum. Le taux d’attaque requis pour la perception de la masse sonore n’est pas une valeur absolue, comme cela a été suggéré par le compositeur lui-même. Il interagit avec d’autres facteurs musicaux et psychoacoustiques tels que la durée, le registre, le timbre et l’organisation musicale. La structure de la hauteur et le contexte subjectif semblent également pertinents, comme le laissaient prévoir les principes de l’analyse de scène auditive.

Ce processus compositionnel produit de magnifiques illusions auditives. Pressnitzer, Suied et Shamma (2001)²⁶⁰ ont également abordé la question de l’illusion auditive dans la musique chez Ligeti. Ils ont appliqué un modèle de calcul de l’ASA (modèle de cohérence) inspiré de la neurophysiologie du système auditif afin de comparer le degré de cohérence temporelle dans deux extraits de pièces d’orchestre de Ligeti : Lontano (1967) et San Francisco Polyphony (1973-1974) Ligeti disait lui-même : « Oui, c’est vrai, je travaille souvent avec les illusions acoustiques, très analogues aux illusions d’optique, à de fausses perspectives, etc. Nous ne connaissons pas très bien les illusions acoustiques. Mais elles sont très analogues et on peut faire des choses très intéressantes dans ce domaine. »²⁶¹

Ces phénomènes sonores insolites ont beaucoup fasciné les compositeurs, qui ont cherché à les imiter avant de les placer, pour certains d’entre eux, au cœur même de leur démarche compositionnelle. Ainsi, la synthèse numérique a permis l’invention de sons très particuliers donnant lieu à des illusions acoustiques, comme les mouvements illusoires des sources sonores de John Chowning (1971)²⁶² , la gamme chromatique perpétuelle de Roger N. Shepard (1964)²⁶³ , les accélérations perpétuelles de Kenneth Knowlton (1964)²⁶⁴ ou encore les glissandi infinis ou paradoxaux de Jean-Claude Risset.²⁶⁵ Le scientifique américain Shepard réalise un équivalent auditif à l’escalier perpétuel de Penrose (cf. figure ci-après).²⁶⁶ Ce procédé s’appuie sur la synthèse préalable par ordinateur des « Shepard tones », des sons périodiques complexes qui résultent de l’addition de signaux sinusoïdaux de même intensité, séparés par des intervalles d’octave. La structure spectrale correspond à un empilement d’octaves, « ce qui a pour effet de rendre la tessiture de chaque son ambiguë (il est difficile d’estimer à quelle octave se situe la note).²⁶⁷ Quand plusieurs sons se succèdent pour former les degrés d’une gamme ascendante ou descendante, et si nous la répétons plusieurs fois, nous obtenons alors l’illusion d’un mouvement perpétuellement ascendant ou descendant.

Figure 62 : Sonagramme d’une gamme de Shepard (échelle des fréquences linéaires). — Figure 62 : Sonagramme d’*une gamme de Shepard* (échelle des fréquences linéaires).²⁶⁸

Figure 63 : L’escalier de Penrose (Deutsch, 2010). — Figure 63 : *L’escalier de Penrose* (Deutsch, 2010).²⁶⁹

Quant à Jean-Claude Risset, il a réussi à le transcrire dans le domaine rythmique en s’inspirant des travaux de Kenneth Knowlton.²⁷⁰ Le compositeur nous éclaire sur ce processus de synthèse sonore :

Dans le processus de synthèse, on est à la source des choses : on peut composer les timbres comme des accords ; on peut transformer intimement les sons de synthèse en modifiant l’évolution dans le temps de leurs composantes. On peut ainsi orienter à son gré l’écoute vers une appréhension fusionnée, focalisée, globale, synthétique, ou au contraire dissociée, distribuée, locale, analytique. On peut fondre des objets sonores en textures fluides, strier ou lisser le temps, plonger dans les profondeurs du timbre dissocié par l’asynchronie temporelle comme la lumière blanche est dispersée par le prisme, et le scinder en constituants élémentaires qui s’allient en mélodie et harmonie.²⁷¹

Les paradoxes sonores créés par Jean-Claude Risset s’inscrivent dans une réelle nécessité esthétique. La réalisation de sons hybrides comme dans son œuvre Sud (1985) par exemple, lui permet de faire cohabiter des oiseaux de métal à côté de grillons de bois.

Figure 64 : Jean-Claude Risset dans un laboratoire de la compagnie Bell en train de suivre une composition pour trompette d’Henry Purcell interprété par un ordinateur. Crédit : Hulton Deutsch.

En 1972, le compositeur et théoricien John Chowning a fait sensation avec son œuvre Turenas et ses impressionants mouvements sonores illusoires, entièrement réalisée par ordinateur avec le programme Music IV de Max Mathews. Turenas est une pierre angulaire de la musique cinétique.

Figure 65: Turenas (1972) : pièce pour bande quatre pistes réalisée sur ordinateur. — Figure 65: *Turenas* (1972) : pièce pour bande quatre pistes réalisée sur ordinateur.

L’œuvre musicale de John Chowning ne peut être séparée de ses recherches sur la localisation et le mouvement des sons dans l’espace.²⁷² Il a utilisé la synthèse des sons par ordinateur, afin de produire des illusions de sons en mouvement très efficaces : rapprocher ou éloigner des sources sonores, les déplacer de droite à gauche, de haut en bas, leur faire remplir une pièce. Des sources individuelles peuvent tourbillonner au-dessus de la tête. Pour cela, certains effets, comme la simulation de l’effet Doppler (léger changement de fréquence lié au mouvement des sources) seront exploités.

Dans son avant-propos à l’ouvrage collectif La spatialisation des musiques électroacoustiques, John Chowning souligne son intérêt conjoint pour la création sonore et la conception d’espaces électroacoustiques : « j’étais convaincu que le contexte spatial du son est tout aussi important que le son lui-même, on entend le son, mais on sent aussi l’espace ».²⁷³

Dans cette période de foisonnement intellectuel, Bregman débute ses recherches sur l’analyse de scènes auditives. Peu de temps après, en 1974, Diana Deutsch découvre une illusion spatiale surprenante : l’illusion d’octave.²⁷⁴ Pour obtenir cela, elle propose l’alternance à plusieurs reprises de 2 tons séparés par une octave, de telle sorte que lorsque l’oreille droite reçoit la tonalité aiguë, l’oreille gauche reçoit la tonalité grave, et vice versa. Diana Deutsch a constaté dans ses expériences que la perception de ce phénomène varie selon les individus : en général, les gauchers et droitiers n’entendent pas la même chose. Puis en 1979, Les illusions auditives seront même référencées pour la première fois dans l’Encyclopaedia universalis, dans un célèbre article réalisé par David Wessel et Jean-Claude Risset.²⁷⁵ Ils dénombrent 6 grandes catégories afin de décrire au mieux ce phénomène : la restitution perceptive des sons, la polyphonie à une seule voix, les paradoxes liés à la dissociation de la hauteur sonore, les paradoxes de rythmes, l’intégration auditive et la localisation auditive.

Il nous semble intéressant de clore ce chapitre sur les illusions auditives en prenant pour exemple un phénomène acoustique singulier issu d’un chant religieux polyphonique du nord de la Sardaigne, principalement à Castelsardo : celui de la quintina. Littéralement « la petite quinte » est un terme générique utilisé pour désigner toute fusion d’harmoniques dans la partie aiguë du spectre. Contrairement à ce que le mot laisse supposer, elle n’est pas nécessairement en relation de quinte avec l’une ou l’autre des voix qui la produisent. La quintina consiste en l’apparition, au sein d’un chœur d’hommes (appelés du grave vers l’aigu : bassu, contra, bogi, falzittu) d’une cinquième voix aiguë qui se situe à l’octave supérieure de la voix principale, celle à laquelle est confié le cantus firmus (Fig. 66).

Figure 66: Spectrogramme et transcription d'un extrait du Miserere Dietro l’Altare enregistré par Bernard Lortat-Jacob (1996/1998) à Castelsardo. — Figure 66: Spectrogramme et transcription d’un extrait du *Miserere Dietro l’Altare* enregistré par Bernard Lortat-Jacob (1996/1998) à Castelsardo.

Cette technique vocale est de tradition orale, transmise depuis des générations. Ce chant qui scande les temps forts de la vie collective (funérailles, fêtes religieuses et patronales) trouve son apogée et sa plus belle manifestation dans les rituels de la Semaine sainte. Cette voix quasi féminine qui naît des quatre voix masculines prend alors dans le contexte dramatique de la « Passion », un sens singulier : « la voix de la vierge » est entendu, dit-on sur place à ce sujet.²⁷⁶

Selon Stephen McAdams, la perception de cette cinquième voix est construite de toute pièce par notre cerveau car elle n’est pas une simple source sonore, elle est tributaire d’un « patron acoustique correspondant à nos connaissances catégorielles des registres vocaux. »²⁷⁷

Cela suppose de la part des chanteurs une grande maîtrise vocale afin que la quintina émerge, notamment la justesse spectrale de la voix qui cherche la consonance de l’accord en concordance avec les harmoniques de la fondamentale, la qualité du répertoire musical liturgique et de l’écriture (technique de faux-bourdon, octave, quinte et quarte), la transformation de la couleur vocalique par l’altération des voyelles du texte chanté afin de privilégier certains formants du spectre harmonique, ainsi que la puissance sonore de la voix dans un espace réverbérant. Bernard Lortat-Jacob, ethnomusicologue et chercheur au CNRS, a analysé les spécificités du chant choral de ces chanteurs sardes de la Confraternità de Castelsardo dans le très bel ouvrage Chant de passion, au cœur d’une confrérie de Sardaigne.²⁷⁸

Figure 67: photo de Bernard Lortat-Jacob.

Bernard Lortat-Jacob explique :

Pour que le phénomène se produise les chanteurs doivent satisfaire à une double exigence : une parfaite intonation (fusion harmonique) et un ajustement précis des voyelles. Seuls quatre chanteurs très avertis, en interaction étroite, capables de s’écouter tout en percevant le résultat d’ensemble peuvent parvenir à une telle perfection, et donner naissance à la mystérieuse quintina.²⁷⁹

6. Texture et émotions

« L’émotion étant le but de toute bonne musique […], je me suis donc attaché avec une application et des efforts non négligeables à le retrouver ».

Claudio Monteverdi.²⁸⁰

6.1. La musique, qu’est-ce que ça nous fait ?

Depuis l’antiquité, les relations entre musique et émotion sont constamment étudiées par une multitude d’auteurs provenant de disciplines très diverses : musicologues, philosophes, sociologues, psychologues, écrivains, historiens, etc. Dans le remarquable ouvrage de Francis Wolff, « Pourquoi la musique ? », le philosophe nous renseigne sur ce que la musique nous fait, en proposant une analyse approfondie, conceptuelle et argumentée sur ce sujet.²⁸¹ En s’introduisant par tous les pores de notre peau, la musique nous fait vibrer. Elle nous agite, nous secoue, nous soulève : « Le son vient d’un corps qui vibre, et lorsque l’onde nous en parvient, elle fait vibrer le nôtre. Les deux corps entrent en sympathie. La musique tient d’abord de ce corps à corps. »²⁸² Distinguant pulsation, mesure et rythme, Wolff analyse avec beaucoup d’intelligence et de finesse, le rythme du discours musical qui contrarie la mesure en nous : « notre attente de l’accent sur le temps fort de « notre » mesure est déjouée par la musique elle-même qui accentue le temps faible. »²⁸³ Pour Eduard Hanslick, à la moitié du XIX^ème siècle, « la forme, par opposition au sentiment, est le vrai contenu, le vrai fond de la musique, elle est la musique même : le sentiment provoqué en nous on ne peut l’appeler ni forme ni fond, il n’est qu’un effet, qu’une résultante ».²⁸⁴ Alors que pour Schopenhauer, la musique rejoint l’âme avec le langage universel du sentiment, en exprimant non un sentiment particulier et déterminé mais l’essence d’un sentiment : la joie, la douleur, etc., une véritable « métaphysique de la musique » en somme. La position d’Hanslick ou de Schopenhauer donne finalement la même place centrale à l’émotion : soit pour l’éviter et rejoindre la forme musicale pure soit, au contraire, pour en souligner l’importance.

Ainsi, probablement de par sa nature répétitive, la musique a servi de support privilégié à de nombreuses études en psychologie cognitive avec un focus particulier sur les attentes de l’individu (Bissell, 1921, Meyer, 1956, Narmour, 1990, Eerola²⁸⁵, 2003, Huron, 2006). Francis Wolff souligne également qu’une grande partie du plaisir musical réside dans la répétition :

La musique est une affaire de répétition, c’est là sa caractéristique la plus constante et la plus propre. Une chanson, c’est souvent un refrain qui revient à l’identique entre les couplets, et les couplets se répètent tous sur le même air. De là la forme rondo B-A-C-A-D-A, etc. Et puis il y a la ritournelle. « Encore ! Encore ! » exige l’enfant. Dans la forme sonate, on expose au début et on réexpose à la fin du mouvement. On répète ou on varie, on imite, on module, que ce soit dans le contrepoint ou dans l’écriture harmonique.²⁸⁶

En général, les études citées précédemment, traitent des attentes suscitées par la musique comme une source de significations et d’émotions chez l’auditeur. En 1921, Arthur Dart Bissel écrivait déjà ceci :

[…] la musique possède un grand avantage sur tous les autres arts – à l’exception possible de la danse – en ce qui concerne la question de l’attente dans sa position unique en ce qui concerne la répétition. Les autres arts admettent la répétition (la danse en particulier), mais la musique l’exige ; elle [la répétition] entre dans la musique comme un facteur essentiel.²⁸⁷

La théorie proposée par Meyer en 1956 est certainement l’étude sur les attentes la plus citée. Elle est devenue une référence incontournable. D’ailleurs, David Huron et Elizabeth Hellmuth Margulis écrivent à ce propos que « Meyer a été bien en avance sur son temps en intégrant les aspects cognitifs et affectifs du fonctionnement mental. En attirant l’attention sur la notion d’attente, il a anticipé d’un demi-siècle les conclusions de la neuroscience cognitive. »²⁸⁸

Etant donné l’immensité des recherches existantes autour de l’émotion en psychologie cognitive et sachant que ce n’est pas le cœur de notre sujet, nous ne pourrons malencontreusement pas être exhaustifs à ce propos. Nous présenterons néanmoins un cours chapitre sur la définition de l’émotion chez les psychologues ainsi que son lien avec le langage musical. Notre objectif n’est pas de faire une synthèse de tout ce que nous savons aujourd’hui des émotions musicales, mais bien de présenter les théories principales dans ce domaine en lien avec la texture. Nous nous servirons pour cela du brillant ouvrage de David Huron, Sweet Anticipation (2006)²⁸⁹ et de l’ouvrage de référence de Meyer largement cité, Emotion et Signification en Musique.²⁹⁰

6.2. Définition de l’émotion musicale

La musique est un stimuli particulièrement puissant. Elle pénètre dans notre corps par les voies auditives et nous sommes tout simplement obligés de donner du sens à ce signal sonore. Cette interprétation se fait à une vitesse extrêmement importante : 500 millièmes de seconde suffisent pour identifier la valence d’un extrait musical (par exemple Vieillard, Peretz, Gosselin, Khalfa, Gagnon et al., 2008).²⁹¹ Et chez Bigand et collaborateurs (2005)²⁹² seulement 250 ms d’un stimuli sonore suffit à notre cerveau pour se synchroniser. Le terme d’« émotion », pour les psychologues, correspond à:

[…] une très brève mais intense réaction affective qui implique généralement un certain nombre de sous-composantes – sentiment subjectif, l’excitation physiologique, l’expression, l’action et tendance, et la régulation – qui sont plus ou moins « synchronisées ». Les émotions se concentrent sur des « objets » spécifiques et durent de quelques minutes à plusieurs heures (par exemple le bonheur, la tristesse).²⁹³

Avec l’émotion et le comportement, l’émotion est l’un des concepts clés de la psychologie expérimentale, car les principales émotions comme la colère, la peur, le bonheur ou encore la tristesse guident et dynamisent les comportements humains dans des situations de vie cruciales. La théorie de Darwin est l’une des premières à avoir posé les bases scientifiques des émotions. Selon l’auteur, elles sont d’une grande utilité pour assurer la survie des individus et les divers aspects expressifs et biologiques des émotions sont indissociables. Pour cela, Darwin a sélectionné huit émotions fondamentales : la tristesse, la joie, la colère, la peur, le dégoût, la honte, le mépris et la surprise.²⁹⁴ A sa suite, les psychologues de la musique se sont notamment appuyés sur les travaux d’Ekman (1980) portant pareillement sur les émotions dites de base que sont la joie, la tristesse, la colère et la peur.²⁹⁵ Tout comme Darwin, ce dernier a en effet démontré qu’il était possible de corréler ces émotions avec des indices faciaux de manière universelle.

Le modèle de Plutchik est également intéressant d’être mentionné : il a abordé le problème d’analogie avec les couleurs en proposant un dictionnaire d’émotions similaires au dictionnaire de couleurs.²⁹⁶

Figure 68: Modèle du *Circumplex* de Plutchik en trois dimensions (en haut à gauche), en dessous à droite en deux dimensions.

De ce fait, tout comme il existe des couleurs primaires et des nuances de celles-ci variant en intensité et constituant le spectre des couleurs, il existerait des émotions primaires et des nuances qui varieraient en intensité. Ce qui aboutitait à des combinaisons possibles entre certaines émotions de base. Ce modèle est défini par le circumplex ci-dessus qui représente un modèle multidimensionnel basé sur des émotions primaires de base dont vont découler des émotions secondaires. Plutchik considère qu’il existe huit émotions de base faites de 4 paires opposées : joie-tristesse, acceptation-dégoût, peur-colère, surprise et anticipation.

De même, plus récemment, dans l’article de Nathalie Fernando et al. (2014), ces chercheurs ont souligné que « la catégorisation de ces émotions repose sur le postulat d’un substrat biologique commun relevant de l’innéité, et sur la différenciation des comportements physiologiques qu’elles engendrent. »²⁹⁷ Les nombreux travaux de Panksepp²⁹⁸(1995-1998)²⁹⁹ et de Peretz (2010)³⁰⁰ y font également références.

6.3. L’émotion dans le langage musical

« La musique est une structure sonore composée qui met en œuvre des systèmes complexes de relations entre les signaux acoustiques. Pour de nombreux auteurs, ces systèmes de relations, plus encore que les propriétés immanentes des sons, sont porteurs d’expression et d’émotion. »³⁰¹ La musique n’est pas seulement destinée au divertissement et au plaisir, mais elle a été utilisée à diverses fins en raison de ses effets sociaux et physiologiques. Nous savons par exemple que la musique agit sur les composantes neurophysiologiques associées à l’état de stress en diminuant le taux de cortisol sécrété par les glandes salivaires. Et, ces effets sont présents dès les premiers stades du développement.³⁰² David Huron souligne que, les fonctions prééminentes de la musique étant sociales et psychologiques, la caractérisation la plus utile serait basée sur quatre types d’informations : le style, l’émotion, le genre et la similitude.³⁰³ Pour Isabelle Peretz, c’est la fonction première de la musique que de renforcer la cohésion sociale³⁰⁴ : « la musique répond à un besoin biologique : un besoin d’appartenance. L’humain est une espèce éminemment sociale. Pour préserver ce trait, elle aurait conservé, dans une petite partie de son cerveau, la musique comme moyen unificateur. Encore plus qu’à communiquer, la musique sert à communier ».³⁰⁵

Rappelons que « le cerveau humain et le reste du corps constituent un organisme dont la cohésion est assurée par des circuits biochimiques et neurorégulateurs mutuellement interactifs, et soulignant l’indissociabilité du corps et de l’esprit »³⁰⁶, Damasio écrit : « La perception des émotions est à la base de ce que les êtres humains appellent, depuis des millénaires, l’âme ou l’esprit » (Damasio, 1995).³⁰⁷

Ainsi, la musique interfère dans nos émotions et provoque dans notre cerveau une sorte de « chorégraphie de neurotransmetteurs », comme l’appelle Daniel Levitin. « La satisfaction et le plaisir liés à la musique découlent de l’augmentation de la dopamine dans le noyau accumbens, à laquelle participe le cervelet en régulant les émotions grâce à ses connexions avec le lobe frontal et le système limbique »³⁰⁸ Cet effet est fortement lié au plaisir éprouvé et corrélé à la sensation de « frisson musical ».³⁰⁹

Le musicologue Léonard Meyer a beaucoup travaillé autour du lien unissant les émotions à la syntaxe musicale. Selon lui, l’émotion se produit lorsqu’une tendance à répondre est provisoirement arrêtée, bloquée ou détournée. Meyer considérait notamment que les émotions en musique étaient provoquées par la façon dont les pièces musicales manipulent les attentes des auditeurs, en lien, comme nous l’avons souligné précédemment, avec les travaux de l’école de la Gestalt. Il considérait les attentes des auditeurs comme étant au centre de l’expérience musicale. Finalement, l’auditeur est amené à se soucier du quoi et du quand (Imberty, 1969³¹⁰; Bharucha, 1987³¹¹; Huron, 2006³¹²). Rappelons que Meyer écrivait à une époque où la recherche sur la cognition musicale était inexistante. Mais depuis de très nombreuses études théoriques et expérimentales se sont intéressées aux attentes musicales, comme celles de Narmour et d’Huron notamment. Le philosophe Schopenhauer « insistait longuement sur le fait qu’un certain type d’émotions spécifiquement musicales peut naître de la beauté formelle, de la dynamique des intensités, du jeu des tensions et des détentes, des attentes et des résolutions. »³¹³ Il insistait sur le fait « qu’une série de purs accords serait fastidieuse, fatigante et vide », que « la musique consiste toujours dans la perpétuelle succession d’accords qui nous troublent plus ou moins, c’est-à-dire qui excitent nos désirs, et d’accords qui nous apportent plus ou moins de calme et de contentement ».³¹⁴ De plus, Michel Imberty en prolongeant la pensée de Bachelard issue de La dialectique de la durée, affirme avec lui que « L’action musicale est discontinue ; c’est notre résonance sentimentale qui lui apporte la continuité ».³¹⁵

La perception de la continuité de la durée musicale ne se réduit pas aux seuls mécanismes cognitifs qui permettent au musicien d’organiser et de mémoriser l’œuvre lors de l’écoute ou de l’exécution : au-delà, il y a aussi une intuition initiale, une émotion personnelle qui vient donner à l’ensemble une unité, une continuité, un « mouvement », un sens, quelque chose qui n’est plus de l’ordre de la cognition abstraite […] ».³¹⁶

Un mot ou une note musicale apparaît rarement seul, mais dans un contexte précis : une phrase ou une mélodie. Le contexte donne des informations essentielles qui permettent à l’auditeur de développer des attentes perceptives sur les évènements sonores à venir. Lors de l’écoute, les connaissances musicales implicites de l’auditeur guident la perception musicale via le développement d’attentes musicales (Tillmann, 2008).³¹⁷ Si l’on compare avec le langage, les connaissances syntaxiques et sémantiques permettent également le développement d’attentes qui guident la compréhension. Cette attention particulière portée à l’écoute se retrouvera par la suite, et jusqu’à aujourd’hui, dans des nombreuses approches analytiques, comme celle d’Eric Clarke.³¹⁸ Dans Ways of Listening, il propose une approche écologique de l’écoute où la notion d’attente décrite par Meyer est également traitée. Pour Clarke, l’acte d’écoute est la clé de sa théorie de la signification musicale, contrairement à la sémiotique de Kofi Agawu³¹⁹ ou à l’herméneutique de Lawrence Kramer.³²⁰ Mais dans le même temps, cette théorie de la perception ne repose pas uniquement sur la hiérarchie de traitement ascendant soulignée par la plupart des théories sur la cognition musicale telles que Narmour³²¹ (1999) et Temperley³²² (2001). Comme l’explique Clarke, « la perception doit être comprise comme une relation entre des informations disponibles sur l’environnement et les capacités, les sensibilités et les intérêts d’un observateur. »³²³ Avec David Huron, soulignons le fait que la valence émotionnelle de la musique dépend de trois types de traits : les traits de la performance liés à l’identité et l’habileté de celui qui produit le message musical, les traits de l’écoute qui dépendent de l’identité individuelle et socioculturelle (et éventuellement de l’expertise musicale) du receveur et les traits contextuels inhérents à la situation d’écoute.³²⁴

Finalement, les attentes qui relèvent de la mémoire immédiate ou à court terme, sont celles qui ont le plus été étudiées par la psychologie de la musique. Un terme équivalent à celui d’attente, et celui d’anticipation. David Huron a d’ailleurs consacré en 2006 un ouvrage sur cette notion d’anticipation.³²⁵ Il propose que les émotions évoquées par les attentes prennent en compte cinq « Perception must be understood as a relationship between environmentally available information and the capacities, sensitivities, and interests of a perceiver. » systèmes distincts : l’Imagination, la Tension, la Prédiction, la Réaction et l’Appréciation (ITPRA). Nous détaillerons ci-après son modèle ITPRA en lien avec la texture après celui de Meyer.

Nous verrons que le point commun central entre les méthodes de Meyer et d’Huron réside dans le fait que l’expérience musicale s’appuie principalement sur la façon dont les attentes de l’auditeur sont satisfaites ou contrariées. Quant à Tan et collaborateurs³²⁶, ils ont mis en avant une différence notable entre ces deux méthodes : à savoir que celle de Meyer serait fondamentalement déterministe, tout comme celle de son disciple Narmour, alors que celle d’ Huron serait basée sur les régularités statistiques de la musique. En parallèle, dans la littérature, nous trouvons particulièrement saisissant le concept « d’horizon d’attente » des œuvres littéraires, à partir des attentes du lecteur, exposé par Jauss dans les années 1970.³²⁷ Pour cet historien allemand, la lecture d’une œuvre littéraire est conçue sur une existence nommée « horizon d’attente » composée de connaissances d’un lecteur potentiel et les présupposés de ce dernier sur la littérature. Cette notion, auparavant utilisée par d’autres comme Gadamer³²⁸ et Husserl³²⁹, joue un rôle essentiel dans la théorie de la réception de Jauss, car pour comprendre l’effet d’une œuvre, il est nécessaire de reconnaître l’horizon antécédent avec ses valeurs. En effet, une œuvre se situe en continuité ou en rupture par rapport à une tradition. « L’expérience des lecteurs renvoie à la perception d’une conformité ou d’un écart par rapport à cette tradition. »³³⁰

De même, étudier en détails les attentes musicales d’un auditeur, comme nous l’expliciterons chez Huron et Meyer, se révèle être une étude esthétique fondamentale par rapport à ce qui nous anime.

6.4. Le pouvoir émotionnel de la texture

Meyer avait tout à fait compris le pouvoir émotionnel de la musique, ce qui explique pourquoi nous la pratiquons, nous l’écoutons et nous l’aimons. Meyer souligne que « tout se passe en art comme dans la vie de tous les jours. »³³¹ En effet, la musique, par ses mouvements, ses vibrations, nous transporte, nous meut et nous émeut. « La musique reflète la forme fondamentale de l’expérience humaine » écrit Meyer.³³²

La texture occupe une place centrale dans son oeuvre car elle est au cœur du processus émotionnel musical. Selon l’auteur, la texture ne se résume pas à une catégorie de l’écriture, mais elle résulte de l’interaction entre le signal acoustique et la perception de l’auditeur. D’ailleurs, dans Emotion and Meaning in Music, Meyer lui consacre un chapitre entier : « La texture concerne l’opération du cerveau qui consiste à regrouper des stimuli musicaux concomitants en plusieurs figures simultanées, une figure et un accompagnement (fond), et ainsi de suite. »³³³ Selon lui, les changements de texture peuvent générer des tensions et des attentes perceptives chez l’auditeur notamment dans des situations telles que l’attente du retour de la texture initiale, une texture trop étirée dans les registres appelant à un rétrécissement ou un fond sans figure, ou encore plusieurs figures sans fond (composition polyphonique avec des parties bien distinctes), etc. Ainsi, « la texture donne lieu à des phénomènes d’émergence perceptive, le terme émergence étant pris dans son sens fort, sous la condition que l’image sonore émergente ne soit pas réductible aux entités fondamentales. »³³⁴ En d’autres termes, la perception de la texture résulte de l’interaction des différentes composantes de sorte que le résultat dépasse leur simple addition selon le principe bien connu de la Gestalt psychologie : « le tout est différent de la somme de ses parties ».³³⁵

Comme expliqué en début de ce chapitre sur les applications de la Gestalt en musique, Léonard B. Meyer nous a prouvé que la musique était un art du temps et qu’à chaque moment d’une œuvre, l’auditeur est placé en situation d’attente par rapport à ce qui va suivre. Il attend « que les formes soient aussi « bonnes » que possible, c’est-à-dire qu’elles satisfassent aux critères de régularité, de symétrie et de simplicité dont les études gestaltistes démontrent qu’ils contribuent à la satisfaction de l’esprit ».³³⁶ Quand un système tonal est établi, nous discernons de la récurrence, une forme de répétition distincte de la réitération qui implique toujours une attente dont la satisfaction est retardée, puis enfin résolue. La réitération est la répétition consécutive d’un terme sonore, qui même s’il est prolongé, est perçu comme un tout. L’attente d’un retour dépend de la compréhension du morceau. Ainsi, nous ne pouvons pas avoir d’attentes musicales si nous n’avons pas compris le cheminement du morceau. Que se passe t-il lors de l’écoute d’un morceau de musique contemporaine atonale ? Nous tenterons de répondre à cette question dans notre partie expérimentale notamment.

Dans son livre Sweet anticipation (2006)³³⁷, Huron décrit plusieurs mécanismes psychologiques liés aux attentes dans la vie quotidienne de l’individu et il illustre comment ces mécanismes fonctionnent. Tout comme Meyer, Huron construit une théorie générale des attentes et l’applique à la musique de concert et à des chansons. Beaucoup d’affects musicaux comme la surprise, le frisson, la tension, etc. sont liés au rapport qui se tisse entre la forme musicale et nos attentes qui dépendent notamment de nos connaissances. L’attente, dans ce sens, implique des représentations mentales, lesquelles sont constamment examinées et réactualisées par nos expériences musicales quotidiennes.

Huron commence par s’interroger en se demandant pourquoi la musique réussit si bien à susciter des émotions alors que ses capacités de représentation du monde semblent si limitées. Il reconnaît le travail fondateur de Meyer, réalisé cinquante ans auparavant, Emotion and Meaning in Music, dans lequel Meyer affirmait que le principal contenu émotionnel de la musique découlait de la manipulation des attentes du compositeur. Au demeurant, Huron propose que les émotions évoquées par les attentes prennent en compte cinq systèmes distincts: l’Imagination, la Tension, la Prédiction, la Réaction et l’Appréciation (ITPRA)³³⁸.

Figure 69: Modèle de la Théorie ITPRA de David Huron.³³⁹

Ces cinq systèmes de réponse peuvent être regroupés en deux périodes différentes : les réponses avant le résultat (les sentiments qui se manifestent avant un événement attendu / inattendu) incluent les réponses d’imagination et de tension. Les réponses post-résultat incluent les réponses de prédiction, de réaction et d’appréciation.

La première, la réponse de l’imagination, est quelque peu éloignée de l’événement et consiste à prédire ce qui va arriver et ce que ressentira l’auditeur, quand et après l’événement musical. Cette réponse peut motiver l’auditeur à prendre le contrôle de l’action, ce qui augmente la probabilité d’une issue positive. Par contre, la réponse en tension fait référence à la préparation mentale et physiologique des auditeurs lorsque l’événement prévu est imminent. La préparation d’un événement attendu implique généralement une préparation motrice et une préparation perceptive.

Une fois que l’événement s’est produit, les auditeurs reçoivent du plaisir ou du mécontentement de la précision de leur prédiction, qui est la réponse de la prédiction. Lorsque le stimulus est attendu, la réaction émotionnelle a une valence positive et quand le stimulus est inattendu, la réaction émotionnelle a une valence négative. Les auditeurs évaluent également le caractère agréable ou désagréable du résultat, ce qui entraîne une réaction. Ainsi, immédiatement après un événement négatif mais néanmoins prévu, l’auditeur peut ressentir un mélange de plaisir et de déplaisir. Enfin, la réaction d’évaluation découle de l’activation de la pensée consciente et implique une évaluation à un niveau plus élevé de l’événement et de ses conséquences.

L’ensemble de ce processus peut conduire à des réponses affectives spécifiques. Lorsque les attentes sont satisfaites, les auditeurs obtiennent un certain degré de plaisir, qui est renforcé si l’événement est positif. Néanmoins, il est important de souligner que les attentes non satisfaites ne sont pas nécessairement négatives. Si l’événement est jugé positif dans son ensemble, le résultat peut être un rire, une crainte ou des frissons.

Le livre se termine par un résumé précieux de la théorie ITPRA et une discussion des implications pour la composition, la performance, la musicologie, l’ethnomusicologie et l’esthétique musicale.

Chapitre 4 : L’enfant sourd, un modèle pour tester la perception de la texture

« Toute science touche à l’art. Tout art a son côté scientifique. Le pire savant est celui qui n’est pas artiste. Le pire artiste est celui qui n’est jamais savant ». Armand Trousseau.³⁴⁰

Au regard de notre présentation et approfondissement autour de la notion de texture, nous nous sommes longuement questionnés sur son utilisation et sa perception auprès d’une population d’enfants avec laquelle nous travaillons depuis une quinzaine d’années : les enfants sourds.

La déficience auditive est le déficit sensoriel le plus fréquent chez l’enfant : environ un cas de surdité congénitale pour 1000 naissances et la même proportion de surdités acquises. Depuis le décret du 23 avril 2012, le dépistage universel systématique néonatal se met progressivement en place en France.³⁴¹ Le diagnostic précoce, la prise en charge ainsi que l’implant cochléaire en cas de surdité bilatérale sévère à profonde constituent des atouts essentiels pour le développement harmonieux d’un enfant sourd.

L’apparition de la surdité peut revêtir des aspects cliniques très divers et peut survenir à tout âge de la vie. La variabilité de plusieurs facteurs comme l’âge d’apparition de la perte auditive (avant, pendant ou après la période d’acquisition du langage), mais également son siège (oreille externe, moyenne ou interne) ainsi que de son degré de sévérité va engendrer des conséquences perceptives, cognitives, neurologiques et langagières diverses. Le développement du langage chez l’enfant, loin d’être un processus linéaire, suit un ordre selon lequel chaque nouveau savoir s’appuie sur des formes ou des fonctions déjà exercées par l’enfant, dans lesquelles l’audition joue un rôle central (Chapman, 2000³⁴² ; Karmiloff-Smith & Karmiloff-Smith, 2012³⁴³). La première partie de ce chapitre sera consacrée à la présentation des critères de la surdité et de ses différents moyens de réhabilitation. Nous exposerons ensuite l’état des connaissances actuelles sur les conséquences cognitives, langagières, sociales et neurologiques de la surdité profonde congénitale. Pour finir, nous présenterons l’émergence des dimensions musicales chez l’enfant normo-entendant et sourd, et pourquoi la musique constitue un véritable outil de stimulation auditive pour ces enfants.

1. Présentation générale de la surdité et les différents moyens de réhabilitation

1.1. L’âge d’apparition de la surdité

La surdité est qualifiée de congénitale lorsqu’elle touche l’enfant dès sa naissance. La boucle audiophonatoire est nécessaire pour le développement du langage et de la parole de l’enfant. Son interruption a donc des conséquences différentes selon l’âge d’apparition de la surdité. Nous distinguons les pertes auditives pré-, péri- et post-linguale. La surdité est qualifiée de pré-linguale ou péri-natale, si elle survient avant l’âge de 2 ans, de péri-linguale ou péri-linguistique, si elle survient entre 2 et 4 ans, et de post-linguale ou post-linguistique, si elle survient après cette période. Il existe également des surdités évolutives responsables d’une régression de l’audition à plus ou moins long terme.

Figure 70 : Schéma récapitulatif d’après Lina-Granade et Truy (2005).³⁴⁴

Les auteurs soulignent l’importance de ces deux premières années de la vie, jugées particulièrement sensibles pour l’acquisition du langage parlé, au regard de la plasticité cérébrale et des capacités d’apprentissages fondamentales.

1.2. Le siège de l’atteinte auditive

De façon générale, les troubles de l’audition sont classés selon la région atteinte du système auditif. Nous distinguons trois types de surdité : les surdités de transmission, de perception et les surdités mixtes. Les surdités de transmission correspondent à une atteinte de l’oreille externe et/ou de l’oreille moyenne. Le degré de perte auditive maximal s’élève à 60 dB et sont en général moins invalidantes sur le plan du développement langagier notamment que les surdités de perception (dont la perte peut atteindre 120 dB). Les surdités de perception se traduisent par une atteinte uni ou bilatérale de l’oreille interne, des voies ou des centres nerveux auditifs. Une surdité de transmission et une surdité de perception peuvent se combiner sur la même oreille, constituant ainsi une surdité mixte. La surdité centrale semble beaucoup plus rare chez l’enfant car elle résulte d’un dommage ou d’une déficience au niveau du système nerveux central et peut se situer dans les connexions nerveuses du cerveau (surdité verbale, surdité corticale et agnosie auditive).

1.3. Le degré de surdité

Il n’existe pas une surdité mais des surdités, classées selon un nombre de critères fort divers (Mondain et al., 2005)³⁴⁵

Figure 71 : Arbre décisionnel pour la classification des surdités, issu de Mondain et collaborateurs (2005).

La Figure ci-dessus représente schématiquement ces critères dans une perspective de prise en charge pluridisciplinaire.

La classification des degrés de surdité et de leurs conséquences perceptives proposée par le Bureau International d’Audio-Phonologie (BIAP, 2008)³⁴⁶ est exposée dans le tableau ci-dessous.

Classification audiométrique des déficiences auditives
Audition normale	La perte tonale moyenne ne dépasse pas 20 dB.
Déficience auditive légère	La perte tonale moyenne est comprise entre 21 dB et 40 dB. La parole est perçue à voix normale. La plupart des bruits familiaux sont perçus.
Déficience auditive moyenne	Premier degré : la perte tonale moyenne est comprise entre 41 et 55 dB. Deuxième degré : la perte tonale moyenne est comprise entre 56 et 70 dB. La parole est perçue à voix élevée. Le sujet comprend mieux en regardant parler. Quelques bruits familiers sont encore perçus.
Déficience auditive sévère	Premier degré : la perte tonale moyenne est comprise entre 71 et 80 dB. Deuxième degré : la perte tonale moyenne est comprise entre 81 et 90 dB. La parole est perçue à voix forte près de l’oreille. Les bruits forts sont perçus.
Déficience auditive profonde	Premier degré : la perte tonale moyenne est comprise entre 91 et 100 dB. Deuxième degré : la perte tonale moyenne est comprise entre 101 et 110 dB. Troisième degré : la perte tonale moyenne est comprise entre 111 et 119 dB. Aucune perception de la parole. Seuls les bruits très puis-sants sont perçus.
Déficience auditive totale	La perte moyenne est de 120 dB et plus. Rien n’est perçu.

Tableau 1 : Classification audiométrique des déficiences auditives du Bureau International d’Audio-Phonologie.

Plus la déficience auditive est importante, plus la quantité et la qualité des informations sonores de l’environnement qui parviennent à l’enfant sourd sont restreintes ; ce qui entrave l’enfant dans son accès au langage oral. Bien évidemment, les conséquences sur le développement du langage seront différentes selon le degré de surdité. Cette classification résulte du calcul d’une perte moyenne sur les fréquences conversationnelles. Dans le schéma ci-après, le son est caractérisé par deux dimensions : la fréquence et l’intensité. Dans l’absolu, il en manque cependant deux autres : les dimensions de durée et de timbre.

Figure 72 : la courbe audiométrique de l'oreille humaine. Les précisions données ci-dessus peuvent se résumer sur un graphique représentant le champ auditif humain (vert). La zone conversationnelle (vert foncé) — Figure 72 : la courbe audiométrique de l’oreille humaine³⁴⁷
Les précisions données ci-dessus peuvent se résumer sur un graphique représentant le champ auditif humain (vert). La zone conversationnelle (vert foncé)

La fréquence basse (pour les sons graves) et élevée (pour les sons aigus) est exprimée en Hertz (Hz). Notre oreille est sensible à une gamme spécifique de fréquences (sons graves et aigus) et d’intensités (sons faibles et forts) définissant le champ auditif humain. L’oreille humaine entend des fréquences comprises entre 20 Hz (fréquence la plus grave) et 20 000 Hz (fréquence la plus aiguë). Elle capte des niveaux d’intensité acoustique compris entre 0 et 120 dB. Pour qu’un son pur de fréquence 1000 Hz soit perceptible par l’oreille humaine, il faut qu’il soit au-dessus de 0 dB. A cette même fréquence, 120 dB est le niveau d’intensité acoustique le plus fort qui puisse être supporté par notre oreille. Au-delà, l’oreille peut subir des lésions irréversibles au niveau de ses structures internes. La zone conversationnelle définit les sons utilisés pour la communication par la voix humaine. Lorsque cette zone est affectée, le handicap auditif apparaît vraiment.

1.4. Étiologie des surdités

Selon une expertise collective réalisée par l’Inserm (Institut National de la Santé et de la Recherche Médicale) en 2006, mais toujours d’actualité, il s’avère que les surdités de l’enfant peuvent être isolées (non syndromiques) ou syndromiques (c’est-à-dire associés à des anomalies d’autres organes).³⁴⁸ Il est à noter également que 90% des enfants sourds naissent de parents entendants (Albertini 2010³⁴⁹ ; Roberts 2018³⁵⁰). La synthèse faite par l’Inserm nous informe précisément sur l’étiologie des différentes surdités :

La prévalence de la surdité augmente avec l’âge. Certains types de surdité, en particulier les surdités génétiques, apparaissent durant l’enfance ou même à l’âge adulte. La répartition des surdités prélinguales dans les pays développés est aujourd’hui estimée à 10-15% de surdités syndromiques héréditaires, 60-65% de surdités isolées héréditaires et 20-25% de surdités d’autre origine (infections, médicaments, complication de la prématurité…).³⁵¹

Les différentes recherches menées dans ce domaine depuis une vingtaine d’années permettent petit à petit l’identification des gènes responsables sur l’origine des déficits auditifs. Le premier gène responsable de la surdité héréditaire congénitale a été identifié en 1995 par Christine Petit, pionnière dans ce domaine, à l’Institut Pasteur (la connexine 26).³⁵² Depuis de jour, une centaine de gènes ont été découvert. L’équipe de Sandrine Marlin³⁵³, médecin spécialiste en génétique de la surdité à l’Hôpital Necker-Enfants Malades – Institut Imagine, contribue énormément à faire avancer la recherche dans ce domaine. Les cahiers de l’Audition ont d’ailleurs dédié un numéro complet autour de ce sujet fondamental en 2013.³⁵⁴

1.5. Les adaptations prothétiques

Selon la recommandation du BIAP, « Chez le jeune enfant, la maturation des voies et des centres auditifs est subordonnée à une stimulation sonore précoce, adaptée et régulière. »³⁵⁵ Toute réhabilitation auditive repose sur un même principe actif : apporter de l’énergie acoustique aux tympans.³⁵⁶ D’où la nécessité d’adapter un appareillage dès le diagnostic posé sans délai. Pour cela, il existe différents moyens de réhabilitation auditive comme : la prothèse auditive conventionnelle et l’implant cochléaire. L’implant cochléaire du tronc cérébral et l’implant électromagnétique d’oreille moyenne sont beaucoup moins fréquents.³⁵⁷ Il est tout à fait primordial de comprendre que l’appareillage évolue au fur et à mesure des progrès de l’enfant. Comme le rappelle Eric Bizaguet, « il s’agit donc d’une démarche interactive dans un cadre pluridisciplinaire où les choix initiaux seront modifiés progressivement à la recherche de la solution la plus adaptée. »³⁵⁸

1.5.1. La prothèse auditive

Il s’agit d’un matériel électronique destiné à amplifier les sons et à améliorer le traitement du signal sonore à partir des capacités résiduelles de l’oreille interne. L’appareil auditif se compose de 3 éléments principaux : un microphone, un écouteur et un amplificateur. Le son est converti en signaux électriques à l’aide du microphone. Ceux-ci sont analysés et traités par le microprocesseur. Les signaux sont ensuite amplifiés et reconvertis en ondes sonores au moyen d’un haut-parleur puis transmis dans le conduit auditif.

Figure 73 : Fonctionnement d’une prothèse auditive conventionnelle.³⁵⁹

1.5.2. L’implant cochléaire

Depuis la fin du XX^ème siècle, Les implants cochléaires ont considérablement évolué. Les premières recherches ont débuté en France et aux Etats-Unis dans les années 1960 pour aboutir à l’essor de cette technologie en 1993.³⁶⁰ L’implant cochléaire pédiatrique s’adresse aux enfants présentant une surdité sévère à profonde bilatérale. Celui-ci a permis une avancée considérable dans le développement du langage oral de l’enfant sourd.³⁶¹ Il existe actuellement quatre fabricants d’implants cochléaires : Cochlear®, Med-El®, Advanced Bionics® et Neurelec®. Chacun de ces fabricants perfectionnent sans cesse leur technologie. Ce qui explique en partie l’orientation de notre recherche auprès d’enfants sourds porteurs d’implants : d’une part, les stratégies de codage de l’implant sont en perpétuelle évolution et demandent une collaboration pluridisciplinaire afin d’améliorer significativement la perception auditive des enfants ; d’autre part, c’est aussi un outil de plus en plus choisi par les familles, au vu des résultats sur la communication des enfants sourds notamment. Une enquête menée par le CISIC (Centre d’Information sur la Surdité et l’Implant Cochléaire) en 2012 en faisait déjà le constat : « 10 % des personnes ont été implantées avant 1996. A partir de 1999, la courbe s’accélère avec un petit ralentissement en 2006 et 2008, avant que les dispositifs d’implants cochléaires ne relèvent d’une prise en charge de la sécurité sociale à partir de 2009. »³⁶² Actuellement on estime à environ 130 000 le nombre de patients sourds bénéficiant d’un implant cochléaire dans le monde, dont environ 1/3 d’enfants.

Figure 74 : Courbe des sujets implantés en France depuis 1996 proposé par le CISIC.

1.5.2.1 Principe et fonctionnement

L’implant cochléaire est une prothèse auditive particulière qui nécessite un acte chirurgical (ANDEM, 1994³⁶³ ; Preisler, 2001³⁶⁴). C’est un dispositif électro-acoustique qui permet de restaurer partiellement la fonction cochléaire, dans le cadre de surdités de perception endocochléaires, profondes et bilatérales (cf. représentation schématique ci-dessous)³⁶⁵.

Le processus entier, de l’arrivée d’un son au traitement par le cerveau, est si rapide que l’utilisateur entend le son au moment où il se produit et ce, de manière continue. A l’inverse de la prothèse auditive, basé uniquement sur l’amplification des sons, l’implant permet de stimuler directement et électriquement le nerf cochléaire par des électrodes implantées chirurgicalement dans la rampe tympanique de la cochlée (jusqu’à 22 électrodes).

Figure 75 : Représentation schématique des différentes composantes d’un implant cochléaire. La partie externe est composée d’un processeur audio, qui enregistre les sons de l’environnement et d’une antenne. La partie interne est constituée d’un stimulateur et d’un porte-électrode de 8 à 22 contacts insérés dans la cochlée.

L’intérêt de cette technique est de remplacer l’organe de Corti défaillant et de restaurer la résolution spectrale ou tonotopie qui permet la discrimination fréquentielle (Govaerts et al., 2004)³⁶⁶, c’est-à-dire la capacité de différencier les sons selon leur fréquence. C’est une capacité essentielle pour la compréhension de la parole.

L’implant est préconisé pour des patients sourds qui ne retirent que peu de bénéfices des prothèses conventionnelles. Il est donc systématiquement précédé d’un essai prothétique. Ainsi, seules 22 électrodes vont remplacer les 3500 cellules ciliées internes absentes ou défaillantes. L’implant permet donc de rétablir une audition efficace mais la perception demeure toujours imprécise, la qualité et la précision des informations sonores s’en trouvent réduites. La gamme de stimulation fréquentielle est similaire entre les quatre constructeurs d’implants, à savoir de 100 à 8000 Hz.

Figure 76 : Implant cochléaire Nucleus CI-22 inséré dans la rampe tympanique. Adapté d’après (G. Clark, 2003)³⁶⁷

Dès lors, pour compléter les apports de l’implant, une prise en charge rééducative alliant l’éducation auditive à l’utilisation d’informations visuelles (lecture labiale, LPC, français signé…) sera nécessaire pour permettre un bon développement linguistique (Hage, Charlier, & Leybaert, 2006).³⁶⁸

1.5.2.2. Les différents types de stratégie de codage existant

Selon Catherine Hage et collaborateurs, les stratégies de codage de l’implant sont divisées en trois grandes catégories : les stratégies temporelles, les stratégies spectrales et les stratégies hybrides.³⁶⁹

Les stratégies temporelles ont pour but de privilégier le traitement de l’information temporelle du message acoustique (stratégie CIS Continuous Interleaved Sampling).³⁷⁰ Cette stratégie effectue un transcodage numérique afin de restituer fidèlement l’enveloppe temporelle dans chaque bande de fréquence. Les électrodes sont stimulées de façon séquentielle afin de réduire les interactions électriques entre les différents canaux. Actuellement, cette stratégie est utilisée chez Cochlear®, Med-El® et Advanced Bionics®. Par exemple, chez ce dernier constructeur, cette stratégie est nommée HiRes.

La stratégie la plus répandue chez Cochlear®, avec leur modèle d’implant Nucleus®, Multipeak (ou MPEAK) a apporté à la cochlée une information supplémentaire sur les hautes fréquences. Le processeur réalise une extraction des estimations des formants F0, F1, F2. Puis, il utilise 3 bandes de filtres pour transmettre des informations supplémentaires entre 2000 et 8000Hz. La fréquence de stimulation reste fixe. Cette stratégie de codage correspond à la stratégie spectrale.

Enfin, les stratégies hybrides plus récentes, correspondent à la combinaison de ces deux types de stratégies précedemment cités : la stratégie spectrale et temporelle. Les stratégies de codage de la parole traitent principalement la représentation la plus pertinente des différents composants fréquentiels de la parole (statégie SPEAK).³⁷¹

Pour une description plus détaillée sur ces questions, nous pouvons faire référence aux travaux de Wilson & Dorman (2008)³⁷² et également très récemment à cet article de Wilson (2019).³⁷³

A l’heure actuelle, les personnes porteurs d’implants cochléaires possèdent généralement plusieurs réglages, avec différentes stratégies de codage, leur permettant de s’adapter à différentes situations acoustiques de la vie quotidienne. Mais la question d’une stratégie de codage permettant à la fois la restitution des informations essentielles à la compréhension de la parole et celle d’autres informations acoustiques n’est pas encore résolue. Il s’agirait de savoir si cela serait plus pertinent d’améliorer la résolution spectrale (nombre d’électrodes disponibles) ou les stratégies de codages.

1.6. Les moyens de communication

Tout d’abord, il faut prendre en compte le fait que la majorité des familles entendantes ayant un bébé sourd, préfère communiquer en utilisant la langue orale, puisque c’est le mode le plus aisé pour les parents.³⁷⁴ Le plus souvent, cela s’avère insuffisant à plus ou moins long terme car l’enfant sourd a besoin d’un étayage supplémentaire afin d’accéder à toutes les subtilités de la langue. En fonction de l’âge de l’enfant, de son niveau de langage, de la fonctionnalité de son audition, de ses capacités d’apprentissage, du contexte familial dans lequel il évolue, différentes aides pourront lui être proposées. Ces aides devront être adaptées au plus près de son évolution.

1.6.1. Le motherese ou Mamanais : procédure naturelle

La première communication du tout petit reste une communication basée sur le regard, les mimiques et les gestes. Le bébé possède dès la naissance des capacités communicationnelles et une volonté d’interagir avec son entourage.³⁷⁵ Ces échanges l’amènent naturellement à explorer la sonorité de sa voix. Le motherese utilisé par les Anglo-Saxons, appelé en France le Mamanais, est une façon courante et instinctive de s’adresser à son petit, présent dans toutes les langues et cultures du monde.³⁷⁶ C’est un très beau moyen de communiquer également avec un enfant sourd. Pour cela, les adultes utilisent un registre de voix plus aigüe que d’habitude avec une gamme de contours d’intonation plutôt restreinte mais dont les modulations de hauteur sont particulièrement exagérées. Le débit est ralenti, l’articulation plus précise et le rythme beaucoup plus marqué. Les différentes pauses proposées permettent au bébé d’intervenir à son tour et de relancer le dialogue. Les répétitions sont nombreuses et le plus souvent pertinentes. Le motherese n’est en aucun cas « une simplification appauvrissante du langage, mais l’expression d’un style particulier, précieux support et renforçateur des éléments paraverbaux. »³⁷⁷ Comme le soulignent Michel Soulé et Boris Cyrulnik, « toutes ces caractéristiques sont parfaitement adaptées aux capacités perceptives et aux capacités d’attention des jeunes nourissons et leur facilitent la perception de la parole. »³⁷⁸ Cet étayage aura pour principale fonction de capter l’attention de l’enfant et de développer « l’attention conjointe ». Cette notion a été étudiée par le psychologue américain Jérome Bruner. « L’attention conjointe » est un élément fondamental de ce qu’il nomme les « formats ».³⁷⁹ Bruner les définit comme étant les « échanges habituels qui fournissent un cadre pour l’interprétation concrète de l’intention de communication entre mère et enfant ».³⁸⁰ C’est l’interaction majeure du développement social décrit par Mundy et Newell.³⁸¹ Pour clore ce chapitre, voici un très beau témoignage d’une maman d’enfant sourd qui illustre notre propos :

Les mots de la mère, du père forment une bulle autour de l’enfant, une enveloppe vibratoire qui l’atteint sur toute la surface de sa peau. Les éléments comme le souffle, la parole brève ou

chantante de la mère, les lignes mélodiques des voix de l’entourage, les onde graves et aigües qui viennent frapper la surface de sa peau vont devenir des repères organisateurs, indispensables à la mise en place des apprentissages ultérieurs.³⁸²

1.6.2. Comptines mimées et chansons gestuées

Nous reparlerons en détails de l’importance de la musique et des comptines tout particulièrement dans notre dernier chapitre dédié aux méthodes d’apprentissages musicaux (chapitre 6). Dans ce moment affectif privilégié, la comptine contribue à développer des compétences essentielles pour l’enfant sourd et sa famille. Le chant stimulerait le développement d’habiletés préalables à l’acquisition du langage, tel que le tour de rôle, l’utilisation de gestes et le maintien du contact visuel. D’après Daniel Stern, le rythme, la forme et l’intensité sont perçus par l’enfant quel que soit le mode sensoriel utilisé : visuel, tactil ou auditif.³⁸³ L’enfant développe et élabore une véritable construction intérieure, qui va lui permettre de développer des capacités d’anticipation grâce à la structure même de la comptine avec la présence d’un début, d’un milieu et d’une fin. De plus, une comptine ou chanson est basée sur une alternance couplet/refrain qui développeront également les mêmes types de compétences. Cela fait particulièrement écho avec Meyer et notre chapitre précédent.

1.6.3. La Langue Française Parlée Complétée (LPC)

C’est grâce à la syllabe que le bébé reconnaît sa langue maternelle. La Langue française Parlée Complétée (LPC) repose sur un code manuel visuel. Son but est de favoriser la compréhension de la parole, en associant à celle-ci des mouvements de mains (des clés). Ainsi, il s’agit de compléter la langue (française, par exemple) pour qu’elle soit perçue finement, malgré une défaillance de l’audition. Initialement, le Cued Speech ³⁸⁴ fut inventé par le physicien Orin Cornett en 1967 pour compléter les informations visuelles apportées par la lecture labiale. Afin d’éliminer les sosies labiaux, cet outil permet de lever toutes les ambiguïtés de la lecture labiale et rend visible toute la chaîne parlée. Certaines études mettent en évidence le fait que la majorité des enfants qui utilisent couramment la LPC sont des enfants qui perçoivent et développent plus facilement leur langage oral (Leybaert & LaSasso, 2010)³⁸⁵ et ce, d’autant plus facilement que le début d’exposition à la LPC a été précoce (Leybaert & Alegria, 2003)³⁸⁶. L’utilisation de la LPC présente des avantages qui vont au-delà de la perception de la parole. En spécifiant tous les contrastes phonologiques de la langue et en la présentant comme une succession de phonèmes, la LPC permet à l’enfant sourd de se construire des représentations phonologiques robustes et précises.

Figure 77 : Les 8 configurations des doigts telles que les voit l’enfant pour coder les consonnes.

Figure 78 : Les 5 positions de la main pour coder les voyelles avec la LPC.

1.6.4. La langue des Signes Française (L.S.F.)

Avant toute chose, il est important de préciser que contrairement à une croyance assez répandue, la langue des signes n’est pas universelle. Il existe une langue des signes française (LSF), une langue des signes américaine (ASL), une langue des signes britanniques (BSL), etc … La langue des signes française est officiellement inventée par l’abbé de l’Epée dans les années 1760. Aujourd’hui, la LSF est reconnue comme une langue à part entière depuis février 2005.³⁸⁷ De ce fait, elle possède un vocabulaire propre et des règles de grammaire. Comme une langue orale, la Langue des Signes est composée de signes arbitraires qui diffèrent d’un pays à l’autre.

Figure 79 : Le signe « Bonjour » extrait du Dictionnaire 1200 signes français-LSF de Monica Companys. — Figure 79 : Le signe « Bonjour » extrait du *Dictionnaire 1200 signes français-LSF* de Monica Companys.³⁸⁸

Interprétée par les mains, le visage et le corps dans son ensemble, la Langue des Signes (LSF) est une langue à part entière et constitue un des piliers de la culture sourde. Etant entièrement visuelle, elle met en valeur le non-verbal. Cette langue accorde aussi une place très importante à l’expression du visage pour exprimer sans ambiguïté les objets, les actions ou les sentiments.

La LSF possède un alphabet dactylologique et utilise la lecture sur les lèvres. Chaque lettre de l’alphabet latin que nous utilisons à l’écrit possède une retranscription signée. Il permet d’épeler les noms propres ou les mots n’existant pas encore en LSF (cf. Figure ci-dessous).

Elle possède une grammaire. Bien qu’il n’y ait pas de conjugaison, cette langue précise le moment où se déroule l’action. On situe l’action sur la ligne du temps par la position du corps, en particulier celle de l’épaule.

Figure 80 : Alphabet dactylologique de la Langue des Signes Française.

Comme toute langue, elle véhicule bien sûr une culture. Choisir de communiquer avec la LSF ne signifie pas pour autant un isolement du reste de la société. C’est choisir de la connaître pour s’ouvrir aux autres et mieux la comprendre. L’enfant aura donc le choix de « signer » afin d’échanger, de communiquer avec les autres.

Dans les années 80, le programme Baby Sign Language s’est développé aux Etats-Unis afin d’aider les familles entendantes à communiquer avec leur bébé, avant l’apparition des premiers mots. Linda Acredolo et Susan Goodwyn (1982), spécialistes en développement de l’enfant, sont partis de l’aptitude naturelle des bébés à utiliser des gestes simples pour des mots qu’ils ne savent pas encore dire. Elles sont arrivées à la conclusion que les bébés initiés à cette méthode par leurs parents apprenaient à parler plus tôt, faisaient moins de colères, réalisaient des gains précieux dans leur développement intellectuel, exprimaient leurs émotions plus efficacement et développaient des liens plus solides avec leurs parents. L’équivalent en France « Signe avec moi » a été mis au point par Nathanaëlle Bouhier-Charles en 2006.³⁸⁹ Cette méthode a été largement développée en France depuis peu, dans les lieux d’accueil de la petite enfance : crèches, jardin d’enfants, écoles maternelles. Elle rencontre un franc succès auprès des familles et des professionnels, car cette méthode donne la possibilité aux tout-petits d’exprimer clairement leurs besoins et permet aux parents de les comprendre. Tout ceci avant même l’acquisition de la langue orale.

Figure 81 : Extrait du signe « Encore ».

2. Les conséquences de la surdité profonde congénitale

Nous pouvons observer une grande variabilité dans le développement psychologique des enfants sourds. Celle-ci peut s’expliquer de par l’hétérogénéité existant au sein de la population, en termes de capacités et performances auditives, mais aussi selon des critères non auditifs tels que l’association éventuelle avec d’autres handicaps, l’étiologie de la déficience, le degré d’atteinte, l’âge de survenue ou encore le contexte familial et social (Guidetti & Tourrette, 2002³⁹⁰; Lina-Granade & Truy, 2005).³⁹¹

Tout au long du développement pré-linguistique, les productions vocales de l’enfant sourd et son comportement communicatif vont se différencier de celui de l’enfant normo-entendant. La conséquence de la surdité la plus invalidante est l’accès au langage oral.

2.1. Les troubles langagiers

2.1.1. L’impact de la surdité sur la communication précoce

Cette partie aborde les difficultés que rencontrent les familles d’enfants sourds pour mettre en place une communication précoce et favoriser l’apparition du langage chez leur enfant. Nous envisagerons cette partie en comparaison avec le développement de l’enfant entendant. Le bébé entre en communication de différentes façons avant d’entrer dans le langage : regard, mimique, intonations signifiantes. Nous verrons que la restriction des premières productions de l’enfant sourd entraîne une modification des interactions qu’il a avec son entourage sur les plans quantitatif et qualitatif. D’où l’installation de difficultés supplémentaires à celles directement liées à la déficience auditive, et qui ont des répercussions non négligeables dans le domaine de l’acquisition du langage.

2.1.1.1. Restriction des premières productions

Au niveau prosodique, quelle que soit l’importance de la perte auditive, tous les enfants au cours des premiers mois suivant la naissance, produisent des vocalisations en faisant varier la hauteur, l’intensité, le rythme, le timbre… Ainsi, dès les premiers mois de vie, on retrouve déjà les différents paramètres de la voix. Nous avons pu voir précédemment que l’environnement linguistique des jeunes enfants est composé, en grande partie, de formes particulières du langage appelées motherese et baby-talk dans la littérature anglaise (De Boysson-Bardies, 2005).³⁹² Cependant, chez l’enfant sourd, ces émissions sonores sont en général retardées et différentes, qualitativement et quantitativement. A partir de deux mois, nous observons une réduction de la dynamique vocale, des durées d’énoncés plus courtes, une courbe mélodique peu variée ainsi qu’un répertoire phonique stéréotypé (Vinter 2005).³⁹³ De même, des auteurs comme Bertoncini et De Boysson-Bardies (2000)³⁹⁴ ou Eilers et Ollers (1994)³⁹⁵ relèvent que les enfants sourds ne babillent pas comme les enfants entendants étant donné que le babillage est lié à la perception des sons d’une langue. Ainsi, les nourrissons sourds n’atteindraient jamais le stade de babillage canonique à l’âge attendu et leur parole présenterait des perturbations de rythme, de mélodie, d’intonation, de contrôle phonatoire et articulatoire. Toutefois, de nombreux facteurs viennent moduler ces caractéristiques, telles que l’appareillage précoce et les interactions avec l’environnement familial conduisant à l’observation de fortes différences entre enfants.

Le babillage canonique est acquis entre 5 et 10 mois chez l’enfant normo-entendant. L’enfant sourd vocalise lui aussi, quelle que soit l’importance de sa déficience auditive. Néanmoins, ses productions sont retardées et déviantes par rapport à celles des enfants entendants. Chez l’enfant sourd, le babillage canonique ne se manifeste qu’aux alentours de 15 mois chez l’enfant dont la perte auditive avoisine les 90 dB, vers 25 mois si la déficience est comprise entre 90 et 100 dB et au-delà de cette perte auditive, ce sera vers 30 mois seulement. Les travaux de Shirley Vinter montrent le lien entre le retard d’apparition du babillage canonique et le degré de surdité. Si au départ, les bébés sourds ont un fondamental comparable à celui des enfants entendants, la voix aura tendance à se dégrader au fil des ans, plutôt qu’à s’améliorer (Dumont, 1997).³⁹⁶ A l’âge de six mois, un enfant normo-entendant distingue deux sons éloignés d’un ton. Nous savons également qu’il est particulièrement sensible aux sons aigus. Pour le bébé sourd c’est l’inverse. En effet, la surdité atteint d’abord et avec un plus grand déficit les fréquences aiguës (Carré, 2008).³⁹⁷ De plus, Valérie Alis et Nicole Jubien (2009) nous explique que le « tapping est un mode exploratoire psychomoteur qui survient pendant la période de babillage : l’enfant explore le monde et les objets en tapant sur ou avec les jouets. Le frapper précède toujours le babillage canonique. Chez le bébé sourd profond, tapping et productions syllabées sont dissociés. »³⁹⁸

2.1.1.2. Modification des interactions parentales

L’avenir linguistique de l’enfant sourd, et ce quel que soit le type d’appareillage choisi, repose majoritairement sur la capacité de la famille à construire un cadre interactif avec leur enfant. Même si aujourd’hui l’importance de la communication précoce avec un tout jeune enfant sourd est bien intégrée dans les représentations des professionnels de la surdité, grâce à la contribution de l’implant cochléaire notamment, Catherine Hage soulève malgré tout le fait que les parents d’un bébé sourd « sont rarement conscients de l’importance des interactions précoces en tant que catalyseur du développement du langage. »³⁹⁹ Chez l’enfant sourd, la période pré-linguistique est compromise par différents facteurs. Il n’est pas rare en effet que les parents d’un bébé sourd s’arrêtent de lui parler, omettant du même coup de renforcer les comportements susceptibles de soutenir la communication avec leur enfant. D’autre part, et ce à la décharge des parents, nous avons vu que la pauvreté des émissions vocales des bébés sourds – productions de durée réduite, schémas mélodiques plats et stéréotypés – n’encourage pas ces derniers à les intégrer au sein des échanges interpersonnels ni à interpréter ces vocalisations en tant qu’actes de communication. Ainsi, l’absence de réponses vocales peut modifier les interactions qu’ont les parents avec leur enfant, soit en n’apportant pas assez de stimulations, soit en exerçant une pression trop forte. Or, nous connaissons l’importance de ces interactions dans le développement des productions vocales et de l’intonation.

Par conséquent, une guidance familiale associée à un appareillage précoce et à une éducation spécifique permet à l’enfant, même sourd profond, un développement des échanges et de la communication avec son entourage. En l’absence de toute remédiation, la privation sensorielle précoce va, par la suite, entrainer de nombreuses répercussions sur la voix et la prosodie de l’enfant sourd, celle-ci constituant « la matrice des futures compétences langagières, pragmatiques et linguistiques, c’est-à-dire des futures compétences à la fois conversationnelles et linguistiques (Vinter 2005).

Chez l’enfant sourd profond, bien que les structures neurologiques spécialisées dans le langage existent dès la naissance, celles-ci ne sont pas suffisamment alimentées par les informations auditives. L’input linguistique des enfants sourds est donc nécessairement visuel. Avec un enfant sourd, la communication repose essentiellement sur le regard. En situation duelle, à chaque fois que l’enfant détourne les yeux, il y a rupture de la communication. En situation d’observation conjointe d’un même objet avec l’adulte, l’enfant doit mettre en place des mécanismes d’attention divisée. Cette attention est répartie entre le message oral audiovisuel et l’objet de l’interaction. Les informations lui parviennent donc de façon séquentielle (regard de l’adulte / objet / regard de l’adulte / objet…) et non simultanée. Ce problème d’attention amène l’adulte à passer plus de temps à attirer l’attention de son bébé qu’à jouer avec lui. Les routines interactives chez l’enfant sourd restent le plus souvent centrées sur le « faire faire » quelque chose à l’adulte plutôt que le « faire savoir » (Deleau & Le Maner-Idrissi, 2005).⁴⁰⁰ Par conséquent, à partir de 18 mois, les habiletés proprement linguistiques des enfants sourds sont inférieures à celles des entendants du même âge (Lepot-Froment & Clerebaut, 1996).⁴⁰¹ À cet égard, la construction d’un « lien d’attachement sécurisant » constitue un prérequis nécessaire à l’utilisation la plus adaptée des divers moyens de communication, par les parents et les professionnels de la petite enfance. Il s’agit d’un processus complexe qui va se développer pendant tout le développement de l’enfant. Claudia Gold a mis en évidence cela dans son ouvrage de référence À l’écoute des émotions de l’enfant (2014).⁴⁰²

Au demeurant, les interactions comportementales servent de support aux interactions affectives. Le psychiatre américain, Daniel Stern (1989) parle d’« accordage affectif » entre le parent et l’enfant.⁴⁰³ Dans cette expérience partagée, le parent répond à un affect exprimé par le bébé par un affect équivalent : par exemple, un geste du parent répondra à une vocalise de l’enfant. Cet accordage au travers des interactions va aider l’enfant à organiser son vécu et ses sensations et à leur donner du sens. Edward Tronick⁴⁰⁴ partage le point de vue de Stern en affirmant que « cette expérience émotionnelle basale du bébé » se traduit par une entrée multimodale des différentes voies sensorielles, sous forme de boucle rétroactive partant des actions du bébé, différente de la seule boucle audio-phonatoire, nuancés par les signaux de contrôle de ce dernier.⁴⁰⁵

2.2. L’impact de la surdité sur le développement du langage

La conséquence la plus importante de la surdité profonde est l’accès au langage oral. Nous avons vu que l’accès au langage peut commencer après la mise en place d’un appareillage efficace, sous l’effet conjoint de la stimulation auditive et de la prise en charge spécifique de l’enfant sourd.

L’apprentissage de la langue s’apprendra surtout de manière explicite, contrairement à l’enfant normo-entendant qui est capable d’extraire les régularités structurelles de la langue de manière implicite : les mots, leur agencement, les usages et habitudes linguistiques. Nous nous intéresserons plus particulièrement aux enfants sourds porteurs d’implant cochléaire, car notre travail expérimental, présenté dans notre cinquième chapitre, s’est focalisé sur cette population.

Concernant l’accès au lexique de l’enfant sourd, les enfants implantés présentent un âge de développement lexical en réception inférieur à ceux des enfants entendants de même âge (Blamey et al., 2001).⁴⁰⁶ Des résultats ultérieurs soulignent que le retard accumulé ne désigne pas une famille de mots en particulier et correspond très sensiblement à la période de surdité. Ce qui permet d’établir un âge de développement analogue à la période d’audition fonctionnelle (Fagan & Pisoni, 2010).⁴⁰⁷ D’autre part, ce développement lexical est positivement corrélé à l’âge d’implantation, avec un net avantage pour les enfants implantés précocement (Hayes, Geers, Treiman, & Moog, 2009).⁴⁰⁸ Une implantation avant l’âge de deux ans serait comparable à celui des enfants entendants pour le vocabulaire en reception (Connor, Craig, Raudenbush, Heavner, & Zwolan, 2006).⁴⁰⁹ De manière plus spécifique, l’enfant sourd rencontre des difficultés pour certains champs lexicaux (mathématiques, mots abstraits, marqueurs temporels, mots fonctions) et pour la catégorisation (Rinaldi & Caselli, 2009).⁴¹⁰ Certains auteurs ont démontré une augmentation significative des capacités conversationnelles des enfants sourds implantés dès les six premiers mois post-implantation (Briec et al., 2012⁴¹¹ ; Le Maner-Idrissi et al. 2008, 2010).⁴¹² En effet, lorsqu’ils sont implantés précocement, ces enfants présentent rapidement un bon niveau d’autonomie dans l’initiation des échanges vocaux et gestuels. (Tait, De Raeve et al., 2007). Ils peuvent par exemple prendre leur tour de parole sans avoir forcément besoin de contact visuel avec autrui. L’implant cochléaire leur permet d’être plus actifs dans les interactions.

Comme le souligne Barbara Tillmann, la surdité engendre différents troubles d’origine centrale, souvent reliés à une difficulté de traitement temporel. De ce fait, les enfants sourds ont des difficultés à maîtriser les aspects langagiers reliés à ces aspects temporels, ce qui les empêchent de prédire et d’anticiper les évènements multisensoriels (Bedouin et al. 2016⁴¹³, 2018⁴¹⁴). Finalement, un déficit fondamental d’apprentissage séquentiel statistique chez les enfants sourds les conduiraient à traiter les phrases comme des suites de mots non reliés (Eisenberg, Martinez, Holowecky, & Pogorelsky, 2002).⁴¹⁵ Cela empêcherait l’apprentissage implicite de règles morphosyntaxiques et limiterait le recours aux stratégies impliquant la syntaxe pour mieux identifier des mots, y compris en lecture (Gallego, Martin-Aragoneses, Lopez-Higes, & Pison, 2016).⁴¹⁶

De plus, Lorenzi et collaborateurs (2006)⁴¹⁷ ont démontré que des sujets malentendants, et ce quelque soit leur âge, semblent peu capable de tirer profit des informations de structure temporelle fine pour identifier les signaux, alors qu’ils obtiennent de très bons résultats pour identifier des logatomes avec l’enveloppe seule. En fin de compte, « un déficit dans les capacités d’encodage et/ou d’utilisation des informations de structure fine semble être systématiquement associé à un déficit d’intelligibilité dans le bruit ».⁴¹⁸

2.3. Les conséquences sur la Cognition

2.3.1. Les facultés intellectuelles

Bien évidemment, la surdité en elle-même ne retentit pas sur l’intelligence d’un enfant. Néanmoins, les conséquences directes de la surdité (telles que les troubles ou retard de langage) et un manque de soutien de l’environnement de l’enfant peuvent rendre difficiles certaines acquisitions. En effet, l’insuffisance langagière que peut engendrer la surdité entraîne parfois un retard dans le développement cognitif, notamment dans les acquisitions intellectuelles liées à la perception du temps et de l’espace sur le plan du raisonnement et de l’abstraction.

Pour certains auteurs, une période de privation auditive chez des enfants sourds, bien que compensée par un implant cochléaire par exemple, aurait de réelles conséquences sur l’apprentissage implicite, et ce dans différentes modalités sensorielles (Conway & Christiansen, 2009)⁴¹⁹. Selon ces auteurs, c’est l’expérience sonore qui permet de construire les fondations servant à développer les habiletés cognitives temporelles et séquentielles dans toutes les modalités. La modalité auditive prime cependant en matière de traitement séquentiel. Ainsi, les enfants sourds implantés présenteraient un déficit du traitement séquentiel, impliqué dans l’apprentissage implicite, ayant pour conséquence des difficultés langagières persistantes malgré la compensation de l’appareil auditif. Ces difficultés se retrouvent notamment en grammaire, car l’extraction des régularités de la langue se fait moins efficacement que chez un enfant entendant.

2.3.2. La mémoire

La mémoire à court terme et la mémoire de travail sont essentielles dans le maintien et le traitement des informations. Elles sont un élément primordial entre l’input sensoriel et le stockage de l’information en mémoire à long terme (Baddeley, 1992).⁴²⁰ La mémoire joue un rôle majeur dans la perception et le traitement du langage. Étant donné que certains mots ne sont pas ou mal perçus, la mémorisation est forcément plus difficile. Ce qui peut entraîner une reconnaissance plus lente puisque l’enfant sourd a besoin de comparer le son entendu à ceux enregistrés dans sa mémoire auditive. Ainsi, le développement de la mémoire verbale sera affecté à plusieurs niveaux par la surdité prélinguale, car elle dépend en partie de l’expérience auditive de l’enfant.

Des études sur la mémoire de travail ont montré dans des tâches usuelles d’empan de chiffres que les enfants implantés cochléaires présentaient des capacités inférieures à celles d’enfants normo-entendants (Harris et al., 2011).⁴²¹ Ces résultats sont corrélées à la modalité linguistique dans laquelle les enfants évoluent, à leur score de vocabulaire en réception (Pisoni & Cleary, 2003⁴²². ; Pisoni et al., 2011).⁴²³ Dans ce cas, plus les scores de perception sont bas, plus la longueur de l’empan est faible. L’ensemble de ces études suggèrent que les fonctions cognitives impliquant la modalité-spécifique auditive, sont davantage impactées chez les enfants sourds implantés que chez les enfants normo-entendants.

2.3.3. Les adaptations du cerveau à la surdité

Il nous apparaît primordiale la question de la surdité et des difficultés qu’elle provoque selon les multiples connexions existantes dans le cerveau. D’une part, les mécanismes de synaptogenèse dépendants de l’expérience auditive ne sont pas utilisés dans le cas de la surdité profonde. Comme les synapses non appropriées ne sont pas éliminées, les connections essentielles ne peuvent pas se former et être redistribuer dans l’arborescence dendritique (Kral & Eggermont, 2007)⁴²⁴ du fait que les modes de réhabilitation deviennent moins efficaces si la période critique est dépassée.⁴²⁵ D’autre part, l’information délivrée par l’implant est cependant appauvrie. Les enfants sourds doivent donc développer des stratégies d’adaptation dans lesquelles les informations visuelles ont un rôle fondamentalement complémentaire. Comparativement aux personnes normo-entendantes, les enfants sourds utilisent la lecture labiale bien plus efficacement par exemple. Cette compensation inter-modalitaire, basée ici sur la vision, est appelée « vicariance sensorielle » et existe également chez les sujets privés d’un autre sens. Au niveau comportemental, « la vicariance sensorielle se manifeste par des capacités accrues dans les modalités épargnées et au niveau cérébral par une réorganisation fonctionnelle des régions cérébrales privées d’informations auditives »⁴²⁶, zones qui sont activées par la présentation de stimuli visuels (Finney Fine & Dobkins 2001)⁴²⁷ et même tactiles (Levänen Jousmäki & Hari, 1998).⁴²⁸ La ré-afférentation auditive est limitée en cas de surdité prolongée, ce qui va entraîner une réorganisation du cerveau de l’enfant sourd pré-lingual. De ce fait, les aires auditives ne peuvent pas récupérer leurs fonctions initiales car le réseau auditif va devoir traiter d’autres informations. Chez l’adulte sourd profond, une surdité précoce affecterait la taille des neurones du noyau cochléaire de moitié par rapport aux sujets entendants (Moore, Niparko, Miller & Linthicum, 1994)⁴²⁹. De plus, au niveau cortical, l’onde P1, marqueur de la maturité des voies auditives (myélination et croissance axonale) est très retardée chez les sujets implantés tardivement (Sharma, Dorman & Spahr, 2002a)⁴³⁰. Cette information implique un ralentissement de la conduction de l’information. Nous remarquons également que cette onde n’apparaît que dans l’hémisphère controlatéral à la stimulation, alors qu’une stimulation neuronale est censée stimuler bilatéralement les cortex auditifs (Gilley, Sharma & Dorman, 2008).⁴³¹ Il semblerait qu’une période de surdité précoce et prolongée pourrait engendrer un découplage des voies auditives. De plus, l’onde N1, autre marqueur de la maturité corticale, apparaît chez l’enfant entendant vers l’âge de 5 ans et se développe jusqu’à l’adolescence. Chez les enfants implantés tardivement ou tirant peu de bénéfices de leurs prothèses auditives (Eggermont & Ponton, 2003), cela n’apparaîtrait pas.⁴³² Cette absence s’expliquerait par un arrêt ou une altération de la maturation des couches corticales concernées, dont la maturation se traduit au niveau comportemental par l’habileté à traiter la parole dégradée ou la parole dans le bruit. Ainsi « les couches corticales profondes pourraient suivre une maturation autonome en l’absence d’input auditif, tandis que la maturation des couches plus superficielles est soumise à l’expérience auditive. »⁴³³ La plasticité des voies auditives centrales aurait tendance à diminuer avec la durée de la surdité. Ces mécanismes de neuroplasticité sont fondamentaux dans le cas de la surdité.

Chez l’enfant sourd congénital, la réhabilitation de l’audition, par le port de prothèses auditives et/ou d’implant cochléaire, est effectuée dès le diagnostic posé. Cette stratégie thérapeutique permet de faire fonctionner les différents relais de la transmission de l’information sonore et d’agir sur les mécanismes de plasticité cérébrale. Toutefois, le succès des aides prothétiques est fortement soumis à la période du développement auquel elles sont effectives (âge de correction auditive) et négativement corrélé à la durée de la surdité. La rééducation en orthophonie et en particulier l’éducation auditive sont indispensables. Une multitude d’arguments permet d’envisager la musique comme moyen privilégié de l’éducation auditive. Les effets de l’éducation musicale sont immenses. Tout d’abord, l’universalité et surtout l’ancienneté des pratiques musicales suggère leur ancrage biologique (Mithen, 2009)⁴³⁴ et son importance dans la cohésion sociale (Peretz, 2010).⁴³⁵ Grâce aux aptitudes très précoces du traitement des stimuli musicaux, la musique jouerait un rôle crucial dans la communication mère-enfant (Trehub, 2003)⁴³⁶ et influencerait le développement langagier. Les études menées chez les experts en perception auditive (musiciens) ont montré que le système auditif, comme les autres systèmes sensoriels d’ailleurs, est plastique et réagit à l’expérience sensorielle par des modifications à la fois neuroanatomiques (Schlaug, Jäncke, & Huang, 1995 (b)⁴³⁷; Schneider et al., 2002⁴³⁸) et neurofonctionnelles (Patel, 2008⁴³⁹.; Herholz et Zatorre, 2012⁴⁴⁰). Dans le cadre de notre étude, nous retenons que des effets spécifiques de la pratique musicale au niveau de compétences langagières accrues ont également été mis en évidence (Oechslin, Meyer & Jäncke, 2010⁴⁴¹; Wong, Skoe, Russo, Dees & Kraus, 2007⁴⁴²). Enfin, dès leur réhabilitation auditive réalisée, les enfants sourds semblent démontrer des comportements émotionnels face à la musique comparables à ceux des enfants entendants. Nous envisagerons dans le chapitre suivant les arguments en faveur de l’utilisation de la musique comme outil de stimulation auditive chez des enfants sourds profonds.

3. La musique : un outil de stimulation auditive pour un enfant sourd

L’enfant présente des compétences très précoces pour le traitement de toutes les informations sonores, comme la musique (Trainor & Heinmiller, 1998⁴⁴³ ; Trehub, 2003⁴⁴⁴), les voix (Decasper & Fifer, 1980), le langage, en particulier la langue à laquelle ils ont été exposés (De Boysson- Bardies, 2005 ; Mandel, Jusczyk, & Kemler-Nelson, 1994) qui vont d’une part se développer spécifiquement sous l’influence de l’expérience. D’autre part, le développement de ces différentes compétences s’influenceraient mutuellement. La première section de ce chapitre fait état du développement des compétences auditives, des modèles développementaux et des répercussions de la musique sur le développement linguistique et communicationnel dans la population tout venant. La façon dont l’expérience de la pratique musicale modifie structurellement et fonctionnellement les aires cérébrales ainsi que les effets de transfert seront présentés dans la deuxième section. Enfin, nous aborderons le comportement de l’enfant sourd face aux stimuli musicaux.⁴⁴⁵

3.1. Aspects développementaux du traitement auditif

Les sciences cognitives de la musique ont mis en évidence des compétences perceptives très précoces pour la perception et la cognition musicales (Trainor & Hannon, 2013⁴⁴⁶ ; Bigand, Tillmann, Peretz et al. 2015)⁴⁴⁷. Nous savons que la cochlée est fonctionnelle à la fin du 5ème mois de la vie fœtale et que les sons qui parviennent au fœtus sont traités et mémorisés. Par exemple, l’équipe de Winkler et collaborateurs ont montré que le fœtus pouvait mémoriser toute sa vie durant, la chanson « Ah, vous dirai-je maman » présentée de manière répétée durant le dernier trimestre de grossesse.⁴⁴⁸ L’expérience auditive prénatale explique la sensibilité particulière pour certains stimuli acoustiques comme en témoignent les études faites sur les nouveaux-nés : préférence des mélodies entendues in utero (Deliège & Sloboda, 1995⁴⁴⁹ ; Nakata & Trehub, 2004⁴⁵⁰) qui sont reconnues même un an après leur naissance sans ré-écoute. Ce qui suggère que le cerveau humain naît avec « un précâblage » pour la musique, pour reprendre le terme d’Isabelle Peretz.⁴⁵¹

3.1.1. Modèles du développement des compétences musicales

A la naissance, le bébé possède donc déjà un vécu musical. Nous avons vu précédemment que ces dispositions musicales vont être encouragées par l’entourage s’adressant spontanément à l’enfant dans un motherese ou mamanais qui implique l’accentuation des éléments rythmiques et prosodiques (Papousek, Papousek, & Haekel, 1987).⁴⁵² Il faut rappeler que le chant est un véritable instinct chez l’Homme. Les premières années de vie de l’enfant sont berçées de chants maternels. C’est un comportement universel. Même après l’annonce précoce du handicap de surdité, la majorité des mères entendantes chantent spontanément pour leur bébé que ce soit dans les moments du change, du bain ou encore pour l’endormissement. Le très bel ouvrage de l’orthophoniste Monique Delaroche, Au fil des regards et des caresses, encourage avec beaucoup de bienveillance et de délicatesse les parents du tout petit à accepter son handicap et propose de manière pragmatique un véritable livre de bord pour entrer en communication avec leur bébé.⁴⁵³

L’équipe de Sandra Trehub a mis en évidence le fait que les bébés savaient faire la différence entre le mamanais et le chant. Grâce à l’écoute d’une voix enregistrée, soit en motherese, soit en chantant, ils ont observé qu’avec le chant, les bébés pouvaient attendre deux fois plus longtemps le retour de l’adulte, avant de donner des signes de détresse.⁴⁵⁴ Ces chercheurs ont également montré que les chants maternels augmentent le taux de cortisol chez les nourissons dont le taux de référence est bas, et au contraire les diminuent, pour ceux dont le taux de référence est haut. Ce qui suggère que le chant aide les bébés à réguler leur état émotionnel. De plus, les travaux de Standley et collaborateurs ont démontré que chez les bébés prématurés, le chant pouvait aider à stabiliser les fonctions physiologiques telles que le rythme cardiaque et les niveaux de saturation en oxygène.⁴⁵⁵ Ces expériences musicales soulignent également l’importance des interactions entre le bébé et son entourage mettant en jeu une communication polysensorielle : l’ouïe, la vue, le toucher et le mouvement. Nous pensons tout particulièrement au travaux réalisés par l’équipe de Laurel Trainor au sujet des interactions en synchronie. Elle explique que les bébés, dès l’âge de 14 mois, lorsqu’ils agissent en synchronie avec un expérimentateur, cela les rend plus enclin à vouloir aider ce dernier (Trainor et Cirelli, 2015).⁴⁵⁶ Ainsi, « le mouvement synchrone rendu possible par la musique, joue un rôle important dans le développement social précoce, en aidant les bébés à établir des relations de confiance et d’amitié et à construire un réseau de sociabilité. »⁴⁵⁷

Dès les premiers jours de vie, le bébé a la capacité d’absorber toutes les musiques du monde. Peretz affirme que « les compétences précoces permettent d’extraire les propriétés quasi universelles de la musique comme : son petit nombre de hauteurs (de 5 à 7 notes) dans un morceau, ses petits intervalles inégaux entre les notes, son nombre limité de durées marquant des temps réguliers et pouvant se grouper. Ces caractéristiques propices à l’organisation hiérarchique, en accordant à certains sons un plus grand poids, sont renforcés par la répétition. »⁴⁵⁸

Par la suite, le développement musical va suivre plusieurs étapes jusqu’à l’adolescence, comme le suggère le modèle à cinq phases de Hargreaves & Galton (1992) qui s’inscrit dans la démarche piagétienne.⁴⁵⁹ La phase sensori-motrice (0-2 ans) se distingue par la capacité de l’enfant à reconnaître les contours mélodiques, les variations d’intensité et à répondre au chant sur le plan moteur. A 6 mois, l’enfant, sensibilisé à la structure de la phrase musicale, est alors capable de discriminer les violations des contours (Trehub, Bull, & Thorpe, 1984).⁴⁶⁰ Il développe également pendant cette période, des compétences temporelles essentielles lui permettant de se balancer et de se synchroniser en rythme. La phase suivante, dite figurale (2-5 ans) se caractérise par la capacité de l’enfant à discriminer différents intervalles (hauteur et contour), et par des expressions vocales fusionnant les chants spontanés et les chants de sa culture. Il se focalise plus sur le texte et les mots que sur la mélodie. Les chansons sont articulées et reconnaissables mais sans cohérence tonale. C’est entre 5 et 8 ans (phase schématique) que tous les aspects de la mélodie sont reproduits convenablement, le respect de la tonalité et l’acquisition de la pulsation apparaissent simultanément. A 6 ans, l’enfant se montre capable de reproduire fidèlement des structures mélodico-rythmiques par exemple. Cependant, il est à noter que les tempi lents sont plus difficiles à appréhender que les tempi rapides. Il aime tout particulièrement imiter l’adulte. A 8 ans, l’enfant a intégré les fonctions tonales comme la cadence parfaite et la demi-cadence (Deliège & Sloboda, 1995).⁴⁶¹ Il découvrira pendant cette période les diverses règles du système tonal. La phase de système de règles (8-15 ans) est caractérisée par la capacité à analyser les éléments musicaux. Elle correspond à l’apprentissage formel de la musique. Enfin, la phase professionnelle (à partir de 15 ans) se caractérise par la capacité de l’adolescent à créer des morceaux de musique et à utiliser la musique comme véritable outil de réflexion.

Nous ne détaillerons pas tous les modèles psychologiques du développement musical. Néanmoins il conviendra de citer les travaux de Sloboda (1985)⁴⁶², Swanwick et Tillmann (1986)⁴⁶³, Zenatti (1967⁴⁶⁴, 1990⁴⁶⁵) et Gordon (1988⁴⁶⁶, 2003⁴⁶⁷). De plus, Pierre Zurcher (2010)⁴⁶⁸ a proposé une autre approche du développement musical qui dépendrait du développement du langage, en quatre étapes.

3.2. Les effets de la musique sur le développement de l’enfant sourd

Les enfants sourds, après réhabilitation de leur fonction auditive, réussissent à développer rapidement des aptitudes perceptives musicales et démontrent en définitive, des patterns comportementaux identiques à ceux des enfants normo-entendants. Ils peuvent également reconnaitre et mémoriser des mélodies (Mitani et al., 2007⁴⁶⁹ ; Nakata, Trehub, Kanda, Shibasaki, & Schellenberg, 2005).⁴⁷⁰ Ces observations soulignent l’automaticité de la mise en place des processus de traitement de la musique dès que l’audition est fonctionnelle.

Indépendamment de la problématique de l’implant cochléaire, de nombreuses études ont mis en évidence le fait que les enfants sourds pouvaient profiter des bienfaits de la musique. Ils apparaissent à trois niveaux : au niveau du développement du langage oral, des capacités d’écoute et des habiletés sociales. Concernant le développement du langage oral, nous savons aujourd’hui qu’un entraînement musical entraîne des résultats positifs sur la parole de l’enfant. Il a été montré notamment que les contours prosodiques seraient plus naturels après un entraînement de discrimination rythmique (Darrow, 1985)⁴⁷¹ et de chant (Walczyk, 1993).⁴⁷² Par ailleurs, l’apprentissage de comptines et de chansons participe activement à l’augmentation et à l’enrichissement du stock lexical. Concernant les capacités d’écoute, des entraînements spécifiques, comme la discrimination de différents timbres et l’apprentissage de séquences rythmiques notamment, produiraient des effets positifs sur la capacité d’analyse du pitch, la capacité d’écoute dans le bruit, et la mémoire de travail impliquée dans le traitement séquentiel. Pour finir, faire de la musique, à travers le partage du chant et de la danse, permettrait l’amélioration des habiletés sociales et du comportement émotionnel. Du reste, ce lien entre musique et mouvement sera détaillée dans notre dernier chapitre à travers l’exposé des différentes méthodes actives musicales. L’étude de Laurel Trainor et collaborateurs, The primal role of the vestibular system in determining musical rhythm (2009)⁴⁷³, nous montre comment s’unissent le rythme et le mouvement dès le déplacement du liquide présent dans le système vestibulaire de nos oreilles, grâce aux vibrations. Ce lien contine à l’intérieur de notre cerveau, et cela même si nous ne bougeons pas. En effet, il a été démontré que le rythme active le cortex auditif mais aussi le cortex moteur, notamment les noyaux de la base responsables de

la libération de dopamine (réseau du plaisir et de la récompense).⁴⁷⁴ De plus, l’activité musicale contribuerait au développement de la confiance en soi (Hummel, 1971)⁴⁷⁵, de la confiance en l’autre également (Anshel & Kipper, 1988)⁴⁷⁶, de la responsabilité à l’égard du groupe (McDermott, 1971)⁴⁷⁷ et de la sociabilité (Cirelli et al., 2014).⁴⁷⁸

L’aptitude manifeste des enfants sourds dans les activités musicales et le plaisir qu’elles procurent, pourraient s’expliquer par une sollicitation cognitive moindre pour le traitement musical, par rapport au traitement linguistique plus coûteux cognitivement dans la mesure où il suppose une analyse sémantique. Par conséquent, cela expliquerait le fait qu’il serait plus facile pour l’enfant sourd, de percevoir une voix chantée qu’une voix parlée (Carré, 2008).⁴⁷⁹ Ainsi, l’entraînement musical prend alors tout son sens dans l’éducation auditive des enfants sourds. Il est empiriquement reconnu comme un outil privilégié dans l’éducation auditive. Les effets positifs sur le développement du langage oral sont illustrés notamment par de meilleurs capacités de traitement des différents paramètres acoustiques comme la durée, la fréquence, l’intensité, le timbre. En orthophonie, il existe diverses méthodes utilisant la musique. Elles méritent d’être mentionnées dans ce chapitre car elles contribuent à soutenir la communication de l’enfant sourd et à construire son langage : la méthode verbo-tonale, la Dynamique naturelle de la parole et la méthode Borel-Maisonny. Les mouvements de la main sont en étroite relation avec ceux de la bouche et de la langue. Ce sont des aires motrices voisines qui sont alors sollicitées. La motricité manuelle favoriserait la motricité bucco-faciale notamment.

3.2.1. La méthode Verbo-tonale (MVT)

Le graphisme phonétique, le rythme corporel et musical sont issus de la méthode verbo-tonale développée par le linguiste croate Petar Guberina dans les années cinquante. Les fondements de cette méthode sont partis de la constatation que la motricité générale pouvait influencer celle des organes phonatoires. Sa grande idée a été de solliciter le corps tout entier afin de stimuler et de favoriser une production vocale riche. Le corps est émetteur et récepteur de la communication. Ces activités sont présentées de façon ludique et plaisante pour l’enfant. La MVT part des potentialités de l’enfant et non de ses manques. Dans cette méthode, l’éducation auditive est mise au premier plan. On se préoccupe de ce que perçoit l’enfant, plutôt que des positionnements articulatoires dans la sphère buccale. La comptine est au centre de cette méthode. Cette méthode utilise des appareils spécifiques à amplificateurs et filtres : un vibrateur, un SUVAG et un plancher vibrant.⁴⁸⁰

3.2.2. La Dynamique naturelle de la parole (DNP)

Cette méthode conçue par M. Dunoyer de Ségonzac, s’inspire de la méthode verbo-tonale, de l’anthropologie du geste de Marcel Jousse et de la méthode Martenot, dont nous parlerons en détails dans notre sixième chapitre, alliant ainsi une dimension artistique aux éléments techniques et sensoriels. De façon ludique, cette méthode utilise des canaux visuel, tactile, kinesthésique et auditif pour développer la conscience phonologique.

3.2.3. La méthode Borel-Maisonny

Suzanne Borel-Maisonny, pionnière de l’orthophonie, a mis au point une méthode phonétique et gestuelle, ainsi qu’une méthode de lecture constituée de 37 gestes très utiles pour tous les enfants et en particulier pour les enfants sourds. Elle a travaillé entre autres avec Denise Sadek-Khalil, linguiste et orthophoniste et brillante élève de Gustave Guillaume (Sadek-Khalil, 1997).⁴⁸¹ La méthode est publiée initialement en 1949 puis en 1956 dans le Bulletin mensuel de la Société Alfred Binet. En 1960, elle trouve une forme aboutie dans la publication des ouvrages de référence Langage oral et écrit 1 et 2 (Borel-Maisonny, 1960)⁴⁸² et connaît un retentissement manifeste à la suite de sa collaboration avec Clotilde Sylvestre de Sacy. Cette dernière, fondatrice du Centre de Rééducation de dyslexie-dysorthographie décide d’adapter à l’enseignement traditionnel, la méthode de Borel-Maisonny. Le geste est en rapport avec la forme de la bouche lors de l’articulation ou bien avec la forme de la lettre. C’est une méthode multi sensorielle d’apprentissage de la lecture, qui propose une aide au déchiffrage. A chaque son correspond un geste symbolique. Il y a un geste par son et non par graphie.

Figure 82 : Gestes associés aux sons.⁴⁸³

Par exemple, pour le son [o] le même geste est associé à toutes les graphies de ce son : au, eau, os, ot, aut, aux, ault, etc.

Figure 83 : Extrait de Bien Lire et Aimer Lire.

Construite autour de trois axes, phonème, graphème et articulation, cette méthode permet à l’enfant sourd de mieux appréhender le décodage. Dans cette méthode, les consonnes sont en noire et les voyelles en rouge (cf. exemple ci-dessous).

Figure 84 : Extrait de Bien lire et aimer Lire, p. 23. — Figure 84 : Extrait de *Bien lire et aimer Lire,* p. 23.

Chapitre 5 : Approche empirique de la perception de la Texture chez l’enfant et l’adulte

1. Vers une classification psycho-musicologique pertinente de la Texture

1.1. Les propriétés émergentes : définitions

Au lendemain de la seconde guerre mondiale, les compositeurs se sont emparés de la texture, afin de s’éloigner de la complexité grandissante des systèmes proposés comme le sérialisme notamment, qui séparait de manière significative les compositeurs de leur public. Ainsi, utiliser la texture était susceptible d’être mieux perçue par les auditeurs. Comme le souligne Philippe Lalitte, « la texture apporte donc aux compositeurs une dimension supplémentaire qui tout en leur offrant la possibilité de sortir d’une pensée musicale trop paramétrique, les engage vers une écriture du virtuel. »⁴⁸⁴

Analyser la texture en musique contemporaine, à savoir analyser les différents types de tissage, de grain, de matière, de strates, revient à considérer la texture comme étant un tout plus ou moins homogène, constituée de la fusion d’éléments séparés. Comme nous l’avons souligné dans le troisième chapitre, « l’émergence » se présente d’abord comme un phénomène perceptif relevant du domaine de la psychoacoustique. Cette notion de « propriétés émergentes » a été élaborée grâce aux travaux de Bregman notamment. Jean François Augoyard (philosophe, urbaniste et musicologue) et Henry Torgue (sociologue, urbaniste et compositeur) en donnent une définition pertinente dans leur ouvrage, À l’écoute de l’environnement : répertoire des effets sonores :

Effet générique regroupant la totalité des occurrences sonores qui apparaissent nettement dans un contexte donné. Très souvent couplée avec un autre effet, l’émergence ne concerne pas seulement l’irruption d’un son fort dans un contexte de plus faible intensité ; elle caractérise aussi l’apparition de sons différents par leurs hauteurs, leurs timbres ou leurs rythmes. C’est plus l’affirmation d’un nouveau son qui marque la singularité de cet effet que ses modalités d’apparition, celles-ci relevant plutôt des effets avec lesquels il se conjugue.⁴⁸⁵

Cette définition explicite clairement la situation dans laquelle nous nous trouvons, car ce concept d’émergence est un phénomène psychoacoustique lié à la capacité de l’oreille à fusionner ou à discerner certains événements sonores selon le contexte dans lequel ils apparaissent. Ce qui nous renvoie directement à l’analyse de scènes auditives de Bregman. C’est pourquoi nous retiendrons cette conception de « l’émergence » car elle nous permettra d’appréhender au mieux des œuvres musicales contemporaines basées sur la notion de textures sonores avec des compositeurs comme Grisey, Lachenmann, Reynolds, Ligeti pour ce chapitre. Ce dernier affirmait d’ailleurs au sujet des capacités de la composition texturale « qu’une structure s’analyse en fonction de ses composantes ; une texture se décrit mieux à l’aide de caractéristiques globales et statistiques. »⁴⁸⁶

Pour cela, nous utiliserons les informations audio provenant d’enregistrements. Nous nous servirons du logiciel Sonic Visualiser⁴⁸⁷ afin de visualiser au mieux les différents types de textures de quatre pièces emblématiques du répertoire contemporain après 1945 : Partiels (1975) de Gérard Grisey, Mouvement (- vor der Erstarrung) d’Helmut Lachenmann (1983-1984), Symphony [Myths] de Roger Reynolds (1990) et le Concerto de chambre (Kammerkonzert) de György Ligeti (1969-1970). Nous étudierons comment ces compositeurs ont développé chacun à leur façon, une écriture texturale singulière. Sonic Visualiser nous permettra de croiser les informations contenues de la partition avec celles obtenues par l’analyse informatique du signal audio. C’est un logiciel gratuit, multi-plateformes et open source, qui offre la possibilité de visualiser et d’étudier la structure d’un signal audio en affichant une analyse visuelle de celui-ci sous forme de spectre(s). Ce logiciel a été développé par le Centre for Digital Music de l’Université Queen Mary à Londres. Il propose un large choix de sonagrammes (Spectrogram, Melodic Range Spectrogram, Peak Frequency Spectrogram, Adaptative Spectrogram, Constant-Q Spectrogram…) et d’autres types de visualisations (chromagramme, extraction de mélodie, coefficients d’énergie dans les bandes critiques, autocorrélation, etc.).

La description verbale de la texture complètera la description visuelle. Elle sera décrite ci-après en fonction de sa dimension verticale et horizontale.

1.1.1. Dimension verticale

Densité : Dans sa dimension verticale, nous parlerons de la densité d’une texture, opacité versus diaphane, trouble versus transparente par exemple, ce qui correspond au nombre de lignes, de sources ou d’évènements simultanés ainsi que d’autres paramètres tels la hauteur, les alliages de timbres, l’intensité et les modes de jeux utilisés (sons harmoniques, pressions de l’archet, pizzicatti…).
Étendue : La largeur fréquentielle (large vs étroite) correspond à la façon dont l’espace des hauteurs est utilisé ou la répartition d’évènements simultanés dans les différentes bandes de fréquences (homogène vs hétérogène).
Centre de gravité spectral : Cela correspond au rapport entre le registre et les timbres utilisés au sein de la texture (sombre vs lumineux).
Dissonances sensorielles : Nous nous focalisons sur les rapports d’intervalles et le timbre utilisé (mode de jeux bruités) et/ou le nombre de lignes (rugueux vs soyeux).
Enveloppe spectrale : Nous qualifions ici l’enveloppe spectrale de la texture avec des termes comme : doux, souple, détendue, chaleureuse vs acérée, métallique, dur, rigide, tendue, glacée, etc.
Fusion versus ségrégation des flux : L’interaction des indices de synchronisme des attaques, de comodulation des amplitudes (lors d’un crescendo par exemple) et des alliages de timbres sont de bons indicateurs de fusion de plusieurs sources en une seule entité perceptive (le groupement simultané dans l’ASA de Bregman). A l’inverse, en manipulant les indices de groupement séquentiel, nous avons la possibilité de rendre plus lisible une polyphonie complexe, de surligner une voix secondaire, de suivre le sujet d’une fugue (groupement sequentiel).

1.1.2. Dimensions horizontales

Les striations : Cela correspond à la nature des évènements au niveau temporel : évènements brefs versus longs par exemple, donnant tantôt une texture pulsée ou au contraire lisse.
Les régularités : Nous faisons référence ici à la fréquence d’apparition des évènements : périodique, fluide, liquescent ou au contraire apériodique, déchiqueté, fragmenté.
La vitesse du changement : Par rapport au déroulement temporel, la texture se présente plutôt mouvante ou au contraire statique (rapide vs lent).
La densité temporelle : Ce qui correspond au nombre d’évènements par seconde (aérée vs compacte) et la présence ou non de silences.
La fusion vs ségrégation des flux : C’est plus une aptitude à former différents flux auditifs qui correspondent à une ou plusieurs lignes au sein de la texture.

2. Analyse de Textures

2.1 Partiels (1975) de Gérard Grisey

2.1.1. Présentation

Cette œuvre emblématique de la musique spectrale a été composée en 1975 par Gérard Grisey (1946-1998) et créée le 4 mars 1976 à Paris par l’ensemble l’Itinéraire sous la direction de Boris de Vinogradov. Ce collectif musical a réuni des compositeurs comme Tristan Murail, Michaël Lévinas, Hugues Dufourt, et aussi un ensemble d’interprètes et surtout un instrumentarium électronique qui a servi de laboratoire de nouvelles technologies musicales. Partiels est écrit pour un ensemble de chambre de dix-huit musiciens, mettant particulièrement en valeur les bois. La partition peut être exécutée avec un seul corniste et un seul percussionniste moyennant quelques adaptations que Grisey précise dans la notice ci-dessous.

Figure 85: Extrait de la notice de la partition Partiels de Grisey, Ricordi, Milano 1976. — Figure 85: Extrait de la notice de la partition *Partiels* de Grisey, Ricordi, Milano 1976.

Notons la présence inhabituelle de l’accordéon, certainement explicable par le fait que le compositeur soit accordéoniste lui-même, mais aussi parce que c’est un instrument qui possède une étendue spectrale fort intéressante.

Partiels est extrait des Espaces acoustiques, cycle de six pièces pour diverses formations, écrit entre 1974 et 1985. Ce cycle est constitué d’un Prologue pour alto seul (1976), Périodes pour sept musiciens (1974), Partiels pour 18 musiciens (1975), Modulations pour 33 musiciens (1976-1978), Transitoires pour grand orchestre (1980-1981) et l’Epilogue pour quatre cors solo et orchestre (1985). Normalement, ces six pièces doivent être jouées à la suite, car elles ne sont pas simplement juxtaposées : elles forment un processus à grande échelle, constitué lui-même de processus qui recouvrent chaque pièce puis chaque section à l’intérieur même de ces pièces.

Selon Grisey, à propos de son cycle Espaces acoustiques (1974-1985), « les paramètres n’y sont qu’une grille de lecture et la réalité musicale réside au-delà, dans les seuils où s’opère une tentative de fusion. Liminal est l’adjectif que je donnerais volontiers à ce type d’écriture : plus volontiers en tout cas que celui de spectral, entendu souvent aujourd’hui et qui me semble trop limitatif »⁴⁸⁸. Partiels illustre parfaitement ce type d’écriture, car Grisey manipule savamment nos seuils perceptifs. En qualifiant son écriture de liminale (limen signifie seuil) Grisey nous explique « qu’elle s’applique à déployer les seuils où s’opèrent les interactions psycho-acoustiques entre les paramètres et à jouer de leurs ambiguïtés »⁴⁸⁹. En effet, Grisey distingue deux types de seuil : le premier est notre « capacité d’intégrer les composantes spectrales»⁴⁹⁰ et donc de percevoir un spectre synthétique et non un accord, le deuxième est d’ordre compositionnel : les instruments traditionnels résistent à la fusion, le spectre « forme une sorte de synthèse additive qui ne ressemble ni à un spectre instrumental ni à un accord orchestré ».⁴⁹¹

Jean-Marc Chouvel a proposé un modèle intéressant autour de la structuration du temps et des évènements sur Partiels de Grisey. Pour lui, la construction de diagrammes formels permet de se pencher sur les distances entre les événements, qui révèlent les liens entre les positions temporelles et mémorielles de chaque événement.

Figure 86: Diagramme matériau/temps réalisé par Jean-Marc Chouvel sur Partiels de Gérard Grisey. — Figure 86: Diagramme matériau/temps réalisé par Jean-Marc Chouvel sur *Partiels* de Gérard Grisey.

En abscisses le temps, exprimé approximativement en pages de la partition et en ordonnées les éléments de matériau sonore suivant la liste suivante :

1. trombone f> 2. contrebasse Arco Sul Ponte sf> sf>…. 3. “harmoniques” sons tenus <> 4. irrégularités de modes de jeu (vibrato… etc.) 5. glissando d’harmoniques 6. jeté 7. pulsations régulières – trémolo 8. sons grincés ASP 9. micro glissandi 10. polyphonie éclatée arythmique 11. tam-tam 12. trilles 13. figures (fusées) 14. ±13 fusées périodiques descendantes (avec oscillation sur les notes d’arrivée) 15. pizz 16. tutti > 17. multiphoniques 18. brosse sur grosse caisse 19. bruits divers d’instruments 20. geste de la cymbale.⁴⁹²

Pour Grisey, « Si les sons ont un corps vivant, le temps est à la fois leur espace et leur atmosphère. »⁴⁹³ A ce propos, Chouvel nous explique dans son ouvrage Analyse musicale, Sémiologie et cognition des formes temporelles, sa conception du temps :

La représentation de la temporalité s’effectue, pour la musique, depuis l’invention de la partition jusqu’à celle du sonagramme, sous la forme d’une trace qui reporte directement le temps sur un espace affine. D’autres représentations sont possibles, connues en physique sous le vocable d’« espace de phase ». Ce concept conduit dans le cas de la musique à une représentation particulièrement utile pour l’analyse mélodique, où positions (hauteurs, échelles…) et transitions (intervalles, modes…) deviennent immédiatement lisibles.⁴⁹⁴

L’œuvre procède par processus de transformation progressive modélisés sur le cycle de la respiration humaine (inspiration, expiration, repos). Grisey nous éclaire encore sur sa conception spectrale : « Nous venons de créer un être hybride pour notre perception, un son qui sans être encore un timbre, n’est déjà plus tout à fait un accord, sorte de mutant de la musique d’aujourd’hui, issu de croisements opérés entre les techniques instrumentales nouvelles et les synthèses additives réalisées par ordinateur. »⁴⁹⁵ Jérôme Baillet propose un tableau récapitulatif du processus compositionnel de Grisey.⁴⁹⁶ En se basant sur le rythme respiratoire, Grisey réussit à créer une alternance de tension et de détente. Les zones de repos correspondent à quelques mesures répétées ad libitum dans la partition. Ce sont les seuls moments où il n’y a pas de processus.

Figure 87: Cycle respiratoire dans Partiels.⁴⁹⁷

2.1.2. Description

La Section II entame un processus inverse à celui de la section précédente, car nous partons d’une texture bruitée pour aller vers une texture d’harmonie spectrale, de rythmes apériodiques (irréguliers) vers des rythmes périodiques (réguliers), d’une intensité fortissimo vers le piano, d’un passage de registre grave vers un registre aigu. A partir du chiffre 12, les sons vont s’engendrer les uns les autres et se superposer afin de créer des couches sonores en perpétuelle mobilité. Pour réaliser ces trames sonores, le compositeur fait apparaître les sons imperceptiblement jusqu’à un haut niveau d’intensité puis les fait disparaître comme ils sont venus. Ainsi, deux textures contrastées s’enchainent : l’une dans la Section II, l’autre dans le Repos II. La première est en perpétuelle évolution.

Au début de la Section II, dans sa dimension verticale, nous avons une texture rugueuse, qui correspondrait à notre texture que l’on qualifie de dense. Elle est sombre, dans les registres graves, avec une étendue plutôt étroite. La rugosité (ou dissonance sensorielle) est un des facteurs susceptibles de contribuer à la tension musicale. Dans sa dimension horizontale, la texture est granuleuse, striée avec parfois des pulses périodiques. Elle est mouvante avec un degré de changement de registres comme des vagues.

Figure 88: Extrait de *Partiels* de Grisey, début de la Section II au numéro 12.

Des effets de distorsion sont générés par l’utilisation d’anches doubles dans les embouchures des cuivres et par le grincement des cordes, effet rendu grâce à un jeu près du chevalet notamment. La prédominance des percussions renforce également cette inharmonicité avec le tam-tam très grave joué forte, avec son spectre large et inharmonique qui vient marquer le début de cette section tout comme la grosse caisse et le tom contrebasse joués avec sourdine.

De plus, les variations de volume et d’intensité utilisés comme les soufflets par exemple (chiffre 13), permettent l’apparition de sons infiniment bas en intensité (presque imperceptible) jusqu’ à un très haut niveau d’intensité (principe de fade in /fade out). Le but consiste à gommer le plus possible les attaques et les extinctions nettes, pour que nos oreilles puissent se concentrer sur les textures sonores. Grisey réussit à créer un tissu sonore ininterrompu grâce à l’écriture de ces soufflets dynamiques en superposant le début de l’un avec le sommet de l’autre.

Figure 89: Tissu sonore obtenu par cet agencement ingénieux des soufflets.

Cette texture granuleuse se déroule de manière relativement continue, car nous ne rencontrons pas de ruptures brusques. Petit à petit, elle va se modifier, se transformer progressivement pour arriver à la texture du repos. Grisey utilise dans Partiels une technique singulière, à savoir la technologie du modulateur en anneau (unique influence des techniques de studio sur son écriture) qui lui permet de renforcer le passage de l’harmonique à l’inharmonique. Pour cela, il simule le phénomène acoustique des sons résultants, procédé déjà utilisé par Edgard Varèse dans les années 1920. Les sons générateurs sont toujours superposés deux à deux. Ils suivent une triple évolution : ils montent progressivement du grave vers l’aigu, les intervalles qui les constituent, d’abord resserrés, s’élargissent et leurs fréquences évoluent de façon à ce qu’elles appartiennent de plus en plus au spectre harmonique du mi du trombone, que nous entendons au début de l’œuvre. Le son résultant est calculé en soustrayant les fréquences des sons générateurs.

Au chiffre 18, les sons générateurs sont joués par le trombone (do2, Fréquence = 131 Hz) et par le cor (fa# 2, Fréquence = 185 Hz). La différence entre les deux fréquences donne un son résultant à 54 Hz, soit un la 0 un peu plus bas. Les sons complémentaires sont également déduits des sons générateurs mais ils se situent dans le registre aigu et sont quasiment inaudibles. Ils forment une sorte de halo. Ces sons additionnels, Grisey les appelle « ombres du son ». A partir de ce moment, le calme s’installe peu à peu jusqu’au chiffre 21 où le vibraphone clôt cette section par un « tremolo imperceptible ».

Figure 90: Extrait de Partiels de Grisey, Section II, ch. 18. — Figure 90: Extrait de *Partiels* de Grisey, Section II, ch. 18.

Dans le Repos II, Grisey met en scène un tableau antinomique par rapport à ce que nous venons de voir précédemment. L’atmosphère y est paisible, éthérée.

Dans sa dimension verticale, dans le Repos II, la texture est au contraire de faible densité, transparente, située dans un registre aigu avec une étendue étroite. Le spectre harmonique est réduit à quelques notes.

Dans sa dimension horizontale, elle est lisse : le discours se polarise autour de la fréquence mi à différentes octaves. Les flûtes rythment ce passage par des fluctuations microtonales quasi périodiques, ce qui correspond à notre extrait de texture lisse dans notre première expérimentation. L’ensemble donne un côté plutôt statique. L’impression globale est celle d’une musique plutôt lancinante.

Figure 91: Extrait de Partiels de Grisey, au début du Repos II, chiffre 22. — Figure 91: Extrait de *Partiels* de Grisey, au début du Repos II, chiffre 22.

2.1.3. Analyse de Textures avec Sonic Visualiser

Sachant que la texture résulte de l’interaction de différentes composantes, nous avons essayé de rendre compte, dans la mesure du possible, de l’émergence perceptive induite par telle ou telle texture, dans un souci d’analyser les différents types de tissage, de grain, de matière sonore.

Pour cela, comme décrit dans l’introduction de ce chapitre, nous avons utilisé les informations audio provenant d’enregistrements. Afin de visualiser au mieux les différents types de textures, nous nous sommes donc servis du logiciel informatique spécialisé Sonic Visualiser.⁴⁹⁸ Le sonagramme nous permet de voir la structure interne du son, en particulier sa décomposition spectrale, car notre oreille n’est pas capable de l’entendre à cause de la trop grande rapidité des évènements. Pour pouvoir percevoir l’entrée des différents partiels du son, d’une durée d’une fraction de seconde, il faudrait pour cela ralentir exagérément le son. Jérôme Baillet souligne que l’idée fondatrice chez Grisey consiste justement à faire le lien entre le ralentissement du temps et l’introspection sonore : « Soit on entend un son dans une temporalité normale, et sa structure interne est inaudible, soit on veut entrer dans le son et on doit dilater le temps. » Pour le musicologue, « la continuité et la lenteur que cherche Grisey trouvent leur matériau sonore dans l’analyse spectrale. »⁴⁹⁹

Dans la Section II, chiffre 12, la texture rugueuse et bruitée est nettement visible sur le sonagramme (au milieu de la figure 92 ci-dessous) où nous observons une sorte de climax textural avec un roulement spectral (en orange sur le sonagramme) particulièrement intense. De même, le coefficient d’énergie dans les bandes critiques nous renseigne sur les différentes strates sonores composées par Grisey afin de nous faire part de la tension significative de son discours musical et textural. Divers effets de distorsion s’organisent dans l’ensemble instrumental (modes de jeux bruités) tout au long de cette section. Cette quête de la fusion est synonyme chez Grisey de recherche des ambiguïtés sonores, notamment au niveau de la perception. Sur ce point, Grisey a bénéficié des travaux de Risset et des psychoacousticiens, sur les illusions perceptives notamment : nous pensons aux soufflets dynamiques décrits en amont de cette analyse.

Jusqu’à 5’30 de cet extrait audio, l’enveloppe spectrale est particulièrement acérée, tendue avec beaucoup d’évènements sombres dans le grave (cf. panneau central et panneau inférieur).

Figure 92: de haut en bas : forme d’onde, sonagramme et roulement spectral, coefficient d’énergie dans les bandes critiques du chiffre 12 à 22, de la Section II au Repos II.

A partir du chiffre 17, le spectre s’élargit avec une largeur fréquentielle plus ample grâce aux notes des bois dans un registre plus étendu qu’au départ. Les différents évènements vont se déplacer dans l’espace pour aller peu à peu vers l’aigu, avec des valeurs longues (ch.19). Nous le voyons très nettement dans les bandes critiques avec une zone très sombre, marquant l’absence d’évènements bruités dans le grave (cf. zone encadrée ci-dessous).

Figure 93 : Coefficient d’énergie dans les bandes critiques.

Les lignes mélodiques sont plus nettes et s’étirent dans le temps, pour arriver au Repos II.

Cette progression est clairement visible sur l’ensemble du panneau de la figure 93 qui représente le coefficient d’énergie dans chaque bande critique.

De même, on peut observer sur la figure suivante le déploiement de cette texture lisse et méditative en contraste avec l’analyse texturale précédente. La forme d’onde est quasi plate, imperturbable (panneau supérieur). Nous pouvons presque visualiser chaque son joué par les instruments sur le sonagramme (panneau central). Le roulement spectral nous renseigne sur le registre aigu de ce repos. La nature lisse de la texture apparaît tout autant dans le panneau inférieur avec cette ligne orange continue.

Figure 94 : de haut en bas : forme d'onde, sonagramme et roulement spectral, coefficient d'énergie dans les bandes critiques au chiffre 22, Repos II. — Figure 94 : de haut en bas : forme d’onde, sonagramme et roulement spectral, coefficient d’énergie dans les bandes critiques au chiffre 22, Repos II.

Dans sa notice de présentation de Dérives, Grisey précisait ceci :

L’image que je désire laisser à ceux pour lesquels le son est insuffisant serait celle d’une mer progressivement agitée jusqu’à une formidable tempête, mais dont les vagues se solidifieraient peu à peu, ne laissant finalement entendre que les craquements isolés des icebergs se chevauchant… Jusqu’au silence, point ultime de cette dérive.⁵⁰⁰

2.2. Mouvement (- vor der Erstarrung) d’Helmut Lachenmann

2.2.1. Présentation

Commandé par l’Ensemble Intercontemporain et créé le 12 novembre 1984 au Théâtre du Rond-Point à Paris sous la direction de Peter Eötvös, Mouvement (- vor der Erstarrung) d’Helmut Lachenmann évoque les derniers mouvements réflexes qui agitent le corps avant de se figer dans la mort : les ultimes convulsions et la pseudo-activité du trépas. L’œuvre est écrite pour quinze instruments : deux flûtes, deux clarinettes, une clarinette basse, deux trompettes, trois stands de percussion (à gauche, à droite et au centre de la scène), deux altos, deux violoncelles et une contrebasse à 5 cordes.

Figure 95 : Disposition des instruments, partition éditée chez Breitkopf & Härtel.

Helmut Lachenmann développe la « musique concrète instrumentale », expression empruntée à la « musique concrète » de Pierre Schaeffer, et pense le son en fonction de l’énergie qui va le produire, en s’éloignant de ce qu’il nomme « le son philharmonique ». Le geste instrumental est au cœur de son processus compositionnel. De ce fait, le type de geste, sa force et sa qualité deviennent, en relation avec le timbre produit, un paramètre déterminant dans la construction de l’œuvre. Lachenmann propose une rupture radicale vis à vis des techniques de jeux instrumentales. Michel Imberty nous relate que « le geste musical ne peut avoir lieu que dans le temps, dans une durée que l’action du corps contribue à sculpter, il est donc de l’ordre du processus et de l’action qui est en train de s’accomplir ».⁵⁰¹ Cette notion de geste chez Lachenmann permet de créer une nouvelle dynamique musicale à travers une corporéité singulière. Dès lors, le compositeur a considérablement élargi la palette des interprètes en investissant le corps de l’instrument allant du son vibré jusqu’au bruit, en inventant une extraordinaire diversité de modes de jeux. Ce qui intéresse Lachenmann lorsqu’il écoute un violoncelle par exemple, c’est le mouvement de l’archet entre la corde. Dans une perception active, le musicien souhaite attirer l’attention de l’auditeur sur ce mouvement, en augmentant excessivement la pression de l’archet par exemple ou au contraire en le faisant passer sans bruit sur le chevalet. Les sons sont alors regroupés au sein de « familles » : sons pressés, soufflés, ponctuels, discontinus, tremblés…etc. Lachenmann nous invite à développer une écoute nouvelle : ce ne sont pas les objets musicaux utilisés en tant que tels qui sont admirables mais le regard que l’on pose sur eux et l’éclairage sous lequel ils apparaissent.

2.2.2. Description

Tout au long de Mouvement (- vor der Erstarrung), Lachenmann écrit que « sa composition ne vise pas à utiliser des sons, mais à l’épuiser dans toutes ses ressources ».⁵⁰² Le matériau est ensuite développé jusqu’à son épuisement. Cette pièce est divisée en trois sections, chacune centrée autour des notions de mouvement, de paralysie et de vide. Nous analyserons la première section jusqu’à la mesure 27.

Figure 96 : Extrait du début de la partition de *Mouvement (- vor der Erstarrung)* de Lachenmann, Breitkopf & Härtel.

Lachenmann décrit sa pièce avec des expressions telles que « archet-machine », « point d’orgue flottant », « champs tremblants » et « frénésie lancinante stop-and-go ». Toute cette première section révèle une vie intense faite de frottements, de grincements, d’effets de souffle, de bruits de grattements et de sons aérés… Le silence y joue également un rôle essentiel. Lachenmann maîtrise la courbure du temps et les anticipations des auditeurs, les surprenant avec ce souci d’enrichir à chaque fois leurs attentes. Par exemple, les trilles des mesures 5 et 7 préparent l’arrivée des courts triolets mesure 9. Dans cette première section, le compositeur utilise une texture aérée, épurée, « bruitiste », où dominent des figures rythmiques simples. Nous verrons avec l’analyse faite avec Sonic Visualiser comment se développe cette texture, soulignant la sensualité et la transcendance expressive de la musique de Lachenmann.

2.2.3. Analyse Texturale avec Sonic Visualiser

Figure 97 : Mouvement (- vor der Erstarrung) de Lachenmann, de la mesure 1 à 27, de haut en bas : forme d'onde, sonagramme et roulement spectral, coefficient d'énergie dans les bandes critiques. — Figure 97 : *Mouvement (- vor der Erstarrung)* de Lachenmann, de la mesure 1 à 27, de haut en bas : forme d’onde, sonagramme et roulement spectral, coefficient d’énergie dans les bandes critiques.

Dès les premières mesures, Lachenmann nous plonge dans une atmosphère singulière avec une texture aérée ponctuée de silences, des modes de jeux bruitées avec des nuances extrêmes, pour terminer sur une certaine densité, amenée par un crescendo textural. Nous pouvons observer dans le panneau inférieur, une texture très fragmentée avec des effets de spatialisation qui ne sont pas sans rappeler l’effet des pièces d’un puzzle. Les savants modes de jeux utilisés créent une certaine ambiguïté perceptive, une sorte d’illusion sonore.

Dans sa dimension verticale, la largeur fréquentielle est éclatée, morcelée. De ce fait, la répartition des évènements simultanés dans les différentes bandes de fréquences est très hétérogène. Le centre de gravité spectrale se caractérise par son côté sombre et mouvant. La richesse des modes de jeux bruités confère à cette texture une certaine légèreté malgré la fragmentation du discours musical. Nous pouvons remarquer de part la multitude d’évènements sonores exposés, une nette ségrégation des flux sonores dans ce début de première période. La texture fait intégralement partie du mouvement généré par le foisonnement du matériau musical.

Dans sa dimension horizontale, nous pouvons observer dans le panneau central et inférieur, la striation constante de la texture obtenue par les sons de respiration, de silences et d’archets. Cette fracture du son nous suggère de découvrir de nouvelles pratiques de perception.

La visualisation texturale de la musique nous renseigne sur la relation entre entendre et voir : dans le cas de la musique de Lachenmann, le chorégraphe Xavier Le Roy a justement produit des versions à la fois rituelles et soustractives d’œuvres telles que Salut für Caudwell (1977) et Mouvement. Une interprétation totalement « muette » de cette dernière œuvre dans laquelle Le Roy laisse les musiciens interpréter l’intégralité de la pièce sans instrument, tend toutefois à simplifier cette relation, que l’on pourrait décrire comme une tentative d’atteinte à l’audition en voyant et en voyant en écoutant. Cette dynamique entre le jeu, le son et la capacité de perception des auditeurs présente un certain caractère théâtral.

Figure 98 : Günther Lebbing et Tom Pauwels in *Mouvements für Lachenmann* de Xavier Le Roy, Tanzquartier Wien, 2005. Photo by Monika Rittershaus.⁵⁰³

2.3. Symphonie Myths de Roger Reynolds (1er mouvement : Futami ga Ura)

2.3.1. Présentation

Le compositeur et théoricien américain Roger Reynolds (né en 1934) se distingue par son intérêt particulier pour la recherche dans les domaines des technologies musicales et des sciences cognitives. Il a contribué notamment au développement des travaux sur le traitement numérique des sons et leur spatialisation sonore dans de nombreuses œuvres, comme Archipelago (1982-83) et The Angel of Death (1998-2001).⁵⁰⁴ Selon Reynolds, l’instrumentalisation du corps par lui-même « impose un certain nombre de contraintes et détermine en conséquence un champ spécifique des possibles ».⁵⁰⁵ En effet, l’audition a une triple fonction de perception sonore, d’orientation spatiale et de centre de l’équilibre. La spatialisation est importante dans l’articulation musicale, parce que, toujours selon le compositeur « l’espace est une dimension immanente de la musique »⁵⁰⁶. Dans la Symphony [Myths] pour orchestre, écrite pour le Suntory Hall à Tokyo en 1990, suite à une commande du compositeur Toru Takemitsu (1930-1996), Reynolds adopte déjà cette conception, une approche compositionnelle singulière : à partir d’une idée initiale généralement extramusicale (ce qu’il nomme « impetus »), il élabore des esquisses, schémas formels, des cartes de textures, etc., visibles dans ses nombreux documents comme dans ses carnets de composition notamment. Cette approche lui a permis de créer des structures de hauteur qui, lorsqu’elles sont associées à des contours mélodiques, à des profils de densité et de texture, etc., confèrent un caractère particulier au matériau thématique. Parfois, non pas une mais plusieurs rangées, issues de la même série de bases, donnaient naissance à un type de matériau musical spécifique que l’on retrouve justement dans cette Symphony [Myths].

2.3.2. Description

Comme expliquée dans sa partition, l’image centrale qui sous-tend cette composition créée en 1990, est une formation rocheuse au large de l’île japonaise de Honshu appelée Futami ga Ura, que Reynolds avait vu à travers la brume lors de sa première visite au Japon vingt-quatre ans plus tôt et qui était restée très vive dans sa mémoire.

Figure 99 : Futami ga Ura. — Figure 99 : *Futami ga Ura.*

Pareillement dans son livre Form and Method ⁵⁰⁷, dans ses premières esquisses du mouvement intitulé Futami ga Ura tiré de sa symphonie Myths, le compositeur a dessiné les deux roches connues sous le nom de Meoto Iwa ou « roches mariées » qui se détachent de la petite ville japonaise de Futami.

Figure 100 : Dessin d'esquisse de son œuvre.508 — Figure 100 : Dessin d’esquisse de son œuvre.⁵⁰⁸

Son dessin comprend la corde qui relie symboliquement les deux rochers et le commentaire suivant : « cette corde est considérée comme étant entrelacée ». De gauche à droite, le dessin se compose du rocher représentant Izanagi (la figure masculine du mythe de la création shinto), la corde qui serre les deux formations et le rocher représentant Izanami (la figure féminine dans le mythe). Reynolds a utilisé des crochets sous les traits du dessin pour indiquer un plan de composition qui allouerait trois minutes pour une section correspondant au rocher Izanagi, six minutes pour l’espace entre les deux rochers et deux minutes pour le rocher Izanami. Le plan en trois parties est essentiellement un plan qui prescrit la traduction des caractéristiques spatiales de cette image très spécifique dans la structure temporelle d’une œuvre musicale.

Reynolds a également préparé pour cette œuvre une carte des différentes textures utilisées dans Symphony [Myths].

Figure 101 : Plan de textures préparatoire à son œuvre

Avec ses schémas formels préconçus, Reynolds « organise le temps pour donner une cohérence entre le matériau et la forme. »⁵⁰⁹ Le compositeur partage l’idée que Samuel Beckett se faisait de la forme. Selon l’écrivain, la forme, pour être artistiquement pertinente, doit comprendre un certain degré de chaos. « Trouver une forme qui accommode le chaos, voilà la tâche d’un artiste d’aujourd’hui »⁵¹⁰, disait Beckett. Rejetant les formes préétablies ou fondées sur une simple périodicité, Reynolds a cherché de nouveaux modèles dans les théories du chaos. Il conçoit ses formes musicales à partir de proportions logarithmiques souvent apériodiques.

Figure 102 : extrait de la partition Symphony [Myths] de Roger Reynolds, éditions Peters. — Figure 102 : extrait de la partition *Symphony [Myths]* de Roger Reynolds, éditions *Peters.*

Lors d’une interview avec Stephen Soderberg, en ce début de siècle, Reynolds relatait ceci : Impulsion, est celui que j’avais utilisé à l’origine dans une série de conférences que j’avais donné à l’Institut Peabody, et l’idée était que, dans l’idéal, il devrait exister au début de l’ouvrage quelque chose qui serve de graine génétique à partir de laquelle le travail jaillit. Maintenant, j’ai décrit cela de différentes manières dans diverses publications et à diverses occasions, mais au fond, une impulsion, tirée du dictionnaire, propulse quelque chose, enflamme quelque chose, le met en mouvement. Et ce que je pense, c’est qu’une impulsion idéale devrait vous indiquer comment la chose devrait évoluer – ce que le processus de croissance ou d’évolution devrait être dans le projet. Mais il devrait en même temps fournir une norme ou une cohérence globale au sein de laquelle les choix sont façonnés et faits. En d’autres termes, une impulsion idéale oriente donc le développement de l’œuvre et contient son potentiel. […] Je vous donnerai l’exemple d’une impulsion idéale – se référant également à Takemitsu – Symphony [Myths]. ⁵¹¹

Voyons, dès à présent, comment la texture se dessine avec Sonic Visualiser, au début de son premier mouvement du début à la mesure 52, chiffre A.

2.3.3. Analyse avec Sonic Visualiser

Les premières mesures dessinent une texture lisse, avec une écriture contrapuntique que l’on discerne parfaitement sur le sonagramme avec le roulement spectral en orange (panneau central).

Cette texture se densifie peu à peu avec des motifs très courts qui émergent sur des valeurs longues comme une sorte de tapis (cf. le panneau inférieur nous renseignant sur le coefficient d’énergie dans les bandes critiques).

Figure 103 : Symphony [Myths], de la mesure 1 à 51. — Figure 103 : *Symphony [Myths]*, de la mesure 1 à 51.
De haut en bas : forme d’onde, sonagramme et roulement spectral, coefficient d’énergie dans les bandes critiques.

Dans sa dimension verticale, nous observons une étendue large, complexe avec beaucoup de micro évènements venant ponctuer le discours musical. En effet, beaucoup d’instruments jouent ensemble et les éléments sonores s’enchaînent les uns aux autres de façon plutôt rapide. Les dissonances sensorielles sont perçues comme étant rugueuses d’une part parce que le nombre de lignes musicales est multiple, d’autre part les rapports d’intervalles et les timbres utilisés confèrent un mode de jeu relativement bruité. L’enveloppe spectrale nous apparaît tendue, acérée.

Dans sa dimension horizontale, les couleurs sonores utilisées dans une musique empreinte d’un certain statisme font ressortir cette densité avec tous ces micro-changements qui transforment la matière sonore perpétuellement mouvante. Ce travail sur la matière sonore, les textures et le rapport au temps se retrouve dans la plupart des œuvres de Reynolds. Par conséquent, la texture dans ce premier mouvement y est tout particulièrement dense, serrée car toutes les familles d’instruments jouent petit à petit ensemble (p. 6 de la partition, par exemple) formant un tissage orchestral complexe. Cette œuvre empreint de spiritualité, de par son contexte, est certainement la plus personnelle de Reynolds.

2.4. Ligeti, Concerto de chambre (1969-1970), 3ème mouvement (Movimento preciso e meccanico)

2.4.1. Présentation

Composé entre 1969 et 1970, écrit pour un ensemble de treize musiciens, couvrant un large spectre de familles instrumentales et de registres (depuis la contrebasse jusqu’à la flûte piccolo), le Concerto de chambre (Kammerkonzert) a été créé le 1er octobre 1970 au festival de Berlin, par l’ensemble Die Reihe sous la direction de Friedrich Cerha. Chaque instrumentiste est traité de manière égale, en tant que virtuose concertant. Six instruments à vent, cinq instruments à cordes, quatre claviers joués par deux musiciens : soit une flûte (qui peut être remplacée par un piccolo), un hautbois (également cor anglais ou hautbois d’amour), une clarinette en si b, une clarinette basse, un cor, un trombone ténor, un piano et un célesta joués par le même interprète, un quatuor à cordes, une contrebasse, un clavecin et un orgue Hammond (ou harmonium) joués par le même exécutant. Ligeti le définissait ainsi : « Une combinaison d’intervalles clairement audible s’efface peu à peu, et à partir de ce brouillage, une combinaison d’intervalles se cristallise. » Pierre Michel souligne que « le concerto de chambre comporte une très grande variété de structures, il pourrait presque résumer à lui seul tous les éléments de langage de la musique de Ligeti à cette époque. »⁵¹² Le premier souci du compositeur semble d’ordre plastique : peaufiner la matière sonore, « ajuster les dynamiques, aucun instrument ne doit émerger », ne cesse de préciser la partition. Cette partition hypnotise l’auditeur, tel un dessin en trompe l’œil du Néerlandais Maurits Cornelis Escher (1898-1972) qui excelle dans l’art de la perspective paradoxale, que Ligeti admirait tant ! Escher est, d’une certaine manière, très proche du compositeur. En effet, si nous observons les gravures ci-dessous d’Escher qui illustrent notre propos, nous remarquons que ce dernier cherche à « tromper » l’observateur, comme le ferait Ligeti dans sa musique. Nous avons d’ailleurs expliqué ce phénomène d’illusions auditives dans le troisième chapitre. Escher utilisera par exemple l’escalier de Penrose⁵¹³ pour créer des scènes surréalistes où les lignes de fuite sont interchangeables.

Figure 104 : Maurits Cornelis Escher, Mouvement perpétuel ou Cascade,1961, Lithographie, 300 mm x 380 mm. — Figure 104 : Maurits Cornelis Escher, *Mouvement perpétuel* ou *Cascade,*1961, Lithographie, 300 mm x 380 mm.

Dans un entretien avec Pierre Michel, Ligeti exprime très clairement sa fascination pour l’artiste et à quel point il a influencé son écriture :

Un de ses dessins les plus typiques s’appelle Métamorphoses. Escher transforme progressivement un carré en animaux (lézards), puis cela devient géométrique ; des hexagones évoquent l’association à une ruche d’abeilles, puis les abeilles sortent en volant et se muent en papillons ou en poissons. L’idée est géniale. Quand j’ai vu cela, j’ai été touché car, dans Continuum, c’est exactement la même chose. J’ai, comme dans cette œuvre d’Escher, une image claire de départ : un intervalle qui est de plus en plus brouillé, puis un nouvel intervalle, brouillé à son tour, etc. Il y a des mondes fantastiques chez Escher, mais cela vaut la peine de les voir très lentement… par moments vous croyez que c’est convexe, à d’autres moments vous croyez que c’est concave, on ne sait plus trop. Cela relève des illusions d’optiques, ou plus simplement de l’ambiguïté de la représentation de l’espace tridimensionnel, perceptif, sur une surface à deux dimensions.⁵¹⁴

Figure 105 : M.C. Escher, Métamorphoses II, xylographie en noir, vert et brun, en vingt blocs, sur trois feuilles combinées 19,2 x 389,5 cm, novembre 1939-mars 1940. — Figure 105 : M.C. Escher, *Métamorphoses II*, xylographie en noir, vert et brun, en vingt blocs, sur trois feuilles combinées 19,2 x 389,5 cm, novembre 1939-mars 1940.

Le compositeur aime intimement utiliser ces effets d’illusion :

Je travaille souvent en me servant d’illusions acoustiques, très analogues aux illusions optiques, les fausses perspectives… Nous ne connaissons pas vraiment très bien les illusions acoustiques. Mais elles sont très analogues et on peut faire des choses très intéressantes dans ce domaine. Par exemple produire l’illusion d’une certaine succession rythmique qui n’est pas vraiment jouée…⁵¹⁵

Les quatre mouvements de l’œuvre tissent une large texture micro-polyphonique, où un ambitus de hauteurs s’élargit peu à peu, depuis le demi-ton jusqu’à la septième majeure. Nous nous intéresserons tout particulièrement à cette horlogerie implacable diaboliquement détraquée du troisième mouvement, Movimento preciso e meccanico, réminiscence de l’orchestre de métronomes désynchronisés du Poème symphonique (1962). Ligeti y façonne un véritable mécanisme de précision qui, comme souvent dans sa musique, s’auto-détruit.

2.4.2. Description

Ce troisième mouvement du Concerto de Chambre reflète une des obsessions récurrentes du compositeur, à savoir celle des objets mécaniques en général et des horloges plus particulièrement, que nous retrouvons également dans Continuum pour clavecin (1968). « La troisième partie est quasi mécanique, comme si un étrange appareil de précision à moitié détraqué se mettait en mouvement » précise Ligeti au sujet du Kammerkonzert.⁵¹⁶ Ainsi, cette « polyphonie saturée », technique d’écriture chère à Ligeti, se retrouve dans la plupart de ses œuvres. Dans Kammerkonzert, il utilise des procédés d’écriture rigoureux et empruntés à la musique « traditionnelle » avec l’emploi du canon (mais de manière non conventionnelle). D’après Ligeti, la technique du canon permet de structurer et de coordonner les éléments verticaux et horizontaux afin de construire les réseaux micro-polyphoniques :

Si je veux remplir un espace peu à peu, graduellement, pas avec un cluster, mais avec une sonorité assez épaisse, le canon à l’unisson est un moyen très approprié, car je peux avoir une succession de plusieurs sons, donc une ligne mélodique, et si je fais de cette succession un canon, il y a alors une deuxième ligne mélodique qui l’imite, puis une troisième, etc. […] Cela signifie que ce que j’ai comme succession va devenir simultanéité ; il y a alors unité entre simultanéité et succession.⁵¹⁷

Figure 106 : extrait de la partition de Ligeti, Concerto de Chambre, Movimento preciso e meccanico, p. 61, Edition Schott. — Figure 106 : extrait de la partition de Ligeti, *Concerto de Chambre, Movimento preciso e meccanico*, p. 61, Edition Schott.

Selon le musicologue Jean-Pierre Dambricourt, ce troisième mouvement se découperait en trois parties distinctes : du début à la lettre C, de C à la mesure 40, puis de la lettre H jusqu’à la fin.⁵¹⁸ Tout le début de cette première section s’articule autour d’une seule note (mi), où Ligeti propose une extension progressive de l’ambitus. Un cluster se forme peu à peu avec un ambitus do-fa# à la sixième mesure. À partir de la mesure 8, de longues tenues apparaissent discrètement chez les bois et à la contrebasse. Cette texture saisissante a la particularité d’allier des sons incisifs à des sons fondus : ainsi de la mesure 8 à 11, les pizzicatos des cordes se mêlent subtilement au fondu des tenues de bois, ponctuée par l’entrée imperceptible de la contrebasse. Cet alliage entre les timbres et les sensations révèle une organisation timbrique et texturale d’une grande finesse. Les trois familles instrumentales (vents, claviers et cordes) évoluent progressivement, avec les vents au départ, puis le piano et les cordes en pizzicato. Au niveau rythmique, cela s’articule de la même manière. Nous assistons à un épaississement de la matière sonore, grâce à la superposition progressive de ces couches sonores, formant des clusters harmoniques : une sorte de fondu enchainé de timbres entre les bois puis les cordes.

Figure 107 : Paul Klee, Chemin principal et chemins secondaires (Hauptwege-und Nebenwege) 1929, huile sur toile de 83 x 67 cm, conservé à Cologne, au Wallraf-Richartz und Ludwig Museum. — Figure 107 : Paul Klee, *Chemin principal et chemins secondaires (Hauptwege-und Nebenwege)* 1929, huile sur toile de 83 x 67 cm, conservé à Cologne, au *Wallraf-Richartz und Ludwig Museum*.⁵¹⁹

Le tableau de Paul Klee ci-dessus explore la vision texturale de Ligeti. Dambricourt souligne ceci à propos de ce tableau : « Ligeti déclare souvent trouver dans la peinture de Paul Klee un travail sur la perception des lignes, des plans et des couleurs comparables au sien. »

La seconde partie débute de la même manière que la précédente avec un focus sur une seule note, la bémol (mesure 12) répartie sur un ambitus de quatre octaves. Alors que nous assistions à une mécanique se grippant peu à peu dans la première section, cette seconde section évoque plus un « emballement délirant » selon les mots de Dambricourt. Mis à part la technique du canon, Ligeti aime utiliser tout particulièrement ici, le « total chromatique » afin de remplir son espace sonore. Á partir du la b de la mesure 12, un cluster se forme par canon chromatique, superposant au total 11 sons. Mesure 38, un nouveau cluster, joué au piano et au clavecin le remplacera.

La formation de ce cluster se fait selon la proposition du schéma ci-après de la musicologue Marie Delcambre-Monpoël. Il nous a semblé fort intéressant d’être mentionnée dans ce chapitre.

Figure 108 : De la lettre C à E, schéma de la formation progressive du cluster, proposé par la musicologue Marie Delcambre-Monpoël. Les chiffres indiqués correspondent aux mesures.⁵²⁰

Dès la mesure 32, les pizzicati vigoureux des cordes, sul ponticello, joués « à la Bartok » amorcent une séquence de mécanique imperturbable où se jouent des moments d’une rare complexité rythmique. Dambricourt parle de « polymétrie » plutôt que de polyrythmie, car cela supposerait une pulsation commune. En effet, c’est surtout un jeu subtil sur la perception des vitesses. Il précise : « Le temps s’écoule à une vitesse différente pour chaque « horloge » dont le fonctionnement, qui plus est, peut lui-même varier. »⁵²¹

Pour clore ce troisième mouvement, la troisième et dernière section intervient à la mesure 41, lettre H. La rupture est brutale : le triple pizzicati des cordes joués double piano avec des arpèges très rapides forment peu à peu une sorte de tapis texturé. Nous retrouvons cette polymétrie : les différents rythmes se figent sur un cluster qui n’évolue pas. L’effet obtenu correspond à une horloge détraquée. Les vitesses de chaque instrument sont différenciées dans des rapports qui n’autorisent plus la simultanéité des sons mais a contrario appèlent à de subtils décalages qui introduisent à leur tour la notion de déphasage. La fascination de Ligeti pour ces mécaniques détraquées vient de ses lectures et en particulier des livres de l’écrivain hongrois Gyula Krudy (1878-1933) : « J’ai repris dans ma musique, inconsciemment je pense deux choses de Krudy: un sentiment de non écoulement du temps et un sens de l’immobilité».⁵²² A la mesure 53, les treize instrumentistes jouent tous ensemble sur le total chromatique, réparti sur presque cinq octaves. La texture y est acérée, agressive, générée par des sons aigus stridents. A partir de la mesure 60, nous assistons à l’épuisement de ce monde avec des variations de timbres sur des rythmes irréguliers. Ligeti utilise pour cela des trilles et un cluster se glissant d’un timbre à l’autre (si à mi b).

2.4.3. Analyse avec Sonic Visualiser

Ligeti articule les différentes voix simultanément de façon systématique : ce qui techniquement permet de faire évoluer la notion de polyphonie vers la notion de texture. Notre choix d’analyser la texture avec Sonic Visualiser nous permettra de discerner les « masses, nuages sonores, cluster, trames, tissus, micropolyphonie, mécanique imperturbable, polyrythmie, illusion, statisme, limites »⁵²³, autant de termes que nous associons le plus souvent à la musique du compositeur.

Dans une conférence sur le Kammerkonzert de Ligeti en 1978, Pierre Boulez décrit les textures ainsi : « comme quand on écrit sur du papier mouillé on a, tout à coup, non seulement la ligne, mais vous avez la ligne qui se répand et l’encre qui imbibe le papier. Mais seulement vous avez toujours la ligne ».⁵²⁴

Figure 109 : Kammerkonzert de Ligeti, première partie : du début à la lettre C. — Figure 109 : *Kammerkonzert* de Ligeti, première partie : du début à la lettre C.

Dans cette première partie, dans sa dimension horizontale, nous observons dans le panneau inférieur (coefficient d’énergie dans les bandes critiques), une ligne orangée traversante correspondant à la note mi. Ligeti s’appuie sur cette note afin de construire peu à peu une sorte de climax orchestral pour arriver à une texture incisive, où se dégage une certaine tension dramatique. La texture est mouvante, avec des accents et des timbres inattendus. La matière sonore se densifie progressivement, ponctuée d’évènements brefs, pour revenir à un calme apparent mais pas véritable (visible sur l’ensemble du document ci-dessus). Ce repos momentané n’est pas sans rappeler ceux de Grisey avec une texture composée de longues tenues, nous permettant d’avoir le sentiment d’une sincère détente. Dans sa dimension verticale, nous pouvons parler d’une texture singulière alliant des sons incisifs à des sons fondus. La largeur fréquentielle est hétérogène avec un mode de jeux bruités. L’écriture contrapuntique confère à cette texture une certaine rugosité, de par le nombre de lignes utilisées. Son enveloppe spectrale est froide, tendue. Ligeti manipule des indices de groupement séquentiel afin de souligner la complexité de sa polyphonie.

Figure 110 : *Kammerkonzert* de Ligeti, deuxième partie : de la lettre C à la mesure 40 inclus.

Au sein de cette deuxième partie, nous pouvons immédiatement remarquer la densité de cette nouvelle texture sur le sonagramme (panneau central), s’apparentant à un « continuum granuleux ».⁵²⁵ Un ostinato rythmique implacable se déploie avec des superpositions de vitesses différentes (polytempi). Ligeti écrit des notes répétées évoluant de manière chromatique à partir du la b en employant la technique du canon. Nous pourrions faire le rapprochement avec les musiques traditionnelles d’Afrique centrale, ce que l’ethnomusicologue Simah Arom nomme « ostinato à variations ».⁵²⁶ Le matériau rythmique est souvent en conflit avec la pulsation :

Dans des musiques cycliques fondées sur la répétition et la variation, il est important afin d’éviter la monotonie, que soit maintenue une tension permanente. Or, c’est précisément par le biais de la polysémie des structures rythmiques, obtenue grâce à l’ambiguïté qui leur est inhérente, que cette tension ne cesse qu’avec la musique elle-même.⁵²⁷

En somme, l’écriture texturale de Ligeti se rapproche du contrepoint tel qu’il est pratiqué dans les musiques africaines.

Dans sa dimension verticale, nous pouvons observer un net changement de texture avec un élargissement spectral conférant un caractère plus dense et opaque. La largeur fréquentielle est plutôt homogène dans cette deuxième partie. Son enveloppe spectrale est de plus en plus tendue, acérée voire agressive. Vers la fin de cette deuxième partie, nous avons la sensation d’une fusion fugitive des différents flux auditifs grâce notamment à la comodulation des amplitudes et du synchronisme des attaques.

Dans sa dimension horizontale, nous voyons clairement se dessiner dans le panneau central notamment, un nombre élevé de striations jouées à un tempo très rapide. Le caractère pulsé de cette texture va évoluer vers un climax timbral et polyrythmique intense. Cette « polymétrie » dont parle Dambricourt, met en avant cette mécanique imperturbable en perpétuel mouvement. La densité temporelle est fort compacte avec un jeu subtil de flux auditifs très variés.

Figure 111 : Kammerkonzert de Ligeti, troisième partie : de la mesure 41 à la fin du troisième mouvement. — Figure 111 : *Kammerkonzert* de Ligeti, troisième partie : de la mesure 41 à la fin du troisième mouvement.

Dans cette ultime partie, Ligeti rompt brutalement avec la texture précédente, en réduisant significativement sa largeur fréquentielle avec un centre de gravité spectral beaucoup plus grave, visible sur l’ensemble du document ci-dessous. Un sentiment de douceur émerge un instant grâce à la réduction des dissonances sensorielles d’une part et du subtil alliage de timbres d’autre part. La nuance double piano maximise cet effet. Dans sa dimension horizontale, sur ce même moment, la faible densité des évènements engendre un certain statisme.

Puis le « mécanisme de l’horloge » se détraque franchement avec le déplacement du spectre vers l’aigu et des dissonances sensorielles beaucoup plus marquées, conférant à cette texture un caractère rugueux et glacé à la fois. Ligeti articule les différents flux auditifs de manière simultanée, tout en faisant varier subtilement les vitesses de chaque instrument. Les différents décalages obtenus introduisent cette notion de « déphasage », chère au compositeur. Nous retrouvons tout particulièrement ce procédé d’écriture dans Continuum pour clavecin (1968). Cette polyphonie saturée met en valeur cette texture grâce à l’ambitus et le registre utilisé.

3. Expérimentation n°1 : Représentation cognitive des textures chez l’enfant sourd

3.1. Méthode

3.1.1. Participants

3.1.1.1. Le groupe expérimental

Cette étude a été menée auprès de 50 enfants dont 26 enfants sourds implantés, scolarisés au CEOP (Centre Expérimental Orthophonique et Pédagogique) à Paris, et auprès de 24 enfants normaux-entendants scolarisés à Chambœuf en Côte d’Or. Les enfants sont âgés de 6 à 12 ans répartis en deux groupes distincts.

Le groupe expérimental est composé de 26 enfants sourds dont 13 garçons et 13 filles. Tous présentent une surdité congénitale profonde, sauf un, ayant une surdité moyenne limite sévère. Les enfants sont répartis en primaire du CP au CM2. 14 enfants portent un implant cochléaire et une prothèse controlatérale, 12 sont bi-implantés. 18 enfants ont été implantés avant l’âge de 2 ans (implantation pré-linguale). Ils ont tous bénéficié d’une éducation auditive dès leur plus jeune âge dispensée par des orthophonistes. Les enfants de ce groupe ont suivi au moins un an des séances de musique hebdomadaire avec un professeur spécialisée pour enfants sourds et musicienne, pour les plus jeunes, et 5 ans pour les plus âgés.

Le projet de cet établissement est bilingue : apprentissage de la langue des signes française (L.S.F.) et développement de la langue orale française accompagnée du langage parlé complété (L.P.C.).

3.1.1.2. Le groupe contrôle

Ce groupe est composé de 22 enfants normo-entendants (11 garçons et 11 filles), âgés de 6 à 12 ans, scolarisés en primaire du CP au CM2, tout comme le groupe expérimental. A la discrétion des professeurs des écoles et en accord avec les programmes de l’éducation nationale, les enfants

pouvaient bénéficier d’un temps musical de 45mn à 1h30 par semaine.

3.1.2. Matériel

L’expérience a été réalisée sur un ordinateur portable muni de haut parleurs de très bonne qualité au sein des deux établissements différents : au CEOP ainsi qu’à l’école élémentaire de Chambœuf. Les fichiers audio sont de qualité 44 100 Hz, 16 bit, extraits de CD commercialisés. Le programme est réalisé avec Max MSP tournant avec Max Runtime.⁵²⁸

3.1.2.1. Matériel musical

Nous avons utilisé 24 extraits de musique contemporaine en sélectionnant 6 extraits pour chaque texture : la texture aérée, dense, lisse et pulsée. Voici la liste des œuvres utilisées pour différencier les différents types de textures : 24 extraits (20 sec. ± 1).

– Concernant les extraits ayant des textures aérées :

Péter Eötvös (1944 – en vie), compositeur et chef d’orchestre hongrois, Chinese Opera pour ensemble (1986), extrait au début du morceau.
Morton Feldman (1926-1987), compositeur américain, Piano and orchestra (1975) extrait à 1’17 minute.
Helmut Lachenmann (1935- en vie), compositeur allemand, Mouvement (- vor der Erstarrung) pour ensemble (1984) extrait du début du morceau.
Helmut Lachenmann (1935- en vie), compositeur allemand, Schwankungen am Rand pour cuivres et cordes (1975) extrait à 1’05 minute.
Karlheinz Stockhausen (1928-2007), compositeur allemand, Gruppen for three orchestras (1955) extrait à 8’38 minutes.
Tōru Takemitsu (1930-1996), compositeur japonais, Tree lines (1988) extrait du début du morceau.

– Concernant les extraits ayant des textures lisses :

Péter Eötvös (1944 – en vie), compositeur et chef d’orchestre Hongrois, Chinese Opera pour ensemble (1986), extrait à 4’33.
Gerard Grisey (1946-1998), compositeur français, Partiels pour dix-huit musiciens (1975) extrait à 6’05 minutes.
Georg Friedrich Haas (1953- en vie), compositeur autrichien, Wer, wenn ich schriee, hörte mich, pour percussions et ensemble (1999), extrait à 1’08 minute.
György Ligeti (1923-2006), compositeur hongrois naturalisé autrichien, Lontano pour grand orchestre (1967) extrait à 19 seconde.
Tristan Murail (1947-en vie), compositeur français, Le lac pour grand ensemble (2001) extrait à 5’06 minutes.
Roger Reynolds (1934- en vie), compositeur Américain, Symphony [Myths] pour orchestre (1990) extrait à 2’55 minutes.

– Concernant les extraits ayant des textures denses :

Hugues Dufourt (1943-en vie), compositeur français, Le Déluge d’après Poussin pour orchestre (2001) extrait à 28’45 minutes.
Pascal Dusapin (1955- en vie) compositeur français, Extenso solo n° 2 pour orchestre (1994) extrait à 4’55 minutes.
Tristan Murail (1947-en vie), compositeur français, Le lac pour grand ensemble (2001) extrait à 18’36 minutes.
Roger Reynolds, (1934- en vie), compositeur américain, Symphony [Myths] pour orchestre (1990) extrait à 20 seconde.
Giacinto Scelsi (1905-1988), compositeur italien, Konx-Om-Pax pour grand orchestre, choeur et orgue (1969) extrait à 3’38 minutes.
Iannis Xenakis (1922-2001), compositeur grec, Tracées pour 94 musiciens (1987) extrait à 30 secondes.

– Concernant les extraits ayant des textures pulsées :

Pierre Boulez (1925-2016), compositeur français, Éclat/Multiples pour orchestre (1970) extrait au début du morceau.
Pierre Boulez (1925-2016), compositeur français, Répons pour six solistes, ensemble de chambre, sons électroniques et électronique en direct (1982) extrait au début du morceau.
Pierre Boulez (1925-2016), compositeur français, Rituel in memoriam Bruno Maderna pour orchestre en huit groupes (1974-1975) extrait à 3’02 minutes.
Peter Eötvös (1944 – en vie), compositeur et chef d’orchestre hongrois, Chinese Opera pour ensemble (1986) extrait à 58 secondes.
Georg Friedrich Haas (1953- en vie), compositeur autrichien, Wer, wenn ich schriee, hörte mich, pour percussions et ensemble (1999), extrait à 7’31 minutes.
György Ligeti (1923-2006) compositeur hongrois naturalisé autrichien, Kammerkonzert pour treize instrumentistes (1970) extrait à 1’24 minute.

Tableau 2 : Abréviations : P (pulsé), A (aéré), D (dense), L (lisse) et le nom de fichier : La qualité de texture, le nom du compositeur, le nom abrégé de l’œuvre avec éventuellement le numéro de mouvement et un chiffre indiquant la position de l’extrait - en secondes - dans le fichier original. Ex.P_Boulez_Rituel_182.wav — Tableau 2 : Abréviations : P (pulsé), A (aéré), D (dense), L (lisse) et le nom de fichier : La qualité de texture, le nom du compositeur, le nom abrégé de l’œuvre avec éventuellement le numéro de mouvement et un chiffre indiquant la position de l’extrait – en secondes – dans le fichier original. Ex.P_Boulez_Rituel_182.wav

Nous avons sélectionné ces quatre types de textures en nous interrogeant sur l’effet qu’elles pourraient produire et si ces effets pourraient conditionnés un classement pertinent.

La texture aérée nous plonge dans un espace intemporel dicté par des sons de façon aléatoire. La présence des silences est caractéristique de cette texture. Celle-ci est très fragmentée avec des effets de spatialisation, le plus souvent avec un mode de jeux bruités et des rythmes apériodiques.

C’est pourquoi la texture que nous qualifions de « lisse » suggère une atmosphère paisible et éthérée, avec un spectre harmonique plutôt réduit, avec peu d’éléments rythmiques, sur des longues tenues renvoyant à un certain immobilisme. Nous n’avons pas réellement de contrastes ou de changements bruts entre les sons.

La texture dense se caractérise par un tissu orchestral complexe où toutes les familles d’instruments sont représentées. Les dissonances sensorielles pourront être perçues comme étant rugueuses d’une part parce que le nombre de lignes musicales est multiple, d’autre part car les rapports d’intervalles et les timbres utilisés confèrent un mode de jeu plutôt bruité. L’enveloppe spectrale sera le plus souvent tendue, acérée.

Quant à la texture pulsée, des éléments rythmiques périodiques la caractérisent, avec un ambitus large. Les sons se superposent, s’ajoutent. Il émerge des lignes mélodiques bien spécifiques conférant à une ambiance chaotique.

3.1.3. Procédure

La capture d’écran ci-dessous correspond à l’image du logiciel Max MSP à son ouverture avant que le sujet commence l’expérience.

Figure 112 : Capture d'écran d'une passation finalisée avec un enfant avec l'explication donnée oralement accompagnée ou pas de LPC (Langage Parlé Complété) ou proposée en Langue des Signes Française (L.S.F.). — Figure 112 : Capture d’écran d’une passation finalisée avec un enfant avec l’explication donnée oralement accompagnée ou pas de LPC (Langage Parlé Complété) ou proposée en Langue des Signes Française (L.S.F.).

A droite, nous pouvons voir les consignes qui ont été données à nos sujets, consignes que nous lisions avec eux en leur donnant des explications complémentaires si besoin. Ainsi, nous pouvons voir 24 pastilles entourées d’un rond rouge orangé réparties en bordure du carré jaune. Ce carré jaune est divisé en quatre parties égales. Les pastilles sont toutes numérotées de 1 à 24. Chaque pastille correspond à un extrait de musique contemporaine d’environ 20 secondes (cf matériel musical en amont). Il est important de préciser qu’à chaque ouverture du logiciel, les extraits musicaux sont associés de manière aléatoire aux différentes pastilles, de façon à ce que la pastille n°1, par exemple, ne correspond pas toujours au même extrait, etc. Ceci afin de pouvoir écarter un biais d’ordre entre les extraits musicaux et le numéro des pastilles.

Chaque sujet devait cliquer sur la pastille de son choix pour démarrer l’expérimentation : l’extrait correspondant, présenté de manière aléatoire pour chaque sujet, pouvait être arrêté au bout de 10 secondes d’écoute. Les sujets pouvaient réécouter plusieurs fois les extraits à tout moment quand ils en ressentaient le besoin, afin de réaliser la tâche demandée le mieux possible et d’être sûr de leur classement. Au fur et à mesure de leur écoute, les participants devaient déplacer les pastilles afin de former des groupes. Ils pouvaient faire un nombre de groupes à leur convenance, et chaque groupe pouvait contenir autant d’extraits qu’ils le souhaitaient. Les résultats d’un sujet à l’autre se sont avérés être relativement différents en terme de groupement notamment.

Figure 113 : Exemples de classements réalisés par deux enfants sourds implantés du groupe expérimental.

Figure 114 : Exemples de classements réalisés par deux enfants normo-entendants du groupe contrôle.

Nous avons rencontré des classements divers : le nombre de groupes pouvant varier entre 2 et 9 selon les sujets. Bien que le plus grand nombre ait réalisé 4 groupes distincts.

Après avoir finalisé l’expérimentation, nous demandions aux sujets d’exprimer leurs ressentis. Concernant les enfants sourds, la plupart ont eu besoin de commenter leurs actions et d’exprimer leurs émotions spontanément : « Cette musique me fait penser aux méchants dans Star Wars » (Aydane, 8 ans) ou encore « J’imagine être en haut de cette colline où tout est calme et paisible » (Anaïs, 12 ans). La plupart des enfants sourds ont eu besoin d’associer à leur écoute une information visuelle ou une émotion. La question est de savoir si c’est la musique contemporaine qui suscite ce type de lien ou bien plus précisément la texture. Nous verrons dans nos résultats et dans notre discussion si nous aurons des éléments de réponses à cette question. Nous avons pu collecter un grand nombre de réponses selon les sujets : 49 chez les enfants et 30 chez les adultes. Nous détaillerons dans un second temps cette dernière population.

Nous avons émis l’hypothèse que la musique contemporaine serait plus porteuse de sens et d’émotions pour les enfants sourds que la musique « tonale ».

3.2. Résultats

3.2.1. Le groupe expérimental

Figure 115 : MDS des enfants sourds implantés (cooccurrence)

Pour analyser les résultats, nous avons utilisé la méthode de Multidimensional scaling (MDS) afin de pouvoir visualiser les similarités dans les données. Deux méthodes de MDS ont été utilisées : la première se base sur un algorithme qui calcule les distances entre les pastilles et la deuxième se base sur une matrice de cooccurrence relevée manuellement. Il nous est apparu nécessaire de vérifier l’efficience de l’algorithme avec cette seconde analyse.

La MDS est une méthode couramment employée dans les études sur les émotions notamment. Nous pensons à l’étude d’Emmanuel Bigand et collaborateurs, Multidimensional scaling of emotional responses to music : the effects of musical expertise and of the duration of the excerpts (2005).⁵²⁹

Pour commencer, nous constatons un classement remarquable chez ces enfants que ce soit avec la MDS à partir de données relevées à la main (fig. 115) et la MDS réalisée à partir de l’algorithme de calcul des distances (fig. 116). Les différentes textures entendues sont très bien discriminées et classées. Que ce soit dans la MDS relevée à la main ou celle réalisée à partir de l’algorithme de calcul des distances, les textures denses sont bien opposées aux textures aérées sur l’axe 2. Les textures lisses sont opposées aux pulsées sur l’axe 1. Dans la MDS relevée à la main seul un extrait est isolé (L15 Wer de Haas) et dans celle produite à partir de l’algorithme, nous remarquons que seul D10 (Reynolds Myths) est isolé. Cette différence provient de la façon de calculer les MDS, c’est un artefact des méthodes.

Sur la MDS (figure 115), les textures lisses sont les mieux regroupées, à part l’extrait L15 (Wer de Haas) qui est éloignée de toutes les textures représentées. Concernant les textures aérées, les extraits A1-A3-A4-A5 sont parfaitement classés (Chinese Opera d’Eotvös, les Lachenmann et Gruppen de Stockhausen). Piano and orchestra de Feldman (A2) apparaît légèrement plus distant des autres, tout comme Tree Lines de Takemitsu (A6), mais dans un degré moindre. Les textures denses sont fort bien regroupées également. Cependant, l’extrait D8 se détache très légèrement des autres : Extenso de Dusapin. Quant aux textures pulsées, très bien groupées, Repons de Boulez semble se rapprocher des extraits denses.

Si nous comparons ces mêmes réponses avec la MDS ci-dessous (calcul mathématique des distances entre chaque pastille), nous pouvons remarquer 4 groupes distincts également. Néanmoins, avec cette MDS, dans les textures denses, l’extrait D10, Myths de Reynolds se détache significativement du groupe.

Figure 116 : MDS des enfants sourds implantés (à partir d’un algorithme de calcul des distances entre chaque pastille).

Au vu de tous ces résultats, nous pouvons affirmer que les enfants sourds implantés sont tout à fait capables de différencier des textures à partir de musiques contemporaines.

Nous avons proposé cette expérimentation auprès d’enfants normo-entendants qui constituent notre groupe contrôle. Nous supposons que ces derniers seront encore plus performants pour classer ces textures.

3.2.2. Le groupe contrôle

Figure 117 : MDS des enfants normo-entendants (cooccurrence).

La MDS (fig. 117) nous montre une classification étonnamment beaucoup moins nette que celle des enfants sourds IC.

Nous pouvons remarquer que les extraits ayant une texture lisse sont les mieux classés tout comme chez les enfants sourds, avec Wer de Haas (L15) qui se retrouve également isolé. Ici, il est classé entre des textures denses et pulsées. Les impulsions apériodiques et le registre grave propre à cet extrait semblent avoir déstabiliser les enfants. Les textures pulsées sont quant à elles éclatées, tantôt au milieu des aérées, tantôt proches des denses. Rituels de Boulez (P21) cohabite près du Concerto de chambre de Ligeti (P24) tout près des textures aérées. Repons de Boulez (P20) est au carrefour de deux textures aérées (A2, Piano and orchestra de Feldman et A3, Mouvement de Lachenmann) et d’une texture dense (D8, Extenso de Dusapin).

Le groupement des textures denses est plus cohérent, même si l’extrait P23 est classé parmi elles (Wer de Haas pulsée).

Pour essayer de comprendre la confusion entre les textures que l’on a pu constater chez les enfants normo-entendants, nous avons réécouté attentivement les stimuli. Il s’avère que sur l’axe horizontale, les enfants ont regroupé à gauche des extraits avec des attaques rapides (beaucoup de sons de percussions) et à droite des extraits avec sons aigus ayant des attaques lentes. Sur l’axe vertical, il semble que les enfants aient fait leur regroupement sur la base de la brillance du timbre et sur la dissonance. Les extraits les plus en haut ont tendance à avoir un timbre plus clair et contenant moins de dissonances, alors que ceux placés en bas, sont plus sombres et plus dissonants.

Tous ces résultats chez les enfants nous conduisent à nous intéresser aux résultats chez les adultes NE musiciens vs non musiciens.

3.2.3. Participants adultes

Cette expérimentation a été menée par une étudiante en musicologie dans le cadre de son mémoire de master 1.⁵³⁰ Chloé Beyrand a utilisé notre corpus musical, afin de les corréler aux émotions.

Pour cette expérience, elle a sélectionné 30 sujets : 15 musiciens et 15 non musiciens, le nombre de femmes et d’hommes étant sensiblement le même et tous ses sujets ont entre 20 et 40 ans. Nous entendons par « musicien », un sujet ayant effectué au moins 6 années de pratique et de formation musicale encadrées par des professionnels (conservatoire, école de musique). Concernant nos sujets non musiciens, ils devaient ne jamais avoir reçu de formation musicale par un professionnel ni être un musicien autodidacte.

3.2.3.1. Résultats

Figure 118 : MDS des adultes normo-entendants musiciens (à partir d'un algorithme de calcul des distances entre chaque pastille). — Figure 118 : MDS des adultes normo-entendants musiciens (à partir d’un algorithme de calcul des distances entre chaque pastille).

Figure 119 : MDS des adultes normo-entendants non-musiciens (à partir d'un algorithme de calcul des distances entre chaque pastille). — Figure 119 : MDS des adultes normo-entendants non-musiciens (à partir d’un algorithme de calcul des distances entre chaque pastille).

Chez les musiciens, nous pouvons constater un bon classement des différentes textures, un classement cohérent (cf. groupements de couleurs).

Chez les non-musiciens, les résultats sont moins bons. Ils classent bien les textures pulsées et denses alors que le classement des textures aérées et lisses n’est pas réussi. Nous pouvons rapprocher ces résultats avec ceux des enfants normo-entendants.

Nous remarquons que ce sont les extraits correspondants à la texture dense qui ont été correctement perçus par les deux groupes de participants. De même, mais de façon moindre, la texture pulsée a plutôt bien été reconnue par les deux groupes, par contre, aucun des deux groupes n’ont intégré l’extrait P23 (Wer wenn ich schriee de Friedrich Haas) dans une texture significative pour eux, ce qui pourrait expliquer son isolement. La texture aérée n’a pas toujours été bien perçue, certains extraits sont assez dispersés, surtout chez les non musiciens. De la même manière, la texture lisse n’a pas toujours été bien perçue, surtout les extrait L16 (Lontano de György Ligeti) et L17 (Le lac de Tristan Murail) qui ont plutôt été regroupés avec les extraits correspondants à la texture aérée.

Au vu de l’ensemble de ces résultats, nous avons entrepris une autre expérimentation avec les enfants où il s’agissait de classer des extraits musicaux en fonction de leur contenu émotionnel : la gaieté, la colère, la sérénité et la tristesse.

Notre principale hypothèse serait de voir si les enfants normo-entendants seraient meilleurs dans cette tâche, puisque nous avons utilisés des musiques tonales cette fois-ci. Est-ce que les enfants sourds implantés seront tout aussi performants également ? Sachant que la perception de la hauteur est plutôt déficitaire, même avec un implant cochléaire.

4. Expérimentation n°2 : Représentation émotionnelle des textures chez l’enfant sourd implanté

4.1. Méthode

4.1.1. Participants

Cette étude a été menée auprès de 58 enfants dont 27 enfants sourds implantés, scolarisés au CEOP à Paris, et auprès de 8 enfants normo-entendants scolarisés à Chambœuf et de 23 enfants normo-entendants à l’école élémentaire de Gevrey en Côte d’Or. Les enfants sont âgés de 5 à 12 ans répartis en deux groupes distincts.

4.1.1.1. Le groupe expérimental

Le groupe expérimental est composé de 27 enfants sourds dont 14 garçons et 13 filles âgés de 5 à 12 ans. 17 enfants ont participé à l’expérimentation précédente. Tous présentent une surdité congénitale profonde. Les enfants sont répartis en primaire du CP au CM2. 12 enfants portent un implant cochléaire et une prothèse controlatérale, 15 sont bi-implantés. 20 enfants ont été implantés avant l’âge de 2 ans (implantation pré-linguale). Ils ont tous bénéficié d’une éducation auditive dès leur plus jeune âge dispensée par des orthophonistes. Les conditions restent identiques à la première expérimentation : les enfants ont donc suivi au moins un an des séances de musique hebdomadaire avec un professeur spécialisée pour enfants sourds et musicienne, pour les plus jeunes, et 5 ans pour les plus âgés. Pour rappel, le projet de cet établissement est bilingue.

4.1.1.2. Le groupe contrôle

Ce groupe est composé de 31 enfants Normaux-entendants (16 garçons et 15 filles), âgés de 6 à 12 ans, scolarisés en primaire du CP au CM2, mais cette fois-ci dans deux écoles différentes. A la discrétion des professeurs des écoles et en accord avec les programmes de l’éducation nationale, les enfants pouvaient bénéficier d’un temps musical de 45mn à 1h30 par semaine.

4.1.2. Matériel

L’expérience a été réalisée sur un ordinateur portable muni de haut parleurs de très bonne qualité au sein des deux établissements différents : au CEOP ainsi que dans les écoles élémentaires de Chambœuf et Gevrey. Les fichiers audio sont de qualité 44 100 Hz, 16 bit, extraits de CD commercialisés. Le programme est réalisé avec Max MSP tournant avec Max Runtime.

4.1.2.1. Matériel musical

Nous avons utilisé 24 extraits de musique classique instrumentale avec les mêmes textures que l’expérimentation précédente, à savoir des textures denses, pulsées, aérées et lisses, corrélées cette fois-ci à quatre émotions fondamentales : la colère, la gaieté, la peur et la sérénité. La durée de chaque extrait est d’environ 15 à 20 s, recouvrant la période de la Renaissance au début du XX^ème.

TEXTURE DENSE :

La colère :

Ludwig van Beethoven, Symphonie n° 6, « Pastorale », 4e mouvement, Wiener Philharmoniker dirigé par Simon Rattle.
Modeste Moussorgski, Les tableaux d’une exposition, Gnomus, orchestre de la Suisse Romande dirigé par Ernest Ansermet.
Richard Strauss, Tod und Verklärung, SWR Stuttgart Radio Symphony Orchestra dirigé par Sergiu Celibidache.

La gaieté :

Maurice Ravel, Rapsodie espagnole, Berliner Philharmoniker dirigé par Pierre Boulez.

Hector Berlioz, Symphonie Fantastique, 2e mouvement « un bal », le Sinfonieorchester des Bayerischen Rundfunks dirigé par Mariss Jansons.
Ludwig van Beethoven, Symphonie n°4, 4e mouvement, Wiener Philharmoniker dirigé par Simon Rattle.

TEXTURE PULSÉE:

La colère :

Franz Liszt, Totentaz, Nelson Freire au piano, Dresdener philharmoniker dirigé par Nelson Freire.
Igor Stravinski, le Sacre du Printemps, Premier tableau : L’Adoration de la terre : Jeux des cités rivales, The Cleveland Orchestra dirigé par Pierre Boulez.
Sergueï Prokofiev, Suite Scythe, City of Birmingham Symphony Orchestra dirigé par Simon Rattle.

La gaieté :

Jean-Sébastien Bach, Concerto Brandebourgeois n°5, 1er mouvement Allegro, dirigé par Gustav Leonhardt.
Rodrigo Martinez, Villancio Foli, Hesperion XX dirigé par Jordi Savall.

Ludwig van Beethoven, Octuor à vents en mib majeur op.103, Quintette de l’orchestre Philharmonique de Berlin.

TEXTURE AÉRÉE :

La sérénité :

Wolfgang Amadeus Mozart, Quintette pour piano et vents k.452, Largo, Brian Pollard (basson), George Pieterson (clarinette), Vicente Zarzo (cor), Han de Vries (hautbois), Radu Lupu (piano).
Franz Liszt, Concerto pour piano n°1, 2e mouvement Quasi Adagio, Martha Argerich (piano), London Symphony Orchestra, dirigé par Claudio Abbado.
Robert Schumann, Kreisleriana, op.16, Wilhelm Kempff (piano).

La tristesse :

Béla Bartók, Musique pour cordes percussions et célesta, 3e mouvement, Chicago Symphony Orchestra dirigé par James Levine.
François Couperin, Pièces de viole avec la basse chiffrée (1728), Suite n°1, Mikko Perkola (viole de gambe), Aapo Häkkinen (harpe), Prélude.
Wolfgang Amadeus Mozart, Concerto pour piano et orchestre n°23 en La Majeur K. 488, Adagio, Clara Haskil (piano), Wiener Symphoniker dirigé par Paul Sacher.

TEXTURE LISSE :

La sérénité :

Alexandre Borodine, Dans les steppes de l’Asie centrale, USSR Symphony Orchestra dirigé par Sveltanov,
Claude Debussy, Prélude à l’après-midi d’un faune, South West German Sinfonieorchester vf Baden-Baden und Freiburg dirigé par Sylvain Cambreling,.
Richard Wagner, Parsifal, Acte 3 final, Berliner Philharmoniker dirigé par Herbert von Karajan.

La tristesse :

Gustav Malher, Symphonie n°5, Adagietto, Berliner Philharminiker dirigé par Herbert von Karajan.
Richard Wagner, Tristan et Isolde, Prélude, Wiener Philharmoniker dirigé par Georg Solti.
John Dowland, Go Crystal Tears, Concerto di Viole, Andreas Scholl (Contre ténor), Julian Behr (Luth).

La difficulté pour créer ce corpus musical a résidé dans le fait de réussir à corréler nos 4 textures avec chacune des émotions choisies : un extrait musical ayant une texture lisse corrélée à la

tristesse semble assez évident à faire correspondre, tandis que de trouver un extrait musical avec cette même texture pour exprimer la colère nous a véritablement posé problème. Après plusieurs tentatives infructueuses nous avons pris la décision de partir plutôt des émotions en associant des textures évidentes qui émaneraient naturellement du caractère émotionnel des pièces sélectionnées.

Ainsi, la colère suggère plutôt des extraits musicaux avec une texture dense ou pulsée tout comme la gaieté, deux émotions ayant une dynamique positive ; tandis que la sérénité et la tristesse, ayant une dynamique négative, seront plutôt corrélées avec des textures lisses et aérées.

Pour pallier à cette contrainte, nous avons essayé dans la mesure du possible de varier les ensembles instrumentaux au sein de chaque émotion et texture : par exemple, la sérénité avec une texture aérée sera tout autant représentée par un grand orchestre chez Liszt, un quintette pour piano et vents chez Mozart et un instrument seul (le piano) chez Schumann.

Nous espérons que nos résultats ne seront pas trop influencés par ces contraintes.

Voici un tableau récapitulatif des extraits musicaux choisis pour cette expérimentation :


1	AS	Liszt : Concerto pour piano n° 1, 2^e mouvement Quasi adagio, Martha Argerich, piano, London Symphony Orchestra, dir. C. Abbado (à 0’36),
2	AS	Mozart : Quintette pour piano et vents K. 452, 1^er mouvement, Largo, Brian Pollard (basson), George Pieterson (clarinette), Vicente Zarzo (cor), Han de Vries (hautbois), Radu Lupu (piano), (à 0.00)
3	AS	Schumann : Kreisleriana op. 16, n° 6, Wilhelm Kempff
4	AT	Bartók : Musique pour cordes, percussion et célesta, 3^e mouvement, Chicago Symphony Orchestra, James Levine
5	AT	Couperin : Pièces de violes avec la basse chiffrée (1728), Suite n° 1, Prélude, Mikko Perkola (viola da gamba), Aapo Häkkinen (harpsichord),
6	AT	Mozart : Concerto pour piano et orchestre n°23, adagio, Clara Haskil (piano), Paul Sacher (dir.),Wiener Symphoniker
7	DC	Beethoven : Symphonie n° 6, 4^e mouvement, Simon Rattle (dir.), Wiener Philharmoniker
8	DC	Moussorgski : Tableaux d’une exposition, Gnomus, Orchestre de la

		Suisse Romande, (dir.) Ernest Ansermet (à 3’15)
9	DC	Strauss : Mort et transfiguration (à 7’), Sergiu Celibidache (dir.) SWR Stuttgart Radio Symphony Orchestra
10	DG	Beethoven : Symphonie n° 4, 4e mouvement, Wiener Philharmoniker, dir. Rattle
11	DG	Berlioz : Symphonie fantastique, 2e mouvement Un bal, Symphonieorchester des Bayerischen Rundfunks, dir. Mariss Jansons (à 5’)
12	DG	Ravel : Rapsodie espagnole, Berliner Philharmoniker, dir. Boulez (à 5’20)
13	LS	Borodine : Dans les steppes de l’Asie centrale, USRR Symphony Orchestra, E. Svetlanov (début)
14	LS	Debussy : Prélude à l’après-midi d’un faune, SWR Sinfonieorchester Baden-Baden und Freiburg, dir. S. Cambreling (début)
15	LS	Wagner : Parsifal, Acte 3 final, Berliner Philharmoniker, dir Karajan
16	LT	Dowland : Go Crystal Tears, Concerto di Viole, Julian Behr (Luth), Andreas Scholl contreténor (début)
17	LT	Mahler : Symphonie n° 5, adagietto, Berliner Philharmoniker, dir. Karajan (à 2’32)
18	LT	Wagner : Tristan et Ysolde, Prélude, Wiener Philharmoniker, dir. G. Solti (début)
19	PC	Liszt : Totentanz, Nelson Freire, piano, Dresdener philharmoniker (début)
20	PC	Prokofiev : Suite Scythe, City of Birmingham Symphony Orchestra, dir. S. Rattle
21	PC	Stravinski : Le sacre du printemps, Jeux des cités rivales, The Cleveland Orchestra, dir. P. Boulez
22	PG	Bach : Concerto brandebourgeois n° 5, 1^er mouvement allegro, dir. G. Leonhardt, (début)
23	PG	Beethoven : Octuor à vents en mib majeur op. 103, Quintette de l’orchestre Philharmonique de Berlin,
24	PG	Rodrigo Martinez : Villancio Foli, Hesperion XX, dir. J. Savall

Tableau 3 : Liste des œuvres,
A = aéré, D = dense, L = lisse, P = pulsé, S = serein, T = triste, G = gai, C = colérique.

4.1.3. Procédure

Nous avons présenté à l’ensemble des enfants cette nouvelle expérimentation de la même manière que l’expérimentation précédente : une lecture de la tâche à réaliser (ce que vous pouvez lire à droite de la capture d’écran ci-dessous) avec explication complémentaire si nécessaire. La procédure étant identique à l’expérimentation précédente, il ne nous apparaît pas nécessaire de la détailler à nouveau ici. Par contre, il est important de souligner qu’à la différence de la première expérimentation, l’écran de démarrage n’est pas divisé en quatre parties.

Figure 120 : Capture d’écran d’une passation finalisée avec un enfant avec l’explication donnée oralement accompagnée ou pas de LPC (Langage Parlé Complété) ou proposée en Langue des Signes Française (L.S.F.).

Ainsi, les sujets devaient classer les 24 extraits musicaux entendus en fonction des émotions qu’ils véhiculaient.

4.2. Résultats

4.2.1. Le groupe expérimental

De prime abord, nous pouvons observer que les enfants IC obtiennent des résultats moins pertinents que pour le classement des textures. Cependant l’énergie, la dynamique, sont clairement identifiée car ils séparent d’un côté, les gais et les colériques, et de l’autre les tristes et les sereins à partir d’extraits de musique tonale, sauf pour le 21 PC (Le Jeu des Cités Rivales dans Le Sacre du Printemps de Stravinski) dont nous reparlerons après.

Figure 121 : MDS des enfants IC (à partir d’un algorithme de calcul des distances entre chaque pastille). L’axe 1 correspond à la dynamique/énergie positive (rythme, percussion, intensité forte et timbre clair) et l’axe 2 correspond à la valence positive (tempo vif, très rythmé, dynamique forte).

Par rapport au classement des émotions, ils séparent significativement les sereins et les tristes mis à part le 5 AT (Couperin) et le 13 LS (Borodine) qui sont très proches sur la MDS, alors que les gais et les colériques sont bien moins distingués. Ce qui est tout à fait remarquable sachant que pour le plus grand nombre, ce sont très souvent les extraits gais et colériques qui sont les mieux reconnus.

Sur l’axe horizontal (axe 1), Totentanz de Liszt (19 PC) a la dynamique la plus forte pour cette population, tandis que la Suite n°1 de Couperin (5 AT), la dynamique la plus faible. La perception de la texture semble être regroupée en deux grands groupes : d’une part les textures denses et pulsées et d’autre part les textures lisses et aérées, renvoyant aux limites de notre élaboration pour ce corpus.

Comme expliqué dans le matériel musical choisi, lorsque nous avons créé et choisi les extraits musicaux qui composent cette expérimentation, nous nous sommes retrouvés face à la difficulté de faire corréler nos quatre types de textures (dense, pulsée, aérée et lisse) à chacune des émotions sélectionnées (la sérénité, la gaieté, la colère et la tristesse). Trouver un extrait musical colérique ayant une texture lisse nous a plongé dans l’embarras de même qu’un extrait musical serein avec une texture pulsée. Au lieu de partir des textures pour construire notre matériel musical émotionnel, nous sommes plutôt parti des émotions engendrées par la musique pour faire correspondre nos textures. C’est pourquoi nous retrouvons dans ces résultats, la colère et la gaieté regroupées avec des textures denses et pulsées, la sérénité et la tristesse avec des textures lisses et aérées. Malgré les limites de ce matériel, ces résultats suggèrent chez ces enfants, une sensibilité particulière pour percevoir la texture et s’en servir afin de séparer en deux groupes distincts des extraits musicaux ayant des dynamiques opposées. Nous remarquons que deux pièces musicales sont isolées : la 11 DG (Le Bal de la Symphonie

Fantastique de Berlioz) et la 8 DC (Moussorgski : Tableaux d’une exposition, Gnomus). Le Bal, relié à la gaieté, est ici classé avec les colériques. Cela pourrait s’expliquer de par le caractère entrainant et endiablé de cette pièce qui pourrait prêter à confusion. Le crescendo crée une certaine tension dramatique également. Concernant la pièce de Moussorgski, le tempo est plutôt modéré avec une progression orchestrale en tension croissante conférant un caractère sombre, inquiétant et mystérieux. Tous les éléments semblent réunis pour susciter chez l’auditeur un sentiment de colère sourde mélangée à de la peur. Pourtant, cet extrait a été classé comme gaie. Le plus surprenant reste le classement du 21 PC (Le Jeu des Cités Rivales dans Le Sacre du Printemps de Stravinski), classé parmi les tristes. Comme cette pièce a la valence la plus négative, nous aurions un début d’explication par rapport à cette incongruité.

Par rapport à la valence (axe 2, vertical), le morceau ayant la valence la plus négative est un extrait du Sacre du Printemps de Stravinski (21 PC) alors que Kreisleriana de Schumann (3 AS) est le morceau classé avec la valence la plus positive.

Après une écoute approfondie des extraits tristes vs sereins, il nous est apparu intéressant d’étudier si les enfants sourds pourraient percevoir le mode, pour mieux expliquer leur classement. Cette réflexion a abouti à une vérification systématique des modes de tous les extraits proposés :

Mode Majeur	Mode mineur	Autres
1AS, 2AS, 3AS, 4AT, 8DC, 10DG,	5AT, 6AT, 7DC, 9DC, 16LT, 17LT,	14LS (chromatique), 18LT, 19PC
11DG, 12DG, 13LS, 15LS, 20PC,	21PC
22PG, 23PG, 24PG

De prime abord, nous pouvons remarquer que le classement des extraits tristes réalisé par cette population, en se focalisant sur le mode, est plutôt cohérent : 16LT, 6AT, 5AT (mode mineur), 18LT (ambigu) et 4AT (majeur). Nous tiendrons compte du 21PC (mode mineur) classé avec les extraits tristes. De plus, concernant les extraits sereins, leur classement est meilleur encore : 13LS, 15LS, 14LS (ambigu), 1AS, 2AS et 3AS (5 sur 6 en mode majeur).

Au vu de ces observations, nous avons utilisé pour mettre en évidence cela, la méthode de Bravais Pearson. Le coefficient de corrélation linéaire Bravais Pearson exprime l’intensité et le sens (positif ou négatif) de la relation linéaire entre deux variables quantitatives : on parle d’analyse de corrélation dans la littérature. Cet indice statistique assume des valeurs se situant dans l’intervalle qui va de – 1 à +1. « Une valeur égale à – 1 ou à +1 indique l’existence d’une relation linéaire parfaite (fonctionnelle) entre ces deux variables. L’intensité de la relation linéaire sera donc d’autant plus forte si la valeur du coefficient est proche de +1 ou de – 1, et d’autant plus faible si elle est proche de 0 ».⁵³¹

Le coefficient de corrélation de Bravais Pearson se calcule à partir de la formule suivante :

Dans notre étude, le coefficient de corrélation linéaire Bravais Pearson est égal à – 0,67 sur la dimension 2, ce qui est significatif à 0,001. Alors que nous obtenons le coefficient + 0,29 sur la dimension 1, ce qui n’est pas significatif. Cela met en valeur le fait que les enfants sourds entendent significativement le mode.

4.2.2. Le groupe contrôle

Figure 122 : MDS des enfants normo-entendants : l'axe 1 correspond ici à la valence et l'axe 2 à l'énergie. — Figure 122 : MDS des enfants normo-entendants : l’axe 1 correspond ici à la valence et l’axe 2 à l’énergie.

Les pièces orchestrales sont majoritairement classées avec une dynamique positive (forte) et les pièces avec solistes, ou en duo, ou de musique de chambre sont toutes classées en dynamique négative (faible). L’extrait Dans les steppes de l’Asie centrale de Borodine (13LS) présente une particularité, car il n’est pas représentatif d’une œuvre orchestrale puisque nous avons fait entendre juste le début, avec une longue pédale aux violons et le thème principal joué à la clarinette. C’est pourquoi, nous l’avons classé à deux endroits différents : d’une part, en solo/duo (correspondant à la réalité de notre extrait) et d’autre part, dans les œuvres orchestrales. Pareillement, le début du Prélude à l’après-midi d’un faune de Debussy présente les mêmes particularités : thème exposé aux flûtes. Nous avons classé ces deux œuvres dans la rubrique Solo/Duo pour signifier ce qui est entendu par l’auditeur, et leurs présences sont légitimes dans la rubrique orchestrale car ce sont bien évidemment deux œuvres écrites pour orchestre (entre parenthèses).

	Solo/Duo	Chambre	Orchestre
		4AT, 23PG, 24PG, 22PG	9DC, 19PC, 21PC, 8DC,
			7DC, 20PC, 12DG,
			10DG, 11DG
Dynamique –	16LT, 5AT, 6AT, 13LS,	2AS	(13LS), (14LS), 15LS,
	3AS, 14LS		1AS, 17LT, 18LT,

Nous remarquons une claire différenciation sur l’axe 1 de la MDS entre d’une part Colère/Gai et d’autre part Serein/Triste, ainsi que sur l’axe 2 entre Gai et Colérique. Par contre, la différence entre serein et triste semble confus, même si nous pouvons noter un meilleur regroupement des extraits tristes versus sereins. Quelques pièces musicales sont isolées : la 4AT (Musique pour cordes percussions et célesta de Bartók) est classée avec les colériques, certainement explicable du fait que ce soit un morceau classé parmi les plus tristes avec le 18 LT (le début du Prélude de Tristan et Yseult de Wagner) et ayant la dynamique la plus forte de tous les extraits tristes. La 12DG (Rapsodie espagnole de Ravel) se retrouve proche des colériques probablement de par le caractère du début de la pièce.

Les enfants normo-entendants classent ici bien mieux les extraits musicaux selon les émotions. La valence positive, gai et colérique est très claire. Les tristes et les sereins sont plus confus, ils sont moins reconnus.

En comparaison avec les enfants sourds implantés, le coefficient de corrélation linéaire Bravais Pearson chez les enfants normo-entendants sur l’axe de la valence avec le mode n’est pas significatif – 0,14. Par contre, ils entendent le mode corrélé avec la valence – 0,45, significatif à 0,05. La valence est meilleure chez les normo-entendants car certainement reliée à la structure tonale également.

5. Discussion générale

Au vu des excellents résultats des enfants sourds implantés versus enfants normo-entendants pour classer des textures, nous nous sommes évertués d’essayer d’expliquer ces résultats pour mieux les comprendre. De plus, dans notre deuxième expérimentation autour des émotions, nous avons mis en évidence le fait que ces mêmes enfants sourds implantés se montraient moins performants dans cette tâche par rapport aux enfants normo-entendants. Malgré cela, ils sont tout de même capables de reconnaître le mode (majeur ou mineur) de ces pièces de manière significative.

Les MDS obtenues sur les enfants sourds implantés et normo-entendants montrent systématiquement des avantages des enfants implantés sur les normo-entendants pour la classification des textures. Ce qui est paradoxale à priori, c’est que l’on obtienne le même type de résultats avec les adultes. Cela suggère que bien qu’implantés ces enfants entendent bien les dimensions acoustiques pertinentes des textures. A ce stade, il nous apparaît primordial d’analyser au plus près certaines caractéristiques du son, grâce aux descripteurs audio. Ils vont nous permettre de mettre en évidence des caractéristiques spécifiques du signal audio. Ils ont été développés dans le domaine Music Information Retrieval/Research (MIR) sur la base de travaux sur le traitement de la parole et sur le timbre musical en psychoacoustique. Les descripteurs audio et leurs outils de visualisation sont de plus en plus utilisés en musicologie pour l’analyse de l’interprétation notamment⁵³², mais aussi pour celle des musiques électroacoustiques.⁵³³ En psychologie cognitive, ils sont également fort pertinents.⁵³⁴ Pour le musicologue Philippe Lalitte, « Ce sont des prédicteurs de la représentation psychologique sous-jacente à une dimension musicale (le timbre, la tonalité, la structure temporelle). »⁵³⁵ Les descripteurs audio commencent à être utilisé également dans le cas de musiques populaires enregistrées. Nous pouvons citer les travaux de Philippe Gonin autour de l’album Atom Heart Mother des Pink Floyd⁵³⁶ et de Philippe Lalitte⁵³⁷ avec une analyse de Heroes de David Bowie, afin de démontrer certaines réalités musicales. Il existe aujourd’hui un grand nombre de logiciel audio (CLAM ⁵³⁸, Marsyas⁵³⁹, Psysound 3 ⁵⁴⁰, Sonic Visualiser ⁵⁴¹, Eanalysis ⁵⁴²). Nous avions choisi Sonic Visualiser pour ce chapitre. Pour approfondir nos résultats obtenus dans notre première expérimentation, nous avons décidé d’utiliser également la MIR Toolbox.⁵⁴³ Les descripteurs audio sont fort nombreux, nous ne fournirons pas dans le cadre de ce travail une liste complète, ni une définition pour chacun d’eux. Pour cela, l’ouvrage d’Alexander Lerch, An Introduction to Audio Content Analysis nous semble pertinent et intéressant à consulter pour ces questions.⁵⁴⁴

Voici une liste non limitative proposée par Philippe Lalitte :

Figure 123 : Liste de certains descripteurs audio.⁵⁴⁵

En ce qui nous concerne, sur la figure 124 avec le cercle, nous avons choisi 16 descripteurs audio qui nous semblent les plus pertinents pour analyser la texture : le temps d’attaque du sonagramme (Attack Time), la pente d’attaque (Attack Slope), la fluctuation rythmique (Rhythm Fluctuation), le centroïde spectral (Spectral Centroïd), la brillance spectrale (Spectral Brightness), l’étalement spectral (largeur du spectre : Spectral Spread), la platitude spectrale (Spectral Flatness), le roulement spectral (Roll Off), l’irrégularité spectrale (Spectral Irregularity), le RMS (Root Mean Square : l’amplitude globale du son), la rugosité (Roughness), le ZCR (Zero Crossing Rate : le nombre de passage par seconde /descripteur du bruit dans le son), le flux spectral dans le temps (Spectral Flux), la clarté tonale (Key Clarity), l’HCDF (Harmonic Change Detection Function : la détection des changements de l’harmonie) et le Centroïde tonal (Chroma Centroïd : la fréquence qui ressort le plus).

Figure 124 : Analyse réalisée par les descripteurs audio choisis.

Voici un tableau récapitulatif fondé sur neuf catégories musicales proposé par Philippe Lalitte où nous retrouvons les descripteurs cités ci-dessus :

Tableau 4 : Classification des descripteurs audio.⁵⁴⁶

Les observations ci-dessous correspondent aux morceaux choisis dans notre première expérimentation où il s’agissait de classer les différentes textures. Nous avons fait une analyse factorielle discriminante qui permet de voir si nos variables ou nos descripteurs audio sont capables de catégoriser les observations (qui ressemblent à nos MDS).

Les variables en valeur positive qui expliquent le mieux le facteur 1 (axe horizontal) sont : l’irrégularité spectrale, le RMS (l’amplitude globale du son), la clarté tonale. En valeur négative, ce sera surtout la fluctuation rythmique qui ressort et dans une moindre mesure le HCDF (la détection des changements de l’harmonie).

Les variables en valeur positive qui expliquent le mieux le facteur 2 (axe vertical) sont : le flux spectral, la rugosité et dans une moindre mesure le RMS. En valeur négative, ce sera surtout la largeur du spectre et dans une moindre mesure le roulement spectral.

Ce qui suggère que les variables de timbre et d’intensité sont les plus significatives pour expliquer les regroupements des pièces dans l’analyse factorielle discriminante. On peut voir également que les pièces sont très bien regroupées en quatre groupes correspondant aux 4 textures choisies.

Figure 125 : Analyse factorielle discriminante avec le premier F1 (axe horizontal) F2 (axe vertical).

Sur l’axe 1, nous remarquons une opposition nette entre les textures denses et lisses d’une part et la texture aérée d’autre part. Cet écart se base sur les descripteurs audio d’intensité et de timbre et la fluctuation rythmique a permis de regrouper les textures aérées. Sur l’axe 2, nous observons une séparation claire entre la texture pulsée et les textures aérées et lisses. Ce sont surtout les descripteurs audio de timbre qui ont permis cette séparation. A titre d’exemple, les morceaux les plus représentatifs concernant la texture dense sont : Le lac de Murail (extrait n° 9), Konx Om Pax de Scelsi (extrait n° 11). Pour la texture lisse ce sera : Partiels de Grisey (extrait n° 14) et Le Lac de Murail (extrait n° 17). Concernant la texture aérée, Gruppen de Stockhausen (extrait n° 5), Chinese Opera d’Etvös (extrait n°1) et Schwankungen de Lachenmann (extrait n° 4) sont les plus pertinents. Pour la texture pulsée, Multiples de Boulez (extrait n° 19) et Le concerto de chambre de Ligeti (extrait n° 24) sont les plus représentatifs. Par rapport à ces descripteurs, il est tout à fait possible que les enfants sourds aient plus utilisé les descripteurs de timbre, d’intensité et de fluctuation rythmique qu’un descripteur comme la clarté tonale qui demande des capacités fines de discriminations de fréquences.

Tous ces résultats suggèrent que dans le signal audio, les enfants sourds implantés ont des éléments pertinents qui leur permettent d’effectuer cette classification de façon tout à fait exemplaire. Les extraits denses et aérés sont les mieux catégorisés avec un pourcentage d’explication de 60,37%.

En résumé, les catégories des descripteurs audio les plus significatives, dans cette tâche de classification de textures, sont : l’intensité, le timbre, la dissonance, l’harmonie et le timbre.

Concernant l’intensité, c’est le descripteur audio RMS (Root Mean Square : l’amplitude globale du son) qui ressort le plus nettement. Pour le timbre, le flux spectral dans le temps (Spectral Flux), l’irrégularité spectrale (Spectral Irregularity) et la propagation spectrale (Spectral spread) sont les plus représentés. Le descripteur audio le plus significatif pour la dissonance est la rugosité (Roughness), et pour l’harmonie, le HCDF (Harmonic Change Detection Function : la détection des changements de l’harmonie). Quant au rythme, la fluctuation rythmique (Rhythm Fluctuation) sera la plus significative.

Au sujet de notre expérimentation autour des émotions, nous avons voulu vérifier s’il pouvait exister des descripteurs audio significatifs afin de mieux comprendre les résultats obtenus. Pour ce faire, nous avons utilisé la MIR Toolbox, comme pour la première expérimentation.

De prime abord, nous avons essayé de trouver les descripteurs les plus pertinents afin d’expliquer les résultats de la bonne perception des modes (mineur/majeur) des enfants sourds implantés (groupe expérimental). L’analyse faite avec les descripteurs ci-dessous correspond aux morceaux choisis pour cette deuxième expérimentation.

Nous avons donc choisi 9 descripteurs audio qui pourraient mettre en évidence le mode des extraits choisis, ainsi que les descripteurs les plus significatifs en lien avec la première expérimentation (classification des textures) : le mode (Tonal mode), la clarté tonale (Tonal Key Clarity), le temps d’attaque (Rhythm Attack Time), le roulement spectral (Spectral Roll off), la brillance spectrale (Spectral Brightness), l’amplitude du son (Dynamics RMS), la détection des changements de l’harmonie tonale (Tonal HCDF), la rugosité (Spectral Roughness), le tempo (Rhythm Tempo).

Figure 126 : Analyse réalisée par les descripteurs audio de l’expérimentation n°2 (Texture/Émotion).

Ce qui est particulièrement intéressant, c’est de constater que les descripteurs audio reliés au mode (Tonal Mode et Key Clarity) sont principalement corrélés avec les extraits tristes et sereins. Ce sont précisément ces extraits qui nous ont permis de faire émerger la perception du mode chez les enfants de notre groupe expérimental (extraits n° 1AS, 2AS, 3AS, 6AT, 15LS, 16LT, 17LT, 18LT sur l’analyse factorielle ci-dessous). Les extraits 13LS et 14LS sont plutôt reliés au temps d’attaque et au roulement spectral.

Les extraits colériques et gais avec une dynamique positive sont logiquement corrélés avec des descripteurs d’intensité, de timbre et d’harmonie.

Dans un second temps, nous avons réalisé une nouvelle analyse factorielle discriminante où nous avons seulement gardé 4 descripteurs qui nous semblaient les plus pertinents pour cette étude. Les descripteurs utilisés correspondent au tempo, au mode, à la dynamique et à la rugosité des 24 extraits musicaux choisis.

Le mode ressort significativement dans cette analyse, tout comme la rugosité. Les observations ci-dessous correspondent aux morceaux choisis dans notre deuxième expérimentation où il s’agissait de classer des extraits musicaux en fonction des émotions.

Les variables en valeur positive qui expliquent le mieux le facteur 1 (axe horizontale) sont : la rugosité et la dynamique, et dans une moindre mesure le tempo. En valeur négative, ce sera principalement le mode. La principale variable en valeur positive qui explique le mieux le facteur 2 (axe verticale) correspond au mode.

Figure 127 : Analyse réalisée par les descripteurs audio choisis.

Ce qui suggère que les variables de mode, de dynamique et de rugosité sont les plus significatifs pour expliquer les regroupements des pièces dans l’analyse factorielle discriminante ci-après.

Figure 128 : Analyse factorielle discriminante de l’expérimentation n°2.

Nous pouvons déjà remarquer une nette séparation entre les extraits colériques et gais. En effet, les extraits correspondants à la colère présentent une dynamique forte et une rugosité marquée. Les enfants normo-entendants ont fort bien fait cette distinction, certainement grâce à la perception de ces variables. Jeux des cités rivales dans Le sacre du printemps de Stravinski (21PC) correspond à l’extrait le plus significatif. Pour la gaieté, Le bal dans la Symphonie Fantastique de Berlioz (11DG) ressort grâce au variable de mode.

Sur l’axe de facteur 1 (horizontale), nous discernons une opposition franche entre les extraits colériques et tristes d’une part, et colériques vs sereins d’autre part. Cet écart se base sur les descripteurs audio de rugosité et de dynamique. Les tristes et les sereins seraient mieux classés par les enfants sourds implantés grâce à leur perception du mode notamment, en lien direct avec nos résultats obtenus avec la méthode de Bravais Pearson. De plus, les extraits sereins et tristes semblent confus, comme ce que l’on a pu constater chez les enfants de notre groupe contrôle.

Sur l’axe de facteur 2 (vertical), la gaieté est opposée à la sérénité et à la tristesse de manière complexe. Le Concerto pour piano et orchestre de Mozart (6AT) correspond à l’extrait le plus significativement triste dans cette analyse. Le plus serein serait le Final de l’acte III de Parsifal de Wagner.

En conclusion, il apparaît que l’utilisation des descripteurs audio s’est avérée très précieuse, car ce type d’analyse nous a apporté des débuts de réponses au sein des deux expérimentations que nous avons mené auprès des enfants sourds et entendants.

Dans la première expérimentation, l’analyse des résultats a montré que dans le signal audio, les enfants sourds implantés étaient capables d’extraire des éléments significatifs leur permettant de classer des textures de façon tout à fait remarquable. Pour rappel, les extraits denses et aérés ont été les mieux catégorisés. Les catégories des descripteurs audio les plus significatives, dans cette tâche de classification de textures, se sont révélées correspondre à : l’intensité, le timbre, la dissonance, l’harmonie et le timbre. Pour les normo-entendants, enfants comme adultes, la tâche s’est révélée plus difficile. Il semblerait que les enfants aient réalisé leur regroupement en se servant principalement de la brillance du timbre et de la dissonance, grâce au flux spectral (Spectral Flux) dans le temps et à la rugosité (Roughness), notamment. Pour les adultes et les enfants, nous avons pu observer que les extraits correspondants à la texture dense ont été les mieux perçus par les deux groupes de participants. En revanche, les adultes musiciens ont eu de meilleurs résultats. Nous pouvons supposer qu’ils aient utilisé les mêmes catégories de descripteurs audio que les enfants sourds pour cette tâche.

Concernant la deuxième expérimentation autour des émotions, nous avons pu mettre en évidence que les enfants normo-entendants réussissaient un classement beaucoup plus cohérent des extraits musicaux selon les émotions. La valence positive, gai et colérique a émergé très clairement. En revanche, les extraits tristes et sereins ont été moins bien reconnus. Le coefficient de corrélation linéaire Bravais Pearson a mis en évidence qu’ils entendent le mode corrélé avec la valence – 0,45, significatif à 0,05. Alors que chez les enfants sourds, ce sont les extraits tristes et sereins qui sont remarquablement classés. Le coefficient de corrélation linéaire Bravais Pearson a mis en valeur le fait que les enfants sourds entendent significativement le mode.

La perception de la texture semble avoir un impact sur l’analyse auditive réalisée par les enfants sourds implantés. Ces résultats nous permettent de commencer à évaluer la cognition musicale de ces enfants et nous éclaire sur les processus musicaux mis en œuvre par ces derniers. Il nous apparaît important de compléter cette réflexion en s’intéressant aux différentes pédagogies qui seraient susceptibles de nous aider à enseigner la texture.

Chapitre 6 : Les outils d’apprentissages des méthodes actives musicales

Un apprentissage spécifique s’avère nécessaire pour développer les capacités musicales des enfants sourds et les sensibiliser à la musique et plus particulièrement à la texture. Dans cette optique, différentes méthodes empiriques ont été crées. Nous présentons dans ce chapitre les méthodes qui ont inspiré notre outil pédagogique musical. Le système tonal occidental, par ses lois organisationnelles, permet de diriger les attentes perceptives.⁵⁴⁷ Nous savons que les connaissances des régularités structurelles musicales s’acquièrent de façon implicite chez l’enfant normo-entendant et nous avons postulé qu’elles s’acquièrent de la même façon chez l’enfant sourd. Néanmoins, même si le processus d’acquisition des connaissances musicales pour un enfant sourd est le même qu’un enfant entendant, il aura plus de difficultés, notamment pour la perception des hauteurs.

Par contre, au regard des résultats exposés précédemment, la perception de la texture chez ces enfants suggère que l’utilisation du mouvement à travers le corps tout entier, leur apporte des informations suffisamment pertinentes pour mieux se l’approprier. C’est pourquoi, nous renforcerons cet apprentissage par des activités sensori-motrices, déjà significatives pour un enfant normo-entendant mais cruciales chez l’enfant sourd, mettant en jeu par l’action, les perceptions proprioceptives, auditives et kinesthésiques.

1. Méthodes d’apprentissage musical

Deux grands pédagogues, Francès (1958)⁵⁴⁸ et Zenatti (1994)⁵⁴⁹, issus du courant socio-constructiviste, ont étudié la psychologie du développement musical chez l’enfant. Francès démontre que l’environnement dans lequel baigne l’enfant le contraint à apprendre la langue et la musique qu’il entend quotidiennement. De même que l’enfant apprend par la voix de sa mère, les syllabes, les mots et les phrases, de même, il apprendra les éléments du langage musical telles les unités (cellules rythmiques, intervalles, échelles mélodiques), l’organisation linéaire (formes simples) et simultanée (accords et cadences) et enfin les phrases. Selon ces deux auteurs, l’apprentissage de chanson et le chant lui-même contribuent à créer ces habitudes perceptives et à ancrer des structures tonales internes chez l’enfant. Il faut donc d’abord percevoir le son pour le produire (l’écoute active), mais on n’a pas vraiment perçu un son de parole tant qu’on ne l’a pas produit soi-même.

« Zenatti reprenant les travaux de Piaget propose une genèse de l’intelligence musicale. Elle suggère une construction progressive en différents stades dans lesquels il y aurait une communication réciproque entre activités perceptives et sensori-motrices permettant ainsi de mettre en lien différents éléments musicaux comme l’intervalle, le système tonal, la structure mélodique et rythmique d’une œuvre. »⁵⁵⁰ Selon cette psychologue, un premier stade s’observerait lors de l’acquisition du sens de l’intervalle : l’enfant reconnaît une mélodie (chanson) et lorsqu’il devient capable de la chanter, c’est qu’il possède l’image mentale de cette chanson. Ainsi, le fait de chanter, comme l’affirme Zenatti engendre une image sonore et cette dernière contrôlera l’image motrice.⁵⁵¹ Elle parvient à résumer l’influence déterminante de l’éducation musicale sur le développement perceptif de l’enfant :

L’éducation musicale est susceptible d’exercer une action primordiale dans le développement musical de l’enfant, depuis les âges de la crèche et de l’école maternelle jusqu’à l’adolescence…des virtualités comportementales s’atrophient lorsqu’elles ne sont pas stimulées…L’enfant sélectionne les informations qui retiennent son attention. Cette attention sélective joue un rôle capital dans le développement cognitif. Savoir susciter l’intérêt est essentiel sur le plan pédagogique, afin de favoriser l’avènement d’une familiarité avec des structures musicales diverses, variant selon la date et le lieu de composition des œuvres. Il ne s’agit pas seulement d’élargir le domaine des connaissances mais, avec des bases cognitives de permettre une formation et une évolution des goûts musicaux, enrichissant ainsi la vie affective.⁵⁵²

Il convient également de rappeler l’ouvrage d’André Giordan, qui constitue une synthèse des différentes études pour fonder une théorie sur le cheminement de l’apprendre.⁵⁵³ L’adaptation au milieu y est énoncée, de manière à trouver des moyens plus efficaces pour répondre à la diversité des problèmes posés. Le rapport qui unit les éléments organisés aux éléments du milieu est une relation d’assimilation : l’organisme conserve le cycle d’organisation et coordonne les données du milieu de manière à les incorporer à ce cycle. C’est ce que Piaget appelle « mouvements circulaires primaires »⁵⁵⁴. Si l’une d’entre elles varie, le milieu est transformé : l’organisme s’adapte. Le cycle organisé se modifie : il devient un nouveau cycle d’éléments organisés qui pourra donner lieu à de nouvelles assimilations. Il s’agit alors d’une accommodation. François Delalande, se référant aux travaux de Piaget, énonce trois aspects fondamentaux de la pratique musicale⁵⁵⁵ :

Le jeu sensori-moteur, qui correspond au jeu d’exercice. Il a une fonction d’adaptation. Le toucher de l’instrument, le contrôle de la sonorité représente une fusion entre la sensation et la motricité.
Le jeu symbolique, qui mime le réel. L’organisation sonore peut correspondre à un mouvement rencontré dans le vécu, à une situation vécue ou encore à une émotion. Tout jeu renvoie symboliquement à une situation qui est de l’ordre des images ou des affects ; on convoque alors un système particulier de codes, propre à soi, en référence avec son vécu.
Le jeu de règles qui peut être perçu comme un plaisir dans l’application du système musical.

Delalande dédie tout un chapitre (III) de La musique est un jeu d’enfant (1984) à l’idée de la musique comme « art du geste », un art dans lequel l’expérience et l’expression de la gestuelle du corps déterminent la gestuelle des sons, de leur organisation, interprétation et perception. Il fait souvent référence à la théorie de Francès (1958), selon lequel nos gestes seraient l’expression de nos émotions et ils seraient inscrits dans la musique. Depuis déjà un demi-siècle, il a été bien démontré l’importance du mouvement dans le développement psychologique de l’enfant : que ce soit chez Henri Wallon et Jean Piaget⁵⁵⁶, un mouvement qui sert au jeune enfant (entre 1 et 2 ans, ce que Wallon appelle stade projectif)⁵⁵⁷ pour projeter à l’extérieur de soi ses représentations mentales. « D’une manière générale, le jeu instrumental réalise cette liaison sensori-motrice dans laquelle la musique est perçue à la fois comme geste et comme son. »⁵⁵⁸

Kémâl Afsin nous rappelle ces faits historiques importants :

Lorsqu’en 1888 Henri Marion prononçait son discours sur l’école active à la Sorbonne, il n’imaginait pas que, dans la première moitié du 20ème siècle, la quintessence de ses propos allait se propager et stimuler la réflexion de musiciens pédagogues tels que Jaques-Dalcroze en 1920, Orff en 1956, Willems en 1977, Martenot en 1967 et Kodály. À cette époque, les neurosciences et la neuropsychologie musicale n’avaient pas la portée qu’elles ont aujourd’hui. Ainsi, ces pédagogues nourrissaient leur réflexion de procédés purement empiriques pour élaborer les méthodes dites actives. L’école active trouvait donc son expression dans les méthodes dites actives. Chacun de ces pionniers de la pédagogie musicale proposait des démarches sensiblement différentes avec cependant les mêmes objectifs : maîtrise de l’écriture, de la lecture ainsi que de tous les éléments de la cognition musicale (rythmes, intervalles, mélodies, harmonies, formes).⁵⁵⁹

Quoique différentes à première vue, ces méthodes présentent des étapes d’apprentissage comparables. Elles préconisent une pratique globale et vivante en plaçant l’expérience au premier rang de la démarche d’apprentissage puisque les éléments musicaux sont expérimentés par le mouvement du corps. Aussi, elles prônent une progression pédagogique adaptée aux différents stades de développement psychologique et moteur de l’enfant pour ainsi assurer l’acquisition du langage musical. Par la suite, elles intègrent l’analyse et l’identification des composantes de la musique (rythme, mélodie, harmonie) après les avoir vécus corporellement puis vocalement. Enfin, elles permettent d’inculquer à l’enfant « l’audition intérieure » et « le chant intérieur », ces deux éléments constituant l’image sonore. Finalement, toutes ces approches sont reconnues pour exploiter le potentiel créatif, intellectuel, sensoriel et kinesthésique de la musique par l’entremise d’activités ludiques adaptées au développement de l’enfant (Anderson & Lawrence, 2007)⁵⁶⁰.

Partant de ces observations, nous trouvons tout à fait pertinent le principe d’association entre son et mouvement que proposent les méthodes actives. Loin d’être seulement un moyen de rendre ludiques les activités qui permettrait à l’enfant sourd de ne pas s’ennuyer, c’est d’un réel apprentissage de l’oreille et par l’oreille dont il s’agit : mettre en mouvement un geste, un son, qui puisse être senti comme pulsation, puis mis en musique pour garder « la cadence », aide à percevoir la régularité d’une action. C’est un travail sur la perception et donc une contribution au développement de l’oreille. C’est aussi ce qui se passe lorsqu’on essaie de jouer et de maintenir régulières des valeurs longues à un tempo lent : le corps a besoin d’effectuer une décomposition, en d’autres termes, de « remplir » par un geste, physique ou mental, l’espace entre chaque pulsation. Dans l’autre sens, marcher sur les appuis d’une pulsation, se mouvoir au rythme de ce qui est perçu, implique de pouvoir synchroniser son corps avec ce qu’on entend, donc de développer des capacités d’anticipation. C’est une manière de se servir de ce que perçoit l’oreille pour s’approprier physiquement la musique. Lors des différentes séances musicales que nous avons pu animer auprès des enfants sourds, nous avons pu constater les bénéfices de cette conception pédagogique de la musique. C’est un enseignement basé sur l’individu qui propose au lieu d’imposer, suggère au lieu de commander. Cela signifie, entre autres, que le rôle de la musique consiste à jeter un pont entre l’expérience et l’analyse, le corps et le cerveau, l’intuition et le savoir, l’expérience et la compréhension. La musique suscite le mouvement en invitant les enfants à réagir à ce qu’ils entendent. Elle inspire une qualité de mouvement selon ses nuances, ses rythmes, ses timbres, ses accents, ses phrases, ses harmonies, ses mélodies et ses silences. La musique impose ses vitesses, exige une adaptation à l’espace dont dispose l’enfant.

Le corps humain est un orchestre dans lequel divers instruments, muscles, nerfs, oreilles et yeux sont dirigés simultanément par deux chefs : l’âme et le cerveau. (Jacques-Dalcroze, 1948)⁵⁶¹

1.1. La méthode Orff

Le compositeur munichois Carl Orff (1895-1982) a eu une approche tout à fait singulière. D’une part, il a su utiliser le théâtre nouveau, inspiré du théâtre grec où se mêlent l’expression verbale, la prosodie, le rythme, le mouvement et la danse. D’autre part, en tant que pédagogue, il crée son Orff-Schulwerk (« travail scolaire Orff ») grâce à des collaborations étroites et fructueuses qu’il a mené pendant une vingtaine d’années au sein de son enseignement à l’Ecole de danse de Munich. La gymnaste et danseuse Dorothée Gunther (1896-1975), la musicienne et compositrice Gunild Keetman (1904-1990), la danseuse et chorégraphe Maja Lex (1906-1986) furent des pédagogues essentielles dans la création de cette optique nouvelle. L’approche pédagogique de Carl Orff s’inscrit dans le courant des recherches psychopédagogiques du début du siècle, avec Montessori, Decroly, Wallon puis Freinet, Piaget, etc., qui prônent une activité centrée sur le développement et la croissance de l’enfant et non sur son seul savoir. C’est donc l’enfant et sa personnalité qui sont au cœur des recherches pédagogiques de Carl Orff. Ce dernier considère que le contexte culturel est un élément important dans le développement des personnes et qu’il est indispensable d’en tenir compte et d’en exploiter les ressources. Par exemple, Orff s’intéresse et se sert énormément du folklore, appartenant au monde verbal et culturel. C’est une pédagogie musicale et corporelle basée sur l’évolution de l’enfant, comme une musique à vivre. Il prône cette éducation musicale qui permet de « découvrir et étendre son potentiel musical, gestuel et langagier ». Il a écrit de nombreuses musiques pour enfants en essayant de pénétrer l’essence des créations enfantines. « Partant du principe que l’enfant parcourt ontogénétiquement les mêmes étapes que l’humanité, il pense que la musique pour les enfants doit être au départ une musique élémentaire. »⁵⁶²

Carl Orff conçoit sa méthode en rapport avec le fonctionnement de l’individu dans la société : ce qui l’intéresse particulièrement c’est que chacun puisse participer à cette construction collective en même tant qu’il développe son potentiel. Cette démarche singulière s’adresse à tous sans exception, son but n’étant pas le résultat à atteindre, mais le processus d’apprentissage qui sous-tend la progression unique de chaque individu. A partir des années 1950, grâce à la création d’un Instrumentarium, des enfants handicapés ont pu accéder à cette méthode.

Orff emploie la notion « d’élémentarité » pour qualifier la musique qu’il utilise au sein de sa méthode. Comme cette musique n’utilise pas de schémas préétablis, chacun peut se l’approprier en fonction de ses possibilités personnelles.⁵⁶³ Ce dernier va utiliser ce qu’il nomme des « ressources de l’individu », qu’il va répertorier en quatre parties différentes : d’abord la voix, le langage (les cris et les onomatopées par exemple) et le chant dont il va se servir simplement, avec des mélodies élémentaires, des rythmes courts et facilement mémorisables. La répétition rythmique des syllabes d’une phrase amène à différencier les hauteurs du son. Au départ, Orff utilise deux sons (une tierce mineure descendante), puis peu à peu il arrive à une gamme pentatonique sur laquelle il travaille longtemps afin que l’enfant puisse développer le plus son imagination, en s’éloignant des modèles harmoniques de la musique non pentatonique. Il considère que cette gamme favorise l’improvisation des enfants car elle ne crée pas de dissonances. Une grande partie du travail est faite à partir de textes comme des comptines ou des poésies. Carl Orff les décortique rythmiquement puis introduit des éléments mélodiques pour arriver à faire des montages d’une extrême complexité.⁵⁶⁴

Bien évidemment, l’utilisation du corps tout entier, le schéma corporel, la danse folklorique, la percussion corporelle qu’il va privilégier en la qualifiant de premier instrument de la « musique élémentaire », sont tout à fait essentiels dans sa démarche pédagogique. Ensuite, le rythme va mettre en relation le mouvement, le langage et la musique. C’est aussi un élément primordial de sa musique « élémentaire ».

Enfin, l’Instrumentarium, qui malgré le fait que l’utilisation d’instruments ne soit pas essentielle dans sa démarche, permet d’élargir le champ d’expérimentation. Il se compose d’instruments mélodiques, carillons, xylophones, métallophones et de percussions variées de hauteur indéterminée, de plus petite taille que les instruments d’orchestre. C’est un instrumentarium fort riche, provenant de cultures du monde entier (africaine, sud-américaine, asiatique…). L’improvisation tient dans ce travail un rôle constant, soit que l’enfant réponde au meneur de jeu, soit qu’il prenne une place plus autonome dans un ensemble rythmique, improvise, ou même qu’il soit amené à diriger cet ensemble.

Le rythme demeure le principe fondamental de sa méthode. Chaque être humain possède en lui des instruments propres à scander le rythme : ses mains et ses pieds. Orff utilisera quatre niveaux corporels : les doigts, les mains, les cuisses et les pieds. En effet, les frappements peuvent s’effectuer selon diverses variantes sonores : frappés de mains, plante, talon ou pointe du pied ; claquement de doigts (médius glissant d’un geste rapide contre le pouce). Par exemple, le fait de frapper à mains plates sur les cuisses constitue une excellente préparation à la technique des timbales et des instruments à lames. Les principaux « jeux de rythmes » sont l’imitation, la mémorisation, le canon, le jeu des « questions-réponses ». Dans la pratique de ces exercices, le rythme n’est pas intellectualisé mais seulement ressenti et réalisé avec tout le corps (ou sur les instruments). Prenons l’exemple des vitamines rythmiques, aussi nommées percussions corporelles (Comeau, 1995)⁵⁶⁵. Elles stimulent énormément la mémoire auditive de l’enfant. Ces vitamines rythmiques peuvent servir d’amorce à plusieurs apprentissages, dont l’exploitation des comptines notamment.⁵⁶⁶

1.2. Chez Zoltán Kodály

Le compositeur hongrois, très reconnu pour son remarquable travail de recherche sur le folklore hongrois aux côtés de Bartók, a créé une méthode utilisant ces chansons populaires que tous les enfants connaissent depuis leur plus jeune âge. En Hongrie, la musique folklorique fait partie de la vie de chacun. Kodály soutenait que le chant populaire est la langue maternelle musicale naturelle de l’enfant et qu’il faut l’apprendre dès le plus jeune âge, comme on apprend à parler.

Tout d’abord, il serait intéressant d’examiner les sources et l’histoire de l’éducation musicale pour comprendre pleinement, comment les principes de Kodály furent établis. Puisque l’on considère la solmisation relative comme l’une des bases fondamentales de cette méthode, c’est donc l’œuvre du moine toscan Guido d’Arezzo (v. 990 – v. 1050) qu’il faut mentionner en premier lieu.

Il s’est servi des premières syllabes d’un hymne à Saint-Jean-Baptiste (la dernière note si est une contraction des deux initiales de Sancte Johannes) : UT queant laxis REsonare fibris MIra gestorum FAmili tuorum, SOLve polluti LAbii reatum, Sancte Iohannes.

Figure 130 : Manuscrit avec notation messine, Laon, X^ème siècle.

A chaque vers, le chant monte d’un ton. D’Arezzo eu donc l’idée de conserver la première syllabe du premier mot de chaque vers. En 1673, le ut devient do sous l’impulsion de Bononcini car plus facile à solfier. Concernant le si, même si Sancte Joannes la suggère déjà, cette note fera son apparition officielle à la fin du XVIème siècle, ajoutée à la gamme par le moine français Anselme de Flandres.

Même si cela ne paraît pas si naturel lorsque l’on ne connaît pas la chanson, il faut reconnaître que cette idée de mémorisation est astucieuse puisqu’elle permet de retrouver le nom et la hauteur de la note en se référant à une chanson connue. Le système de Guido d’Arezzo fut adoptée par les autres pays latins dans la seconde moitié du Moyen Age. Dans les pays germaniques et anglo-saxons, on lui préféra la notation par les lettres (A à G). La première notation est conservée par Kodály dans le premier apprentissage de la musique. Ainsi, lorsqu’il a mis au point sa pédagogie en Hongrie dans les années cinquante, la solmisation relative sera utilisée dans le but d’éduquer l’oreille des enfants à travers le chant. Ici, les différents degrés de l’échelle sont chantés avec les noms de syllabes correspondantes, quelle que soit leur hauteur absolue. Une gamme majeure sera ainsi toujours chantée do-ré-mi-fa-sol-la-si-do, quelle que soit la hauteur de sa tonique absolue. De cette façon, chaque note a sa fonction et est chantée en relation à une autre note. Les intervalles deviennent les formules que les enfants reproduisent sans problème. Pour faciliter l’intonation, Kodály utilise la phonomimie, une manière de visualiser les hauteurs de notes chantées en les assimilant à un geste de la main. Il fut sensibilisé pour la première fois à cette technique en visitant l’Angleterre, où un système à échelle mobile créé par John Curwen était utilisé dans tout le pays au sein des formations chorales. Kodály a trouvé que l’échelle mobile développait le sens modal des élèves et par là leur capacité à lire la musique. Par ailleurs, il pensait que l’échelle mobile devrait précéder l’écriture sur une portée, en développant une sorte de sténographie musicale utilisant des rythmes simplifiés.⁵⁶⁷

Les signes de la main sont utilisés en tant qu’aide visuelle lors du chant. Cette technique assigne à chaque degré de l’échelle un signe qui montre la fonction tonale du degré. Par exemple, do, mi et sol sont d’apparence stable, tandis que fa et ti pointent respectivement dans la direction de mi et de do. De la même manière, le signe de main ré suggère le mouvement vers do, et celui de la vers celui de sol. Kodály ajouta aux signes de main de Curwen un mouvement ascendant/descendant, ce qui permet aux enfants de voir la hauteur de la note. Les signes sont réalisés devant le corps, do étant au niveau de la taille et la au niveau de l’œil. La distance dans l’espace correspond à la taille de l’intervalle représenté.

Figure 131: Dans la méthode Kodály, la phonomimie est régulièrement utilisée pour faciliter l'intonation. — Figure 131: Dans la méthode Kodály, la *phonomimie* est régulièrement utilisée pour faciliter l’intonation.

À partir du moment où l’enfant acquiert l’écriture et la lecture, cet apprentissage peut alors être complété par l’étude du solfège traditionnel. La pédagogie de Kodály se fonde sur un principe fondamental : tout apprentissage musical doit être acquis par l’oreille en premier, et non par l’intellect. Le chant et le travail d’audition doivent toujours précéder la notation, sinon la lecture et l’écriture musicale sont réduites à des exercices cérébraux, non significatifs. Ainsi, dans la création de la méthode de Kodály, la première étape a été d’introduire de nombreuses mélodies enfantines et chants populaires afin de choisir un matériau sonore adapté aux enfants. En Hongrie, les mélodies enfantines sont construites principalement sur deux éléments : la tierce mineure descendante sol-mi et le motif sol-la-sol-mi (la étant la broderie supérieure du sol). Cette méthode s’adresse tout d’abord aux enfants entre trois et six/sept ans. Pour Kodály, le chant est à la base de tout enseignement musical, avant même l’étude du langage verbal et littéraire. Il était persuadé que l’esprit de l’enfant pouvait acquérir au mieux les fondamentaux musicaux par des méthodes amusantes, avec l’aide de mouvements du corps et des jeux de rythmes. Il était aussi convaincu que l’étude d’un instrument devait être précédée par l’apprentissage ludique du chant dans le but de distinguer l’assimilation naturelle, intérieure et physique de la musique, du mécanisme et de l’apprentissage liés à la technique propre de l’instrument. C’est pourquoi Kodály a incorporé des syllabes rythmiques similaires à celles créées au XIX^ème siècle par le théoricien français Émile-Joseph Chêvé. Dans ce système, on associe à chaque valeur de notes des syllabes spécifiques qui expriment littéralement leur durée. Par exemple, une noire est dite « ta », tandis que deux croches sont dites « ti-ti ». « Deux croches-noire » se dit donc « titi-ta ». Ces syllabes sont utilisées pour reconnaître, chanter, frapper ou lire des rythmes.⁵⁶⁸

La méthode Kodály inclut également l’utilisation de mouvements rythmiques. Technique inspirée par le professeur suisse Émile Jacques Dalcroze dont nous reparlerons dans ce chapitre, Kodály connaissait bien les techniques de ce dernier et partageait l’idée que le mouvement est un outil important pour intérioriser un rythme. Ainsi, la méthode Kodály utilise des mouvements rythmiques comme la marche, la course, la marche rapide, taper des mains. Ils peuvent être exécutés lors de l’écoute ou du chant. Le professeur peut être amené à inventer sur des exercices de chant des mouvements rythmiques appropriés pour accompagner des chansons.⁵⁶⁹

Pour résumer, nous pouvons énumérer en dix grands principes (établis par Kodály lui-même) son enseignement et ses idées générales :

– Le rôle de la musique dans l’éducation devrait être aussi important qu’il l’était dans la Grèce Antique, et doit être au centre du système scolaire, parmi les « fondamentaux », au même titre que les mathématiques ou les arts du langage. Elle ne doit pas être considérée comme accessoire ou superflue puisqu’elle favorise l’acquisition des autres disciplines précitées qui lui sont intimement liées.

L’analphabétisme musical est l’obstacle principal à l’accès à la culture musicale.

L’enseignement de la musique doit être radicalement amélioré dans les écoles de formation des maîtres.
Il faut systématiquement éviter de faire écouter aux enfants de la « mauvaise » musique.

L’école doit donner accès à la musique, dès le plus jeune âge, pour tous.

Le chant doit devenir une pratique quotidienne et être enseigné aux enfants.

Le chant choral en particulier doit être développé, comme toute pratique collective.

Une éducation musicale digne de ce nom doit commencer entre l’âge de trois et six ans. Pour reprendre la boutade de Kodály, cet apprentissage devrait idéalement commencer « neuf mois avant la naissance de la mère ».
Les expériences capitales de la vie d’un enfant en musique se déroulent entre l’âge de six et seize ans, soit durant la période capitale de la scolarité.
L’écoute des chefs-d’œuvre de la musique doit être encouragée et suivie sur le long terme.⁵⁷⁰

Pour terminer ce point sur la méthode du compositeur, nous souhaiterions terminer avec ses mots : « La musique est une nourriture spirituelle irremplaçable. Celui qui ne s’en nourrit pas souffrira d’anémie toute sa vie. Sans musique la vie spirituelle n’est pas complète : l’esprit humain possède des régions que seule elle peut illuminer. »⁵⁷¹

1.3. La méthode Willems

D’origine belge, Edgar Willems (1890-1978) s’est inspiré des travaux de Dalcroze pour développer une méthode qui tienne compte des recherches sur la psychologie enfantine. Pour lui, l’éducation musicale doit favoriser l’épanouissement de l’enfant, enrichir l’être humain tout en s’adaptant aux besoins (physiques, affectifs, mentaux) de chacun. Cet enseignement de la musique suit les tendances de l’éducation moderne mettant en valeur la motricité, l’affectivité et la sensorialité. Il s’agit de solliciter le plaisir de la découverte et de l’écoute mutuelle. Willems considère que la musique est un langage et que son apprentissage suit les mêmes lois psychiques que l’éducation au langage (activités sensorielles, mémoire, activités affectives, activités mentales, activités inventives et activités créatrices). En cela, il insiste sur l’importance de l’initiation musicale dès le plus jeune âge, en étroite collaboration avec les parents, comme l’utilisation de mouvements pour le développement de l’instinct rythmique (bercements, petits sauts sur les genoux, etc.) qui permet d’acquérir et d’ancrer les éléments essentiels de la musique à travers l’expérimentation et la participation active. Pour Willems, l’initiation musicale précoce est une étape essentielle avant l’apprentissage du solfège et d’un instrument. L’enfant doit s’imprégner progressivement de l’environnement sonore qui l’entoure. Les jeux de reconnaissance auditive grâce à l’utilisation d’objets sonores variés et attrayants (comme par exemple les appeaux) permettent d’éveiller l’écoute et l’intérêt de l’enfant. S’en suit un travail rythmique (mouvements corporels, vivre et ressentir le rythme, marches pour développer le sens du tempo) et mélodique. Enfin, le chant tient une place très importante en tant qu’activité regroupant les aspects mélodique, rythmique et harmonique.

Il s’agit d’une méthode globale pour tout ce qui concerne la vie, et une méthode analytique pour la prise de conscience, qui exclut tout procédé extramusical et emploie des moyens qui vont du concret vers l’abstrait, c’est-à-dire de l’instinct à la conscience et à l’automatisme.⁵⁷²

Dans le tome II de son ouvrage l’oreille musicale,⁵⁷³ Edgar Willems consacre un chapitre entier à définir la bonne oreille. Il y distingue 3 types de fonctions auditives :

La sensibilité auditive (réception),

L’affectivité auditive (implique une sensation et une réaction),

L’intelligence auditive (compréhension).

Largement influencé par la philosophie empiriste, Edgar Willems recommandera l’utilisation de l’audiomètre comme moyen pédagogique du développement auditif de ses élèves. « L’audiomètre est un genre d’harmonium à clavier chromatique qui comporte jusqu’à des cinquantièmes et des centièmes de ton » (Willems, 1968).⁵⁷⁴ Le test de Seashore créé en 1919, une batterie de tests destinée à mesurer le talent musical appelé Measures of musical talent ⁵⁷⁵, permettra d’évaluer les différentes aptitudes musicales. Beaucoup plus tard, Gordon (2003)⁵⁷⁶ et Sloboda (1988)⁵⁷⁷ soutiendront également la même idée, à savoir qu’un test d’aptitude musicale est un outil d’enseignement.

On a souvent posé la question : « l’oreille musicale peut-elle être éduquée ? » Nous répondrons affirmativement … La vue aussi peut être améliorée, car le peintre apprend à voir de mieux en mieux les couleurs et les formes, et l’on a même inventé des méthodes qui ont fait leurs preuves, par lesquelles on supplée au port de lunettes par des exercices quotidiens. Donc, si les facultés et les sens humains se développent, pourquoi en serait-il autrement pour l’audition ? Mais si tel est le cas, direz-vous, pourquoi ne s’en est-on pas occupé plus tôt ? Nous en trouvons la raison, en partie, dans la complexité de la nature de la musique ainsi que dans le fait que peu de musiciens sont psychologues et peu de psychologues, musiciens.⁵⁷⁸

Selon le pédagogue et musicien Jacques Chapuis, « la conception willemsienne ne part pas de la matière, ni des instruments, mais de principes de vie reliant la musique et l’être humain, exaltant en tout premier lieu ce qui nous est à tous donné par la nature, au départ, soit notamment le mouvement et la voix. »⁵⁷⁹

L’initiation musicale est avant tout basée sur l’instinct rythmique des enfants et sur les développements de leurs capacités auditives. Elle comporte différents éléments de travail dont les principaux sont :

Un matériel auditif varié (surtout sensorielle et affective) : voix, flûte à coulisse, flûte à clavier, piano, sirène, carillon, xylophone, etc.,
Des frappés pour développer l’instinct rythmique,

Des chansons soigneusement choisies afin de développer la sensibilité,

Un vocabulaire de termes musicaux avec des mots simples et concrets pour l’enfant : un son, un intervalle, un accord, une mélodie, une chanson, un rythme etc.,
La gamme diatonique de sept sons, envisagée comme un ensemble d’intervalles à partir d’un son initial, la tonique. Elle forme une suite régulière de degrés,
Trois séries de symboles pour les sons : do, ré, mi etc. pour les noms des notes ; les chiffres romains pour les degrés de la gamme (I, II, III, etc.) et les chiffres arabes pour les intervalles (1er, 2e, 3e, etc.). L’écriture des valeurs rythmiques reste inchangée,
Le battement de mesure pratiqué de façon naturelle et méthodique,
Des marches caractéristiques ou des mouvements naturels, destinés à sentir le rythme physiologique et tout particulièrement, le sens du tempo.

Willems et Chapuis divisent cette initiation musicale en trois degrés pédagogique : la découverte sensorielle et auditive, la prise de conscience et l’introduction au graphisme, et enfin le stade pré-solfégique et pré-instrumental. A tous les niveaux, cette initiation doit largement faire place à l’improvisation rythmique et mélodique. Le solfège fait naturellement suite à cette initiation, dont il constitue en fait la quatrième étape, aboutissant à la maîtrise de la lecture et de l’écriture, c’est à dire à l’abstraction des phénomènes concrets.

Kémâl Afsin met en relation de manière tout à fait singulière les pédagogies de Maria Montessori et Edgar Willems en soulignant qu’ils jouent tous les deux sur ces pôles essentiels que sont le sensoriel, le mental et l’affectif. Ces trois pôles ne sont pas travaillés de manière séparée. Au contraire, ils se superposent et s’interpénètrent.⁵⁸⁰

Enfin la pratique instrumentale s’inspire des mêmes principes fondamentaux, avec une préférence pour l’apprentissage du piano. Pour Willems, il faut éviter un enseignement trop exclusivement instrumental qui privilégie l’aspect visuel et technique en le dissociant de l’aspect auditif et instinctif.

1.4. La méthode Maurice Martenot (1898-1980)

D’abord pianiste et violoncelliste, puis chef d’orchestre, Maurice Martenot servit de 1914 à 1918 dans les unités de transmissions. Sa fascination pour le son naîtra de cette période, car les postes utilisés pour les transmissions radio se servaient de lampes triodes. La pureté du son qui en ressortait impressionna grandement le musicien. Grand passionné de sciences, il souhaita dès lors inclure l’électricité dans l’instrumentation musicale de son temps. En 1919, il commença alors à faire ses recherches sur son futur instrument. « Les Ondes Martenot », qui figure parmi les toutes premières inventions de la musique électro acoustique, fut présenté dès 1928, à l’Opéra de Paris. Il se compose d’un clavier à sept octaves et d’un ruban qui, provoquant des oscillations électriques, crée des sons dont la richesse, le coloris, sont amplifiés par des haut-parleurs. La vibration répond aux moindres gestes de l’interprète, qui, de la main gauche, commande également, par des boutons, les changements de timbre et d’intensité. La première ondiste fut Geneviève Martenot, qui durant plus de 40 ans, présentera fidèlement l’invention de son frère à travers le monde. Jeanne Loriod deviendra l’élève et l’interprète privilégiée de Maurice Martenot. Elle créera un certain nombre d’œuvres de compositeurs de l’époque, dont celles d’Olivier Messiaen. Elle fondera également un quatuor, puis un sextuor d’ondes Martenot qui portera son nom. Succédant à son maître, Jeanne Loriod enseignera la technique de son instrument au Conservatoire National de Paris, à partir de 1970, ainsi qu’à la Schola Cantorum.

JOLIAT François, « La genèse et le développement de l’éducation musicale à l’école : entre l’enseignement de l’art et l’éducation par l’art en Suisse romande », in M. Mellouki & A. Akkari (Ed.), La recherche au service de la formation des enseignants, Actes de la recherche, Vol. 7, 2009, p. 195-217. — Figure 132: Les Ondes Martenot.

Concernant les fondements de sa pédagogie, il apparaît primordiale de se replonger dans le contexte socio-culturel de l’époque. François Joliat nous relate qu’au lendemain de la première guerre mondiale, « l’école française va élaborer un nouveau programme d’étude qui abandonnera l’accent mis sur le patriotisme, au profit d’une vision éducative basée sur le respect des besoins de l’enfant. »⁵⁸¹ Maurice Chevais (1880-1943) saura parfaitement intégrer cette réflexion dans ses ouvrages, prônant une « pédagogie active » de l’éducation musicale⁵⁸². Il utilise un nombre considérable de sources dans des domaines aussi divers que la littérature (Rousseau), la sociologie (Durkheim), la psychologie (Binet, Claparède, Decroly, Wallon, Piaget) et la pédagogie (Montessori, Dewey). Se basant sur les aptitudes auditives de l’enfant, par la passation de tests qu’il aura lui-même élaborés, Chevais élaborera une véritable didactique de l’éducation musicale.⁵⁸³ Elle passera par des exercices de pose de voix dont les notes de la gamme feront référence au corps par la « phonomimie » (précédemment énoncée dans notre chapitre sur la méthode Kodály) ou des exercices basés sur l’expression digitale de valeurs rythmiques appelée « dactylorythmie ».⁵⁸⁴ Désormais, les leçons de chant ne « mettront plus l’accent sur l’exposition et la décomposition de notions théoriques suivies de chants d’illustration »⁵⁸⁵, mais « articuleront le besoin d’activité de l’enfant avec la musique comme art du temps et du mouvement ».⁵⁸⁶

Maurice Martenot s’est largement inspiré des écrits de Chevais et de Willems dans la conception de sa pédagogie. Il s’intéressa tout particulièrement au problème de l’éducation musicale. Il mit au point avec ses sœurs, Madeleine et Ginette Martenot, une méthode d’enseignement qui, durant de longues années, mettrait en question les théories établies. La méthode Martenot développera une approche « psychopédagogique » de l’apprentissage musical. En enseignant la musique, Maurice Martenot s’est aperçu que la plupart de ses élèves instrumentistes manquaient de liberté dans leur geste, généré par des tensions intérieures plus profondes. Dès lors, la nécessité d’accorder d’abord « l’instrument humain », avant d’enseigner la musique lui est apparu comme une évidence. Après avoir expérimenté sur lui-même cette méthode de relaxation pendant plus de cinquante années de recherche, Maurice Martenot a proposé son cheminement basé sur des méthodes occidentales.⁵⁸⁷

L’importance de cette recherche autour de la relaxation active définit l’orientation de son travail : il ambitionne de devenir « Éducateur par l’Art ». « L’esprit avant la lettre, le cœur avant l’intellect », telle est la maxime qui se trouve en couverture des Principes fondamentaux.⁵⁸⁸ Pour Maurice Martenot, l’essentiel est que la musique parte d’une « pensée musicale » :

Il n’y a pas de musicien s’il n’y a pas de pensée musicale. C’est donc d’abord par le développement de cette faculté que passe tout apprentissage de la musique. Cette pensée musicale, qu’on peut aussi appeler chant intérieur, se développe par la mémorisation de mélodies dès le plus jeune âge. Elle se développe aussi par l’improvisation et la transposition spontanée. Derrière la pensée musicale, il y a tout simplement la vie. Le but de l’éducateur par l’art est de libérer, épanouir, respecter la vie, tout en inculquant les techniques. Il a pour mission de développer l’éveil, le sens de l’humain, le potentiel psychique, la stabilité continue d’attention, l’imagination créatrice et la maîtrise de soi.⁵⁸⁹

Les principes fondamentaux de cette éducation musicale peuvent être appliqués au dessin et à la danse aussi bien qu’au solfège et au piano. Basés sur les « trois temps Montessori » inspiré par la méthode d’Edouard Séguin⁵⁹⁰, à savoir l’imitation, la reconnaissance et la reproduction⁵⁹¹, ces principes se situent à l’opposé des méthodes traditionnelles en ce qu’ils explicitent le processus du passage du sensoriel à l’acquisition des connaissances.

1.5. La méthode Émile Jacques-Dalcroze

La rythmicienne et professeure Louise Mathieu, responsable du Groupe international de recherche sur la rythmique Jaques-Dalcroze (GIRRJD), nous présente ce dernier dans l’article Un regard actuel sur la rythmique Jacques-Dalcroze : ⁵⁹²

Né en 1865, mort en 1950, Émile Jaques-Dalcroze fut un homme aux multiples talents. Pianiste, compositeur, metteur en scène, il est considéré comme l’un des grands pédagogues du XXème siècle. Ses idées ont marqué plusieurs disciples artistiques. Précurseur de la danse moderne, il a également exercé une influence considérable sur le jeu scénique et la mise en scène moderne. En 1892, Jaques-Dalcroze est nommé professeur au Conservatoire de musique de Genève. C’est à cette époque qu’il se rend compte de la nécessité de réformer les programmes d’études et les méthodes d’enseignement de la musique qu’il considère trop fragmentés et trop intellectuels, déconnectés des sensations et des émotions de l’étudiant. Il s’appliquera donc à mettre au point une approche de la pédagogie musicale qui se fonde sur l’engagement de la personne toute entière et vise le développement harmonieux de l’ensemble de ses facultés. De là naîtra, avec le XXème siècle, la Rythmique Jaques-Dalcroze.⁵⁹³

Cette belle introduction nous permet de présenter à notre tour cette pédagogie que nous utilisons majoritairement auprès des enfants sourds avec lesquels nous travaillons quotidiennement. Nous nous sommes servis abondamment du très bel ouvrage de Marie Brice, Pédagogie de tous les possibles…⁵⁹⁴ et de celui de Marie-Laure Bachmann, un ouvrage de référence, La Rythmique Jaques-Dalcroze, une éducation par la musique et pour la musique.⁵⁹⁵

Marie-Laure Bachmann, directrice de l’Institut Jaques-Dalcroze de Genève de 1990 à 2006, a beaucoup œuvré pour que cette pédagogie dalcrozienne ait un plus grand rayonnement dans les diverses écoles européennes. Actuellement, il n’existe que trop peu de rythmicienne sur notre territoire. Il faudrait une vraie volonté politique pour repenser la place de l’éducation musicale au sein des écoles. Mais c’est un large débat qui n’est pas le propos véritable de ce chapitre.

Nous avons été particulièrement sensible à cette affirmation de Dalcroze, « On n’ écoute pas la musique uniquement avec les oreilles, on l’entend résonner dans le corps tout entier, dans le cerveau et dans le cœur ».⁵⁹⁶

Figure 133 : Photo de Valérie Aeschimann, Institut Jacques-Dalcroze, Genève.

En mettant l’accent sur ses propres sensations, le corps prend le rôle d’« oreille portative » en ressentant et en écoutant dans son intégralité.⁵⁹⁷ C’est ce qui nous a particulièrement intéressé dans cette approche pour l’enseignement auprès des enfants sourds. Marie-Laure Bachmann met d’ailleurs en avant que Dalcroze avait tout à fait l’intuition de la portée de sa méthode auprès d’un public élargi tel que les personnes en situation de handicap :

La diversité des domaines auquels touche la rythmique, le nombre des aptitudes qu’elle est à même de développer, en font un instrument particulièrement souple et économique pour qui entreprend d’aider un être en difficulté à découvrir-ou à redécouvrir- ses possibilités latentes. Très tôt, les élèves de Jacques-Dalcroze ont vu le parti qu’il y avait à tirer de la Rythmique dans le champ alors presque inexploré de l’éducation ou de la rééducation des handicapés sensoriels, mentaux et moteurs.⁵⁹⁸

D’après le pédagogue, la rythmique part de l’individu tel qu’il est et souhaite développer ses potentiels car « l’éducation ne consiste pas à créer chez l’élève des facultés qu’il n’a pas, mais bien plutôt à le mettre en mesure de tirer le plus grand parti possible des facultés qu’il a. »⁵⁹⁹ En voici les principaux fondements :

« Développer le sentiment musical (dans le sens grec du mot) dans l’organisme tout entier,

Créer le sentiment de l’ordre et de l’équilibre après avoir éveillé tous les instincts moteurs,

Développer les facultés imaginatives. »⁶⁰⁰

Dalcroze insiste sur nos rythmes corporels. Ils sont composés de nos « battements de cœur », nous donnant inconsciemment l’idée de la mesure de par sa régularité. « L’acte respiratoire » nous renseigne sur la division du temps et enfin « la marche régulière » qui est un modèle parfait de mesure et de division du temps en parties égales. Sa méthode est un ensemble de principes pédagogiques basés sur « une éducation visant à ordonner les réactions nerveuses, à accorder muscles et nerfs, à harmoniser l’esprit et le corps »⁶⁰¹ Par ailleurs, Marja-Leena Juntunen et Leena Hyvönen, se sont penchées sur la réciprocité entre les découvertes empiriques de Jaques-Dalcroze et la phénoménologie de Merleau-Ponty. Car, tous les deux considèrent le corps et l’esprit indissociables l’un de l’autre.⁶⁰² Pour Merleau-Ponty, écrivent-elles, « humans come to know the world by ‘being- in-the-world’ through the body ».⁶⁰³ Ainsi, « chez Merleau-Ponty, tout comme c’est le cas dans la conception dalcrozienne de l’apprentissage musical, le corps est perçu comme l’attribut constitutif de la connaissance. »⁶⁰⁴ Louise Mathieu rappelle également que « Damasio considère que le savoir se construit dans et à travers le corps, dans et à travers les sensations que nous procure notre corps, ainsi que dans la prise de conscience que notre être les ressent. »⁶⁰⁵ Jaques-Dalcroze ne disait-il pas justement, de façon imagée : « Que votre corps devienne de la musique ».

Figure 134 : « Rythmiciennes en plein air », photo de Frédéric Boissonnas, 1909-1910.

Annie Beck, Suzanne Perrottet, Jeanne Allemand et Clara Brooke.

Les trois matières principales dans cette pédagogie sont : la Rythmique, le Solfège et l’Improvisation. Deux enseignantes dalcroziennes, avec qui nous avons eu l’occasion de collaborer⁶⁰⁶, Anne Gabrielle Peter-Chatoux et Claire Leleu rappellent les principes pédagogiques qu’elles utilisent :

« La relation entre le temps, l’espace et l’énergie,

Les réactions auditives, visuelles et tactiles (en imitation, conventionnelles, mixtes),

L’association ou la dissociation de mouvements,

L’incitation, l’inhibition (gestion de son influx nerveux),

L’automatisation (la répétition inconsciente),

La systématisation (la répétition consciente),

Les exercices de groupe (sociabilisation),

L’improvisation (la créativité). »⁶⁰⁷

Tous ces moyens sont utilisés au service de l’élève (bébé, enfant, adulte, sénior) afin de développer des outils nécessaires pour l’expression du musicien, du danseur ou du comédien. L’enseignement se fait principalement à l’aide du piano et de la voix, en s’appuyant sur les mouvements naturels du corps. Anne Gabrielle Peter-Chatoux précise que :

Pour une même notion on proposera plein d’approches différentes pour multiplier les chances qu’elle soit intégrée. Lorsque j’explique un triolet par exemple, on va d’abord faire entendre le triolet à travers des exemples musicaux. Ensuite on va le danser avec un foulard, on va le comparer avec un rythme qui ressemble beaucoup, mais qui est quand même différent, on va le chanter, taper sur un tambourin, faire écouter une chanson pour l’identifier… et après seulement on va dire à l’élève : ce que tu as fait, ressenti, marché, dansé, chanté, s’appelle un triolet et s’écrit de cette façon-là. De fait, lorsque l’enfant a intégré le triolet pratiquement sans se rendre compte, et qu’il prend son instrument, il le connait déjà.⁶⁰⁸

Cette rythmicienne et présidente de l’association « Dalcroze France » fait finalement la synthèse des différents exercices de « réactions » typiques de l’approche dalcrozienne, concernant l’apprentissage du triolet. Il s’agit de développer des réflexes, d’être réactif aux différents stimuli physiques proposés. Lorsqu’un enfant joue une cellule rythmique au djembé par exemple, le reste du groupe réagit avec tout son corps et développe ainsi une sensibilité particulière. Ceci dans le but de développer la capacité à discriminer des gradations (même légères) de durée, de temps, d’intensité et de phrasé. L’utilisation de cette combinaison entre le rythme et le mouvement permet une relation singulière à l’autre, nécessitant la conscience mentale et kinesthésique de soi. Toutes ces sensations physiques sont transmises au cerveau comme des émotions et une compréhension plus développée de l’expérience musicale.⁶⁰⁹

2. Le pouvoir de la musique : concevoir un outil d’apprentissage de la texture destiné aux enfants sourds

« La danse joue un rôle capital dans les relations humaines, elle est une école du comportement social, de l’harmonie du groupe. La danse est l’école de la générosité et de l’amour, du sens de la communauté et de l’unité humaine. Tout être humain porte en lui un danseur. » Rudolf Laban

Partant du plaisir des enfants sourds à faire de la musique ensemble, nous avons réfléchi à l’élaboration d’un outil pédagogique qui nous permettrait de faire le lien entre leur perception de la texture et de la matière sonore à travers le mouvement. La perception musicale est intimement liée à l’action et vice versa. Renforcer ce couplage perception-action est tout à fait primordiale dans les mécanismes de plasticité cérébrale. Nous savons que la synchronisation du mouvement avec un son est véritablement une compétence universelle spécifique à tous les êtres humains. L’intelligence du corps est au centre de nos préoccupations. Nous avons souligné que la musique représente une médiation privilégiée pour l’émergence de nombreuses habiletés cognitives, émotionnelles et motrices.

Quelques exemples pratiques de ce type d’éducation musicale permettront d’illustrer au mieux ce cadre théorique.

2.1. Présentation :

Les différents groupes d’enfants sourds (âgés de 3 à 12 ans) avec lesquels nous travaillons au

C.E.O.P (Centre Expérimental Orthophonique et Pédagogique), bénéficient d’une séance hebdomadaire de 30 mn à 1 heure (selon leurs âges). Ils sont idéalement par groupe de 4 à 8 personnes. Nous avons créé également depuis l’année dernière un groupe parents/bébé sourd (une heure hebdomadaire) afin de stimuler au plus tôt l’audition du tout petit. Cela nous permet également d’accompagner au mieux les parents dans l’acceptation du handicap et de répondre à leurs interrogations dans la mesure du possible. La présentation ci-dessous correspond aux groupes d’enfants plus grands.

Une séance commence toujours de la même manière : les enfants se déchaussent et s’assoient en formant un cercle. Cette disposition nous permet de tous nous voir et facilite la concentration de chacun. Nous délimitons ainsi notre espace de travail.

Il s’agit de mémoriser une suite de gestes corporels (non-signifiants) inventés par chaque enfant à tour de rôle. L’idée est que chacun puisse exprimer ce qu’il est, en partageant librement son émotion du moment, en utilisant la partie du corps de son choix. Par la répétition, les enfants entraînent leur mémoire et prennent conscience de la successivité. Après avoir mémorisé cette « phrase » mimo-gestuée, nous la travaillons dans sa globalité en rythme. Ici, tous les enfants jouent en même temps et prennent conscience de la simultanéité (deux notions par ailleurs essentielles en langage).

Une phase d’éveil corporel termine cette mise en condition : étirements, bâillements, tension et relâchement des différentes parties du corps, prise de conscience de l’acte respiratoire. Petit à petit va s’installer une certaine harmonie, car nous aurons partagé ensemble nos sensations en respectant la proposition de mouvement de chacun, ce qui va nous permettre de développer un lien précieux, un sentiment d’appartenance.

Figure 135 : Illustrations de la phase d’éveil corporel.

Les enfants sont alors disponibles, en éveil. Nous pouvons commencer des petits jeux d’écoute musical, comme le « jeu de Kim » par exemple, très apprécié des enfants.

Un enfant se cache derrière un paravent et choisit pour commencer, trois instruments de son choix, présents dans la salle de musique. Le reste du groupe attend au fond de la pièce. L’enfant (le leader) joue et fait écouter aux autres ces trois instruments dans un ordre connu de lui seul. Les autres doivent bien sûr écouter et découvrir l’ordre choisi par ce dernier. L’enfant qui a trouvé la bonne combinaison peut alors prendre la place du premier et ainsi de suite… Chez les plus jeunes, nous n’irons pas au-delà de cinq instruments. Pour les plus expérimentés, ils sont en mesure d’aller jusqu’à neuf.

Cet exercice exige l’identification, la mémorisation puis la reproduction fidèle de la successivité des instruments entendus. Le plaisir du geste occupe ici une place toute particulière, car l’enfant caché ose s’exprimer davantage et enrichit ses connaissances tant sur le plan corporel que musical. Ce jeu permet aussi une prise de conscience du lien entre ses perceptions et ses productions. « D’une manière générale, le jeu instrumental réalise cette liaison sensori-motrice dans laquelle la musique est perçue a la fois comme geste et comme son ».⁶¹⁰

2.2. Développer la conscience rythmique à travers le mouvement :

Grâce à des mouvements naturels comme la marche ou les déplacements dans une salle, la sensation musculaire va pouvoir s’exercer et s’associer au phénomène sonore grâce à la musique proposée par l’enseignant ou l’enfant. Le plus important est d’être dans l’action, de prendre conscience de son corps en mouvement et d’y être attentif. Ce qui va pouvoir créer des images audio-motrices pour constituer un répertoire de perception enrichissant la musicalité de l’enfant. Même si bouger en rythme peut sembler simple, cela fait appel à un réseau complexe de régions cérébrales. Nous avons vu que le rythme musical stimule également les régions cérébrales dédiées au cortex moteur (Kotz et al., 2011).⁶¹¹

De plus, grâce au nombreuses études scientifiques sur le sujet, nous connaissons aujourd’hui les bienfaits du mouvement et de la danse, dans les maladies neurodégénératives comme la maladie de Parkinson ou la maladie d’Alzheimer (Spaulding et al., 2012⁶¹²; Duncan et Earhart, 2014⁶¹³ ; Lazarou et al., 2017)⁶¹⁴. Dans ce qui nous préoccupe, il est tout à fait indispensable de proposer des exercices dansés de façon ludique et motivante pour l’enfant. Le point de vue de la danseuse Doris Humphrey nous semble intéressant d’être mentionné. Dans son ouvrage, The Art of making dances (1959)⁶¹⁵, elle écrit que « le mouvement sans motivation est impensable ». Juste le fait de produire des mouvements peut être une motivation en soi. Elle poursuit en affirmant « je vis, donc je bouge ». La pédagogie Dalcrozienne nous semble partir de ce même élan vital. Le point d’entrée de la corporéité passe par les sensations corporelles chez l’enfant et lui fournissent un outil indispensable pour éveiller son imagination.

Pour favoriser cela, voici quelques exemples d’exercices typiques de cette pédagogie :

Grâce à leurs déplacements, les notions de « poids » leur permettront de sentir et de prendre conscience de la métrique et de la mesure dans la musique,

A travers la tension et détente musculaire, le ressenti des nuances sera plus aisée,

L’orientation dans l’espace pourra aider les enfants à découvrir le phrasé,

L’utilisation de l’espace enrichira la conscience de l’espace sonore.

Nous utilisons du matériel comme des balles, des cerceaux, des bâtons colorés… tout ce que notre imagination peut nous dicter sans limites. Il faut prendre le temps d’expérimenter, d’essayer des choses et de se tromper. Il est essentiel d’encourager les enfants à proposer tel ou tel matériel. La fierté ressentie par l’enfant et surtout les possibilités dont il dispose de choisir par lui-même sont si précieuses.

Figure 137 : Travail autour de la mesure à 4 temps avec des bâtons colorés

Il est possible, dans un second temps, de proposer aux enfants d’associer une action à un instrument. Par exemple, sur la cymbale, les enfants tournent, sur le triangle, on se met sur la pointe des pieds, etc. L’idée étant de faire correspondre un mouvement à la qualité du timbre proposé. La mémoire kinesthésique aidera ici à reconnaître de manière ludique chaque instrument et leur succession dans le temps. L’enfant développe alors, ce que Piaget, rappelons-le, a mis en évidence : le principe « d’assimilation » et « d’accommodation ». Par exemple, si un enfant entend une cymbale, son impulsion première sera de tourner sur lui-même puisqu’il l’a travaillé ainsi. Et si le coup de cymbale est joué « fortissimo », il pourra accommoder en amplifiant son mouvement ou en tournant plus vite notamment. « Assimilation » et « accommodation » sont inséparables l’une de l’autre. Nous assistons à un perpétuel va et vient entre ces deux actions essentielles. Cette activité peut aider à mobiliser ces principes piagétiens.⁶¹⁶

Figure 138 : Travail de la conscience rythmique à l’aide de balles.

« Le but des études rythmiques est de régulariser les rythmes naturels du corps et, grâce à leur automatisation, de créer dans le cerveau des images rythmiques définitives. »⁶¹⁷

2.3. Improvisation et Création

2.3.1. Exploration instrumentale :

Nous jouons dans un premier temps avec des instruments de petite percussion (tambourins, claves…) avec pour objectif de :

Prendre conscience de notre corps en mouvement,

Entraîner la coordination entre les pieds et les mains,

Travailler les différents niveaux de dissociation : entre les pieds et les mains (motricité globale), entre les mains et les doigts (motricité fine),
Établir une autre forme de relation dans le groupe.

Dans un second temps, les enfants explorent librement les instruments qui sont mis à leur disposition tels que des triangles, maracas, tambourins, xylophones ou carillons, guiros, claves, des « tubes mélodiques », djembé, etc. au final, ce qui ressemble finalement à l’instrumentarium de Carl Orff, dont nous avons déjà parlé au cours de ce sixième chapitre (Cf. Figure 129). La découverte se fait sur plusieurs séances, les enfants sont amenés à manipuler tous les instruments, à explorer leur sonorité, leur matériau, leur texture, etc. Nous pouvons alors échanger sur les techniques ou les stratégies mises en place pour faire de la musique avec tel ou tel instrument. Un travail sur les techniques de jeu est réalisé avec les enfants. Ils apprennent alors à contrôler et à préciser leurs gestes pour jouer.

2.3.2. Improvisation dansée :

Nous pouvons proposer également aux enfants un ruban de gymnastique, qu’ils affectionnent tout particulièrement, pour travailler en profondeur une cellule rythmique, comme deux croches/noire par exemple. La consigne étant de dire « Suivez ce que vous entendez au piano et dessinez-le avec votre ruban. » Ainsi les élèves dessinent avec leur ruban ce qu’ils entendent. Nous enchaînons alors au piano, des phrases qui toutes comportent deux croches/noire, mais les enfants ne le savent évidemment pas. Cet exercice fait appel à une perception globale. Même si le but est d’apprendre cette cellule rythmique tout particulièrement, il importe de laisser le temps d’explorer la sensation corporelle des rythmes. On ne fait pas appel à l’analyse ici, mais plutôt au ressenti.

Les enfants n’ont même pas besoin de savoir ce qui se passe dans la musique, ils n’ont qu’à se laisser guider par ce qu’ils entendent. En revanche, nous exigeons une certaine précision de mouvement, afin de voir les rythmes se dessiner. Les mouvements du ruban et du corps doivent rendre visible la musique entendue.

2.3.3. Improvisation instrumentale :

En partant d’une musique appréciée de l’enfant, nous aimons bien proposer l’utilisation d’un ou plusieurs instruments afin de permettre à l’enfant de s’exprimer. En improvisant, les enfants explorent les caractéristiques de leur corps, ils reconnaissent et expriment leurs sentiments et développent une meilleure compréhension du monde environnant. Pierre Schaeffer, dans son célèbre Traité des objets musicaux,⁶¹⁸ « valorise les « sons » plutôt que les « notes », non pas leur origine ou leur signification, mais leur mouvement, leur texture, leur couleur. »⁶¹⁹ C’est en créant des espaces sonores que les enfants découvrent qu’ils peuvent « composer ». Ils n’ont pas forcément des modèles à suivre ou à reproduire. En ne se préoccupant pas forcément de la tonalité et de ses codes, ils ont directement accès au monde sonore selon leurs moyens et leur personnalité.

2.3.4. Création de partition comme des « Paysages sonores » :

Des musiciens tels que John Paynter⁶²⁰ ou R. Murray Schafer⁶²¹ , et plus tard François Delalande⁶²², Monique Frapat⁶²³ et Claire Renard ont totalement inspiré ma démarche autour de la création avec les enfants sourds.⁶²⁴ Cette dernière propose d’aborder le jeu musical par le geste comme « l’intermédiaire entre la pensée musicale et le son produit ».⁶²⁵ Par exemple, pour jouer avec la texture, nous pouvons proposer ce type d’improvisation où les enfants joueront d’un instrument les uns après les autres, ce qui va densifier la matière sonore ou au contraire la faire disparaître, jouant sur la densité du son. Le volume sonore va varier mais les enfants, eux, devront garder la même intensité sonore par exemple.

Ce qui est particulièrement intéressant dans ce type d’approche, c’est de proposer un enseignement musical fondé sur la créativité, l’expression libre, ainsi que sur un retour à l’élément fondamental de la musique : le son. En travaillant sur la matière sonore et la texture, il devient alors possible d’aborder l’interprétation, l’improvisation et la composition musicale. Les sons peuvent alors être assemblés comme pourraient l’être les couleurs d’une peinture abstraite. Nous avons d’ailleurs mené un projet entre le pictural et la création musicale avec un petit groupe d’élèves sourds signants de 10-12 ans au Ceop, en collaboration avec Philippe Séro-Guillaume, qui nous a ouvert les portes de son atelier. Il est interprète en langue des signes, docteur en traductologie, directeur de la Section Interprétation en Langue des Signes de l’Ecole Supérieure d’Interprètes et de Traducteurs (ESIT). Son ouvrage, Langues des Signes, Surdité et accès au langage (2008)⁶²⁶ est une référence, car ses recherches mettent en évidence les bases constructivistes psycho-mécaniques inhérentes à l’activité langagière qu’elle soit signée, parlée ou écrite. Il a proposé une analyse des différents mécanismes d’apprentissage de la langue.

Sur une proposition de ces enfants, il s’agissait d’illustrer musicalement le tableau ci-dessous. Les enfants ont aussi travaillé leur créativité et leur imagination en produisant un texte écrit de manière collective.

Figure 140 : *Composition, 2015* de Philippe Séro-Guillaume, Huile sur toile, 100 x 100 cm

Nous avons réalisé un premier graphique représentant les différents flux auditifs, une sorte d’architecture globale où chaque enfant s’intégrait dans la matière sonore. Le premier élément important pour eux a été d’exprimer l’intensité : ce que l’on distingue en bas à gauche de la photo. Nous avons désigné un instrument pour chacun et élaboré, selon nos émotions et nos sensibilités, le début d’une partition. Grâce à cette pratique collective, l’enfant se construit en tant que personne au sein du groupe et grâce au groupe. En effet, l’enfant sourd, tout en apprenant à respecter des règles, construit son savoir seul mais il a besoin des autres pour le structurer et le faire évoluer.

Chaque instrument entrait successivement constituant un immense crescendo orchestral en quelque sorte, arrivant à son climax pour redescendre peu à peu et terminer avec l’instrument initial : un tambour océan. Le contexte imaginé était de représenter une île bleu azur et ses habitants : divers animaux (baleine, dinosaure, girafe, éléphant, renard, etc.).

Figure 141 : Premier jet de notre travail.

Après avoir travaillé leurs parties séparément, ils ont pris un immense plaisir à jouer ensemble. Tous les enfants sont attirés spontanément par le jeu instrumental : plaisir de la découverte, plaisir du geste, plaisir de la production.

Finalement, après avoir joué les propositions des uns et des autres, nous nous sommes mis d’accord pour aboutir à la partition finale ci-dessous (fig. 142).

Dans cette perspective, le fait d’enseigner la musique comme phénomène sonore, permet d’accèder à une plus large compréhension de toutes les musiques, autant les musiques tonales que les musiques non tonales ou extra-occidentales. Les enfants sont donc invités à penser la musique sous forme de textures, avec des termes comme doux/rugueux, chaud/froid, léger/lourd, etc., le plus souvent corrélés avec des émotions comme la tristesse, la gaieté, la peur, etc.

Figure 142 : Partition collective de l’Ile Bleu Azur. — Figure 142 : Partition collective de *l’Ile Bleu Azur*.

Le rôle de l’enseignant consiste à stimuler l’écoute et la curiosité des enfants par la présence accrue d’exercices d’improvisation, d’expression, de travail corporel, afin de développer leur jugement esthétique. De cette manière, les enfants pourront apprendre d’eux-mêmes, en procédant par tatônnement tout en essayant de résoudre les divers problèmes rencontrés dans leur démarche artistique.

Figure 143 : Concert des enfants devant Philippe Sero-Guillaume au Ceop.

Finalement, notre démarche pourrait s’inscrire dans un processus de « recherche-création » défini par Gosselin notamment.⁶²⁷ Les travaux réalisés dans ce sens par Grazia Giacco et le GREAM (Groupe de recherches expérimentales sur l’acte musical) à Strasbourg nous intéresse tout particulièrement.⁶²⁸

2.4. Le rôle essentiel des comptines :

L’importance des comptines, pendant les premières années de l’enfance est fondamentale. Nous pouvons affirmer qu’elles soutiennent la communication préverbale de tout petit. Trevarthen et Malloch (2009) ont développé le concept de musicalité communicative afin de décrire la capacité du tout petit à communiquer avec les autres.⁶²⁹ Ces chercheurs ont montré que les bébés étaient capables très précocement de s’impliquer dans des échanges sociaux et d’avoir une influence sur eux. Nous avons également vu que le motherese participait à la construction de la communication mère-enfant. Lors de ces échanges, la communication est polysensorielle : le regard, les mouvements du corps et la voix sont corrélées. Déjà, l’implication du corps tout entier nous renseigne sur les émotions, au niveau de sa tonicité ou de son relâchement (tension/détente). La conception du danseur et chorégraphe Rudolph Laban développée dans les années 1950 pose les bases du rôle de l’expression corporelle.⁶³⁰ Il énonce quatre facteurs constitutifs du mouvement : le poids, le flux, l’espace et le temps. Il ajoute la notion essentielle de l’« effort » qui désigne « les impulsions intérieures dans lesquelles le mouvement prend son origine ».⁶³¹ Selon lui, ces éléments sont « les clefs permettant de comprendre ce qu’on pourrait appeler l’alphabet du langage du mouvement ».⁶³² Tous ces éléments sont déjà présents chez le nouveau-né. De plus, selon l’âge et le comportement de son enfant, la mère adaptera son chant. Anne Delavenne et collaborateurs (2013) ont mis en évidence cela en demandant aux mères de chanter la même chanson à deux moments différents : au 3 mois puis au 6 mois de leur enfant. Une analyse acoustique a permis de montrer que les mères avaient un chant beaucoup plus marqué au 6 mois de leur petit. Ce qui suggère que les mères devaient ajuster leur chant en fonction du développement de leur enfant de manière intuitive. Ces études sont corroborées par les recherches de Sandra E. Trehub : « Les nourrissons sont sensibles aux modèles de sons perçus par les adultes comme « musicaux », tels le contour d’une mélodie et les intervalles les plus bas d’une série harmonique comme la quinte juste ; ils peuvent aussi reconnaître des séquences de sons dans diverses transpositions et divers tempos. On connaît bien leur sensibilité à la mélodie sous forme de berceuse (Trehub & Trainor, 1998)⁶³³ ».

Les comptines s’inscrivent dans notre patrimoine culturel. La plupart sont très anciennes. La forme de la comptine est multiple, cependant nous pouvons dire qu’elle est souvent divisée en couplets séparés d’un refrain. Elle prépare l’enfant à recevoir les principales composantes du langage, à savoir le rythme et l’intonation. La comptine est un moyen simple pour réguler les émotions des bébés. Leur but est manifestement ludique, car elles sont source de plaisir partagé. L’aspect rythmé des comptines et leur répétition permet aux bébés de développer des capacités attentionnelles ainsi que des capacités d’anticipation, car la familiarité des chansons entendues va lui permettre de prédire la suite des évènements (Stern, 1989).⁶³⁴

Pour un bébé sourd, comme chez un bébé normo-entendant, les comptines vont éveiller son intérêt pour le monde sonore et donner du sens à son environnement. Après la mise en place d’un appareillage adapté le plus tôt possible, le bébé sourd pourra développer les mêmes types de compétences grâce à l’apport de la comptine notamment. Elle va l’accompagner tout au long de son développement psycho-affectif et favorisera son développement linguistique. Multimodale, la comptine fait intervenir l’audition, la vision et la motricité. Elle contribue à la structuration du temps, de l’énergie et de l’espace. C’est grâce à cela, que pourront se construire la langue et la pensée. La comptine permettra aussi d’établir des liens avec l’analyse des éléments pertinents de la voix et de la parole, le travail d’articulation et de conscience phonologique. Tous ces liens se feront harmonieusement grâce au soutien essentiel de sa famille.

Ainsi, de par les échanges relationnels ludiques et dynamiques entre le bébé sourd et son entourage, la comptine offrira au bébé la possibilité de combiner « des perceptions auditivo-verbales, des perceptions kinesthésiques, multisensorielles et somesthésiques. »⁶³⁵

Au niveau pédagogique, l’utilisation de la voix associée aux gestes permet d’aborder une réflexion intéressante menée par Grazia Giacco (2016) à propos du processus de création autour de la notion de geste visuel, sonore et tactile.⁶³⁶ Il s’agit ici de repenser la place de la voix, « La voix n’est pas uniquement une voix chantée : un lien profond l’unit au corps, une voix qui grâce à l’expression gestuelle, corporelle, peut être exploitée dans toutes ses possibilités paramétriques, sonores-quantitatives et qualitatives. »⁶³⁷ Par rapport à la surdité, cette problématique prend tout son sens. Le « Moi-Peau » développé par Didier Anzieu (1985)⁶³⁸ et rappelé par Grazia Giacco, constitue un concept psychanalytique majeur, replaçant le corps au centre de toutes les attentions. Il explique comment se construit le sentiment d’existence, d’identité du bébé, ce sentiment d’être « une personne unifiée » pour Anzieu. Ce dernier s’inspirera notamment des travaux de l’éthologue Lorenz sur « l’empreinte »⁶³⁹ ⁶⁴⁰ et des travaux du pédopsychiatre Winnicott à travers la notion de holding.⁶⁴¹ C’est pourquoi les gestes maternels, réalisés au moment des soins du tout petit mais aussi au moment des échanges vocaux-gestués des comptines, correspondent aux premiers messages d’une communication pré-verbale précoce essentielle.

Dès lors, la place du corps, central dans les méthodes actives musicales exposées tout au long de ce chapitre, devient un concept clef dans l’élaboration d’une pédagogie musicale auprès des enfants sourds.

2.5. Création d’un « Jardin des Sons »

Depuis quelques années, nous animons également deux ateliers musicaux hebdomadaires au CHU de Dijon à destination des enfants et des adultes sourds implantés. Ce qui a donné naissance à une réflexion autour de leur perception. Nous avons alors élaboré avec Frédéric Voisin, Emmanuel Bigand et Philippe Lalitte au LEAD (Laboratoire d’Étude des Apprentissages et du Développement) un projet de recherche nommé « Jardin des sons », en utilisant les mêmes textures présentes dans notre première expérimentation, afin de créer un espace sonore ludique où les enfants sourds se déplaceraient munis de capteurs sensoriels. Selon leurs déplacements, cela pourrait nous renseigner sur leurs préférences, ce qu’ils perçoivent le mieux etc…

Figure 144 : Salle d’interaction *Musique-Geste* LEAD.

Ce dispositif de sonification musicale du mouvement nous a permis d’amener les enfants sourds implantés à explorer le plus grand nombre de dimensions du son et de la musique avec une participation active de l’ensemble du corps et par la même occasion d’explorer leurs propres capacités auditives.

Figure 145 : Schéma général de l’interface musicale.

Neuf modules d’exploration sonore et musicale ont été conçus :

Audiométrie active : Les fils sonores, La pêche aux mots, La chasse au trésor.

Exploration du son musical : Jeu de la statue, Jeu avec deux dimensions sonores, Jeu avec plusieurs dimensions sonores.
Explorations polyphoniques : Mimer c’est jouer, Mix et remix, Danse avec les voix.

Figure 146 : Expérimentation des enfants sourds implantés au LEAD.

Ils ont été expérimenté par nos élèves à plusieurs reprises. Ces modules comportent tous des niveaux de difficultés progressifs, en relation direct avec leurs capacités psychomotrices.

Voici une présentation détaillée de l’avancement de ce projet en cours de finalisation.

2.5.1. Audiométrie active

Les fils sonores virtuels : Au moyen d’une baguette, l’enfant tire l’un après l’autre différents fils virtuels qui représentent des fréquences fixes dont l’intensité décroit lorsqu’il traverse la salle jusqu’à devenir inaudible. Dans une première phase, pour chaque fil (fréquence), l’enfant marque le sol de sa baguette lorsqu’il arrive au bout du fil, c’est à dire lorsqu’il ne l’entend plus. Dans une seconde phase, l’enfant doit retrouver chacun des bouts de fil en partant du silence cette fois-ci. Notre objectif principal étant de familiariser l’enfant avec la sonification de l’espace. Nous cherchons à évaluer le seuil de perception tonale de l’enfant.
La pêche aux mots : A l’aide d’une baguette, l’enfant recherche des puits virtuels d’où émergent des voix à peine audibles : plus la baguette est proche du sol, plus on entend les voix. A chacun des puits qu’il trouve, l’enfant en extrait tous les mots, en les répétant un à un : à chaque extraction, l’intensité des mots diminue de 4 dB. Lorsque le puit est vide, les mots étant devenus inaudibles, l’enfant recherche le puit suivant. L’objectif est d’évaluer leur seuil de perception et leur seuil d’intelligibilité vocale.

La chasse aux trésors : L’enfant effectue un jeu de piste dans la salle. Des coups de baguette déclenchent l’énonciation vocale de consignes qu’il doit suivre. L’enfant est amené à parcourir six « scènes auditives » typiques (par exemple : la rue, la cantine, la cours de récréation, la mer) associées à six zones différentes dans la salle. La hauteur de la baguette détermine le rapport signal bruit de la consigne vocale (voix/scène auditive).

2.5.2. Exploration du son musical

Le jeu de la Statue : L’enfant accompagne la musique en bougeant et en se déplaçant comme il veut. Lorsque la musique s’interrompt, l’enfant doit rester immobile. Lorsqu’elle reprend, l’enfant peut recommencer à bouger. A chaque reprise, l’intensité de la musique diminue de 4 à 6 dB. Dans une première phase, les arrêts sont automatisés, aléatoires ou structuraux (prédictibles). Dans une deuxième phase, c’est l’enfant qui décide de l’arrêt et du recommencement de la musique. L’objectif consiste à évaluer leurs seuils de perception avec des sons musicaux.
Jeu avec deux dimension sonores : Explorer les dimensions du son et de la musique par les mouvements du corps et les déplacements dans l’espace qui font varier deux dimensions musicales à fois, notamment le tempo de la musique et le registre des instruments. L’objectif est d’apprendre aux enfants à interagir avec la musique par le mouvement et la position dans l’espace.
Jeu des effets musicaux : Explorer différents effets musicaux par les mouvements plus précis des mains, outre les positions dans l’espace : tempo, registre, mais aussi intensité, consonances, dissonances, rugosité, réverbération… L’espace est exploité dans ses 3 dimensions.

Notre objectif consiste à aider l’enfant à se familiariser avec la diversité des dimensions et qualités musicales en apprenant à contrôler ses gestes.

2.5.3. Exploration polyphonique

Mimer c’est jouer : Lorsque l’enfant mime un instrument (violon, trombone, flûte traversière, batterie), il s’entend en jouer comme s’il avait déjà commencé à apprendre à en jouer… A différentes positions dans l’espace correspondent différents styles de musique. Il s’agit ici de familiariser l’enfant au contrôle du phrasé et à l’expressivité musicale par le geste.
Mix et Remix : L’enfant se tient debout au milieu de la salle. Des « fenêtres » invisibles que l’on peut ouvrir ou fermer plus ou moins, sont disposées ici et là autour de lui. Elles permettent d’entendre ou d’atténuer différentes parties qui constituent une musique polyphonique. L’idée est que les enfants se familiarisent avec les différentes parties d’une musique polyphonique.
Danse avec les voix : Avec l’ensemble de son corps, l’enfant active, avec plus ou moins d’intensité, les différentes parties polyphoniques associées aux différentes parties de son corps. La musique s’arrête lorsque l’enfant ne bouge plus et reprend lorsqu’il bouge. Il peut changer de style de musique en frappant dans ses mains. L’objectif principal est de permettre à l’enfant de développer la coordination et l’indépendance de différentes parties de son corps (membres, torse) en relation avec la musique entendue.

Figure 147 : Visualisation du mouvement d’un enfant sourd implanté.

Conclusion

Tout au long de ce travail de recherche, nous avons essayé de définir quelles réalités recouvraient la texture dans des domaines fort variés et plus particulièrement d’étudier ses implications en musique, d’un point de vue musicologique, cognitiviste et pédagogique.

Dans le premier chapitre, nous avons pu constater à quel point la texture est omniprésente autour de nous. Son aspect multimodal en fait un concept à la fois complexe et subtil que nous retrouverons également en musique. Elle contient des informations visuelles essentielles sur les objets de notre environnement. Elle nous permet de distinguer les aliments, les tissus, les surfaces d’une œuvre d’art. Cela fait de la texture une partie importante de l’apport sensoriel que nous recevons chaque jour.

Tout au long du second chapitre, nous avons démontré sa richesse conceptuelle en musicologie. Tantôt elle sera définie comme étant une « surface », « un grain », « une nappe »,⁶⁴² ce qui renvoie au caractère général du son, au sentiment extérieur de la musique, plutôt qu’à sa structure interne, tout comme chez Morgan qui la dépeint comme « une immense toile sonore ».⁶⁴³ Tantôt elle correspondra à une combinaison subtile de lignes musicales, avec les conceptions de Wallace Berry ou de Joel Lester notamment.⁶⁴⁴ Chez les compositeurs, nous retrouvons des textures s’apparentant à « la matière » comme chez Ligeti ou chez Feldman partageant le point de vue du musicologue Lewis Rowell.⁶⁴⁵

En psychologie cognitive, l’étude de la perception de la texture s’avère fondamentale pour mieux comprendre les principes de l’organisation auditive. Nous nous sommes appuyés dans le troisième chapitre sur le cadre de référence théorique proposé par Bregman : « l’analyse de scènes auditives ».⁶⁴⁶ Il a mis en évidence deux grandes classes de mécanismes : les mécanismes de ségrégation simultanée et les mécanismes de ségrégation séquentielle. Grâce à ses travaux et ceux de McAdams, dans une perspective analytique, nous avons apparenté le groupement simultané à la dimension verticale de la texture et le groupement séquentiel et segmental à la dimension horizontale. Dans la musique après 1945, et notamment dans les musiques qui accordent une importance majeure au timbre, à la texture et à l’espace, le groupement segmentationnel correspond à des qualités sonores émergentes telles que la densité (opacité vs transparence), l’étendue (large vs étroite), le centre de gravité tonal (léger vs lourd), la brillance (clair vs sombre), la dissonance sensorielle (rugueux vs soyeux) pour la dimension verticale. Alors que la striation (pulsé vs lisse), la régularité (fluide vs saccadé), la vitesse (rapide vs lent), la stabilité (mouvant vs statique) et la densité temporelle (aéré vs compact) illustrent plutôt la dimension horizontale. Nous avons d’ailleurs construit nos expérimentations (chapitre 5) à partir de cela. L’apport essentiel de Meyer nous a permis de comprendre les processus cognitifs et émotionnels de la musique. Il nous a guidé également dans l’élaboration de nos recherches expérimentales.

Afin de mieux comprendre la perception de nos élèves sourds implantés avec lesquels nous travaillons, nous avons présenté dans le quatrième chapitre, la surdité et ses conséquences dans le but de mieux cerner les enjeux de notre étude. Nous avons pu souligner l’apport essentiel de la musique dans leur éducation.

Dans notre cinquième chapitre, nous avons dans un premier temps présenté quatre analyses de la texture à l’aide du logiciel informatique Sonic Visualiser. Analyser la texture en musique contemporaine, à savoir analyser les différents types de tissage, de grain, de matière, de strates, revient à considérer la texture comme étant un tout plus ou moins homogène, constituée de la fusion d’éléments séparés. La description verbale de la texture a complété notre description visuelle. Nous l’avons décrite en fonction de sa dimension verticale et horizontale, en référence à l’ASA de Bregman.

Dans un second temps, nous avons présenté nos deux études comportementales menées auprès d’enfants sourds implantés, versus enfants normo-entendants. Dans la première, il s’agissait de classer des textures à partir d’extraits audio de musique contemporaine. Les résultats ont mis en évidence les capacités inouïes des enfants sourds implantés à percevoir significativement la texture malgré leur déficience. Nous pensions que les enfants normo-entendants seraient bien meilleurs dans cette tâche. Nous avons alors cherché à comprendre ces résultats en la proposant à des adultes musiciens et non-musiciens. Nous avons montré que les résultats des adultes musiciens se rapprochaient de ceux des enfants sourds, alors que ceux des adultes non-musiciens étaient plutôt semblables à ceux des enfants normo-entendants. Nous avons donc mené une seconde expérimentation avec les enfants où il s’agissait de classer des extraits musicaux en fonction de leur contenu émotionnel : la gaieté, la colère, la sérénité et la tristesse. Nous avons postulé tout comme pour la première, que les enfants normo-entendants seraient meilleurs dans cette tâche car nous avons utilisé cette fois-ci de la musique tonale. Malgré tout, les résultats ont montré que les enfants sourds performaient dans la reconnaissance d’émotions singulières, la sérénité et la tristesse, et ce grâce à leur perception du mode. Les enfants normo-entendants ont obtenus de meilleurs résultats cette fois-ci.

Nous sommes tout de même allés plus loin dans notre analyse en nous intéressant tout particulièrement aux excellents résultats des enfants sourds pour classer des textures ; car ces résultats mettaient en évidence que bien qu’implantés ces enfants percevaient très bien les dimensions acoustiques pertinentes des textures. A ce stade, l’utilisation de descripteurs audio s’est avérée primordiale afin d’analyser au plus près certaines caractéristiques du son. Il semblerait que les enfants sourds aient plus utilisé les descripteurs de timbre, d’intensité et de fluctuation rythmique pour réaliser cette tâche. Concernant la reconnaissance des émotions, nous attirons votre attention sur le fait que ce sont précisément les descripteurs audio reliés au mode (Tonal Mode et Key Clarity) qui sont principalement corrélés avec les extraits tristes et sereins. Ce qui permet de maximiser nos résultats. Par conséquent, il nous plaît à penser que l’utilisation de la texture pourrait contribuer à enrichir les pratiques pédagogiques actuelles chez les enfants et plus particulièrement chez les enfants sourds implantés. De plus, nous pourrions envisager de poursuivre nos recherches sur la perception de la texture, en étudiant plus finement ses liens avec les émotions, à partir d’extraits en musique contemporaine, avec une plus grande population d’enfants sourds implantés par exemple. Cela nous fournirait certainement de nouveaux éléments d’analyse, tant en musicologie qu’en psychologie cognitive.

Plus particulièrement en musicologie, il conviendrait d’harmoniser nos pratiques d’analyse de la texture afin d’avoir une compréhension plus fine de celle-ci. La partition seule ne suffit pas à rendre compte de son importance. Nous avons montré que la forme d’onde, le sonagramme et le coefficient d’énergie dans les bandes critiques notamment, pouvaient apporter de nouvelles perspectives pour l’étude de la texture en musique contemporaine.

La petite enfance nous semble la période idéale pour commencer à développer ces facultés sensorielles. Le cerveau de l’enfant, dès la naissance est extrêmement bien organisé. Il contient des connaissances innées et aussi des « algorithmes sophistiqués d’apprentissage ». Il est très important de ne pas sous-estimer les compétences de l’enfant. Selon Stanislas Dehaene, le métier d’enseignant suppose de respecter quatre principes fondamentaux sur la plasticité cérébrale et les apprentissages : l’attention, l’engagement actif, le retour sur erreurs et la consolidation.⁶⁴⁷ Ces principes sont compatibles avec une grande liberté pédagogique, car l’enseignant devient un véritable expérimentateur. Nous avons expliqué les différentes activités musicales que l’on peut faire avec des enfants sourds. Un enfant sourd, comme un enfant normo-entendant, est attiré par la musique : plaisir du geste, plaisir de la découverte, plaisir de la production. La musique joue un rôle fondamental dans nos vies car elle agit sur nos émotions, notre cognition et notre comportement. L’écoute musicale ne peut être passive, car nous apprenons toujours en agissant. La possibilité de percevoir les sons avec le corps tout entier est une faculté essentielle que nous devons développer avec ces enfants, dès leur plus jeune âge. Le corps est émetteur et récepteur de la communication. La musique dans ce cadre, devient un terrain d’expériences, de jeu et de créativité nécessaires à la construction du langage et à la découverte de soi. Selon Winnicott, « C’est en jouant, et seulement en jouant, que l’individu, enfant ou adulte, est capable d’être créatif et d’utiliser sa personne toute entière. C’est seulement en étant créatif que l’individu découvre le soi ».⁶⁴⁸ Comme le rappelle Grazia Giacco, « la didactique de la musique a développé désormais un intérêt pour ces pratiques pédagogiques où la spatialité du corps — spatialité physique et spatialité symbolique—acquiert toute sa valeur. »⁶⁴⁹

La création sonore avec des enfants sourds, grâce à l’enseignement de la texture à travers le mouvement, ouvre de nouvelles perspectives pour mieux comprendre leurs performances tant sur le plan auditif et moteur. Mais elle permet aussi l’émergence de sensibilités et de comportement singuliers.

Liste des figures

Figure 1 : Hommage à Edgar Varèse – 25.10.64, de Zao Wou-Ki, 2
Figure 2 : Description générale des quatre tissus fondamentaux, 10
Figure 3 : Granit, 11
Figure 4 : Basalte, 11
Figure 5 : Obsidienne, 12
Figure 6 : Pegmatite, 12
Figure 7 : Quartzite, 12
Figure 8 : Gneiss,13
Figure 9 : Schiste, 13
Figure 10 : Exemples de résultats de l’analyse quantitative de texture magnétique présentés sous la forme de figures de pôles directes. 15
Figure 11 : Exemples de différents types de textures alimentaires. 16
Figure 12 : Exemples de différents types de textures en cosmétique, 19
Figure 13 : Extraits de textures de la base de Brodatz, 21
Figure 14 : Berenice Abbott, Soap Bubbles, 1945-46, New York, 23
Figure 15 : Schéma général de la Textualité de Jean Michel Adam, 24
Figure 16 : Plan d’organisation de la texture, 25
Figure 17 : Sheila Hicks, The Silk Rainforest (fils de soie), 1975, silk, linen, and cotton, (243.8 x 685.8 x 7.6 cm), Smithsonian American Art Museum. 28
Figure 18: Mona Hatoum, Pom Pom City, 2002, Natural wool, (5,1 x 365,8 cm), 29
Figure 19: Vue d’exposition : Hella Jongerius, Entrelacs, une recherche tissée (2019), 30
Figure 20: Vue d’exposition : Hella Jongerius, Entrelacs, une recherche tissée (2019). 31
Figure 21 : Vincent Van Gogh, Nuit étoilée, 1889, huile sur toile, (73 X 92 cm), 33
Figure 22: Jackson Pollock dans son atelier, 35
Figure 23: William De Kooning, 1952, Woman II, huile et fusain sur toile, (149.9 x 109.3 cm), 36
Figure 24: Barnett Newman, Onement III (1949), huile sur toile, (182.5 x 84.9 cm), 37
Figure 25: Mark Rothko, Orange and Yellow (1956), huile sur toile, (231.1 x 180.3 cm), Albright-Knox Art, Buffalo (États-Unis). 38

Figure 26: Pierre Soulages, Peinture, 9 mars 2014, Acrylique sur toile, (57 × 81 cm), 39
Figure 27: Texture monophonique (mesures 1 à 4,) 42
Figure 28: Texture homophonique (mesures 5 à 10). 42
Figure 29: Texture polyphonique (mesures 11 à 20). 42
Figure 30: Texture monodique simple. 43
Figure 31: Texture monodique étendue, 43
Figure 32: Deux lignes indépendantes. 44
Figure 33: Exemple de texture homophonique, 44
Figure 34: Vassily Kandinsky, Akzent in Rosa (Accent en Rose), 1926, 47
Figure 35: James Abbott McNeil Whistler, Nocturne: Blue and Silver – Chelsea (1871), 48
Figure 36: Monument en pays fertile, Paul Klee, 1929, 51
Figure 37: Structures pour deux pianos, 52
Figure 38: Paul Cézanne, Le Lac bleu, 1896, Huile sur toile, 65×81 cm, 55
Figure 39: Vue intérieure de la chapelle (Thomas Struth for The New York Times). 58
Figure 40: disposition des panneaux dans la chapelle. 60
Figure 41 : Pithoprakta : description globale des transformations progressives. 62
Figure 42: Exemple de la Sound Box d’Allan Moore : Cliff Richard, Congratulations 68
Figure 43: Illustration de la loi de prégnance, 74
Figure 44: Illustration de la loi de continuité, 75
Figure 45: Illustration de la loi de proximité, 75
Figure 46: Illustration de la loi de similarité, 75
Figure 47: Illustration de la loi de destin commun. 76
Figure 48: Illustrations de la loi de clôture avec notamment le célèbre logo de l’ONG ayant pour but la protection de la nature WWF (World Wildlife Fund), 76
Figure 49 : Schémas des étapes de traitement qui interviennent dans la reconnaissance et l’identification. 80
Figure 50: Différents types de groupements et leurs effets perceptifs. 83
Figure 51: Extrait de l’analyse de Tenney et Polansky, p. 222. 89
Figure 52: Exemple de représentation de la structure de groupe avec le début du Scherzo de la Sonate de Beethoven opus 2, n°2, Extrait de Lerdahl and Jackendoff (1983), p. 15. 91
Figure 53: Exemple de représentation de la structure métrique avec le début de la Symphonie en sol mineur de Mozart. Extrait de Lerdahl and Jackendoff (1983), p. 23. 91
Figure 54: Représentation des structures de groupe et métrique de l’Ouverture du Menuet de la Symphonie n° 104 de Haydn. Extrait de Lerdahl and Jackendoff, p. 26. 92
Figure 55 : Exemple d’une réduction prolongationnelle de Là ci darem la mano de Don Giovanni de Mozart : les branchements à droite représentent les éléments de tension et ceux de gauche la détente, extrait de Lerdahl and Jackendoff, p. 200. 93
Figure 56: Analyse générative de la première phrase de l’Aria des Variations Goldberg de Bach. 93
Figure 57: Représentation schématique de la TGMT (d’après E. Bigand, 1994). 94
Figure 58 : Diagramme générale de la théorie de Lerdhal et Jackendoff. 95
Figure 59: Pianos 1 & 2, altos et violoncelles (chiffre 9), extrait de Philippe Lalitte, 100
Figure 60: Évaluation des distances des strates sonores de la pièce A Day in the Life des Beatles, 107
Figure 61: Illustration de l’effet de continuité, 108
Figure 62 : Sonagramme d’une gamme de Shepard (échelle des fréquences linéaires). 112
Figure 63 : L’escalier de Penrose (Deutsch, 2010). 112
Figure 64 : Jean-Claude Risset dans un laboratoire de la compagnie Bell en train de suivre une composition pour trompette d’Henry Purcell interprété par un ordinateur. Crédit : Hulton Deutsch. 113
Figure 65: Turenas (1972) : pièce pour bande quatre pistes réalisée sur ordinateur, 114
Figure 66: Spectrogramme et transcription d’un extrait du Miserere Dietro l’Altare enregistré par Bernard Lortat-Jacob (1996/1998) à Castelsardo. 116
Figure 67: photo de Bernard Lortat-Jacob. 117
Figure 68: Modèle du Circumplex de Plutchik en trois dimensions (en haut à gauche), 122
Figure 69: Modèle de la Théorie ITPRA de David Huron. 130
Figure 70 : Schéma récapitulatif d’après Lina-Granade et Truy (2005). 134
Figure 71 : Arbre décisionnel pour la classification des surdités, issu de Mondain et collaborateurs (2005) 135
Figure 72 : la courbe audiométrique de l’oreille humaine, 137
Figure 73 : Fonctionnement d’une prothèse auditive conventionnelle, 140
Figure 74 : Courbe des sujets implantés en France depuis 1996 proposé par le CISIC 141
Figure 75 : Représentation schématique des différentes composantes d’un implant cochléaire, 142
Figure 76 : Implant cochléaire Nucleus CI-22 inséré dans la rampe tympanique, 143
Figure 77 : Les 8 configurations des doigts telles que les voit l’enfant pour coder les consonnes, 148
Figure 78 : Les 5 positions de la main pour coder les voyelles avec la LPC 148

Figure 79 : Le signe « Bonjour » extrait du Dictionnaire 1200 signes français-LSF de Monica Companys. 149
Figure 80 : Alphabet dactylologique de la Langue des Signes Française. 150
Figure 81 : Extrait du signe « Encore ». 151
Figure 82 : Gestes associés aux sons. 172
Figure 83 : Extrait de Bien Lire et Aimer Lire, 173
Figure 84 : Extrait de Bien lire et aimer Lire, p. 23 173
Figure 85: Extrait de la notice de la partition Partiels de Grisey, Ricordi, Milano 1976, 178
Figure 86: Diagramme matériau/temps réalisé par Jean-Marc Chouvel sur Partiels de Gérard Grisey, 180
Figure 87: Cycle respiratoire dans Partiels. 182
Figure 88: Extrait de Partiels de Grisey, début de la Section II au numéro 12. 183
Figure 89: Tissu sonore obtenu par cet agencement ingénieux des soufflets. 184
Figure 90: Extrait de Partiels de Grisey, Section II, ch. 18. 185
Figure 91: Extrait de Partiels de Grisey, au début du Repos II, chiffre 22. 186
Figure 92: de haut en bas : forme d’onde, sonagramme et roulement spectral, coefficient d’énergie dans les bandes critiques du chiffre 12 à 22, de la Section II au Repos II , 188
Figure 93 : Coefficient d’énergie dans les bandes critiques. 188
Figure 94 : de haut en bas : forme d’onde, sonagramme et roulement spectral, coefficient d’énergie dans les bandes critiques au chiffre 22, Repos II, 189
Figure 95 : Disposition des instruments, partition éditée chez Breitkopf & Härtel. 190
Figure 96 : Extrait du début de la partition de Mouvement (- vor der Erstarrung) de Lachenmann, Breitkopf & Härtel. 192
Figure 97 : Mouvement (- vor der Erstarrung) de Lachenmann, de la mesure 1 à 27, 193
Figure 98 : Günther Lebbing et Tom Pauwels in Mouvements für Lachenmann de Xavier LeRoy, Tanzquartier Wien, 2005. Photo by Monika Rittershaus. 195
Figure 99 : Futami ga Ura, 196
Figure 100 : Dessin d’esquisse de son œuvre 197
Figure 101 : Plan de textures préparatoire à son œuvre 198
Figure 102 : extrait de la partition Symphony [Myths] de Roger Reynolds, éditions Peters. 199
Figure 103 : Symphony [Myths], de la mesure 1 à 51. 201
Figure 104 : Maurits Cornelis Escher, Mouvement perpétuel ou Cascade,1961, 203
Figure 105 : M.C. Escher, Métamorphoses II, xylographie en noir, vert et brun, en vingt blocs, sur trois feuilles combinées 19,2 x 389,5 cm, novembre 1939-mars 1940. 204

Figure 106 : extrait de la partition de Ligeti, Concerto de Chambre, Movimento preciso e meccanico, 206
Figure 107 : Paul Klee, Chemin principal et chemins secondaires (Hauptwege-und Nebenwege) 1929, 207
Figure 108 : De la lettre C à E, schéma de la formation progressive du cluster, proposé par la musicologue Marie Delcambre-Monpoël. Les chiffres indiqués correspondent aux mesures. 208
Figure 109 : Kammerkonzert de Ligeti, première partie : du début à la lettre C 210
Figure 110 : Kammerkonzert de Ligeti, deuxième partie : de la lettre C à la mesure 40 inclus.
. 211
Figure 111 : Kammerkonzert de Ligeti, troisième partie : de la mesure 41 à la fin du troisième mouvement. 213
Figure 112 : Capture d’écran d’une passation finalisée avec un enfant avec l’explication donnée oralement accompagnée ou pas de LPC (Langage Parlé Complété) ou proposée en Langue des Signes Française (L.S.F.). 219
Figure 113 : Exemples de classements réalisés par deux enfants sourds implantés du groupe expérimental. 220
Figure 114 : Exemples de classements réalisés par deux enfants normo-entendants du groupe contrôle. 221
Figure 115 : MDS des enfants sourds implantés (cooccurrence) 222
Figure 116 : MDS des enfants sourds implantés (à partir d’un algorithme de calcul des distances entre chaque pastille). 224
Figure 117 : MDS des enfants normo-entendants (cooccurrence). 225
Figure 118 : MDS des adultes normo-entendants musiciens (à partir d’un algorithme de calcul des distances entre chaque pastille). 227
Figure 119 : MDS des adultes normo-entendants non-musiciens (à partir d’un algorithme de calcul des distances entre chaque pastille). 227
Figure 120 : Capture d’écran d’une passation finalisée avec un enfant avec l’explication donnée oralement accompagnée ou pas de LPC (Langage Parlé Complété) ou proposée en Langue des Signes Française (L.S.F.). 235
Figure 121 : MDS des enfants IC (à partir d’un algorithme de calcul des distances entre chaque pastille). 236
Figure 122 : MDS des enfants normo-entendants : l’axe 1 correspond ici à la valence et l’axe 2 à l’énergie 239
Figure 123 : Liste de certains descripteurs audio. 243
Figure 124 : Analyse réalisée par les descripteurs audio choisis. 244
Figure 125 : Analyse factorielle discriminante avec le premier F1 (axe horizontale) F2 (axe vertical). 245

Figure 126 : Analyse réalisée par les descripteurs audio de l’expérimentation n°2 (Texture/Émotion). 247
Figure 127 : Analyse réalisée par les descripteurs audio choisis. 248
Figure 128 : Analyse factorielle discriminante de l’expérimentation n°2. 249
Figure 129 : Instrumentarium Orff. 259
Figure 130 : Manuscrit avec notation messine, Laon, Xème siècle 261
Figure 131: Dans la méthode Kodály, la phonomimie est régulièrement utilisée pour faciliter l’intonation. 263
Figure 132: Les Ondes Martenot. 270
Figure 133 : Photo de Valérie Aeschimann, Institut Jacques-Dalcroze, Genève 274
Figure 134 : « Rythmiciennes en plein air », photo de Frédéric Boissonnas, 1909-1910. 276
Figure 135 : Illustrations de la phase d’éveil corporel. 280
Figure 136: « Jeu de Kim ». 281
Figure 137 : Travail autour de la mesure à 4 temps avec des bâtons colorés 283
Figure 138 : Travail de la conscience rythmique à l’aide de balles. 284
Figure 139 : Utilisation du ruban 286
Figure 140 : Composition, 2015 de Philippe Séro-Guillaume, 288
Figure 141 : Premier jet de notre travail 289
Figure 142 : Partition collective de l’Ile Bleu Azur 290
Figure 143 : Concert des enfants devant Philippe Sero-Guillaume au Ceop. 290
Figure 144 : Salle d’interaction Musique-Geste LEAD 294
Figure 145 : Schéma général de l’interface musicale. 295
Figure 146 : Expérimentation des enfants sourds implantés au LEAD. 295
Figure 147 : Visualisation du mouvement d’un enfant sourd implanté. 298

Liste des tableaux

Tableau 1 : Classification audiométrique des déficiences auditives du Bureau International d’Audio- Phonologie, p.136
Tableau 2 : Abréviations : P (pulsé), A (aéré), D (dense), L (lisse) et le nom de fichier, p.218
Tableau 3 : Liste des œuvres, p.234
Tableau 4 : Classification des descripteurs audio, p.244

Annexes

J’invite les membres du jury à se connecter au lien Dropbox ci-dessous, s’ils souhaitent consulter les extraits de partitions de Partiels de Grisey, de Mouvement (- vor der Erstarrung) de Lachenmann, du 3ème mouvement du Concerto de chambre de Ligeti ainsi que du début de la Symphonie Myths de Reynolds (où il manque la page 4 et 5), en lien avec nos analyses texturales (chapitre 5).

L’ensemble des extraits correspondants à nos deux expérimentations sont également disponibles sur cette même Dropbox :

1_Représentation_cognitive_des_textures : 24 extraits

2_ Représentation_emotionnelle_des_textures : 24 extraits.

https://www.dropbox.com/sh/l7ipwj36fncmido/AAAkS8g1e3PJNjwkngpcfIBUa?dl=0

Bibliographie

A :

ADAM Jean Michel, « Une alternative au « tout narratif » : les gradients de narrativité », Recherche en Communication, Vol. 7, 1997, p. 11-36.

AFSIN Kémâl, « Psychopédagogie de l’écoute musicale », Orphée Apprenti, Atelier du GRIAM, Octobre 2010, p. 42-59.

AFSIN Kémâl, Psychopédagogie de l’écoute musicale, Bruxelles, De Boeck Université, 2009. AGAWU Kofi, Playing with Signs: A Semiotic Interpretation of Classic Music, Princeton, Princeton University Press. 1991.

AGOSTI-GHERBAN Cristina, L’éveil musical, une pédagogie évolutive, Paris, L’Harmattan, 2000. ALBÈRA Philippe, À propos de « Die glückliche Hand », in Schoenberg-Kandinsky. Correspondance, écrits : Revue Contrechamps n° 2, Genève, Éditions Contrechamps, 1984, p. 156-166.

ALBERTINI John A., « Deafness and Hearing Loss », The Corsini Encyclopedia of Psychology, Ed. I. B. Weiner and W. E. Craighead. 4th ed, Vol. 2, Hoboken: John Wiley & Sons, 2010, p. 461-62.

ALIS Valérie et JUBIEN Nicole, « Quelques particularités de l’accès au langage chez l’enfant sourd, » in Implant cochléaire pédiatrique et rééducation orthophoniste, Médecine-Sciences, Flammarion, Paris, 2009, p. 14.

ANDEM, L’implant cochléaire chez l’enfant sourd pré-lingual, Paris, ANDEM-Service des Études, 1994.

ANDERSON M. William. & LAWRENCE E. Joy, Integrating music into the elementary classroom, (7e éd.), Belmont, Thomson Higher Education, 2007.

ANSHEL Anat & KIPPER David A., « The influence of group singing on trust and cooperation »,

Journal of Music Therapy, Vol. 25, n° 3, 1988, p. 145-155.

ANZIEU Didier, Le Moi-peau, Paris, Dunod, 1985.

AROM Simha, « Les musiques traditionnelles d’Afrique centrale », Contrechamps, janvier 1988, n°10, p. 177-195.

ASHTON Dore, About Mark Rothko, Oxford University Press, 1983 (réed. 1996 et 2003).

ATTIA Dhouha, « Segmentation d’images par combinaison adaptative couleur-texture et classification de pixels : Applications à la caractérisation de l’environnement de réception de signaux GNSS », Thèse de Doctorat, Université de Technologie de Belfort-Montbeliard, 2013.

AUGOYARD Jean-François et TORGUE Henry, A l’écoute de l’environnement : répertoire des effets sonores, Marseille, Editions Parenthèses, 1995.

B :

BACHELARD Gaston, La Dialectique de la durée (1950), Paris, PUF, 1980.

BACHMANN Marie-Laure, La Rythmique Jaques-Dalcroze, une éducation par la musique et pour la musique, À la Baconnière, Neuchâtel, 1984.

BADDELEY Alan, « Working Memory », Science, Vol. 255, n°5044, 1992, p. 556-559. BAGOT Jean Didier, Information, sensation et perception, Paris, Armand Colin. 1999.

BAILLET Jérome, « Partiels de Gérard Grisey », in L’éducation musicale, supplément aux n° 473/474, septembre-octobre 2000, p. 47-56.

BALAS Daniel et PHILIP Patrick, Cours d’Histologie générale [en ligne], Université de Nice Sophia-Antipolis, http://www.db-gersite.com/HISTOLOGIE/HISTGENE/index.html

BARKÓCZI Llona & PLÉH Csaba, Etude de l’effet psychologique de la méthode d’éducation musicale de Kodály, Kecskemét, Institut de pédagogie musicale Zoltán Kodály, 1982.

BARTHEL-CALVET Anne-Sylvie « De la dispersion à la fusion sonore : écriture et perception des textures xenakiennes », Analyse Musicale, Vol. 38, Paris, 2001, p. 86-96.

BAUDIN Thierry, CHATEIGNER Daniel, ESLING Claude, LUTTEROTTI Luca et MORALES Magali, « Analyse des textures cristallographiques et des microstructures », Reflets de la physique, La Cristallographie, Sciences et Techniques, n° 44-45, 2015, p. 80-85.

BEDOUIN Nathalie, BESOMBES Anne-Marie, ESCANDE Eliette, DUMONT Annie & TILLMANN Barbara, « Déficits morphosyntaxiques chez des enfants sourds implantés : hypothèses et pistes de remédiation par le rythme musical », Rééducation orthophonique, n°268, 2016, p. 261-288.

BEDOUIN Nathalie, BESOMBES Anne-Marie, ESCANDE Eliette, DUMONT Annie, LALITTE Philippe & TILLMANN Barbara, « Boosting syntax training with temporally regular musical primes in children with cochlear implants », Annals of Physical and Rehabilitation Medicine, Vol. 61, n°6, 2018, p. 365-371.

BENWARD Bruce & SAKER Marilyn, Music: In Theory and Practice, Vol. I. Seventh Edition, McGraw-Hill, New York, 2003.

BERNARDES Gilberto, « David Huron, Voice Leading: The Science Behind a Musical Art », Portuguese Journal of Musicology, Vol. 4, n°1, 2017, p. 219-226.

BERRY Wallace, Structural Functions in Music (1976), 2de édition, Dover, Mineola, 1987.

BERTONCINI Josiane et DE BOYSSON-BARDIES Bénédicte. « Chapitre 4. La perception et la production de la parole avant deux ans », Michèle Kail éd., L’acquisition du langage. Vol. I. Le language en émergence. De la naissance à trois ans, Presses Universitaires de France, 2000, p. 95-136.

BEYAERT Anne, « De la texture à la matière », Protée, Vol. 36, n°2, 2008, p. 101-110. BEYAERT Anne, « Texture, couleur, lumière et autres arrangements de la perception », Protée, Vol .3, n°3, 2003, p. 81–90.

BEYAERT Anne, « Modernité et synesthésies », dans VISIBLE, n°1, La diversité sensible, PULIM, 2006, p. 25-36.

BEYRAND Chloé, « Comment sont véhiculées les émotions dans la texture de la musique contemporaine ? », Mémoire de Master 1 sous la direction de Philippe Lalitte, 2016.

BHARUCHA Jamshed, « Music cognition and perceptual facilitation: A connectionist framework », Music Perception, n°5, 1987, p. 1-30.

BIGAND Emmanuel, « The influence of implicit harmony, rhythm and musical training on the abstraction of tension-relaxation schemas in tonal music phrases », Contempory Music Review, Vol. 9, 1993, p. 123-137.

BIGAND Emmanuel, « Traveling through Lerdahl’s Tonal Pitch Space Theory: A psychological perspective », Musicae Scientae, Vol. 7, n°1, 2003, p. 121-155.

BIGAND Emmanuel, « Contribution de la musique aux recherches sur la cognition auditive humaine », in S. McAdams et E. Bigand (éd.), Penser les sons : La psychologie auditive de l’audition, Paris, PUF, 1994.

BIGAND Emmanuel, « L’émotion dans le langage musical », in Parole et Musique : Aux origines du dialogue humain, sous la direction de Stanislas Dehaene et Christine Petit, Odile Jacob, 2009, p. 343-357.

BIGAND Emmanuel, FILIPIC Suzanne & LALITTE Philippe, « The time course of emotional responses to music », Annals of the New York Academy of Sciences, 1060, 2005, p. 429-437.

BIGAND Emmanuel, Les bienfaits de la musique sur le cerveau, Paris, Belin, coll. « Cerveau et bien-être », 2018.

BIGAND Emmanuel, « Musiciens et non-musiciens perçoivent-ils la musique différemment ? » in Le Cerveau Musicien, Paris, De Boeck University, 2006.

BIGAND Emmanuel, PARNCUTT Richard, LERDHAL Fred, « Perception of musical tension in short chord sequences: the influence of harmonic function, sensory dissonance, horizontal motion, and musical training », Perception and Psychophysics, Vol. 58, n°1, 1996, p. 125-141.

BIGAND Emmanuel, TILLMANN Barbara, PERETZ Isabelle, ZATORRE Robert J., LOPEZ Luisa & MAJNO Maria, « The Neurosciences and Music – V, Cognitive stimulation and Rehabilitation », Annals of the New York Academy of Sciences, Vol. 1337, New York, 2015.

BIGAND Emmanuel, VIEILLARD Sandrine, MADURELL François, MAROZEAU Jeremy, DACQUET Alice, « Multidimensional scaling of emotional responses to music: the effects of musical expertise and of the duration of the excerpts », Cognition and Emotion, Vol. 19, n°8, 2005, p. 1113-1139.

BIOTEAU Alain, « Spatialisation et écriture de l’espace, des pionniers à Emmanuel Nunes », dans Nicolas Donin et Laurent Feneyrou (dir.), Théories de la composition musicale au XXe siècle, Lyon, Symétrie, 2013, vol. 2, p. 1337-1366.

BISSELL Arthur Dart, The Role of Expectation in Music: A Study In The Psychology Of Music, New Haven, 1921.

BIZAGUET Éric, « L’appareillage de l’enfant sourd », Revues générales : Audition, Réalités pédiatriques, n°175, Décembre 2012, p. 17-22.

BLAMEY Peter J., SARANT Julia Z., PAATSCH Louise E., BARRY Johanna G., BOW Catherine P., WALES Roger J., et al., « Relationships Among Speech Perception, Production, Language, Hearing Loss, and Age in Children with Impaired Hearing », Journal of Speech Language Hear Research, Vol. 44, n°2, 2001, p. 264-285.

BLOOD Anne J. & ZATORRE Robert J., « Intensely pleasurable responses to music correlate with activity in brain regions implicated in reward and emotion », Proceedings of the National Academy of Sciences of the United States of America, Vol. 98, n°20, 2001, p. 11818-11823.

BOBÉE Emmanuelle, « La partition sonore et musicale de « Dunkerque » (C. Nolan, 2017). « Une expérience sensorielle inédite », Revue musicale OICRM, Vol. 5, n°2, 2018, p. 125–148.

BONNET Claude, « La perception visuelle des formes », in C. Bonnet, R. Ghiglione, J.F. Richard (éd), Traité de psychologie cognitive Vol.1, Paris, Dunod, p. 1-82, 1989.

BOREL-MAISONNY Suzanne, Langage oral et écrit. Tome 1 : Pédagogie des notions de base. Étude expérimentale et applications pratiques. Tome 2 : Épreuves sensorielles et tests de langage. Appréciation de l’état du langage, Neuchâtel, Paris, Delachaux & Niestlé, 1960.

BORT Françoise, DUPONT Valérie, Texte, texture, textile, Variations sur le tissage dans la musique, les arts plastiques et la littérature, Éditions universitaires de Dijon, 2013.

BOSSEUR Jean-Yves, « Texture et matériau dans la pensée musicale contemporaine », Analyse Musicale n°38, Paris, février 2001, p. 129-139.

BOUHIER-CHARLES Nathanaëlle, Signe avec moi : la langue gestuelle des sourds à la portée de tous les bébés, Editions Monica Companys, 2006.

BOULEZ Pierre, « Le Temps Musical », 1978-02-17-1978-02-23, Conférence du 17/02/1978 autour du Kammerkonzert de Ligeti, Centre Georges Pompidou, Paris. https://medias.ircam.fr/embed/media/xfdefef_kammerkonzert-gyorgy-ligeti

BOULEZ Pierre, Le pays fertile : Paul Klee, texte préparé et présenté par Paule Thévenin, Paris, Gallimard, 1989.

BOULEZ Pierre, Penser la musique aujourd’hui, Paris, Denoël Gonthier, 1963. BOULEZ Pierre, Point de repère III. Leçon de musique, Paris, Christian Bourgois. 1995. BOULEZ Pierre, Point de repère, I, Imaginer, Paris, Christian Bourgeois, 1995.

BRACKETT David, Interpreting Popular Music, Berkeley, University of California Press, 2000.

BREGMAN Albert S. et MCADAMS Stephen, « Hearing Musical Streams », Computer Music Journal, Vol. 3, n° 4, 1979, p. 26-43.

BREGMAN Albert S. et PINKER Steven, « Auditory Streaming and the Building of Timbre », Canadian Journal of Psychology, Vol. 32, 1978, p. 19-31.

BREGMAN Alfred S. & CAMPBELL Jeffrey, « Primary auditory stream segregation and perception of order in rapid sequences of tones », Journal of Experimental Psychology, Vol. 89, n°2, 1971, p. 244-249.

BREGMAN Alfred S., « L’analyse des scènes auditives : l’audition dans des environnements complexes », in McADAMS Stephen et BIGAND Emmanuel, éd., Penser les sons, psychologie cognitive de l’audition, Paris, Presses universitaires de France, 1994, p. 11-39.

BREGMAN Alfred S., Auditory scene analysis: The perceptual organization of sound, MIT Press/Bradford Books, Cambridge, Mass, 1990.

BRESLIN James E. B, Mark Rothko: a biography, Chicago, University of Chicago Press, 1993.

BRICE Marie, Pédagogie de tous les possibles… La Rythmique Jacques-Dalcroze, Genève, Editions Papillon, 2012.

BRIEC Julie, LE MANER-IDRISSI Gaïd, DARDIER Virginie, ROUXEL Géraldine, TAN-BESCOND Géraldine & GODEY Benoit, « Échanges conversationnels avec un partenaire familier : étude comparative entre enfants sourds, implantés cohléaires depuis 2 ans et enfants entendants. », L’Année psychologique, Vol. 112, n°1, 2012, p. 17-48.

BRODATZ Phil, Texture: a photographic album for artists and designers, New York, Dover Publications, 1966.

BRUNER Jérome S., Le développement de l’enfant, savoir faire, savoir dire (Trad. M. Deleau), Paris, P.U.F., 1983.

BUREL Gilles, « Réseaux de neurones en traitement-Des Modèles théoriques aux Applications Industrielles », Thèse d’état, Université de Bretagne occidentale, 1991.

BURGGRAEVE Adolphe, Anatomie de texture ou Histologie, appliquée à la physiologie et à la pathologie, Gand, Annoot-Braekman, 1845.

C :

CAMBOUROPOULOS Emilios et TSOUGRAS Costas, « Auditory Streams in Ligeti’s Continuum: A Theoretical and Perceptual Approach », Journal of Interdisciplinary Music Studies, Vol. 3, n° 1-2, printemps-automne 2009, p. 119-137.

CANNAM Chris, LANDONE Christian and SANDLER Mark, « Sonic Visualiser: An Open Source Application for Viewing, Analysing, and Annotating Music Audio Files », in Proceedings of the ACM Multimedia 2010 International Conference, 2010.

CARRÉ Alain, Musique et surdité, Ed. Fuzeau, 2008.

CASTELLENGO Michèle, LORTAT-JACOB Bernard, LEOTHAUD Gilles, « Un paradoxe de perception de la hauteur : la « quintina » des chanteurs sardes », ISMA (International Symposium on Musical Acoustics), Perugia (Italie), 2001.

CELESTE Bernadette DELALANDE François, DUMAURIER Elisabeth, L’enfant, du sonore au musical, Paris, Buchet/Chastel-INA, coll. Bibliothèque de Recherche Musicale, 1982.

CHAPMAN Robin S., « Children’s Language Learning: An Interactionist Perspective », Journal of Child Psychology and Psychiatry and allied disciplines, Vol. 41, n°1, 2000, p. 33-54.

CHAPUIS Jacques, « De l’Initiation musicale au Solfège vivant », Panorama Pédagogique de l’Education Musicale Willems, 1, p. 1-8, 1980.

CHEMILLIER Marc, « György Ligeti et la logique des textures », Analyse musicale n°38, 2001, p. 75-85.

CHERRY Edward Colin & TAYLOR, W. K., « Some experiments on the recognition of speech, with one and two ears », Journal of the Acoustic Society of America, Vol. 26, 1953, p. 554-559.

CHEVAIS Maurice, Education musicale de l’enfance (Vol. 1), Paris, Leduc, 1937. CHEVAIS Maurice, L’art d’enseigner (Vol. 2), Paris, Leduc, 1943.

CHOUVEL Jean-Marc, « Extrême présence du phénomène : parcours de la forme dans l’oeuvre de Gérard Grisey », in Le temps de l’écoute. Gérard Grisey ou la beauté des ombres sonores, textes réunis par Danielle Cohen Levinas, L’Harmattan/L’Itinéraire, Paris, 2004 p. 71-86.

CHOUVEL Jean-Marc, Analyse musicale, Sémiologie et cognition des formes temporelles, Paris, CNRS / L’harmattan, 2006.

CHOWNING John, « The simulation of moving sound sources », Journal of the Audio Engineering Society, Vol. 19, n. 1, 1971, p. 2-6, republié dans Computer Music Journal, Vol. 1, n°3, 1977, p. 48-52.

CHOWNING John, La Spatialisation des musiques électroacoustiques, Publications de l’université de Saint-Etienne, Saint-Etienne, 2012.

Chris CANNAM, Christian LANDONE, and Mark SANDLER, « Sonic Visualiser: An Open Source Application for Viewing, Analysing, and Annotating Music Audio Files », in Proceedings of the ACM Multimedia 2010 International Conference, 2010.

CIRELLI Laura K., EINARSON Kate & TRAINOR Laurel J., « Interpersonal synchrony increases prosocial behavior in infants », Developmental Science, Vol. 17, n°6, 2014, p. 1003-1011.

CIVILLE Gael Vance & DUS Clar A., « Evaluating tactile properties of skincare products: a descriptive analysis technique », Cosmetics and Toiletries 106, 1991, p. 83-88.

CLARK Graeme, « Cochlear implants in children: safety as well as speech and language », Int J Pediatr Otorhinolaryngol, Vol. 67, Suppl 1, p. 7-20, 2003.

CLARKE Eric F. et KRUMHANSL Carol L., « Perceiving Musical rime », Music Perception, Vol. 7, 1990, p. 213-253.

CLARKE Erick, Ways of Listening: An ecological approach to the perception of musical meaning, Oxford, NY, Oxford University Press, 2005.

COENE Martine & SCHAUWERS Karen & GILLIS Steven & ROORYCK Johan & GOVAERTS Paul. « Genetic predisposition and sensory experience in language development: Evidence from cochlear-implanted children », Language and cognitive Processes, Psychology Press, Vol. 26, n°8, 2011, p. 1083-1101.

COMEAU Gilles, Comparaison de trois approches d’éducation musicale, Jaques-Dalcroze, Orff ou Kodály ?, Vanier, CFORP, 1995.

CONNOR Carol M., CRAIG Holly K., RAUDENBUSH Stephen W., HEAVNER Krista & ZWOLAN Teresa A., « The Age at Which Young Deaf Children Receive Cochlear Implants and Their Vocabulary and Speech-Production Growth: Is There an Added Value for Early Implantation? », Ear Hearing, Vol. 27, n°6, 2006, p. 628-644.

CONWAY Christopher M. & CHRISTIANSEN Morten H., « Seeing and Hearing in Space and Time : Effects of modality and presentation rate on implicit statistical learning », European Journal of Cognitive Psychology, Vol. 21, n°4, 2009, p. 561-580.

CORBEIL Mariève, TREHUB Sandra E. et PERETZ Isabelle, « Singing delays the onset of infant distress », Infancy, Vol. 21, p. 373-391.

CORNETT Orin R., « Cued Speech », American Annals of the Deaf, Vol.112, p. 3-13, 1967.

D :

DAMASIO Antonio R., L’Erreur de Descartes. La raison des émotions, Paris, Odile Jacob, 1995. DAMBRICOURT Jean-Pierre, « György Ligeti et le Kammerkonzert pour treize instruments », Éducation musicale n° 462-463, Septembre-Octobre 1999, p. 40-52.

D’ANGIOLINI Giuliano, Jesu, un chant de confrérie en Sardaigne, Éditions Delatour France, Sampzon, 2009.

DANIEL Christine et ROUDOT Alain-Claude, « La terminologie de la texture des aliments », Érudit, Méta, Vol. 52, n°2, juin 2007, p. 342-351.

DARROW Alice-Ann, « Music for the Deaf », Music Educators Journal, Vol. 71, 1985, p. 33-35. DARWIN Charles, The Expression of the Emotions in Man and Animals, London, John Murray, 1872.

DAUMAN René, CARBONNIERE Bernadette, SORIANO Véronique, BERGER-LAUTISSIER

Sylvie, BOUYÉ Jany, DEBRUGE Éric, CORIAT Géraldine et BÉBÉAR Jean-Pierre, « Implants cochléaires chez l’adulte et l’enfant », Encycl Méd Chir (Elsevier, Paris), Oto-rhino-laryngologie, 20-185- D-10, 1998, p. 7.

DE BOYSSON-BARDIES Bénédicte, Comment la parole vient aux enfants, Paris, Odile Jacob poche, 2005.

DEBUSSY Claude, Monsieur Croche et autres écrits, Paris, Gallimard, 1971.

DEHAENE Stanislas et PETIT Christine, Parole et musique : Aux origines du dialogue humain, Paris, Odile Jacob, 2009.

DEHAENE Stanislas, Apprendre ! Le talent du cerveau, le défi des machines, Paris, Odile Jacob, 2018.

DELALANDE François, La musique est un jeu d’enfant, Paris, Buchet/Chastel, coll. Bibliothèque de Recherche musicale, 1984.

DELAPLACE Joseph, György Ligeti. Un essai d’analyse et d’esthétique musicales, Rennes, Presses universitaires de Rennes, 2007.

DELAPLACE Joseph, « Rothko Chapel de Morton Feldman : approches analytiques d’une « procession immobile » », Déméter, Centre d’étude des arts contemporains, Université Lille 3, 2015. http://demeter.revue.univ-lille3.fr/lodel9/index.php?id=430

DELAROCHE Monique, Au fil des regards et des caresses…, Ortho-éditions, 2012.

DELCAMBRE-MONPOËL Marie, « György Ligeti, Kammerkonzert », Musurgia, Vol. VI, n° 3-4, 1999. p. 57-79.

DELEAU Michel & LE MANER-IDRISSI Gaid, « Le développement des habiletés pragmatiques chez les enfants sourds », in L’acquisition du Langage Chez l’Enfant Sourd, Marseille, Solal, 2005.

DELIEGE Célestin, Cinquante ans de modernité musicale : De Darmstadt àl’IRCAM, contribution historiographique à une musicologie critique, Bruxelles, Editions Mardaga, 2003.

DELIEGE Célestin, Invention musicale et idéologie 2, Mutations historiques et lectures critiques de la modernité, Bruxelles, Editions Mardaga, 2007.

DELIEGE Irène et SLOBODA John, Naissance et développement du sens musical, Paris, PUF, 1995.

DELIEGE Irène, « Grouping conditions in listening to music: An approach to Lerdahl & Jackendoff’s grouping preference rules », Music Perception, n° 4, 1987, p. 325-359.

DEMANGE Michel, Les Textures des roches cristallines, Aspects microscopiques, Presse des Mines, coll. Sciences de la Terre et de l’environnement, 2011.

DERRIDA Jacques, La dissémination, Paris, Seuil, 1972. DERRIDA Jacques, Marges de la philosophie, Paris, Minuit, 1972.

DESAUNAY Melodie, FLEURIOT Pierre, DEBRUILLE Louis, GARNIER Stéphane, GARABEDIAN Erea Noël, LOUNDON Nathalie, MARLIN Sandrine, DENOYELLE Françoise, TRAN BA HUY Patrice, De WAELE Catherine, GILBERT Gaëtan & LORENZI Christian, « Rôle des informations d’enveloppe temporelle et de structure temporelle fine dans l’intelligibilité de la parole chez les sujets entendants et malentendants », Les Cahiers de l’Audition, Vol. 20, n°3, 2007, p. 46-50.

DESROCHES Monique, STÉVANCE Sophie et LACASSE Serge, Quand La Musique Prend Corps, Presses De L’Université De Montréal, 2014.

DÉSY PROULX Monique, Pourquoi la musique ? Son importance dans la vie des enfants, Montréal, Éditions du CHU Sainte-Justine, 2014.

DEUTSCH Diana, « An auditory illusion », Nature, n° 251, 1974, p. 307-309.

DEUTSCH Diana, « Grouping mechanisms in music », In D. Deutsch (Ed.). The Psychology of Music, 1982, p. 99-134, New York: Academic Press. « The processing of pitch combinations », In D. Deutsch (Ed.). The Psychology of Music, p. 271-316.

DEUTSCH Diana, « The Paradox of Pitch Circularity », Acoustics Today, Vol. 6, n° 3, Juillet 2010, p. 8-14.

DEUTSCH Diana, Psychologie de la musique, Paris, PUF, 1994.

DEUTSCH Diana, « La perception des structures musicales », In Psychologie de la musique, sous la direction d’Arlette Zenatti, Paris, Presses Universitaires de France, 1994, p. 115-144. Dictionnaire 1200 signes français-LSF, Editions Monica Companys, 2000.

DIVENYI Pierre L. and OLIVER Susan K., « Resolution of Steady State Sounds in Simulated Auditory Space », The Journal of the Acoustical Society of America, Vol. 85, n°5, 1989, p. 2042-52.

Dossier « Génétique et Surdité », Collège National d’Audioprothèse, Vol. 26, n°1, 2013, p. 6-20. Dossier de presse « Sheila Hicks au festival d’Automne », propos recueillis par Clément Dirié, juin 2016.

DOUGLAS Chelsea, NOBLE Jason et MCADAMS Stephen, « Auditory Scene Analysis and the Perception of Sound Mass in Ligeti’s Continuum », Music Perception, Vol. 33, n° 3, 2015, p. 287-305.

DOWLING JAY Walter, « La structuration mélodique : perception et chant » (P.-E. Dauzat, trad.), in

A. Zenatti (Ed.), Psychologie de la musique, Paris, PUF, 1994, p. 145-176.

DUBUFFET Jean, L’Homme du commun à l’ouvrage, Paris, Gallimard, 1973.

DUBUISSON Pauline, « Influence de la phase grasse et des polymères naturels sur les paramètres physico-chimiques en lien avec la perception tactile de l’émulsion », Thèse de doctorat, Université du Havre, 2017.

DUMONT Annie, Implantations cochléaires : guide pratique d’évaluation et de rééducation, Isbergues, Ortho Edition, 1997.

DUNCAN Ryan P., EARHART Gammon M., « Are the effects of community-based dance on Parkinson disease severity, balance, and functional mobility reduced with time? A 2-year prospective pilot study », Journal of alternative and complementary medicine, Vol. 20, n°10, p. 757-763.

DUNSBY Jonathan, « Considerations of Textures », Oxford University Press, Music & Letters, Vol. 70, N° 1, 1989, p. 46-57.

DUTILLEUX Henri, Constellations : entretiens / Henri Dutilleux, Martine Cadieux, avant-propos de Jean Roy, Paris, M. de Maule, 2007.

DUTILLEUX Henri, Le Nouvel Observateur, rubrique « Le Musée égoïste », octobre 1984, reproduit dans la note de programme du concert de l’Orchestre de Paris, 1er et 2 juillet 1995, Cité de la Musique.

DUTOIT-CARLIER Claire-Lise, Emile Jaques-Dalcroze, créateur de la rythmique, A la Baconnière, Neuchâtel, 1965.

DYSON George, « The Texture of Modern Music », Oxford University Press, Music & Letters, Vol. 4, n° 2, 1923, p. 107-118.

E :

EEROLA Tuomas, « The dynamics of musical expectancy: Cross-cultural and statistical approaches to melodic expectations », Jyväskylä studies in humanities, 2003.

EGGERMONT Jos J. & PONTON Curtis W., « Auditory-evoked Potentials Studies of Cortical Maturation in Normal Hearing and Implanted Children: Correlations in Changes in Structure and Speech Perception », Acta Otorhinolaryngology, Vol.123, n°2, 2003, p. 249-252.◻

EHRENFELS Chritian von, « Über Gestaltqualitäten ». Vierteljahresschrift für wissenschaftliche Philosophie, 14, 1890-1922, p. 249-292.

EILERS et OLLERS, « Infant vocalizations and the early diagnosis of severe hearing impairment », J. Pediatr., Vol. 124, n°2, 1994, p 199-203.

EIMERT Herbert, « Debussys Jeux », Die Reihe, n°5, 1959, p. 7-8.

EISENBERG Laurie, MARTINEZ Amy, HOLOWECKY Suzanne, POGORELSKY Stephanie, « Recognition of lexically controlled words and sentences by children with normal hearing and children with cochlear implants », Ear Hear, Vol. 23, n°5, p. 450-62.

EKMAN Paul, « Biological and Cultural Contribution to Body and Facial Movements in the Expression of the Emotions », p.73-101, in A.O. Rorty (dir.), Explaining Emotions, Los Angeles, University of California Press, 1980.

ERICKSON Robert, Sound Structure in Music, Berkeley, University of California Press, 1975. Expertise Collective, Déficits auditifs : Recherches émergentes et applications chez l’enfant, Inserm, 2006.

F :

FAGAN Mary K. & PISONI David B., « Hearing Experience and Receptive Vocabulary Development in Deaf Children With Cochlear Implants », Journal of Deaf Studies and Deaf Education, Vol. 15, n°2, 2010, p. 149-161.

FELDMAN Morton, Écrits et paroles, précédés d’une monographie de Jean-Yves Bosseur, Paris, L’Harmattan, 1998.

FENEYROU Laurent, « Debussy au miroir des écrits de Boulez », Delatour France, Goldman, Nicolas, Nattiez. La Pensée de Pierre Boulez à travers ses écrits, 2010, p. 161-176.

FERNANDEZ-MALOIGNE Christine, MACAIRE Ludovic, ROBERT-INACIO Frédérique, « Imagerie numérique, avancées et perspectives pour la couleur », in Couleur Numérique, Acquisition, Perception, Codage et rendu, Paris, Lavoisier, 2012, p. 227-234.

FERNANDO Nathalie, EGERMANN Hauke, CHUEN Lorraine, KIMBEMBÉ Bienvenu et MCADAMS Stephen, « Musique et émotion : Quand deux disciplines travaillent ensemble à mieux comprendre le comportement musical humain », Anthropologie et Sociétés, 2014, Vol. 38, n°1, p. 167–191.

FERON François-Xavier, « L’art du Trompe-l’oreille rythmique », Intermédialités : histoire et théorie des arts, des lettres et des techniques, n° 16, Rythmer/Rhythmize, 2010, p. 145- 165.

FERON François-Xavier, « Propositions pour une typologie des phénomènes sonores insolites », Hybrid. Revue des arts et médiations humaines, Labex Arts H2H/Presses Universitaires de Vincennes, 2015.

FIJALKOW Claire, « Du plaisir et de la méthode avant toute chose… » in C. Fijalkow (Ed.), Maurice Chevais (1880-1943) : un grand pédagogue de la musique, Paris, L’Harmattan, 2005, p. 69-92.

FINNEY Eva M., FINE Ione & DOBKINS Karen R., « Visual Stimuli activate auditory cortex in the deaf », Nature Neurosciences, Vol. 4, n°12, 2001, p. 1171-1173.

FINNEY John, « John Paynter, music education and the creativity of coincidence », British Journal of Music Education, Vol. 28, n°1, 2011, p. 11-26.

FONTANILLE Jacques, Sémiotique du visible. Des mondes de lumière, Paris, P.U.F., 1995. FRAISSE Paul, Psychologie du temps, Paris, Presses Universitaires de France, 1957.

FRANCÈS Robert, La Perception du Rythme, Paris, Vrin, 1958. Francis WOLFF, Pourquoi la musique ?, Paris, Fayard, 2015.

FRANGNE Pierre-Henry, LACOMBE Hervé, MASSIN Marianne, PICARD Timothée. « Musique et émotion : problèmes et enjeux », in Pierre-Henry Frangne, Hervé Lacombe, Marianne Massin et Timothée Picard, La valeur de l’émotion musicale, Presses universitaires de Rennes, p. 9-36, 2017.

FRAPAT Monique, L’invention musicale en maternelle, Centre régional de documentation pédagogique de Versailles, 1990.

G :

GADAMER Hans-Georg, Wahrheit und Methode (W.M), Tübingen, J.C.B. Mohr, 1960, 2. Auflage, 1965, trad. française partielle Vérité et Méthode, Paris, éd. Du Seuil, 1976.

GAGALOWICZ André, « Vers un modèle de textures », Thèse d’état, Université Pierre et Marie Curie, 1983.

GALLEGO Carlos, MARTIN-ARAGONESES Teresa, LOPEZ-HIGES Ramón & PISON Guzmán, « Semantic and syntactic reading comprehension strategies used by deaf children with early and late cochlear implantation. », Research in developmental disabilities, Vol. 49-50, 2016, p. 153-170.

GAPENNE Olivier et ROVIRA Katia, « Psychologie et cognition sans langage. Actualité d’une figure historique », Intellectica, 1999/1, n° 28, p. 229-250.

GARRIGUES Juliette, ATMOSPHÈRES (G. Ligeti), Encyclopædia Universalis [en ligne], consulté le 18 février 2018. URL : http://www.universalis.fr/encyclopedie/atmospheres/

GIACCO Grazia et LORANT Sonia, « Pour une didactique de la création artistique : Axes, projets, bilan (2014-2016) », Le Ragioni di Erasmus–Revue en ligne de l’Université de Roma 3, Roma TrE-Press, 2017, p. 153-168.

GIACCO Grazia, « Geste et voix, entre corps et souffle : pour une didactique de la création artistique », Revue Recherche en éducation musicale, n° 33, Juillet 2016, p. 63-89.

GILLEY Phillip M., SHARMA Anu & DORMAN Michael F., « Cortical reorganization in children with cochlear implants », Brain Research, Vol.1239, n°6, 2008, p. 56-65.

GIORDAN, André, Apprendre ! Paris, Belin, coll. Débats, 1998.

GOLD Claudia M., À l’écoute des émotions de l’enfant, Paris, Albin Michel, 2014. GONIN Philippe, Pink Floyd, Atom Heart Mother, Scérén/CNDP, Paris, 2011.

GOODCHILD Meghan et MCADAMS Stephen, « Perceptual Processes in Orchestration », in The Oxford Handbook of Timbre, Oxford University Press, 2018.

GORDON Edwin E., A music learning theory for newborn and young children, Chicago, G.I.A. Publications, 3e édition, 2003.

GORDON Edwin E., Learning sequences in music skill, content and patterns, Chicago, G.I.A. Publications, 1988.

GOSSELIN Pierre & LE COGUIEC Éric, La recherche création : Pour une compréhension de la recherche en pratique artistique, Québec, Presses de l’Université du Québec, 2006.

GOVAERTS Paul J., DAEMERS Kristin, SCHAUWERS Karen, De BEUKELAER Carina, YPERMAN Marjan, De CEULAER Geer., et al., « Implantation précoce et/ou bilatérale. » Rééducation orthophonique, n°217, 2004, p. 31-47.

GRAHAM Daniel J., MENG Ming, « Artistic representations: clues to efficient coding in human vision », Visual Neuroscience, Vol. 28, n°4, 2011, p. 371-379.

GREENBERG Clement, Modernist Painting, Washington, D.C., in Forum Lectures (Voice of America), 1960

GRIMAULT Nicolas, BACON Sid P., MICHEYL Christophe, « Auditory stream segregation on the basis of amplitude-modulation rate », Journal of the Acoustical Society of America, Vol. 111, 2002, p. 1340-1348.

GRISEY Gérard, « La musique, le devenir des sons », in Écrits ou l’invention de la musique spectrale, Paris, Editions MF, 2008.

GRISEY Gérard, « Structuration des timbres dans la musique instrumentale », in Jean-Baptiste Barrière (éd.), Le timbre métaphore pour la composition, Christian Bourgois Editeur/Ircam, Paris, 1991.

GROUPE μ, Traité du signe visuel. Pour une rhétorique de l’image, Paris, Le Seuil, 1992.

GUIDETTI Michel & TOURRETTE Catherine, Handicaps et développement psychologique de l’enfant, Paris, Armand Colin, 2002.

GUILLAUME Paul, La psychologie de la forme, Paris, Flammarion, 1937.

GUTHLEBEN Denis, « La cristallographie, de Platon à nos jours… ». CNRS Le Journal, n°256, février 2014, p. 66.

H :

HAGE Catherine, « Co-construire le langage : le défi des interactions précoces avec le très jeune enfant sourd », A.N.A.E. Approche Neuropsychologique des Apprentissages chez l’Enfant, Vol. 27, Tome 5, n°138, 2015, p. 427-434.

HAGE Catherine, CHARLIER Brigitte & LEYBAERT Jacqueline, Compétences cognitives, linguistiques et sociales de l’enfant sourd. Pistes d’évaluations, Bruxelles, Mardaga, 2006.

HANSLICK Eduard, Du beau dans la musique, Leipzig, 1854, trad. fr. Ch. Bannelier, Paris, Bourgois, 1986.

HARALICK Robert M., « Statistical and structural approaches to texture », Proceedings of the IEEE, Vol. 67, n°5, 1979, p. 787-804.

HARDELIN Jean-Pierre, DENOYELLE Françoise, LEVILLIERS Jacqueline, SIMMLER Marie-Christine & PETIT Christine, « Les surdités héréditaires : génétique moléculaire », Med Sci (Paris), Vol. 20, n°3, 2004, p. 311–316.

HARGREAVES David J. and GALTON Maurice J., « Aesthetic learning; psychological theory and educational practice », in B. Reimer and R.A. Smith (Eds.) National Society for the Study of Education Yearbook on the Arts in Education (Ed.), p. 124-50, 1992.

HARRIS Michael S., PISONI David B., KRONENBERGER William G., GAO Sujuan, CAFFREY Helena M., & MIYAMOTO Richard T., « Developmental trajectories of forward and backward digit spans in deaf children with cochlear implants », Cochlear implants international, Vol. 12 (Suppl. 1), 2011, p. 84-88.

HAYES Heather, GEERS Ann E., TREIMAN Rebecca & MOOG Jean S., « Receptive Vocabulary Development in Deaf Children with Cochlear Implants: Achievement in an Intensive Auditory-Oral Educational Setting », Ear Hearing, Vol. 30, n°1, 2009, p. 128-135.

HELMHOLTZ Hermann von (1877), On the sensations of tone (English translation A.J. Ellis, 1954), New York, Dover ; traduction française, Théorie physiologique de la musique, fondée sur l’étude des sensations auditives. Trad. par Georges GUEROULT et Auguste Desiré Bernard WOLFF, Paris, Masson et fils, 1868.

HERHOLZ Sibylle C. & ZATORRE Robert J., « Musical training as a framework for brain plasticity: behavior, function, and structure », Neuron, Vol. 76, 2012, p. 486-502.

HUMMEL Cora J. M. « The Value of Music in Teaching Deaf Students », Volta Review, Vol. 73, 1971, p. 224-249.

HUMPHREY Doris, Construire la danse [The Art of making dances, 1959], Paris, L’Harmattan, 1998, p. 126.

HURON David, « On the Role of Embellishment Tones in the Perceptual Segregation of Concurrent Musical Parts », Empirical Musicology Review, Vol. 2, n°4, 2007, p. 123-39.

HURON David, « Perceptual and cognitive applications in music information retrieval », In International Symposium on Music Information Retrieval, 2000.

HURON David, « The ramp archetype and the maintenance of auditory attention », Music Perception, Vol. 10, n°1, 1992, p. 83-92.

HURON David, «Voice Denumerability in Polyphonic Music of Homogeneous Timbres », Music Perception, Vol. 6, n° 4, 1989, p. 361-382.

HURON David, HELLMUTH MARGULIS Elizabeth, « Musical Expectancy and Thrills », in P.N. Juslin et J.A. Sloboda (éd.), Handbook of Music and Emotion: Theory, Research, Applications, Oxford-Toronto, Oxford University Press, 2010, p. 586.

HURON David, Sweet Anticipation: Music and The Psychology of Expectation, Cambridge: MIT Press, 2006.

HURON David, Voice leading, The Science behind a Musical Art, Cambridge, MIT Press, 2016. HUSSERL Edmund, Méditations cartésiennes, Paris, Vrin, 1953.

I :

IMBERTY Michel, « Introduction : Du geste temporel au sens » in Temps geste et musicalité, sous la direction de Michel Imberty et Maya Gratier, Paris, L’Harmattan, 2007.

IMBERTY Michel, La musique creuse le temps… De Wagner à Boulez : Musique, psychologie, psychanalyse, Paris, L’Harmattan, 2005.

IMBERTY Michel, L’aquisition de structures tonales chez l’enfant, Paris, Klincksieck, 1969. ISHAGHPOUR Youssef, Rothko, une absence d’image : lumière de la couleur, Tours, Éditions Léo Scheer, 2003.

J :

JACQUES-DALCROZE Émile, Le rythme, la musique et l’éducation, éd. Foetisch, Lausanne, 1965 (original 1920).

JACQUES-DALCROZE Émile, « La technique corporelle de la rythmique », Le Rythme, 1926, n°17, p. 2-3.

JACQUES-DALCROZE Emile, Notes bariolées, Genève, édition Jeheber, 1948.

JAUSS Hans Robert, Pour une esthétique de la réception, Paris, éditions Gallimard, 1978.

Jérôme BAILLET, « Gérard Grisey : Partiels », L’éducation musicale, « baccalauréat 2001 », supplément au n° 473/474, septembre-octobre 2000.

JOHNSON Steven, « Rothko Chapel and Rothko’s Chapel », Perspectives of New Music, Vol. 32, n° 2, 1994, p. 11.

JOLIAT François, « La genèse et le développement de l’éducation musicale à l’école : entre l’enseignement de l’art et l’éducation par l’art en Suisse romande », in M. Mellouki & A. Akkari (Ed.), La recherche au service de la formation des enseignants, Actes de la recherche, Vol. 7, 2009, p. 195-217.

JONES Mari Riess & YEE William, « L’attention aux évènements auditifs : le rôle de l’organisation temporelle », in Penser les sons, p. 74-121.

JOUBERT Muriel, « Le Kammerkonzert pour treize instrumentistes de Ligeti : une écriture d’une grande rigueur », In Musurgia, Pratique et Analyse Musicale, Vol. 8, n°1, 2001, p. 57-79.

JUNOD Philippe, Contrepoints. Dialogues entre musique et peinture, Genève, Contrechamps, 2006.

JUNTUNEN Marja-Leena. « Embodiment in musical knowing: how body movement facilitates learning within Dalcroze Eurhythmics », British Journal of Music Education, Vol. 21, n°2, July 2004, p. 199-214.

JUSLIN Patrik N. et SLOBODA John A., « Introduction. Aims, Organization, and Terminology », in

P.N. Juslin et J.A. Sloboda (dir.), Handbook of Music and Emotion. Theory, Research, Applications. New York, Oxford University Press, 2010, p. 3-12.

K :

KALINOWSKI Isabelle, « Hans-Robert Jauss et l’esthétique de la réception », Revue germanique internationale, Vol. 8, 1997, p. 151-172.

KANDINSKY Vassily, Du spirituel dans l’art et dans la peinture en particulier, éd. établie et présentée par Philippe Sers, Paris, Denoël, Gallimard, « Folio Essais », trad. de l’allemand par Nicole Debrand, trad. du russe par Bernadette Du Crest, 1989.

KARMILOFF-SMITH Kyra & KARMILOFF-SMITH Annette, Comment les enfants entrent dans le langage, Paris, Retz, 2012.

KIRSCHNER Sebastian et TOMASELLO Michael, « Joint drumming: Social context facilitates synchronization in preschool children », Journal of Experimental Child Psychology, Vol. 102, p. 299-314.

KNOWLTON Kenneth C., « A computer technique for producing animated movies », in Proceeding, April 21-23, Washington, D.C., 1964, p. 67-87.

KODÁLY Zoltán, Music should belong to everyone, IKS: Budapest, 2002.

KODÁLY Zoltán, The selected writings of Zoltán Kodály, Halapy, Lili (trad.), Macnicol, Fred (trad.), Boosey & Hawkes, 1974.

KOFFKA Kurt, Principles of Gestalt psychology, New York, Harcourt Brace, 1935.

KÖHLER Wolfgang, Die physischen Gestalten in Ruhe und im stationären Zustand. Erlangen: Verlag der Philosophischen Akademie, 1920.

KOKORAS Panayiotis, « Auditory Fusion and Holophonic Musical Texture », in Xenakis’s Pithoprakta, Athènes, 2014.

KOTZ Sonja A. E. & SCHWARTZE Michael, « Differential Input of the Supplementary Motor Area to a Dedicated Temporal Processing Network: Functional and Clinical Implications », Frontiers in Integrative Neuroscience, Vol. 5, 2011, p. 86.

KRAL Andrej & EGGERMONT Jos J., « What’s to lose and what’s to learn: Development under auditory deprivation, cochlear implants and limits of cortical plasticity », Brain Research Reviews, Vol.56, 2007, p. 259-269.

KRAMER Lawrence, « Subjectivity Rampant! Music, Hermeneutics, and History », in The Cultural Study of Music. A critical introduction, ed. by Martin Clayton, Trevor Herbert and Richard Middleton, New York: Routledge, 2003, p. 124-35.

KRUMHANSL Carol L., « Effects of musical context on similarity and expectancy », Systematische Musikwissenschaft, Vol. 3, n°2, 1995, p. 211-250.

KUBIK Suzana, « Vivre, ressentir, comprendre : l’enseignement musical selon la rythmique Dalcroze », Dossier Éducation musicale dans le monde, publié en ligne le 17 février 2017, France Musique. https://www.francemusique.fr/savoirs-pratiques/vivre-ressentir-comprendre-l-enseignement-musical-selon-la-methode-dalcroze-32139

KURTH Ernst, Musikpsychologie, Berlin, Max Hesse, 1931, 2e éd. 1947.

KURTH Ernst, Selected Writings (sous la dir. de I. Bent), Cambridge, Cambridge University Press, 2006.

L :

La surdité de l’enfant – guide pratique à l’usage des parents, édition INPES/Fondation de France, 2005.

LABAN Rudolph, La maîtrise du mouvement, Arles, Acte Sud, 1994.

LACASSE Serge, « “Listen to My Voice”: The Evocative Power of Vocal Staging in Recorded Rock Music and Other Forms of Vocal Expression », Thèse de doctorat, Université de Liverpool, 2000.

LACASSE Serge, « Composition, performance, phonographie : Un malentendu ontologique en analyse musicale? » in Groove : Enquête sur les phénomènes musicaux contemporains, sous la direction de Serge Lacasse et Patrick Roy, Québec, Presses de l’Université Laval, 2006, p. 65-78.

LACHENMANN Helmut, cité par Clyttus Gottwald, in Musik-Konzept n°61/62, numéro consacré à « Helmut Lachenmann », sous la dir. de H.-K. Metzger, Münich, oct. 88.

LALITTE Philippe, « Le spectre d’une voix, analyse de L’esprit des dunes de Tristan Murail. » In Szendy P. (Eds.), Tristan Murail, Paris, L’Harmattan/Ircam-Centre Georges Pompidou, 2002, p. 59-102.

LALITTE Philippe, « Outils informatiques et méthodes pour l’analyse des musiques actuelles », Focus sur le rock en France, Éditions Delatour France, Sampzon, 2014, p. 191-213.

LALITTE Philippe, « Temporalité et texture dans « Eight Lines » de Steve Reich : de la perception locale à la forme expérientielle. » Musicologies nouvelles, Éditions Musicales Lugdivine 2017,

Les temps de la musique (thèmes Agrégation 2018) 4, p. 66-76.

LALITTE Philippe, « Texture et émergence perceptive en musique contemporaine », in Texte, texture, textile. Variations sur le tissage dans la musique, les arts plastiques et la littérature, EUD, 2013, p. 121-133.

LALITTE Philippe, « The Unique Aesthetic Character of the Music of Roger Reynolds », in Stephen McAdams et Marc Battier (éds.), Creation and perception of a contemporary musical work: The Angel of Death by Roger Reynolds, Paris, IRCAM-Centre Georges Pompidou (DVD, ± 28 pages), 2005.

LALITTE Philippe, « Vers une analyse texturale fondée sur les principes de l’analyse de scène auditive », in Analyse et perception, Actes des Journées d’analyse musicales, 2016. Dijon, Editions Universitaires de Dijon.

LALITTE Philippe, Analyser l’interprétation de la musique du XXe siècle, Hermann, Paris, 2015. LALITTE Philippe, BIGAND Emmanuel, KANTOR-MARTYRUSKA Joanna et DELBÉ Charles, «

On listening to atonal variants of two Piano Sonatas by Beethoven », Music Perception, Vol. 26, n°3, 2009, p. 223-234.

LALITTE Philippe, « Contribution de l’analyse de scène auditive à l’analyse de la performance », IXe congrès européen d’Analyse musicale (CEAM – Euromac 9) / 9th European Music Analysis Conference, Juin 2017, Strasbourg, France.

LALITTE Philippe, « Implications compositionnelles et perceptives des échelles temporelles locales et globales », in Le rythme, Actes des 2es Rencontres inter artistiques, mars 2005, série « Conférences et séminaires », Paris, Observatoire Musical Français, Université de Paris-Sorbonne, 2006, p. 23-34.

LAMBERT Nelle et LOTSTRA Françoise, « L’attachement. De Konrad Lorenz à Larry Young : de l’éthologie à la neurobiologie », Cahiers critiques de thérapie familiale et de pratiques de réseaux, Vol. 35, n°2, 2005, p. 83-97.

LARTILLOT Olivier et TOIVIAINEN Petri, « A Matlab Toolbox for Musical Feature Extraction From Audio », in International Conference on Digital Audio Effects, Bordeaux, 2007.

LAURENT Stéphane et ROY Thomas, « Le Bilan d’efficacité prothétique : interprétation et utilisation pour les réglages », Les Cahiers de l’Audition n°6, 2012, p. 24-28.

LAVIGNE Emma et HORVATH Anne, Dossier de Presse Musicircus, œuvres phares du Centre Pompidou/Musée National d’Art Moderne, 20/04/16-17/07/17.

LAZAROU Loulietta, PARASTATIDIS Themis, TSOLAKI Anthoula, GKIOKA Mara, « International Ballroom Dancing Against Neurodegeneration: A Randomized Controlled Trial in Greek Community-Dwelling Elders With Mild Cognitive impairment », American Journal of Alzheimer’s Disease & Other Dementias, Vol. 32, n°8, p. 489-499.

LE CALVEZ Viviane, « La méthode verbo-tonale à l’heure de l’implant cochléaire », Connaissances Surdités, n°28, 2009, p. 13-17.

LE GOUIC Jean-Claude, « Sheila Hicks, Cheminements en sensualités textiles », Textile art revue, mars 2018.

LE MANER-IDRISSI Gaïd, PAJON Cécile, GAVORNIKOVA-BALIGAND Zdenka, DELEAU Michel, TAN-BESCOND Géraldine & GODEY Benoit, « Implant cochléaire et développement des échanges conversationnels », Revue canadienne des sciences du comportement, Vol. 40, n°2, 2008, p. 120-127.

LEDERBERG Amy & EVERHART Victoria S., « Conversations Between Deaf Children and Their Hearing Mothers: Pragmatic and Dialogic Characteristics », Journal of deaf studies and deaf education, Vol. 5, 2000, p. 303-322.

LELEU Claire et PETER-CHATOUX Anne Gabrielle, « La méthode Jacques-Dalcroze aujourd’hui », Revue de l’APEMU, 2017, p. 51-53.

LELEU Jean-Louis, La construction de l’idée musicale : Essais sur Webern, Debussy et Boulez, éditions Contrechamps, 2015.

LENEL Nadjmah, « Les communications alternatives », In M. Mondain et V. Brun (Eds.), Les surdités de l’enfant, Issy-les-Moulineaux, Masson, 2009, p. 20-27.

LEPOT-FROMENT Christiane & CLEREBAUT Nadine, L’enfant Sourd. Chapitre 2 : « Les interactions prélinguistiques entre l’enfant et ses parents », Bruxelles, De Boeck, 1996, p. 59-82.

LERCH Alexander, An Introduction to Audio Content Analysis, New York, John Wiley, 2012. LERDAHL Fred, JACKENDOFF Ray, A Generative Theory of Tonal Music, Cambridge, MIT Press, 1983.

LESTER Joel, Analytic Approaches to Twentieth-Century Music, New York et Londres, W. W. Norton, 1989.

LEVÄNEN Sari, JOUSMÄKI Veikko & HARI Riitta, « Vibration-induced auditory-cortex activation in a congenitally deaf adult », Current Biology, Vol. 8, n°15, 1998, p. 869-872.

LEVIN Judikael et BOSSIS Bruno, « Les descripteurs audio au service de l’analyse comparée des canaux stéréophoniques dans les musiques populaires », https://jim2019.sciencesconf.org/data/pages/LevinBossis.pdf

LEVITIN Daniel, De la note au cerveau, Paris, Editions Héloïse d’Ormesson, 2010.

LEYBAERT Jacqueline & ALEGRIA Jésus, « The role of cued speech in language development of deaf children. » In M. Marschark & P. E. Spencer (Eds.), Handbook of deaf studies, language, and education, New York, Oxford University Press, 2003, p. 261-274.

LEYBAERT Jacqueline & LASASSO Carol, « Cued speech for enhancing speech perception and first language development of children with cochlear implants », Trends in Amplification, Vol. 14, n°2, 2010, p. 96–112.

LIGETI György, « Concerto de Chambre », in Passages du XXème siècle, première partie, janvier-juillet 1977, Ed. IRCAM et Métiers graphiques, 1977, p. 101.

LIGETI György, « Pierre Boulez : Structure and Automatism in Structure la » in Die Reihe n° 4, 1958, trad. fr. « Décision et automatisme dans la Structure Ia de Pierre Boulez », in Neuf essai sur la musique, Genève, Editions Contrechamps, 2001, p. 89-126.

LIGETI György, « Evolution de la forme musicale », Die Reihe, n°7, Universal Edition (Vienne, 1960), repris dans Neuf essais sur la musique, Editions Contrechamps (Genève, 2001), p. 140.

LIGETI György, György Ligeti in Conversation with Peter Varnai, Josef Hausler, Claude Samuel and himself, London, Eulenburg, 1983.

LIGNY Chantal, SIMON Patricia, MATAGNE Laurence & SCHEPERS Franz, « Implantation cochléaire bilatérale », A.N.A.E. Approche Neuropsychologique des Apprentissages chez l’Enfant, Vol. 27, Tome 5, n°138, 2015, p. 403-413.

LINA-GRANADE Geneviève & TRUY Éric, « Conduite à tenir devant une surdité de l’enfant », EMC-Oto-rhino-laryngologie, Vol. 2, n° 3, 2005, p. 290-300.

LORENZ Konrad, Evolution et modification du comportement, Paris, éd. Payot & Rivages, 2007. LORENZI Christian, GILBERT Gaëtan, CARN Héloïse, GARNIER Stéphane et MOORE Brian C.

J., « Speech perception problems of the hearing impaired reflect inability to use temporal fine structure », Proceedings of the National Academy of Sciences, Dec 2006, Vol. 103, n°49, p.18866-18869.

LORTAT-JACOB Bernard, Chants de Passion, au cœur d’une confrérie de Sardaigne, Paris, Cerf, 1998.

M :

MALT Mikhail, « Une proposition pour l’analyse des musiques électroacoustiques de Xenakis à partir de l’utilisation de descripteurs audio », in Iannis Xenakis – The Electroacoustic Music / La Musique électroacoustique, sous la direction de Makis Solomos, L’Harmattan, Paris, 2015, p. 159-198.

MAMASSIAN Pascal et LE CORRE François, « Des illusions dans tous les sens », L’Essentiel Cerveau et Psycho n° 12, novembre 2012-janvier 2013.

MANFREDI Louise R., SAAL Hannes P., BROWN Kyler J., ZIELINSKI Mark C., DAMMANN III John F., POLASHOCK Vicky S. and BENSMAIA Sliman J., « Natural scenes in tactile texture », Journal Neurophysiology, Vol. 111, 2014, p. 1792-1802.

MARGULIS Elizabeth Hellmuth, « A model of melodic expectation », Music Perception: An Interdisciplinary Journal, Vol. 22, n°4, 2005, p. 663-714.

MARLIN Sandrine, GARABÉDIAN Éréa Noël, ROGER Gilles, MOATTI Lucien, MATHA Nicole, LEWIN Patricia, et al. « Connexin 26 gene mutations in congenitally deaf children: pitfalls for genetic counseling », Arch. Otolaryngol. head Neck Surg, 2001, Vol. 127, n°8, p. 927-33.

MARQUET Françoise, Zao Wou-Ki, Autoportrait, Paris, éditions Fayard, 1988.

MARTENOT Maurice & SAÏTO Christine, La relaxation active ou kinésophie : le corps, expression de l’être, Paris, Le Courrier du Livre, 2004.

MARTENOT Maurice, Principes fondamentaux de la formation musicale et leur application, Paris, Magnard, 1996.

MATHEWS Max, « The digital computer as a musical instrument. », Science, New Series, Vol. 142, N° 3592, 1963, p. 553-557.

MATHIEU Louise, « Un regard actuel sur la rythmique Jacques-Dalcroze », Recherche en éducation musicale, n°28, décembre 2010, p. 17-27.

MAURIAL Sandrine, « États de couleur entre pigment-matière et pixel-lumière », Traitement du signal, Vol. 21, numéro spécial « L’image numérique couleur », 2004, p. 373-384.

MCADAMS Stephen & BIGAND Emmanuel, Penser les sons, Psychologie cognitive de la musique, Paris, Presses Universitaires de France, 1994.

MCADAMS Stephen, « La reconnaissance de sources et d’événements sonores », in S. McAdams et

E. Bigand (éd.), Penser les sons : La psychologie auditive de l’audition, Paris, PUF, 1994, p. 157-213.

MCADAMS Stephen, Perception et cognition de la musique, Paris, Vrin, 2015.

MCADAMS Steve, « Spectral fusion and the creation of auditory images », in Manfred Clynes (ed.)

Music, Mind, and Brain, 1982, p. 279-298.

MCDERMOTT E. F. « Music and Rhythm – From Movement and Lipreading and Speech », Volta Review, Vol. 73, 1971, p. 229-232.

MÉLÈSE Pierre, Samuel Beckett, Paris, Pierre Seghers, 1966.

MERLEAU-PONTY Maurice, La structure du comportement, Paris, PUF, 1942.

MESSENGER Thomas, « Texture and Form in the Masses of Fayrfax », Journal of the American Musicological Society, Vol. 24, n° 2, 1971, p. 282-286.

MEYER Leonard B, Emotion and Meaning in Music, 1956, The University of Chicago Press, trad. fr., Emotion et Signification en Musique, Arles, Actes Sud, 2011.

MIALARET Jean-Pierre, « Maurice Chevais et la didactique de la musique à l’école », In C. Fijalkow (Ed.), Maurice Chevais (1880-1943) : un grand pédagogue de la musique, Paris, L’Harmattan, 1995, p. 93-106.

MICHEL Pierre, « György Ligeti : Kammerkonzert pour 13 instrumentistes (1969-70) », Analyse musicale, n°34, 1999, p. 31-51.

MICHEL Pierre, György Ligeti, Paris, Minerve, deuxième édition revue et complétée, 1995. MIDDLETON Richard, « Play it Again Sam: Some Notes on the Productivity of Repetition in Popular

Music », Popular Music, Vol. 3, 1983, p. 235-270.

MIDDLETON Richard, « L’étude des musiques populaires », in Musique une encyclopédie pour le XXIe siècle, Vol. 2, Savoirs musicaux, sous la direction de Jean-Jacques Nattiez, Paris, Actes Sud/Cité de la musique, 2004, p. 771.

MILLER George A. et LICKLIDER Joseph C. R., « The intelligibility of interrupted speech », Journal of the Acoustical Society of America, n° 22, 1950, p. 167-173.

MITANI Chisato, NAKATA Takayuki, TREHUB Sandra, KANDA Yukihito, KUMAGAMI Hidetaka, TABASAKI Kenji, et al., « Music recognition, music listening, and word recognition by deaf children with cochlear implants », Ear Hearing, Vol. 28(Supplement), 2007, p. 29-33.

MITHEN Steven J., « The music instinct: the evolutionary basis of musicality », Annals of the New York Academy of Science, Vol.1169, 2009, p. 3-12.

MONDAIN Michel, BLANCHET Catherine & VENAIL Frederic & VIEU Adrienne, « Classification et traitement des surdités de l’enfant », Emc – Oto-rhino-laryngologie, Vol. 2, 2005, p. 301-319.

MONTESSORI Maria, L’enfant, Paris, Desclée de Brouwer, 1936, 12e éd., tr. G.J.J. Bernard.

MONTEVERDI Claudio, Préface aux Madrigaux guerriers et amoureux, huitième livre des madrigaux, in Correspondances, préfaces, épîtres dédicatoires, trad. A. Russo, Sprimont, Mardaga, 2001.

MOORE Allan F. et DOCKWRAY Ruth, « Configuring the Sound-Box 1965-1972 », Popular Music, Vol. 29, n° 2, 2010, p. 181-197.

MOORE Allan F., Rock: The Primary Text: Developing a Musicology of Rock, Aldershot, Ashgate, 2004.

MOORE Jean K., NIPARKO John K., MILLER George A. & LINTHICUM Fred H., « Effect of Profound Hearing Loss on A Central Auditory Nucleus », American Journal of Otology, Vol. 15, n°5, 1994, p. 588-595.

MORGAN Robert. P., Twentieth-Century Music: a history of musical style in modern Europe and America, New York: Norton, 1991.

MOULENDA Joseph Igor, « Par-delà le sens, l’écriture et le texte. Jacques Derrida », Controverses, Revue spécialisée de philosophie, ENS, Libreville, Editions Oudjat, 2016.

MOUSSARD Aline, ROCHETTE Françoise & BIGANG Emmanuel, « La musique comme outil de stimulation cognitive », L’Année psychologique, Vol. 112, n°3, 2012, p. 499-542.

MOYLAN William, The Art of Record Production: The Creative Resources of Music Production and Audio, 1ère édition, New York: Van Nostrand Reinhold, 1992.

MOYLAN William, Understanding and Crafting the Mix: The Art of Recording, 2e édition, Cambridge (Mass.), MIT Press, 2002.

MUNDY Peter & NEWELL Lisa, « Attention, joint attention, and social cognition », Current directions in Psychological Science, Vol. 16, 2007, p. 269-274.

N :

NAKATA Takayuki & TREHUB Sandra E., « Infants’ Responsiveness to Maternal Speech and Singing », Infant Behavior and Development, Vol. 27, 2004, p. 455-464.

NAKATA Takayuki, TREHUB Sandra, MITANI Chisato, KANDA Yukihito, SHIBASAKI Atsuko & SCHENLLENBERG E. Glenn, « Music recognition by Japanese children with cochlear implants », Journal of Physiological Anthropol. Applied Human Sciences, Vol. 24, n°1, 2005, p. 29-32.

NARMOUR Eugene, « Hierarchical expectation and musical style », In D. Deutsch (ed), The Psychology of Music, 2nd Edition. San Diego: Academic Press, 1999, p. 442-472.

NARMOUR Eugene, The analysis and cognition of basic melodic structures: the implication-realisation model, Chicago, University of Chicago Press, 1992.

NATTIEZ Jean-Jacques, « Varèse’s Density 21.5: A study in semiological analysis », Music Analysis, n° 1, 1982, p. 243-340.

O :

OECHSLIN Mathias S., MEYER Martin & JÄNCKE Lutz, « Absolute Pitch – Functional Evidence of Speech-Relevant Auditory Acuity », Cerebral cortex, Vol. 20, n°2, 2010, p. 447-455.

ORFF Carl et KEETMAN, Guild, Musik fur Kinder, B. Schott’s Söhne, Mainz, vol. 1, 1950, vol. 2, 1952, vol. 3, 1953, vol. 4, 1954, vol. 5, 1954.

ORSENNA Erik, Voyage Aux Pays du Coton : Petit Précis de la Mondialisation, Paris, Fayard, 2006. P

PANKSEPP Jaak, « The Emotional Sources of Chills Induced by Music », Music Perception, Vol. 13, n°2, 1995, p. 171-207.

PANKSEPP Jaak, Affective Neuroscience, New York, Oxford University Press, 1998.

PAPOUSEK Mechthild, PAPOUSEK Hanuš & HAEKEL Monika, « Didactic adjustments in fathers’ and mothers’ speech to their three-month-old infants », Journal of Psycholonguistic Research, Vol. 16, n°5, 1987, p. 491-516.

PAQUIER Mathieu, « Traitement du bruit et de la parole par le système auditif chez l’entendant et le déficient auditif », Les Cahiers de l’Audition, Vol. 26, 2013, p. 17-22.

PATEL Aniruddh D., Music, Language and the Brain, New York, Oxford University Press, 2008.

PEARCE Marcus T. & WIGGINS Geraint A., « Expectation in melody: The influence of context and learning », Music Perception: An Interdisciplinary Journal, Vol. 23, n°5, 2006, p. 377-405.

PENROSE Lionel S. et PENROSE Roger, « Impossible Objects: A Special Type of Illusion », British Journal of Psychology, Vol. 49, n° 1, 1958, p. 31–33.

PERETZ Isabelle, « Towards a Neurobiology of Musical Emotions », in P. J. J. Sloboda (Ed.), Handbook of Music and Emotion: Theory, research, applications, Oxford, Oxford University Press, 2010, p. 99-126.

PERETZ Isabelle, Apprendre la Musique, Nouvelles des Neurosciences, Odile Jacob, 2018. PERETZ Isabelle, « A quoi sert la musique ? », Le temps stratégique, mars-avril 2000, n°92. PERRAUDEAU Sandrine, « Un Atelier Musical avec les enfants sourds », Connaissances Surdités, Décembre 2012, n°42, p. 23-25.

PIAGET Jean, La formation du symbole chez l’enfant, Neuchâtel, Delachaux et Niestlé, 1945.

PIAGET Jean, Naissance de l’intelligence chez l’enfant, Paris, Delachaux et Niestlé, Actualité pédagogiques et psychologiques, 1977.

PIENCIKOWSKI Robert, « Note de programme pour Structures pour deux pianos », premier livre [archive], sur le site de l’IRCAM.

PINEAU Marion & TILLMANN Barbara, Percevoir la musique : une activité cognitive, Paris, L’Harmattan, 2001.

PINTO Serge et SATO Marc, Traité de Neuro-linguistique : du cerveau au langage, De Boeck, 2016.

PISONI David B. & CLEARY Miranda, « Measures of Working Memory Span and Verbal Rehearsal Speed in Deaf Children after Cochlear Implantation », Ear Hearing, Vol. 24, n°1, 2003, p. 106-120.

PISONI David B., KRONENBERGER William G., ROMAN Adrienne & GEERS Ann E., « Measures of digit span and verbal rehearsal speed in deaf children after more than 10 years of cochlear implantation », Ear and Hearing, Vol.32, 2011, p. 60–74.

PISTON Walter, Orchestration, London, Victor Gollancz, 1955.

PLUTCHIK Robert, Emotion a Psycho Evolutionary Synthesis, Harper, New York, 1980.

PREISLER Gunilla, Les implants cochléaires chez les enfants sourds, Strasbourg, Edition du conseil de l’Europe, 2001.

PRESSNITZER Daniel, SUIED Clara and SHAMMA Shihab A., « Auditory Scene Analysis: the sweet music ambiguity », Frontiers in Human Neuroscience, Vol. 5, n° 158, 2011, p. 1-10.

R :

RASTIER François, Le silence de Saussure ou l’ontologie refusée, éd. Bouquet, 2003. Recommandation BIAP 06/8 : « L’appareillage de l’enfant déficient auditif. »

REICH Steve, « Music as a gradual process », in Writings on music 1965-2000, New-York, Oxford University Press, 2002, p. 34-36.

REICH Steve, Différentes phases, Paris, Cité de la musique-Philharmonie de Paris, 2016. REICH Steve, Écrits et entretiens sur la musique, Christian Bourgeois éditeur, Paris, 1981.

RENARD Christian et AZÉMA Bernard, Précis d’Audioprothèse, Production, phonétique acoustique et perception de la parole, Elsevier Masson, « Chapitre 5 – Données fréquentielles et temporelles de la perception de la parole », 2005, p. 291.

RENARD Claire, Le geste musical, Van de Velde, 1982.

REYNOLDS Roger, Form and Method: Composing Music, The Rothschild Essays, Edited by Stephen McAdams, New York, Routledge, 2002.

REYNOLDS Roger, « Manuscript Sketch of Symphony [Myths] by Roger Reynolds », Internet http://lcweb2.loc.gov/diglib/ihas/loc.natlib.ihas.200029047.

RIBIERE-RAVERLAT Jacquotte, L’Éducation musicale en Hongrie, 2e éd., A. Leduc, Paris, 1977. RIBIERE-RAVERLAT Jacquotte, Développer les capacités d’écoute à l’école, Ecoute musicale, écoute des langues, Paris, PUF, 1997.

RICHARD JOHNSON C., MESSIER Paul, SETHARES William A., KLEIN Andrew G., BROWN Christopher A., HOANG DO Anh, KLAUSMEYER Philip A., ABRY Patrice, JAFFARD Stéphane, WENDT Herwig, ROUX Stéphane, PUSTELNIK Nelly, VAN NOORD Nanne, VAN DER MAATEN Laurens, POSTMA Eric, CODDINGTON James, DAFFNER Lee Ann,

MURATA Hanako, WILHELM Henry, WOOD Sally et MESSIER Mark, « Pursuing automated classification of historic photographic papers from raking light image », Journal of the American Institute for Conservation, Vol. 53, n°3, 2014, p. 159-170.

RIEDELSHEIMER Thomas, Touch The Sound : un voyage sonore avec Evelyn Glennie, un documentaire germano-britannique réalisé en 2004.

RINALDI Pasquale, CASELLI Cristina, « Lexical and Grammatical Abilities in Deaf Italian Preschoolers: The Role of Duration of Formal Language Experience », The Journal of Deaf Studies and Deaf Education, Vol. 14, Issue 1, Winter 2009, p. 63–75.

RISSET Jean-Claude, « Pitch and Rhythm Paradoxes: Comments on Auditory Paradox Based on Fractal Waveform », The Journal of the Acoustical Society of America, Vol. 79, 1986, p. 186-189.

RISSET Jean-Claude, « Composer le son : expériences avec l’ordinateur, 1964-1989 », Contrechamps, n° 11, 1990, p. 107-126.

RISSET Jean-Claude, « Ouvrir l’espace sonore : Max Mathews, John Chowning, Holophon, » Journée d’informatique musicale, 2011.

ROBERTS Megan Y., « Parent-Implemented Communication Treatment for Infants and Toddlers With Hearing Loss: A Randomized Pilot Trial », Journal of Speech Language and Hearing Research, Vol. 62, n°1, 2018, p. 143-152.

ROCHETTE Françoise, « Entraînement Auditif et Musical Chez l’Enfant Sourd Profond : Effets sur la Perception Auditive et Effets de Transferts », Thèse d’état, Université de Bourgogne, 2012.

ROSEN Charles, Arnold Schœnberg, Chicago, The University Press of Chicago, 1975; trad. fr.: Shoenberg, Paris, Minuit, 1979, p. 52.

ROSENBERG Harold, « Les peintres d’action américains » (1952), in Charles Harrison et Paul Wood (ed.), Art en théorie 1900-1990, Hazan, 1997 pour la traduction française, p. 644.

ROSENBLUM Ouriel, « Du bébé à l’empathie : Une approche des interactions affectives », in A. Braconnier & J. Sipos (Dir), Le Bébé et les interactions précoces, Paris, PUF, 1998, p. 167-194.

ROSS Alex, The Rest is Noise : A l’écoute du XXe siècle, la modernité en musique, Arles, Acte Sud, 2010.

ROWELL Lewis, Thinking About Music: An Introduction to the Philosophy of Music, The University of Massachusetts, Amherst, 1983.

S :

SABBE Herman, « Gyorgy ligeti, illusions et allusions », J. New Music Res., Vol. 8, 1979, p. 11–34. SADEK-KHALIL Denise, L’enfant sourd et la construction de la langue, Montreuil, Ed. Du Papyrus, 1997.

SADIE Stanley and TYRELL John, The New Grove Dictionnary of Music and Musicians, Vol XVIII, Oxford University Press, 1980.

SAFATLE Vladimir, « Morton Feldman comme critique de l’idéologie : expression et politique dans Rothko Chapel », in Kogler, S. et Olive, J-P. (dir), Expression et geste musical, Éditions L’Harmattan, Paris, 2013.

SAINT-MARTIN Fernande, Sémiologie du langage visuel, Sillery, Presses de l’Université du Québec, 1987.

SARROUILHE Denis, FAVOT Laure, Histologie UE2, Ed. Ellypses « Entrainement intensif », 2018. SAUSSURE Ferdinand de, Écrits de Linguistique générale, Texte établi et édité par S. Bouquet et R.Engler, Paris, Gallimard, 2002.

SCHAEFFER Pierre, Traité des objets musicaux, Paris, Seuil, 1966.

SCHELLENBERG E. Glenn, « Expectancy in melody: Tests of the implication-realization model », Cognition, Vol. 58, 1996, p. 75-125.

SCHELLENBERG E. Glenn, « Simplifying the implication-realization model of melodic expectancy », Music Perception: An Interdisciplinary Journal, Vol. 14, n°3, 1997, p. 295-318.

SCHELLENBERG E. Glenn, ADACHI Mayumi, PURDY Kelly T. & McKINNON Margaret C., « Expectancy in Melody: Tests of Children and Adults », Journal of Experimental Psychology: General, Vol. 131, 2002, p. 511-537.

SCHENKER Heinrich, L’Écriture Libre (1935), Seconde édition revue et adaptée par Oswald Jonas. Trad. De l’allemand par N. Meeùs. Titre Original : Der freie Satz (Neue musikalische Theorien und Phantasien, vol. 3). Liège, Mardaga, 1993.

SCHER Joël, « Rhéologie, texture et texturation des produits alimentaires », Journal Techniques de l’ingénieur Opérations unitaires du génie industriel alimentaire, 2006.

SCHLAUG Gottfried, JÄNCKE Lutz & HUANG Yanxiong, « In vivo evidence of structural brain asymetry in musicians », Science, Vol. 3, n°267, 1995b, p. 699-701.

SCHMID Stefan, « Textures of geological materials: computer model predictions versus empirical interpretations based on rock deformation experiments and field studies », in Textures of Geological Materials (Hans Joachim BUNGE et al.eds), DGM Verlag, p. 279-301.

SCHNEIDER Peter, SCHERG Michael, DOSCH H. Günter, SPECHT Hans J., GUTSCHALK Alexander, & RUPP André, « Morphology of Heschl’s gyrus reflects enhanced activation in the auditory cortex of musicians », Nature Neurosciences, Vol. 5, n°7, 2002, p. 688-694.

SCHOPENHAUER Arthur, Le monde comme volonté et comme représentation, trad. A. Burdeau, Paris, PUF, 1966.

SCHROEDTER Stephanie, « Staging Listening: Corporeal Dimensions of New Music in Choreographies by Xavier Le Roy », Critical Stages, The IATC journal, December 2017, n°16.

SCHWARTZ Naomi Oshinsky, « Adaptation of the sensory texture profile method to skin care products », Journal of Texture Studies 6, 1975, p. 33-42.

SEASHORE Carl E., The Psychology of musical talent, New York, Silver Burdett, 1919. SÉGUIN Édouard, Traitement moral, hygiène et éducation des idiots, Paris, J. B. Balliere, 1846.

SÉRO-GUILLAUME Philippe, Langues des Signes, Surdité et accès au langage, Neuilly-Plaisance, Éd. Du Papyrus, 2008.

SHAFER Raymond Murray, Le paysage sonore, le monde comme musique (The Tuning of the World, 1977), Marseille, éditions Wild Project, 2010.

SHARMA Anu, DORMAN Michael F. & SPAHR Anthony J., « A sensitive period for the development of the central auditory system in children with cochlear implants; implications for age of implantation », Ear Hearing, Vol.23, n°6, 2002a, p. 532-539.

SHENFIELD Tali, TREHUB Sandra & NAKATA Takayuki, « Maternal singing modulates infant arousal », Psychology of Music, Vol. 31, n°4, 2003, p. 365-375.

SHEPARD Roger N., « Circularity in judgments of relative pitch », J. Acoust. Soc. Am. Vol. 36, 1964, p. 2345–2353.

SILK Joseph, Une brève histoire de l’univers, Paris. Odile Jacob, 2003.

SIMARD France, CHEVALIER Nicole et DESPINS Jean-Paul, « Performance musicale : le chant préalable à l’apprentissage instrumental », http://www.jfrem.uottawa.ca/texte_jfrem2009_simard_france.pdf.

SLOBODA John A., L’esprit musicien : la psychologie cognitive de la musique, Paris, Mardaga, 1985. SLOBODA John Anthony, « Cognition and real music: the psychology of music comes of age », Psychologica Belgica, Vol. 26, 1986, p. 199-219.

SMITH-BRINDLE Reginald, Serial Composition, Oxford University Press, 1966.

SODERBERG Stephen, An interview with Roger Reynolds, Beginnings, Library of congress, The Roger Reynolds Collection, 2000.

SOLOMOS Makis, « Pour une filiation Xenakis-Grisey? », in Makis Solomos (éd.), Iannis Xenakis, Gérard Grisey, La métaphore lumineuse, L’Harmattan, 2003, p. 149-167.

SOLOMOS Makis, De la musique au son. L’émergence du son dans la musique des XXe et XXIe siècles, Rennes, Presses Universitaires de Rennes, 2013.

SOULÉ Michel et CYRULNIK Boris, L’intelligence avant la parole : nouvelles approches originales du bébé, Paris, ESF, 1998.

SPAULDING Sandy J., BARBER Brittany, COLBY Morgan, CORMACK Bronwyn, MICK Tanya & JENKINS Mary E., « Cueing and Gait Improvement Among People With Parkinson’s Disease: A Meta-Analysis », Archives of Physical Medicine and Rehabilitation, Vol. 94, 2012, p. 562-570.

STANDLEY Jayne M., CASSIDY Jane, GRANT Roy, CEVASCO Andrea, SZUCH Catherine, NGUYEN Judy, WALWORTH Darcy, PROCELLI Danielle, JARRED Jennifer, ADAMS Kristen, « The effect of music reinforcement for non-nutritive sucking on nipple feeding of premature infants », Pediatric nursing, May-June 2010, Vol. 36, p. 136-145.

STARR Lawrence, « Melody-Accompaniment Textures in the Music of Bartók, as Seen in His Mikrokosmos », University of California Press, The Journal of Musicology, Vol. 4, n° 1, 1985-1986, p. 91-104.

STERN Daniel N., Le monde interpersonnel du nourisson, PUF le fil rouge, 2003.

STRIZICH Robert, « Texture in post-World War II music », Ex Tempore: A journal of compositional and theoretical research in music, vol. 5, n°2, 1991, p. 1-28.

SWANWICK Keith et TILLMANN June, « The sequence of musical development: A study of children’s composition. », British journal of music education, Vol.3, 1986, p. 305-339.

SYLVESTRE DE SACY Clotilde, COMTE Chantal et CAVALIER Luna, Bien lire et aimer lire : méthode phonétique et gestuelle créée par Suzanne Borel-Maisonny, Bien Lire, 2018.

SZCZESNIAK Alina Surmacka, « Classification of textural characteristics », Journal of Food Science, Vol. 28, n°4, 1963, p. 385- 389.

SZCZESNIAK Alina Surmacka, « Sensory texture profiling – historical and scientific perspectives »,

Food Technology, Vol. 52, n°8, 1998, p. 54-57.

SZŐNYI Erzsébet, Quelques aspects de la méthode de Zoltan Kodály : application de ses principes à l’éducation musicale, Ed. Corvina, 1976.

T :

TAGG Philip, « Kojak: 50 Seconds of Television Music – Towards the Analysis of Affect », in Popular Music, Götenborg: Skrifter från Musikvetenskapliga institutionen, 1979.

TAN Siu-Lan, PFORDRESHER Peter, HARRE Rom, « The Question of Meaning in Music », in Psychology of Music: From Sound to Significance. New York, Psychology Press, 2010, p. 245–259.

TEMPERLEY David, The Cognition of Basic Musical Structures, Cambridge MA: MIT Press, 2001. TENNEY James et POLANSKY Larry, «Temporal gestalt perception in music», Journal of Music Theory, XXIV, n° 2, 1980, p. 205-241.

TILLMANN Barbara & POULIN-CHARRONNAT Bénédicte, « Etudier les attentes musicales de l’auditeur non- musicien : le paradigme d’amorçage musical », Intellectica, n°48-49, 2008, p. 27-35.

TILLMANN Barbara, « La musique au secours du langage. De l’étude des corrélats neuronaux vers des perspectives de réhabilitation », in PLATEL Hervé et THOMAS-ANTÉRION Catherine, Neuropsychologie et art, Paris, De Boeck-Solal, coll. « Neuropsychologie », 2014, p. 177-198.

TOMITA Fumiaki, SHIRAI Yoshiaki, TSUJI Saburo, « Description of textures by structural analysis », IEEE PAMI, Vol. 4, n° 2, 1982.

TRAINOR Laurel J. & HANNON Erin E., « Musical development », in D. Deutsch (dir.), The Psychology of Music, Academic Press, 3e éd., p. 423-497.

TRAINOR Laurel J. & HEINMILLER Becky M., « The development of evaluative responses to music: Infants prefer to listen to consonant over dissonance », Infant Behavior & Development, Vol. 21,1998, p. 77-88.

TRAINOR Laurel J., « The origins of music in auditory scene analysis and the roles of evolution and culture in musical creation », Phil. Trans. R. Soc. B, 2016, n° 370.

TRAINOR Laurel J., « La musique chez les tout-petits » in Revue Internationale d’Éducation « Dossier Musique et Éducation », Sèvres n°75, septembre 2017, p. 65-74.

TRAINOR Laurel J., GAO Xiaoqing, LEI Jing-Jiang, LEHTOVAARA Karen, HARRIS Laurence R., « The primal role of the vestibular system in determining musical rhythm », Cortex, Vol. 45, n°1, 2009, p. 35-43.

TRAINOR Lauren J. & CIRELLI Laura, « Rhythm and interpersonal synchrony in early social development », Annals of the New York Academy of Sciences, Vol. 1337, 2015, p. 45-52.

TREHUB Sandra & TRAINOR Laurel, « Singing to infants: Lullabies and play songs. » Advances in Infancy Research. Vol. 12, 1998, p. 43-77.

TREHUB Sandra E., BULL Dale & THORPE Leigh A., « Infants’ perception of melodies: the role of melodic contour », Child Development, Vol. 55, n°3, 1984, p. 821-830.

TREHUB Sandra, « The developmental origins of musicality », Nature Neurosciences, Vol. 6, n°7, 2003, p. 669-673.

TREVARTHEN Colwyn et MALLOCK Stephen, « Musicality: Communicating the vitality and interests of life », Communicative musicality: Exploring the basis of human companionship, New York, Oxford University Press, 2009, p. 1-11.

TRONICK Edward, « Multilevel meaning making and dyadic expansion of consciousness theory: The emotional and the polymorphic polysemic flow of meaning », in D.Fosha, D.J. Siegel, M. Solomon (éd.) The healing power of emotion: Affective neuroscience, development, and clinical practice, New York, Norton; 2008, p. 86–110.

TROUSSEAU Armand, « Extrait de son discours de rentrée de la Faculté de Médecine de Paris », prononcé le 2 novembre 1842.

TRUY Éric & LINA-GRANADE Geneviève, « Implantation cochléaire de l’enfant : Technologie, bilan médical et sélection des candidats, réhabilitation », Archives de Pédiatrie, Vol. 10, n°6, 2003, p. 554-564.

TRUY Éric, « Méthodes instrumentales de réhabilitation de l’audition : intérêts et limites. » In M. Mondain, V. Brun, Les surdités de l’enfant. Entretiens de rééducation et réadaptation fonctionnelle, Issy-les-Moulineaux, Elsevier Masson, 2009, p. 11-19.

V :

VALLIER Dora, « La rencontre Schoenberg-Kandinsky : Musique ⇆ Peinture », in Schoenberg-Kandinsky. Correspondance, écrits : Revue Contrechamps n° 2, Genève, Éditions Contrechamps, 1984, p. 143-153.

VICKERS Zata & BOURNE Malcom C., « A psychoacoustical theory of crispness », Journal of Food Science, 1976, n°41, p. 1158-1164.

VIEILLARD Sandrine, PERETZ Isabelle, GOSSELIN Nathalie, KHALFA Stéphanie, GAGNON Lise & BOUCHARD Bernard, « Happy, sad, scary and peaceful musical excerpts for research on emotions », Cognition and Emotion, Vol. 22, n°4, 2008, p. 720-752.

VINTER Shirley, « L’acquisition du langage oral par l’enfant sourd », In Solal (Ed.), Précis d’audiologie et de déglutition, Marseille,2005, p. 271-292.

W :

WALCZYK Eugenia Bulawa, « Music instruction and the hearing impaired », Music Educators Journal, Vol. 80, n°1, 1993, p. 42-44.

WALLON Henri, Importance du mouvement dans le développement psychologique de l’enfant, Enfance, réédit. in Enfance, 1959, 3-4, p. 235-239.

WARREN Richard M. et WARREN Roslyn P., « Auditory Illusions and Confusions », Scientific American, vol. CCXXIII, n° 6, décembre 1970, p. 30-36.

WERTHEIMER Max, « Experimentelle Studien über das Sehen von Bewegung », Zeitschrift für Psychologie, 61, 1912, p. 161-265.

WESSEL David L. et RISSET Jean-Claude, « Les illusions auditives », in Claude Malric (dir.), Musique et ordinateur [Encyclopaedia Universalis, Encyclopaedia Universalis, 1979, p. 161-171.], Les Ulis, Centre expérimental du spectacle, 1983, p. 93-105.

WILLEMS Edgar, L’éducation musicale nouvelle (2e éd.), Fribourg, Pro Musica, 1968.

WILLEMS Edgar, L’oreille musicale 2, la culture auditive, les intervalles et les accords, Genève, Ed. Pro Musica, 1940.

WILSON Blake S. & DORMAN Mickael F., « Cochlear Implants: Current designs and future possibilities », Journal of Rehabilitation Research and Development, Vol. 45, n°5, 2008, p. 695-730.

WILSON Blake S., « The Remarkable Cochlear Implant and Possibilities for the Next Large Step Forward », Acoustical Society of America, Acoustics Today, Vol. 15, n°1, 2019, p. 53-61.

WILSON Blake S., FINLEY Charles C., LAWSON Dewey T., WOLFORD Robert D., ZERBI

Mariangeli. « Design and evaluation of a continuous interleaved sampling (CIS) processing strategy for multichannel cochlear implants. » Journal of Rehabilitation Research and Development, Vol. 30, n°1, 1993, p. 110-116.

WILSON Peter Niklas, « Interkulturelle Fantasien: György Ligetis Klavieretüden Nr. 7 und 8 »,

Melos 51, 1992, p. 63–84.

WINKLER István, HÁDEN Gábor P., LADINIG Olivia, SZILLER István, and HONING Henkjan, « Newborn infants detect the beat in music », Proceedings of the National Academy of Sciences, Feb. 2009, Vol. 106, n°7, p. 2468-2471.

WINNICOTT Donald Woods, « La théorie de la relation parents-nourisson », in De la pédiatrie à la psychanalyse, Paris, Payot, 1969, p. 61.

WINNICOTT Donald Woods, Jeu et réalité, Paris, NRF Gallimard, 1975.

WONG Patrick C. M., SKOE Erika, RUSSO Nicole M., DEES Tasha & KRAUS Nina, « Musical experience shapes human brainstem encoding of linguistic pitch patterns », Nature Neurosciences, Vol.10, 2007, p. 420-422.

WOSZCZYK Wieslaw, BREGMAN Albert S., « Creating mixtures: The application of auditory scene analysis (ASA) to audio recording », Audio anecdotes 2, AK Peters, 2005.

WRIGHT James K. et BREGMAN Alfred S., « Auditory stream segregation and the control of dissonance in polyphonic music », Contemporary Music Review, Vol. 2, n°1, 1987, p 63-92.

WUYTACK Jos, Musica Viva. Pour une éducation musicale active. Volume 1 : Sonnez…battez, Paris, Alphonse Leduc, 1970.

WUYTACK Jos, Musica Viva. Pour une éducation musicale active. Volume 2 : Expression rythmique, Paris, Alphonse Leduc 1970.

X :

XENAKIS Iannis, « Provlimata ellinikis mousikis synthesis (Problèmes de composition musicale grecque) », Epitheorisi technis n°9, Athènes, 1955, p. 185-189. Traduction française dans Présences de / Presences of Iannis Xenakis, éd. par Makis SOLOMOS, Paris, Cdmc, 2001, p. 12.

Y :

YOST William A., Fundamentals of Hearing: An Introduction, 5e éd., San Diego, Brill Academic Press, 2006.

Z :

ZAGORSKI-THOMAS Simon, « The Musicology of Record Production », Twentieth-Century Music, Vol. 4, n°2, Boston: Cambridge, 2007, p. 189-207.

ZAK III Albin, I Don’t Sound Like Nobody, Remaking Music in 1950s America, University of Michigan Press, 2010.

ZAK III Albin, The poetics of rock, California UP, 2001.

ZATORRE Robert J. & SALIMPOOR Valorie N., « From perception to pleasure: Music and its neural substrates », Proceedings of the National Academy of Sciences of the United States of America, Vol. 110 (suppl. 2), 2013, p. 10430-10437.

ZENATTI Arlette, « Aspects du développement musical de l’enfant dans l’histoire de la psychologie au XXe siècle », Les Sciences de l’éducation, Vol.3, n°4, p. 21-38.

ZENATTI Arlette, Perception et intelligence musicales chez l’enfan, Université Paris X-Nanterre, Paris, 1967.

ZENATTI Arlette, Psychologie de la musique, Paris, Presses universitaires de France, 1994.

ZENATTI Arlette. « Aspects du développement musical de l’enfant dans l’Histoire de la psychologie au XXe siècle », in Education musicale et psychologie de la musique, Revue internationale Les sciences de l’éducation pour l’ère nouvelle n°6, CERSE, Université de Caen, 1990, p. 35-36.

ZURCHER Pierre, Le développement musical de l’enfant : les quatre temps de la musique, Paris, L’Harmattan, 2010.

Sites internet Consultés

http://affairesjuridiques.aphp.fr/textes/arrete-du-23-avril-2012-relatif-a-lorganisation-du-depistage-de-la-surdite-permanente-neonatale/, consulté le 15 juillet 2019.

http://clam-project.org, consulté le 16 juillet 2019.

http://logiciels.pierrecouprie.fr, consulté le 2 juin 2019.

http://marsyas.info, consulté le 12 juillet 2019.

http://psysound.wikidot.com, consulté le 12 juillet 2019.

http://www.biap.org/biapfrancais.html, consulté le 11 mai 2014. http://www.biap.org/en/component/content/article/66-recommendations/ct-6–hearing-aid/12-biap-recommendation-nd-068–prosthetic-fitting-procedure-for-hearing-impaired-child, consulté le 11 mai 2014.

http://www.sonicvisualiser.org, consulté le 12 avril 2019. https://www.cisic.fr/CISIC/media/doccisic/synthese_questionnaire_cisic2012.pdf, consulté le 2 février 2014.

https://www.diplomatie.gouv.fr/IMG/pdf/la_surdite_de_l_enfant_-_guide_pratique-inpes_cle01de4c.pdf, consulté le 16 juillet 2019.

https://www.franceculture.fr/emissions/une-vie-une-oeuvre/mark-rothko-1903-1970, consulté le 24/04/18.

https://www.irdp.ch/institut/coefficient-bravais-pearson-2041.html, consulté le 15 juin 2019. https://www.legifrance.gouv.fr/affichCodeArticle.do?idArticle=LEGIARTI000006524761&cidTexte=LEGITEXT000006071191&dateTexte=20050212, consulté le 5 janvier 2018.

https://www.ted.com/talks/evelyn_glennie_shows_how_to_listen, consulté le 10 mai 2014 et le 25 août 2019.

https://cycling74.com/downloads/#.VzxxgPmLSM8, consulté le 15 mai 2017.

http://www.musiquecontemporaine.fr/doc/index.php/spatialisation, consulté le 10 août 2019.

http://www.db-gersite.com/HISTOLOGIE/HISTGENE/index.html, consulté le 10 juillet 2019. https://medias.ircam.fr/embed/media/xfdefef_kammerkonzert-gyorgy-ligeti, consulté le 2 février 2018.

http://demeter.revue.univ-lille3.fr/lodel9/index.php?id=430, consulté le 12 décembre 2017.

http://www.universalis.fr/encyclopedie/atmospheres/, consulté le 18 février 2018

La texture en musique : sa contribution pour la composition, l’apprentissage de la musique et ses effets sur la perception musicale et la cognition des enfants sourds implantés.

Au cours de la deuxième moitié du XXe siècle, l’émergence de la notion de texture a ouvert de nouvelles perspectives en matière de composition et d’appréhension de la musique. Il apparaît aujourd’hui évident que cette notion est devenu un outil précieux et incontournable pour analyser la musique en dépassant les éléments classiques tels que la note, l’intervalle, le rythme, la mélodie, etc… La première partie sera consacrée à définir précisément cette notion, à analyser son usage dans le répertoire contemporain et à initier une réflexion sur son statut en musicologie. La deuxième partie abordera la question de la perception auditive chez les enfants sourds en s’appuyant sur des études comportementales. L’évaluation des habiletés perceptives des enfants sourds dans le domaine de la musique souffrant actuellement d’un manque d’outil, nous étudierons comment l’utilisation de la texture peut contribuer à enrichir nos pratiques pédagogiques actuelles chez les enfants, plus particulièrement chez les enfants sourds implantés.

The texture in music : its contribution for composition, learning of music and its effects on music perception and cognition of deaf children with cochlear implants.

In the second half of the 20th century, the emergence of the notion of texture created new perspectives in the field of composition and music understanding. Today, it is clear that this notion became a valuable and major tool to analyse music by exceeding classic elements such as note, interval, rhythm, melody, and so on. The first part will be dedicated to define exactly this notion, and to analyze its use in the contemporary repertory and to introduce some thougths on its status in musicology. The second part will approach the question of deaf children hearing perception based on behavioral studies. The evaluation of the perceptual skills of deaf children in the field of music suffering at present from a lack of tool, we shall study how the use of the texture can contribute to improve our current educational practices for chlidren, more particularly among deaf children with cochlear implant.

Mots clés : texture-perception musicale-surdité-composition-apprentissage-cognition.

Remerciements

Ce travail n’aurait pas pu voir le jour sans le soutien d’un grand nombre de personnes que je tiens à remercier ici.

Tout d’abord, un grand merci à toute l’équipe du CEOP, aux parents et aux enfants sourds et tout spécialement à Martial Franzoni qui m’a permis de vivre cette belle aventure et qui m’a accordé sa confiance. Un merci tout particulier pour la team de choc des Céopiennes qui ne m’a pas lâché, malgré les moments de doutes : Anne-Sophie, Élise, Julie, Sophie, Delphine, Sandra, Anne-Laure et Marta.

Merci à toute l’équipe du LEAD, que je côtoie de près ou de loin depuis… quelques années maintenant ! Tout spécialement Marion, Laura, Helle, Laure-Hélène, Stéphane. J’exprime également ma gratitude à tous les enfants dijonnais et à leur famille pour leur participation.

J’aimerais aussi remercier les institutions qui ont contribué à ce travail, le CHU de Dijon et le Pr. Alexis Borzog Grayeli ainsi que la société Advanced Bionics : un immense merci pour le soutien de Florian Sadreux et de Jean-Baptiste Delande.

Merci aux membres du jury qui ont accepté de consacrer du temps à lire et à commenter ce travail, et en particulier Barbara Tillmann et Grazia Giacco pour avoir accepté d’être les rapporteurs de cette thèse.

Toute ma gratitude va à mes deux directeurs. Philippe, je te remercie de m’avoir fait confiance, d’avoir accepté la direction de ma thèse et d’avoir su me guider depuis le début pour me mener jusqu’ici avec un engagement admirable. Merci, Emmanuel, pour ta grande expérience, ta bienveillance, tes remarques avisées et ta générosité qui m’ont permis de mener à bien ce beau projet. Mille mercis à tous les deux pour votre soutien scientifique et humain inconditionnel.

Un immense merci revient à mes amis chers pour leur constance, leur bienveillance et leur bonne humeur : Valentine, Anne-So, Émilie, Bruno, Christiane, Anne, Delphine et Élise. Un merci spécial aussi à Alban pour ton soutien essentiel de ces deux derniers mois !

Pour terminer, je n’aurai jamais réussi tout cela sans le soutien indéfectible de ma famille. Je remercie chaleureusement mon mari, Benoit, qui par son amour et sa patience a supporté pendant plus de six ans, mes contraintes journalières et mes absences liées à ma recherche, tout en sachant m’encourager durant les moments difficiles. Un immense merci à mes filles adorées, Juliette et Louise pour leur soutien et leur encouragement magnifiques.

Notes

LIGETI György, « Wandlungen der musikalischen Form », in Die Reihe n°7, Vienne, Universal Edition, 1960. Trad. Fr. : Neuf essais sur la musique, éditions Contrechamps, 2010. ↩︎
WILSON Peter Niklas, « Interkulturelle Fantasien: György Ligetis Klavieretüden Nr. 7 und 8 », Melos 51, 1992, p. 63–84. ↩︎
LESTER Joel, Analytic Approaches to Twentieth-Century Music, New York et Londres, W. W. Norton, 1989. ↩︎
Portail de la musique contemporaine, Spatialisation, http://www.musiquecontemporaine.fr/doc/index.php/spatialisation, consulté le 10 août 2019. ↩︎
MARQUET Françoise, Zao Wou-Ki, Autoportrait, Paris, éditions Fayard, 1988. ↩︎
DUFOURT Hugues, Musique, Pouvoir, Écriture, Paris, Christian Bourgois éditeur, coll. Musique/Passé/Présent, 1991, p. 302. ↩︎
MEYER Leonard B, Emotion and Meaning in Music, 1956, The University of Chicago Press, trad. française, Emotion et Signification en Musique, Arles, Actes Sud, 2011. ↩︎
LALITTE Philippe, « Texture et émergence perceptive en musique contemporaine », Texte, texture, textile. Variations sur le tissage dans la musique, les arts plastiques et la littérature, EUD, 2013, p. 125. ↩︎
BREGMAN Alfred S., Auditory scene analysis: The perceptual organization of sound, MIT Press/Bradford Books, Cambridge, Mass, 1990. ↩︎
KIRSCHNER Sebastian et TOMASELLO Michael, « Joint drumming: Social context facilitates synchronization in preschool children », Journal of Experimental Child Psychology, Vol. 102, p. 299-314. ↩︎
HERHOLZ Sibylle C. & ZATORRE Robert J., « Musical training as a framework for brain plasticity: behavior, function, and structure », Neuron, Vol. 76, 2012, p. 486-502. ↩︎
TILLMANN Barbara, « La musique au secours du langage. De l’étude des corrélats neuronaux vers des perspectives de réhabilitation », in PLATEL Hervé et THOMAS-ANTÉRION Catherine, Neuropsychologie et art, Paris, De Boeck-Solal, coll. « Neuropsychologie », 2014, p. 177-198. ↩︎
BIGAND Emmanuel, Les bienfaits de la musique sur le cerveau, Belin, coll. « Cerveau et bien-être », 2018. ↩︎
JACQUES-DALCROZE Emile, Notes bariolées, Genève, Edition Jeheber, 1948. ↩︎
https://www.ted.com/talks/evelyn_glennie_shows_how_to_listen, consulté le 10 mai 2014 et le 25 août 2019. ↩︎
RIEDELSHEIMER Thomas, Touch The Sound : un voyage sonore avec Evelyn Glennie, un documentaire germano-britannique réalisé en 2004. ↩︎
DÉSY PROULX Monique, Pourquoi la musique ? Son importance dans la vie des enfants, Montréal, Éditions du CHU Sainte-Justine, 2014, p. 19. ↩︎
GRAHAM Daniel J., MENG Ming, « Artistic representations: clues to efficient coding in human vision », Visual Neuroscience, Vol. 28, n°4, 2011, p. 371-379. ↩︎
MANFREDI Louise R., SAAL Hannes P., BROWN Kyler J., ZIELINSKI Mark C., DAMMANN III John F., POLASHOCK Vicky S. and BENSMAIA Sliman J., « Natural scenes in tactile texture », Journal Neurophysiology, Vol. 111, 2014, p. 1792-1802. ↩︎
SILK Joseph, Une brève histoire de l’univers. Paris. Odile Jacob, 2003, p. 226. ↩︎
BURGGRAEVE Adolphe, Anatomie de texture ou Histologie, appliquée à la physiologie et à la pathologie. Gand, Annoot-Braekman, 1845, p. 12. ↩︎
SARROUILHE Denis, FAVOT Laure, Histologie UE2, Ed. Ellypses « Entrainement intensif », 2018, p. 6. ↩︎
BALAS Daniel et PHILIP Patrick, Cours d’Histologie générale [en ligne], Université de Nice Sophia-Antipolis, http://www.db-gersite.com/HISTOLOGIE/HISTGENE/index.html ↩︎
DEMANGE Michel, Les Textures des roches cristallines, Aspects microscopiques. Presse des Mines, coll. Sciences de la Terre et de l’environnement, 2011, p. 9-39. ↩︎
SCHMID Stefan, « Textures of geological materials: computer model predictions versus empirical interpretations based on rock deformation experiments and field studies », in Textures of Geological Materials (Hans Joachim BUNGE et al.eds), DGM Verlag, p. 279-301. ↩︎
GUTHLEBEN Denis, « La cristallographie, de Platon à nos jours… ». CNRS Le Journal, n°256, février 2014, p. 66. ↩︎
BAUDIN Thierry, CHATEIGNER Daniel, ESLING Claude, LUTTEROTTI Luca et MORALES Magali, « Analyse des textures cristallographiques et des microstructures », Reflets de la physique, La Cristallographie, Sciences et Techniques, n° 44-45, 2015, p. 80-85. ↩︎
Ibid., p. 84. ↩︎
SZCZESNIAK Alina Surmacka, « Classification of textural characteristics », Journal of Food Science, Vol. 28, n°4, 1963, p. 385- 389. ↩︎
SZCZESNIAK Alina Surmacka, « Sensory texture profiling – historical and scientific perspectives », Food Technology, Vol. 52, n°8, 1998, p. 54-57. ↩︎
DANIEL Christine et ROUDOT Alain-Claude, « La terminologie de la texture des aliments », Érudit, Méta, Vol. 52, n°2, juin 2007, p. 343. ↩︎
VICKERS Zata & BOURNE Malcom C., « A psychoacoustical theory of crispness », Journal of Food Science, 1976, n°41, p. 1158-1164 ↩︎
BAGOT Jean Didier, Information, sensation et perception, Paris, Armand Colin. 1999. ↩︎
SCHER Joël, Rhéologie, texture et texturation des produits alimentaires, Journal Techniques de l’ingénieur Opérations unitaires du génie industriel alimentaire, 2006. ↩︎
SCHWARTZ Naomi Oshinsky, « Adaptation of the sensory texture profile method to skin care products », Journal of Texture Studies 6, 1975, p. 33-42. ↩︎
CIVILLE Gael Vance & DUS Clar A., « Evaluating tactile properties of skincare products: a descriptive analysis technique », Cosmetics and Toiletries 106, 1991, p. 83-88. ↩︎
DUBUISSON Pauline, « Influence de la phase grasse et des polymères naturels sur les paramètres physico-chimiques en lien avec la perception tactile de l’émulsion », Thèse de doctorat, Université du Havre, 2017. ↩︎
ATTIA Dhouha, « Segmentation d’images par combinaison adaptative couleur-texture et classification de pixels : Applications à la caractérisation de l’environnement de réception de signaux GNSS », Thèse de Doctorat, Université de Technologie de Belfort-Montbeliard, 2013. ↩︎
HARALICK Robert M., « Statistical and structural approaches to texture », Proceedings of the IEEE, Vol. 67, n°5, 1979, p. 787-804. ↩︎
TOMITA Fumiaki, SHIRAI Yoshiaki, TSUJI Saburo, « Description of textures bytructural analysis », IEEE PAMI, Vol. 4, n° 2, 1982. ↩︎
GAGALOWICZ André, « Vers un modèle de textures », Thèse d’état, Université Pierre et Marie Curie, 1983. ↩︎
BUREL Gilles, « Réseaux de neurones en traitement-Des Modèles théoriques aux Applications Industrielles », Thèse d’état, Université de Bretagne occidentale, 1991. ↩︎
BRODATZ Phil, Texture: a photographic album for artists and designers, New York, Dover Publications, 1966. ↩︎
FERNANDEZ-MALOIGNE Christine, MACAIRE Ludovic, ROBERT-INACIO Frédérique, Imagerie numérique, avancées et perspectives pour la couleur, Paris, Lavoisier, 2012, p. 227-234. ↩︎
FONTANILLE Jacques, Sémiotique du visible. Des mondes de lumière, Paris, P.U.F., 1995. ↩︎
BEYAERT Anne, « Texture, couleur, lumière et autres arrangements de la perception ». Protée, Vol .3, n°3, 2003, p. 81–90. ↩︎
RICHARD JOHNSON C., MESSIER Paul, SETHARES William A., KLEIN Andrew G., BROWN Christopher A., HOANG DO Anh, KLAUSMEYER Philip A., ABRY Patrice, JAFFARD Stéphane, WENDT Herwig, ROUX Stéphane, PUSTELNIK Nelly, VAN NOORD Nanne, VAN DER MAATEN Laurens, POSTMA Eric, CODDINGTON James, DAFFNER Lee Ann, MURATA Hanako, WILHELM Henry, WOOD Sally et MESSIER Mark, « Pursuing automated classification of historic photographic papers from raking light image ». Journal of the American Institute for Conservation, Vol. 53, n°3, 2014, p. 159-170. ↩︎
Ibid., p. 16. ↩︎
SAUSSURE Ferdinand de, Écrits de Linguistique générale, Texte établi et édité par S. Bouquet et R. Engler, Paris, Gallimard, 2002. ↩︎
RASTIER François, Le silence de Saussure ou l’ontologie refusée, éd. Bouquet, 2003, p. 24. ↩︎
ADAM Jean Michel, « Une alternative au « tout narratif » : les gradients de narrativité », Recherche en Communication, Vol. 7, 1997, p. 15. ↩︎
Ibid., p. 17 ↩︎
DERRIDA Jacques, La dissémination, Paris, Seuil, 1972, p. 263. ↩︎
MOULENDA Joseph Igor, « Par-delà le sens, l’écriture et le texte. Jacques Derrida », Controverses, Revue spécialisée de philosophie, ENS, Libreville, Editions Oudjat, 2016. ↩︎
DERRIDA Jacques, Marges de la philosophie, Paris, Minuit, 1972, p. 191. ↩︎
Ibid., MOULENDA J.I., p. 13. ↩︎
BORT Françoise, DUPONT Valérie, Texte, texture, textile, Variations sur le tissage dans la musique, les arts plastiques et la littérature, Editions universitaires de Dijon, 2013, extrait de la présentation de l’éditeur. ↩︎
Ibid., p. 14. ↩︎
LE GOUIC Jean-Claude, « Sheila Hicks, Cheminements en sensualités textiles », Textile art revue, mars 2018. ↩︎
ORSENNA Erik, Voyage Aux Pays du Coton : Petit Précis de la Mondialisation, Paris, Fayard, 2006, p. 17. ↩︎
Dossier de presse : « Sheila Hicks au festival d’Automne », propos recueillis par Clément Dirié, juin 2016. ↩︎
KANDINSKY Vassily, Du spirituel dans l’art dans la peinture en particulier, trad. Française de P. Volboudt, Paris, Denoël-Gonthier, 1969 (1954), p. 96 ; Ecrits complets, La synthèse des arts, édition établie par P. Sers, Paris, Denoël-Gonthier, 1975, p. 206. Nous nous référons également à l’article écrit par Anne Beyaert-Geslin, « Modernité et synesthésies », dans VISIBLE, n°1, La diversité sensible, PULIM, 2006, p. 25-36. ↩︎
MAURIAL Sandrine, « États de couleur entre pigment-matière et pixel-lumière », Traitement du signal, Vol. 21, numéro spécial L’image numérique couleur, 2004, p. 373-384. ↩︎
DUTILLEUX Henri, Le Nouvel Observateur, rubrique « Le Musée égoïste », octobre 1984, reproduit dans la note de programme du concert de l’Orchestre de Paris, 1er et 2 juillet 1995, Cité de la Musique. ↩︎
DUTILLEUX Henri, Constellations : entretiens / Henri Dutilleux, Martine Cadieu, avant-propos de Jean Roy. Paris,
M. de Maule, 2007. ↩︎
BEYAERT Anne, « Texture, couleur, lumière et autres arrangements de la perception. » Protée, Vol. 31, n°3, 2003, p. 81–90. ↩︎
SAINT-MARTIN Fernande, Sémiologie du langage visuel, Sillery, Presses de l’Université du Québec, 1987, p. 68. ↩︎
Groupe μ, Traité du signe visuel. Pour une rhétorique de l’image, Paris, Le Seuil, 1992, p. 70. ↩︎
ROSENBERG Harold, « Les peintres d’action américains » (1952), in Charles Harrison et Paul Wood (ed.), Art en théorie 1900-1990, Hazan, 1997 pour la traduction française, p. 644. ↩︎
GREENBERG Clement, Modernist Painting, Washington, D.C., in Forum Lectures (Voice of America), 1960 ↩︎
BEYAERT Anne, « De la texture à la matière », Protée, Vol. 36, n°2, 2008, p. 104. ↩︎
Ibid., p. 103. ↩︎
Ibid., p. 101. ↩︎
DUBUFFET Jean, L’Homme du commun à l’ouvrage, Paris, Gallimard, 1973, p. 25. ↩︎
MESSENGER Thomas, « Texture and Form in the Masses of Fayrfax », Journal of the American Musicological Society, Vol. 24, n° 2, 1971, p. 282-286. « Fayrfax mess composed during the first twenty years of the sixteenth century, show a remarkably sophisticated treatment of texture /colour units which is of vital importance to a true understanding of their four-movement structure. » ↩︎
SADIE Stanley and TYRELL John, The New Grove Dictionnary of Music and Musicians, Vol XVIII, Oxford University Press, 1980, p.709. ↩︎
BENWARD Bruce & SAKER Marilyn, Music: In Theory and Practice, Vol. I. Seventh Edition, McGraw-Hill, New York, 2003, p.131. « In music, texture is the way the melodic, rhythmic and harmonic materials are combined in a composition ». ↩︎
Op. cit., p. 31. ↩︎
Benward & Saker, op. cit., p. 147. ↩︎
Op. cit., p. 148 ↩︎
LESTER Joel, Analytic Approaches to Twentieth-Century Music, op. cit., p. 89. ↩︎
DYSON George, « The Texture of Modern Music », Oxford University Press, Music & Letters, Vol. 4, n° 2, 1923, p. 107-118. ↩︎
STARR Lawrence, « Melody-Accompaniment Textures in the Music of Bartók, as Seen in His Mikrokosmos », University of California Press, The Journal of Musicology, Vol. 4, n° 1, 1985-1986, p. 91-104. ↩︎
PISTON Walter, Orchestration, London, Victor Gollancz, 1955. ↩︎
BERRY Wallace, Structural Functions in Music (1976), 2de édition, Dover, Mineola, 1987, p. 184. ↩︎
BOSSEUR Jean-Yves, « Texture et matériau dans la pensée musicale contemporaine », Analyse Musicale n°38, Paris, février 2001. ↩︎
BERRY, Op. cit., p. 192. ↩︎
ROSEN Charles, Arnold Schœnberg, Chicago, The University Press of Chicago, 1975; trad. fr.: Shoenberg, Paris, Minuit, 1979, p. 52. ↩︎
KANDINSKY Vassily, Du spirituel dans l’art et dans la peinture en particulier, éd. établie et présentée par Philippe Sers, Paris, Denoël, Gallimard, « Folio Essais », trad. de l’allemand par Nicole Debrand, trad. du russe par Bernadette Du Crest, 1989, p. 110. ↩︎
LAVIGNE Emma et HORVATH Anne, Dossier de Presse Musicircus, œuvres phares du Centre Pompidou/Musée National d’Art Moderne, 20/04/16-17/07/17, p. 4. ↩︎
Ibid., p. 6. ↩︎
JUNOD Philippe, Contrepoints. Dialogues entre musique et peinture, Genève, Contrechamps, 2006, p. 66-106. ↩︎
VALLIER Dora, « La rencontre Schoenberg-Kandinsky : Musique ⇆ Peinture », in Schoenberg-Kandinsky. Correspondance, écrits : Revue Contrechamps n° 2, Genève : Éditions Contrechamps, 1984, p. 143-153. ↩︎
ALBÈRA Philippe, À propos de « Die glückliche Hand », in Schoenberg-Kandinsky, Correspondance, écrits : Revue Contrechamps, n° 2, Genève : Éditions Contrechamps, 1984, p. 156-166. ↩︎
Note de programme publiée par Denis Herlin et citée par Jean-Michel Nectoux dans Harmonie en bleu et or : Debussy, la musique et les arts, Paris, Fayard, 2005. ↩︎
DEBUSSY Claude, Monsieur Croche et autres écrits, Paris, Gallimard, ([1971]1987), p. 325. ↩︎
BOULEZ Pierre, Point de repère, I, Imaginer, Paris : Christian Bourgeois, 1995, p. 77. ↩︎
BOULEZ Pierre, Point de repère III. Leçon de musique. Paris : Christian Bourgois. 1995, p. 265. ↩︎
FENEYROU Laurent, Debussy au miroir des écrits de Boulez. Delatour France, Goldman, Nicolas, Nattiez. La Pensée de Pierre Boulez à travers ses écrits, 2010, p. 161-176. ↩︎
EIMERT Herbert, « Debussys Jeux », Die Reihe, n°5, 1959, p. 7-8. ↩︎
BOULEZ Pierre, Le pays fertile : Paul Klee, texte préparé et présenté par Paule Thévenin, Paris, Gallimard, 1989. ↩︎
PIENCIKOWSKI Robert, Note de programme pour Structures pour deux pianos, premier livre [archive], sur le site de l’IRCAM. ↩︎
LIGETI György, « Pierre Boulez : Structure and Automatism in Structure la » in Die Reihe n° 4, 1958, trad. fr. « Décision et automatisme dans la Structure Ia de Pierre Boulez », in Neuf essai sur la musique, Genève, Editions Contrechamps, 2001, p. 89-126. ↩︎
BOULEZ Pierre, Penser la musique aujourd’hui, Denoël Gonthier, Paris, 1963. ↩︎
Le pays fertile, op.cit., p. 75. ↩︎
LALITTE Philippe, « Texture et émergence perceptive en musique contemporaine », op. cit. p. 121-133. ↩︎
LIGETI György, « Décision et automatisme dans la Structure Ia de Pierre Boulez », op. cit., p. 125. ↩︎
MICHEL Pierre, « György Ligeti : Kammerkonzert pour 13 instrumentistes (1969-70) », Analyse musicale, n°34, 1999, p. 31-51. ↩︎
GARRIGUES Juliette, ATMOSPHÈRES (G. Ligeti), Encyclopædia Universalis [en ligne], consulté le 18 février 2018. URL : http://www.universalis.fr/encyclopedie/atmospheres/ ↩︎
MICHEL Pierre, György Ligeti, Paris, Minerve, deuxième édition revue et complétée, 1995, p. 72. ↩︎
CHEMILLIER Marc, « György Ligeti et la logique des textures », Analyse musicale n°38, 2001, p. 75-85. ↩︎
DELIEGE Célestin, Cinquante ans de modernité musicale : De Darmstadt àl’IRCAM, contribution historiographique à une musicologie critique, Bruxelles, Editions Mardaga, 2003, p. 145. ↩︎
FELDMAN Morton, Écrits et paroles, précédés d’une monographie de Jean-Yves Bosseur, Paris, L’Harmattan, 1998, p. 210. ↩︎
Op. cit., p. 65. ↩︎
SAFATLE Vladimir, « Morton Feldman comme critique de l’idéologie : expression et politique dans Rothko Chapel », in Kogler, S. et Olive, J-P. (dir), Expression et geste musical, Éditions L’Harmattan, Paris, 2013. ↩︎
ISHAGHPOUR Youssef, Rothko, une absence d’image : lumière de la couleur. Tours : Éditions Léo Scheer, 2003, p. 10-11. ↩︎
https://www.franceculture.fr/emissions/une-vie-une-oeuvre/mark-rothko-1903-1970, consulté le 24/04/18. ↩︎
DELAPLACE Joseph, « Rothko Chapel de Morton Feldman : approches analytiques d’une « procession immobile » », Déméter, Centre d’étude des arts contemporains, Université Lille 3, 2015. : http://demeter.revue.univ-lille3.fr/lodel9/index.php?id=430 ↩︎
ASHTON Dore, About Mark Rothko, Oxford University Press, 1983 (réed. 1996 et 2003), p. 170. ↩︎
JOHNSON Steven, « Rothko Chapel and Rothko’s Chapel », Perspectives of New Music, Vol. 32, n^o. 2, 1994, p. 11. ↩︎
BRESLIN James E. B, Mark Rothko: a biography, Chicago: University of Chicago Press, 1993, p. 480. ↩︎
Op. cit., p. 11. ↩︎
FELDMAN Morton, op. cit., p. 81. ↩︎
Ibid., p. 81. ↩︎
ROSS Alex, The Rest is Noise : A l’écoute du XXe siècle, la modernité en musique, Acte Sud, 2010, p. 673. ↩︎
Ibid., p. 649 ↩︎
KOKORAS Panayiotis, Auditory Fusion and Holophonic Musical Texture in Xenakis’s Pithoprakta. Athènes, 2014. ↩︎
BREGMAN Albert S., Auditory scene analysis, op. cit. ↩︎
MCADAMS Steve, « Spectral fusion and the creation of auditory images », in Manfred Clynes (ed.) Music, Mind, and Brain, 1982, p. 279-298. ↩︎
SOLOMOS Makis, « Pour une filiation Xenakis-Grisey? », Makis Solomos, in Makis Solomos (éd.), Iannis Xenakis, Gérard Grisey. La métaphore lumineuse, L’Harmattan, 2003, p. 167. ↩︎
XENAKIS Iannis, « Provlimata ellinikis mousikis synthesis (Problèmes de composition musicale grecque) », Epitheorisi technis n°9, Athènes, 1955, p. 185-189. Traduction française dans Présences de / Presences of Iannis Xenakis, éd. par Makis SOLOMOS, Paris, Cdmc, 2001, p. 12. ↩︎
SOLOMOS Makis, De la musique au son. L’émergence du son dans la musique des XX^e et XXI^e siècles, Rennes, Presses Universitaires de Rennes, 2013, p. 354. ↩︎
BARTHEL-CALVET Anne-Sylvie « De la dispersion à la fusion sonore : écriture et perception des textures xenakiennes », Analyse Musicale, Vol. 38, Paris, 2001, p. 86-96. ↩︎
MORGAN Robert. P., Twentieth-Century Music: a history of musical style in modern Europe and America, New York: Norton, 1991. ↩︎
SMITH-BRINDLE Reginald, Serial Composition, Oxford University Press, 1966, p. 136 ↩︎
DUNSBY Jonathan, « Considerations of Textures », Oxford University Press, Music & Letters, Vol. 70, N° 1 (Feb., 1989), p. 51. « Lewis Rowell writes about the distinction between focus and interplay, between economy and saturation, between the thin and the dense, between the smooth and the rough, in which can be discerned the etymology of the musical term ‘texture’ in the physical term. » ↩︎
ROWELL Lewis, Thinking About Music: An Introduction to the Philosophy of Music, The University of Massachusetts (Amherst, 1983), p. 158. « By texture we mean the weave of the music, whether we conceive/perceive it as an aesthetic surface or as the warp (pitch, the vertical axis simultaneity) and woof (time, the horizontal axis, sequence) of the musical fabric. » ↩︎
ERICKSON Robert, Sound Structure in Music, Berkeley, University of California Press, 1975, p. 139.
« Texture always denotes some overall quality, the feel of surfaces, the weave of fabrics, the look of things. Words from visual and tactile sense modalities are often appropriated for descriptions of sounds and their combination: sharp, rough, dull, smooth, biting, bright, brilliant, brittle, coarse, thick, thin, dry, diaphanous, airy, finespun, flaccid, fluid, gauzy, glittery, grainy, harsh, hazy, heavy, icy, inchoate, jagged, limpid, liquescent, lush, mild, murky, pliant, relaxed, rippling… » ↩︎
STRIZICH Robert, « Texture in post-World War II music », Ex Tempore: A journal of compositional and theoretical research in music, vol. 5, n. 2, 1991, p. 1-28. « In my opinion, our traditional concepts, definitions and terms are inadequate for the discussion and analysis of new textures in post-World War II music. Indeed, much music written since 1945 is quite beyond the grasp of standard analytical terminology, chiefly because so many of these works make exclusive use of textures and textural procedures that depart significantly from conventional practices. » ↩︎
BRACKETT David, Interpreting Popular Music (Berkeley: University of California Press, 2000). John R. Covach et Graeme M. Boone, Understanding Rock: Essays in Musical Analysis (New York: Oxford University Press, 1997). ↩︎
TAGG Philip, Kojak: 50 Seconds of Television Music – Towards the Analysis of Affect in Popular Music. Götenborg: Skrifter från Musikvetenskapliga institutionen, 1979. ↩︎
MIDDLETON Richard, « Play it Again Sam: Some Notes on the Productivity of Repetition in Popular Music », Popular Music, Vol. 3, 1983, p. 235-270. ↩︎
LACASSE Serge, « Listen to My Voice »: The Evocative Power of Vocal Staging in Recorded Rock Music and Other Forms of Vocal Expression. Thèse de doctorat, Université de Liverpool, 2000. ↩︎
MIDDLETON Richard, « L’étude des musiques populaires », in Musiques, Vol. 2, Savoirs musicaux sous la direction de Jean-Jacques Nattiez, Paris, Actes Sud/Cité de la musique, 2004, p. 771. ↩︎
ZAK III Albin, I Don’t Sound Like Nobody, Remaking Music in 1950s America, University of Michigan Press, 2010. ↩︎
ZAK III Albin, The poetics of rock; California UP, 2001. ↩︎
ZAGORSKI-THOMAS Simon, « The Musicology of Record Production », Twentieth-Century Music Vol. 4, n°2, Boston: Cambridge, 2007, p. 193. Traduction personnelle : « Changes in technology can impact on the character of recorded sound in a number of ways. For instance, a series of incremental changes in a particular type of product may generate a wider palette of sonic options, one example being the development of microphone technology or dynamic compressors over many years ». ↩︎
MOORE Allan F. et DOCKWRAY Ruth, « Configuring the Sound-Box 1965-1972 », Popular Music, Vol. 29, n° 2, 2010, p. 181-197. ↩︎
LEVIN Judikael et BOSSIS Bruno, « Les descripteurs audio au service de l’analyse comparée des canaux stéréophoniques dans les musiques populaires », https://jim2019.sciencesconf.org/data/pages/LevinBossis.pdf ↩︎
MOORE Allan F., Rock: The Primary Text: Developing a Musicology of Rock, Aldershot, Ashgate, 2004, p. 34-35. ↩︎
MOORE Allan F. et DOCKWRAY Ruth, « Configuring the Sound-Box 1965-1972 », op.cit., p. 189. ↩︎
MOYLAN William, The Art of Record Production: The Creative Resources of Music Production and Audio, 1ère édition (New York: Van Nostrand Reinhold, 1992). ↩︎
LACASSE Serge, « Composition, performance, phonographie : Un malentendu ontologique en analyse musicale ? » dans Groove : Enquête sur les phénomènes musicaux contemporains, sous la direction de Serge Lacasse et Patrick Roy, Québec : Presses de l’Université Laval, 2006, p. 65-78. ↩︎
BERRY Wallace, Structural Functions in Music, op.cit. (1976). ↩︎
MCADAMS Stephen & BIGAND Emmanuel, Penser les sons, Psychologie cognitive de la musique, Presses Universitaires de France, 1994 ↩︎
BREGMAN Alfred S., Auditory scene analysis: The perceptual organization of sound, MIT Press/Bradford Books, Cambridge, Mass, 1990. ↩︎
MCADAMS Stephen, Perception et cognition de la musique. Paris, Vrin, 2015 ↩︎
JONES Mari Riess & YEE William, « L’attention aux évènements auditifs : le rôle de l’organisation temporelle », in Penser les sons, op. cit., p. 84. ↩︎
BIGAND Emmanuel, « The influence of implicit harmony, rhythm and musical training on the abstraction of tension-relaxation schemas in tonal music phrases », Contempory Music Review, Vol. 9, 1993, p. 123-137. ↩︎
BIGAND Emmanuel, Musiciens et non-musiciens perçoivent-ils la musique différemment ? Le Cerveau Musicien, Paris : De Boeck University, 2006. ↩︎
BIGAND Emmanuel, L’émotion dans le langage musical, in Parole et Musique : Aux origines du dialogue humain sous la direction de Stanislas Dehaene et Christine Petit, Odile Jacob, 2009, p. 343-357. ↩︎
BIGAND Emmanuel, PARNCUTT Richard, LERDHAL Fred, « Perception of musical tension in short chord sequences: the influence of harmonic function, sensory dissonance, horizontal motion, and musical training », Perception and Psychophysics, Vol. 58, n°1, 1996, p. 125-141. ↩︎
WERTHEIMER Max, « Experimentelle Studien über das Sehen von Bewegung », Zeitschrift für Psychologie, 61, 1912, p. 161-265. ↩︎
KOFFKA Kurt, Principles of Gestalt psychology, New York: Harcourt Brace, 1935. ↩︎
KÖHLER Wolfgang, Die physischen Gestalten in Ruhe und im stationären Zustand, Erlangen: Verlag der Philosophischen Akademie, 1920. ↩︎
EHRENFELS Chritian von, « Über Gestaltqualitäten ». Vierteljahresschrift für wissenschaftliche Philosophie, 14, 1890-1922, p. 249-292. ↩︎
GUILLAUME Paul, La psychologie de la forme, Paris, Flammarion, 1937. ↩︎
MERLEAU-PONTY Maurice, La structure du comportement. Paris, PUF, 1942, p. 143. ↩︎
GAPENNE Olivier et ROVIRA Katia, « Psychologie et cognition sans langage. Actualité d’une figure historique », Intellectica, 1999/1, n° 28, p. 229-250 ↩︎
BONNET Claude, « La perception visuelle des formes », in C. Bonnet, R. Ghiglione, J.F. Richard (éd), Traité de psychologie cognitive, Vol. 1, Perception, Action, Langage. Paris, Dunod, 2002, p. 67. ↩︎
BREGMAN, Auditory scene analysis: The perceptual organization of sound, op. cit., 1990. ↩︎
TRAINOR Laurel J., « The origins of music in auditory scene analysis and the roles of evolution and culture in musical creation », Phil. Trans. R. Soc. B, 2016, n° 370. ↩︎
CHERRY Edward Colin & TAYLOR, W. K., « Some experiments on the recognition of speech, with one and two ears», Journal of the Acoustic Society of America, Vol. 26, 1953, p. 554-559. ↩︎
HELMHOLTZ Hermann von (1877), On the sensations of tone (English translation A.J. Ellis, 1954), New York, Dover ; traduction française, Théorie physiologique de la musique, fondée sur l’étude des sensations auditives. Trad. par Georges GUEROULT et Auguste Desiré Bernard WOLFF, Paris, Masson et fils, 1868. ↩︎
DEUTSCH Diana, Psychologie de la musique, PUF, 1994, p. 117. ↩︎
WRIGHT James K. et BREGMAN Alfred S., « Auditory stream segregation and the control of dissonance in polyphonic music », Contemporary Music Review, Vol. 2, n°1, 1987, p 63-92. ↩︎
MCADAMS Stephen, Perception et cognition de la musique. Paris, Vrin, 2015, p. 29. ↩︎
BREGMAN Alfred S., Auditory scene analysis: The perceptual organization of sound, op. cit. ↩︎
BREGMAN Alfred S., « L’analyse des scènes auditives : l’audition dans des environnements complexes », McADAMS Stephen et BIGAND Emmanuel, éd., Penser les sons, psychologie cognitive de l’audition, Paris, Presses universitaires de France, 1994, p. 12. ↩︎
MCADAMS Stephen, « La reconnaissance de sources et d’événements sonores », in S. McAdams et E. Bigand (éd.), Penser les sons : La psychologie auditive de l’audition, Paris, PUF, 1994, p. 157-213. ↩︎
LALITTE Philippe, Contribution de l’analyse de scène auditive à l’analyse de la performance. IXe congrès européen d’Analyse musicale (CEAM – Euromac 9) / 9th European Music Analysis Conference, Juin 2017, Strasbourg, France. ↩︎
PAQUIER Mathieu, « Traitement du bruit et de la parole par le système auditif chez l’entendant et le déficient auditif », Les Cahiers de l’Audition, Vol. 26, 2013, p. 19. ↩︎
RENARD Christian et AZÉMA Bernard, Précis d’Audioprothèse, Production, phonétique acoustique et perception de la parole, Elsevier Masson, Chapitre 5 – Données fréquentielles et temporelles de la perception de la parole, 2005, p. 291. ↩︎
Op. cit., LALITTE Philippe, « Contribution de l’analyse de scène auditive à l’analyse de la performance. » ↩︎
GRIMAULT Nicolas, BACON Sid P., MICHEYL Christophe, «Auditory stream segregation on the basis of amplitude-modulation rate », Journal of the Acoustical Society of America, Vol. 111, 2002, p. 1340-1348. ↩︎
BREGMAN Alfred S. & CAMPBELL Jeffrey, « Primary auditory stream segregation and perception of order in rapid sequences of tones », Journal of Experimental Psychology, Vol. 89, n°2, 1971, p. 244-249. ↩︎
MCADAMS Stephen, Perception et cognition de la musique, op. cit. ↩︎
GOODCHILD Meghan et MCADAMS Stephen, « Perceptual Processes in Orchestration », in The Oxford Handbook of Timbre, Oxford University Press, 2018. ↩︎
Op. cit., MCADAMS Stephen, p. 46. ↩︎
BREGMAN Albert S. et PINKER Steven, « Auditory Streaming and the Building of Timbre », Canadian Journal of Psychology, vol. 32, 1978, p. 19-31. ↩︎
Op. cit., WRIGHT James K. et BREGMAN Alfred S., p. 68. ↩︎
Op. cit., MEYER Leonard B, Emotion and Meaning in Music, 1956. ↩︎
Ibid., p. 55. ↩︎
KURTH Ernst, Musikpsychologie. Berlin, Max Hesse, 1931, 2e éd. 1947. ↩︎
LELEU Jean-Louis, La construction de l’idée musicale : Essais sur Webern, Debussy et Boulez, éditions Contrechamps, 2015, p. 101-111. ↩︎
KURTH Ernst, Selected Writings (sous la dir. de I. Bent), Cambridge, Cambridge University Press, 2006. ↩︎
Ibid., p. 91. ↩︎
BACHELARD Gaston, La dialectique de la durée, Paris, PUF, 1950, p. 116. ↩︎
MEYER Leonard B., 1956, op. cit., p. 222-234. ↩︎
Ibid., p. 223. ↩︎
TENNEY James et POLANSKY Larry, «Temporal gestalt perception in music», Journal of Music Theory, XXIV, n° 2, 1980, p. 205-241. ↩︎
NATTIEZ Jean-Jacques, « Varèse’s Density 21.5: A study in semiological analysis », Music Analysis, n° 1, 1982, p. 243-340. ↩︎
Ibid., TENNEY and POLANSKY, p. 208: « The perceptual formation of TGs at any hierarchical level is determined by a number of factors of cohesion and segregation, the most important of which are proximity and similarity. » ↩︎
DEUTSCH Diana, « Grouping mechanisms in music », in D. Deutsch (Ed.). The Psychology of Music, 1982, p. 99-134, New York, Academic Press. The processing of pitch combinations, in D. Deutsch (Ed.). The Psychology of Music, p. 271-316. ↩︎
DELIEGE Célestin, Invention musicale et idéologie 2, Mutations historiques et lectures critiques de la modernité, Bruxelles, Editions Mardaga, 2007, p. 124. ↩︎
LERDAHL Fred, JACKENDOFF Ray, A Generative Theory of Tonal Music. Cambridge, MIT Press, 1983, p. 37-68. ↩︎
SCHENKER Heinrich, L’Écriture Libre (1935), Seconde édition revue et adaptée par Oswald Jonas. Trad. De l’allemand par N. Meeùs. Titre Original : Der freie Satz (Neue musikalische Theorien und Phantasien, vol. 3). Liège, Mardaga, 1993. ↩︎
BIGAND Emmanuel, « Contribution de la musique aux recherches sur la cognition auditive humaine », in S. McAdams et E. Bigand (éd.), Penser les sons : La psychologie auditive de l’audition, Paris, PUF, 1994, p. 267. ↩︎
BIGAND Emmanuel, « Traveling through Lerdahl’s Tonal Pitch Space Theory: A psychological perspective », Musicae Scientae, Vol. 7, n°1, 2003, p. 121-155. ↩︎
DELIEGE Irène, « Grouping conditions in listening to music: An approach to Lerdahl & Jackendoff’s grouping preference rules », Music Perception, n° 4, 1987, p. 325-359. ↩︎
CLARKE Eric F. et KRUMHANSL Carol L., « Perceiving Musical rime », Music Perception, Vol. 7, 1990, p. 213-253. ↩︎
SLOBODA John Anthony, « Cognition and real music: the psychology of music comes of age », Psychologica Belgica, Vol. 26, 1986, p. 199-219. ↩︎
Op. cit., p. 10. ↩︎
NARMOUR Eugene, The analysis and cognition of basic melodic structures: the implication-realisation model, Chicago, University of Chicago Press, 1992, p. 431. ↩︎
KRUMHANSL Carol L., « Effects of musical context on similarity and expectancy », Systematische Musikwissenschaft, Vol. 3, n°2, 1995, p. 211-250. ↩︎
SCHELLENBERG E. Glenn, « Expectancy in melody: Tests of the implication-realization model », Cognition, Vol. 58, 1996, p. 75-125. ↩︎
SCHELLENBERG E. Glenn, « Simplifying the implication-realization model of melodic expectancy », Music Perception: An Interdisciplinary Journal, Vol. 14, n°3, 1997, p. 295-318. ↩︎
SCHELLENBERG E. Glenn, ADACHI Mayumi, PURDY Kelly T. & McKINNON Margaret C., « Expectancy in Melody: Tests of Children and Adults », Journal of Experimental Psychology: General, Vol. 131, 2002, p. 511-537. ↩︎
MARGULIS Elizabeth Hellmuth, « A model of melodic expectation », Music Perception: An Interdisciplinary Journal, Vol. 22, n°4, 2005, p. 663-714. ↩︎
PEARCE Marcus T. & WIGGINS Geraint A., « Expectation in melody: The influence of context and learning », Music Perception: An Interdisciplinary Journal, Vol. 23, n°5, 2006, p. 377-405. ↩︎
BREGMAN Alfred S., Auditory scene analysis: The perceptual organization of sound, op. cit. p. 457. ↩︎
HURON David, « Voice Denumerability in Polyphonic Music of Homogeneous Timbres », Music Perception, Vol. 6, n° 4, 1989, p. 361-382. ↩︎
HURON David, Voice leading, The Science behind a Musical Art, Cambridge, MIT Press, 2016. ↩︎
REICH Steve, « Music as a gradual process », in Writings on music 1965-2000. New-York, Oxford University Press, 2002, p. 34-36. ↩︎
REICH Steve, Différentes phases, Paris, Cité de la musique-Philharmonie de Paris, 2016, p. 39. ↩︎
Op. cit., REICH Steve, Music as a gradual process. ↩︎
LALITTE Philippe, « Temporalité et texture dans « Eight Lines » de Steve Reich : de la perception locale à la forme expérientielle. » Musicologies nouvelles, Éditions Musicales Lugdivine 2017, Les temps de la musique (thèmes Agrégation 2018) 4, p. 66-76. ↩︎
Ibid., LALITTE Philippe. ↩︎
Op. cit., BREGMAN Alfred S, 1990. ↩︎
Op. cit., LALITTE Philippe. ↩︎
Diana DEUTSCH. « La perception des structures musicales ». In Psychologie de la musique, sous la direction d’Arlette Zenatti. Paris, Presses Universitaires de France, 1994, p. 118. ↩︎
Op. cit., LALITTE Philippe, p. 68. ↩︎
FRAISSE Paul, Psychologie du temps, Paris, Presses Universitaires de France, 1957. ↩︎
REICH Steve, Écrits et entretiens sur la musique, Christian Bourgeois éditeur, Paris, 1981, p. 129-130. ↩︎
HURON David, 2016, op. cit., p. 263. ↩︎
HURON David, « On the Role of Embellishment Tones in the Perceptual Segregation of Concurrent Musical Parts », Empirical Musicology Review, Vol. 2, n°4, 2007, p. 123-39. ↩︎
DIVENYI Pierre L. and OLIVER Susan K., « Resolution of Steady State Sounds in Simulated Auditory Space », The Journal of the Acoustical Society of America, Vol. 85, n°5, 1989, p. 2042-52. ↩︎
BERNARDES Gilberto, « David Huron, Voice Leading: The Science Behind a Musical Art », Portuguese Journal of Musicology, Vol. 4, n°1, 2017, p. 219-226. ↩︎
LALITTE Philippe, « Le spectre d’une voix, analyse de L’esprit des dunes de Tristan Murail. » In Szendy P. (Eds.), Tristan Murail, Paris, L’Harmattan/Ircam-Centre Georges Pompidou, 2002, p. 59-102. ↩︎
Ibid., p. 70. ↩︎
WOSZCZYK Wieslaw, BREGMAN Albert S., « Creating mixtures: The application of auditory scene analysis (ASA) to audio recording », Audio anecdotes, AK Peters, 2005. ↩︎
Ibid., p. 15. « the sequential grouping of sounds is affected by their timbres; this means that the ear will be more easily able to follow the same instrument or voice over time, if it has a unique timbre. There are two ways in which timbre might affect perception: (a) by providing features that the listener can track voluntarily over time; and (b) by influencing the automatic, bottom-up grouping of the sounds in a sequence. It is by no means certain that every feature that permits voluntary tracking is also a basis for automatic sequential grouping. » (traduction personnelle) ↩︎
Ibid., p. 17. ↩︎
BREGMAN Albert S. et MCADAMS Stephen, « Hearing Musical Streams », Computer Music Journal, Vol. 3, n° 4, 1979, p. 26-43. ↩︎
MOYLAN William, Understanding and Crafting the Mix: The Art of Recording, 2^e édition, Cambridge (Mass.), MIT Press, 2002. ↩︎
MOYLAN William, The Art of Record Production: The Creative Resources of Music Production and Audio, 1ère édition New York: Van Nostrand Reinhold, 1992. ↩︎
YOST William A., Fundamentals of Hearing: An Introduction, 5e éd., San Diego, Brill Academic Press, 2006. ↩︎
MAMASSIAN Pascal et LE CORRE François, « Des illusions dans tous les sens », L’Essentiel Cerveau et Psycho n° 12, novembre 2012-janvier 2013. ↩︎
MILLER George A. et LICKLIDER Joseph C. R., « The intelligibility of interrupted speech », Journal of the Acoustical Society of America, n° 22, 1950, p. 167-173. ↩︎
WARREN Richard M. et WARREN Roslyn P., « Auditory Illusions and Confusions », Scientific American, vol. CCXXIII, n° 6, décembre 1970, p. 30-36. ↩︎
MATHEWS Max, « The digital computer as a musical instrument. », Science, New Series, Vol. 142, No. 3592 (1963), p. 553-557. ↩︎
FERON François-Xavier, « Propositions pour une typologie des phénomènes sonores insolites. » Hybrid. Revue des arts et médiations humaines, Labex Arts H2H/Presses Universitaires de Vincennes, 2015, Réalités de l’illusion. ↩︎
RISSET Jean-Claude, « Composer le son : expériences avec l’ordinateur, 1964-1989 », Contrechamps n° 11, « Musiques électroniques », 1990, p. 112. ↩︎
DELAPLACE Joseph, György Ligeti. Un essai d’analyse et d’esthétique musicales, Rennes, Presses universitaires de Rennes, 2007, p. 131. ↩︎
MICHEL Pierre, György Ligeti, compositeur d’aujourd’hui, Paris, Minerve, 1985, p. 60-61. ↩︎
FERON François-Xavier, « L’art du Trompe-l’oreille rythmique », Intermédialités : histoire et théorie des arts, des lettres et des techniques, n° 16, Rythmer/Rhythmize, 2010, p. 145- 165. ↩︎
↩︎
CAMBOUROPOULOS Emilios et TSOUGRAS Costas, « Auditory Streams in Ligeti’s Continuum: A Theoretical and Perceptual Approach », Journal of Interdisciplinary Music Studies, vol. 3, n° 1-2, printemps-automne 2009, p. 119-137. ²⁵⁸ DOUGLAS Chelsea, NOBLE Jason et MCADAMS Stephen, « Auditory Scene Analysis and the Perception of Sound Mass in Ligeti’s Continuum », Music Perception, vol. 33, n° 3, 2015, p. 287-305. ↩︎
DOUGLAS Chelsea, NOBLE Jason et MCADAMS Stephen, « Auditory Scene Analysis and the Perception of Sound Mass in Ligeti’s Continuum », Music Perception, vol. 33, n° 3, 2015, p. 287-305. ↩︎
PRESSNITZER Daniel, SUIED Clara and SHAMMA Shihab A., « Auditory Scene Analysis: the sweet music ambiguity », Frontiers in Human Neuroscience, Vol. 5, n° 158, 2011, p. 1-10. ↩︎
SABBE Herman, « Gyorgy ligeti, illusions et allusions », J. New Music Res. Vol. 8, 1979, p. 11–34. « Yes, it is true, I often work with acoustical illusions, very analogous to optical illusions, false perspectives, etc. We are not very familiar with acoustical illusions. But they are very analogous and one can make very interesting things in this domain. » (traduction personnelle) ↩︎
CHOWNING John, « The simulation of moving sound sources », Journal of the Audio Engineering Society, vol. 19,
n. 1, 1971, p. 2-6. ↩︎
SHEPARD Roger N., « Circularity in judgments of relative pitch », J. Acoust. Soc. Am. Vol. 36, 1964, p. 2345–2353. ↩︎
KNOWLTON Kenneth C., « A computer technique for producing animated movies », Washington, D.C., April 21-23, 1964, p. 67-87. ↩︎
DEHAENE Stanislas et PETIT Christine, Parole et musique : Aux origines du dialogue humain. Odile Jacob, 2009, p. 324. ↩︎
PENROSE Lionel S. et PENROSE Roger, « Impossible Objects: A Special Type of Illusion », British Journal of Psychology, Vol. 49, n° 1, 1958, p. 31–33. ↩︎
Op. cit., FÉRON François-Xavier, « L’Art du « trompe-l’oreille » rythmique », p. 159. ↩︎
BOBÉE Emmanuelle, « La partition sonore et musicale de « Dunkerque » (C. Nolan, 2017). « Une expérience sensorielle inédite », Revue musicale OICRM, Vol. 5, n°2, 2018, p. 125–148. ↩︎
DEUTSCH Diana, « The Paradox of Pitch Circularity », Acoustics Today, Vol. 6, n° 3, Juillet 2010, p. 8. ↩︎
RISSET Jean-Claude, « Pitch and Rhythm Paradoxes: Comments on Auditory Paradox Based on Fractal Waveform », Journal of the Acoustical Society of America, Vol. 80, n° 3, 1986, p. 961-962. ↩︎
RISSET Jean-Claude, « Ouvrir l’espace sonore : Max Mathews, John Chowning, Holophon, » Journée d’informatique musicale, 2011. ↩︎
CHOWNING John, «The Simulation of Moving Sound Sources », Journal of the Audio Engineering Society, Vol. 19, p. 2-6, 1971, republié dans Computer Music Journal, vol. 1, n°3, 1977, p. 48-52. ↩︎
CHOWNING John, La Spatialisation des musiques électroacoustiques, Publications de l’université de Saint-Etienne, Saint-Etienne : 2012, p. 19-21. ↩︎
DEUTSCH Diana, «An auditory illusion », Nature, n° 251, 1974, p. 307-309. ↩︎
WESSEL David L. et RISSET Jean-Claude, « Les illusions auditives », in Claude Malric (dir.), Musique et ordinateur [Encyclopaedia Universalis, Encyclopaedia Universalis, 1979, p. 161- 171.], Les Ulis, Centre expérimental du spectacle, 1983, p. 93-105. ↩︎
D’ANGIOLINI Giuliano, Jesu, un chant de confrérie en Sardaigne, Éditions Delatour France, Sampzon, 2009. ↩︎
MCADAMS Stephen, Perception et cognition de la musique, op. cit., p. 22. ↩︎
LORTAT-JACOB Bernard, Chants de Passion, au cœur d’une confrérie de Sardaigne, Paris, Cerf, 1998, p. 342. ↩︎
CASTELLENGO Michèle, LORTAT-JACOB Bernard, LEOTHAUD Gilles, « Un paradoxe de perception de la hauteur : la « quintina » des chanteurs sardes », ISMA (International Symposium on Musical Acoustics), Perugia (Italie), 2001. ↩︎
MONTEVERDI Claudio, « Préface aux Madrigaux guerriers et amoureux, huitième livre des madrigaux », in Correspondances, préfaces, épîtres dédicatoires, trad. A. Russo, Sprimont, Mardaga, 2001, p. 269. ↩︎
Francis WOLFF, Pourquoi la musique ? Paris, Fayard, 2015. ↩︎
Ibid., p. 95. ↩︎
Ibid., p. 130. ↩︎
HANSLICK Eduard, Du beau dans la musique, Leipzig, 1854, trad. fr. Ch. Bannelier, Paris, Bourgois, 1986, p. 135. ↩︎
EEROLA Tuomas, «The dynamics of musical expectancy: Cross-cultural and statistical approaches to melodic expectations », Jyväskylä studies in humanities, 2003. ↩︎
WOLFF Francis, op. cit., p. 127. ↩︎
BISSELL Arthur Dart, The Role of Expectation in Music, A Study In The Psychology Of Music, New Haven, 1921, p.9. « Music possesses one point of great advantage over all the other arts – with the possible exception of dancing – in this matter of expectation in its unique position as regards repetition. The other arts allow of repetition (dancing particularly), but music calls for it, demands it; it enters into music as an integral factor ». ↩︎
HURON David, HELLMUTH MARGULIS Elizabeth, « Musical Expectancy and Thrills », in P.N. Juslin et J.A. Sloboda (éd.), Handbook of Music and Emotion: Theory, Research, Applications, Oxford-Toronto, Oxford University Press, 2010, p. 586. ↩︎
HURON David, Sweet Anticipation: Music and The Psychology of Expectation. Cambridge: MIT Press, 2006. ↩︎
MEYER Leonard B., Emotion and Meaning in Music, op. cit. ↩︎
VIEILLARD Sandrine, PERETZ Isabelle, GOSSELIN Nathalie, KHALFA Stéphanie, GAGNON Lise & BOUCHARD Bernard, « Happy, sad, scary and peaceful musical excerpts for research on emotions », Cognition and Emotion, Vol. 22, n°4, 2008, p. 720-752. ↩︎
BIGAND Emmanuel, FILIPIC Suzanne & LALITTE Philippe, « The time course of emotional responses to music », Annals of the New York Academy of Sciences, 1060, 2005, p. 429-437. ↩︎
JUSLIN Patrik N. et SLOBODA John A., « Introduction. Aims, Organization, and Terminology », in P.N. Juslin et J.A. Sloboda (dir.), Handbook of Music and Emotion. Theory, Research, Applications. New York, Oxford University Press, 2010, p. 3-12. ↩︎
DARWIN Charles, The Expression of the Emotions in Man and Animals, London, John Murray, 1872. ↩︎
EKMAN Paul, « Biological and Cultural Contribution to Body and Facial Movements in the Expression of the Emotions », p.73-101, in A.O. Rorty (dir.), Explaining Emotions. Los Angeles, University of California Press, 1980. ↩︎
PLUTCHIK Robert, Emotion a Psycho Evolutionary Synthesis, Harper, New York, 1980. ↩︎
FERNANDO Nathalie, EGERMANN Hauke, CHUEN Lorraine, KIMBEMBÉ Bienvenu et MCADAMS Stephen, « Musique et émotion : Quand deux disciplines travaillent ensemble à mieux comprendre le comportement musical humain », Anthropologie et Sociétés, 2014, Vol. 38, n°1, p. 167–191. ↩︎
PANKSEPP Jaak, « The Emotional Sources of Chills Induced by Music », Music Perception, 1995, Vol. 13, n°2, p. 171-207. ↩︎
PANKSEPP Jaak, Affective Neuroscience, New York, Oxford University Press, 1998. ↩︎
PERETZ Isabelle, « Towards a Neurobiology of Musical Emotions », p. 99-126, in P.N. Juslin et J.A. Sloboda (dir.), Handbook of Music and Emotion. Theory, Research, Applications. New York, Oxford University Press, 2010. ↩︎
BIGAND Emmanuel, « L’émotion dans le langage musical », in Parole et Musique : Aux origines du dialogue humain sous la direction de Stanislas Dehaene et Christine Petit, Odile Jacob, 2009, p. 346. ↩︎
SHENFIELD Tali, TREHUB Sandra & NAKATA Takayuki, « Maternal singing modulates infant arousal », Psychology of Music, Vol. 31, n°4, 2003, p. 365-375. ↩︎
HURON David, « Perceptual and cognitive applications in music information retrieval », In International Symposium on Music Information Retrieval, 2000. ↩︎
Op.cit., PERETZ Isabelle, « Towards a Neurobiology of Musical Emotions » ↩︎
PERETZ Isabelle, Le temps stratégique, mars-avril 2000, n°92. ↩︎
MATHIEU Louise, « Un regard actuel sur la rythmique Jacques-Dalcroze », Recherche en éducation musicale, N°28, Décembre 2010, p. 24. ↩︎
DAMASIO Antonio, L’Erreur de Descartes. La raison des émotions. Paris, Odile Jacob, 1995. ↩︎
LEVITIN Daniel, De la note au cerveau, Paris, Editions Héloïse d’Ormesson, 2010, p. 239. ↩︎
BLOOD Anne J. & ZATORRE Robert J., « Intensely pleasurable responses to music correlate with activity in brain regions implicated in reward and emotion », Proceedings of the National Academy of Sciences of the United States of America, Vol.98, n°20, 2001, p. 11818-11823. ↩︎
IMBERTY Michel, L’aquisition de structures tonales chez l’enfant, Paris, Klincksieck, 1969. ↩︎
BHARUCHA Jamshed, « Music cognition and perceptual facilitation: A connectionist framework », Music Perception, n°5, 1987, p. 1-30. ↩︎
HURON David, Sweet anticipation, Massachusetts, M.I.T. Press, 2006. ↩︎
FRANGNE Pierre-Henry, LACOMBE Hervé, MASSIN Marianne, PICARD Timothée. « Musique et émotion : problèmes et enjeux ». Pierre-Henry Frangne, Hervé Lacombe, Marianne Massin et Timothée Picard. La valeur de l’émotion musicale, Presses universitaires de Rennes, 2017, p. 9-36. ↩︎
SCHOPENHAUER Arthur, Le monde comme volonté et comme représentation, trad. A. Burdeau, Paris, PUF, 1966, livre III, § 39 : « De la métaphysique de la musique », p. 1198. ↩︎
BACHELARD Gaston, La Dialectique de la durée (1950), Paris, PUF, 1980, p. 116. ↩︎
IMBERTY Michel, « Introduction : Du geste temporel au sens » in Temps geste et musicalité, sous la direction de Michel Imberty et Maya Gratier, Paris, L’Harmattan, 2007, p. 9. ↩︎
TILLMANN Barbara & POULIN-CHARRONNAT Bénédicte, « Etudier les attentes musicales de l’auditeur non-musicien : le paradigme d’amorçage musical », Intellectica, n°48-49, 2008, p. 27-35. ↩︎
CLARKE Eric, Ways of Listening: An ecological approach to the perception of musical meaning. Oxford, NY: Oxford University Press, 2005. ↩︎
AGAWU Kofi, Playing with Signs: A Semiotic Interpretation of Classic Music, Princeton, Princeton University Press. 1991. ↩︎
KRAMER Lawrence, « Subjectivity Rampant! Music, Hermeneutics, and History », in The Cultural Study of Music. A critical introduction, ed. by Martin Clayton, Trevor Herbert and Richard Middleton, New York: Routledge, 2003, p. 124-35. ↩︎
NARMOUR Eugene, « Hierarchical expectation and musical style », In: D. Deutsch (ed), The Psychology of Music, 2nd Edition. San Diego: Academic Press, 1999, p. 442-472. ↩︎
TEMPERLEY David, The Cognition of Basic Musical Structures. Cambridge MA: MIT Press, 2001. ↩︎
CLARKE Erick, Ways of Listening: An ecological approach to the perception of musical meaning, op. cit., p. 91. ↩︎
HURON David, « The ramp archetype and the maintenance of auditory attention », Music Perception, Vol. 10, n°1, 1992, p. 83-92. ↩︎
HURON David, Sweet Anticipation: Music and The Psychology of Expectation, op. cit. ↩︎
TAN Siu-Lan, PFORDRESHER Peter, HARRE Rom, « The Question of Meaning in Music », In Psychology of Music: From Sound to Significance. New York : Psychology Press, 2010, p. 245–259. ↩︎
JAUSS Hans Robert, Pour une esthétique de la réception, Paris, éditions Gallimard, 1978. ↩︎
GADAMER Hans-Georg, Wahrheit und Methode (W.M), Tübingen, J.C.B. Mohr, 1960, 2. Auflage, 1965, trad. française partielle Vérité et Méthode, Paris, éd. Du Seuil, 1976. ↩︎
HUSSERL Edmund, Méditations cartésiennes, Paris, Vrin, 1953. ↩︎
KALINOWSKI Isabelle, « Hans-Robert Jauss et l’esthétique de la réception », Revue germanique internationale, Vol. 8, 1997, p. 151-172. ↩︎
MEYER Leonard B., Emotion and Meaning in Music, 1956, op. cit. p. 77. ↩︎
Ibid., p. 232. ↩︎
Ibid., p. 222. ↩︎
LALITTE Philippe, « Vers une analyse texturale fondée sur les principes de l’analyse de scène auditive », In Analyse et perception, Actes des Journées d’analyse musicales, 2016. Dijon, Editions Universitaires de Dijon. ↩︎
KOFFKA Kurt, Principles of Gestalt psychology. New York, Harcourt Brace, 1935, p. 176. ↩︎
MEYER op. cit., p. 24. ↩︎
HURON, Sweet Anticipation: Music and The Psychology of Expectation, op. cit. ↩︎
En anglais: Imagination, Tension, Prediction, Reaction, Appraisal. ↩︎
HURON David et HELLMUTH MARGULIS Elizabeth, Musical Expectancy and Thrills, op. cit., p. 588. ↩︎
TROUSSEAU Armand, Extrait de son discours de rentrée de la Faculté de Médecine de Paris, prononcé le 2 novembre 1842. ↩︎
http://affairesjuridiques.aphp.fr/textes/arrete-du-23-avril-2012-relatif-a-lorganisation-du-depistage-de-la-surdite-permanente-neonatale/, consulté le 15 juillet 2019. ↩︎
CHAPMAN Robin S., « Children’s Language Learning: An Interactionist Perspective ». Journal of Child Psychology and Psychiatry and allied disciplines, Vol. 41, n°1, 2000, p. 33-54. ↩︎
KARMILOFF-SMITH Kyra & KARMILOFF-SMITH Annette, Comment les enfants entrent dans le langage. Paris : Retz, 2012. ↩︎
LINA-GRANADE Geneviève & TRUY Éric, « Conduite à tenir devant une surdité de l’enfant ». EMC-Oto-rhino-laryngologie, Vol. 2, n° 3, 2005, p. 290-300. ↩︎
MONDAIN Michel & BLANCHET Catherine & VENAIL Frederic & VIEU Adrienne, « Classification et traitement des surdités de l’enfant. » Emc – Oto-rhino-laryngologie, Vol. 2, 2005, p. 301-319. ↩︎
http://www.biap.org/biapfrancais.htm ↩︎
GUIDETTI Michel & TOURRETTE Catherine. (2002). Handicaps et développement psychologique de l’enfant. Paris, Armand Colin. ↩︎
Expertise Collective, Déficits auditifs : Recherches émergentes et applications chez l’enfant, Inserm, 2006. ↩︎
ALBERTINI John A., « Deafness and Hearing Loss ». The Corsini Encyclopedia of Psychology. Ed. I. B. Weiner and W. E. Craighead. 4th ed. Vol. 2. Hoboken: John Wiley & Sons, 2010, p. 461-62. ↩︎
ROBERTS Megan Y., « Parent-Implemented Communication Treatment for Infants and Toddlers With Hearing Loss: A Randomized Pilot Trial », Journal of Speech Language and Hearing Research, Vol. 62, n°1, 2018, p. 143-152. ↩︎
Op. cit., Inserm, p. 105. ↩︎
HARDELIN Jean-Pierre, DENOYELLE Françoise, LEVILLIERS Jacqueline, SIMMLER Marie-Christine & PETIT Christine, « Les surdités héréditaires : génétique moléculaire », Med Sci (Paris), Vol. 20, n°3, 2004, p. 311–316. ↩︎
MARLIN Sandrine, GARABÉDIAN Éréa Noël, ROGER Gilles, MOATTI Lucien, MATHA Nicole, LEWIN Patricia, et al. « Connexin 26 gene mutations in congenitally deaf children: pitfalls for genetic counseling », Arch. Otolaryngol. head Neck Surg, 2001, Vol. 127, n°8, p. 927-33. ↩︎
« Dossier Génétique et Surdité », Collège National d’Audioprothèse, Vol. 26, n°1, 2013, p. 6-20. ↩︎
Recommandation BIAP 06/8 : « L’appareillage de l’enfant déficient auditif. » http://www.biap.org/en/component/content/article/66-recommendations/ct-6–hearing-aid/12-biap-recommendation-nd-068–prosthetic-fitting-procedure-for-hearing-impaired-child ↩︎
LAURENT Stéphane et ROY Thomas, « Le Bilan d’efficacité prothétique : interprétation et utilisation pour les réglages », Les Cahiers de l’Audition n°6, 2012, p. 24. ↩︎
TRUY Éric, « Méthodes instrumentales de réhabilitation de l’audition : intérêts et limites. » In M. Mondain, V. Brun, Les surdités de l’enfant. Entretiens de rééducation et réadaptation fonctionnelle. Issy-les-Moulineaux : Elsevier Masson, 2009, p. 11-19. ↩︎
BIZAGUET Éric, « L’appareillage de l’enfant sourd », Revues générales : Audition, Réalités pédiatriques, n°175, Décembre 2012, p. 18. ↩︎
La surdité de l’enfant – guide pratique à l’usage des parents, édition INPES/Fondation de France, 2005, p. 69. https://www.diplomatie.gouv.fr/IMG/pdf/la_surdite_de_l_enfant_-_guide_pratique-inpes_cle01de4c.pdf ↩︎
LIGNY Chantal, SIMON Patricia, MATAGNE Laurence & SCHEPERS Franz, « Implantation cochléaire bilatérale ». A.N.A.E. Approche Neuropsychologique des Apprentissages chez l’Enfant, Vol. 27, Tome 5, n°138, 2015, p. 403-413. ↩︎
COENE Martine & SCHAUWERS Karen & GILLIS Steven & ROORYCK Johan & GOVAERTS Paul. « Genetic predisposition and sensory experience in language development: Evidence from cochlear-implanted children. » Language and cognitive Processes. Psychology Press, Vol. 26, n°8, 2011, p. 1083-1101. ↩︎
https://www.cisic.fr/CISIC/media/doccisic/synthese_questionnaire_cisic2012.pdf ↩︎
ANDEM, L’implant cochléaire chez l’enfant sourd pré-lingual, Paris, ANDEM-Service des Études, 1994. ↩︎
PREISLER Gunilla, Les implants cochléaires chez les enfants sourds. Strasbourg, Edition du conseil de l’Europe, 2001. ↩︎
TRUY Éric & LINA-GRANADE Geneviève, « Implantation cochléaire de l’enfant : Technologie, bilan médical et sélection des candidats, réhabilitation. » Archives de Pédiatrie, Vol. 10, n°6, 2003, p. 554-564. ↩︎
GOVAERTS Paul J., DAEMERS Kristin, SCHAUWERS Karen, De BEUKELAER Carina, YPERMAN Marjan, De CEULAER Geer., et al., « Implantation précoce et/ou bilatérale. » Rééducation orthophonique, n°217, 2004, p. 31-47. ↩︎
CLARK Graeme, « Cochlear implants in children: safety as well as speech and language », Int J Pediatr Otorhinolaryngol, Vol. 67 Suppl 1, p. 7-20, 2003. ↩︎
HAGE Catherine, CHARLIER Brigitte & LEYBAERT Jacqueline. Compétences cognitives, linguistiques et sociales de l’enfant sourd. Pistes d’évaluations. Bruxelles : Mardaga, 2006. ↩︎
HAGE Catherine et al., 2006, « Chapitre 11 : L’enfant porteur d’implant cochléaire : Intervention chirurgicale, suivi et évaluation », op. cit., p. 247-266. ↩︎
WILSON Blake S., FINLEY Charles C., LAWSON Dewey T., WOLFORD Robert D., ZERBI Mariangeli. « Design and evaluation of a continuous interleaved sampling (CIS) processing strategy for multichannel cochlear implants. » Journal of Rehabilitation Research and Development, Vol. 30, n°1, 1993, p. 110-116. ↩︎
DAUMAN René, CARBONNIERE Bernadette, SORIANO Véronique, BERGER-LAUTISSIER Sylvie, BOUYÉ Jany, DEBRUGE Éric, CORIAT Géraldine et BÉBÉAR Jean-Pierre, « Implants cochléaires chez l’adulte et l’enfant. » Encycl Méd Chir (Elsevier, Paris), Oto-rhino-laryngologie, 20-185- D-10, 1998, p. 7. ↩︎
WILSON Blake S. & DORMAN Mickael F., « Cochlear Implants: Current designs and future possibilities », Journal of Rehabilitation Research and Development, Vol. 45, n°5, 2008, p. 695-730. ↩︎
WILSON Blake S., « The Remarkable Cochlear Implant and Possibilities for the Next Large Step Forward », Acoustical Society of America, Acoustics Today, Vol. 15, n°1, 2019, p. 53-61. ↩︎
LENEL Nadjmah, « Les communications alternatives », In M. Mondain et V. Brun (Eds.), Les surdités de l’enfant. Issy-les-Moulineaux, Masson, 2009, p. 20-27. ↩︎
LEDERBERG Amy & EVERHART Victoria S., « Conversations Between Deaf Children and Their Hearing Mothers : Pragmatic and Dialogic Characteristics. » Journal of deaf studies and deaf education. Vol. 5, 2000, p. 303-322. ↩︎
DE BOYSSON-BARDIES Bénédicte. Comment la parole vient aux enfants. Paris : Odile Jacob poche, 2005. ↩︎
DELAROCHE Monique, Au fil des regards et des caresses…, Ortho-éditions, 2012, p. 27. ↩︎
SOULÉ Michel et CYRULNIK Boris, L’intelligence avant la parole : nouvelles approches originales du bébé, Paris, ESF, 1998, p. 22. ↩︎
BRUNER Jérome S., Le développement de l’enfant, savoir faire, savoir dire (Trad. M. Deleau), Paris, P.U.F., 1983. ↩︎
Ibid., p. 171. ↩︎
MUNDY Peter & NEWELL Lisa, « Attention, joint attention, and social cognition », Current directions in Psychological Science, Vol. 16, 2007, p. 269-274. ↩︎
DELAROCHE Monique, Au fil des regards et des caresses…, op. cit., p. 19. ↩︎
STERN Daniel N., Le monde interpersonnel du nourisson, PUF le fil rouge, 2003. ↩︎
CORNETT Orin R., « Cued Speech », American Annals of the Deaf, Vol.112, p. 3-13, 1967. ↩︎
LEYBAERT Jacqueline & LaSasso Carol, « Cued speech for enhancing speech perception and first language development of children with cochlear implants. » Trends in Amplification, Vol. 14, n°2, 2010, p. 96–112. ↩︎
LEYBAERT Jacqueline & ALEGRIA Jésus, « The role of cued speech in language development of deaf children. » In M. Marschark & P. E. Spencer (Eds.), Handbook of deaf studies, language, and education. New York: Oxford University Press, 2003, p. 261-274. ↩︎
Article L312-9-1 du Code de L’éducation. https://www.legifrance.gouv.fr/affichCodeArticle.do?idArticle=LEGIARTI000006524761&cidTexte=LEGITEXT00000 6071191&dateTexte=20050212 ↩︎
Dictionnaire 1200 signes français-LSF, Editions Monica Companys, 2000. ↩︎
BOUHIER-CHARLES Nathanaëlle, Signe avec moi : la langue gestuelle des sourds à la portée de tous les bébés, Editions Monica Companys, 2006. ↩︎
Op. Cit., Handicaps et développement psychologique de l’enfant, 2002. ↩︎
Op. Cit., Conduite à tenir devant une surdité de l’enfant, 2005. ↩︎
DE BOYSSON-BARDIES Bénédicte. Comment la parole vient aux enfants. Paris : Odile Jacob poche, 2005. ↩︎
VINTER Shirley, L’acquisition du langage oral par l’enfant sourd. In Solal (Ed.), Précis d’audiologie et de déglutition, Marseille,2005, p. 271-292 ↩︎
BERTONCINI Josiane et DE BOYSSON-BARDIES Bénédicte. « Chapitre 4. La perception et la production de la parole avant deux ans », Michèle Kail éd., L’acquisition du langage. Vol. I. Le language en émergence. De la naissance à trois ans. Presses Universitaires de France, 2000, p. 95-136. ↩︎
EILERS et OLLERS, « Infant vocalizations and the early diagnosis of severe hearing impairment. » J. Pediatr. Vol.124, n°2, 1994, p 199-203. ↩︎
DUMONT Annie, Implantations cochléaires : guide pratique d’évaluation et de rééducation, Isbergues, Ortho Edition, 1997. ↩︎
CARRÉ Alain, Musique et Surdité, Paris, Fuzeau, 2008. ↩︎
ALIS Valérie et JUBIEN Nicole, « Quelques particularités de l’accès au langage chez l’enfant sourd, » in Implant cochléaire pédiatrique et rééducation orthophoniste, Médecine-Sciences, Flammarion, Paris, 2009, p. 14. ↩︎
HAGE Catherine, « Co-construire le langage : le défi des interactions précoces avec le très jeune enfant sourd », A.N.A.E. Approche Neuropsychologique des Apprentissages chez l’Enfant, Vol.27, Tome 5, n°138, 2015, p. 427-434. ↩︎
DELEAU Michel & LE MANER-IDRISSI Gaid, « Le développement des habiletés pragmatiques chez les enfants sourds ». In L’acquisition du Langage Chez l’Enfant Sourd, Marseille, Solal, 2005. ↩︎
LEPOT-FROMENT Christiane & CLEREBAUT Nadine, L’enfant Sourd. Chapitre 2 : « Les interactions prélinguistiques entre l’enfant et ses parents », Bruxelles, De Boeck, 1996, p. 59-82. ↩︎
GOLD Claudia M., À l’écoute des émotions de l’enfant, Paris, Albin Michel, 2014. ↩︎
STERN Daniel, Le monde interpersonnel du nourrisson, Paris, PUF, 1989. ↩︎
TRONICK Edward, « Multilevel meaning making and dyadic expansion of consciousness theory: The emotional and the polymorphic polysemic flow of meaning », in D. Fosha, D.J. Siegel, M. Solomon (éd.) The healing power of emotion: Affective neuroscience, development, and clinical practice, New York, Norton; 2008, p. 86–110. ↩︎
ROSENBLUM Ouriel, « Du bébé à l’empathie : Une approche des interactions affectives », in A. Braconnier & J. Sipos (Dir), Le Bébé et les interactions précoces, Paris, PUF, 1998, p. 167-194. ↩︎
BLAMEY Peter J., SARANT Julia Z., PAATSCH Louise E., BARRY Johanna G., BOW Catherine P., WALES Roger J., et al., « Relationships Among Speech Perception, Production, Language, Hearing Loss, and Age in Children with Impaired Hearing », Journal of Speech Language Hear Research, Vol. 44, n°2, 2001, p. 264-285. ↩︎
FAGAN Mary K. & PISONI David B., « Hearing Experience and Receptive Vocabulary Development in Deaf Children with Cochlear Implants », Journal of Deaf Studies and Deaf Education, Vol.15, n°2, 2010, p. 149-161. ↩︎
HAYES Heather, GEERS Ann E., TREIMAN Rebecca & MOOG Jean S., « Receptive Vocabulary Development in Deaf Children with Cochlear Implants: Achievement in an Intensive Auditory-Oral Educational Setting », Ear Hearing, Vol.30, n°1, 2009, p. 128-135. ↩︎
CONNOR Carol M., CRAIG Holly K., RAUDENBUSH Stephen W., HEAVNER Krista & ZWOLAN Teresa A., « The Age at Which Young Deaf Children Receive Cochlear Implants and Their Vocabulary and Speech-Production Growth: Is There an Added Value for Early Implantation? », Ear Hearing, Vol.27, n°6, 2006, p. 628-644. ↩︎
RINALDI Pasquale, CASELLI Cristina, « Lexical and Grammatical Abilities in Deaf Italian Preschoolers: The Role of Duration of Formal Language Experience », The Journal of Deaf Studies and Deaf Education, Volume 14, Issue 1, Winter 2009, p. 63–75. ↩︎
BRIEC Julie, LE MANER-IDRISSI Gaïd, DARDIER Virginie, ROUXEL Géraldine, TAN-BESCOND Géraldine & GODEY Benoit, « Échanges conversationnels avec un partenaire familier : étude comparative entre enfants sourds, implantés cohléaires depuis 2 ans et enfants entendants. », L’Année psychologique, Vol. 112, n°1, 2012, p. 17-48. ↩︎
LE MANER-IDRISSI Gaïd, PAJON Cécile, GAVORNIKOVA-BALIGAND Zdenka, DELEAU Michel, TAN-BESCOND Géraldine & GODEY Benoit, « Implant cochléaire et développement des échanges conversationnels », Revue canadienne des sciences du comportement, Vol. 40, n°2, 2008, p. 120-127. ↩︎
BEDOUIN Nathalie, BESOMBES Anne-Marie, ESCANDE Eliette, DUMONT Annie & TILLMANN Barbara, « Déficits morphosyntaxiques chez des enfants sourds implantés : hypothèses et pistes de remédiation par le rythme musical », Rééducation orthophonique, n°268, 2016, p. 261-288. ↩︎
BEDOUIN Nathalie, BESOMBES Anne-Marie, ESCANDE Eliette, DUMONT Annie, LALITTE Philippe & TILLMANN Barbara, « Boosting syntax training with temporally regular musical primes in children with cochlear implants », Annals of Physical and Rehabilitation Medicine, Vol.61, n°6, 2018, p. 365-371. ↩︎
EISENBERG Laurie, MARTINEZ Amy, HOLOWECKY Suzanne, POGORELSKY Stephanie, « Recognition of lexically controlled words and sentences by children with normal hearing and children with cochlear implants », Ear Hear, Vol. 23, n°5, p. 450-62. ↩︎
GALLEGO Carlos, MARTIN-ARAGONESES Teresa, LOPEZ-HIGES Ramón & PISON Guzmán, « Semantic and syntactic reading comprehension strategies used by deaf children with early and late cochlear implantation. », Research in developmental disabilities, Vol. 49-50, 2016, p. 153-170. ↩︎
LORENZI Christian, GILBERT Gaëtan, CARN Héloïse, GARNIER Stéphane et MOORE Brian C. J., « Speech perception problems of the hearing impaired reflect inability to use temporal fine structure », Proceedings of the National Academy of Sciences, Dec 2006, Vol. 103, n°49, p.18866-18869. ↩︎
DESAUNAY Melodie, FLEURIOT Pierre, DEBRUILLE Louis, GARNIER Stéphane, GARABEDIAN Erea Noël, LOUNDON Nathalie, MARLIN Sandrine, DENOYELLE Françoise, TRAN BA HUY Patrice, De WAELE Catherine, GILBERT Gaëtan & LORENZI Christian, « Rôle des informations d’enveloppe temporelle et de structure temporelle fine dans l’intelligibilité de la parole chez les sujets entendants et malentendants », Les Cahiers de l’Audition, Vol. 20, n°3, 2007, p. 46-50. ↩︎
CONWAY Christopher M. & CHRISTIANSEN Morten H., « Seeing and Hearing in Space and Time : Effects of modality and presentation rate on implicit statistical learning », European Journal of Cognitive Psychology, Vol.21, n°4, 2009, p. 561-580. ↩︎
BADDELEY Alan, « Working Memory », Science, Vol.255, n°5044, 1992, p. 556-559. ↩︎
HARRIS Michael S., PISONI David B., KRONENBERGER William G., GAO Sujuan, CAFFREY Helena M., & MIYAMOTO Richard T., « Developmental trajectories of forward and backward digit spans in deaf children with cochlear implants », Cochlear implants international, Vol.12 (Suppl. 1), 2011, p. 84-88. ↩︎
PISONI David B. & CLEARY Miranda, « Measures of Working Memory Span and Verbal Rehearsal Speed in Deaf Children after Cochlear Implantation », Ear Hearing, Vol.24, n°1, 2003, p. 106-120. ↩︎
PISONI David B., KRONENBERGER William G., ROMAN Adrienne & GEERS Ann E., « Measures of digit span and verbal rehearsal speed in deaf children after more than 10 years of cochlear implantation », Ear and Hearing, Vol.32, 2011, p. 60–74. ↩︎
KRAL Andrej & EGGERMONT Jos J., « What’s to lose and what’s to learn: Development under auditory deprivation, cochlear implants and limits of cortical plasticity. » Brain Research Reviews, Vol.56, 2007, p. 259-269. ↩︎
ROCHETTE Françoise, « Entraînement Auditif et Musical Chez l’Enfant Sourd Profond : Effets sur la Perception Auditive et Effets de Transferts », Thèse d’état, Université de Bourgogne, 2012. ↩︎
PINTO Serge et SATO Marc, Traité de Neuro-linguistique : du cerveau au langage, De Boeck, 2016, p. 259. ↩︎
FINNEY Eva M., FINE Ione & DOBKINS Karen R., « Visual Stimuli activate auditory cortex in the deaf », Nature Neurosciences, Vol.4, n°12, 2001, p. 1171-1173. ↩︎
LEVÄNEN Sari, JOUSMÄKI Veikko & HARI Riitta, « Vibration-induced auditory-cortex activation in a congenitally deaf adult », Current Biology, Vol.8, n°15, 1998, p. 869-872. ↩︎
MOORE Jean K., NIPARKO John K., MILLER George A. & LINTHICUM Fred H., « Effect of Profound Hearing Loss on A Central Auditory Nucleus », American Journal of Otology, Vol.15, n°5,1994, p. 588-595. ↩︎
SHARMA Anu, DORMAN Michael F. & SPAHR Anthony J., « A sensitive period for the development of the central auditory system in children with cochlear implants, implications for age of implantation », Ear Hearing, Vol.23, n°6, 2002a, p. 532-539. ↩︎
GILLEY Phillip M., SHARMA Anu & DORMAN Michael F., Cortical reorganization in children with cochlear implants, Brain Research, Vol.1239, n°6, 2008, p. 56-65. ↩︎
EGGERMONT Jos J. & PONTON Curtis W., « Auditory-evoked Potentials Studies of Cortical Maturation in Normal Hearing and Implanted Children: Correlations in Changes in Structure and Speech Perception ». Acta Otorhinolaryngology, Vol.123, n°2, 2003, p. 249-252. ↩︎
ROCHETTE Françoise, op. cit., p. 33. ↩︎
MITHEN Steven J., The music instinct: the evolutionary basis of musicality, Annals of the New York Academy of Science, Vol.1169, 2009, p. 3-12. ↩︎
PERETZ Isabelle, « Towards a Neurobiology of Musical Emotions », In P. J. J. Sloboda (Ed.), Handbook of Music and Emotion: Theory, research, applications, Oxford, Oxford University Press, 2010. ↩︎
TREHUB Sandra, « The developmental origins of musicality », Nature Neurosciences, Vol. 6, n°7, 2003, p. 669-673. ↩︎
SCHLAUG Gottfried, JÄNCKE Lutz & HUANG Yanxiong, « In vivo evidence of structural brain asymetry in musicians. » Science, Vol. 3, n°267, 1995b, p. 699-701. ↩︎
SCHNEIDER Peter, SCHERG Michael, DOSCH H. Günter, SPECHT Hans J., GUTSCHALK Alexander, & RUPP André, « Morphology of Heschl’s gyrus reflects enhanced activation in the auditory cortex of musicians. » Nature Neurosciences, Vol. 5, n°7, 2002, p. 688-694. ↩︎
PATEL Aniruddh D., Music, Language and the Brain. New York, Oxford University Press, 2008. ↩︎
HERHOLZ Sibylle C. & ZATORRE Robert J., « Musical training as a framework for brain plasticity: behavior, function, and structure », op. cit. ↩︎
OECHSLIN Mathias S., MEYER Martin & JÄNCKE Lutz, « Absolute Pitch – Functional Evidence of Speech-Relevant Auditory Acuity », Cerebral cortex, Vol. 20, n°2, 2010, p. 447-455. ↩︎
WONG Patrick C. M., SKOE Erika, RUSSO Nicole M., DEES Tasha & KRAUS Nina, « Musical experience shapes human brainstem encoding of linguistic pitch patterns ». Nature Neurosciences, Vol.10, 2007, p. 420-422. ↩︎
TRAINOR Laurel J. & HEINMILLER Becky M., « The development of evaluative responses to music : Infants prefer to listen to consonant over dissonance. » Infant Behavior & Development, Vol. 21,1998, p. 77-88. ↩︎
Op. Cit., TREHUB Sandra, The developmental origins of musicality. ↩︎
MOUSSARD Aline, ROCHETTE Françoise & BIGANG Emmanuel, « La musique comme outil de stimulation cognitive ». L’Année psychologique, vol. 112, n°3, 2012, p. 499-542. ↩︎
TRAINOR Laurel J. & HANNON Erin E., « Musical development », in D. Deutsch (dir.), The Psychology of Music, Academic Press, 3^e éd., p. 423-497. ↩︎
BIGAND Emmanuel, TILLMANN Barbara, PERETZ Isabelle, ZATORRE Robert J., LOPEZ Luisa & MAJNO Maria, « The neurosciences and music V: cognitive stimulation and rehabilitation », Annals of the New York Academy of sciences, n° 1337, 2015, p. 1-271. ↩︎
WINKLER István, HÁDEN Gábor P., LADINIG Olivia, SZILLER István, and HONING Henkjan, « Newborn infants detect the beat in music », Proceedings of the National Academy of Sciences, Feb 2009, Vol. 106, n°7, p. 2468-2471. ↩︎
DELIEGE Irène et SLOBODA John, Naissance et développement du sens musical, PUF, 1995. ↩︎
NAKATA Takayuki & TREHUB Sandra E., « Infants’ Responsiveness to Maternal Speech and Singing. » Infant Behavior and Development, Vol. 27, 2004, p. 455-464. ↩︎
PERETZ Isabelle, Apprendre la Musique, Nouvelles des Neurosciences, Odile Jacob, 2018, p. 19. ↩︎
PAPOUSEK Mechthild, PAPOUSEK Hanuš & HAEKEL Monika, « Didactic adjustments in fathers’ and mothers’ speech to their three-month-old infants », Journal of Psycholonguistic Research, Vol. 16, n°5, 1987, p. 491-516. ↩︎
Op. cit., DELAROCHE Monique, Au fil des regards et des caresses… ↩︎
CORBEIL Mariève, TREHUB Sandra E. et PERETZ Isabelle, « Singing delays the onset of infant distress », Infancy, Vol. 21, p. 373-391. ↩︎
STANDLEY Jayne M., CASSIDY Jane, GRANT Roy, CEVASCO Andrea, SZUCH Catherine, NGUYEN Judy, WALWORTH Darcy, PROCELLI Danielle, JARRED Jennifer, ADAMS Kristen, « The effect of music reinforcement for non-nutritive sucking on nipple feeding of premature infants », Pediatric nursing, May-June 2010, Vol. 36, p. 136-145. ↩︎
TRAINOR Lauren J. & CIRELLI Laura, « Rhythm and interpersonal synchrony in early social development », Annals of the New York Academy of Sciences, Vol. 1337, 2015, p. 45-52. ↩︎
TRAINOR Laurel J., « La musique chez les tout-petits » in Revue Internationale d’Éducation « Dossier Musique et Éducation », Sèvres n°75, septembre 2017, p. 73. ↩︎
PERETZ Isabelle, Apprendre la Musique, op.cit., p. 20. ↩︎
HARGREAVES David J. and GALTON Maurice J., « Aesthetic learning; psychological theory and educational practice. » In B. Reimer and R.A. Smith (Eds.) National Society for the Study of Education Yearbook on the Arts in Education (Ed.), p. 124-50, 1992. ↩︎
TREHUB Sandra E., BULL Dale & THORPE Leigh A., « Infants’ perception of melodies: the role of melodic contour », Child Development, Vol. 55, n°3, 1984, p. 821-830. ↩︎
Deliège et Sloboda, Naissance et développement du sens musical, op.cit. ↩︎
SLOBODA John A., L’esprit musicien : la psychologie cognitive de la musique, Paris, Mardaga. 1985. ↩︎
SWANWICK Keith et TILLMANN June, « The sequence of musical development: A study of children’s composition. », British journal of music education, Vol.3, 1986, p. 305-339. ↩︎
ZENATTI Arlette, Perception et intelligence musicales chez l’enfant. Université Paris X-Nanterre, Paris, 1967. ↩︎
ZENATTI Arlette, « Aspects du développement musical de l’enfant dans l’histoire de la psychologie au XXe siècle ». Les Sciences de l’éducation, Vol. 3, n°4, p. 21-38. ↩︎
GORDON Edwin E., Learning sequences in music skill, content and patterns. Chicago, G.I.A. Publications, 1988. ↩︎
GORDON Edwin E., A music learning theory for newborn and young children. Chicago, G.I.A. Publications, 3^e édition, 2003. ↩︎
ZURCHER Pierre, Le développement musical de l’enfant : les quatre temps de la musique, Paris, L’Harmattan, 2010. ↩︎
MITANI Chisato, NAKATA Takayuki, TREHUB Sandra, KANDA Yukihito, KUMAGAMI Hidetaka, TABASAKI Kenji, et al., « Music recognition, music listening, and word recognition by deaf children with cochlear implants. » Ear Hearing, Vol. 28(Supplement), 2007, p. 29-33. ↩︎
NAKATA Takayuki, TREHUB Sandra, MITANI Chisato, KANDA Yukihito, SHIBASAKI Atsuko & SCHENLLENBERG E. Glenn, « Music recognition by Japanese children with cochlear implants. » Journal of Physiological Anthropol. Applied Human Sciences, Vol. 24, n°1, 2005, p. 29-32. ↩︎
DARROW Alice-Ann, « Music for the Deaf », Music Educators Journal, Vol. 71, 1985, p. 33-35. ↩︎
WALCZYK Eugenia Bulawa, « Music instruction and the hearing impaired », Music Educators Journal, Vol. 80, n°1, 1993, p. 42-44. ↩︎
TRAINOR Laurel J., GAO Xiaoqing, LEI Jing-Jiang, LEHTOVAARA Karen, HARRIS Laurence R., « The primal role of the vestibular system in determining musical rhythm », Cortex, Vol. 45, n°1, 2009, p. 35-43. ↩︎
ZATORRE Robert J. & SALIMPOOR Valorie N., « From perception to pleasure: Music and its neural substrates », Proceedings of the National Academy of Sciences of the United States of America, Vol. 110 (suppl. 2), 2013, p. 10430-10437. ↩︎
HUMMEL Cora J. M. « The Value of Music in Teaching Deaf Students », Volta Review, Vol. 73, 1971, p. 224-249. ↩︎
ANSHEL Anat & KIPPER David A., « The influence of group singing on trust and coopération », Journal of Music Therapy, Vol. 25, n° 3, 1988, p. 145-155. ↩︎
MCDERMOTT E. F. « Music and Rhythm – From Movement and Lipreading and Speech », Volta Review, Vol. 73, 1971, p. 229-232. ↩︎
CIRELLI Laura K., EINARSON Kate & TRAINOR Laurel J., « Interpersonal synchrony increases prosocial behavior in infants », Developmental Science, Vol. 17, n°6, 2014, p. 1003-1011. ↩︎
CARRÉ Alain, Musique et surdité, Ed. Fuzeau, 2008. ↩︎
LE CALVEZ Viviane, « La méthode verbo-tonale à l’heure de l’implant cochléaire », Connaissances Surdités, n°28, 2009, p. 13-17. ↩︎
SADEK-KHALIL Denise, L’enfant sourd et la construction de la langue, Montreuil, Ed. Du Papyrus, 1997. ↩︎
BOREL-MAISONNY Suzanne, Langage oral et écrit. Tome 1 : Pédagogie des notions de base. Étude expérimentale et applications pratiques. Tome 2 : Épreuves sensorielles et tests de langage. Appréciation de l’état du langage, Neuchâtel, Paris, Delachaux & Niestlé, 1960. ↩︎
SYLVESTRE DE SACY Clotilde, COMTE Chantal et CAVALIER Luna, Bien lire et aimer lire : méthode phonétique et gestuelle créée par Suzanne Borel-Maisonny. Bien Lire, 2018. ↩︎
Philippe LALITTE, « Texture et émergence perceptive en musique contemporaine », in Texte, texture, textile. Variations sur le tissage dans la musique, les arts plastiques et la littérature, EUD, 2013, p. 121-133. ↩︎
AUGOYARD Jean-François et TORGUE Henry, A l’écoute de l’environnement : répertoire des effets sonores, Marseille, Editions Parenthèses, 1995, p. 55. ↩︎
LIGETI György, « Evolution de la forme musicale », Die Reihe, n°7, Universal Edition (Vienne, 1960), repris dans Neuf essais sur la musique, Editions Contrechamps (Genève, 2001), p. 140. ↩︎
CANNAM Chris, LANDONE Christian and SANDLER Mark, « Sonic Visualiser: An Open Source Application for Viewing, Analysing, and Annotating Music Audio Files », in Proceedings of the ACM Multimedia 2010 International Conference, 2010. ↩︎
GRISEY Gérard, « Structuration des timbres dans la musique instrumentale », in Jean-Baptiste Barrière (éd.), Le timbre métaphore pour la composition, Christian Bourgois Editeur/Ircam, Paris, 1991, p. 377. ↩︎
GRISEY Gérard, « La musique, le devenir des sons », in Écrits ou l’invention de la musique spectrale, Editions MF, Paris, 2008, p. 16. ↩︎
Ibid, p. 100. ↩︎
Ibid, p. 101 ↩︎
CHOUVEL Jean-Marc, « Extrême présence du phénomène : parcours de la forme dans l’oeuvre de Gérard Grisey », in Le temps de l’écoute. Gérard Grisey ou la beauté des ombres sonores, textes réunis par Danielle Cohen Levinas, L’Harmattan/L’Itinéraire, Paris, 2004 p. 71-86. ↩︎
Ibid., p. 41. ↩︎
CHOUVEL Jean-Marc, Analyse musicale, Sémiologie et cognition des formes temporelles, Paris, CNRS / L’harmattan, 2006, p. 137. ↩︎
GRISEY Gérard, La musique, le devenir des sons, op. cit., p. 50-51. ↩︎
BAILLET Jérome, « Partiels de Gérard Grisey », in L’éducation musicale, supplément aux n° 473/474, septembre-octobre 2000, p. 47-56. ↩︎
BAILLET, op. cit., p. 49. ↩︎
Chris CANNAM, Christian LANDONE, and Mark SANDLER, « Sonic Visualiser: An Open Source Application for Viewing, Analysing, and Annotating Music Audio Files », in Proceedings of the ACM Multimedia 2010 International Conference, 2010. ↩︎
Jérôme BAILLET, « Gérard Grisey : Partiels », L’éducation musicale, « baccalauréat 2001 », supplément au n° 473/474, septembre-octobre 2000. ↩︎
Notice de présentation de Dérives (1973-1974) de Gérard Grisey. Cette œuvre est écrite pour petit ensemble et grand orchestre. ↩︎
IMBERTY Michel, La musique creuse le temps… De Wagner à Boulez : Musique, psychologie, psychanalyse, Paris, L’Harmattan, 2005, p. 90. ↩︎
LACHENMANN Helmut, cité par Clytus Gottwald, in Musik-Konzept n°61/62, numéro consacré à « Helmut Lachenmann », sous la dir. de H.-K. Metzger, Münich, oct. 88, p.4. ↩︎
SCHROEDTER Stephanie, « Staging Listening: Corporeal Dimensions of New Music in Choreographies by Xavier Le Roy », Critical Stages, The IATC journal, December 2017, n°16. ↩︎
LALITTE Philippe, « The Unique Aesthetic Character of the Music of Roger Reynolds », in Stephen McAdams et Marc Battier (éds.), Creation and perception of a contemporary musical work: The Angel of Death by Roger Reynolds, Paris, IRCAM-Centre Georges Pompidou (DVD, ± 28 pages), 2005. ↩︎
BIOTEAU Alain, « Spatialisation et écriture de l’espace, des pionniers à Emmanuel Nunes », dans Nicolas Donin et Laurent Feneyrou (dir.), Théories de la composition musicale au XXe siècle, Lyon, Symétrie, 2013, vol. 2, p. 1345. ↩︎
Ibid., p. 1337. ↩︎
REYNOLDS Roger, Form and Method: Composing Music, The Rothschild Essays, Edited by Stephen McAdams, New York, Routledge, 2002. ↩︎
REYNOLDS Roger, Manuscript Sketch of Symphony [Myths] by Roger Reynolds. Internet http://lcweb2.loc.gov/diglib/ihas/loc.natlib.ihas.200029047. ↩︎
LALITTE Philippe, « Implications compositionnelles et perceptives des échelles temporelles locales et globales », in Le rythme, Actes des 2es Rencontres inter artistiques, mars 2005, série « Conférences et séminaires », Paris, Observatoire Musical Français, Université de Paris- Sorbonne, 2006, p. 23-34. ↩︎
MÉLÈSE Pierre, Samuel Beckett, Paris, Pierre Seghers, 1966, p. 138. ↩︎
SODERBERG Stephen, An interview with Roger Reynolds, Beginnings, Library of congress, The Roger Reynolds Collection, 2000. « « impetus, » is one that I used originally in a series of lectures I gave at the Peabody Institute, and the idea was that, ideally, there should be something at the beginning of the work which serves as a genetic seed out of which the work springs. Now I described this in various ways in various publications and on various occasions, but basically an impetus, obviously, from the dictionary, propels something, ignites something, sets something in motion. And what I feel is that an ideal impetus should indicate to you how the thing should evolve – what the process of growth or evolution should be in the project. But it should at the same time provide a global normative or consistency within which choices are shaped and made. So in other words, an ideal impetus both drives the development of the work and contains its potential. […] I’ll give you an example of an impetus in an ideal way- also referring back to Takemitsu – Symphony [Myths]. » ↩︎
MICHEL Pierre, György Ligeti, Paris, Minerve (2ème édition), 1995, p. 93. ↩︎
PENROSE Lionel S. et PENROSE Roger, « Impossible Objects: A Special Type of Illusion », British Journal of Psychology, vol. 49, n^°1, 1958, p. 31–33 ↩︎
Gyor̈gy Ligeti, in Pierre MICHEL, Ibid., p. 193. ↩︎
Ibid., p. 142. ↩︎
LIGETI György, « Concerto de Chambre », in Passages du XXème siècle, première partie, janvier-juillet 1977, Ed. IRCAM et Métiers graphiques, 1977, p. 101. ↩︎
Ibid., p. 151. ↩︎
DAMBRICOURT Jean-Pierre, « György Ligeti et le Kammerkonzert pour treize instruments », Éducation musicale 462-463, Septembre-Octobre 1999, p. 40-52. ↩︎
Ibid., p. 47. ↩︎
DELCAMBRE-MONPOËL Marie, « György Ligeti, Kammerkonzert », Musurgia, vol. VI, n° 3-4, 1999. p. 112. ↩︎
Op.cit. p. 48. ↩︎
MICHEL Pierre, György Ligeti, op.cit., p. 144. ↩︎
DELCAMBRE-MONPOËL Marie, « György Ligeti, Kammerkonzert », op. cit., p. 109. ↩︎
BOULEZ Pierre, « Le Temps Musical », 1978-02-17-1978-02-23, Conférence du 17/02/1978 autour du Kammerkonzert de Ligeti, Centre Georges Pompidou, Paris. https://medias.ircam.fr/embed/media/xfdefef_kammerkonzert-gyorgy-ligeti ↩︎
JOUBERT Muriel, « Le Kammerkonzert pour treize instrumentistes de Ligeti : une écriture d’une grande rigueur. In Musurgia », Pratique et Analyse Musicale, Vol. 8, n°1, 2001, p. 61. ↩︎
AROM Simha, « Les musiques traditionnelles d’Afrique centrale », Contrechamps, janvier 1988, n°10, p. 180. ↩︎
Ibid., p. 194. ↩︎
Site internet du marchand du logiciel : https://cycling74.com/downloads/#.VzxxgPmLSM8, consulté le 15 mai 2017. ↩︎
BIGAND Emmanuel, VIEILLARD Sandrine, MADURELL François, MAROZEAU Jeremy, DACQUET Alice, « Multidimensional scaling of emotional responses to music: the effects of musical expertise and of the duration of the excerpts », Cognition and Emotion, Vol. 19, n°8, 2005, p. 1113-1139. ↩︎
BEYRAND Chloé, « Comment sont véhiculées les émotions dans la texture de la musique contemporaine? », Mémoire de Master 1 sous la direction de Philippe Lalitte, 2016. ↩︎
https://www.irdp.ch/institut/coefficient-bravais-pearson-2041.html ↩︎
LALITTE Philippe, Analyser l’interprétation de la musique du XXe siècle, Hermann, Paris, 2015. ↩︎
MALT Mikhail, « Une proposition pour l’analyse des musiques électroacoustiques de Xenakis à partir de l’utilisation de descripteurs audio », dans Iannis Xenakis – The Electroacoustic Music / La Musique électroacoustique, sous la direction de Makis Solomos, L’Harmattan, Paris, 2015, p. 159-198. ↩︎
LALITTE Philippe, BIGAND Emmanuel, KANTOR-MARTYRUSKA Joanna et DELBÉ Charles, « On listening to atonal variants of two Piano Sonatas by Beethoven », Music Perception, Vol. 26, n°3, 2009, p. 223-234. ↩︎
LALITTE Philippe, op.cit. p. 149. ↩︎
GONIN Philippe, Pink Floyd, Atom Heart Mother, Scérén/CNDP, Paris, 2011. ↩︎
LALITTE Philippe, « Outils informatiques et méthodes pour l’analyse des musiques actuelles », Focus sur le rock en France, Éditions Delatour France, Sampzon, 2014, p. 191-213. ↩︎
http://clam-project.org ↩︎
http://marsyas.info ↩︎
http://psysound.wikidot.com ↩︎
http://www.sonicvisualiser.org ↩︎
http://logiciels.pierrecouprie.fr. ↩︎
LARTILLOT Olivier et TOIVIAINEN Petri, « A Matlab Toolbox for Musical Feature Extraction From Audio », in International Conference on Digital Audio Effects, Bordeaux, 2007. ↩︎
LERCH Alexander, An Introduction to Audio Content Analysis, New York, John Wiley, 2012. ↩︎
LALITTE Philippe, op. cit., p. 201. ↩︎
LALITTE Philippe (2015), op.cit., p. 152. ↩︎
PINEAU Marion & TILLMANN Barbara, Percevoir la musique : une activité cognitive, Paris, L’Harmattan, 2001. ↩︎
FRANCÈS Robert, La Perception du Rythme. Paris : Vrin, 1958. ↩︎
ZENATTI Arlette, Psychologie de la musique, Paris, France : Presses universitaires de France, 1994. ↩︎
SIMARD France, CHEVALIER Nicole et DESPINS Jean-Paul, Performance musicale : le chant préalable à l’apprentissage instrumental. http://www.jfrem.uottawa.ca/texte_jfrem2009_simard_france.pdf ↩︎
DOWLING, JAY. Walter, La structuration mélodique : perception et chant. (P.-E. Dauzat, trad.). In A. Zenatti (Ed.), Psychologie de la musique, Paris : PUF, 1994, p. 145-176. ↩︎
ZENATTI Arlette. « Aspects du développement musical de l’enfant dans l’Histoire de la psychologie au XXe siècle », in Education musicale et psychologie de la musique, Revue internationale Les sciences de l’éducation pour l’ère nouvelle n°6, CERSE, Université de Caen, 1990, p. 35-36, cité par RIBIERE-RAVERLAT Jacquotte. ↩︎
GIORDAN, André, Apprendre ! Paris, Belin, coll. Débats, 1998. ↩︎
PIAGET Jean, Naissance de l’intelligence chez l’enfant, Paris, Delachaux et Niestlé, Actualité pédagogiques et psychologiques, 1977. ↩︎
DELALANDE François, La musique est un jeu d’enfant, Paris, Buchet/Chastel, coll. Bibliothèque de Recherche musicale, 1984. ↩︎
PIAGET Jean, La formation du symbole chez l’enfant, Neuchâtel, Delachaux et Niestlé, 1945. ↩︎
WALLON Henri, « Importance du mouvement dans le développement psychologique de l’enfant », Enfance, réédit. in Enfance, 1959, 3-4, p. 235-239. ↩︎
CELESTE Bernadette, DELALANDE François, DUMAURIER Elisabeth, L’enfant, du sonore au musical, Paris, Buchet/Chastel-INA, coll. Bibliothèque de Recherche Musicale, 1982, p 165. ↩︎
AFSIN Kémâl, « Psychopédagogie de l’écoute musicale ». Orphée Apprenti, Atelier du GRIAM, Octobre 2010, p. 42. ↩︎
ANDERSON M. William. & LAWRENCE E. Joy, Integrating music into the elementary classroom (7e éd.), Belmont, Thomson Higher Education, 2007. ↩︎
JACQUES-DALCROZE Emile, Notes bariolées. Genève, Edition Jeheber, 1948. ↩︎
AGOSTI-GHERBAN Cristina, L’éveil musical, une pédagogie évolutive, Paris, L’Harmattan, 2000, p.18. ↩︎
WUYTACK Jos, Musica Viva. Pour une éducation musicale active. Volume 1 : Sonnez…battez. Paris, Alphonse Leduc, 1970. ↩︎
WUYTACK Jos, Musica Viva. Pour une éducation musicale active. Volume 2 : Expression rythmique. Paris, Alphonse Leduc 1970. ↩︎
COMEAU Gilles, Comparaison de trois approches d’éducation musicale, Jaques-Dalcroze, Orff ou Kodály ?, Vanier: CFORP, 1995. ↩︎
ORFF Carl et KEETMAN Guild, Musik fur Kinder, B. Schott’s Söhne, Mainz, vol. 1, 1950, 164 p., vol. 2, 1952, 127 p., vol. 3, 1953, 128 p., vol. 4, 1954, 158 p., vol. 5, 1954, 152 p. ↩︎
SZŐNYI Erzsébet, Quelques aspects de la méthode de Zoltan Kodály : application de ses principes à l’éducation musicale, Ed. Corvina, 1976. ↩︎
RIBIERE-RAVERLAT Jacquotte, L’Éducation musicale en Hongrie, 2e éd., A. Leduc, Paris, 1977 ; Chant-Musique, adaptation française de la méthode Kodály, Paris, Leduc, 1975-1980, 5 volumes ; Un chemin pédagogique en passant par les chansons, 500 chansons folkloriques de langue française choisies et classées progressivement pour servir de base à une adaptation française de la méthode Kodály, Paris, Leduc, 1974-1981, 4 volumes ; Développer les capacités d’écoute à l’école, Ecoute musicale, écoute des langues, PUF, 1997. ↩︎
BARKÓCZI Llona. & PLÉH Csaba, Etude de l’effet psychologique de la méthode d’éducation musicale de Kodály. Kecskemét : Institut de pédagogie musicale Zoltán Kodály, 1982. ↩︎
KODÁLY Zoltán, The selected writings of Zoltán Kodály, Halapy, Lili (trad.), Macnicol, Fred (trad.), Boosey & Hawkes, 1974. ↩︎
KODÁLY Zoltán, Music should belong to everyone. IKS: Budapest, 2002, p. 50. ↩︎
AGOSTI-GHERBAN Cristina, op. cit., p 16. ↩︎
WILLEMS Edgar, L’oreille musicale 2, la culture auditive, les intervalles et les accords, Ed. Pro Musica: Genève, 1940. ↩︎
WILLEMS Edgar, L’éducation musicale nouvelle (2^e éd.), Fribourg, Pro Musica, 1968, p. 24. ↩︎
SEASHORE Carl E., The Psychology of musical talent, New York, Silver Burdett, 1919. ↩︎
GORDON Edwin, Learning sequences in music: A music learning theory, Chicago, GIA Publications, 2003. ↩︎
SLOBODA John A., L’esprit musicien : la psychologie cognitive de la musique, op.cit. ↩︎
WILLEMS, L’éducation musicale nouvelle, op. cit., p. 20-21. ↩︎
CHAPUIS Jacques, De l’Initiation musicale au Solfège vivant, Panorama Pédagogique de l’Education Musicale Willems, 1, p. 1-8, 1980. ↩︎
AFSIN Kémâl, Psychopédagogie de l’écoute musicale, Bruxelles, De Boeck Université, 2009. ↩︎
JOLIAT François, « La genèse et le développement de l’éducation musicale à l’école : entre l’enseignement de l’art et l’éducation par l’art en Suisse romande », in M. Mellouki & A. Akkari (Ed.), La recherche au service de la formation des enseignants, Actes de la recherche, Vol. 7, 2009, p. 195-217. ↩︎
CHEVAIS Maurice, Education musicale de l’enfance (Vol. 1), Paris, Leduc, 1937. ↩︎
CHEVAIS Maurice, L’art d’enseigner (Vol. 2), Paris, Leduc, 1943. ↩︎
FIJALKOW Claire, « Du plaisir et de la méthode avant toute chose… » in C. Fijalkow (Ed.), Maurice Chevais (1880-1943) : un grand pédagogue de la musique, Paris, L’Harmattan, 2005, p. 69-92. ↩︎
MIALARET Jean-Pierre, « Maurice Chevais et la didactique de la musique à l’école », In C. Fijalkow (Ed.), Maurice Chevais (1880-1943) : un grand pédagogue de la musique, Paris, L’Harmattan, 1995, p. 93-106. ↩︎
CHEVAIS, 1943, op. cit., p. 96. ↩︎
MARTENOT Maurice & SAÏTO Christine, La relaxation active ou kinésophie : le corps, expression de l’être, Paris, Le Courrier du Livre, 2004. ↩︎
MARTENOT Maurice, Principes fondamentaux de la formation musicale et leur application, Paris, Magnard, 1996. ↩︎
MARTENOT M. op.cit., p.19. ↩︎
SÉGUIN Édouard, Traitement moral, hygiène et éducation des idiots, Paris, J. B. Balliere, 1846. ↩︎
MONTESSORI Maria, L’enfant, Paris, Desclée de Brouwer, 1936, 12^e éd., tr. G.J.J. Bernard. ↩︎
MATHIEU Louise, « Un regard actuel sur la rythmique Jacques-Dalcroze », Recherche en éducation musicale, N°28, Décembre 2010, p. 17. ↩︎
JACQUES-DALCROZE Émile, Le rythme, la musique et l’éducation. éd. Foetisch, Lausanne, 1965 (original 1920). ↩︎
BRICE Marie, Pédagogie de tous les possibles… La Rythmique Jacques-Dalcroze, Editions Papillon, Genève, 2012. ↩︎
BACHMANN Marie-Laure, La Rythmique Jaques-Dalcroze, une éducation par la musique et pour la musique. A la Baconnière, Neuchâtel, 1984. ↩︎
JACQUES-DALCROZE Émile, Notes bariolées, Jeheber, Genève, 1948. ↩︎
DUTOIT-CARLIER Claire-Lise. Emile Jaques-Dalcroze, créateur de la rythmique. A la Baconnière, Neuchâtel, 1965, p. 391. ↩︎
Op. Cit., BACHMANN Marie-Laure, p. 91. ↩︎
Op. Cit., BRICE Marie, p. 27. ↩︎
JACQUES-DALCROZE Émile, « La technique corporelle de la rythmique », Le Rythme, 1926, n°17, p. 2-3. ↩︎
JACQUES-DALCROZE Émile (1919), « Avant-propos », in JACQUES-DALCROZE, 1965, p. 5-8. ↩︎
JUNTUNEN Marja-Leena. « Embodiment in musical knowing: how body movement facilitates learning within Dalcroze Eurhythmics. » British Journal of Music Education. Vol.21, n°2, July 2004, p. 199-214. ↩︎
Ibid., p. 200. ↩︎
Op. Cit., Louise MATHIEU, p. 23. ↩︎
DAMASIO Antonio R. L’Erreur de Descartes. La raison des émotions. Paris : Odile Jacob, 1995. ↩︎
Lors d’une journée « Musique, Langage et Surdité » organisée par Daniele Schön (Institut de Neuroscience des Systèmes, Marseille) en Novembre 2016, nous avons été invités, Emmanuel Bigand et moi, afin de communiquer sur notre travail. C’est aussi à Marseille que nous avons pu participer pour la première fois à un atelier sur la méthode Dalcroze animé par Anne Gabrielle Peter-Chatoux. Nous avons par la suite suivi cette initiation au Conservatoire de Vincennes. ↩︎
LELEU Claire et PETER-CHATOUX Anne Gabrielle, « La méthode Jacques-Dalcroze aujourd’hui », Revue de l’APEMU, 2017, p. 51-53 ↩︎
KUBIK Suzana, « Vivre, ressentir, comprendre : l’enseignement musical selon la rythmique Dalcroze », Dossier Éducation musicale dans le monde, publié en ligne le 17 février 2017, France Musique. https://www.francemusique.fr/savoirs-pratiques/vivre-ressentir-comprendre-l-enseignement-musical-selon-la-methode-dalcroze-32139 ↩︎
PERRAUDEAU Sandrine, « Un Atelier Musical avec les enfants sourds », Connaissances Surdités, décembre 2012, n°42, p. 24. ↩︎
CELESTE Bernadette, DELALANDE François, DUMAURIER Elisabeth, L’enfant, du sonore au musical, Paris, Buchet/Chastel-INA, coll. Bibliothèque de Recherche Musicale, 1982, p. 165. ↩︎
KOTZ Sonja A. E. & SCHWARTZE Michael, « Differential Input of the Supplementary Motor Area to a Dedicated Temporal Processing Network: Functional and Clinical Implications », Frontiers in Integrative Neuroscience, Vol. 5, 2011, p. 86. ↩︎
SPAULDING Sandy J., BARBER Brittany, COLBY Morgan, CORMACK Bronwyn, MICK Tanya & JENKINS Mary E., « Cueing and Gait Improvement Among People with Parkinson’s Disease: A Meta-Analysis », Archives of Physical Medicine and Rehabilitation, Vol. 94, 2012, p. 562-570. ↩︎
DUNCAN Ryan P., EARHART Gammon M., « Are the effects of community-based dance on Parkinson disease severity, balance, and functional mobility reduced with time? A 2-year prospective pilot study », Journal of alternative and complementary medicine, Vol. 20, n°10, p. 757-763. ↩︎
LAZAROU Loulietta, PARASTATIDIS Themis, TSOLAKI Anthoula, GKIOKA Mara, « International Ballroom Dancing Against Neurodegeneration: A Randomized Controlled Trial in Greek Community-Dwelling Elders With Mild Cognitive impairment », American Journal of Alzheimer’s Disease & Other Dementias, Vol. 32, n°8, p. 489-499. ↩︎
HUMPHREY Doris, Construire la danse [The Art of making dances, 1959], Paris, L’Harmattan, 1998, p. 126. ↩︎
PIAGET Jean, Naissance de l’intelligence chez l’enfant, op. cit. ↩︎
JAQUES-DALCROZE Emile. « La rythmique et la plastique animée », Le rythme, la musique et l’éducation, 1965, p. 137. ↩︎
SCHAEFFER Pierre, Traité des objets musicaux, Paris, Seuil, 1966. ↩︎
PROULX Monique Désy, Pourquoi la musique ? Son importance dans la vie des enfants, op. cit., p. 219. ↩︎
FINNEY John, « John Paynter, music education and the creativity of coincidence », British Journal of Music Education, Vol. 28, n°1, 2011, p. 11-26. ↩︎
SHAFER Raymond Murray, Le paysage sonore, le monde comme musique (The Tuning of the World, 1977), Marseille, éditions Wild Project, 2010. ↩︎
DELALANDE François, La musique est un jeu d’enfant, op. cit. ↩︎
FRAPAT Monique, L’invention musicale en maternelle, Centre régional de documentation pédagogique de Versailles, 1990. ↩︎
DESROCHES Monique, STÉVANCE Sophie et LACASSE Serge, Quand La Musique Prend Corps. Presses De L’Université De Montréal, 2014. ↩︎
RENARD Claire, Le geste musical, Van de Velde, 1982. ↩︎
SÉRO-GUILLAUME Philippe, Langues des Signes, Surdité et accès au langage, Neuilly-Plaisance, Éd. Du Papyrus, 2008. ↩︎
GOSSELIN Pierre & LE COGUIEC Éric, La recherche création : Pour une compréhension de la recherche en pratique artistique, Québec, Presses de l’Université du Québec, 2006. ↩︎
GIACCO Grazia et LORANT Sonia, « Pour une didactique de la création artistique : Axes, projets, bilan (2014-2016) », Le Ragioni di Erasmus-Revue en ligne de l’Université de Roma 3, Roma TrE-Press, 2017, p. 153-168. ↩︎
TREVARTHEN Colwyn et MALLOCK Stephen, « Musicality: Communicating the vitality and interests of life », Communicative musicality: Exploring the basis of human companionship, New York, Oxford University Press, 2009, p. 1-11. ↩︎
LABAN Rudolph, La maîtrise du mouvement, Arles, Acte Sud, 1994. ↩︎
Ibid., p. 49 ↩︎
Ibid., p. 152. ↩︎
TREHUB Sandra & TRAINOR Laurel, « Singing to infants: Lullabies and play songs », Advances in Infancy Research. Vol. 12, 1998, p. 43-77. ↩︎
STERN Daniel, Le monde interpersonnel du nourrisson, op. cit. ↩︎
DELAROCHE Monique, op. cit., p. 31. ↩︎
GIACCO Grazia, « Geste et voix, entre corps et souffle : pour une didactique de la création artistique », Revue Recherche en éducation musicale, n° 33, Juillet 2016, p. 63-89. ↩︎
Ibid., p. 72. ↩︎
ANZIEU Didier, Le Moi-peau, Paris, Dunod, 1985. ↩︎
LORENZ Konrad, Evolution et modification du comportement, éd. Payot&Rivages, 2007. ↩︎
LAMBERT Nelle et LOTSTRA Françoise, « L’attachement. De Konrad Lorenz à Larry Young : de l’éthologie à la neurobiologie », Cahiers critiques de thérapie familiale et de pratiques de réseaux, Vol. 35, n°2, 2005, p. 83-97. ↩︎
WINNICOTT Donald Woods, « La théorie de la relation parents-nourisson », in De la pédiatrie à la psychanalyse, Paris, Payot, 1969, p. 61. ↩︎
SMITH-BRINDLE Reginald, Serial Composition, op.cit. ↩︎
MORGAN Robert. P., Twentieth-Century Music: a history of musical style in modern Europe and America, op.cit. ↩︎
LESTER Joel, Analytic Approaches to Twentieth-Century Music, op. cit. ↩︎
ROWELL Lewis, Thinking About Music: An Introduction to the Philosophy of Music, op.cit. ↩︎
BREGMAN Alfred S., Auditory scene analysis: The perceptual organization of sound, op. cit. ↩︎
DEHAENE Stanislas, Apprendre ! Le talent du cerveau, le défi des machines, Odile Jacob, 2018. ↩︎
WINNICOTT, Jeu et réalité, NRF Gallimard, Paris, 1975, p. 76. ↩︎
GIACCO Grazia, op. cit., p. 76. ↩︎

mai 29, 2026

Le gospel
1. Introduction

De l’église au studio

FACECAM KLAUS (1)

* morceau iconique du Gospel choisi par Klaus
* script Klaus

2. Contexte historique

a) Emergence

Dans le contexte esclavagiste du Sud profond des États-Unis, où les Africains déportés ont été contraints de reconstruire leur identité, les chants dits « spirituals » émergent comme une réponse culturelle unique. Dépossédés de leurs repères sociaux, les esclaves réinventent des liens communautaires à travers la prière, la spiritualité et la musique. Ces chants de travail ou work songs apparaissent dans les champs de coton au XVIIIᵉ siècle, puis migrent dans les Églises afro-américaines pour devenir les Negro Spirituals.

Contrairement à une perception répandue, ces compositions ne représentent pas une simple continuation de traditions musicales africaines, mais plutôt une assimilation et une réinterprétation sophistiquée de la liturgie protestante anglo-saxonne, composée de rites, cérémonies, prières et chants s’inspirant de l’Ancien Testament (la Bible). Cette transformation s’opère à travers le prisme de l’expérience afro-américaine, donnant naissance à une forme d’expression singulière.

Le gospel (Godspell, évangile) est lui une forme de musique chrétienne qui s’est développée à partir des spirituals, mais traite plutôt du Nouveau Testament, des Évangiles. On y célèbre, dans les églises Baptistes et Pentecôtistes, majoritairement Jesus Christ, même si à l’occasion, on peut évoquer Mary et tous les saints et apôtres (sauf Juda bien sûr !).Le gospel prend véritablement son essor à la fin des années 20, en parallèle du blues. Cette évolution coïncide avec l’urbanisation croissante de la communauté afro-américaine, engendrant des modifications substantielles dans la pratique musicale religieuse.

b) Gospel et Spirituals

Le Spirituals

Le Spirituals est un genre musical sacré développé par les esclaves afro-américains à partir de la liturgie européenne, caractérisé par des structures d’appel-réponse entre un chant soliste et un cœur, des mélodies pentatoniques, et des textes souvent codés faisant référence à la libération tant spirituelle que physique

Thèmes

Toujours liés à l’Ancien Testament, chantent la douleur, l’espoir (par opposition au blues) et la quête de liberté des esclaves

Caractéristiques
- Chants a cappella ou avec un accompagnement minimal (piano ou orgue)
- Transmission orale, souvent improvisés
- Mélodies simples avec des répétitions
Exemples

« Go Down Moses », « Swing Low, Sweet Chariot »

Le Gospel

Le Gospel est un genre musical chrétien apparu plus tardivement (fin XIXe – début XXe siècle) dans le contexte des églises afro-américaines du sud, incorporant des influences du blues, du jazz et plus tard du R&B, avec un accompagnement instrumental plus élaboré et une expressivité vocale caractéristique

Thèmes

Toujours basés sur le Nouveau Testament, célébrant la foi et la délivrance et l’espoir aussi

Caractéristiques
- Incorporation d’instruments modernes (orgue, piano), accompagnés d’un chœur de fidèles
- Arrangements musicaux plus complexes, avec interaction dynamique entre solistes et chœurs (de fidèles)
- Développement d’une dramaturgie musicale élaborée, intégrant un chant puissant, émotionnel, avec des improvisations vocales
- Intégration d’éléments stylistiques du blues et du jazz
Exemples

« Oh Happy Day » et « Amazing Grace », à l’origine une mélodie catholique irlandaise, devenue un pilier des messes afro-américaines

Oh Happy Day (Edwin Hawkins)

Ecoutez
« Oh Happy Day »

« Oh Happy Day» est sans aucun doute plus grand hit de tous les temps, en matière de gospel, a été produit en 1969 par Edwin Hawkins (1943-2018) et son groupe vocal The Edwin Hawkins Singers (chanteuse soliste : Dorothy Combs Morrison), lui qui avait fondé le Northern California State Youth Choir de l’église Church of God In Christ en 1967. Hit gospel certes, mais qui a eu un impact dans toutes les couches de la société, et pas seulement en Amérique du Nord. Le premier succès du genre fut l’omniprésent « When the Saints Go Marching In », un negro spiritual datant des années 20, qui était écouté et joué partout dans le monde.

Lyrics

Oh happy day (Oh happy day)
Oh happy day (Oh happy day)
When Jesus washed (When Jesus washed)
Oh when he washed (When Jesus washed)
When Jesus washed (When Jesus washed)
He washed my sins away (Oh happy day)
Oh happy day (Oh happy day)
Oh happy day (Oh happy day)
Oh happy day (Oh happy day)
Oh when he washed (When Jesus washed)
When Jesus washed (When Jesus washed)
Oh, when he washed (When Jesus washed)
He washed my sins away (Oh happy day)
Oh happy day (Oh happy day)
He taught me how to watch, fight and pray
(Fight and pray)
(And he’ll rejoice every day)
(Every day)
(Every day)
Oh happy day (Oh happy day)
Oh happy day (Oh happy day)
When Jesus washed (When Jesus washed)
Oh when he washed (When Jesus washed)
When Jesus washed (When Jesus washed)
He washed my sins away (Oh happy day)
Oh happy day (Oh happy day)
He taught me how to watch, fight and pray
Fight and pray!
And he’ll rejoice every day
Every day
Every day
Oh happy day (Oh happy day)
Oh happy day (Oh happy day)
Oh happy day (Oh happy day)
Oh happy day (Oh happy day)

When I get to heaven (Oh happy day)
I’m gon’ talk right down, yeah (Oh happy day)
Ask my lord Jesus, all right (Oh happy day)
For my starry ground, oh yeah (Oh happy day)
I ain’t been to heaven (Oh happy day)
That’s what I’ve been told (Oh happy day)
That the streets up there, all right (Oh happy day)
That they’re paved with gold (Oh happy day)
Yeah if you go there (Oh happy day)
Yeah, before I do, yeah (Oh happy day)
Just tell my friends I’m there (Oh happy day)
Then I’m coming too, yeah (Oh happy day)
Oh, oh it was a happy day (Oh happy day)
Oh, it was a happy day, all right (Oh happy day)
Yes a happy day (Oh happy day)
Oh, a happy day (Oh happy day)
Happy day (Oh happy day)
Oh happy day (Oh happy day)
When Jesus washed (When Jesus washed)
Oh when he washed (When Jesus washed)
When Jesus washed (When Jesus washed)
He washed my sins away (Oh happy day)
Oh happy day (Oh happy day)
Oh happy day (Oh happy day)
Oh, good god (Oh happy day)
Oh, Jesus (Oh happy day)
Mmh, yeah (Oh happy day)

Amazing Grace (Elvis Presley)

Ecoutez
Version Elvis Presley

Ecoutez
Version Aretha Franklin

« Amazing Grace » trouve son origine dans l’expérience personnelle de John Newton (1725-1807), ancien capitaine de navire négrier converti au christianisme après avoir survécu à une violente tempête en 1748. C’est en 1772, alors qu’il officiait comme pasteur anglican à Olney en Angleterre, que Newton compose les paroles de ce qui est devenu l’un des hymnes les plus célèbres au monde. L’hymne parut initialement dans le recueil « Olney Hymns » publié en 1779. Les paroles de l’hymne reflètent un thème de rédemption et de grâce divine, des éléments centraux dans la foi chrétienne. Le premier couplet, « Amazing grace! How sweet the sound, that saved a wretch like me! » est souvent interprété comme une expression de gratitude pour la délivrance du péché et des souffrances mondaines. Les communautés afro-américaines ont adopté « Amazing Grace » comme un hymne emblématique de leur expérience de libération et de résilience. Pendant le mouvement des droits civiques et la contestation de la guerre du Vietnam, « Amazing Grace » a pris une dimension politique. Mahalia Jackson, une figure emblématique du gospel, utilisait cet hymne pour galvaniser les marcheurs des droits civiques.

Lyrics

Amazing grace! how sweet the sound,
That saved a wretch; like me!
I once was lost, but now am found,
Was blind, but now I see.

’Twas grace that taught my heart to fear,
And grace my fears relieved;
How precious did that grace appear
The hour I first believed!

The Lord hath promised good to me,
His word my hope secures;
He will my shield and portion be
As long as life endures.

When we’ve been there ten thousand years,
Bright shining as the sun,
We’ve no less days to sing God’s praise
Than when we first begun.

Autres exemples

Go down Moses (Louis Armstrong)

Ecoutez
« Go down Moses »

Lyrics

Go down Moses
Way down in Egypt land
Tell old Pharaoh
To let my people go!
Oh when Israel was in Egypt land
Let my people go!
Oppressed so hard, they could not stand
Let my people go!
So the Lord said, go down (go down) Moses (Moses)
Way (way) down (down) in Egypt land
Tell all Pharaoes
To let my people go (let my people go)
So Moses went to Egypt land
Let my people go!
He made old Pharaoh understand
Let my people go!
Yes the Lord said, go down (go down) Moses (Moses)
Way (way) down (down) in Egypt land
Tell old Pharaoh
To let my people go (let my people go)
Thus spoke the Lord, bold Moses said
Let my people go!
If not I’ll smite, your firstborn dead
Let my people go!
God the Lord said, go down (go down) Moses (Moses)
Way (way) down (down) in Egypt land
Tell old Pharaoh
To let my people go!
Way down in Egypt land
Tell old Pharaoh
To let my people go

Swing Low, Sweet Chariot

Ecoutez
Version Sam Cooke

Ecoutez
Version Fisk Jubilee Singers

Lyrics

Swing low, sweet chariot
Coming for to carry me home
Swing low, sweet chariot
Coming for to carry he home x 2
I looked over Jordan and what did I see
Coming for to carry he home
A band of angels coming after me
Coming for to carry me home
Swing low, sweet chariot
Coming for to carry me home
Swing low, sweet chariot
Coming for to carry me home
If you get there before I do
Coming for to carry me home
Tell all my friends I’m coming too
Coming for to carry me home
Swing low, sweet chariot
Coming for to carry me home
Swing low, sweet chariot
Coming for to carry me home

3. Définition

(FACECAM KLAUS 2)

a) Essence et marqueurs musicaux

Dès le début, les colons blancs ont ainsi converti les esclaves afro-américains de force, à la religion chrétienne, en leur imposant d’aller à l’église et en leur apprenant la liturgie (la Bible), en anglais bien sûr, eux qui ne parlent pas encore bien la langue de leurs maîtres. Ils vont ainsi rapidement participer activement aux offices, leur riche culture du chant et de la musique leur permettant de s’y adapter facilement.

Les chants religieux, les cantiques (les hymnes), sont alors repris en chœur par ces esclaves, qui vont finir par les prendre en main au XIXᵉ siècle, les remanier en leur insufflant un caractère plus africain, avec là aussi prédominance d’une pulsation où l’on valorise les syncopes (after beat) sur les temps 2 et 4 plutôt que sur les temps forts sur les temps 1 et le 3. On va y trouver également la recherche de la transe mystique par la répétition des motifs en boucle et le rythme très marqué (danse). Quand la pulsation du blues et du jazz est le plus souvent ternaire, le gospel va, lui, « retourner » à la pulsation binaire, plus vivante, plus sautillante. On est dans la joie et l’espérance, on saute et l’on danse plutôt que l’on traîne des pieds dans le désespoir et l’affliction. On y roule (rock) et on y balance (roll) déjà avec entrain, en faisant du bruit (rattle), certes, mais du holy noise.

Les premiers chants collectifs sont nés dans les plantations, où le travail est particulièrement pénible, cette expression musicale étant un moyen de communication premier entre des déracinés ne parlant pas la même langue (ils sont de provenances diverses), en tout cas dans un premier temps.

Des églises vont être réservées aux noirs et de nombreuses congrégations religieuses, des paroisses (communities), vont s’assembler et célébrer des messes chaque fin de semaine (« Sunday I Go To Church, I Kneel Down And Pray »). Lorsque le pasteur prononce son sermon, les fidèles répondent en tapant dans leurs mains (ou dans un tambourin, un tambour de Basque amené en Amérique par les Espagnols), et s’expriment non pas d’une voix douce et rentrée, mais fortement et avec énergie, de manière à bien remplir l’église de leurs voix, dans le but de faire vibrer les âmes (soul) des participants. Le chœur est bien sûr accompagné par l’orgue (church organ), le piano ou plus rarement l’harmonium, instrument exclusif qui se doit de trôner dans chaque église ou temple aux États-Unis.

4. Quand le Gospel sort de l’église

a) Le crossover

Le terme « crossover » dans le contexte du gospel désigne le phénomène par lequel des chansons ou des artistes, initialement confinés à la sphère religieuse, transposent les textes séculiers du gospel pour le sortir des églises et entrer dans les charts grand public et toucher des auditeurs de divers horizons. Ce mouvement a non seulement transformé la carrière de ces artistes, mais a également donné naissance à des labels et des studios emblématiques qui ont façonné l’industrie musicale, dont notamment Motown Records et Stax Records. Un exemple emblématique de ce phénomène est la chanson « Hallelujah I love Her so » de Ray Charles, qui a connu un immense succès commercial en 1957, dans laquelle Ray Charles chante l’amour d’une femme et non plus de Jesus.

Ray Charles : « Hallelujah I Love Her so » :

Sam Cooke : « A Change is Gonna Come » :

En inventant chacun une forme de soul qui leur est propre, ces artistes « crossover », quittant des groupes vocaux de Gospel pour faire carrière en solo, sont amenés à inventer une nouvelle forme de musique : le gospel profane, séculier, laïc, qui a tendance à rejoindre la forme évoluée du blues qu’est le Rhythm & Blues.

Dans un premier temps, ces paroissiens sortent de l’église pour aller donner des concerts de Gospel puis franchissent le pas en entrant dans le show business (par la petite porte : ils sont noirs), en développant une musique très semblable au Gospel mais aux paroles tout autres. On y célèbre la belle petite du coin plutôt que Jésus sur sa croix, l’amour physique (et même la grivoiserie) plutôt que la ferveur religieuse et le confinement dans le culte. Ces artistes s’adressent alors au grand public, le public pop, majoritairement blanc, auquel ils peuvent vendre leur production, quand ils ne peuvent pas vraiment le faire en restant dans le domaine du Gospel pur et dur.

Ces artistes ont contribué dans un premier temps à populariser le gospel en dehors des églises, en se produisant dans des salles de concert et en enregistrant des disques, donnant naissance à la soul.

b) Atlantic Records : creuset du Rhythm & Blues

(FACECAM KLAUS 3)

Rhythm and blues

L’expression « Race Records » a été inventée dans les années 1920 par Ralph S. Peer, alors qu’il travaillait pour Okeh Records. Ce terme désignait les disques de 78 tours commercialisés spécifiquement pour les Afro-Américains, et incluait des genres musicaux tels que le blues, le jazz, et le gospel.

À cette époque, les enregistrements de musique étaient principalement destinés à un public blanc, mais le succès de certains artistes afro-américains a démontré le potentiel commercial de la musique afro-américaine. Cela a conduit plusieurs maisons de disques à créer des lignes de « Race Records » pour répondre à cette demande croissante. En renommant cette catégorie en « Rhythm & Blues Records » en 1949, Jerry Wexler consacre un genre musical en l’affranchissant des considérations communautaires.

Jerry Wexler (1917 – 2008), né Gerald Wexler, était un journaliste musical pour le magazine Billboard, devenu producteur de musique, et une figure majeure de la musique populaire américaine des années 1950 aux années 1980. Il est célèbre pour avoir signé et/ou produit de nombreux artistes emblématiques tels que Ray Charles, Aretha Franklin, Led Zeppelin, et Bob Dylan. En 1953, il est devenu associé chez Atlantic Records, où il a joué un rôle crucial dans le développement de la maison de disques en une force majeure de l’industrie musicale.

Au cours des années 1960, Wexler a travaillé avec des artistes comme Wilson Pickett et Aretha Franklin, produisant des albums acclamés tels que « Dusty in Memphis » de Dusty Springfield.

En 1987, il est intronisé au Rock and Roll Hall of Fame, reconnaissance de son immense contribution à la musique.

Atlantic Records

Atlantic Records a été fondé en 1947 par Ahmet Ertegun et Herb Abramson à New York. Dès ses débuts, le label s’est concentré sur le jazz moderne, mais il a rapidement élargi son répertoire pour inclure le rhythm and blues, le gospel et la soul.

L’une des contributions majeures d’Atlantic Records a été de populariser le gospel et la soul en signant des artistes influents comme Ray Charles, qui a fusionné le gospel avec le rhythm and blues pour créer un son unique. Des chansons comme « What’d I Say » et « I Got a Woman » ont repoussé les frontières sociales et ont établi la réputation de Ray Charles comme une légende de la musique.

Atlantic Records a également joué un rôle crucial dans la carrière d’Aretha Franklin, souvent surnommée la « Reine de la Soul ». Sous la direction de Jerry Wexler, Aretha Franklin a enregistré des succès emblématiques tels que « Respect » et « Chain of Fools », qui ont solidifié sa place dans l’histoire de la musique soul.

Le label a contribué à briser les barrières raciales dans l’industrie musicale en mettant en avant des artistes afro-américains et en favorisant l’intégration musicale.

c) Le Doo-wop

Certains chanteurs (auteurs-compositeurs) exécutent le crossover et pénètrent résolument dans le show business (les variétés) et même le rock naissant dans les années 50.

C’est alors que des groupes vocaux vont créer un genre nouveau, le doo-wop, puis diverses formes de soul music (la musique de l’âme), chacun apportant sa pierre au nouvel édifice.

Une émanation du gospel

Dans les années 1930 va fleurir une première génération de groupes vocaux – essentiellement des quatuors et, a cappella, qui manifestement sortent de l’église (noire) et qui vont être les précurseurs d’un nouveau genre apparaissant au début des années 50 : le doo-wop. Le terme « doo-wop » est une onomatopée évoquant les sons émis par le groupe pour soutenir le soliste. Dérivé des negro spirituals, c’est une une variante du rhythm and blues et du rock and roll, populaire durant les années 1950 et 1960. Ce style est généralement interprété par de petits ensembles vocaux comprenant un soliste ténor qui chante la mélodie, tandis que trois ou quatre autres chanteurs produisent des harmonies en arrière-plan. Les harmonies vocales dans le doo-wop se font écho ou se succèdent sous le chant principal. Les voix de second ténor et de baryton se mélangent, le ténor aigu se superpose au chant principal, et la basse résonne en dessous.

Les origines du doo-wop remontent aux enregistrements des Mills Brothers et des Ink Spots dans les années 1930 et 1940. Les Mills Brothers ont mis sur le devant de la scène une technique vocale étonnante consistant à imiter les instruments d’orchestre comme les vents, la contrebasse (le tuba) ou la batterie, tandis que les Ink Spots ont établi la prédominance du ténor et de la basse. L’influence de ces derniers est perceptible dans les premiers enregistrements de rhythm and blues des Ravens dans les années 1940, ou dans les reprises de certains de leurs tubes, telles que « My Prayer » par les Platters en 1956, véritable hit mondial porté par un chanteur lead merveilleux , le ténor Tony Williams, qui prêche comme à l’église et « If I Didn’t Care » par les Moments en 1970.

Le groupe vedette masculin de la Motown des années 1960 et 1970, les Temptations, a également adopté une couleur vocale inspirée de ce style doo-wop classique.

Il existe également une école de doo-wop féminin, représentée par des groupes tels que les Chantels, les Shirelles, ainsi que Patti LaBelle et les Bluebelles.

The Mills Brothers

Les Mills Brothers
Crédits : Domaine Public, William Morris Agency (management)/Photo by Maurice Seymour, New York.

The Mills Brothers, pionniers du jazz vocal et de la pop traditionnelle, ont marqué l’histoire de la musique avec leur son unique et leurs harmonies impeccables. Originaires de Piqua, Ohio, les frères John Jr., Herbert, Harry et Donald Mills commencent à chanter ensemble dès leur plus jeune âge, influencés par leur père, John Sr., qui dirige un quartet de barbershop.

Leur carrière décolle en 1931 lorsqu’ils signent un contrat avec CBS Radio, devenant ainsi les premiers artistes noirs à avoir leur propre émission nationale. Leur premier grand succès, « Tiger Rag », les propulse sur le devant de la scène musicale.

Parmi leurs nombreux succès, on compte « Paper Doll », « Glow Worm » et « You Always Hurt the One You Love », qui deviennent des classiques intemporels. Leur influence s’étend au-delà du jazz, touchant la pop et le R&B, et inspirant des générations d’artistes. Les Mills Brothers continuent à se produire et à enregistrer jusqu’aux années 1980, laissant un héritage musical riche et influent. Ils sont intronisés au Vocal Group Hall of Fame en 1998, en reconnaissance de leur contribution exceptionnelle à la musique.

Mills Brothers : « Tiger Rag »

The Platters : « Only You », « My Prayer »

The Coasters

The Coasters
Crédits : Domain Public, TGC-Topps Gum Cards-photo from ATCO Records

Produit par le duo d’auteurs-compositeurs phare du rock and roll, Jerry Lieber et Mike Stoller (des blancs), the Coasters (groupe vocal noir) ont marqué les années 1950 en introduisant un élément absent dans le Gospel (et dans le rock) : l’humour. Leur premier succès, « Down in Mexico », sort en 1956 et pose les bases de leur style unique, mêlant des histoires drôles à des harmonies vocales « Barbershop ». Mais c’est avec des titres comme « Searchin’ », « Young Blood » et « Yakety Yak » que les Coasters atteignent la consécration, devenant des incontournables des charts américains. Leur musique, souvent accompagnée du saxophone de King Curtis, déborde d’une énergie contagieuse. Les Coasters se démarquent également par leur capacité à traverser les genres, influençant aussi bien le doo-wop que le rock ‘n’ roll.

The Coasters : « Along Came Jones », « Charlie Brown », « Yakety Yak »

Barbershop & Close Harmony

(FACECAM KLAUS 4)

Le barbershop est un style de musique vocale a cappella qui se caractérise par des harmonies riches et complexes, appelées « close harmonies ». Le concept de close harmony (littéralement harmonie serrée) désigne un style d’arrangement vocal où les notes chantées par les différentes voix sont très proches les unes des autres en termes de hauteur. Ce type d’harmonie crée une texture sonore riche et dense, souvent utilisée dans les groupes vocaux de jazz, de barbershop et de pop. Le close harmony est particulièrement présent dans les quatuors de barbershop, où les voix sont arrangées de manière à rester très proches les unes des autres, souvent dans une seule octave. Ce style demande une grande précision et une excellente coordination entre les chanteurs, car les notes étant très proches, toute déviation peut être facilement perçue. C’est cette complexité et cette beauté harmonique qui rendent le close harmony si captivant et apprécié des amateurs de musique vocale. Cette tradition trouve ses origines dans les États-Unis à la fin du 19ᵉ siècle, souvent associée aux quatuors masculins qui se produisaient dans les salons de coiffure (d’où le nom « barbershop »).

Historiquement, les salons de coiffure étaient des lieux de rassemblement communautaire, particulièrement dans les communautés afro-américaines du Sud des États-Unis à la fin du 19e et au début du 20ᵉ siècle. Les hommes se réunissaient dans ces salons non seulement pour se faire couper les cheveux, mais aussi pour socialiser, échanger des nouvelles et se divertir. La musique y jouait un rôle central, et les quatuors de barbershop y trouvaient un public captif et enthousiaste. Les performances de barbershop se caractérisent le plus souvent par l’utilisation de quatre voix masculines (pouvant aller jusqu’à six) : le ou les ténor(s) dont un falsetto éventuellement, le lead (ou voix principale), le baryton et éventuellement baryton martin, et la basse. Le ténor chante les notes les plus aiguës, souvent en harmonie avec le lead, qui porte la mélodie. Le baryton ajoute des notes intermédiaires, tandis que la basse fournit les notes les plus graves, créant ainsi une texture harmonique riche et équilibrée. Le répertoire du barbershop inclut souvent des chansons populaires, des ballades et des morceaux de jazz, interprétés avec une précision vocale et une grande expressivité. Ce style musical est également connu pour ses « tags », des finales de chansons prolongées et harmonisées de manière élaborée.

The Four Freshmen :

https://www.youtube.com/@BarbershopHarmony

The Charades : Le doo-wop dans sa variante multicolore, avec une haute-contre en filigrane et des harmonies vocales très Barber Shop (close harmony).

The Charades : « Please Be My Love Tonight »

5. Playlist

a) Les grands groupes de gospel

The Soul Stirrers

Les Soul Stirrers, formés en 1926 à Trinity, Texas, sont reconnus comme l’un des groupes de gospel les plus influents de leur époque. Fondé par Silas Roy Crain, le groupe a rapidement évolué pour inclure des membres tels que Rebert H. Harris, Thomas L. Brewster, Edward Allen Rundless, Jr., et O.W. Thomas. Leur style, mêlant harmonies vocales sophistiquées et improvisations poignantes, a redéfini les standards du gospel.

Dans les années 1930, les Soul Stirrers ont commencé à se faire un nom en enregistrant des chansons pour la Library of Congress sous la direction d’Alan Lomax. Leur popularité a continué de croître, et ils ont signé un contrat avec Specialty Records en 1943, enregistrant des titres mémorables comme « By and By » et « In That Awful Hour ».

L’arrivée de Sam Cooke en 1950 a marqué un tournant décisif pour le groupe. Cooke, avec sa voix suave et émotive, a apporté une nouvelle dimension aux Soul Stirrers. Des chansons comme « Jesus Gave Me Water » et « Touch the Hem of His Garment » sont devenues des classiques instantanés. Cooke a quitté le groupe en 1956 pour poursuivre une carrière solo dans la Soul, mais son passage a laissé une empreinte indélébile.

Après le départ de Cooke, Johnnie Taylor a pris la relève en tant que chanteur principal. Sous sa direction, le groupe a continué à produire des succès et à influencer la scène musicale gospel et soul.

The Drifters

The Drifters (à la dérive) est, avec The Soul Stirrers, l’autre grand groupe vocal Gospel ayant effectué le crossover. Véritables légendes du rhythm and blues et du doo-wop, ils ont marqué les années 1950 et 1960 avec une série de succès inoubliables, malgré de nombreux changements de membres. Plusieurs chanteurs lead sont sortis des Drifters à terme pour faire eux aussi carrière en solo, dans la soul, en particulier les renversants Clyde McPhatter et Ben E. King. Formé en 1953 à New York par Clyde McPhatter après son départ des Dominoes, le premier groupe se fait connaître avec des titres comme « Money Honey » et « Honey Love », qui dominent les charts R&B. Après le départ de McPhatter en 1955, le manager George Treadwell remplace l’ensemble du groupe par les Five Crowns, menés par Ben E. King. Cette nouvelle formation connaît un succès retentissant avec des hits comme « There Goes My Baby », « Save the Last Dance for Me » et « Under the Boardwalk ».

Leur collaboration avec des auteurs-compositeurs de renom comme Carole King, Gerry Goffin, et Doc Pomus contribue à leur succès durable.

The Drifters : « Unchained Melody », « Save The Last Dance For Me », « Under The Boardwalk », « On Broadway » :

Clyde McPhatter and the Drifters: « What Ya’ Gonna Do»

(Benjamin Earl Nelson) Ben E. King : « Stand By Me »

The Golden Gate Quartet

Le Golden Gate Quartet, formé en 1934 à Norfolk, Virginie, est une véritable institution du gospel. À l’origine connu sous le nom de Golden Gate Jubilee Singers, le groupe a été fondé par quatre étudiants : Willie Johnson, William Langford, Henry Owens et Orlandus Wilson. Quartet vocal, chantant généralement a cappella un Gospel authentique, le Golden Gate Quartet va étrangement faire une longue carrière en France, où le groupe s’est installé à la fin des années 50.

Dès 1935, le Golden Gate Quartet commence à se produire dans des églises et à la radio locale, la station WIS à Columbia, Caroline du Sud. Leur popularité croit rapidement et en 1937, ils signent un contrat avec Bluebird Records, enregistrant 14 chansons en deux heures lors de leur première session ! En 1941, ils sont invités à chanter lors de la troisième investiture du président Franklin D. Roosevelt, à l’initiative de la Première Dame Eleanor Roosevelt. Leur influence s’étend à l’international avec leur première tournée européenne en 1955, souvent à guichets fermés. Le groupe a également joué un rôle important en tant qu’ambassadeurs culturels, effectuant des tournées dans 28 pays sous les auspices du Département d’État des États-Unis entre 1958 et 1960.

The Golden Gate Quartet :

« Golden Gate Quartet Gospel Train »

« Joshua Fit The Battle Of Jericho »

« Didn’t it Rain »

The Staples Singers

Créé en 1948 et drivé par « Pops » Staple, auteur-compositeur, chanteur et guitariste, ce groupe vocal familial comprenait ses enfants Cleotha, Pervis, Yvonne et la charismatique Mavis Staples. Leur carrière débute dans les églises de Chicago avec un gospel pur et dur avant de réaliser eux aussi le cross-over, à partir du milieu des années 60 avec une soul très revendicatrice, voire même insurgée, que l’on pourrait tout à fait chanter à l’église. Les Staple Singers ont ainsi marqué l’histoire de la musique avec leur fusion unique de genres et leur engagement social. Ils commencent alors à intégrer des éléments de soul et de R&B dans leur musique, produisant des classiques comme « Respect Yourself », « I’ll Take You There » et « If You’re Ready (Come Go with Me) ». Leur musique, imprégnée de thèmes de justice sociale et de droits civiques, devient la bande-son de nombreux mouvements de l’époque. En 1972, « I’ll Take You There » atteint le sommet des charts, consolidant leur statut de légendes de la musique.

Les Staple Singers continuent à se produire et à enregistrer jusqu’aux années 1990, et leur influence perdure aujourd’hui, portée par la voix puissante et l’engagement indéfectible de Mavis Staples.

The Staple Singers :

« Swing Low Sweet Chariot – aka Let Me Ride »

« Respect Yourself »

« I’ll Take You There »

b) Du Gospel à la soul

Ray Charles Robinson « Ray Charles » (1930 – 2004)

Ray Charles, né Ray Charles Robinson en 1930 à Albany, en Géorgie, est une légende de la musique américaine, souvent surnommé « The Genius ». Aveugle dès l’enfance, probablement à cause d’un glaucome, c’est sans doute le premier à jaillir de l’église (en même temps qu’il sort du blues traditionnel) en effectuant le fameux crossover.

Il va mêler le blues et le gospel au jazz, dans le genre dont il est l’un des créateurs dès la fin des années 40 : la soul. Mais sa soul (que l’on appelle également R&B selon la formule de son producteur d’alors Jerry Wexler), au son nouveau, retourne parfois drastiquement à ses origines avec des morceaux manifestement Gospel, sur lesquels il chante l’amour et la passion amoureuse plutôt que l’adoration du Christ. Attitude qui fera scandale dans la communauté Gospel.

Il signe avec Atlantic Records en 1952, où il a révolutionné la musique avec des titres comme « I Got a Woman » et « What’d I Say ». Son style unique et sa voix rauque ont rapidement fait de lui une icône. En 1960, il enregistre « Georgia on My Mind », qui est devenu l’un de ses plus grands succès et un hymne intemporel.

Il a vendu plusieurs dizaines de millions d’albums, et a été récompensé de douze Grammy Awards, parmi les très nombreuses récompenses et distinctions qu’il reçoit au cours de sa carrière. C’est un des premiers à entrer au Rock’n’Roll Hall of Fame en 1986.

(Raymond Charles Robinson) Ray Charles

« Hallelujah I Love Her So »

« At Newport » : The Right Time »

« Drown In My Own Tears »

Sam Cooke (1931 – 1964)

Sam Cooke, de son vrai nom Samuel Cook, a ajouté un « e » à la fin de son nom lorsqu’il a commencé sa carrière pour s’émanciper de sa connotation historiquement reliée à l’histoire de l’esclavage. De nombreux Afro-Américains, au sortir de l’esclavage, n’avaient qu’un prénom, et furent affublés, au moment des premiers recensements, de patronymes décrivant leurs caractéristiques physiques, leurs métiers, quand ce n’était pas ceux des anciens présidents, ou ceux de leurs maîtres.

Grand rival de Ray Charles, qui deviendra plus célèbre que lui à l’époque, Sam Cooke passe d’abord par la case Gospel, au sein du groupe vocal The Soul Stirrers (en 1951), avec lequel il va déjà, avant de le quitter en 1957, se détacher de l’église. « A Change is Gonna Come », dont Bob Dylan dit qu’il aurait aimé le composer, est la première tentative, à l’époque de la lutte pour les droits civiques en ce milieu des années 60, de « revendiquer » pour le peuple noir. Une chanson politique, en quelque sorte, mais produite en douceur avec force violons. Magnifique et pathétique (« Je suis né au bord de la rivière, dans une petite tente, et depuis, comme la rivière, je n’ai jamais cessé de courir … »).

Sam Cooke est assassiné en 1964, dans de mystérieuses circonstances, il n’a que 33 ans et est au faîte de sa gloire.

(Samuel Cook) Sam Cooke & The Soul Stirrers :

« Jesus Gave Me Water »

« A Change Is Gonna Come »

Wilson Pickett (1941 – 2006)

Le n°2 dans la course au succès de la soul/rhythm and blues, lui aussi dans le Memphis Sound : le hurleur, mais néanmoins magnifique chanteur, à l’instar de James Brown, Wilson Pickett a souvent prêché comme à l’église. Même si on n’aurait pu que difficilement lui attribuer le titre de révérend.

Surnommé « The Wicked Pickett », il est une figure emblématique de la soul des années 1960. Né en 1941 à Prattville, Alabama, il grandit à Detroit où il est influencé par le gospel et les stars du rock and roll comme Little Richard. Pickett commence sa carrière musicale avec le groupe gospel The Violinaires avant de rejoindre les Falcons en 1959, où il se fait remarquer avec « I Found a Love ». Sa carrière solo décolle véritablement avec le hit « In the Midnight Hour » en 1965, coécrit avec Steve Cropper de Booker T. and the MG’s. Ce titre devient un classique instantané et propulse Pickett au rang de star.

Wilson Pickett : « Something You Got »

Percy Sledge : « When A Man Loves A Woman »

Al Green (1946 – )

Al Green
Crédits : Mike Douglas Show, Public domain, via Wikimedia Commons

Formidable auteur-compositeur-interprète, Al Green, surnommé « The Reverend », prend la relève chez Stax à la disparition d’Otis Redding. Né Albert Leornes Greene en 1946 à Forrest City, Arkansas, il grandit dans une famille nombreuse et commence à chanter dès son plus jeune âge.

Sa carrière décolle véritablement lorsqu’il rencontre le producteur Willie Mitchell en 1968, qui l’aide à signer chez Hi Records. Il change le son et la forme du R&B de Memphis et réinvente la soul avec panache et un énorme succès, jusqu’au moment où il décide de retourner à l’église dans les années 70, après avoir survécu à une agression violente. Cet événement le pousse en effet à se consacrer davantage à sa foi, devenant pasteur et intégrant des éléments de gospel dans sa musique. Malgré cette transition qui l’éloigne quelques années du show business, il fait son come-back dans les années 80 avec quelques grands hits, mêlant habilement soul et gospel.

(Albert Leornes Greene) Al Green :

« L.O.V.E. »

« Take Me To The River »

« Lay It Down »

Aretha Franklin (1942 – 2018)

Aretha Franklin
Crédits : Atlantic Records(Life time: Published before 1978 without a copyright notice), Public domain, via Wikimedia Commons

La fille du Révérend Franklin, qui faisait sans doute déjà du Gospel dans le ventre de sa mère, va faire le crossover elle aussi, à l’instigation de son fameux producteur chez Atlantic : Jerry Wexler. C’est ce dernier qui aura l’idée géniale d’emmener Aretha enregistrer à Memphis dans les studios Stax (avec les musiciens du cru) mais aussi à Muscle Schoals, dans le studio Fame (avec les musiciens locaux là aussi : les Swampers). C’est lui aussi qui a l’idée en 1971 d’envoyer Aretha jouer dans le temple des hippies, à San Francisco, le Fillmore West, accompagné par l’orchestre The Kingpins de King Curtis (avec Bernard Purdie à la batterie, Jerry Jemmott à la basse, Billy Preston à l’orgue, Cornell Dupree à la guitare…). Apercevant Ray Charles au premier rang elle le fait monter sur scène pour réinterpréter son hit « Spirit in The Dark » avec lui (Ray Charles improvise alors totalement sur un morceau qu’il ne connaît pas !).

En 1972, un film sur et avec la « Queen of soul » est réalisé par Sydney Pollack. Film qui ne sortira jamais sur les écrans mais dont les enregistrements sonores ont fait l’objet d’une édition phonographique en double album. Aretha y retourne à l’église (une petite église baptiste d’une banlieue de Los Angeles, à Watts), avec le révérend James Cleveland et le Southern California Community Choir). Elle y interprète des grands classiques du Gospel avec une ferveur renouvelée. Une véritable merveille. C’est l’album live de Gospel le plus vendu de tous les temps.

(Aretha Louise Franklin) Aretha Franklin

« Aretha Live At The Fillmore West » : « Spirit In The Dark-reprise »

« Amazing Grace »

« Mary Don’t You Weep »

« Old Landmark »

Solomon Burke 1940 – 2010)

Solomon Burke
Crédits : Atlantic Records, Public domain, via Wikimedia Commons

Solomon Burke, né James Solomon McDonald en 1940 à Philadelphie, a su marier gospel, blues, jazz et country pour créer un son unique. Surnommé The King of Rock‘n’Soul, the Bishop of Soul ou encore The Muhammad Ali of Soul, lui qui a franchi le pas du crossover dans les années 50 retourne en 1964 à ses premières amours : le prêche enflammé. Dès son plus jeune âge, il prêche et anime en effet une émission de radio gospel. En 1961, il connaît son premier succès national avec « Just Out of Reach ». Suivent des titres emblématiques comme « Cry to Me », « If You Need Me » et « Everybody Needs Somebody to Love », qui deviennent des classiques du genre.

(James Solomon Vincent McDonald Burke) Solomon Burke « Everybody Needs Somebody To Love »

c) La reine du Gospel

Mahalia Jackson

Surnommée la « Reine du Gospel », fille de révérend, Mahalia Jackson fait partie de ces artistes qui ont joué un rôle crucial dans la diffusion du gospel au-delà des frontières religieuses. Cette femme noire – femme et noire : deux caractères rédhibitoires à l’époque, va devenir la première grande prêtresse du Gospel, dès ses enregistrements de 1946.

Le 28 août 1963, Mahalia Jackson est présente dans la foule de manifestants rassemblés devant le Lincoln Memorial de Washington pour recevoir le discours de Martin Luther King (« I Have A Dream »). C’est elle qui lui aurait donné l’idée d’improviser la fin de son discours en lui criant : « Parle-leur de ton rêve, Martin ! ». Elle chante par ailleurs à la Maison-Blanche lors de l’intronisation du président John F. Kennedy, ce qui inspirera la grande Aretha Franklin, qui viendra chanter à son tour en 2009 pour l’intronisation d’un président, noir cette fois, Barack Obama. Elle y portera un costume semblable à celui que portait Mahalia Jackson en 1961.

Mahalia Jackson :

« In The Upper Room »

« Didn’t Rain »

« Nobody Knows The Trouble I’ve Seen »

6. Héritage

a) Une influence qui perdure

Le Gospel s’institutionnalise et se renouvelle

(FACECAM KLAUS 5)

Né en Amérique du Nord au début du siècle dernier, dans un contexte anglophone marqué par la lutte contre l’esclavage, le Gospel s’est depuis répandu dans d’autres aires culturelles et linguistiques. C’est ainsi que l’on a vu naître, à partir des années 60, un Gospel francophone, porté par les protestantismes des Caraïbes, de l’Afrique de l’Ouest, du Québec et de l’Europe de l’Ouest. Un genre florissant aujourd’hui encore : on peut en effet assister en fin de semaine à des messes Gospel dans toutes les banlieues de Paris, offices qui rassemblent parfois un nombre impressionnant de fidèles (et d’officiants).

De l’autre côté de l’Atlantique, aux États-Unis, le Gospel n’a jamais vraiment fait son entrée à Broadway, dans ces théâtres new-yorkais où l’on a joué des plays (comédies musicales) par milliers depuis le début du siècle dernier. Le caractère sacré du genre faisant sans doute reculer les artistes et producteurs éventuels. Pourtant, un spectacle Gospel a bien été monté en 1983, avec force vedettes (noires) au chant, en présence d’un récitant fameux : l’acteur Morgan Freeman. Le show (une adaptation de la tragédie de Sophocle « Œdipe à Colone ») a été filmé et enregistré, heureusement. Les acteurs y chantent et les chanteurs y jouent la tragédie dans un Gospel resplendissant.

b) Playlist

Kirk Franklin (1970 -)

Le (encore) jeune Kirk Franklin s’est forgé un empire (en tout cas une église et une société de production) en quelques années seulement. Il compose, produit, arrange et prêche avec une vigueur et une conviction particulièrement communicatives. Il dirige son orchestre et surtout son chœur (The Family) avec un grand savoir-faire, ce qui l’amène à passer allégrement du Gospel traditionnel à un Gospel très « urbain » proche du R&B (new gospel), très soul, mais qui peut toujours être donné lors de messes auxquelles assistent parfois des dizaines de milliers de « fidèles ». Et cela de par le monde ! Surnommé « The Reigning King of Urban Gospel ».

(Kirk Dewayne Franklin) Kirk Franklin « The Fight Of My Life » album :

« Declaration (This Is It) »

« He Will Supply »

Kirk Franklin « The Rebirth Of Kirk Franklin » album :

« Hosanna »

Incroyable mix de Gospel et de jazz (arrangements vocaux très sophistiqués « à la big band »), le groupe vocal Take Six pratique le genre, le plus souvent a cappella, à la perfection, en tout cas dans son merveilleux premier disque, où l’on ne trouve rien à jeter, et continue à tourner aujourd’hui.

Take Six « Do Be Do Wop Bop » album :

« Spread Love »

« Mary »

Formé en 1980 sur le campus d’Oakwood College à Huntsville, Alabama, Take 6 est un sextet vocal qui a redéfini les frontières du gospel et du jazz. Fondé par Claude McKnight, le groupe a rapidement intégré des membres talentueux comme Mark Kibble, Mervyn Warren, Alvin Chea, Cedric Dent et David Thomas.

Leur premier album éponyme, sorti en 1988, a immédiatement rencontré un succès critique et commercial, remportant plusieurs Grammy Awards. Take 6 a collaboré avec des légendes de la musique telles que Quincy Jones, Stevie Wonder et Whitney Houston, consolidant leur statut de pionniers de l’a cappella moderne.

Frank MacComb (1970 -)

Héritier du légendaire auteur-compositeur-interprète et pianiste Donny Hathaway (pourtant méconnu), Frank McComb est un authentique chanteur de Gospel, quand il ne déploie pas sa très funky soul à la Stevie Wonder.

Véritable virtuose de la soul et du jazz né en 1970 à Cleveland, Ohio, il commence à jouer du piano dès son plus jeune âge, influencé par le gospel et les légendes du jazz.

Sa carrière décolle dans les années 1990 lorsqu’il rejoint le groupe Buckshot LeFonque de Branford Marsalis, avec lequel il enregistre deux albums acclamés. McComb se distingue par sa capacité à fusionner des éléments de soul, de jazz et de R&B, créant un son unique et intemporel.

En 2004, il sort son premier album indépendant, « Straight From The Vault », et a collaboré depuis avec des artistes de renom tels que Prince, Chaka Khan et Will Smith, tout en continuant à produire et à enregistrer sa propre musique. Frank McComb est également un pédagogue passionné, transmettant son art au Frank McComb Independent Artist Institute, un programme de master class destiné aux artistes indépendants. Son influence et son talent continuent de résonner, faisant de lui une figure incontournable de la scène musicale contemporaine.

Frank McComb « Love Stories » album :

« His Eye Is On The Sparrow »

c) Le Gospel en image

Gospel At Colonus :

« Live Where You Can »

« Fair Colonus »

Film réalisé par Kirk Browning, 1985

On retrouve les Blind Boys of Alabama, ces vieux routiers du gospel en compagnie des Soul Stirrers dans « Gospel At Colonus ». Les survivants du groupe d’origine (The Five Blind Boys Of Alabama) sont produits par Peter Gabriel dans son label Realworld. Production et qualité sonore assurés.

The Blind Boys Of Alabama « Spirit Of The Century » :

« The Last Time »

Al Green : « Gospel According To Al Green »

Le révérend Al Green fait son retour à l’église, en crossover inverse en quelque sorte, après avoir effectué une rédemption consécutive à des événements révélateurs, à ses yeux, de sa déchéance spirituelle. Lui qui avait fait un énorme succès dans la soul au début des années 70 a failli mourir plusieurs fois, notamment en tombant de scène, et a vu sa petite amie se suicider devant lui…

Film de Robert Mugge, 1984. L’histoire d’une star de la soul qui abandonne sa carrière de chanteur pour devenir un gospel minister.

Voir film
de Robert Mugge, 1984

La preuve que ce l’on dit de lui un peu plus haut n’est pas une « vue de l’esprit » :

Kirk Franklin « The Rebirth Of Kirk Franklin Live »

Film largement primé, ce biopic interprété par un Jamie Fox hallucinant (il chante lui même !), raconte en détail (mais à la manière hollywoodienne) trente ans de la vie du Genius, l’inventeur de la soul.

Ray

Film de Taylor Hackford, 2005. Biopic sur un mythe.

Voir film
de Taylor Hackford, 2005

The Blues Brothers, Film de John Landis, 1980.

The Blues Brothers, premier du nom : le fameux film de John Landis, avec les frères Blues John Belushi et Dan Aycroyd, où l’on peut voir notamment le gratin des survivants de la soul, du blues et du rhythm and blues, parmi lesquels Aretha Franklin (scène d’anthologie dans son restaurant : « Think ! »)

Ray Charles (en patron de pawn shop)

ou James Brown chantant « The Old Landmark » (en révérend endiablé dans l’église de la révélation pour les Blues Brothers : « Can you see the light ? », « What light ? » « The Band, Jake ! The Band ! »)

7. Conclusion

a) À retenir

Le gospel est bien plus qu’un genre musical religieux : c’est la matrice de toute la musique populaire américaine du XXe siècle.

Né dans les plantations sous forme de work songs et de negro spirituals, il s’épanouit dans les églises baptistes et pentecôtistes afro-américaines avant de franchir leurs murs pour conquérir le grand public. Ce mouvement de crossover, incarné par des pionniers comme Ray Charles, Sam Cooke ou Aretha Franklin, donne naissance à la soul, au rhythm and blues, puis irrigue le rock and roll et la pop.

Le doo-wop, les harmonies barbershop, les grands labels comme Atlantic Records : autant d’étapes et d’institutions qui témoignent de la façon dont une musique de foi, portée par des voix afro-américaines, a transformé l’industrie musicale mondiale tout entière, et continue de le faire, de Kirk Franklin à Take Six.

Le gospel reste aujourd’hui vivant et en constante évolution, loin d’être une simple pièce de musée : il résonne chaque dimanche dans les banlieues de Paris comme dans les méga-églises américaines, preuve que la frontière entre le sacré et le profane n’a jamais vraiment cessé de se négocier, note après note.
mai 25, 2026
Entretien avec Patricia Loubière, directrice artistique de Mozaïk Danse
Patricia Loubière coordonne Mozaïk Danse depuis sa fondation en 1999 à Montpellier. Chorégraphe et danseuse hip-hop / contemporain interprète au sein de nombreuses compagnies pendant plus de 12 ans, professeure de danse diplômée d’État en modern jazz, formatrice spécialisée dans l’enseignement de la danse pour des publics en situation de handicap, elle a construit au fil de vingt-cinq ans une pratique singulière, à la croisée de la création artistique exigeante et de l’accessibilité culturelle.

Pour commencer cet échange, pourriez-vous nous retracer votre parcours et ce qui a forgé votre sensibilité à la question de l’accessibilité dans les pratiques artistiques ?

C’est effectivement quelque chose qui s’est construit de façon très organique. J’ai commencé la danse contemporaine et le modern jazz à 12 ans, dans un milieu rural où l’accès aux pratiques artistiques était loin d’être évident à cette époque. Très tôt, j’ai ressenti une gêne face au fait que la danse n’était pas accessible à tous, socialement, culturellement, géographiquement, financièrement. Ce sentiment s’est approfondi quand je me suis tournée vers la danse hip-hop, que j’aimais pour son énergie, ses valeurs et aussi parce qu’elle parlait à tous les corps, sans aucune condition.

Parallèlement, j’ai grandi avec un enfant sourd, placé dans notre famille d’accueil alors que j’avais trois ans, nous avons grandi ensemble. Nous communiquions spontanément, sans que la différence soit jamais vécue comme un obstacle. Je pense que cette expérience précoce d’une communication non verbale naturelle, et la conviction qu’elle m’a donnée que la différence nous enrichit, ont profondément orienté mon rapport au corps et au mouvement.

Y a-t-il eu un moment précis où votre approche de la chorégraphie a basculé vers ce que l’on appelle aujourd’hui la danse inclusive ?

Et en réalité, dès 2000, quand je me suis installée à Montpellier, à mon retour de Paris, j’ai contacté le centre d’éducation spécialisé pour les déficients auditifs de Montpellier : j’ai immédiatement proposé des ateliers de danse à des enfants et adolescents sourds. La danse et la langue des signes sont toutes deux des façons non verbales de communiquer, il me paraissait évident de développer des projets chorégraphiques avec ces publics. Il en est sorti un premier spectacle, Signes en 2024, avec une comédienne sourde et des danseurs entendants. Mais je ne posais pas le mot « handicap » sur ce public , ni n’utilisai le terme danse adaptée/inclusive qui n’existait pas à cette époque, mais aussi car la langue des signes est une langue à part entière, et donc je ne percevais absolument pas ce public comme « handicapé » juste parce qu’ils ont une langue différente…

C’est un peu plus tard vers 2006 où en tant que danseuse interprète, un chorégraphe, à la Maison de la danse de Lyon, nous a fait travailler sur la contrainte physique ou sensorielle (par exemple : danser avec une jambe raide, les mains attachées, sans la vue, etc…) Ce qui m’a frappée, c’est la puissance d’adaptation du corps face à la limitation imposée. La contrainte, loin d’appauvrir le mouvement, devenait source d’inspiration et de créativité. C’est à partir de là que quelque chose s’est vraiment cristallisé pour moi sur le plan artistique en étant convaincue que la danse était accessible à tous et je suis donc partie me former notamment auprès de pionniers en danse inclusive en Angleterre et en Belgique, et tout s’est ensuite enchaîné naturellement.

Vous accordez une grande importance au choix des mots. Quelle distinction faites-vous entre « danse adaptée/inclusive », « inclusion » et « inclusivité » ?

Elle a une portée à la fois pédagogique, éthique et politique. La danse adaptée désigne des ateliers conçus spécifiquement pour des personnes en situation de handicap, avec une pédagogie pensée pour garantir un cadre et un enseignement sécures pour ces publics. La danse inclusive, c’est la danse adaptée en mixité, réunissant au sein d’une même pratique (en ateliers ou sur scène) des danseurs avec et sans handicap .

Ce qu’on espère, c’est qu’un jour ces termes deviennent superflus, et qu’il n’y aura plus besoin de nommer adapté/inclusive… Mais pour l’instant, ils remplissent une fonction concrète : ils permettent aux personnes concernées de savoir qu’elles seront accueillies dans un cours adapté et sécure, , et ils conditionnent également la légitimité à demander des financements car l’accessibilité culturelle a un cout a un coût réel, en termes de moyens techniques, logistiques, humains, compétences.. : formation des professionnels de la danse, formation des équipes d’accueil, des bénévoles, accessibilité des lieux, accessibilité des œuvres (surtitrage, audiodescription, acces pmr, interprete lsf, gilets vibrants…)

L’accessibilité culturelle demande de penser différemment la conception de projets artistiques, en prenant en compte ce besoin d’accessibilité dès le tout début de la conception du projet à tous les niveaux.

Il est aussi important d’impliquer des personnes en situation de handicap au cœur du processus, car il est primordial de ne pas penser et ne pas faire « à la place de », mais « avec » afin de valider les différentes étapes C’est un changement de paradigme profond où l’environnement doit s’adapter aux besoins spécifiques de ces publics et non l’inverse

On oublie souvent que l’accessibilité est aussi une question de logistique lourde et de moyens financiers. Comment gérez-vous cet aspect ?

L’accessibilité a un coût réel qui doit être considéré dès le début d’un projet. Par exemple, pour garantir la sécurité et la qualité pédagogique, nous devons limiter drastiquement le nombre d’élèves par atelier (loin des 20 ou 25 personnes d’un cours classique).

L’accessibilité, c’est aussi :
- Le volet financier : Nous pratiquons des tarifs spécifiques (tarifs réduits ou parfois gratuité selon les projets et partenaires) en fonction des possibilités de chacun car une personne vivant seulement avec l’AAH (allocation adulte handicap) ne peut souvent pas se permettre de financer un cours de danse
- La logistique, salle accessible, lieux accessibles, transport : Nous choisissons des lieux accessibles et formons des bénévoles à l’accueil de ces publics qui ont des besoins spécifiques
- Les ressources humaines, techniques: Faire appel à des professionnels de danse diplômés d’État et formés au handicap, interprètes en Langue des signes française, audiodescriptrices, casques et micro pour l’audiodescription, logiciel de surtitrage et régisseur spécifique, gilets vibrants, personnels d’accueil ou bénévoles formés à l’accueil de publics spécifiques,…
Comment orchestrez-vous la rencontre artistique entre des profils si différents (sourds, handicap moteur, pros, amateurs) ?

Fil Rouge réunissait des danseurs amateurs et professionnels, des personnes sourdes et malentendantes, des danseurs en situation de handicap moteur, et un danseur à la fois malentendant et malvoyant. La première exigence était méthodologique : ne jamais faire à la place des personnes concernées, mais construire avec elles.

Concrètement, cela a supposé plusieurs phases : d’abord sensibiliser les danseurs sans handicap, puis travailler en groupes parallèles, puis croiser progressivement les deux groupes à condition que chacun l’ait choisi librement. La confiance ne se décrète pas, elle se construit étape après étape, et brûler l’une d’elles, c’est compromettre l’ensemble du projet. La notion de temporalité est très importante dans ce type de projet, il est important d’observer, de communiquer, d’être attentif aux besoins, envies, d’être adaptable en permanence, et surtout de prendre le temps et ne jamais forcer quelque chose.

Pourquoi ce choix ?

Parce qu’on s’est rendu compte que les spectacles en salle drainent essentiellement un public déjà convaincu, déjà sensibilisé à ces questions. Or ce n’est pas là que se jouent les représentations dominantes. Ce qui nous intéresse, c’est le tout-public, celui qui passe par là par hasard et se retrouve nez à nez avec des danseurs. L’espace public, lieu du vivre ensemble, est un terrain de transformation des regards bien plus puissant qu’une salle de théâtre pour toucher de nouveaux publics .

À mon avis, le principal frein à l’inclusion dans les arts n’est pas technique ni même financier au fond, il est dans les représentations liées au handicap. Tant que celui -ci sera pensé essentiellement comme une limitation, les décisions qui en découlent, pédagogiques, institutionnelles, artistiques, seront limitantes. Ce que nous essayons de faire, c’est partir des possibles d’une personne, quelle que soit sa singularité corporelle.

Selon vous, quels sont les obstacles les plus tenaces à la professionnalisation de ces artistes ?

Le premier frein reste les représentations mentales. Si l’on regarde le handicap avec pitié ou comme une limite, on ne mettra jamais les moyens nécessaires.

Un autre obstacle majeur en plus de l’accès à la pratique amateur, c’est qu’il n’existe pas à ma connaissance en France de formation professionnelle pour devenir danseur professionnel pour un artiste en situation de handicap. De plus, l’accès et le maintien du statut d’intermittent du spectacle requiert 507 heures de travail sur 12 mois, un seuil déjà exigeant pour n’importe quel interprète, mais qui réellement quasi inaccessible pour beaucoup de danseurs en situation de handicap, dont la fatigabilité, les douleurs chroniques, les risques de blessures ..ne permettent pas ce rythme, outre le fait que seulement quelques compagnies de danse offre des postes pour des artistes chorégraphiques ayant un handicap. On les expose littéralement à des situations de rupture. Ce n’est pas une question de volonté individuelle, c’est une question de droit, de politique et de conception du travail artistique.

Quel message souhaiteriez-vous adresser aux conservatoires ou aux jeunes enseignants qui souhaitent s’engager dans cette voie ?

Que cela parte tout d’abord d’une envie sincère, d’interroger ses propres représentations du handicap et sur ce qu’est un corps dansant… Sur le plan pratique : il est essentiel de se former à la pédagogie de la danse adaptée pour ces différents publics, connaitre ces différents publics, et leurs besoins spécifiques et adaptations nécessaires… Il est primordial aussi de se mettre en réseau avec les structures médico-sociales et associations représentant et œuvrant avec des personnes en situation de handicap, et de travailler en concertation et encore une fois, co-construire ensemble et non pas « à la place ». Également se rapprocher des structures culturelles travaillant déjà (ou non) avec ces publics, tisser un fort maillage de partenaires et ressources. Ne pas sous-estimer la préparation logistique et humaine, prendre en compte la temporalité et définir en amont les étapes indispensables de chaque projet.

Ces projets ont quelque chose d’irremplaçable, ils ramènent de l’authenticité dans nos pratiques artistiques et interrogent profondément nos normes esthétiques, et même au-delà, notre humanité. Ce n’est pas un bénéfice secondaire. C’est au cœur de ce que la danse peut faire. Ces projets artistiques sont porteurs d’une richesse et diversité incroyables , plus qu’urgentes et nécessaires dans nos sociétés !

www.mozaikdanses.fr
mai 20, 2026

L’influence de la vidéo sur la perception d’un défaut sonore temporaire : cas du visionnage d’un concert de musique classique

Conservatoire National Supérieur de Musique et de Danse de Paris : Formation Supérieure aux Métiers du Son

Mémoire de Fin d’Études, présenté par : Benjamin RIBOLET

Sous la Direction de : Corsin VOGEL , Session : juin 2009

Introduction

L’étude de la perception est domaine dans lequel de nombreuses recherches ont été effectuées et sont encore effectuées de nos jours. Alors que notre connaissance du fonctionnement physiologique de nos modalités sensorielles devient de plus en plus précise, de nombreuses théories existent encore sur la manière dont sont traitées les informations. En effet, il ne suffit pas de savoir comment nos sens fonctionnent, car la perception intègre une très grande part de psychologie.

Ce mémoire a pour objectif d’étudier une situation particulière de la perception. Dans notre métier d’ingénieur du son – directeur artistique, nous rencontrons cette situation très souvent : il s’agit de la perception auditive que nous avons d’un document audiovisuel. Plus précisément, il s’agit d’étudier l’influence que peut avoir la vidéo sur notre perception du son et des défauts sonores pouvant apparaître dans la bande son.

Pour cela, il convient en premier lieu d’étudier les différentes théories existantes de la perception ainsi que leur histoire. Nous verrons que toutes ont apporté de précieux éléments pour tenter d’expliquer les mécanismes psychologiques mis en œuvre.

Nous verrons également que l’attention joue un rôle très important en ce qui concerne notre perception du monde extérieur et notre apprentissage, et nous apporterons quelques éléments en ce qui concerne l’étude de la perception multimodale, appelée aussi perception multisensorielle. Nous laisserons volontairement de côté l’étude physiologique des sens, en nous appuyant sur les nombreuses publications qu’il existe à ce sujet.

Dans un second temps, nous tenterons d’élaborer un protocole expérimental qui nous permettra d’étudier la situation que nous venons de décrire, en partant de l’hypothèse suivante : « La perception des défauts sonores est atténuée ou devient nulle lorsque l’on ajoute une information visuelle synchrone : la vidéo. » L’étude des théories de la perception et de l’attention nous aidera à concevoir avec moins de difficulté notre expérience, qui contient de nombreux paramètres qui s’influencent les uns les autres.

Enfin, dans un troisième temps, nous étudierons les résultats et émettrons d’autres hypothèses qui nous permettrons de les expliquer.

Partie I : La perception

Introduction

La perception au sens large du terme a été l’objet de nombreuses études depuis de nombreuses années. Beaucoup de personnes ont en effet envie de savoir comment elles perçoivent le monde complexe qui nous entoure, quels sont les mécanismes qui nous permettent d’appréhender la réalité et d’évoluer dans notre environnement.

Mais il convient de mieux comprendre ce qu’est exactement la perception avant de se lancer dans l’étude de celle-ci. En effet, percevoir est une activité très complexe, même si elle paraît inconsciente et surtout triviale. Elle est la source de tous nos autres comportements comme apprendre, parler, mémoriser ou communiquer.

La perception est le premier degré vers la connaissance, et elle sert d’introduction à tout ce qui en fait le sujet. (Locke, 1690)

Ces considérations sur la perception conduiront les philosophes, puis les psychologues, à élaborer de nombreuses théories à propos de la perception.

Mais Locke s’intéresse également à l’attention. En effet, il constate que lorsque l’esprit contemple fortement un objet, ou lorsqu’il réfléchit à des idées qui se présentent à lui, il ne s’aperçoit plus de l’impression causée par les sons environnants. On voit ici que l’attention est partie prenante dans le phénomène de perception, et également dans le phénomène de mémorisation, que l’on ne traitera pas ici.

Nous nous intéresserons donc à l’histoire des théories de la perception, puis de l’attention, avant de reconsidérer l’étude de la perception dans sa version multisensorielle en lien avec le sujet de ce mémoire.

I – Les Théories de la Perception

1. Approche Psychophysique

La psychophysique peut être considérée comme l’une des premières disciplines visant à étudier la perception, et plus précisément les relations entre les stimuli, objets objectivables et décrits par les sciences de la nature, et les sensations que ceux-ci suscitent chez l’individu.

Cette branche de la psychologie expérimentale trouve son origine dans la publication du livre Elemente der Psychophysik en 1860 par G. T. Fechner, qui a ainsi abordé le problème fondamental de la mesure en psychologie, et a développé des méthodes pour étudier objectivement des éléments subjectifs de perception.

La psychophysique repose principalement sur l’étude des seuils. Fechner distingue alors deux types de seuils :

seuil absolu, qui correspond à la plus petite quantité d’énergie nécessaire à produire une sensation. On passe alors d’une absence de sensation à une sensation ressentie.
seuil différentiel, qui correspond à la quantité d’énergie juste nécessaire pour produire une différence de sensation, une impression nouvelle.

Partant de cela, Fechner a mis au point trois méthodes de mesure des seuils.

1.1 Méthode des limites

Elle consiste à augmenter ou à faire décroître progressivement l’intensité d’un stimulus, et à effectuer le relevé des réponses ou des absences de réponse du sujet. On détermine les seuils de perception selon que l’expérimentateur utilise des séries de stimuli croissantes ou décroissantes, puisque l’on cesse de percevoir plus tard que l’on ne commence (BINET, 1894). Le seuil absolu est alors obtenu en faisant la moyenne de ces deux seuils.

1.2 Méthode des stimuli constants

Cette méthode consiste, à la différence de la méthode des limites, à présenter au sujet une série de stimuli d’intensité aléatoire. Le seuil est alors détecté en demandant au sujet s’il a perçu ou non le stimulus.

1.3 Méthode de l’ajustement

Ici, le sujet doit lui-même ajuster l’intensité d’un stimulus, de manière à ce que celui- ci devienne tout juste perceptible, puis tout juste imperceptible. La moyenne de ces deux intensités peut être alors considérée comme le seuil de détection du sujet pour ce stimulus donné.

À partir de ces méthodes, et en prenant pour référence les travaux de Weber, qui sera le premier à montrer que les accroissements égaux d’excitation sont proportionnels aux accroissements égaux de sensation, Fechner établira la loi aujourd’hui nommée « loi de Weber-Fechner », selon laquelle « la sensation varie selon le logarithme de l’excitation ».

L’amplitude de la sensation (Y) n’est pas proportionnelle à la valeur absolue de l’excitation (B), mais plutôt au logarithme de l’amplitude de l’excitation, quand cette dernière est exprimée en termes de valeur de seuil (b), c’est-à-dire que l’amplitude considérée comme l’unité à laquelle la sensation commence et disparaît. En résumé elle est proportionnelle au logarithme de la valeur de l’excitation fondamentale. (Fechner, 1860)

Les premiers expérimentalistes ont utilisé également les méthodes de l’introspection, qui consiste à tenter de décrire ses propres états mentaux.

Toutes ces méthodes susciteront de vives réactions et conduiront notamment à l’apparition du Behaviorisme.

2. Le Behaviorisme

C’est John Watson qui en 1913 initie le mouvement behavioriste, avec la parution de l’article « La Psychologie telle qu’un behavioriste la voit », dans la revue Psychological Review.

Le terme behaviorisme provient du mot anglais behavior, qu’on traduit par comportement. Ainsi, par rupture, voire par opposition avec le mouvement mentaliste et introspectif, Watson crée une science du comportement qui vise à étudier précisément des éléments observables objectifs, en rejetant les états de l’âme, de l’esprit et de la conscience.

La psychologie, telle que la conçoit le behavioriste, est une branche parfaitement objective des sciences de la nature. Elle a pour objectif théorique la prédiction et le contrôle du comportement. Le behavioriste, dans sa recherche sur le comportement, n’admet pas de ligne de démarcation entre l’homme et l’animal. (Watson, 1913)

Les éléments observables objectifs étudiés seront donc principalement les entrées, que constituent les stimuli appliqués à l’individu, et les sorties, ou réponses de celui-ci. Par extension, les sorties correspondront donc aux réactions, soit au comportement de l’individu. On considère ainsi l’être humain comme une boîte noire, dans le sens où ce qui se passe à l’intérieur de cette dernière est par nature inobservable.

On arrivera très vite alors à la conclusion première que le stimulus suscite une réponse, et ainsi naîtra le concept de stimulus-réponse, si cher aux behavioristes. Ceux-ci lanceront alors une large campagne d’études pour tenter de découvrir les relations entre stimuli et réponses.

Un des champs d’applications les plus importants a été celui de découvrir quels stimuli provoquent des réponses de façon innée, et lesquels provoquent des réponses apprises, conditionnées. L’apprentissage apparaît alors comme une modification du comportement face à un stimulus.

Thorndike¹, Pavlov² et Skinner³ poursuivent l’œuvre de Watson et élaborent certaines théories de l’apprentissage, en tenant compte des sentiments des individus. Ils mettent alors en évidence l’importance de la récompense et de la motivation dans l’apprentissage.

Pour les behavioristes, la perception reste donc un élément inobservable en tant que tel. En revanche, leurs travaux sur les stimuli (qui doivent être perçus) et les comportements résultant des stimuli, et donc de la perception, ont permis d’élaborer certaines théories concernant l’apprentissage, et donc les comportements conditionnés par l’environnement.

Nous allons voir que ces théories ont pu susciter elles aussi de vives réactions, notamment dans les pays germaniques.

3. Le Gestaltisme

Appelée également psychologie ou théorie de la forme, Goethe lui-même en émettra quelques idées fondatrices.

Ce mouvement apparaît en Allemagne, à peu près à la même période que le mouvement behavioriste, à propos duquel un certain nombre de critiques seront faites.

En effet, le gestaltisme s’intéresse tout particulièrement à la « boîte noire » que le behaviorisme avait laissée de côté. Ainsi, on cherchera à savoir de quelle manière l’individu organise les éléments perçus, l’environnement dans lequel il évolue, et non comment ce dernier influence le comportement. Les affects, les états mentaux, prennent alors une importance considérable dans cette étude. C’est d’ailleurs pour cette raison que ce courant sera considéré plus tard comme précurseur du cognitivisme dont nous parlerons un peu plus tard.

La Gestalttheorie établit que la perception est fortement influencée par le contexte, ainsi que par la configuration des éléments perçus. Une partie découlant souvent d’une totalité, cela implique qu’on ne peut nécessairement pas comprendre cette partie en dehors de son contexte, et de ses liens avec la totalité, d’où la loi fondamentale du courant gestaltiste : le tout est différent de la somme des parties qui le constituent.

De même, une partie dans un tout est autre chose que cette même partie isolée ou incluse dans un autre tout. Nous voyons ici que la notion de contexte est ici prépondérante.

En plus de ces constatations, le gestaltisme repose sur quelques affirmations fondamentales. En effet, dans un premier temps, il affirme qu’il existe une distinction de la forme sur le fond au sein de toute expérience perceptive. L’image du vase de Rubin nous donne un exemple tout à fait particulier de ce principe, puisqu’en général, la forme distinguée sera bien celle du vase blanc sur un fond noir, alors que nous pouvons également y voir deux visages se faisant face, sur un fond blanc. Cette distinction figure / fond nous permet donc à tout moment de hiérarchiser notre perception de notre milieu. Ainsi sommes-nous capables, selon les principes gestaltistes, de distinguer une ligne mélodique au milieu d’un brouhaha.

Exemples de vases de Rubin. Une représentation graphique classique

Exemples de vases de Rubin. Une photographie d'un vase avec son ombre. — Exemples de vases de Rubin. Une photographie d’un vase avec son ombre.

A gauche, une représentation graphique classique ; à droite, une photographie d’un vase avec son ombre.

Les Lois de la Forme

Selon la Gestalttheorie, la distinction figure / fond est permise grâce à plusieurs mécanismes, pour nous permettre de trier les informations et de regrouper les éléments. Ces mécanismes sont expliqués dans les lois suivantes (Wertheimer, 1923) :

La loi de proximité : tendance à associer des éléments proches, et à séparer les éléments éloignés.
La loi de similitude : regroupement des éléments semblables et dissociation des éléments différents.
La loi de clôture : tendance à percevoir une forme complète plus facilement lorsqu’elle est parfaitement délimitée
La loi de bonne continuité : capacité à regrouper, à relier de façon naturelle des éléments discontinus. Dans le cas d’une forme visuelle, c’est la capacité à interpréter un trait coupé comme ne l’étant pas.
La loi de destin commun : regroupement d’éléments ayant la même trajectoire. Ces éléments sont alors regroupés au sein de la même forme.
La loi de l’expérience : reconnaît la part jouée par l’apprentissage dans la perception de regroupements. L’expérience permet ainsi de structurer des éléments sans que celle-ci soit influencée par les lois précédentes.
La loi de la bonne forme : capacité à organiser naturellement des éléments en une forme plutôt qu’une autre. Cette forme est en général de nature simple, géométrique et stable.

Pour Wertheimer, ces lois constituent donc les premiers principes de la perception, et ce, sans recourir à l’expérience personnelle. Ces principes seraient donc innés. C’est le courant constructiviste qui étudiera plus précisément les mécanismes de l’apprentissage.

4. L’approche constructiviste

Initié par Jean Piaget, ce mouvement est en partie l’origine des courants de la psychologie cognitive. En effet, on conçoit ici la perception comme étant le résultat d’une construction cognitive de la part de l’individu. Les perceptions sont elles-mêmes élaborées à partir de l’expérience personnelle, à partir d’indices issus de l’observation active du stimulus.

Au début du constructivisme, Piaget s’oppose à la théorie de la Gestalt, car il ne reconnaît pas le caractère inné de la perception, ainsi que les invariances de l’organisation perceptive, énoncées dans toutes les lois de la forme. Cependant, il adhère à la théorie de la totalité dans la figure, à la différence près que pour lui, cette notion dépend encore une fois de l’activité cognitive de l’individu et non de la configuration dans laquelle se présentent le ou les stimuli.

Piaget insiste ainsi sur les notions d’assimilation et d’accommodation. L’assimilation est justement ce qui nous permet de nous forger de nouvelles connaissances, d’intégrer de nouvelles données sur le monde qui nous entoure, à partir de nos différentes expériences perceptives. L’accommodation fait que notre perception est évolutive. En effet, en fonction de nos différentes perceptions, nous allons pouvoir adapter notre comportement et nos activités cognitives aux situations nouvelles. Le constructivisme est ainsi souvent assimilé à une théorie de l’apprentissage, que ce soit dans un cadre scolaire ou par exemple dans le cadre de la perception auditive qui nous intéresse plus particulièrement.

L’acquisition d’une information se traduit par une « perturbation » qui va entraîner chez l’individu un « déséquilibre » du champ cognitif et exiger un travail de synthèse pour assimiler, intégrer, critiquer, admettre, ajouter cette nouvelle dans un champ cognitif alors enrichi. (Jean Piaget, 1940)

5. New Look Perceptif

Cette théorie peut s’inscrire dans la continuité du mouvement constructiviste de Jean Piaget. Élaborée par Jerome Bruner, son origine tient dans une célèbre expérience de 1947 dans laquelle le psychologue découvre que les enfants surestiment la taille de pièces de monnaie par rapport à des disques en carton de la même surface. Par cette expérience, Bruner met le doigt sur l’importance des attentes, des motivations et de la préparation des individus dans la perception.

Pour Bruner, la perception est donc un processus qui consiste à tester des hypothèses à propos du stimulus perçu. Ainsi le sujet attribue une première signification sur la nature de l’objet observé, et qui sera confirmée ou non par des informations complémentaires reçues ultérieurement. Le sujet est alors pleinement acteur de sa perception.

Cependant, il est important de souligner le fait que le sujet formule ses hypothèses à partir de quelques indices, quelques échantillons sur le stimulus, et en aucun cas à partir d’une analyse complète de celui-ci. Ce sont ces premiers indices qui permettent de classifier le stimulus dans une catégorie. En voici un exemple :

Cette chose est ronde, sa surface n’est pas lisse, c’est de couleur orangée, de telle et telle dimension, c’est donc une orange. (Bruner, 1957)

A partir des hypothèses formulées sur certaines caractéristiques de l’objet, nous pouvons faire une première hypothèse sur la nature de celui-ci. Il s’agit d’un passage du particulier au général, des indices à la catégorie, contrairement à la théorie Gestaltiste qui part du général, la forme, pour aller vers le particulier.

De plus, nous voyons ici un premier indice d’une orientation catégorielle et prédictive de la perception, c’est-à-dire qu’à partir des hypothèses, le sujet place directement le stimulus dans une catégorie. À partir de cela, il peut prédire plus précisément ce qu’il pourra percevoir ultérieurement, en se forgeant une idée plus précise du contexte. Le sujet est ainsi dans un état constant de préparation et d’attente.

6. Approche cognitive

6.1. Psychologie cognitive

Comme nous avons pu le voir avec Piajet ou Bruner, la psychologie cognitive consiste à étudier les processus mentaux mis en œuvre lors de la perception, qu’ils soient conscients ou inconscients. Ces processus sont en général le lien entre les entrées sensorielles et les réactions de l’individu. La psychologie cognitive étudie également et plus généralement la manière dont les personnes pensent, mémorisent, apprennent… Elle trouve des liens de parenté à d’autres disciplines comme les neurosciences, la philosophie et la linguistique, qui font elles aussi partie des sciences cognitives.

C’est le psychologue Ulric Neisser qui utilisera le premier le terme de « psychologie cognitive ». Considéré aujourd’hui comme le père de celle-ci, il la définira comme se référant « à tous les processus par lesquels l’input sensoriel est transformé, réduit, élaboré, stocké, rappelé et utilisé ». (Neisser, 1967)

Avec la psychologie cognitive émergent deux concepts très importants du traitement de l’information perceptive : les concepts de processus descendants ou ascendants. On parle encore de processus « bottom-up » (ou « Data-driven) ou « top-down » (ou Theory- driven).

Les processus ascendants sont basés sur l’information seule. Ils représentent un traitement de l’information du bas niveau, qui correspond aux caractéristiques du stimulus perçu, vers le haut niveau, l’intégration et le traitement cognitif. Ces processus interviennent typiquement lors de la première présentation d’un stimulus à un sujet. Celui- ci acquiert de nouvelles informations à partir de ce qu’il perçoit seulement. De plus, ces processus bottom-up dépendent en général peu des hypothèses ou des attentes du sujet. Les représentations formées à partir de ces processus constituent la base de l’identification perceptive.

Les processus descendants sont basés sur l’intégration d’informations préalablement acquises à propos d’un stimulus. Ces processus font en général suite aux processus ascendants. En effet, lors d’une deuxième présentation d’un même élément à un sujet, celui-ci se sert des informations préalablement acquises pour effectuer des hypothèses. Ces processus contrôlent l’information sensorielle à partir de l’expérience et des connaissances, et constituent donc des processus de haut niveau cognitif faisant suite à l’identification perceptive. Ils jouent un rôle essentiel dans les situations où les stimuli peuvent être ambigus ou tout juste perceptibles.

Cette distinction entre les deux types de processus a pour origine le constat selon lequel un stimulus perçu ne l’est pas de la même manière la première fois que les fois suivantes. Nous appréhendons d’abord l’élément présenté, puis nous pouvons nous resservir des informations recueillies lors d’expériences ultérieures.

Les processus top-down sont souvent à l’origine d’un état d’attente ou de préparation lors de la perception. La théorie de l’état central directeur⁴ traite ainsi de l’influence des caractéristiques du sujet percevant. En effet, en présence de ces éléments, on observe généralement un abaissement des seuils de perception. Ces éléments peuvent être de six natures différentes :

besoins corporels (alimentation, sommeil, sexualité…). Certaines expériences montrent ainsi qu’il existe un abaissement des seuils perceptifs pour des mots portant sur l’alimentation chez des sujets ayant jeûné 24h.
récompense / punition. On constate un abaissement des seuils perceptifs et des réponses plus rapides lors d’expériences mettant en jeu une récompense.
valeurs caractéristiques du sujet.
valeur monétaire d’un objet
personnalité du sujet
valeur sémantique des mots (par exemple des mots tabous)

En plus du phénomène de l’état central directeur, nous pouvons voir également apparaître un effet de mémoire lors de la présentation répétitive d’un stimulus, ce qui peut également être à l’origine d’un abaissement du seuil de perception pour ce stimulus.

6.2. Cognition auditive

Les recherches sur la cognition auditive ont au début concerné principalement un cas particulier de l’audition et de notre ouverture sur le monde : le langage parlé. Cependant, il existe de nos jours de nombreux documents concernant la psychologie cognitive de la perception des sons non verbaux, domaine qui s’élargit notamment avec des études sur la perception de la musique (voir les travaux mis en œuvre à l’IRCAM, notamment par Stephen McAdams, et au LAM par Michelle Castellingo…)

La cognition auditive, comme pour les autres modalités sensorielles, fait toujours intervenir une étape d’interprétation de l’information sensorielle. En effet, le contenu sensoriel des stimuli n’est pas suffisant pour se forger grâce à eux seuls une idée sur notre environnement. C’est ainsi que lorsque nous percevons, nous élaborons naturellement une représentation mentale à partir de notre expérience.

L’être humain cherche donc à attribuer une signification à l’ensemble de la structure sonore.

6.2.1 Un modèle de perception auditive

Le modèle de Peretz, basé sur les modèles de perception visuelle, décrit le processus de la reconnaissance auditive en deux étapes. Nous pouvons d’ailleurs remarquer que la plupart des théories perceptives se sont appuyées et s’appuient encore sur les théories de la vision.

Dans un premier temps, l’événement sonore est analysé, de manière à dégager les propriétés de ce son complexe. Ceci conduit alors à la perception de l’événement, à la discrimination de celui-ci.

Dans un second temps, les propriétés du son dégagées à la première étape sont mises en relation avec les représentations mentales stockées en mémoire. Les schémas ou expériences antérieures en rapport avec elles sont alors activés.

Modèle de Peretz (Bertrand & Garnier, 2005)

6.2.2 La perception de la musique

Avant de pouvoir apprécier la musique, il paraît naturel de pouvoir la reconnaître en tant que telle, c’est-à-dire, de pouvoir catégoriser l’événement sonore perçu comme un air musical. Le phénomène de reconnaissance de la musique repose sur une série de mécanismes complexes.

De plus, même si la musique peut susciter en nous, et dès notre plus jeune âge, un panel d’émotions tout à fait impressionnant, et qu’il n’est pas nécessaire d’en être un spécialiste pour l’apprécier, la perception de la musique repose pour une grande partie sur l’apprentissage. Cet apprentissage peut être de nature différentes. Il peut être initié par des spécialistes qui vont permettre également d’acquérir un savoir technique (cas de l’apprentissage en école de musique). Il peut également être le résultat d’un phénomène d’habituation, d’appréhension autonome (cas des autodidactes).

En étudiant le cas de personnes souffrant de troubles de la cognition musicale, la neuropsychologue Isabelle Peretz met en évidence l’existence d’une zone spécifique du traitement de la musique dans notre cerveau qu’elle appelle le Système de Reconnaissance Musicale (PERETZ, 1993). Selon elle, le modèle de perception de la musique est analogue à celui des sons non verbaux. La différence réside dans la présence de nombreux modules de détection (hauteur, organisation temporelle…), dont les sorties seront mises en relation entre elles, et aussi avec la mémoire.

Système de Reconnaissance Musicale selon Peretz (Peretz, 2003)

7. La Psychologie écologique

Le concept de psychologie écologique est initié par James Jerome Gibson. Il expose sa théorie selon laquelle la perception ne peut être expliquée que dans des conditions naturelles de perception, dans la relation de l’animal avec son environnement, dans The Ecological Approach to Visual Perception en 1979.

Gibson propose ainsi le couplage perception-action, et soutient que ces deux composantes sont inséparables. Le psychologue avance qu’il n’existe pas de représentation intermédiaire entre la perception et le comportement. Ce que nous percevons dépend de nos actions, et nos actions, de nos perceptions.

Ainsi, on peut dire que le mouvement est presque le seul moyen dont nous disposons pour interagir avec notre environnement, le cerveau ayant alors pour fonction de déterminer nos actions futures. Il appartient donc de laisser les sujets libres de leurs mouvements et de leurs actions dans l’étude de la perception.

Gibson introduit également le concept d’ »affordances ». En effet, il existe dans l’environnement un nombre d’éléments qui offrent une possibilité d’interaction avec l’individu. La notion d’affordance désigne alors les possibilités d’interaction du sujet avec son environnement.

Les affordances de l’environnement sont ce qu’il offre à l’animal, ce qu’il lui fournit, que ce soit bon ou mauvais. (Gibson, 1979)

II – Psychologie de l’attention

1. Qu’est-ce que l’attention?

Mobilisée dans toutes les activités cognitives, l’attention peut être considérée comme la capacité à se concentrer, à capter certaines informations parmi d’autres. Elle améliore grandement l’efficacité des individus dans leurs activités quotidiennes et intellectuelles.

Elle permet d’effectuer une grande variété d’opérations sensorielles comme la sélection de l’information, la focalisation intentionnelle, la mobilisation des ressources attentionnelles dans la concentration et l’effort, la résistance à la distraction, le contrôle de l’activité, etc.

On peut distinguer trois fonctions de l’attention. L’attention sélective permet justement de sélectionner l’information pertinente pour une tâche à accomplir ou pour approfondir la connaissance de cette information. L’attention partagée nous permet de suivre plusieurs actions ou plusieurs informations en parallèle. Enfin, l’attention soutenue ou prolongée nous permet de rester concentré sur une source d’information pendant une longue durée.

L’attention fait naturellement apparaître la notion de cible, ainsi que la notion de distracteur. Ainsi, l’élément distracteur est celui qui va venir perturber notre attention, alors que l’élément cible est celui sur lequel nous allons devoir nous concentrer.

L’attention est la prise de possession par l’esprit, sous une forme claire et vive, d’un objet ou d’une suite de pensées parmi plusieurs qui semblent possibles […] Elle implique le retrait de certains objets afin de traiter plus efficacement les autres. (James, 1890)

2. Mécanismes de l’attention

2.1. L’attention sélective

Pour traiter une information, il est nécessaire de se focaliser sur celle-ci, ce qui suppose de la sélectionner parmi un ensemble d’informations disponibles. A l’extrême, il peut être possible d’éliminer totalement les stimuli non pertinents. Parmi les différentes théories de l’attention sélective existantes, toutes postulent que nous ne pouvons laisser rentrer dans le système cognitif qu’une quantité limitée d’informations. La différence réside dans le moment où survient la sélection des informations.

2.1.1 La théorie du filtre de Broadbent

En 1958, Donald Broadbent effectue une expérience d’écoute dichotique. Dans cette expérience, on diffuse au moyen d’un casque des informations différentes dans chacune des deux oreilles. On demande ensuite au sujet de répéter au fur et à mesure le message qui arrive dans une de ses deux oreilles (cible), tout en ignorant le message arrivant à l’autre oreille (distracteur). Les résultats de cette expérience sont alors restés au cœur de la recherche sur l’attention, que sa théorie soit critiquée, ou même réfutée.

En effet, Broadbent postule l’idée selon laquelle l’information est traitée par le système cognitif en suivant trois étapes.

Dans un premier temps, le stimulus est capté par les sens, et les registres sensoriels encodent l’information sans aucune transformation, et les stockent dans la mémoire à court terme.

Dans un second temps, un filtre sélectif est appliqué sur les stimuli. Ce filtre repose sur des caractéristiques prédéterminées de l’information.

Enfin, l’information passe par une sorte de détecteur pour déterminer par exemple la signification du message, avant d’utiliser les informations, ou de les transmettre à la mémoire à long terme. Broadbent avance par ailleurs que les informations stockées en mémoire à court terme disparaissent si elles ne sont pas utilisées.

2.1.2 La théorie de l’atténuation de Treisman

Anne Treisman propose un nouveau modèle en 1960, à partir de celui de Broadbent. La différence majeure réside dans le fait que là où Broadbent proposait une sélection des informations, Treisman propose un mécanisme d’atténuation.

En d’autres termes, là où Broadbent pense que les stimuli qui ne font pas l’objet d’une focalisation attentionnelle ne passent même pas à travers le « filtre », Treisman propose l’idée que les stimuli-cibles font l’objet d’un traitement plus approfondi que les autres. On n’a plus un filtre « tout-ou-rien », mais bien un filtre atténuateur des informations, grâce auquel certains éléments distracteurs peuvent être traités, mais dans une qualité dégradée.

2.1.3 Le modèle de sélection tardive de Deutsch et Deutsch

Proposée en 1963, cette théorie suggère que toutes les informations passent par le système cognitif. La sélection ne se ferait alors qu’au moment où l’information passe en mémoire à court-terme, afin d’être traitée plus en profondeur. Il n’y aurait alors sélection qu’après une étape d’analyse sémantique de l’information, c’est-à-dire qu’elle est choisie en fonction de son sens et de son importance, et non en fonction de ses propriétés physiques.

2.1.4 La théorie de filtre mouvant de Norman

Norman réintroduit en 1968 le concept de capacité limitée à l’intérieur du modèle de Deustch & Deutsch. Ainsi, Norman soutient qu’on ne traite réellement qu’une faible quantité d’informations, puisqu’une majorité aura pu être rejetée au fur et à mesure des étapes du traitement. Ainsi, un message paraissant très pertinent pourra en réalité se révéler petit à petit sans intérêt.

2.2. L’attention partagée

L’attention partagée nous permet de percevoir l’ensemble d’une scène ou d’appréhender plusieurs informations fournies par plusieurs événements. Il n’y a pas ici de réelle focalisation, mais notre attention va nous permettre d’assimiler un ensemble d’événements ou d’éléments essentiels d’une scène. Ces événements pourront ou non être liés entre eux.

Cependant, la perception simultanée de plusieurs informations implique qu’il est plus difficile de restituer avec précision un seul de ces événements. En effet, plusieurs aspects sont tout simplement ignorés pour permettre ce traitement simultané.

On peut remarquer que nous sommes en difficulté lorsque les tâches à effectuer sont similaires, qu’elles sont difficiles, ou si ces deux tâches nécessitent une attention consciente. Au contraire, nos actions sont facilitées lorsque les tâches à effectuer sont différentes, peu complexes, si l’une des deux tâches ne nécessite pas d’attention consciente et/ou si elles sont répétées.

2.2.1 Le modèle de Kahneman

En s’inspirant des modèles proposés par les économistes, Daniel Kahneman propose en 1973 la notion de « ressource » attentionnelle. Ce concept repose sur l’idée que nous disposons d’un stock de ressources limité, et qu’il possible de mener de front plusieurs activités sous réserve que la demande totale en ressources attentionnelles n’excède pas le stock disponible. Kahneman fait également l’hypothèse qu’il existe un mécanisme de gestion qui décide de l’assignation de l’effort à une activité plutôt qu’à une autre. Ainsi, la quantité de ressources disponibles à un instant « t » provient de différents facteurs, tels que le degré d’éveil, les dispositions permanentes, les intentions du moment, les exigences de la tâche…

2.2.2 Modèle des ressources attentionnelles multiples de Wickens

Wickens propose en 1984 une théorie approfondie, qui fait intervenir des stocks de ressources distincts, ceci à partir de constatations qui montrent qu’il est possible de réaliser simultanément deux activités sans interférence.

Il adopte alors une métrique tridimensionnelle. La première dimension, correspondant au stade de traitement, oppose les processus à l’entrée du système (traitement perceptif, encodage) à ceux qui à la sortie sous-tendent la réponse. La deuxième dimension, correspondant au type de traitement, oppose les processus verbaux situés dans l’hémisphère gauche du cerveau, aux processus spatiaux situés dans l’hémisphère droit. Enfin la troisième dimension correspond au canal d’entrée de l’information, et se base sur l’hypothèse que les informations sont moins perturbées lorsqu’elles proviennent de deux modalités différentes.

2.3 L’attention « de longue durée »

Peut-on maintenir durablement son attention focalisée? L’attention fluctue-t-elle d’un instant à l’autre? Un nombre de scientifiques se sont penchés sur ces questions. En effet, les réponses que l’on peut donner à ces dernières ont des implications nombreuses en matière de théorie de l’apprentissage par exemple, ou des sciences de l’éducation.

On peut distinguer deux types d’attention de longue durée. La vigilance, dans un premier temps, est considérée comme un état physiologique. L’attention soutenue, elle, s’apparente plutôt à un contrôle conscient de l’activité.

2.3.1 La vigilance

Elle est définie en 1923 comme un « état de haut niveau d’efficience du système nerveux central » par Head (Head, 1923). Elle permet notamment de résister à l’endormissement. Il appartient de préciser qu’aucun niveau de vigilance ne préjuge de la qualité d’une réponse comportementale. Le niveau de vigilance peut être mesuré de deux façons différentes, soit par un électroencéphalogramme, soit par l’exécution d’une tâche, qui consiste généralement en une tâche de surveillance, telle que l’a définie Macworth (longue et monotone, et présentant peu de cibles à détecter).

La performance à une tâche n’est pas linéaire avec le niveau de vigilance. En effet, s’il paraît intuitif qu’en état d’hypovigilance ou même de veille diffuse, la performance est détériorée, il en va de même pour un état d’hyperexcitation (niveau de vigilance surélevé), qui favorise ainsi l’augmentation des erreurs, et qui traduit donc un mauvais contrôle attentionnel.

Loi de Yerkes et Dodson ou loi de l'optimum — Loi de Yerkes et Dodson ou loi de l’optimum

2.3.2 L’attention soutenue

L’attention soutenue correspond à la capacité de maintenir une performance sur une longue période qui dépend du maintien de la vigilance, de la capacité de détection du stimulus et de la résistance à la distraction, donc du contrôle mental. Il s’agit donc d’un mécanisme d’attention sélective ou partagée, mais sur une longue période.

On observe que la capacité à focaliser son attention de manière durable progresse significativement en fonction de l’âge, et avec le développement de stratégies.

Kahneman introduit en 1973 la notion d’effort attentionnel qui allie deux paramètres : d’une part, la composante intensive reflétant l’effort investi, et d’autre part, la composante sélective, que l’on peut relier au degré de focalisation. Ainsi, l’efficacité du comportement serait modulée par l’effort investi, qui n’est autre que la régulation, par le sujet, de son propre niveau d’activation en fonction des exigences de la situation.

2.4 Processus automatiques ou conscients

On a tous remarqué combien il était nécessaire de se concentrer pour effectuer une tâche nouvelle, comme par exemple composer un numéro de téléphone que l’on ne connaît pas. Au contraire, il est très facile de suivre assidûment une conversation tout en composant un numéro de téléphone connu, dont on a l’habitude.

Ainsi, Shiffrin et Schneider distinguent en 1977 deux types de processus attentionnels : les processus dits contrôlés, qui opèrent en série et avec une certaine lenteur. Ce sont des processus coûteux mais souples ; et les processus automatiques rapides, qui opèrent en parallèle. Ces mécanismes sont plus économiques, mais plus rigides, généralement involontaires. De plus, ce ne sont en général pas des mécanismes conscients.

2.5 Attention endogène et attention exogène

L’orientation de l’attention peut-être déclenchée de plusieurs manières. En effet, elle peut aussi bien être causée par un élément extérieur soudain, qu’être le résultat de la volonté de l’individu de se concentrer sur un sujet précis.

Un événement soudain peut attirer notre attention soudainement. En effet, cet événement inattendu produit chez le sujet une réaction d’orientation de son attention, qui aura pour conséquence un arrêt immédiat de l’activité en cours. Cette orientation exogène est en général rapide (50 à 150 ms). Elle peut-être d’une durée très brève si le signal ne contient aucune information intéressante.

L’attention endogène correspond à une orientation volontaire de l’attention vers un endroit ou un stimulus précis. Elle trouve son origine dans une attitude et une décision du sujet. Plus lente à se déployer (350 à 500 ms), l’attention endogène prend généralement le relais de l’orientation exogène afin d’appréhender plus précisément l’événement qui vient d’être perçu.

III – Multimodalité

L’étude des phénomènes perceptifs au cours de l’histoire a souvent privilégié un seul de nos cinq sens. De nombreuses théories ont été élaborées par rapport à la vision, moins par rapport à l’ouïe et au toucher, mais elles sont presque inexistantes à propos du goût et de l’odorat. Ces théories nous ont apporté de nombreuses réponses et l’étude de ces sens nous ont permis de connaître le fonctionnement de nos organes sensoriels.

Cependant, il apparaît aujourd’hui que l’étude de la perception, si l’on souhaite approfondir nos connaissances de celle-ci, nécessite quelques ajustements. En effet, il peut sembler paradoxal d’étudier une seule modalité sensorielle étant donné que tous nos comportements suggèrent l’intégration de plusieurs informations provenant de tous les systèmes sensoriels. De plus, dans le domaine qui nous intéresse, c’est-à-dire l’audiovisuel, la multimodalité est le principe central de la perception.

1. Les origines

Les questions sur la multimodalité commencent dès le XVIIᵉ siècle, avec l’étude de la relation toucher-vision et la question de Molyneux. Cette question, plutôt d’ordre philosophique, apparaît dans la correspondance du 7 juillet 1688 entre William Molyneux et John Locke :

« Supposez un aveugle de naissance qui soit présentement homme fait, auquel on ait appris à distinguer par l’attouchement un cube et un globe du même métal, et à peu près la même grosseur, en sorte que lorsqu’il touche l’un ou l’autre, il puisse dire quel est le cube, et quel est le globe. Supposez que, le cube et le globe étant posés sur une table, cet aveugle vienne à jouir de la vue : on demande si, en les voyant sans les toucher, il pourrait les discerner, et dire quel est le globe et quel est le cube. » (William Molyneux, correspondance du 7 juillet 1688)

Les deux correspondants répondent par la négative à cette question, avançant que même si l’aveugle sait comment le globe et le cube affectent son sens du toucher, il ne peut pas savoir comment ceux-ci affectent son sens de la vue.

Ce problème suscite ensuite un important débat qui implique notamment Georges Berkeley, Gottfried Wilhem von Leibniz, Voltaire, Diderot, et nombre d’autres grands penseurs de l’époque. Cette question est celle qui a suscité le plus de réflexions chez les philosophes de la perception dans l’histoire de la philosophie.

Depuis lors, quelques études ont été menées en parallèle des études monomodales et ont pris un essor considérable ces dernières années.

2. Associations acquises ou innées

Comme nous venons de le voir, la perception multisensorielle a supposé au départ une séparation de chacun de nos cinq sens. En effet, alors qu’il est possible d’associer nos perceptions lorsque nous jouissons de tous nos sens simultanément, ceci paraît difficile dans le cas du problème de Molyneux une fois que l’aveugle recouvre la vue. Pour arriver à cette conclusion, les penseurs partent de la constatation que ces associations entre modalités se mettent en place par apprentissage.

En 1960, Senden réalise les premières expérimentations à propos de ce fameux problème en effectuant une opération de la cataracte sur des aveugles de naissance dans le but de leur restaurer la vue. Il s’avère que les conclusions de Molyneux et de Locke sont exactes.

Cette hypothèse de la séparation initiale des modalités sensorielles a été d’ailleurs consolidée notamment par les théories de Jean Piaget vers 1935. Dans ses théories de l’apprentissage, il postule que dans les premières semaines de notre vie, nos espaces perceptifs (visuels, tactiles, auditifs, etc) sont séparés, et que les modalités vont petit à petit « s’assimiler », se coordonner.

A l’inverse, Gibson émet la théorie selon laquelle les modalités sensorielles partagent quelque chose en commun dès le début de la vie (Gibson, 1966). De plus, il invente le concept de perception « amodale », où la relation entre les modalités sensorielles ne dépend pas d’elles mais de l’information véhiculée par chacune des modalités. Delorme et Flückiger citent dans leur ouvrage « Perception et Réalité » l’exemple du feu, qui est à la source de sensations auditives, olfactives, tactiles (chaleur). Le fait que toutes ces sensations véhiculent simultanément la même information « feu » suffit à associer nos perceptions selon Gibson. La perception est dite « amodale » (Delorme & Flückiger, 2003).

3. Les recherches actuelles

La psychologie cognitive présente des points de vue très divers. En effet, il n’existe pas d’explication unique des relations entre les modalités sensorielles. Il semble ainsi exister une grande variété d’interactions. C’est ainsi que l’on peut voir apparaître aujourd’hui un grand nombre de publications aux champs d’applications plus restreints, qui ne cherchent pas à établir une théorie générale de la perception multisensorielle, mais plutôt à expliquer comment celle-ci fonctionne dans une situation donnée.

Les travaux concernant la relation audition-vision découlent en partie des expériences de Harry McGurk et John MacDonald, dont ils publient les résultats dans l’article « Hearing Lips and Seeing Voices » dans la revue Nature en 1976.

Ils démontrent ainsi l’existence d’une interférence entre l’audition et la vision lors de la perception de la parole. On a d’ailleurs les premières suggestions d’une perception

multimodale de la parole. Pour montrer cet effet, on présente habituellement une vidéo montrant une personne prononçant le phonème /ga/, alors que la bande sonore synchronisée diffuse le phonème /ba/. On a alors généralement l’impression de percevoir un phonème différent des deux autres, ici /da/. De plus, McGurck et MacDonald montrent que cet effet dure même lorsque l’on connaît le « truc ».

Aujourd’hui, certains laboratoires comme le Laboratoire d’Acoustique Musicale à Paris, la NASA ou encore le CIRMMT et le Multimodal Interaction Laboratory à l’université McGill au Canada, s’intéressent de près aux perceptions multisensorielles. Ces recherches s’intéressent aussi bien à la réalité virtuelle, qu’à l’architecture ou bien la perception de concerts musicaux.

On peut noter par exemple l’importance du visuel sur la perception de la distance apparente d’un sujet. Plus précisément, Santhie Nathanail met en évidence dans sa thèse « Influence des informations visuelles sur la perception auditive : conséquences sur la caractérisation de la qualité acoustique des salles » l’influence de la distance visuelle de la scène sur la perception de la distance auditive dans une salle. En effet, les mêmes éléments sonores sont perçus plus proches sous des conditions visuelles proches, et plus lointains sous des conditions visuelles lointaines.

Certaines études portent également sur le rapport entre la multimodalité et l’émotion dans la perception, et spécifiquement dans le cadre de concerts musicaux. Dan Levitin en fait d’ailleurs le sujet d’expériences très intéressantes dont il publie les résultats en 2007. Il démontre ainsi que les réactions des sujets sont beaucoup plus importantes lorsqu’ils reçoivent un stimulus à la fois visuel et sonore.

En ce qui concerne l’influence d’une ou plusieurs modalités sur une modalité donnée, il apparaît que l’on ne peut pas hiérarchiser nos différentes modalités sensorielles. En effet, nous avons vu que la vision pouvait altérer notre perception du son, mais l’inverse est également possible. On peut alors émettre l’hypothèse que la modalité dominante dépend de la tâche à effectuer et de son contexte (Calvert, 2004).

Conclusion

Les théories de la perception ont beaucoup évolué au fil de l’histoire, en partant d’hypothèses et de théories très générales, pour laisser finalement toute la place à l’individu et aux différences interindividuelles. Il existe certes des schémas applicables à tous, mais il reste impossible de prévoir comment chacun perçoit, puisque la perception reste un événement très personnel.

Malgré les nombreuses réfutations et affrontements entre les différents courants de pensée, il est à mon sens important de noter que chaque théorie permet d’avancer et prend tout son sens. On peut paradoxalement remarquer que les théories générales se sont mises en place à partir de cas particuliers, alors que, de nos jours, le champ d’application est plus vaste, puisqu’il dépend de chacun.

Bien entendu, bon nombre d’études sont encore en cours, et les théories actuelles ne peuvent pas apporter toutes les réponses aux questions, mais on peut tout de même avoir un certain éclairage.

La connaissance de toutes ces théories sur la perception, sur l’attention et sur la perception multimodale vont nous permettre de comprendre un peu mieux les processus mis en œuvre dans le sujet qui nous intéresse, c’est-à-dire, la perception d’un événement audiovisuel musical. Ces théories vont nous permettre d’élaborer notre expérience perceptive, en tenant compte des phénomènes cognitifs, en prenant garde aux effets indésirables, comme les attentes par exemple, et avec un souci de sa validité écologique.

De plus, nous allons pouvoir ensuite formuler des hypothèses sur les mécanismes de la perception, précisément dans cette situation d’écoute dans un contexte multimodal.

Partie II : L’expérience

1. Contexte

Il s’agit d’étudier une situation commune dans notre métier d’ingénieur du son : le montage son à l’image. Nous allons nous intéresser plus précisément au montage d’un concert ou d’un opéra filmé, avec plusieurs prises, dans le but d’une diffusion ultérieure à la télévision avec la réalisation d’un DVD, et peut-être à la radio, avec la réalisation d’un CD audio. Nous sommes donc dans le domaine de la musique dite « classique ».

Dans cette situation de production, plusieurs étapes seront nécessaires :

– Élaboration du système de captation (caméras, microphones…), enregistrement de plusieurs représentations ou au minimum de la répétition générale et du concert.
– Montage de l’image et montage du son. Ces deux opérations seront effectuées en général par deux équipes techniques différentes, chacune ayant son domaine de spécialisation.
– Visionnage et validation des montages.
– Mixage du son, mastering.
– Création du DVD, du CD, envoi du P.A.D. (prêt à diffuser) à la télévision, et du son à la radio.

Nous allons ici nous préoccuper de l’étape de montage de la bande sonore, en relation avec l’image. Un phénomène assez complexe, déjà identifié par la plupart des personnes familières de cette tâche, peut se produire : lorsqu’un point de montage (passage d’une prise à une autre) est difficilement réalisable, et que, malgré les tentatives de correction, celui-ci reste encore audible, il n’est cependant pas rare qu’il « disparaisse » en ajoutant la vidéo. Darcy Proper, qui a longtemps effectué ce genre de travail chez Sony, et qui aujourd’hui fait du mastering chez Galaxy Studio en Belgique, l’a elle-même évoqué lors de la126ᵉ convention de l’AES à Munich. Nous pouvons d’ailleurs faire l’hypothèse qu’un tel phénomène se reproduit pour tout défaut présent sur la bande sonore, tel que des clics numériques, des bruits parasites, ou que du moins, ces défauts sont moins bien perçus lorsque la bande sonore est diffusée conjointement avec la vidéo.

Mais le montage présente également d’autres questions. En effet, en superposant l’enregistrement vidéo d’une représentation et l’enregistrement sonore d’une autre, pour corriger par exemple la justesse d’une ou plusieurs notes, nous pouvons être confrontés à des problèmes de cohérence entre des intentions perçues, le geste musical, et la perception du son. Ces problèmes sont beaucoup plus difficiles à résoudre. C’est le problème de ce qu’on appelle par exemple le « playback ».

Un troisième problème pouvant être rencontré est celui de la synchronisation. En effet, un montage pourra être rendu totalement impossible lorsque, par exemple, les musiciens n’ont pas joué ni chanté au même tempo entre les différentes prises. Si l’on vient à mélanger le son d’une prise avec l’image d’une autre, les deux composantes son et image vont en effet se décaler temporellement, ce qui pourra conduire de la part du spectateur à un sentiment de malaise lorsque le décalage est trop faible pour identifier clairement le problème, puis à un sentiment de totale incompréhension du discours pour un décalage important.

Le caractère multimodal de cette tâche la rend donc plus complexe et plus difficile à réaliser d’un point de vue tout d’abord simplement logistique, mais surtout d’un point de vue perceptif. C’est pourquoi nous allons essayer d’analyser cette tâche d’un point de vue psychologique en questionnant des auditeurs, pour essayer de comprendre les processus mis en œuvre.

2. Approche méthodologique

Une telle étude semble tout d’abord difficilement réalisable, puisqu’elle fait appel principalement à des mesures du subjectif. Il va donc falloir établir un protocole expérimental qui nous permettra d’identifier les processus mis en œuvre et de les rapporter ensuite à des mesures physiques. Les sciences humaines, et plus précisément la psychologie cognitive, nous seront ainsi requises dans cette démarche, et nous allons nous appuyer sur les théories de la perception détaillées en première partie.

A partir des trois types de problèmes pouvant être rencontrés dans cette étape de montage, nous nous focaliserons sur deux catégories :

Les problèmes dits « de congruence », qui font référence à des problèmes de cohérence entre deux éléments : un élément de référence, constitué par la vidéo, et un élément que nous pourrons faire varier ponctuellement, la bande sonore. Cette dernière étant la plupart du temps travaillée sans cet élément de référence, des problèmes de congruence peuvent apparaître. C’est le cas des problèmes d’intention ou de dynamique gestuelle, mais également de nos problèmes de point de montage ou de clic. Lors de la phase d’écoute, l’élément de référence agit alors comme un distracteur par rapport à la bande son. Il en résultera alors soit une atténuation du problème sonore, soit une amplification.

Les problèmes temporels : ce sont principalement les problèmes de synchronisation. En travaillant sans l’image, le monteur son peut involontairement décaler une note lors d’un montage, et changer faiblement le rythme de la musique. Cette variation, imperceptible lors d’une diffusion uniquement sonore, pourra être flagrante avec l’ajout de l’image qui était au départ synchrone lors de l’enregistrement. Ici, nous n’avons plus cette notion de cible et de distracteur, les deux éléments interagissent. Au moment du visionnage, la question de savoir si c’est le son qui a été désynchronisé, ou bien la vidéo, peut se poser.

Nous allons nous limiter ici aux problèmes de congruence, que nous pouvons également subdiviser en deux sous-catégories :

Les problèmes d’ordre perceptif : ils sont généralement dus à un problème « technique » comme des parasites sur le signal audio, ou à un élément indésirable présent dans la salle où la prise de son a été effectuée. On a affaire à un événement plutôt unimodal, où l’image va venir modifier la perception du son.

Les problèmes d’ordre sémiotique : ceux-ci font appel à des processus cognitifs plus complexes, notamment aux processus « top-down » dont nous avons parlé en première partie. La perception de ce type de défaut fait appel à un niveau supérieur de traitement. Le sujet doit ici mettre en relation ce qu’il voit et ce qu’il entend, pour ensuite déterminer si les deux éléments sont en cohérence l’un avec l’autre, tandis que pour les problèmes d’ordre perceptif, cette mise en relation n’est pas nécessaire ; nous sommes dans ce cas dans une configuration dite « bottom-up ».

3. L’expérience

3.1 But de l’expérience

A partir des phénomènes observés, nous allons essayer d’observer l’influence de l’image dynamique sur la perception d’un défaut présent sur la bande sonore. Il s’agira de détecter les seuils de perception des défauts avec ou sans vidéo, puis de voir si ceux-ci sont différents, pour ensuite tenter de mettre en évidence les mécanismes mis en œuvre. Deux hypothèses s’offrent à nous : s’agit-il « simplement » de problèmes d’attention, de sélectivité de l’attention? Ou s’agit-il d’un phénomène de masquage entre l’image et le son?

En d’autres termes, il s’agit de déterminer de quelle manière le défaut sonore est rendu imperceptible, ou devient perceptible.

3.2 Matériel utilisé

Nous allons présenter aux sujets des extraits d’un concert de musique classique, qui a fait l’objet d’un enregistrement audio-visuel, dans des conditions réelles de production, et dans lequel un montage vidéo a été effectué. Ce concert a eu lieu au Conservatoire National Supérieur de Musique et de Danse de Paris le 2 avril 2008 dans la salle d’orgue du Conservatoire, pour la création mondiale avec viole d’amour, du deuxième quatuor à cordes de Leoš Janáček, Lettres intimes, par Sylvie Gazeau, Sébastien Richaud, Pierre- Henri Xuereb et Jérôme Perno.

Cet enregistrement ayant eu pour finalité la création d’un DVD, il m’a été demandé d’assurer la direction artistique (musicale) ainsi que le montage son du concert, en relation avec les musiciens. Un schéma du dispositif de captation est disponible en annexe.

Le montage audio terminé, l’enregistrement a par ailleurs fait l’objet d’une diffusion sur France-Musique, dans le cadre de l’émission « Miniatures » consacrant une semaine à la viole d’amour et aux instruments rares, du 5 janvier au 9 janvier 2009.

Nous avons ensuite sélectionné un extrait d’une durée de deux minutes et quarante- cinq secondes environ, dans le but de replacer le sujet dans une situation d’écoute proche d’une expérience ordinaire. Puis nous avons inséré quelques défauts les plus fréquemment rencontrés lors de l’étape de montage : points de montage difficiles, un défaut technique du signal, des problèmes de niveaux sonores. Ces défauts sont distribués séquentiellement, à des intervalles de temps différents pour éviter les effets de régularité, et pour donc éviter que les sujets s’attendent à percevoir un défaut à un instant donné.

3.3 Dispositif utilisé pour le test

Nous avons disposé de la régie de la salle interdisciplinaire (ex-Maurice Fleuret) du CNSMDP. Celle-ci est équipée du logiciel Pyramix, qui permet via un synchroniseur virtuel de diffuser de l’image et du son de façon synchrone, tout en effectuant des modifications au niveau de notre session de travail.

Nous avions donc d’un côté la vidéo, sous la forme d’un fichier extrait d’un DVD- vidéo, et de l’autre le son enregistré grâce à notre dispositif de captation. Ce son avait par ailleurs déjà fait l’objet d’un montage, comme indiqué dans la section précédente.

Les enceintes de cette régie sont des enceintes Skiff du constructeur Cabasse⁵.

3.4 Protocole de test

Nous nous attachons à détecter les seuils de détection des défauts sonores, avec ou sans image. Il s’agira donc de faire varier la « qualité » de ces défauts, de « pas du tout perceptible » à « très nettement perceptible », et de relever les réponses ou non-réponses des sujets, dans une situation avec image, puis sans image.

Après une expérience préliminaire qui a surtout pour but de familiariser le sujet avec le contexte de l’expérience, nous procédons donc au visionnage d’un extrait de 2’45 », présenté à cinq reprises. À chaque écoute, la « qualité » des défauts se voit dégradée⁶.

Nous avons successivement :

un crossfade dont le temps s’allonge de quelques millisecondes à plus de deux secondes au fur et à mesure des extraits,
un deuxième fade dont le temps se raccourcit jusqu’à être quasiment égal à zéro,
un clic numérique dont le niveau augmente par pas de trois décibels,
un troisième fade qui s’allonge jusqu’à une valeur moyenne,
une baisse de volume qui s’amplifie sur une note de violoncelle,
une désynchronisation,
une baisse de volume au niveau des trois accords de fin.

Après ces cinq écoutes, nous revenons à un extrait précédent pour vérifier l’effet de mémoire et si besoin ajuster la valeur de seuil détectée pour chacun des défauts. Nous avons donc rediffusé généralement l’extrait 2 ou 1, après cela, nous procédons à la diffusion du son seul de ce même extrait pour tenter de quantifier l’influence de l’image sur la perception du son. En d’autres termes, nous essayons par ce moyen de voir si l’on détecte mieux certains défauts en ôtant la vidéo lors de la diffusion.

Schéma du déroulement de la première partie de l'expérience — Schéma du déroulement de la première partie de l’expérience

Enfin, nous procédons à la dernière phase de l’expérience. Ici, nous nous attardons sur de plus courts extraits, là où les sujets n’ont pas détecté les défauts. La méthode utilisée est alors de diffuser successivement le même extrait de quelques secondes avec l’image, puis sans l’image.

Une telle expérience s’avère beaucoup plus difficile à monter qu’il n’y paraît. En effet, la mise en place de celle-ci dépend entièrement de la propre perception de la personne qui l’élabore. Ainsi il convient de faire particulièrement attention à ce que les défauts inclus puissent être à un moment donné suffisamment perceptibles pour chacun, ce qui est difficilement évaluable à l’avance.

3.5 Type de population testé

Nous avons choisi une population d’ingénieurs du son et directeurs artistiques, qui par leur métier sont experts du type de produit que représentent le DVD ou le CD audio. Ce sont eux qui abaisseront les seuils et qui détermineront ainsi la qualité minimum à atteindre.

Experts au niveau du son en tant que matériau sonore, les ingénieurs du son sont directement impliqués dans l’étape de post-production qui nous intéresse. En étant directeurs artistiques, ils ont l’avantage de pouvoir être également des musiciens de bon niveau et d’être par conséquent des experts musicaux de confiance. Ils sont les premiers à intervenir sur le montage et constituent donc un « filtre perceptif », en abaissant les seuils de détection. Nous faisons en effet l’hypothèse que les personnes non formées et non familières de ce type de travail ont des seuils de détection plus élevés, et que leur tolérance aux défauts sonores est plus forte.

3.6 Validité écologique et conditions de test

Nous nous attachons à ce que les extraits présentés et le contexte de l’expérience soient écologiquement valides, c’est-à-dire proches d’une situation naturelle, pour que les sujets répondent de façon comparable à la réalité. Ainsi, nous pourrons transposer les résultats obtenus en laboratoire à des situations réelles.

Dans un premier temps, le type de matériau choisi (concert filmé) présente une validité écologique. En effet, ayant déjà fait l’objet d’une exploitation réelle en vue de la production d’un DVD ou d’un CD audio, il est assez aisé de se replacer dans un tel contexte pour un ingénieur du son comme pour un musicien, puisqu’ils interviennent tous deux en amont de la diffusion du produit.

Dans un second temps, nous apporterons une attention toute particulière à la longueur du ou des extraits choisis. En effet, la tâche à accomplir n’est pas du tout la même selon que l’on demande à un technicien un « contrôle qualité » ou un travail de montage. En effet, ce dernier nécessite d’écouter et de réécouter souvent de courts extraits, en modifiant certaines propriétés. De plus, une grande concentration, une grande attention est demandée, mais sur de brefs passages, ce qui renforce l’effet de mémoire.

Le « contrôle qualité », qui lui demande l’écoute de longs extraits, se rapproche d’une situation d’écoute domestique, à la différence qu’il nécessite une forte mobilisation de notre attention soutenue, et que l’écoute se déroule dans une régie audiovisuelle professionnelle.

Nous plaçons ainsi les sujets dans un contexte de « contrôle qualité ». C’est pourquoi nous avons sélectionné des extraits plutôt longs, que nous diffusons dans une régie de taille modeste, reproduisant le plus fidèlement possible des conditions naturelles de travail. La régie est équipée d’un écran de 19 pouces, ainsi que d’une paire d’enceintes Cabasse.

3.7 Choix de la consigne

Nous avons choisi de donner une consigne ouverte. En effet, en effectuant l’expérience sur une population d’ingénieurs du son, nous pouvons nous attendre à ce qu’ils ne jugent que le son du produit audiovisuel qui leur est présenté. Cependant, il nous a paru également intéressant de pouvoir leur laisser la liberté de nous indiquer les incongruences perçues entre la vidéo et le son, c’est-à-dire de nous dire à quel moment et en quoi la vidéo pouvait être en incohérence avec le son. Pour indiquer à quel moment le sujet perçoit un défaut, il lui suffit d’appuyer sur une touche de son clavier AZERTY pour placer un marqueur au curseur, pendant la diffusion de l’extrait.

Le point sur lequel nous avons particulièrement insisté lors de la phase de test a été de ne pas fermer les yeux pendant le visionnage de la vidéo. En effet, notre travail étant basé sur la relation du visuel avec l’audition, le fait de fermer les yeux revient à écouter la bande sonore seule, chose qui est effectuée uniquement à la fin du test pour comparer avec les résultats obtenus lors du visionnage « complet » (son et image).

Partie III : Résultats et discussion

1. Introduction

Douze sujets ont pu nous prêter quarante-cinq minutes de leur temps pour se soumettre aux tests de perception décrits dans la partie précédente. Ce sont tous des musiciens-ingénieurs du son experts dans le type de produit que nous présentons.

Évidemment, la faible quantité de sujets ne nous permettra pas de tirer des conclusions générales. Nous nous efforcerons cependant de dégager quelques indices concernant les seuils de perception dans une telle situation d’écoute et de travail.

Nous tenterons également de trouver un mode de représentation pertinent des résultats obtenus pour les différentes parties de l’expérience, et de classifier les types de problèmes en fonction des réponses obtenues.

2. Résultats généraux

Nous pouvons remarquer dans un premier temps que les résultats obtenus ne sont pas ceux que l’on attendait. En effet, alors que de nombreuses personnes confirment notre hypothèse de l’atténuation ou même la disparition des défauts sonores avec l’ajout de l’image, ce phénomène a été ici difficilement quantifiable, et même difficilement démontrable.

Il apparaît ainsi que la plupart des personnes testées ne perçoivent pas les points de montage, que ce soit avec ou sans vidéo. Il en va de même pour les variations de volume sonore. Nous essaierons d’en dégager les raisons ultérieurement.

Nous pouvons toutefois mettre en évidence quelques indices, quelques données qui ne peuvent évidemment pas s’appliquer à la majorité des personnes, mais qui pourraient être approfondies dans le cadre d’une thèse par exemple.

Moyenne des seuils de perception des défauts sur la séquence longue.

L’absence d’histogramme signifie qu’aucune ou trop peu de personnes ont pu percevoir le défaut, même à son intensité maximale.

Nombre de personnes ayant perçu les défauts.

Les histogrammes précédents nous montrent respectivement les seuils de perception moyens des défauts sur la séquence vidéo longue, ainsi que le nombre de personnes ayant perçu chaque défaut, avec image sur la séquence longue, avec image sur les séquences courtes et longues, puis avec et sans image sur toutes les séquences. Cette troisième indication nous montre si le défaut est globalement perçu ou non, et donc si les réponses sont pertinentes ou non pour ce test.

Nous voyons donc clairement qu’avec l’image, les crossfades ne sont pas perçus. On considère ainsi que la réponse de l’unique personne ayant repéré le premier défaut et ce dès la première séquence constitue une exception dans les résultats de ce test.

Nous pouvons dans un second temps considérer que les résultats concernant la perception du clic numérique constituent un élément pertinent. Nous étudierons le phénomène et analyserons plus précisément ces résultats dans un paragraphe ultérieur.

Dans un troisième temps nous pouvons observer des résultats analogues dans le domaine du volume sonore. Il est donc a priori possible de regrouper ces deux défauts en une même famille, d’autant plus que le même type de défaut est appliqué.

Enfin, nous pourrons parler brièvement de la désynchronisation. Nous pouvons remarquer une absence de données sur le deuxième diagramme pour ce défaut. Ceci est volontaire. En effet, pour des problèmes de temps, nous n’avons pas re-testé ce défaut sur une séquence courte et pour finir, le nombre total de personnes ayant perçu ce défaut est le même dans tous les cas (avec ou bien avec + sans vidéo), puisque ce défaut ne peut pas être perçu en l’absence de l’une des deux informations. C’est un défaut purement multimodal, comme nous l’indiquions en deuxième partie.

3. Résultats détaillés

3.1 Perception des points de montage

Nous avons vu grâce aux diagrammes précédents qu’en général, les sujets n’ont pas perçu les points de montage dans la séquence longue de presque trois minutes. C’est pourquoi nous ne pouvons pas évaluer le seuil de perception de ces points de montage.

De plus, ces mêmes points de montage ont été assez peu repérés lors d’une présentation de plus courtes séquences alors même que les attentes des sujets étaient motivées par la consigne. En effet, ceux-ci étaient sûrs de la présence d’un défaut dans ces passages d’une dizaine de secondes.

En revanche, il se trouve que quelques sujets ont tout de même perçu le défaut lorsqu’on les prive de l’image. Ils sont ainsi trois de plus à avoir perçu le point numéro un (Fade Long), deux de plus pour le point numéro deux (Fade Court), et un pour le troisième point (Fade Moyen).

Ainsi, nous ne pouvons pas clairement mesurer les seuils de perception de ce défaut, mais les résultats nous indiquent que la capacité de perception de ces points de montage est accrue lorsque l’on prive les sujets de la vidéo. En d’autres termes, nous avons ici un indice qui nous permettrait de confirmer notre hypothèse de l’atténuation de la perception lorsque celle-ci est partagée entre les deux modalités audition et vision.

3.2 Perception du « Clic »

Nous pouvons voir ici que la totalité des sujets a perçu cet artefact. Nous pouvons ainsi établir une moyenne des seuils de perception avec vidéo pour ce test sur la séquence longue. Le clic numérique est perçu à partir du troisième visionnage de la séquence, ce qui correspond à un niveau de dégradation supérieur.

Nous pouvons remarquer pour certains sujets l’apparition d’un phénomène d’hystérésis. En effet, comme nous l’avons précisé dans notre première partie, nous cessons de percevoir plus tard que nous ne commençons (Binet, 1894).

Exemple de résultat pour le défaut "clic" avec apparition d'un phénomène d'hystérésis. (Sujet B) — Exemple de résultat pour le défaut « clic » avec apparition d’un phénomène d’hystérésis. (Sujet B)

Le sujet a un seuil croissant au quatrième extrait, mais en redescendant, il perçoit le défaut jusqu’au deuxième.

En observant les résultats complets pour ce défaut, nous remarquons également une légère influence de la vision sur l’audition, puisque deux sujets ont une meilleure perception du clic lorsque l’on enlève l’image. Nous ne pouvons là encore pas généraliser, mais ceci peut constituer une piste à creuser en effectuant d’autres expérimentations uniquement sur ce défaut.

Résultats complets (11 sujets) pour le défaut "clic". — Résultats complets (11 sujets) pour le défaut « clic ».

Nous voyons que pour deux sujets le seuil de perception est inférieur lorsque seul le son de la séquence est diffusé (cf. flèches sur le graphique).

Nous pouvons également ajouter qu’un sujet n’a jamais perçu le clic lors du visionnage de la séquence longue, et que lors de la diffusion d’une séquence plus courte, le défaut est perçu uniquement lorsque l’image est absente.

Nous avons donc trois sujets (soit 25 %) dont les performances sont améliorées lorsqu’ils ont la possibilité de ne prêter attention qu’à la bande sonore.

3.3 Perception des variations de volume

Nous pouvons remarquer que les personnes ayant participé à l’expérience sont en moyenne plus sensibles aux variations de volume sonore, comme les phénomènes de « pompage », par exemple, qu’aux points de montage.

En outre, il est important de remarquer que la moitié des sujets perçoit ce défaut uniquement lorsque l’image est absente, ce qui constitue là encore un indice qui nous permettrait de confirmer notre hypothèse de départ pour cette expérience, si le nombre de sujets était suffisant.

Résultats pour le défaut "volume fin", Sujet A. — Résultats pour le défaut « volume fin », Sujet A.

Résultats pour le défaut "volume fin", Sujet J. — Résultats pour le défaut « volume fin », Sujet J.

Les deux courbes précédentes nous indiquent encore une fois que pour trois sujets, le seuil de perception de ces variations de volume est inférieur lorsque l’image est absente, ce qui rejoint notre remarque précédente quant au nombre important de sujets (8 sujets) ayant perçu le défaut uniquement lorsque l’image est absente.

Nous pouvons donc noter encore une fois que l’image semble avoir une certaine influence sur les seuils de perception des défauts sonores lors du visionnage d’une séquence audiovisuelle.

3.4 Perception de la désynchronisation

Bien que ce ne soit pas le point central du sujet, il nous a semblé intéressant d’inclure ce défaut dans la séquence, puisque celui-ci est apparu pendant la production du DVD. En effet, après avoir effectué le montage son, et après avoir ajouté la vidéo, nous avons eu besoin de visionner le montage une petite dizaine de fois avant de repérer cette désynchronisation qui intervient sur un seul des instrumentistes.

Il s’agit d’un passage musical dans lequel le second violon joue en pizzicati, et le premier violon, arco. Il s’est alors produit la chose suivante : nous avons corrigé ce passage en insérant dans la bande sonore un extrait de la répétition générale. Nous avons pu alors parfaitement recaler les pizzicati du second violon, mais nous avons remarqué seulement après quelques visionnages que les deux violons n’avaient pas joué avec le même synchronisme entre la générale et le concert.

La séquence choisie nous montre les deux violonistes. A ce moment, pour le second violon, le son est parfaitement synchrone avec l’image. Cependant, il apparaît que le premier violon ne l’est pas du tout.

Le phénomène a été repéré par la moitié de nos sujets et ceci aux alentours de la troisième diffusion, ce qui confirme notre propre expérience du phénomène.

De plus, nous mettons en évidence une hystérésis importante. Lorsque le défaut a été repéré une première fois, les sujets l’identifient à chaque fois ensuite.

Dans la mesure où ce défaut ne faisait pas partie de nos intérêts premiers, nous n’avons pas effectué d’expériences concernant la mesure des seuils pour la désynchronisation. Il serait néanmoins très intéressant de pouvoir déterminer à partir de quel moment le défaut devient déstabilisant.

Exemple de phénomène d'hystérésis pour la désynchronisation, sujet A. — Exemple de phénomène d’hystérésis pour la désynchronisation, sujet A.

Exemple de phénomène d'hystérésis pour la désynchronisation, sujet J. — Exemple de phénomène d’hystérésis pour la désynchronisation, sujet J.

4. Interprétation des résultats et discussion

Nous allons émettre ici quelques hypothèses pouvant éclaircir les résultats obtenus. Il s’agira d’explorer quelques pistes qui nous permettent de comprendre comment fonctionne notre perception dans une telle situation multimodale. Nous essaierons en outre de dégager quelques pistes interprétatives sur le rôle que jouent les mécanismes cognitifs et les mécanismes de l’attention.

4.1 Différents niveaux de perception

Dans la situation précise que nous avons décrite, nous pouvons repérer plusieurs niveaux de perception. La connaissance de ceux-ci pourra nous donner quelques informations à propos des procédés attentionnels mis en œuvre.

Au même niveau, nous avons la perception auditive combinée avec la perception visuelle lorsque l’image nous est présentée avec le son. Il s’agit ici du niveau le plus basique de la perception, avant que ces éléments ne fassent sens.

Ce que nous avons vu concernant la cognition prend ensuite toute son importance. En effet, à un niveau supérieur, les informations provenant des deux modalités audition et vision sont alors mises en relation. Une certaine signification est attribuée au message. C’est à ce moment-là que nous pouvons appréhender cette situation de concert retransmis par l’intermédiaire d’un écran et de haut-parleurs.

Deux types de perception différents agissent ensuite en parallèle : nous avons d’un côté notre perception de la musique, du concert à proprement parler, et de l’autre côté notre perception « technique », selon la consigne qui nous a été indiquée. Ici, il s’agissait donc de détecter d’éventuels problèmes au niveau du son ou même de l’image.

4.1.1 Perception musicale dans cette situation

Notre perception musicale nous permet d’apprécier la relation des instruments entre eux, l’harmonie, la mélodie, etc. Elle nous permet également de ressentir un certain nombre d’émotions en fonction de la sensibilité de chacun. De plus, comme nous l’avons vu dans le troisième chapitre de notre première partie (III – Multimodalité), nous savons que les stimuli à la fois visuels et sonores ont pour effet une augmentation de nos réactions et de nos émotions (Levitin D., 2007).

Le montage vidéo peut influencer également la perception. Selon les plans choisis par le réalisateur, notre attention peut être dirigée vers une partie seulement des instrumentistes. En mettant en relation notre perception visuelle avec notre perception

auditive de la musique, nous pouvons alors percevoir plus distinctement telle ou telle partie de la partition.

4.1.2 Perception « technique » dans cette situation

Pendant qu’une partie de notre système cognitif nous permet de percevoir la musique et d’en ressentir des émotions, une autre nous permet, selon la consigne demandée, d’évaluer la qualité d’un produit. Il s’agit donc de repérer des éléments souvent brefs, peu perceptibles, que nous avons appris à reconnaître et à qualifier, grâce à nos connaissances spécifiques et notre savoir-faire d’ingénieur du son. Ainsi, là où une personne inexpérimentée pourra soit ne rien percevoir, soit ressentir un malaise sans pouvoir l’exprimer, les ingénieurs du son ont la capacité de pouvoir qualifier, interpréter, et exprimer ce qu’ils ont perçu grâce au langage.

Il s’agit donc d’essayer de faire abstraction des messages musicaux pour se concentrer sur le signal lui-même. Cependant, il n’est pas rare que les défauts possibles aient un certain rapport avec la musique. Les points de montage en sont typiquement l’exemple.

Ici, le seul élément qui n’ait aucun rapport avec la musique et qui relève de l’évaluation de la qualité purement technique du signal est le « clic ». Notre système perceptif l’analyse donc comme un élément étranger. C’est d’ailleurs l’élément le plus facilement détecté dans notre expérience.

4.2 Détection des défauts en rapport avec la musique – première interprétation

À partir de quels critères pouvons-nous juger de la mauvaise qualité d’un point de montage ? Il s’agit essentiellement de repérer les discontinuités. En effet, le point de montage parfait est celui qui ne s’entend pas, en d’autres termes, ce passage d’une prise à une autre s’effectue le plus naturellement possible, comme si ces deux éléments faisaient partie d’un même tout.

Dans notre situation, les discontinuités relèvent essentiellement d’une écoute plutôt technique (problème de raccord entre les timbres des instruments, différence d’image sonore…), puisque le son et l’image sont sensés être synchrones tout au long de la séquence.

Cependant, l’image du concert, dans laquelle nous pouvons percevoir une unité de lieu et de temps, nous apparaît continue. Et même dans le cas de plusieurs prises, le fait de voir le même décor, les mêmes costumes, les mêmes éléments nous font accepter sans aucun problème la continuité de la situation. C’est l’illusion qui est créée au cinéma, même si chacun a pu appréhender ce phénomène en voyant des films dès son plus jeune âge.

Nous effectuons alors une première hypothèse concernant la non-perception de ces points de montage avec la vidéo : le synchronisme entre le son et la vidéo fait que l’on

considère ces deux éléments comme un tout. De plus, l’image étant supposée continue, il n’y a donc aucune raison pour que le son ne le soit pas pour notre système cognitif.

Cette hypothèse part donc du principe que la non-perception des défauts lorsque l’image est présente, relève de mécanismes cognitifs, et plus précisément de processus top- down et bottom-up.

4.3 Hypothèse d’un masquage attentionnel

Notre deuxième hypothèse concernant l’explication de la non-perception, ou du moins la moins bonne perception des défauts sonores lorsque nous ajoutons une information visuelle, repose sur les mécanismes attentionnels mis en œuvre.

En effet, comme nous l’avons sous-entendu précédemment, pour détecter les défauts sonores, il faut prêter attention à la bande sonore. Or, notre attention est ici perturbée par l’image, qui joue alors le rôle de distracteur.

Un élément supplémentaire vient s’ajouter à cela. Il s’agit, comme nous l’avons décrit, de la signification du message, et donc de la perception musicale que nous avons de l’extrait. Nos émotions et nos attentes musicales jouent elles aussi un rôle de distracteur. Pourtant, elles font partie intégrante de la perception de ce concert retransmis.

Nous avons donc un distracteur perceptif, constitué par l’image, et un distracteur que l’on peut qualifier de « cognitif », qui résulte de notre perception et de notre ressenti de la musique.

Notre attention est donc partagée entre deux modalités, certes, mais surtout entre trois voire quatre éléments (son, image, musique, émotions). Il n’est donc pas chose aisée de détecter des défauts dans ces conditions. De plus, la situation principale fait appel à notre attention soutenue, ce qui rend encore plus difficile la tâche de détection.

Nous pouvons donc faire l’hypothèse que la non-perception des défauts sonores résulte d’un masquage attentionnel provoqué par l’ajout de l’image qui renforce alors nos émotions et notre perception de la musique.

Mais alors, comment expliquer le fait que les points de montage ne sont pas perçus même lorsque l’on ôte l’image?

Nous pouvons avancer un élément de réponse en remettant en cause notre expérience. En effet, comme nous l’avons indiqué précédemment, celle-ci dépend fortement de la propre perception de l’expérimentateur. Il est donc possible qu’en ayant travaillé beaucoup sur ce montage, nous avons mémorisé chaque caractéristique des points de montage, et que nous avons été trop optimistes sur les seuils. Mais si ce n’était pas le cas ? Nous avons tous au moins une fois fait l’expérience d’écouter un montage en fermant les yeux et en se détachant de notre travail. Par miracle, les points montages que l’on pouvait trouver perfectibles ne s’entendent plus. Que se passe-t-il alors ?

4.4 Attention soutenue et attentes

Là encore, nous pouvons faire l’hypothèse que la non-perception des défauts dans une même modalité relève des mécanismes de l’attention.

En effet, comme nous l’avons précédemment indiqué, l’écoute d’une longue séquence dans un but de « contrôle qualité » mobilise notre attention soutenue, ce qui rend la tâche de détection plus difficile. Fondamentalement, il reste possible que des défauts soient présents, mais ce n’est pas certain. De plus, nous n’avons aucun moyen de savoir ni de prévoir à quels moments peuvent survenir ces défauts.

Nous ajouterons également que dans certains cas, nous pouvons percevoir un point de montage par exemple là où il n’y en a pas. Ceci peut arriver lorsque nous percevons un bruit « parasite » qui nous fait donc penser à un tel défaut.

Une personne qui écoute un montage pour la première fois ne connaît jamais le plan de montage. À aucun moment celle-ci ne sait quand plusieurs prises s’enchaînent l’une à l’autre. Les attentes du sujet sont donc modifiées dans ce cas. En effet, n’ayant pas repéré à l’avance où peuvent se situer les points « critiques », le sujet n’a pas d’attente concernant ces points, contrairement à quelqu’un qui a travaillé des heures sur le montage. La perception n’est donc à aucun moment influencée par des indices extérieurs.

Il en résulte que sur un long extrait sonore, les défauts du type « mauvais point de montage » sont difficiles à détecter pour quelqu’un qui n’a pas travaillé sur le projet auparavant, et qui donc n’a pas mémorisé le plan de montage ainsi que les points critiques.

On peut cependant remarquer que lorsque nous présentons la session de montage aux sujets, et que ceux-ci visualisent les points de montage, la perception de ces derniers devient absolument flagrante. Les effets d’attente sont rétablis, puisque l’on voit le curseur défiler et s’approcher des points. De plus, la visualisation de la session de travail nous replace dans un contexte d’écoute technique, avec l’environnement adéquat. Il est donc plus aisé de se détacher de la musique et de concentrer uniquement sur ce qui nous intéresse.

4.5 Notes sur le problème du « playback »

Au cours de productions sur lesquelles j’ai pu travailler au studio EtLaNuit à Montreuil, j’ai été chargé d’effectuer le montage musical d’un moyen-métrage de la réalisatrice sénégalaise Dyana Gaye. Il s’agit précisément d’une comédie musicale.

Il m’a donc été donné de travailler sur le problème du playback. Après avoir enregistré la musique, les comédiens ont dû tourner les scènes en playback. Après le montage image, il m’a fallu recaler plus précisément les voix en fonction de l’image.

Ce travail m’a donc permis de réfléchir sur le problème du playback, et de l’intention musicale, qui peut différer entre le son et l’image. La difficulté du problème réside alors dans le fait de faire correspondre les deux composantes.

Dans un premier temps, j’ai pu m’apercevoir que les tolérances temporelles qui sont communément admises au niveau du synchronisme son-image se retrouvent fortement réduites lorsque cela concerne un contenu musical. En effet, lorsque la musique rentre en jeu, et que de plus elle devient l’acteur principal du film, nous avons besoin d’être en parfaite synchronie.

Dans un second temps, j’ai pu également travailler au niveau des intentions des chanteurs. Il n’a pas été rare de voir que par exemple les ouvertures de bouche sur les voyelles diffèrent entre image et son (par exemple, un /a/ qui apparaît plus « ouvert » à l’image qu’au son). Ceci contribue fortement à un playback « qui se voit », à un effet inverse de celui recherché qui est d’amplifier la perception de la musique.

Conclusion

Au cours de ce travail, nous avons pu comprendre les mécanismes de la perception d’un point de vue psychologique et cognitif. En effet, bien qu’ayant une bonne connaissance du fonctionnement physiologique de nos mécanismes sensoriels, cette connaissance ne peut pas à elle seule expliquer tous les procédés de la perception.

Nous avons étudié notamment un cas de perception multisensorielle dans une situation courante de notre métier d’ingénieur du son – directeur artistique, et nous avons vu que les informations transmises sont très nombreuses, et qu’il était difficile d’élaborer un protocole expérimental, du fait que tous les éléments sont imbriqués et s’influencent les uns les autres. Il a fallu en outre prévenir les effets cognitifs pouvant influencer les résultats, tels que les effets de mémoire ou d’attente.

Nous avons cependant pu vérifier grâce à quelques sujets qu’il semble bien exister une influence de l’image sur la perception du son et des défauts sonores. Encore une fois, il ne s’agit pas ici de généraliser mais de trouver quelques indices pouvant confirmer notre hypothèse de départ. Il en ressort ainsi qu’il semble que les seuils de détection des défauts sonores soient plus élevés lorsque l’image est diffusée avec le son.

En outre, nous avons pu remarquer que la perception des mauvais points de montage dans notre expérience est presque nulle, même lorsque nous diffusons que le son. Il semble donc que leur détection devient très difficile sur de longues périodes, et lorsque les effets d’attente sont inhibés.

Nous avons enfin pu faire plusieurs hypothèses pouvant expliquer l’influence de l’image sur le son, et du contenu sur le son : une première hypothèse qui relève du traitement cognitif de l’information, où nous avons donc un masquage du défaut par l’information et les émotions que celle-ci suscite ; et une seconde hypothèse qui relève plus simplement d’un masquage attentionnel, dans la continuité des travaux qui ont été effectués sur l’attention au cours de l’Histoire.

Il serait intéressant de pouvoir creuser ces deux hypothèses en réduisant encore notre champ d’action. L’étude de tels phénomènes peut cependant poser de nombreuses difficultés et demande l’élaboration de protocoles expérimentaux très maîtrisés et sophistiqués pour savoir si l’une ou l’autre de nos hypothèses est valide ou non.

Remerciements

Je tiens à remercier en premier lieu Corsin Vogel, qui a assuré la direction de mon mémoire, et qui a su parfaitement m’aiguiller et me rassurer dans les moments de doute.

Je remercie également chaleureusement Danièle Dubois, du laboratoire Langages, Cognitions, Pratiques, Ergonomie, qui a assuré la co-direction de mon mémoire, et Caroline Cance du Laboratoire d’Acoustique Musicale, pour leur regard critique et leur aide ô combien précieuse.

Merci également à Hugues Genevois, du Laboratoire d’Acoustique Musicale, qui m’a conseillé lors de l’élaboration de mon sujet.

Un grand merci à toute l’équipe pédagogique de la FSMS, Daniel Zalay, Georges Bloch, Catherine Barbe et Philippe Lafargue (une pensée particulière pour Didier Salles), ainsi que Catherine de Boishéraud et toute l’équipe du Centre Audiovisuel.

Je tiens à remercier ma famille, mes amis, toutes les personnes qui ont été à mes côtés au cours de ces quatre années.

A ces personnes qui m’ont soutenu pendant les moments difficiles, je ne vous remercierai jamais assez.

J’aimerais remercier toutes les personnes qui se sont prêtées au jeu de l’expérience, et sans qui il m’aurait été impossible de mener ce travail à son terme.

Bibliographie

BERTRAND, A., GARNIER, P.-H. Psychologie Cognitive. Levallois-Perret : Studyrama, 2005.

BINET, A. Introduction à la psychologie expérimentale. Paris : L’Harmattan, 2006 (1894).

BROADBENT, D. Perception and Communication. London: Pergamon Press, 1958.

BRUNER, J.S. On perceptual readiness. Psychol Rev., 1957, n°64, 123-152.

CALVER, G., SPENCE, C., STEIN, B. E. The hand book of multisensory processes. Cambridge : MIT Press, 2004.

CAMUS, J.-F. La psychologie cognitive de l’attention. Paris : Armand Colin ed., 1996.

DELORME, A., FLÜCKIGER, M. Perception et Réalité : une introduction à la psychologie des perceptions. Bruxelles : DeBoeck Université, 2003.

DUMAURIER, E. Psychologie expérimentale de la perception. Paris : PUF, Le Psychologue, 1992.
FECHNER, G.T. Elemente der Psychophysik. Leipzig : Breitskopf and Härtel, 1860.
GODEFROID, J. Psychologie : science humaine et science cognitive. Bruxelles : De Boeck Université, 2001.

GIBSON, J.-J. The Senses Considered as Perceptual Systems. Boston: Houghton Mifflin, 1966.
GUASTAVINO, C. (2003).Etude sémantique et acoustique de la perception des basses fréquences dans l’environnement sonore urbain. (Thèse de doctorat – LAM, Paris VI).

HEAD, H. The conception of nervous and mental energy : II. Vigilance : A physiological state of the nervous system. British Journal of Psychology. 1923, n°14, p. 126-147.

JAMES, W. Attention. The Principles of Psychology, 1890, Vol 1, Chap. 11, p. 403-404.

KAHNEMAN, D. Attention and Effort. Englewood Cliffs, NJ : Prenticehall, 1973.

LEMAIRE, P. Abrégé de psychologie cognitive. Bruxelles : De Boeck, 2006.
LEVITIN, D., CHAPADOS C. Cross-modal interactions in the experience of muscial performances : Physiological correlates. Cognition. 2007, n°108. p. 638-651.
LOCKE, J. Essai sur l’entendement humain. Paris : Vrin, 2001 (1690).
MCADAMS, S., BIGAND E. Penser les sons, psychologie cognitive de l’audition. Paris : PUF, Psychologie et Sciences de la Pensée, 1994.

MCGURCK, H., MACDONALD, J. Hearing Lips and Seeing Voices. Nature. 1976, n° 264, p. 746-748.

MOLYNEUX, W. Correspondance, 1688.

NATHANAIL, C. (1999). Influence des informations visuelles sur la perception auditive : conséquences sur la caractérisation de la qualité acoustique des salles. (Thèse de doctorat – LAM, Paris).

NEISSER, U. Cognitive psychology. New York : Appleton-Century-Crofts, 1967.

PERETZ, I. Les agnosies auditives: une analyse fonctionnelle. in MCADAMS, S., BIGAND E. Penser les sons, psychologie cognitive de l’audition. Paris : PUF, Psychologie et Sciences de la Pensée, p. 215-248, 1994.

PERETZ, I. Modularity of Music Processing. Nature Neurosciences. 2003, vol 6, p. 688-691.
PIAGET, J. Le développement mental de l’enfant. dans Six Etudes de Psychologie. 1940, folio essais, n°71, p.11-101.
PINEAU, M., TILLMANN, B. Percevoir la Musique : Une Activité Cognitive. coll. Sciences de l’Education Musicale. Paris : L’Harmathan, 2001.

PROPER, D. Mastering for Multichannel. Workshop, AES 126th Convention, Munich, 2009.

QUINLAN, P., DYSON, B. Cognitive Psychology. Harlow/New York, Pearson/Prentice Hall, 2008.

ROULIN, J.-L. Psychologie Cognitive. Rosny : Bréal, coll. Grand amphi Psychologie, 2006.

ROY, S., NATTIEZ, J.-J.L’analyse des musiques électroacoustiques : Modèles et propositions. Paris : L’Harmattan, 2004.

TREISMAN, A. Contextual cues in selective listening. Quarterly Journal of Experimental Psychology. 1960, n°12, p.242-248.

VIOLLON, S. (2000) Influence des informations visuelles sur la caractérisation de la qualité acoustique de l’environnement urbain. (Thèse de doctorat – LAM, Paris VI).

VOGEL, C. (1999) Etude sémiotique et acoustique de l’identification des signaux sonores d’avertissement en contexte urbain. (Thèse de doctorat – LAM, Paris VI).
WATSON, J.Psychology as the Behaviorist Views it. Psychological Review. 1913, n°20, p.158- 177.
WEIL-BARAIS, A. L’homme cognitif. Paris : PUF, coll. Premier Cycle, 1993.
WERTHEIMER, M. Untersuchungen zur Lehre der Gestalt, II. Psychologische Forschung 1923, n°4, p. 301-350.
WICKENS, C. D. Processing resources in attention. In R. Parasuraman & D. R. Davies (Eds.),Varieties of attention. 1984, Orlando, Fl : Academic, p. 63-102.

Bibliographie complémentaire

ALLPORT, G. Becoming : basic considerations for a psychology of personality. New Haven : Yale University Press, 1955.

BAILBLE, C. (1998). L’image frontale, le son spatial. in Beau, F., Dubois, P., Leblanc, G.

Cinema et dernières technologies. Paris : De Boeck & Larcier, 1998.

BAILBLE, C. (2003). Le réel, le sonore et l’imaginaire auditif. Dossiers de l’Audiovisuel. 2003, n°109.

PAVLOV, I. P.Conditioned reflexes. London : Routledge and Kegan Paul, 1927.

POIRIER, A., BOUKOBZA, J.-F., XUEREB, P.-H., STRANSKA, L., SRNKA, M. Leos Janacek,

Lettres intimes, quatuor à cordes n°2. Fascicule, programme de concert, CNSMDP, Paris, 2008.

SKINNER, B. F. Science and human behavior. New York: Macmillan, 1953.

THORNDIKE, E. Educational Psychology : The Psychology of Learning. New York : Teachers College Press, 1913.

Annexes

Annexe A.

Dispositif de captation du concert ayant servi de support à l’expérience

Nous disposions pour cette captation d’une équipe vidéo avec 3 caméras, et d’une équipe son. Le principe même du concert filmé nous a quelque peu imposé le système de prise de son et son emplacement, de façon à ce que celui-ci ne se voie pas.

Le quatuor à cordes a donc été enregistré au moyen d’un couple suspendu de microphones Schoeps mk4V. Une réverbération artificielle a ensuite été ajoutée en post- production à l’aide du logiciel Altiverb.

Salle d’Orgue, Conservatoire National Supérieur de Musique et de Danse de Paris

Caractéristiques techniques des microphones utilisés (source : www.schoeps.de)

Capsules microphoniques MK 4V + amplificateurs microphoniques CMC 6, CCM 4V U, CCM 4V L

Bande passante :	40 Hz – 20 kHz
Sensibilité :	13 mV/Pa
Niveau de bruit de fond acoustique équivalent :	pondéré A: 14 dB-A
	CCIR: 24 dB
Niveau de signal/bruit (pondéré A) :	80 dB-A
Pression acoustique maximum (0,5% THD*) :	132 dB

*distorsion harmonique totale

Amplificateurs microphoniques CMC 5, 6 :

Type d’amplificateur	Alimentation	Intensité de courant	Impédance	Seuil de fréquence basse(-3 dB)
CMC 6U: commutation automatique	12 V fantôme	8 mA	25 Ohms	20 Hz
	48 V fantôme	4 mA	35 Ohms	20 Hz
CMC 5U:	48 V fantôme	4 mA	35 Ohms	30 Hz
Tension maximale de sortie:	1 V (pour 1 kHz et 1 kOhms de résistance de charge)
Résistance de charge conseillée:	600 Ohms (au valeurs inférieures, réduction notable du niveau de modulation)
Longueur:	116 mm (y compris 3mm de filetage pour la capsule)
Diamètre:	20 mm
Poids:	65 à 68 g (en fonction du type)
Surface:	gris anti-reflet (g) ou nickel (ni)

Annexe B.

Détail des valeurs de défauts ajoutés

Fade Long	Fade Court	Clic	Fade Moyen	Volume Violoncelle	Volume Fin
251,2 ms	501 ms	-42dB	211 ms	-2,5 dB	0 dB
398,1 ms	170,9 ms	-36 dB	265,7 ms	-3,8 dB	-3 dB
857,5 ms	107,8 ms	-30 dB	309,8 ms	-5,2 dB	-6 dB
1,6 s	92,4 ms	-24 dB	390 ms	-7,8 dB	-9 dB
2,9 s	34,1 ms	-18 dB	530 ms	-10,3 dB	-12 dB

Explication des défauts :

« Fade Long » : point de montage dont la longueur augmente au fur et à mesure des 5 écoutes, pour arriver au dédoublement de la source.

« Fade Court » : point de montage dont la longueur diminue au fur et à mesure des 5 écoutes, pour arriver pratiquement à une rupture sonore.

« Clic » : clic numérique rajouté et mélangé à la bande son suivant les valeurs ci-dessus.

« Fade Moyen » : point de montage dont la longueur augmente au fur et à mesure des 5 écoutes. Les différences de temps sont plus faibles que pour le « Fade Long »

« Volume violoncelle » : Variation de volume à un instant t de la séquance, qui ne comporte qu’une note de violoncelle, ainsi que la réverbération de l’accord précédent.

« Volume fin » : effet de pompage sur l’attaque des trois accords de fin. Une courbe de volume est appliquée de manière analogue sur les trois accords, en suivant les valeurs ci- dessus.

Annexe C.

Photographie de la régie ayant servi à l’expérience

Régie de l'espace interdisciplinaire (ex - Salle Maurice Fleuret) Conservatoire Nationale Supérieur de Musique et de Danse de Paris — Régie de l’espace interdisciplinaire (ex – Salle Maurice Fleuret) Conservatoire Nationale Supérieur de Musique et de Danse de Paris

Caractéristiques techniques des enceintes (source : www.cabasse.com)

Annexe D.

Copie du questionnaire ayant servi à l’expérience

Notes

voir THORNDIKE, E. Educational Psychology : The Psychology of Learning. New York : Teachers College Press,
1913. ↩︎
voir PAVLOV, I. P. Conditioned reflexes. London : Routledge and Kegan Paul, 1927. ↩︎
voir SKINNER, B. F. Science and human behavior. New York: Macmillan, 1953. ↩︎
voir ALLPORT, G. Becoming : basic considerations for a psychology of personality. New Haven : Yale University Press, 1955. ↩︎
Caractéristiques à l’annexe C. ↩︎
Valeurs complètes à l’annexe B. ↩︎

mai 20, 2026

La prise de son d’orchestre en Europe
Conservatoire National Supérieur de Musique et de Danse de Paris

Étude technique et esthétique

Par : Elsa Desjardins
Directeur de mémoire : Thomas Dappelo
Mai 2014

Formation Supérieure aux Métiers du Son

Résumé

Ce mémoire est l’aboutissement d’un travail de recherche mené dans le cadre du diplôme de la Formation Supérieure aux Métiers du Son du Conservatoire National Supérieur de Musique et de Danse de Paris. Les questions abordées sont celles de l’existence et de l’évolution de différentes écoles et traditions de prise de son d’orchestre depuis les débuts de la stéréophonie.

Des ingénieurs du son français, allemands et anglais ont été interrogés sur différents thèmes autour de la prise de son d’orchestre : les écoles esthétiques et techniques, les labels, leurs propres habitudes techniques et goûts esthétiques… Parallèlement à cette enquête, des écoutes analytiques d’enregistrements ont été menées afin de relier les différents aspects étudiés à des exemples sonores.

Après cela, un certain nombre de pistes de discussions différentes a pu être exploré et des réflexions ont été menées sur la notion d’esthétique de label et l’avenir de cette notion, la distinction entre les esthétiques de radio et de disques, le lien entre certaines habitudes de prise de son et les lieux d’enregistrement…

Remarques

Les citations en langue étrangère sont présentées en français, avec leur version originale en bas de page. Les traductions des citations, du questionnaire et des réponses aux questionnaires ont été réalisées par mes soins.

Les références bibliographiques sont présentées entre crochets, numérotées par ordre d’apparition. La bibliographie est consultable p.71.

Les extraits sonores proposés dans le CD joint sont référencés de la manière suivante : Piste n° 1

Les photos non créditées ont été réalisées lors de mes différents stages professionnels.

Introduction

Lors de mes études, j’ai entendu à plusieurs reprises l’évocation d’un son allemand qui s’opposerait à un son français, de l’identité sonore de certains labels, ou radios, etc. J’ai aussi pu observer, lors de productions à l’étranger et lors de discussions avec des étudiants Erasmus, que les microphones et techniques utilisés à l’étranger n’étaient pas toujours les mêmes qu’en France. Ceci m’a amenée à me poser la question de l’existence de différentes écoles ou traditions de prise de son. Mon expérience personnelle n’étant pas suffisante pour répondre à cette question, j’ai choisi d’étudier plus précisément cette thématique dans ce projet de recherche.

Que sont devenues les esthétiques et techniques des grands labels du début de la stéréophonie ? Existe-t-il aujourd’hui des écoles de prise de son ? Comment se caractérisent-elles ?

Pour ce faire, je me suis concentrée plus particulièrement sur la prise de son d’orchestre symphonique, car c’est une formation qui a fait l’objet d’un grand nombre d’enregistrements, et qui permet de soulever un grand nombre de questions techniques (système principal, appoints, techniques de mixage, etc.) et esthétiques (référence au concert, importance de la salle, …). Cette recherche porte uniquement sur le cas de l’orchestre symphonique ‘type’ tel qu’il sera défini dans le chapitre 1.1.1, et exclut par exemple le répertoire baroque ou contemporain.

D’autre part, je me suis limitée à la prise de son à deux canaux, pour deux raisons : premièrement, la grande majorité des enregistrements actuels sont encore réalisés en stéréo, et les prises de son multicanales représentent encore une part très minoritaire du marché. D’autre part, une des problématiques était de voir ce qu’était devenue la notion d’esthétique de label aujourd’hui, en comparaison avec les labels historiques des années 1960 à 1980. Afin de pouvoir comparer cela, il était important de se situer dans ce même cadre de l’enregistrement stéréophonique.

Enfin, j’ai aussi exclu le cas des enregistrements avec vidéo, pour les mêmes raisons que précédemment, mais aussi parce qu’il s’agissait de se concentrer sur une esthétique audio, et que la question du son pour la vidéo aurait impliqué de s’intéresser aussi à l’esthétique vidéo et aux liens entretenus par l’image et le son. De la même manière, la musique de film étant très liée au support visuel qu’elle accompagne, elle ne sera pas prise en compte dans ce mémoire, si ce n’est comme source d’influence.

Cette recherche s’articule autour de plusieurs éléments :
- Une recherche documentaire portant principalement sur trois aspects de la prise de son d’orchestre. L’orchestre en lui-même tout d’abord, et le questionnement de la notion d’identité sonore d’un orchestre et des paramètres pouvant influer sur cette identité sonore. Ensuite, le lieu d’enregistrement, dont la qualité représente un pré-requis indispensable à une bonne prise de son, et qui peut apporter sa propre personnalité à l’enregistrement. Enfin, quelques labels historiques européens ont été étudiés, afin de voir ce qui faisait leurs caractéristiques techniques et esthétiques, ainsi que leur évolution depuis les débuts de la stéréophonie.
- D’autre part, la rédaction d’un questionnaire destinés à des ingénieurs du son Français, Allemands, et Britanniques, permettant de rassembler des informations sur l’état actuel de la production de musique symphonique, les différentes techniques utilisées et esthétiques recherchées.
- Et enfin, l’écoute personnelle d’un grand nombre d’enregistrements anciens et actuels (depuis les années 1960), afin de mettre en relation les différents éléments évoqués dans la recherche documentaire et dans les interviews, et de vérifier ou infirmer par l’écoute les différentes problématiques soulevées.
Les différentes étapes de cette recherche nous permettront d’analyser l’émergence d’écoles nationales de prise de son, d’esthétiques propres à des radios ou labels, et de discuter de l’évolution de ces notions.

1. Revue de littérature

1.1. L’orchestre symphonique

Afin d’étudier les caractéristiques esthétiques et techniques de la prise de son d’orchestre, il est important d’analyser tout d’abord plus précisément l’objet sonore que représente l’orchestre. Après un bref rappel historique sur les origines de l’orchestre symphonique et son développement jusqu’à un effectif-type, nous verrons dans quelle mesure certains orchestres ont pu développer une couleur sonore qui leur est propre, comme c’est le cas pour un instrumentiste seul.

1.1.1. Un instrument à part entière

L’orchestre peut être défini comme une réunion d’instrumentistes de différentes familles selon une organisation-type qui s’est développée au fil de l’histoire. Cependant, l’orchestre est plus qu’une addition de solistes. On peut donc considérer l’orchestre sous un autre angle : celui d’un instrument à part entière. En effet, le niveau instrumental de chaque membre de l’orchestre est important, mais l’habitude qu’ils ont de jouer ensemble, leur écoute, les caractéristiques communes de son qu’ils développent le sont tout autant.

One can start from two different premises : that an orchestra is a corporation of instrumental musicians ; and that an orchestra is a corporate musical instrument. The distinction is, in effect, that of the orchestra as an institution and as a sounding body.¹ [1]

Orchestre : n.m. Au sens le plus général, et particulièrement dans la musique occidentale, réunion d’instruments fonctionnant comme « masse », comme ensemble, et non comme addition de solistes, ce qui est le cas dans les formations « de chambre ». [2]

L’histoire de l’orchestre débute au XVIIème siècle, pendant lequel les instrumentistes se regroupent par famille d’instruments pour former des consorts. Pour des événements particuliers ou des œuvres particulières, il arrive qu’on regroupe ces différents consorts pour former ce qui correspondrait à l’ancêtre de l’orchestre.

L’évolution de l’orchestre est liée à l’histoire de l’opéra. Au milieu du XVIIᵉ siècle, chaque maison d’opéra possède un ensemble de cordes et un continuo. À la fin du XVIIᵉ siècle, on commence à utiliser le terme ‘orchestre’ en France et en Italie pour parler de ces ensembles, et quelque temps après, ce terme est repris en Allemagne et en Angleterre. Les compositeurs commencent à écrire pour des formations orchestrales « types ». Lully établit par exemple un modèle d’orchestre dont il se sert pour tous ses opéras (cordes, deux hautbois, deux bassons, avec ajout si nécessaire d’autres bois ou de cuivres). Ce modèle est ensuite transmis par ses élèves et admirateurs, et devient un modèle pour les compositeurs de la période classique. Beaucoup de symphonies de Mozart et Haydn utilisent cette même formation, avec l’addition de deux cors. [1]

Durant le XIXᵉ siècle, l’orchestre symphonique type se développe. Cette formation est la base de tous les orchestres actuels :
- Section de cordes (par exemple 16 violons I, 14 violons II, 12 altos, 10 violoncelles, 8 contrebasses)
- Bois (flûte, hautbois, clarinette, basson) souvent par 2 et éventuellement flûte en sol, piccolo, cor anglais, clarinette basse, contrebasson,…
- Section de cuivres : 2 ou 4 cors, trompettes, trombones, éventuellement tuba
- Timbales, percussions
- À ces sections peuvent s’ajouter harpe, piano, célesta,… selon les besoins des œuvres.
Durant le XXᵉ siècle, les principales évolutions que l’on a pu observer concernant la composition des orchestres consistent surtout en l’ajout d’un grand nombre de percussions, et une importance parfois plus grande donnée aux cuivres. Quelques nouveaux instruments ont aussi fait leur apparition dans l’orchestre : guitare acoustique (Symphonie n°7 de Mahler, 1905), saxophone (Boléro de Ravel, 1928), ou encore guitare électrique (Allelujah II de Berio, 1958)…

1.1.2. L’identité sonore des orchestres

Du fait de l’existence d’une formation orchestrale « type », avec un effectif semblable pour tous les orchestres, on peut considérer l’orchestre comme un instrument à part entière. Les musiciens d’orchestre restant en général pendant un temps important de leur carrière dans un même orchestre, chaque orchestre a la possibilité de développer des caractéristiques sonores qui lui sont propres, tout comme ce serait le cas d’un instrumentiste seul. On attribue ainsi à certains orchestres célèbres une sonorité particulière, qui fait leur identité et leur renommée, exactement de la même manière qu’on attribue une identité sonore à un instrumentiste soliste. Lors de la prise de son, il est donc possible de considérer l’orchestre comme entité sonore, et non pas seulement comme une multitude d’instruments.

Quelques orchestres célèbres

On trouve dans The Orchestra – A very short introduction [3] une description de l’identité sonore de quelques orchestres célèbres (pour chaque orchestre, l’auteur propose un exemple sonore) :

Amsterdam Royal Concertgebouw Orchestra
Le son chaud, intime, de la salle elle-même, permettant aux musiciens de ne pas forcer. Jeu délicat et nuancé des cordes, parfois qualifié de doux ou velouté. Longue association aux symphonies de Bruckner et Mahler. Percussions sophistiquées.²

Exemple sonore (Piste n° 2) : Mahler, Symphonie n°3 en ré mineur, mvt I (Kräftig, Entschieden), dir. Bernard Haitink (Philips 1966).

Berliner Philharmoniker
Interprétations voluptueuses et extrêmement raffinées, typiquement attribuées à l’instruction de Herbert von Karajan de faire commencer le vibrato de la main gauche avant que l’archet ne touche la corde. Cuivres sonores et gutturaux.³

Exemple sonore (Piste n° 3) : Sibelius, Symphonie n°5, mvt III (Allegro Molto), dir. Herbert von Karajan (Deutsche Grammophon, 1965)

Chicago Symphony Orchestra
Les « cuivres de Chicago » : une grandeur et une perfection technique attribuées tour à tour au chef d’orchestre Fritz Reiner, au trompettiste principal, Adolph Herseth, et au tubiste principal, Arnold Jacobs.⁴

Exemple sonore (Piste n° 4) : Richard Strauss, Also Sprach Zarathustra, dir. Georg Solti (Decca 1975)

Cleveland Orchestra
Perfection technique, soin minutieux des contrastes dynamiques, contrepoint orchestral étudié, souvent qualifié de transparent, et sonorité fine européenne.⁵

Exemple sonore (Piste n° 5) : Dvořák, Danse slave en si Majeur, op 72 n°1, dir. George Szell (Columbia 1965)

London Symphony Orchestra
Interprétations vives et extraverties, solistes célèbres dans les rangs (James Galway, flûte ; Gervase de Peyer, clarinette ; Barry Tuckwell, cor). Bonne faculté d’adaptation à ses nombreux et éminents chefs d’orchestre invités. Musiques de film.⁶

Exemple sonore (Piste n° 6) : Elgar, The Dream of Gerontius, fin de la 1ère partie, Proficiscere, anima Christina/ Go forth, in the name of Angels and Archangels, dir. Colin Davis (LSO Live, 2006)

Philadelphia Orchestra
Phrasé des cordes homogène (« le son de Philadelphie », « ces fabuleux philadelphiens »). On dit souvent que c’est une réponse à l’acoustique sèche de l’ancienne résidence de l’orchestre, l’Académie de Musique de Philadelphie ; accomplie en partie par des superpositions subtiles de changements d’archets.⁷

Exemple sonore (Piste n° 7) : Tchaikovsky, Symphone n°5 en mi mineur, op 64, mvt III (Valse), dir. Riccardo Muti (EMI 1992)

Wiener Philharmoniker
Instruments n’existants qu’à Vienne. Le hautbois viennois et les cuivres à palettes sont de petit calibre et offrent un timbre délicat et précis. Les instruments à cordes appartiennent à l’orchestre, et non aux musiciens, et sont donc transmis de génération en génération. La pureté et la traditition continue de ce son ont longtemps été également attribuées à la pureté raciale et de genre des musiciens hommes, blancs et européens.⁸

Exemple sonore (Piste n° 8) : Beethoven, Symphonie n°7 en la Majeur, op 72, mvt III (Presto), dir. Carlos Kleiber (Deutsche Grammophon 1976)

Nous voyons dans les exemples ci-dessus que différents paramètres sont évoqués pour expliquer le son d’un orchestre (le chef, la salle, les instruments, le répertoire, …). Certains de ces critères sont présentés ici plus en détail. La question de la salle, qui a à la fois une influence sur le son de l’orchestre, mais aussi directement sur la prise de son, est étudiée dans le chapitre 1.2.1.

Paramètres à l’origine de la sonorité d’un orchestre

Il existe de nombreux critères qui peuvent donner une sonorité particulière à un orchestre. En voici quelques exemples.

La disposition

En premier lieu, il est important de noter les différentes dispositions d’orchestres existantes, et que chaque chef d’orchestre choisit en fonction de ses habitudes, des traditions de l’orchestre, de la salle, du répertoire… Les dispositions les plus fréquentes pour les cordes sont présentées dans la figure 1.1.

Figure 1.1 – Quelques dispositions d’orchestre

La disposition européenne a été la norme durant tout le XIXᵉ siècle. C’est Leopold Stokowski qui invente à Philadelphie en 1920 la disposition « américaine ». Christian Merlin explique que cette invention est due à l’essor de l’enregistrement, qui à l’époque s’accommodait mieux d’une nette séparation des registres. Cette disposition s’est ensuite importée en Europe (London Symphony Orchestra, Royal Concertgebouw Orchestra, Orchestre national de la Radiodiffusion Française, …). La variante allemande s’est alors développée parallèlement dans les orchestres allemands. La disposition européenne, qui était encore utilisée dans certains orchestres, et demandée par exemple par des chefs comme Otto Klemperer, quel que soit l’orchestre avec lequel il travaillait, est revenue au goût du jour dans les années 1980, à cause, entre autres raisons, de l’essor des orchestres sur instruments d’époque.

Une autre disposition existante, beaucoup moins répandue, est celle du Wiener Philharmoniker, appelée disposition « viennoise », avec les contrebasses derrière les vents. C’est un exemple de disposition imposée en grande partie par la configuration de la salle (Große Musikvereinsaal, Vienne). Pour cette raison, cette disposition est aussi adoptée par beaucoup d’orchestres étrangers lorsqu’ils jouent dans cette salle, ce qui qui réclame un certain temps d’adaptation. [4]

La disposition des bois est fixe, sauf dans un autre cas particulier : le Royal Concertgebouw Orchestra, où les clarinettes et les bassons sont inversés. De la même manière, la disposition des autres instruments de l’orchestre peut varier : les cors sont par exemple disposés à jardin ou à court, en ligne ou en carré, etc.

Les orchestres sur instruments anciens peuvent aussi avoir des dispositions plus flexibles. En particulier, les effectifs de cordes peuvent être plus réduits que dans un orchestre symphonique « standard », ce qui peut modifier la disposition.

La disposition de l’orchestre peut avoir une grande influence sur la prise de son. Par exemple, la disposition « européenne » accentue les effets de stéréophonie des réponses entre violons 1 et violons 2. Cette disposition pose cependant des problèmes pour la prise de son, en raison de la directivité des instruments. En effet, les violons 2 sont alors tournés vers l’intérieur de l’orchestre et non pas vers le public.

Le choix d’une certaine disposition peut aussi permettre de favoriser une plus grande intelligibilité, par un placement judicieux des sources permettant un meilleur démasquage spectral. Cette question du démasquage spectral est une problématique qui n’est pas uniquement liée à l’enregistrement, et qui se pose déjà dans le cas d’un concert.

Lors d’une prise de son live, c’est le chef d’orchestre qui prend la décision de la disposition. Mais lors d’un enregistrement non public, l’ingénieur du son et le directeur artistique peuvent discuter de la disposition avec le chef avant la séance s’ils le souhaitent.

Paramètres instrumentaux

Certains éléments instrumentaux peuvent entrer en jeu dans la sonorité d’un orchestre. En effet, l’utilisation de certains types d’instruments peut être spécifique à un pays ou à un orchestre particulier.

Tout d’abord, on peut citer l’exemple du basson. Selon les orchestres, on retrouve des bassons français ou des Fagotts allemands. La facture de ces deux instruments a divergé au début du XIXᵉ siècle et les deux types de bassons se sont développés parallèlement. Le Fagott a un son plus rond, plus proche du son de la clarinette, alors que le basson français a un son plus brillant, ce qui le rend plus apprécié pour le jeu soliste. Aujourd’hui, le Fagott a remplacé le basson français dans un certain nombre de pays, et on le retrouve en Allemagne, en Angleterre, en Autriche, et en Italie. En France, certains orchestres (Orchestre National de France, Orchestre du Capitole de Toulouse, Orchestre National Bordeaux-Aquitaine, …) continuent de préférer le basson français, alors que d’autres (Orchestre de Paris, Orchestre de l’Opéra de Lyon, …) utilisent maintenant le Fagott. Il arrive aussi, comme à l’Orchestre Philharmonique de Radio France, que le pupitre de bassons soit partagé par des bassons français et des fagotts allemands.

Certaines œuvres ont été écrites spécifiquement pour l’un ou l’autre de ces instruments (le solo de basson du Sacre du Printemps par exemple est écrit pour basson français, car Stravinsky recherchait ce timbre particulier).

On peut aussi citer le cor viennois, plus proche du cor naturel, et qui est utilisé quasi-exclusivement à l’Orchestre Philharmonique de Vienne. Cet orchestre utilise aussi un hautbois particulier, le hautbois viennois.

Enfin, on peut évoquer la technique d’archet des contrebasses, avec des musiciens français, anglais et italiens qui tiennent l’archet avec la main au-dessus de la hausse (comme un archet de violoncelle), alors que les musiciens allemands et autrichiens le tiennent par-dessous (comme un archet de viole de gambe). L’archet allemand offrirait une sonorité plus riche, mais une moins grande souplesse de jeu et de phrasé. A l’échelle d’un pupitre de contrebasses dans l’orchestre, le son peut donc être notablement différent.

D’autres habitudes spécifiques à certains orchestres peuvent expliquer le développement d’une sonorité propre. Par exemple, la possession par l’orchestre de tous les instruments à cordes de l’Orchestre Philharmonique de Vienne permet d’avoir des instruments homogènes et de supprimer une source d’individualisation du son des musiciens.

Enfin, si le renouveau apporté par les formations jouant sur instruments d’époque a d’abord concerné la musique baroque, la musique jouée par ces orchestres s’est aujourd’hui élargie au répertoire classique et à une partie du répertoire romantique. Les orchestres sur instruments anciens proposent donc une interprétation qui peut différer énormément de celle d’un orchestre symphonique « standard », en particulier en termes de sonorité (cordes en boyaux, flûtes en bois,…). Par exemple, le Freiburger Barockorchester compte dans sa discographie, outre des œuvres baroques, des œuvres de Mozart, Haydn ou Mendelssohn, ou bien encore un disque de Schumann en cours de post-production.

L’esthétique choisie pour enregistrer ce type d’orchestres, sur instruments anciens, peut être assez proche de ce qui se fait en musique baroque, avec beaucoup de précision et une grande proximité.

Ecoute proposée (Piste n° 1) : Ludwig van Beethoven, Symphonie N°1 – Emmanuel Krivine – La Chambre Philharmonique – Interprétation sur instruments d’époque – Naïve 2011

Les écoles instrumentales

À tous ces éléments instrumentaux s’ajoutent les traditions de jeu instrumental dans chaque pays. À ce propos, Philippe Muller, professeur de violoncelle au Conservatoire National Supérieur de Musique de Paris, estime qu’on retrouve des caractéristiques propres à chaque pays dans le jeu des instruments à cordes.

Je pense en effet qu’il existe un rapport entre la façon de phraser et la manière de parler ; la façon de rythmer la musique est en partie liée à la manière dont on rythme le langage. Par exemple, une pièce de musique ne sera pas jouée immédiatement de la même façon par un interprète russe, italien ou allemand… La scansion est plus forte en italien, la profondeur des graves ressortira davantage chez un Allemand, et un Français aura tendance à faire ressortir le côté brillant de la phrase. Je pense qu’il existe un lien entre la sonorité, le phrasé, et la langue qu’on parle. [5]

Si l’école française de violoncelle (fondée par Maurice Maréchal) a par exemple été une référence à une certaine période, et que certains violoncellistes actuels ont repris le flambeau de cette école française, il faut tout de même noter que la notion d’école instrumentale a eu tendance à s’estomper depuis une cinquantaine d’années. [6]

L’identité d’un orchestre et sa couleur particulière a aussi pu être renforcée par l’existence de familles de musiciens, et de lignées professeur-élèves, qui assurent une continuité technique et esthétique dans le jeu instrumental et donc la sonorité d’un orchestre. Aujourd’hui encore, beaucoup d’orchestres célèbres s’investissent par le biais d’Académies d’orchestre dans la formation de jeunes musiciens, qui intègreront peut-être plus tard l’orchestre (par exemple Académies de l’Orchestre Philharmonique de Berlin ou de l’orchestre du Concertgebouw d’Amsterdam).

Le répertoire

Chaque orchestre développe sa propre tradition de répertoire, en fonction de son chef permanent et directeur musical, de la culture du pays… Ceci implique une évolution du son en rapport avec ce répertoire. (Profondeur du son de la musique allemande, fusion des timbres dans les orchestrations de Ravel, …). C’est le cas dans les exemples précédemment cités du Royal Concertgebouw Orchestra d’Amsterdam, qui a une longue tradition d’interprétation des symphonies de Mahler et Bruckner. C’est aussi celui du London Symphony Orchestra, pour lequel l’enregistrement fréquent de musiques de film a développé une grande flexibilité et faculté d’adaptation, mais aussi un son « extraverti », spectaculaire.

D’autre part, il ne faut pas oublier que la plupart des orchestres sont en résidence dans une salle particulière, et leur jeu et leur sonorité s’adapte donc progressivement à cette salle dans laquelle ils donnent la majorité de leurs concerts et organisent la plupart de leurs répétitions.

Enfin, un autre critère extrêmement important à prendre en compte est le chef d’orchestre lui-même. En effet, un même orchestre peut sonner très différemment selon le chef qui le dirige, selon les choix d’interprétation de ce chef, ses gestes, …

Conséquences sur la prise de son

Mais quelle différence pour l’ingénieur du son ? Prenons l’exemple des orchestres français, qui ont la réputation d’avoir un son plus brillant que les orchestres allemands.

Ceci est dû à la fois à l’utilisation d’instruments particuliers (par exemple le basson français ou le Fagott, l’archet des contrebasses, …) mais aussi à des traditions instrumentales, comme l’explique Philippe Muller pour le jeu des instruments à cordes. D’autre part, l’orchestre allemand aura probablement une plus longue tradition de jeu des œuvres de Brahms, Mahler, Wagner, et l’orchestre français la tradition du répertoire de Debussy par exemple, qui nécessite un autre type de sonorité.

Toutes ces caractéristiques s’additionnent et peuvent donc donner une sonorité particulière à l’orchestre français ou allemand. Ainsi, la sonorité globale de l’orchestre allemand sera plus ronde, là où l’orchestre français aura un son plus clair et brillant. L’ingénieur du son confronté à l’enregistrement d’un de ces orchestres pourra donc ressentir le besoin de choisir des microphones qui « compensent » ces caractéristiques orchestrales ou bien au contraire choisir de les accentuer. Par exemple, ceci pourra entraîner l’utilisation de micros avec une préaccentuation dans l’aigu pour gagner en définition et en « accroche » sur l’orchestre allemand, ou de micros non préaccentués pour gagner en rondeur de son sur des orchestres français, et ne pas accentuer démesurément l’aspect brillant. L’ingénieur du son pourra aussi choisir de mettre en valeur ces caractéristiques en les accentuant, et en faisant donc un choix microphonique totalement différent.

Uniformisation

Nous avons vu les paramètres qui font qu’un orchestre peut développer sa propre identité sonore. Il faut cependant nuancer cette notion, qui est de nos jours moins pertinente.

Avec l’arrivée et la large diffusion de l’enregistrement, et la meilleure mobilité des musiciens, on assiste à une certaine uniformisation du son des orchestres. C’est ce qu’expliquent les musicologues Tim Carter et Erik Levi :

L’arrivée de la radiodiffusion et de l’enregistrement a servi à fixer un son d’orchestre standard et idéalisé. Une conséquence inévitable de ces développements est que beaucoup d’orchestres ont perdu les éléments distinctifs de timbres qui restaient uniques à certains pays avant la Première Guerre Mondiale.⁹ [1]

De plus en plus d’étudiants profitent de la mobilité favorisée par le programme Erasmus et autres échanges étudiants. Ainsi, ils passent une partie de leurs études au contact de la culture d’un pays étranger, auprès de professeurs de différentes nationalités, … De la même manière, les professeurs n’enseignent pas toujours dans leur pays d’origine. Tout cela mène à un affaiblissement des écoles nationales instrumentales présentées par P. Muller.

D’autre part, les orchestres effectuent des tournées internationales, et les enregistrements circulent dans toute l’Europe, par la distribution des disques dans tous les pays, mais aussi de manière très importante par le biais d’internet (plateformes de téléchargement, streaming, …). On peut aussi citer l’Union Européenne de la Radio-Télévision, qui permet depuis les années 1950 aux différentes radios d’échanger des programmes, et donc de les diffuser à une plus grande échelle.

Tous ces éléments ont favorisé une uniformisation du son des orchestres durant la seconde moitié du XXᵉ siècle. Jon Tolanski [1] explique ainsi qu’il y a eu durant les dernières décennies une tendance à l’uniformisation du son des orchestres, en direction du son riche, sophistiqué et homogène d’orchestres allemands célèbres comme l’Orchestre Philharmonique de Berlin. Les cuivres des orchestres russes jouent désormais avec moins de vibrato, voire plus du tout, et moins de staccato. Le son des bois s’est aussi uniformisé. Le son rustique de clarinette qu’on entendait dans les orchestres d’Europe de l’Est, mais aussi dans les orchestres français, a laissé place à un son plus rond.

Les sons caractéristiques des orchestres ayant en partie disparu, on peut se demander s’il en est de même pour des écoles de prise de son qui seraient liées au son des orchestres fréquemment enregistrés.

1.2. La prise de son d’orchestre

1.2.1. Les lieux d’enregistrement

Nous avons vu dans le chapitre précédent que certains orchestres ont développé un son spécifique qui correspond à des caractéristiques de la salle dans laquelle ils sont en résidence. C’était ainsi le cas du Concertgebouw Orchestra, pour lequel la salle du Concertgebouw permet aux musiciens de ne pas forcer. C’est aussi le cas de l’orchestre de Philadelphie, qui a développé un son de cordes en réponse à la salle dans laquelle il était en résidence. D’autre part, nous avons vu que la salle peut avoir une influence directe sur la disposition de l’orchestre (comme c’est le cas pour la salle du Musikverein de Vienne), et donc sur le son de l’orchestre.

D’autre part, l’orchestre est l’objet de l’enregistrement, mais la salle est tout aussi importante pour la prise de son. De la même manière qu’un photographe doit s’adapter à la lumière du lieu dans lequel il photographie, un ingénieur du son doit s’adapter à la salle dans laquelle il travaille, et qui aura un impact sur le son (coloration spectrale, intelligibilité, longueur et couleur de la réverbération, …).

E. Kemper [7] explique, en se basant sur une série de tests d’écoutes réalisés lors de son mémoire de fin d’études à la Musikhochschule de Detmold que pour un même ingénieur du son, la note donnée à l’enregistrement par les participants au test d’écoute est liée à la salle et à sa qualité. Ainsi, elle donne l’exemple de la Kammermusiksaal de la Philharmonie de Berlin, ainsi que de la Festspielhaus de Baden-Baden qui correspondent à des enregistrements respectivement bien notés ou mal notés pour un même ingénieur du son. Pour cette raison, une salle adaptée au répertoire et à la dimension de l’orchestre est un prérequis très important pour la qualité d’un enregistrement.

Certaines salles permettent de moduler l’acoustique (volumes couplés, rideaux, ou autre) mais il est impossible de s’abstraire totalement de l’acoustique du lieu. De plus, ces modifications acoustiques sont parfois peu efficaces ou compliquées à mettre en place, et ne sont donc pas toujours très utilisées. Il est donc important de comprendre quels sont les différents types de salle utilisés pour la prise de son d’orchestre, de connaître leurs caractéristiques, pour comprendre pourquoi et comment l’ingénieur du son cherche à retransmettre l’acoustique du lieu d’enregistrement, ou au contraire à améliorer par certaines techniques (réverbération artificielle, …) l’acoustique d’un lieu moins adapté. Une caractéristique importante, quel que soit le type de salle, est sa dimension. En effet, un enregistrement dans une salle trop grande ne posera généralement pas trop de problèmes, en revanche une salle trop petite pourra créer de véritables difficultés de prise de son (premières réflexions trop proches, coloration de la salle, …).

Les salles de concert

L’enregistrement d’orchestre symphonique requiert une salle d’un grand volume. Pour cette raison, les salles de concert, dont la taille, l’acoustique et la configuration sont prévues pour accueillir des orchestres, sont souvent utilisées pour l’enregistrement.

D’autre part, aujourd’hui de plus en plus de disques sont enregistrés en « live » ou en « faux-live » pour des raisons parfois musicales (préserver l’énergie du direct, archivage de concerts,…) mais aussi très souvent pour des raisons économiques (enregistrement de la répétition générale, d’un ou plusieurs concerts, et de quelques corrections si nécessaire). Dans ces cas-là, le lieu d’enregistrement est donc imposé puisqu’il s’agit du lieu dans lequel le concert est programmé.

Architectures

On trouve en Europe un certain nombre de salles de concert, construites sur différents modèles architecturaux, en fonction des traditions de chaque pays, de l’année de construction, de modes… Ces traditions architecturales sont liées aux traditions musicales de chaque pays.

Les salles en forme de fer à cheval

En Italie, le fort développement de l’opéra a mené à la construction de nombreux théâtres à l’italienne (en forme de fer à cheval) dans toutes les grandes villes. On peut par exemple citer la Scala de Milan, construite en 1778, … C’est un type d’architecture qu’on retrouve fréquemment dans les salles d’opéras en Europe, mais aussi dans certaines salles qui sont aujourd’hui utilisées principalement pour des concerts (le Théâtre des Champs Elysées à Paris par exemple).

Ces salles étant initialement destinées au théâtre ou à l’opéra, elles sont généralement caractérisées par un temps de réverbération beaucoup plus court que dans une salle de concert. Le Théâtre des Champs Elysées avait par exemple jusqu’en 2005 (date où certaines modifications acoustiques ont été faites afin, entre autres, d’augmenter ce temps de réverbération) un temps de réverbération de 1,35 sec à 1000 Hz. En comparaison, la grande salle du Musikverein à Vienne et la salle du Concertgebouw d’Amsterdam, qui sont deux salles en « boîte à chaussures » avec une jauge comparable à celle du TCE (1900 places environ pour le TCE, 1700 pour le Musikverein, 2000 pour le Concergebouw), ont un temps de réverbération de 2,0 sec à 1000 Hz [8, 9, 10].

Les salles en « boîte à chaussures »

Les salles en forme de « boîte à chaussures » se sont développées à partir des modèles des salles de bal, mais aussi des églises. Beaucoup d’œuvres classiques ont été composées pour des salles de bal (les premières symphonies de Haydn pour les châteaux du Prince Esterhazy, les premières symphonies de Beethoven pour le palais Razumofsky).

Tout comme les salles de bal, les premières salles de concert rectangulaires sont généralement hautes de plafond, avec beaucoup de décorations. Ces décorations permettent de « casser » les réflexions des murs parallèles. Elles possèdent aussi généralement des balcons latéraux et/ou arrière.

Parmi les salles de ce type, on peut citer le Concertgebouw à Amsterdam ou le Musikverein à Vienne.

Figure 1.2 – Royal Concertgebouw Amsterdam, exemple de salle rectangulaire, ou en forme de « boîte à chaussures » – Crédits photo : Hans Samsom

Les salles récentes

Parmi les différentes solutions architecturales proposées pour répondre à de nouvelles contraintes, le concept de salle en vignobles a été développé par l’architecte de la Philharmonie de Berlin pour répondre à la contrainte d’avoir l’orchestre au milieu de la salle. L’orchestre placé au centre de la salle est donc assez éloigné des murs, ce qui réduit les réflexions précoces. Pour compenser cela, l’architecte a construit des « terrasses » pour placer les sièges. Ces terrasses forment des obstacles acoustiques, qui permettent de recréer des réflexions précoces.

Figure 1.3 – La Philharmonie de Berlin, une salle construite d’après le modèle « en vignobles »

D’autres architectes ont choisi de reprendre le concept de la « boîte à chaussures ». Ils ont parfois dû trouver des solutions architecturales pour conserver les caractéristiques de ces salles (riches ornementations qui cassent les réflexions des murs parallèles) tout en gardant un style plus épuré. C’est le cas par exemple de la salle du Congress and Culture Center à Lucerne, en Suisse. Cette salle est aussi un modèle de salle avec acoustique variable. L’architecte Jean Nouvel y a construit des espaces dont l’acoustique peut être couplée avec l’acoustique de la salle, afin d’en augmenter la réverbération. On passe ainsi d’un temps de réverbération de 1,7 sec (à 1000 Hz) sans couplage acoustique à un temps de réverbération de 2,1 sec (à 1000 Hz) quand tous les espaces sont couplés. Cette possibilité de moduler l’acoustique de la salle peut être un outil supplémentaire pour l’ingénieur du son lors de la séance d’enregistrement. Cependant, selon la mécanique utilisée pour la construction, le changement peut être difficile ou long à mettre en œuvre, et l’ingénieur du son perd cette possibilité. Dans le cas d’un concert, ce n’est encore une fois pas à l’ingénieur du son que revient ce choix.

Quelques salles célèbres

Suite à une étude réalisée en 1962 auprès de chefs d’orchestre célèbres (dont Herbert von Karajan, Bruno Walter, …) et de critiques musicaux, Leo Beranek [10] a proposé un classement des salles de concert (parmi 76 salles) en fonction de leur acoustique. Fergus R. Fricke a réalisé une étude similaire en 1992, y ajoutant certaines salles réalisées ou rénovées depuis la première étude. Les salles sont classées sur une échelle allant de A+ (Supérieure) à C (passable).

Les deux études donnent des résultats assez similaires. De manière unanime, trois salles forment la catégorie A+ : le Symphony Hall de Boston, la Großer Musikvereinsaal de Vienne, et le Concertgebouw d’Amsterdam. Ces salles sont considérées par tous les interviewés comme les meilleures au monde.

Les salles européennes dans la catégorie A (Excellent) sont le Stadt-Casino de Bâle (Suisse), le Konzerthaus de Berlin (Allemagne), le St David’s Hall de Cardiff (Pays de Galles), et la Großer Tonhallesaal de Zurich (Suisse). A ces salles viennent s’ajouter dans l’étude de Fricke : la Philharmonie de Berlin (Allemagne), la Herkulessaal de Munich (Allemagne), et De Doelen de Rotterdam (Pays-Bas).

Un grand nombre de productions de disques se déroulent dans ces salles réputées. D’autre part, une très grande majorité des concerts qui se jouent dans ces salles sont aussi enregistrés. Au Musikverein de Vienne par exemple, la radio autrichienne (Österreichischer Rundfunk) possède une régie et enregistre non seulement tous les concerts du Radio-Symphonieorchester Wien, mais aussi une grande partie des concerts du Wiener Philharmoniker Orchester, du Wiener Symphoniker, ou d’autres orchestres nationaux ou étrangers (sauf quand ceux-ci sont enregistrés par une équipe différente pour un label particulier ou par une équipe accompagnant l’orchestre).

Et en France ?

Nous avons vu que parmi les salles de concert les plus réputées (selon l’étude de Beranek), aucune ne se trouve en France. Ceci est confirmé par un grand nombre d’ingénieurs du son, qui estiment qu’il n’y a en France pas (ou très peu) de bonne salle pour enregistrer un orchestre symphonique. Ainsi, le Théâtre des Champs Elysées, la Salle Pleyel, et d’autres salles parisiennes sont fréquemment critiquées pour leur acoustique. Quelques salles plus récentes sont cependant reconnues pour leur excellente acoustique, comme l’Arsenal de Metz (construit en 1989) ou l’Auditorium de Dijon (1998). Ces salles servent régulièrement pour des enregistrements, mais la majorité des productions se déroule tout de même à Paris. En effet, un grand nombre de disques est aujourd’hui réalisé grâce à des captations de concerts. La vie musicale française étant de plus beaucoup plus centralisée qu’en Allemagne, une grande partie des concerts a lieu à Paris, et beaucoup d’enregistrements sont donc réalisés dans ces salles.

La Philharmonie de Paris est actuellement en cours de construction. Cette salle est construite sur le modèle des vignobles, suivant l’exemple de la Philharmonie de Berlin dont l’acoustique est reconnue. S’il s’avère que l’acoustique de cette salle est réussie, cela pourrait permettre aux ingénieurs du son français d’avoir un lieu adapté à la prise de son d’orchestre, avec une bonne acoustique, et se situant à Paris.

Figure 1.4 – La grande salle de l’Arsenal de Metz. – Crédits photos : [11]

Figure 1.4 – L’Auditorium de Dijon – Crédits photos :[12]

Figure 1.5 – La Philharmonie de Paris, actuellement en cours de construction (image de synthèse pour le concours architectural) – Crédits photo : [13]

Un autre critère important : l’équipement de la salle de concert

En dehors de l’aspect acoustique des salles de concert, un autre critère peut avoir une influence sur les choix techniques de l’ingénieur du son : l’équipement de la salle en matière d’enregistrement. En effet, certaines salles possèdent un système de microphones suspendus en permanence au-dessus de la scène. Ces systèmes sont généralement utilisés par toutes les équipes qui sont amenées à travailler dans la salle en question, pour des raisons de discrétion visuelle lors des concerts.

Ceci peut avoir une incidence sur deux types de choix techniques. Tout d’abord, le positionnement des microphones est dépendant de l’endroit où sont suspendus les câbles. Il est donc probable que les différents ingénieurs du son travaillant dans une salle ainsi équipée utilisent les mêmes positionnements pour les microphones d’appoint sur un orchestre.

D’autre part, l’utilisation de ces systèmes est liée à l’utilisation de câbles actifs (et de microphones à petite membrane). Ceci restreint donc les choix à des microphones compatibles avec des câbles actifs (on utilise principalement la série Colette de Schoeps ou la série KM100 de Neumann). De plus, la salle étant équipée généralement dans une seule de ces marques, le choix microphonique en est d’autant plus limité. Par exemple, la Philharmonie de Cologne ou la salle du Musikverein de Vienne sont équipées de câbles actifs Schoeps, fonctionnant avec la série Colette, et il est donc uniquement possible d’utiliser les microphones de cette série. A la Philharmonie de Berlin en revanche, ce sont des câbles actifs Neumann qui sont utilisés.

En France, les grandes salles qui servent le plus souvent pour des enregistrements ne sont pas équipées d’un tel système, mais il est prévu d’en installer un à la Philharmonie de Paris, actuellement en construction.

Les studios d’enregistrement

Certains studios d’enregistrement sont prévus pour accueillir des orchestres symphoniques. C’est le cas des studios Abbey Road, par exemple, qui ont été fondés par EMI, et qui ont accueilli (et accueillent toujours) un grand nombre d’enregistrements symphoniques. En Allemagne, on peut citer le studio Teldex (anciennement studio Teldec, fondé par Telefunken et Decca, et racheté par les ingénieurs du son de Teldec à la fermeture du label), qui accueille régulièrement des productions symphoniques.

Certaines salles ont aussi été utilisées comme studio d’enregistrement de manière régulière, alors qu’elles n’étaient pas conçues pour cela. Ainsi, EMI, Decca et RCA ont utilisé le Kingsway Hall entre 1926 et 1984 pour beaucoup d’enregistrements, jusqu’à la destruction de la salle. Cette salle avait été construite par l’Eglise Méthodiste, et était donc initialement destinée à des célébrations religieuses. La Jesus-Christus-Kirche, à Berlin, a aussi été utilisée comme studio d’enregistrement, en particulier par Deutsche Grammophon. De nos jours, cette église est encore réservée très fréquemment pour la réalisation d’enregistrements de disques. A Paris, la salle Wagram, qui était une salle de bal, a elle aussi été le lieu de nombreux enregistrements, en particulier pour le label EMI.

Figure 1.6 – Studio Teldex – séance avec le Freiburger Barockorchester – Mai 2014

Les studios de radio

Si certains labels ont utilisé des studios d’enregistrement pour réaliser une partie de leurs disques, beaucoup de radios ont aussi utilisé leurs propres locaux, qui servent de lieux de répétition pour les orchestres attachés à ces radios, mais aussi de studios d’enregistrement. Ainsi, la Maison de la Radio (Radio France) comporte plusieurs studios dédiés à la musique, dont un auditorium, le studio 104, aussi appelé Salle Olivier Messiaen, ou le studio 103, où ont été réalisés certains enregistrements des orchestres de Radio France. Ces studios ont des jauges plus faibles que celles du Musikverein ou du Concertgebouw par exemple (930 places environ pour le studio 104, 40 places pour le studio 103). Le volume est aussi plus faible que celui de ces salles de concert, mais le studio 104 a tout de même un volume comparable par exemple à la Großer Tonhallesaal de Zurich (environ 12000 m3 pour les deux), qui est classée en catégorie A dans l’étude de Beranek. Cependant, on peut noter une différence importante entre le studio 104 et la Tonhallesaal : le temps de réverbération. En effet, le temps de réverbération de la Tonhallesaal est de 2,05 sec à 1000 Hz, et se situe donc dans la même catégorie que le Musikverein et le Concertgebouw, alors que le studio 104 n’a que 1,7 sec de temps de réverbération à 1000 Hz.

La Maison de la Radio, actuellement en travaux, va ouvrir son nouvel Auditorium à la fin de l’année 2014. Il comptera 1400 places et suivra le concept de salle « en vignobles » développé par Hans Sharoun pour la Philharmonie de Berlin. Cet auditorium a pour objectif de devenir un lieu de référence pour les concerts de musique classique à Paris, et pas seulement un studio d’enregistrement. Ses caractéristiques seront donc probablement à mi-chemin entre celles d’une salle de concert et celles d’un studio d’enregistrement, afin de pouvoir répondre à ces deux usages.

Un tableau donnant les caractéristiques de quelques salles européennes utilisées pour la prise de son d’orchestre est consultable en Annexe D.

Nous avons vu comment le son d’un orchestre peut modifier les choix microphoniques de l’ingénieur du son. Il en est de même avec l’acoustique des salles. En effet, l’ingénieur du son peut choisir d’accentuer ou au contraire de compenser certaines caractéristiques acoustiques d’une salle. Ainsi, le choix d’un microphone avec une couleur particulière ou l’utilisation d’égalisation se fait automatiquement en interaction avec la couleur de la salle. De plus, il pourra choisir d’utiliser plus ou moins la réverbération de la salle de concert (mais il ne pourra jamais s’en abstraire totalement), en dosant le niveau de champ direct/champ réverbéré par le placement des microphones ou par l’utilisation de micros d’ambiance. Toutes ces possibilités relèvent de choix techniques faits par l’ingénieur du son, qui a donc une large influence sur l’esthétique d’un enregistrement.

1.2.2. Les esthétiques

Nous avons étudié la notion d’orchestre comme entité sonore, ainsi que les caractéristiques de différents types de lieux d’enregistrement (salle de concert, studio d’enregistrement, studio de radio). Ces deux éléments, ainsi que l’œuvre enregistrée, sont des données sur lesquelles l’ingénieur du son n’a aucune (ou très peu) marge de manœuvre. Il faut donc maintenant se pencher plus précisément sur le rôle de l’ingénieur du son, et les différentes esthétiques que celui-ci peut développer pour les mêmes données de base (orchestre, chef, salle, répertoire).

Elisabeth Kemper [7] explique que l’ingénieur du son est le paramètre qui a la plus grande influence sur le résultat sonore. En tout état de cause, l’influence de l’ingénieur du son sur le son est plus grande que celle de la salle d’enregistrement, du chef d’orchestre et de l’orchestre.¹⁰ Pour cette raison, la compréhension des différentes esthétiques sonores défendues par les ingénieurs du son est primordiale, car de cette esthétique dépendra une grande partie du son final.

La notion de fidélité

La notion de réalisme et de fidélité est un concept extrêmement répandu dans le domaine de l’enregistrement de musique classique. Ainsi, de nombreux ingénieurs du son se rejoignent pour dire que l’idéal reste d’avoir la plus grande fidélité par rapport à la situation d’enregistrement [14].

La musique classique existait bien avant l’arrivée de l’enregistrement, contrairement à d’autres styles musicaux. Par conséquent, l’expérience du concert reste la référence pour beaucoup d’auditeurs et de musiciens. Dans son ouvrage retraçant l’histoire de l’enregistrement classique, Colin Symes rappelle lui aussi l’attachement du monde de la musique classique au concert :

Dans les cercles de musique classique, […] ils n’ont jamais abandonné l’idée que le concert était l’articulation ultime de la musique et que le phonographe devait s’y référer. Les modes de représentation de la musique classique sur disque qui ont abandonné cette référence au concert ont eu tendance, à de rares exceptions près, à être marginalisés.¹¹ [15]

Denis Mercier [16] explique quant à lui que pour être réussie, une prise de son doit laisser passer les « vraies » couleurs de l’orchestre (c’est-à-dire l’orchestre tel qu’on l’entend au concert).

Ainsi, il est souvent admis par les auditeurs, les musiciens et certains ingénieurs du son que l’équilibre dans la salle est l’équilibre à retransmettre absolument. Certains ingénieurs du son estiment encore qu’il suffirait de positionner les micros comme si l’on était assis à la meilleure place de la salle pour obtenir un excellent enregistrement, solution qui était préconisée au début de l’enregistrement stéréophonique. C’est la notion de « best seat in the hall », qui a longtemps été très répandue dans le domaine de l’enregistrement classique.

Subjectivité

Nous avons vu que l’idéal recherché par beaucoup est la fidélité.

En réalité, un deuxième discours existe aussi. Cette deuxième esthétique serait celle de l’idéalisme [15]. Il consiste à s’abstraire de la réalité de la salle d’enregistrement pour recréer une réalité idéalisée par l’ingénieur du son (et les musiciens). Cette création de l’ingénieur du son peut alors être « réaliste » sans être fidèle, mais aussi apporter un point de vue (d’audition !) et une expérience différents sur l’œuvre, le concert, de la même manière que l’interprétation musicale. De cette façon, l’ingénieur du son peut alors être considéré comme un artiste qui « interprète » sa prise de son.

Là où les producteurs puristes parlent d’équilibrer différentes sources sonores pour créer une impression fidèle de la scène sonore d’origine, les producteurs créatifs parlent de mixer des sources sonores sans se soucier de la fidélité.¹²

D’autre part, Symes évoque la notion de « best seat in the hall » défendue par certains auteurs. Ainsi, il remarque que la notion de meilleure place et de meilleure salle est aussi une notion subjective. En effet, le choix de cette « meilleure place » ou encore le choix des microphones qu’on y place sont déjà des choix subjectifs de l’ingénieur du son.

Il est intéressant de comparer cette « non-objectivité » de l’ingénieur du son à celle du photographe. Le photographe doit lui aussi effectuer des choix concernant l’appareil photo, la focale, l’angle de prise de vue, etc. Ainsi, même un photo-reporter, dont on pourrait attendre, en raison de son rôle de journaliste et de rapporteur de l’information, qu’il soit le plus objectif possible, ne peut s’abstraire de ce type de choix.

De plus, Symes fait remarquer que même une salle qui est unanimement reconnue comme excellente pour ses qualités acoustiques peut ne pas être idéale pour certains enregistrements. Il prend pour exemple le Concertgebouw d’Amsterdam, qui est considéré comme une des meilleures salles de concert au monde (cf. chapitre 1.2.1) et dans laquelle tous les sièges ont pourtant été retirés pour certains enregistrements, afin d’avoir une acoustique plus adaptée. Ce cas précis montre bien que la « meilleure place de la meilleure salle » n’est pas toujours l’option choisie par les ingénieurs du son, même lorsqu’ils ont cette « meilleure salle » à disposition.

Il est important de rappeler aussi que la stéréophonie n’est qu’une illusion [1]. La multitude de réflexions acoustiques que l’on retrouve dans une salle est réduite à deux enceintes, ce qui limite automatiquement l’enveloppement, les possibilités de démasquage spatial, etc. Les différentes installations multicanales permettent de compenser en partie ces problèmes, mais jamais totalement, puisqu’il s’agit toujours de sources ponctuelles, en comparaison avec l’infinité des directions d’audition dans la salle.

Le rôle de la vision

Un autre élément très important dans la perception d’un concert est l’utilisation de la vue. La vision a une grande influence sur notre perception de ce que nous entendons. Ainsi, pour un concerto dans lequel le soliste serait par moments couvert par l’orchestre, ce qui est le cas lorsqu’on écoute le concert en salle, le fait de voir le musicien permet à l’auditeur de ne pas perdre le contact avec celui-ci. Si un enregistrement présente ce même équilibre, l’auditeur « perd » auditivement le soliste, et n’a plus la vision pour compenser cela.

D’autre part, Denis Mercier explique que la vision a aussi un impact émotif :

En même temps qu’il ressent les moments de tension et de détente dans la musique, il les voit dans les gestes de l’interprète et les lit sur leur visage. [16]

Lors d’une captation audiovisuelle, le spectateur retrouve une partie de cette faculté, avec cependant une différence importante : c’est le réalisateur qui choisit ce que voit à chaque instant le spectateur, et la vision du spectateur est donc très différente de la situation de concert. Pour cette raison, la captation audiovisuelle implique des problématiques différentes de celle de la captation uniquement audio, que nous ne traiterons pas dans le cadre de ce mémoire.

1.2.3. Quelques labels historiques européens

Aux débuts de la stéréophonie, de nombreuses expérimentations de systèmes microphoniques ont été menées. L’orchestre symphonique, par sa taille et sa richesse de timbres, était un terrain privilégié pour ces expérimentations. Ainsi, certains labels ont développé leurs propres techniques microphoniques, et leur propre esthétique pour la prise de son d’orchestre, grâce à un travail de recherche spécifique, mais aussi en raison de l’existence de personnalités fortes (ingénieurs du son, directeurs artistiques, artistes). C’est le cas entre autres de quatre labels européens : Decca, Deutsche Grammophon, EMI et Philips.

Les majors de l’époque, EMI, Decca, RCA, CBS (American Columbia), Philips et Deutsche Grammophon se distinguaient en effet par des identités fortes, aisément repérables par le mélomane audiophile. Tout concourait à cela : la personnalité souvent forte du directeur artistique, celle de l’ingénieur du son, la fabrication du disque proprement dite, gravure, pressage, qualité de la résine, le tout au bénéfice d’un esprit maison avec des recettes propres. [17]

Günther Breest explique comment les moyens techniques et humains de ces labels étaient séparés, ce qui a permis à chacun de développer une esthétique propre :

Après l’intégration de Decca au sein de Polygram, les départements techniques étaient strictement séparés durant des années et il était impossible à une équipe de Deutsche Grammophon d’utiliser les équipements de Decca, même lorsqu’un enregistrement était prévu à Londres. [17]

Toutefois, il faut noter que toutes les équipes expérimentaient différents systèmes, y compris des techniques observées chez d’autres labels, et la discographie de chacun de ces labels comporte bien évidemment des exceptions vis-à-vis des techniques décrites ci-dessous.

Decca

Decca est un label anglais, qui est né en 1937, du rachat de Crystalate Records et ses studios à West Hamptstead.

Roy Wallace intègre Decca en 1953 pour développer un système avec tête artificielle qu’il utilise déjà depuis plusieurs années. Il abandonne la tête artificielle et utilise trois micros Neumann M49 avec une base espacée de 60cm, et le microphone central avancé de 20cm par rapport à cette base. Le tout est positionné autour d’une plaque qui sert d’obstacle acoustique. Il s’agit du premier Decca Tree. En effet, le terme de Decca Tree regroupe non pas une mais bien une multitude de configurations, expérimentées au fil de son développement, avec différents microphones, différents espacements, avec ou sans obstacle. Après une version avec 3 microphones Neumann M50 (toujours avec une plaque) arrive le premier Decca Tree sans plaque acoustique, mais avec des microphones directionnels (Neumann KM56). Plus tard, Kenneth E. Wilkinson prend le relais de Roy Wallace et ajoute deux ailes (« outriggers ») afin de produire une image sonore grand écran [18]. C’est seulement au début des années 1960 que ces expérimentations aboutissent au Decca Tree le plus célèbre, constitué de trois microphones Neumann M50 pour le triangle principal, et de deux autres M50 pour les ailes, tel qu’on peut le voir dans l’image 1.7 (droite).

Figure 1.7 – Deux configurations de Decca Tree – A gauche : configuration avec obstacle acoustique. A droite : 5 microphones M50 (dont deux ailes) – Crédits photos : [19]

Kenneth E. Wilkinson est alors chargé de former tous les ingénieurs du son travaillant pour le label à la technique Decca.

D’autre part, les microphones de cet arbre Decca étaient fixés de façon permanente, et le placement recommandé était à un peu plus de trois mètres au-dessus du pupitre du chef. Ceci permettait d’assurer une constance dans la prise de son. Les ingénieurs du son avaient la liberté d’égaliser le signal, mais pas de faire varier l’espacement entre les microphones, ni de changer les capsules [18]. On remarque donc une volonté assumée de la part du label d’avoir une certaine cohérence esthétique et technique entre les différents enregistrements d’orchestre.

Aujourd’hui, beaucoup d’ingénieurs du son utilisent l’arbre Decca, avec différentes configurations et différents microphones. On ne peut donc pas donner de mesures d’un système unique. Cependant, on considère en général que la base doit mesurer entre 1m50 et 2m20, et que le microphone central est placé entre 80cm et 1m20 en avant de la base [20]. De plus, on utilise principalement des microphones omnidirectionnels (souvent un peu directifs dans les hautes fréquences, comme le M50), même s’il arrive que des ingénieurs du son utilisent des microphones plus directifs, pour des raisons acoustiques.

Le système Decca Tree permet d’avoir une base plus large pour le système qu’un couple AB, car le micro central stabilise l’image, et enlève le « trou au centre » qui se forme lorsqu’on écarte les microphones de la base AB. Il permet aussi une meilleure compatibilité monophonique que le système AB, contrainte particulièrement importante aux débuts de la stéréophonie.

Aujourd’hui, le Decca Tree est particulièrement apprécié par les ingénieurs du son qui travaillent en multicanal, car les trois micros se répartissent naturellement sur les trois enceintes avant du système 5.1. Cependant, ce choix de mixage n’est pas non plus unique. Certains ingénieurs du son choisissent de ne pas placer le microphone central dans le canal central, mais de le mixer comme source fantôme en utilisant les enceintes gauche et droite. Par sa bonne compatibilité avec les systèmes multicanaux, mais aussi car il permet de créer une image plus large et plus spectaculaire, le Decca Tree est aussi plébiscité pour l’enregistrement de musique de film.

Deux salles se partagent un très grand nombre d’enregistrements Decca, en particulier dans les années 1950 et 1960. Il s’agit de la Sofiensaal, à Vienne, et du Kingsway Hall, à Londres.

D’autre part, il est intéressant de noter que, contrairement à d’autres labels, et à ce qui se fait fréquemment de nos jours, peu d’enregistrements Decca ont été réalisés en live. On peut tout de même citer le disque Live from Lincoln Center, avec Pavarotti, Horne et Sutherland, avec le New York City Opera Orchestra dirigé par Richard Bonynge.

Ecoutes proposées :

Felix Mendelssohn, Symphonie N°4 – Claudio Abbado – London Symphony Orchestra – Decca 1968 (Piste n° 12)

Ludwig van Beethoven, Symphonie N°1 – Georg Solti – Chicago Symphony Orchestra – Decca 1975 (Piste n° 19)

Hector Berlioz, Harold en Italie – Zubin Mehta – Israël Philharmonic Orchestra – Decca 1975 (Piste n° 21)

Franz Schubert, Symphonie N°9 – Georg Solti – Wiener Philharmoniker – Decca 1981

Figure 1.8 – Session d’enregistrement Decca du Ring de Wagner, avec l’Orchestre Philharmonique de Vienne dirigé par Georg Solti, dans la Sofiensaal – Crédits photo : Decca

Philips

Philips est un label hollandais, fondé en 1950, et dont la filiale dédiée uniquement à la musique classique, Philips Classics, est née dans les années 1980. Les ingénieurs du son de Philips ont basé leur technique sur l’utilisation d’un système AB omni très large, et très décorrélé. L’ingénieur du son utilise conjointement à ce système un très grand nombre de microphones d’appoints, et reconstitue à partir de ces appoints la cohésion de l’image.

Parmi les personnalités de la firme Philips, on peut entre autres citer Volker Straus, qui a travaillé pendant très longtemps pour le label, et qui a inventé un nouveau système pour les microphones d’appoint, le Straus-Paket : il combinait un KM84 (cardioïde) et un KM83 (omni) coïncidents, branchés avec un câble adaptateur en série (pour entrer dans la console sur un seul préampli) et obtenait ainsi une directivité cardioïde large (ou infra-cardioïde), contrairement aux autres labels qui utilisaient des microphones d’appoints cardioïdes. Cette technique a donné naissance à des microphones infra-cardioïdes (Schoeps MK21, Neumann KM143…).

La technique Philips est donc caractérisée à la fois par le nombre de microphones d’appoints utilisés et par la directivité infra-cardioïde d’une partie de ces appoints, directivité qui crée une couleur différente de celle des microphones cardioïdes utilisés par les autres firmes.

Figure 1.9 – Session d’enregistrement Philips – Crédits photo : [21]

Ecoutes proposées :

Felix Mendelssohn, Symphonie N°4 – Wolfgang Sawallisch – New Philhamonia Orchestra – Philips 1967 (Piste n° 13)

Hector Berlioz, Symphonie Fantastique – Sir Colin Davis – Royal Concertgebouw Orchestra – 1974

EMI

EMI, label anglais issu de la firme Deutsche Grammophon à la fin de la première Guerre Mondiale, comptait parmi ses ingénieurs Alan Blumlein, un pionnier de la stéréophonie. C’est lui qui a inventé et développé le système « Stereosonic » (aussi appelé Blumlein), constitué de deux microphones coïncidents bidirectionnels, positionnés avec un angle de 90 degrés. Cette technique a été reprise par les successeurs d’Alan Blumlein qui travaillaient pour EMI, et est devenu le principal système utilisé par la firme.

Le choix de ce type de système basé sur le principe de la stéréophonie d’intensité, tout comme le système XY choisi par Deutsche Grammophon, est donc différent de celui fait par Decca ou par Philips, d’un système qui fait intervenir la stéréophonie de temps.

Ecoutes proposées :

Franz Schubert, Symphonie N°9 – Herbert von Karajan – Berliner Philharmoniker – 1978 EMI

Deutsche Grammophon

Deutsche Grammophon est un label allemand, basé à Hanovre, et fondé en 1898 par les frères Emil et Joseph Berliner.

L’histoire sonore de Deutsche Grammophon est extrêmement liée au chef d’orchestre Herbert van Karajan et son ingénieur du son Günther Hermanns. Günther Hermanns explique que jusqu’à la fin des années 1950, le son « Karajan-DG » ne se distingue pas encore de EMI ou Decca. C’est à partir des années 1960 que Günther Hermanns et Herbert von Karajan vont réellement développer au fil des nombreux enregistrements effectués ensemble l’esthétique qui deviendra la signature du label.

En particulier, Herbert von Karajan voulait tirer tout le profit des innovations technologiques de son époque. Günther Hermanns a donc développé une technique multimicrophonique, et Herbert von Karajan intervenait directement dans les choix de mixage en modifiant l’équilibre de l’orchestre grâce aux microphones d’appoint.

La technique de Deutsche Grammophon résidait généralement dans l’emploi d’un système coïncident XY comme système principal et de nombreux appoints pour préciser les instruments.

Fig. 1.10 – Utilisation d’un syst`eme XY lors d’un enregistrement Deutsche Grammophon Crédits photo : [17]

Pour de nombreux enregistrements, Deutsche Grammophon utilisait les studios Emil Berliner ou l’église Jesus-Christus de Berlin. Beaucoup d’enregistrements ont aussi été réalisés dans des salles comme le Musikverein de Vienne, la Philharmonie de Berlin, …

L’esthétique Deutsche Grammophon développée par Karajan et Hermanns est celle d’un beau son, d’un mélange équilibré sans aspérité ni agressivité [17]. En comparaison, Günther Breest explique que Decca a toujours été plus audacieux. Günther Hermanns précise aussi que l’esthétique Deutsche Grammophon n’était pas toujours fidèle à la réalité des concerts :

Ce style si caractéristique, que d’aucuns qualifiaient de « sans conflit », comme au-delà de l’humain, détermine toutefois un style apollinien qui ne correspond pas toujours à la vérité des concerts, plus engagés, plus fiévreux, plus violents, parfois presque à l’excès… Autant d’éléments qui nous poussent à évoquer la spécificité du son Deutsche Grammophon dans ces années de gloire.

Figure 1.11 – Enregistrement Deutsche Grammophon à la Jesus-Christus-Kirche, Dahlem, Berlin – Crédits photo : [17]

Ecoutes proposées :

Felix Mendelssohn, Symphonie N°4 – Herbert von Karajan – Berliner Philharmoniker – Deutsche Grammophon 1973 (Piste n° 11)

Ludwig van Beethoven, Symphonie N°1 – Herbert von Karajan – Berliner Philharmoniker – Deutsche Grammophon 1974 (Piste n° 18)

Hector Berlioz, Harold en Italie – Lorin Maazel – Berliner Philharmoniker – Deutsche Grammophon 1985 (Piste n° 20)

2. Méthodologie

2.1. Objectifs

Nous avons vu en première partie que l’orchestre peut être considéré comme un instrument et développer sa propre identité sonore, et les implications que peuvent avoir différentes couleurs d’orchestre sur la prise de son. De la même manière, nous avons étudié les caractéristiques des différents lieux d’enregistrement, et l’impact que peut avoir l’acoustique du lieu sur les choix de prise de son.

Après avoir analysé les caractéristiques de quelques labels européens célèbres pendant l’âge d’or de l’enregistrement stéréophonique des années 1960 à 1980, on peut se demander comment la notion d’esthétique de labels a évolué, comment les différentes techniques de prise de son développées par chacun de ces labels ont été adoptées ou rejetées par les ingénieurs du son actuels, quelles techniques sont aujourd’hui utilisées pour la prise de son d’orchestre et quelles esthétiques sont recherchées par les ingénieurs du son. En effet, il n’existe pas de document répondant à ces problématiques, qui permette de mieux comprendre l’évolution des pratiques et regroupant des données sur les pratiques dans plusieurs pays européens.

Afin de répondre à ces questions, il est nécessaire de réaliser un état des lieux des pratiques actuelles dans le domaine de la prise de son d’orchestre. Cet état des lieux peut être réalisé de deux différentes manières : assister à un grand nombre d’enregistrements dans un grand nombre de salles différentes avec un grand nombre d’ingénieurs du son, ou interroger directement les ingénieurs du son sur leurs habitudes. La première méthode est compliquée à mettre en place pour des raisons pratiques, et la recherche a donc été axée sur des interviews d’ingénieurs du son. Ces interviews ont été complétées par l’observation de plusieurs productions (disque ou radio) lors de différents stages, en France et en Allemagne. Enfin, afin de lier les différentes problématiques étudiées à des exemples sonores, des écoutes critiques d’enregistrements ont été menées parallèlement à ce travail de regroupement d’informations.

2.2. Questionnaire

2.2.1. Participants

La recherche s’est portée plus précisément sur des ingénieurs du son de trois pays : France, Allemagne et Grande-Bretagne. La réduction du nombre de pays permettait d’obtenir une étude plus approfondie sur les habitudes de travail de prise de son dans chacun de ces pays.

Le questionnaire a été envoyé par e-mail à 41 ingénieurs du son (19 Français, 15 Allemands, et 7 Anglais). Les sujets ont été choisis afin d’obtenir un échantillon d’ingénieurs du son expérimentés travaillant dans chacun de ces pays, ayant une pratique régulière de la prise de son d’orchestre. Il a donc été envoyé à des personnes travaillant en radio, d’autres en studio, et d’autres en freelance, issus de formations différentes (y compris des ingénieurs du son n’ayant pas reçu de formation institutionnelle).

23 participants ont renvoyé le questionnaire avec leurs réponses, entre le mois de février et le mois d’avril. Une autre personne a prévenu qu’elle ne souhaitait pas répondre, car ne travaillant pas suffisamment dans le domaine de l’enregistrement d’orchestre symphonique, elle ne s’estimait pas pertinente pour ce sujet. Enfin, trois autres personnes ont souhaité répondre à l’oral. Seulement deux de ces trois entretiens ont pu être menés. Cela permet donc de totaliser 25 réponses, dont 12 en France, 10 en Allemagne, et 3 en Grande-Bretagne. La liste des participants au questionnaire est disponible en Annexe A.

Le nombre de réponses obtenues ne permet pas de généraliser les résultats de manière statistique. Cependant, les ingénieurs du son interviewés sont des professionnels reconnus dans le milieu et travaillant sur un nombre important de productions. Observer les pratiques de ces ingénieurs ne donne donc pas seulement des informations ponctuelles sur quelques cas particuliers, mais offre au contraire une très bonne vision de l’état actuel des techniques et esthétiques de prise de son dans ces pays.

Dans le chapitre suivant, les citations des participants seront codées par une lettre et un chiffre, correspondant au pays et au numéro de participant. Par exemple, (F4=French4) pour le 4ème participant français, (G2=German2) pour le 2ème participant allemand, ou (E1=English1) pour le 1er participant anglais.

2.2.2. Élaboration du questionnaire

L’objectif du questionnaire était de recueillir des informations sur les habitudes de travail et les choix esthétiques des ingénieurs du son. Leur évolution esthétique, leur expérience professionnelle au sein de différentes firmes, ainsi que leur avis sur l’existence d’écoles de prise de son ont aussi été étudiés dans ce questionnaire.

Le questionnaire a été construit en quatre parties :
- une partie permettant de recueillir des informations sur la formation des participants, les choix esthétiques et techniques qui en sont issus, etc.
- une partie pour interroger leur esthétique pour la prise de son d’orchestre, leur expérience au sein de différentes firmes, radios, etc.
- une partie interrogeant plus précisément leurs habitudes pratiques de prise de son et de mixage. Cette question a été réduite au cas particulier d’une symphonie de Beethoven, pour obtenir des résultats plus concrets et avoir des résultats correspondants tous au même style musical.
- enfin, une partie rassemblant quelques questions complémentaires, plus générales.
Certaines questions ont été inspirées du questionnaire réalisé par Elisabeth Kemper dans son mémoire de fin d’études de l’Erich-Tienhaus-Institut der Hochschule für Musik Detmold [7].

Le questionnaire a ensuite été traduit en anglais et en allemand, afin que les ingénieurs du son puissent y répondre dans la langue qu’ils souhaitent, et ainsi ne pas avoir de limitation due à la langue dans les réponses.

La version française est disponible en annexe B.

2.3. Écoutes d’enregistrements

Afin d’illustrer par des exemples sonores les différentes notions étudiées tout au long de ce travail de recherche, j’ai mené parallèlement à ces interviews un travail d’écoute critique de nombreux enregistrements.

Dans le but de faciliter le travail comparatif, l’étude a d’abord été centrée sur des enregistrements de symphonies de Beethoven. Ces symphonies ont été choisies car elles font partie des œuvres les plus enregistrées, par un grand nombre d’orchestres, de chefs, de labels… Par la suite, la comparaison a été étendue à d’autres œuvres du XIXᵉ siècle (symphonies de Schubert, œuvres symphoniques de Berlioz, symphonies de Mahler…). En effet, malgré le fait que beaucoup d’ingénieurs du son indiquent adapter leur esthétique à l’œuvre enregistrée, j’ai pu constater que dans cette période, les différences constatées entre les différents labels sont semblables quelle que soit l’œuvre concernée. L’élargissement à plusieurs compositeurs a ainsi permis d’augmenter la base de données d’écoutes.

Les enregistrements ont été analysés en complétant deux grilles d’écoute. La première est une grille permettant de rassembler les données liées à l’enregistrement : œuvre, orchestre, chef d’orchestre, salle, date d’enregistrement, ingénieur du son, directeur artistique, et remarques diverses (enregistrement live, …). Il n’a cependant pas toujours été possible d’obtenir toutes ces informations. En effet, certains livrets de disque ne précisent pas le lieu d’enregistrement, ou bien l’ingénieur du son et le directeur artistique.

La deuxième est une grille d’écoute critique, composée de critères tels que largeur, profondeur, relief, localisation, acoustique, équilibre spectral, balance, intelligibilité… Les critères complets sont disponibles en Annexe C.

À l’issue de ces écoutes, j’ai pu, en croisant les données de ces deux grilles, déterminer des caractéristiques propres à certains critères (labels par exemple), et ainsi sélectionner les extraits qui sont proposés pour illustrer certains aspects de mon travail de recherche (à l’exception des exemples sonores du chapitre 1.1.2, qui sont issus de [3])

Pour des raisons pratiques d’accès aux archives, la comparaison d’enregistrements s’est portée principalement sur des enregistrements discographiques et assez peu sur des enregistrements radiophoniques. Ceci limite donc les possibilités de tirer d’après ces écoutes des conclusions concernant les enregistrements radiophoniques.

3. Résultats du questionnaire

3.1. Les différentes esthétiques

3.1.1. La question du réalisme et du naturel

Nous avons vu dans le chapitre 1.2.2 que l’idéal visé par certains ingénieurs du son est la fidélité.

Seuls deux des ingénieurs interviewés recherchent la fidélité, et l’un d’eux cite même le concept de best seat in the hall. (E1)

En revanche, 8 ingénieurs revendiquent un goût pour les prises de son « naturelles » ou bien encore cohérentes, rationnelles, ce qui n’implique pas forcément pour eux la notion de réalisme :

Goût pour une image naturelle mais pas forcément fidèle. (F1)

Cela doit rester naturel¹³ (G3)

Mon goût en matière de prise de son est de reproduire une prestation qui sonne naturelle.¹⁴ (E1)

[J’aime les images] plutôt « spectaculaires », tant que ça reste naturel¹⁵ (G9)

Mon goût pour la mesure et le rationnel… (F5)

[Je cherche un] placement cohérent pour la musique classique (F3)

Pendant des années, j’ai cru qu’il fallait reproduire la réalité. J’ai essayé de le faire, c’est quasiment impossible. Il faut faire quelque chose qui s’éloigne de la réalité mais qui soit cohérent. (F11)

D’autre part, certains évoquent la notion de réalisme, mais pour la rejeter :

Le réalisme de la largeur d’orchestre n’a pas de sens à mes yeux car l’expérience qu’on en a depuis une salle n’est jamais la même. (F3)

Le confort d’écoute est plus important que le réalisme. (F8)

Je ne crois pas en l’idée d’essayer de capturer la « meilleure place de la salle », qui est un argument (erroné et fallacieux) que l’on entend souvent.¹⁶ (E2)

Le réalisme est ennuyeux. (G10)

Enfin, plusieurs ingénieurs du son évoquent la différence de vécu entre l’écoute d’un concert et l’écoute d’un disque, et plus particulièrement la problématique de la vision.

Dans un environnement de concert, l’œil guide l’oreille.¹⁷ (E2)

L’image sonore est une image. Elle doit montrer ce que l’auditeur CROIT avoir entendu (en réalité, il a entendu, plus vu, plus vécu, plus ???).¹⁸ (G8)

3.1.2. S’éloigner de la réalité du concert

Plusieurs ingénieurs du son ont des approches esthétiques qui tendent à s’éloigner de la réalité vécue par le spectateur d’un concert. Cette approche est souvent associée à un souhait d’image sonore spectaculaire.

J’aime les enregistrements directs, pleins d’effets, et spectaculaires, qui ne sont pas trop réverbérés, sans cependant perdre le son chaud et ouvert…¹⁹ (G3)

[J’aime l’] Extra-largeur dans une certaine mesure. […] [Je privilégie] le timbre par rapport au réalisme de l’image. (F7)

Le travail de l’ingénieur est de créer l’illusion de la réalité. Le son enregistré doit impliquer et exciter l’auditeur, qui n’a pas l’expérience de l’environnement de concert.²⁰ (E2)

[Placements, largeurs, etc :] à mon sens tout est permis. (F8)

J’ai une tendance pour le réalisme spectaculaire, qui se traduit par la volonté de mettre l’auditeur à la place du chef d’orchestre et non pas forcément dans la salle de concert. Ce choix esthétique nécessite par conséquent une image large, voire extra-large. […] J’ai également tendance à exagérer les plans en profondeur. (F10)

3.1.3. Influences

Il a été demandé aux ingénieurs du son quelles étaient leurs influences et on retrouve trois influences principales : la formation, les expériences professionnelles (stages et assistanat), et enfin la pratique instrumentale et l’écoute de disques et de concerts.

Formation

Quelques ingénieurs du son n’ont pas suivi de formation institutionnelle et ont appris leur travail directement par la pratique. Cependant, un grand nombre d’ingénieurs estiment que leur formation a eu une influence sur leur esthétique ou sur leurs habitudes, influence dont l’importance varie selon les personnes :

Le Conservatoire a forcément formé mon écoute et mes premiers réflexes de choix de microphonie. (F2)

Il y a deux grandes sources à mes critères esthétiques, dans deux cours pendant les études. Dans un cours, nous avons écouté de la musique de tous genres sur une très bonne installation, […] comparé les esthétiques d’enregistrement de différents orchestres dans différentes salles, appris à nous concentrer uniquement sur les basses, sur la perception de la salle, sur la profondeur, sur la résolution des aigus, etc. Le second est un cours d’acoustique. Durant le cours, nous avons enregistré de la musique pour guitare, la même pièce avec le même musicien et le même micro, dans 10 studios d’enregistrement de taille différente, et comparé ces enregistrements. […] Ce travail influence encore aujourd’hui mon travail dans les productions musicales.²¹ (G2)

Oui, Detmold est la source [de mes critères esthétiques].²² (G7)

Le plus intéressant reste les idées de Christian Briguet au CNR [Conservatoire National de Région] de Boulogne Billancourt. (F6)

Les études m’ont donné des suggestions pour développer un style personnel dans l’esthétique sonore.²³ (G6)

Ma formation m’a évidemment donné les bases intellectuelles et théoriques pour pouvoir travailler mais ne m’a pas réellement donné d’esthétique. […] J’ai donc pu rapidement développer mes propres critères en prise de son et direction artistique, critères souvent opposés à l’enseignement reçu, d’ailleurs. (F3)

Les esthétiques sonores défendues à Detmold n’étaient pas les miennes. (F4)

Stages et assistanat

Si la formation est une des sources esthétiques pour un certain nombre d’ingénieurs du son, ils indiquent tous que les stages qu’ils ont effectués ou les années d’assistanat ont eu une grande influence sur eux. Ainsi, la plupart d’entre eux cite quelques professionnels dont le travail les a particulièrement marqués.

D’autre part, plusieurs d’entre eux évoquent une formation interne à certaines firmes dans lesquelles ils ont travaillé. Ainsi, l’ingénieur (E1) explique avoir été formé par les membres plus âgés de Decca. Il explique que les techniques Decca étaient transmises de génération en génération, et qu’un jeune ingénieur était immergé dans le Decca Sound, par du travail de mastering, de montage, et de fabrication de vinyles, avant de pouvoir faire lui-même ses propres enregistrements pour la firme.

L’ingénieur (F9) explique quant à lui qu’il n’a pas suivi de formation institutionnelle et qu’il a été formé par assistanat. Au début de sa carrière, il avait régulièrement des discussions et des bilans de qualité avec les ingénieurs qui l’avaient formé, ce qui lui a permis d’établir pendant cette période les fondements de ses choix esthétiques.

D’autres ingénieurs du son indiquent eux aussi avoir été formés par une entreprise particulière, pour laquelle ils travaillent toujours : la WDR, Radio Classique, Radio France, Naïve, Abbey Road Studios, EMI, Teldec/Teldex…

Pratique musicale, écoute de concerts et de disques

La plupart des ingénieurs du son interrogés estiment que leur pratique musicale influence grandement leur esthétique. Ils font ainsi état de la pratique d’un instrument, mais aussi de la musique d’ensemble, que ce soit en musique classique (formation de chambre, en orchestre, ou en chœur) ou dans d’autres styles musicaux.

D’autre part, plusieurs ingénieurs du son indiquent que la visite fréquente de concerts, depuis leur plus jeune âge, influence énormément leur esthétique sonore.

Enfin, l’écoute de disques est aussi une influence importante. Ainsi, si la plupart d’entre eux se dit influencée par la tradition d’enregistrement de la musique symphonique, d’autres évoquent aussi leur goût pour d’autres styles de musiques (pop, rock, jazz, musiques électroniques, musique de film, …). L’ingénieur (F11) explique aussi que l’écoute de nombreux disques en particulier au début de sa carrière lui a permis de développer sa propre esthétique. L’écoute d’un très grand nombre d’enregistrements de labels différents lui a permis de se faire sa propre idée de la prise de son d’orchestre et il explique qu’il a par exemple très vite été marqué par certaines écoles de son, notamment l’école anglaise.

L’ingénieur (F5) explique quant à lui que sa culture des musiques dites actuelles lui a donné un goût particulier pour les spectres larges et les ambiances très définies.

3.1.4. Évolution esthétique

Nous avons vu quelles sont les sources esthétiques des ingénieurs interviewés. Cependant, il est important de se demander aussi comment cette esthétique a évolué au fil des années, avec l’expérience et après de nombreux enregistrements.

À la question de savoir si les ingénieurs du son cherchent à s’inscrire dans une continuité esthétique, et si leur esthétique a évolué au fil des années, la plupart d’entre eux estiment qu’il y a bien une évolution.

3 ingénieurs du son indiquent ne pas chercher à s’inscrire dans une continuité esthétique, et que leur esthétique dépend principalement du projet.

19 ingénieurs observent une évolution dans leur esthétique. Parmi ces ingénieurs, deux estiment cependant qu’en réalité, ce n’est pas leur esthétique qui a évolué, mais les moyens d’y parvenir.

Certains d’entre eux précisent qu’ils analysent cette évolution a posteriori, mais qu’elle a été très lente et qu’ils ne s’en sont pas rendu compte au fur et à mesure de leur carrière. Un seul ingénieur estime que son esthétique n’a pas évolué.

Certains participants donnent des pistes pour expliquer leur évolution. Deux d’entre eux estiment que leur esthétique a évolué en suivant certaines évolutions techniques. Ainsi l’un deux explique qu’il a de nouvelles attentes, créées par de nouveaux moyens (F5). Le second indique que l’expérimentation de nouvelles techniques de prise de son et de mixage sur des projets innovants fait évoluer son approche des projets plus conventionnels (F10).

Deux autres participants expliquent que leur évolution esthétique est due à une meilleure compréhension de la partition (G5) et (F9). Beaucoup évoquent des rencontres avec d’autres professionnels ou des musiciens, et surtout les années de pratique et d’expérience professionnelle.

Enfin, quelques participants donnent plus de détails sur leur évolution esthétique :

J’ai évolué en essayant de concilier l’espace et le relief avec la précision et le timbre. (F1)

J’ai beaucoup enregistré de la musique ancienne ces dernières années, ce qui m’a amenée à développer une esthétique de plus grande proximité, avec une très grande définition, très liée à la précision qu’on entend sur un continuo, par exemple. (F2)

Avec le métier, je sais de plus en plus ce que je recherche et j’y arrive mieux. Par contre, je pense qu’au début je faisais des prises de son plus proches que maintenant, et que j’ai appris à maîtriser la prise de son lointaine avec le temps. (F4)

Dans les années 80, les enregistrements d’orchestre étaient très globaux et neutres. Aujourd’hui, je cherche un son […] structuré et clair, avec le plus possible une grande acoustique. Aujourd’hui, mes microphones d’appoint sont plus proches des instruments, mais sont retardés et le système principal est plus fort dans le mix.²⁴ (G8)

Je suis plus sensible à l’architecture musicale et la structure instrumentale, c’est-à-dire avec une partition plus évidente à l’écoute sans perdre les autres critères d’esthétique sonore. (F9)

J’ai évolué de quelque chose d’assez proche à quelque chose de plus global, jusqu’à l’excès, puis je suis revenu un peu plus proche. (F11)

3.1.5. Critères objectifs/critères subjectifs

Certains ingénieurs du son interrogés évoquent la distinction entre des critères objectifs et des critères subjectifs d’analyse sonore.

D’autre part, plusieurs participants estiment que le fait de respecter la partition réduit la part de choix et de subjectivité de l’ingénieur du son. En effet, ils expliquent que la balance doit respecter la partition et que le style musical détermine l’esthétique sonore.

Je pense que le fait de respecter la logique musicale amène une certaine objectivation des choix techniques et esthétiques et réduit la part de goût personnel dans le travail. (F3)

Je fais la différence entre critères objectifs et subjectifs. Les erreurs sonores objectives (par ex. erreurs de balance, de localisation ou de panoramiques), je ne les admets pas.²⁵ (G8)

Pour le professionnel, le goût se traduit par une gestion de la qualité. Pour l’orchestre comme pour les autres formations instrumentales, la qualité sonore est constituée d’une composante objective plutôt technique, basée sur des critères clairement définis, voire mesurables, inclus dans les connaissances du métier et aussi sur les références de l’environnement de l’enregistrement (le répertoire, le genre, l’objectif du produit audiovisuel, le support…). Il y a une autre composante, subjective celle-là, plus personnelle, influencée par nos « états d’âme », nos maitres à penser de la prise de son, les phénomènes de mode esthétique et notre cadre culturel en mutation. […] Notre tâche sera de réduire au mieux cette partie aléatoire pour une bonne analyse. (F9)

3.1.6. Classement des critères d’analyse sonore

Il a été demandé aux participants de classer les critères suivants, selon l’ordre d’importance selon eux : respect de l’image sonore (largeur, profondeur, localisation, …), espace (réverbération,…), homogénéité, définition, timbre, équilibre spectral, balance, dynamique, naturel, recherche de spectaculaire, autres critères (à préciser)

La majorité d’entre eux a trouvé qu’il était assez difficile de répondre à cette question, estimant que tous ces critères étaient importants. Cependant, 15 participants ont tout de même répondu et rangé ces critères par ordre d’importance. Certains n’ont cité que quelques critères (au minimum 3) et d’autres les ont tous rangés. Pour prendre en compte ces deux types de résultats, deux analyses ont été faites. La première consiste à dénombrer le nombre de fois où chaque critère figure parmi les trois premiers de la liste. La seconde a consisté à pondérer chaque critère par son numéro d’ordre, sur une échelle de 1 à 10 (10 points pour le premier critère, 9 pour le second, etc). Les résultats de chacune de ces analyses sont présentés pour la totalité des participants, puis par pays (Allemagne et France). Les résultats ont été normalisés pour être comparables pour chaque pays malgré le nombre différent d’ingénieurs français et allemands.

Les Figures 3.1 et 3.2 permettent d’analyser les critères considérés comme étant les plus importants dans le cas d’une prise de son d’orchestre symphonique. La figure 3.2 donne des résultats plus homogènes entre les critères, puisqu’elle prend aussi en compte ceux qui ne sont pas cités comme les plus importants. Cependant, on remarque certaines constantes sur ces deux graphiques. Ainsi, on peut affirmer que les 5 critères jugés les plus importants sont le timbre, l’image, l’acoustique, l’homogénéité, et la balance. En revanche, la recherche de spectaculaire par exemple n’est pas un critère prioritaire.

Fig. 3.1 – Critères cités parmi les trois les plus importants

Fig. 3.2 – Critères avec pondération selon l’ordre

Les figures 3.3 et 3.4 montrent que quelque soit le pays étudié, on retrouve ces 5 mêmes critères comme étant les plus importants. Cependant, il est intéressant de noter quelques différences entre les critères cités par les ingénieurs du son français et allemands. Ainsi, on remarque que même si l’importance de certains critères est jugée de la même manière (image, acoustique, balance), les ingénieurs du son français semblent accorder plus d’importance à la question du timbre et de l’équilibre spectral, et les ingénieurs allemands plus d’importance à la recherche de « naturel ».

Fig. 3.3 – Critères cités parmi les trois les plus importants, par pays

Fig. 3.4 – Critères avec pondération selon l’ordre, par pays

3.2. Les différentes techniques

3.2.1. Systèmes principaux

La quasi-totalité des ingénieurs du son interrogés utilisent un système principal en Decca tree ou en couple AB avec des micros omnidirectionnels. La plupart d’entre eux complète ce système principal par des ailes, ou « outriggers ».

3 d’entre eux utilisent principalement un Decca tree. (G1, G5 et G8)

10 utilisent principalement un couple AB (F1, F2, F3, F5, F7, F10, F11, F12, G6, G7). L’ingénieur (G10) utilise quant à lui une combinaison de ces deux types de systèmes. Ainsi il explique que le Decca tree et le couple AB qu’il utilise sont chacun inutilisables seuls (car il place le decca tree trop près pour fonctionner en autonomie et le AB trop loin) et que c’est par la combinaison de ces deux systèmes qu’il construit la base de sa balance.

Enfin, quatre ingénieurs (E1, F8, G4 et G9) utilisent un nombre variable de micros pour leur système principal, le système étant en particulier choisi en fonction de la salle. Ainsi, E1 explique avoir deux systèmes de prise de son : l’un avec un decca tree lorsqu’il travaille dans des salles ayant une bonne acoustique, et l’autre avec un couple AB lorsqu’il travaille dans des salles ayant une moins bonne acoustique. (G4) explique pour sa part installer systématiquement un triangle Decca, mais dont il n’utilise le centre que pour le mixage en surround.

Seul l’ingénieur du son (E2) indique utiliser un système principal coïncident, avec des microphones hyper-cardioïdes, complété par des ailes.

3.2.2. Appoints

Les ingénieurs du son interrogés utilisent tous des appoints pour préciser certains instruments. Certains ont des configurations assez minimalistes (couple principal + couple de fond de scène + quelques appoints si nécessaires pour (F5) par exemple), d’autres des configurations plus chargées (deux appoints par groupe de cordes, appoints sur les bois, les cuivres, les timbales, etc). Il semblerait que cela ne dépende ni du pays dont vient l’ingénieur du son, ni du média pour lequel il travaille. En revanche, plusieurs personnes précisent que c’est le système principal qui fait la plus grande partie du son, et ce plus encore lorsqu’ils se trouvent dans une bonne salle.

10 ingénieurs ont précisé la directivité qu’ils utilisent de préférence pour leurs microphones d’appoint. Il est tout de même intéressant de noter que, indépendamment du type de média pour lequel ils travaillent, des tendances peuvent se retrouver selon le pays. Ainsi, si l’on s’intéresse aux appoints cordes, les ingénieurs du son allemands ayant répondu (G4 et G5) indiquent préférer travailler avec des appoints cardioïdes. En revanche, parmi les 6 ingénieurs du son français ayant indiqué le type de directivité privilégiée, quatre indiquent utiliser des microphones infracardioïdes (F2, F7, F11, F12), et deux ingénieurs français indiquent même privilégier les appoints omnidirectionnels.

3.2.3. Mixage

Alignement temporel des appoints avec le système principal (Delays)

En ce qui concerne l’utilisation de delays, on note trois catégories de personnes : ceux qui les utilisent systématiquement (9 ingénieurs), ceux qui ne les utilisent presque jamais (3 ingénieurs), et ceux qui décident au cas par cas de les mettre sur certains micros et pas sur d’autres (8 ingénieurs).

Plusieurs ingénieurs du son font remarquer l’usage assez récent du delay, et expliquent qu’ils n’ont pas appris la prise de son d’orchestre en utilisant des delays. Ils expliquent qu’il y avait d’ailleurs un certain avantage, qui consistait à régler le problème dès l’enregistrement, et non pas au mixage : il y avait des problèmes de phase, mais on apprenait à placer les micros (F11) ou encore : La phase n’est jamais un problème dont je m’occupe – si ça ne sonne pas bien, je déplace le micro.²⁶ (E2)

Un autre ingénieur du son explique qu’en Allemagne, en ce qui concerne l’utilisation de delays, il y a longtemps eu deux traditions différentes dans les écoles de Tonmeister de Detmold et Berlin. Ainsi, les étudiants de Detmold étaient formés à une technique utilisant beaucoup de delays, alors que ceux de Berlin n’y étaient pas du tout formés.

De plus, lors de l’utilisation de delays, il y a de nouveau deux catégories de personnes qui se distinguent : ceux utilisant des delays exacts qu’ils ont mesurés, et ceux utilisant des delays estimés.

Enfin, certains ingénieurs expliquent que selon eux, l’utilisation de delays, bien que parfois utile, peut avoir pour conséquence d’aplatir le mix et de le rendre ennuyeux. (F11, E3)

Réverbération

Tous les ingénieurs du son participants utilisent de la réverbération artificielle, que ce soit pour allonger la réverbération naturelle, pour créer une réverbération dans le cas d’une salle peu réverbérante, pour intégrer des appoints, etc.

Les ingénieurs (F2), (F4), (F5) et (F11) précisent qu’ils utilisent une réverbération à convolution sous la forme de plug-in (pour la plupart, il s’agit d’une Altiverb). Les ingénieurs (E1), (G4), (G6) et (F8) indiquent eux utiliser des réverbérations artificielles sous forme de hardware (Lexicon 480, 960, TC Electronic, Bricasti M7 ou encore EMT240). Trois autres (F12, G10 et E3) indiquent se servir à la fois des plug-in et du matériel hardware (l’un d’eux explique que pour du mix direct pour la radio, il utilise du hardware, mais pour la post-production, un plug-in).

À première vue, il semblerait que les Français interrogés aient plus tendance à se servir de réverbération sous forme de plug-in que les Allemands ou anglais. Cependant, l’explication est probablement différente : les ingénieurs déclarant utiliser des plug-ins sont tous des ingénieurs du son qui travaillent de manière indépendante, surtout pour le disque. En revanche, les ingénieurs se servant de réverbération hardware sont quasiment tous employés par une structure (studio ou radio). Il semble donc logique que les structures (qui ont des locaux dédiés et des moyens plus grands que des ingénieurs indépendants) aient la possibilité d’investir dans du matériel hardware. A contrario, les ingénieurs du son indépendants, qui ont besoin d’être plus mobiles, sont amenés à travailler à domicile et ont des budgets plus limités, choisissent de travailler avec des plug-ins.

Autres outils

En ce qui concerne le suivi des appoints, il y a unanimité sur le fait que le mixage de base doit fonctionner pour une grande part de l’œuvre sans faire de suivi. Cependant, alors que certains ingénieurs ne font aucun suivi, afin de respecter l’équilibre choisi par le chef, une grande partie s’autorise tout de même des suivis sur certains appoints, lors des interventions solistes en particulier.

En ce qui concerne l’utilisation d’égalisation et de compression, on trouve toute la gamme d’utilisation, de l’approche consistant à ne les utiliser que sur certains appoints particuliers, dans des cas particuliers, à l’approche consistant à utiliser systématiquement des filtres (outil utilisé assez fréquemment par beaucoup d’ingénieurs du son) et des égalisations sur tous les appoints et éventuellement le couple, ainsi que de la compression dès que jugée nécessaire.

3.3. Les « écoles » de prise de son

Les ingénieurs du son ont été invités à répondre directement à la problématique de ce mémoire, c’est-à-dire à donner leur avis sur l’existence d’écoles de prise de son de nos jours et à les caractériser.

9 ingénieurs du son estiment qu’il existe aujourd’hui différentes écoles de prise de son, et 7 pensent que ces écoles n’existent pas de nos jours. Pour ceux qui penchent en faveur de l’existence d’écoles, plusieurs types de caractérisation sont donnés :

Je pense qu’il y a différentes écoles – probablement en grande partie polarisées autour de l’opposition entre techniques multi-microphoniques et techniques minimalistes.²⁷ (E2)

Je pense qu’il y a des écoles de prises de son qui sont caractérisées par le choix des micros et leurs placements. (F7)

L’ingénieur (G10) explique qu’il y a différentes traditions de prise de son liées à des formations et/ou labels particuliers. Ainsi, il précise que les formations de Detmold et de Berlin ont des traditions différentes (par exemple pour l’utilisation des delays ou d’autres outils).

Il met aussi en lumière des réseaux particuliers qui existent entre certains studios et ces formations : ainsi, il existe un lien fort entre le studio Emil Berliner (ancien studio de Deutsche Grammophon) et l’Erich-Tienhaus-Institut de Detmold, et un lien semblable entre le studio Teldex et l’Université de Berlin. Les ingénieurs travaillant au studio Emil Berliner sont en grande partie issus de la formation de Detmold, et certains d’entre eux sont aujourd’hui enseignants dans cette formation. De même, tous les ingénieurs travaillant au studio Teldex sont issus de la formation berlinoise, et certains y enseignent.

Cependant, (G10) précise que de nos jours, les formations sont plus nombreuses et diversifiées, ce qui a tendance à faire disparaître ce type de lien formation-entreprise.

3.3.1. Esthétiques propres à un pays

Effectivement en Allemagne par ex., je trouve que d’une façon générale l’esthétique est d’enregistrer la source sonore de plus loin. (F4)

Les ingénieurs russes ont la réputation d’un son très précis et vibrant.²⁸ (E1)

3.3.2. Habitudes propres à un secteur professionnel

Une radio ne travaille pas de la même manière que pour le disque (F11)

Je dirais que l’esthétique entendue sur les captations radio est plus synthétique, fidèle à un rendu réaliste, par opposition à celle du disque, plus analytique, en proximité. (F2)

Et il y a certainement un ‘style’ particulier pour les ingénieurs radio – principalement caractérisé par une configuration de microphones omnidirectionnels. […] Je pense que les ingénieurs de radio recherchent probablement plus un son ‘naturel’ de concert.²⁹ (E2)

Aujourd’hui, comme on fait appel en permanence à des freelances, il ne peut y avoir d’esthétique de son que dans des structures types radios publiques (F3)

Il y a une différence selon le mode de diffusion radio/production-CD, même quand on utilise les mêmes micros. Une production CD ne peut pas sonner comme un enregistrement radio. C’est en particulier dû aux contraintes de temps, et à l’absence de post-production sur une diffusion radio directe. (G10)

3.3.3. Mélange de plusieurs de ces critères

Des écoles peut-être pas, mais des usages, des habitudes qui diffèrent selon le parc de matériel disponible, le secteur professionnel (musique, captation, cinéma, radio…) et selon les pays (AKG en Angleterre, Sennheiser en Allemagne…). (F8)

Les ingénieurs de radio (particulièrement en Allemagne) semblent faire un mixage plus lointain et moins défini.³⁰ (E2)

Enfin, beaucoup d’ingénieurs du son évoquent les différentes esthétiques que l’on retrouve à l’intérieur d’un même secteur, c’est-à-dire les esthétiques propres à certains labels, certains studios ou certaines radios, que ce soit pour confirmer cette notion, ou bien pour rejeter l’existence de ces esthétiques :

3.3.4. Labels

Les labels historiques dont nous avons parlé dans le chapitre 1.2.3 (Decca, EMI, Philips, Deutsche Grammophon) sont cités par plusieurs ingénieurs du son :

EMI aimait les enregistrements avec un système principal coïncident, car Alan Blumlein était un de leurs ingénieurs.³¹ (G1)

Decca avait une forte esthétique sonore – le Son Decca. Usage général de la méthode d’enregistrement Decca Tree avec 4 ou 5 microphones omnis. La captation de l’acoustique naturelle était au cœur de chaque enregistrement.³² (E1)

[Deutsche Grammophon :] une vision totalement différente de l’enregistrement, avec une technique plus multi-microphonique et une utilisation de delays pour préciser un enregistrement.³³ (E1)

DG a eu une technique de prise de son pendant longtemps, avec les micros XY en principal avec énormément d’appoints. […] Ils travaillaient dans des très belles acoustiques. […] [Decca :] Il y avait une esthétique, un sens du relief, de la profondeur. […] il y a encore 25 ans, 30 ans, on pouvait reconnaître un enregistrement, Decca, DG, Philips. De nos jours, je pense que ça n’existe plus. (F11)

Dans la grande période de l’enregistrement, pendant les années 60 et 70, je dirais que EMI, Decca et DG avaient des styles propres définis.³⁴ (E3)

Je dirais que ce sont plus certaines maisons de disque du passé qui avait un son caractéristique (comme Decca pour l’orchestre et l’opéra dans les années 60/70). (F4)

Il n’y avait pas d’esthétique sonore spécifique à un label, même chez DG et EMI, bien qu’ils aient fait de la publicité exactement sur cette notion.³⁵ (G8)

Autres labels :

Label Aparte : Micros exclusivement DPA omnis. (F2)

Dans les années 90 [j’ai travaillé] pour Denon : oui, il y avait une esthétique sonore : avec peu de micros d’appoints, obtenir un effet de salle naturel. La recherche de naturel était un critère de premier plan.³⁶ (G7)

Les disques d’Harmonia Mundi étant aujourd’hui en grande partie enregistrés au studio Teldex ou par des équipes de ce studio, le son d’Harmonia Mundi est peut-être un peu celui de Teldex. (G10)

Hyperion a la réputation d’un certain type de son.³⁷ (E2)

Pour ma part, je n’ai jamais travaillé pour un client (éditeurs, TV, cinéma) qui m’imposait une esthétique sonore particulière. (F8)

Je n’ai pour l’instant jamais travaillé avec un label qui avait des directives précises en matière de son.³⁸ (G6)

[esthétique des labels] : Peut-être cela est-il vrai de certains labels historiques, mais la modification du marché du disque semble avoir chamboulé tout ça. (F3)

Sony Classical : pas d’esthétique de label³⁹ (G7)

Je ne pense pas que Naïve a une esthétique propre. Par contre chaque artiste en a une. (F7)

[Naïve :] Conditions trop variables d’un disque à l’autre pour définir une esthétique. (F2)

3.3.5. Les radios

À Radio France, il semble qu’il y ait eu une identité sonore très forte pendant les années 50 à 80, mais qui a évolué au fil de ces années, et qui est désormais nettement moins marquée. Cependant, on retrouve encore, de nos jours, certaines manières de travailler et une esthétique particulière décrite par l’ingénieur (F1).

Il y a évidemment un style Radio France, clairement assumé, développé consciemment et volontairement durant les années 60 à 80 au fil de nombreux tests et expériences. C’est l’archétype de la structure qui produit énormément d’enregistrements (plusieurs centaines par an) avec des orchestres et des salles identiques et est à même d’affiner un processus de manière exhaustive. (F3)

Il y a certainement une idée du son Radio France, mais elle a évolué au cours du temps. Il y a 25 ans par exemple, on utilisait une rampe d’omnies devant l’orchestre au lieu d’un couple et de grands AB, cela ne se fait plus aujourd’hui. Chez Radio-France, il y a des modes… (F4)

Radio France, c’était le couple ORTF et des ailes en omni, tout en Schoeps.[…] ils ont un certain type de matériel, des façons de faire, effectivement. A Radio France il y a eu pendant longtemps une école, une façon de faire, qui existe toujours aujourd’hui. A la RSR [Radio Suisse Romande] c’est pareil, ils ont des façons de travailler qu’on retrouve. (F11)

Il y a longtemps eu une esthétique de prise de son Radio France, que j’essaie de pérenniser […] : prises de son d’orchestre larges et profondes, beaucoup d’espace et de relief, étagement des plans, … (F1)

[J’ai travaillé à] Radio France de 1993 à 2000 : Il n’y avait déjà plus d’identité propre ou homogène comme dans les années 50-70.

À Radio Classique, il semblerait qu’il y ait aussi une recherche d’esthétique commune :

Quand je travaille pour Radio Classique, je fais en sorte de me conformer à l’esthétique de cette radio en terme de captation. […] L’esthétique radio classique [est] plutôt au réalisme : plans, placements cohérents dans l’image… (F12)

Je crois que Radio Classique a développé une esthétique sonore particulière. […] Je dirais qu’elle privilégie l’espace et la qualité des timbres avant toute chose. (F7)

Pour les autres radios citées par les ingénieurs du son, (WestDeutscher Rundfunk, Bayerischen Rundfunk, NordDeutscher Rundfunk, British Broadcasting Corporation), les avis sont parfois contradictoires :

J’étais en échange pendant 2 semaines à la BBC à Londres, et là-bas, on travaille exactement comme à la WDR.⁴⁰ (G3)

J’ai eu un Tonmeister de la BBC en invité, il voulait gérer toutes les interventions instrumentales (Appoints).⁴¹ (G8)

Oui, je trouve que la WDR (WestDeutscher Rundfunk) ou plutôt les radios allemandes ont une esthétique sonore propre (en comparaison avec les Pays-Bas, l’Angleterre, les USA ou le Japon par exemple).⁴² (G2)

WDR : pas d’esthétique caractéristique.⁴³ (G7)

Le travail comme Tonmeister à la Bayerischen Rundfunk m’a toujours laissé cette indépendance.⁴⁴ (G6)

NDR Hambourg : non, pas d’esthétique sonore, plutôt dépendant du directeur artistique et de l’ingénieur du son que de l’institution. BR Munich : vraisemblablement oui, j’ai pour le moment trop peu d’expérience [pour le dire].⁴⁵ (G9)

3.4. Contraintes extérieures

Il a été demandé aux ingénieurs du son de décrire les contraintes extérieures auxquelles ils sont soumis pour leurs enregistrements d’orchestre. Les contraintes économiques sont décrites comme ayant de plus en plus d’impact sur les conditions d’enregistrement. Elles se manifestent en particulier dans le choix de la salle et dans le temps accordé à l’installation, à la balance et aux prises.

Ainsi, les deux contraintes principales citées sont le temps, pour 14 ingénieurs, et la salle, pour 16 ingénieurs. Cependant, parmi les ingénieurs citant ces deux critères, il semble que la salle soit celui qui soit considéré comme le plus contraignant, en particulier par les ingénieurs français, là où les ingénieurs allemands regrettent parfois davantage le manque de temps.

3.4.1. La salle

Le lieu d’enregistrement est, de l’avis de tous les ingénieurs du son, d’une importance capitale en ce qui concerne le résultat final. En effet, plusieurs d’entre eux aiment pouvoir intégrer l’acoustique du lieu de captation (F10). L’ingénieur (E1) explique qu’en ce qui concerne Decca, dont un des objectifs était de capturer l’acoustique naturelle, le choix de la salle a évidemment joué une part importante dans le succès sonore.⁴⁶

Plusieurs ingénieurs estiment que la salle a plus d’importance sur l’esthétique sonore que la plupart des autres critères :

L’acoustique de la salle d’enregistrement a, à mon avis, plus d’influence sur le son que la vision esthétique, qui réside principalement sur la reproduction exacte de la partition.⁴⁷ (G5)

Pour moi, c’est plutôt d’abord l’orchestre et la salle qui font le son.

Quelques ingénieurs font aussi un lien direct entre des écoles de prise de son et des salles : ainsi, (F3) explique que si Radio France a pu développer une esthétique et une méthode propres, c’est en particulier grâce au fait de travailler toujours avec des orchestres identiques dans des salles identiques. Toujours concernant Radio France, (F1) donne une liste plus précise des salles généralement utilisées pour leurs enregistrements : la Salle Pleyel, le Théâtre des Champs Élysées, le théâtre du Châtelet, et le studio Olivier Messiaen de la Maison de la Radio. On voit donc que les ingénieurs de Radio France travaillent principalement dans un nombre limité de salles, ce qui permet de comprendre comment ils ont pu développer des techniques et esthétiques adaptées plus particulièrement à ces salles.

(G5) estime de la même manière que on développe des images sonores comparables si on enregistre toujours dans la même salle.⁴⁸

(F9) développe plus précisément ce lien entre esthétique de prise de son et type de salle utilisé pour la prise de son d’orchestre : Il y avait au début de la stéréophonie de véritables écoles de prise de son qui accompagnaient fréquemment les traditions acoustiques des salles de concert. De la grande salle de fête viennoise au théâtre à l’italienne, l’Europe a suivi des modèles différents que l’on a retrouvés en partie dans les choix esthétiques des captations sonores. Nous pouvions trouver à cette époque, le découpage traditionnel entre une Europe du sud et une Europe du nord où une fois encore, la France se situe à la croisée des chemins, la Grande Bretagne dans sa superbe originalité et l’Allemagne en reconstruction dans ces années 60/70 testant de nouvelles salles de concert.

(E3) explique de la même manière le lien entre l’esthétique de certains labels et les salles utilisées : Chacun [EMI, Decca, DG] était caractérisé principalement par les acoustiques qu’ils utilisaient – EMI avait les studios Abbey Road/ Decca avait certaines des plus belles salles de concert/ DG avait des acoustiques merveilleuses, particulièrement à Berlin, comme l’Eglise Jesus Christus à Dahlem.⁴⁹ (F11) note lui aussi que Deutsche Grammophon avait pour habitude de travailler dans de très belles acoustiques.

Certains ingénieurs donnent les qualités indispensables à une bonne salle pour la prise de son d’orchestre symphonique. Ainsi, (F3) explique que Pour un symphonique, un grand volume avec une belle couleur est nécessaire. Pour l’ingénieur (F11), la salle idéale est la salle où l’on peut prendre du recul, mais où on a une tellement bonne projection de la source sonore que malgré le recul on ne perd pas en précision.

Enfin, (F11) donne des détails sur les salles qu’il considère comme bonnes ou mauvaises pour la prise de son d’orchestre :

En Angleterre ils ont la chance d’avoir […] des très belles salles. […] [Autres bonnes salles :] au Victoria Hall à Genève, la réverbération est assez importante, mais très dense, on peut vraiment avoir de la profondeur et de la perspective ; Arsenal de Metz ; … […] de nos jours, il existe plus de mauvaises salles que de bonnes salles. (F11)

Adaptation à la salle

Afin de réaliser un enregistrement convenable dans une acoustique moyenne, les ingénieurs du son développent des techniques spécifiques.

Ainsi, (E1) explique qu’il a deux configurations de base au niveau microphonique : une configuration formée d’un decca tree avec deux ailes et un nombre restreint d’appoints (pas d’appoints sur les cordes, deux appoints sur les bois, …) pour les bonnes acoustiques, et une deuxième technique formée d’un couple AB et d’un nombre beaucoup plus élevé d’appoints (2 appoints sur les violons I, 2 sur les violons II, 1 alto, 1 violoncelle, 1 contre-basse, un appoint pour chaque section de bois, …). Ainsi, il explique le principe de son premier set-up : L’idée est d’obtenir une bonne image sonore globale par le placement correct des cinq micros omni principaux. Les appoints sont utilisés pour apporter un peu de précision aux différentes sections, plutôt que d’avoir un mixage construit uniquement à partir de ces appoints. La technique ci-dessus est totalement dépendante d’une bonne acoustique naturelle dans la salle.⁵⁰ C’est donc en raison de la dépendance du résultat à l’acoustique de la salle qu’il a dû développer une deuxième technique, qui accorde plus d’importance aux appoints.

D’autres techniques sont utilisées pour s’adapter à la salle : choix de micros principaux avec des colorations différentes, directivité des ailes, placement des micros d’ambiance, nombre des micros d’appoint, utilisation de réverbération artificielle pour améliorer une acoustique trop sèche (F3 précise cependant que dans le cas d’une réverbération naturelle trop longue, il est impossible de la contourner par utilisation de réverbération artificielle, et que la couleur de la réverbération naturelle est particulièrement importante), utilisation ou non de delays selon la taille de la scène.

3.4.2. Le temps

Les contraintes économiques et la baisse des budgets dédiés à la production musicale se manifestent aussi par la réduction de la durée de l’enregistrement. Ainsi, les productions studio sont de plus en plus rares et les captations sont donc de plus en plus des concerts enregistrés, avec enregistrement de la répétition générale et du concert pour permettre un minimum de montage, avec parfois une séance de corrections. Si le nombre de prises et le temps accordé à la direction artistique n’a pas d’influence directe sur l’esthétique sonore, mais plutôt sur le travail d’interprétation, la diminution du temps de balance en revanche a une influence directe sur l’esthétique sonore.

Le temps est le plus gros problème. Aujourd’hui, il faut avoir le son dès le début… Mais les meilleurs enregistrements sont ceux où l’on peut écouter dans la salle et avoir le temps d’ajuster les microphones.⁵¹ (E3)

Le manque de temps peut m’empêcher d’optimiser la position des microphones.⁵² (G2)

Il faudrait avoir plus de temps, mais c’est trop cher…⁵³ (G3)

Actuellement, dans le domaine de la production musicale et des concerts, le facteur temps joue un rôle de plus en plus grand. Le temps, c’est cher. Ceci crée de la pression sur l’équipe. Beaucoup de choses qui étaient auparavant réglées à l’enregistrement doivent aujourd’hui être faites en post-production.⁵⁴ (G6)

Ces deux contraintes sont les deux principales citées par les ingénieurs interrogés, mais certains en évoquent d’autres, rencontrées lors des enregistrements :
- la discrétion visuelle, pour les concerts qui sont aussi captés par une équipe vidéo, ou plus généralement pour tous les enregistrements se déroulant avec du public. Cette discrétion visuelle implique le choix de microphones plus petits, mais surtout de suspendre le système principal, ce qui le rend moins facile à régler finement et donc à optimiser.
- l’acoustique de la régie d’enregistrement, pour les ingénieurs utilisant des régies mobiles, installées dans des locaux rarement adaptés.
- les conditions d’écoute actuelles, sur de mauvais systèmes, sur des écouteurs, etc. qui obligent les ingénieurs à mixer avec des objectifs parfois opposés (doit-on mixer pour ces auditeurs ou pour les systèmes hifi de bonne qualité ?)
- la taille de l’équipe d’enregistrement
4. Discussions

Les avis des ingénieurs interviewés sont assez partagés quant à l’existence d’écoles de prise de son. L’existence d’une esthétique propre à certains labels historiques semble cependant faire consensus. En ce qui concerne les productions actuelles, plusieurs pistes de réflexions sont évoquées par les différents participants, et nous allons ici les développer.

4.1. Évolution de l’industrie musicale

Les contraintes économiques et la baisse des budgets accordés à la production musicale ont entraîné de grandes modifications du métier d’ingénieur du son pour l’orchestre depuis les années 1990.

Aujourd’hui, les labels font appel à des ingénieurs du son freelance, alors qu’il y a encore une quinzaine d’années, un grand nombre de labels embauchaient des ingénieurs du son qui faisaient tous leurs enregistrements.

Beaucoup d’ingénieurs du son travaillent donc aujourd’hui de manière indépendante, en tant que prestataires de service. Des ingénieurs avec des esthétiques et techniques très différentes peuvent travaillent pour un même label. Réciproquement, un même ingénieur est amené à travailler pour plusieurs labels différents, et il ne change pas sa technique ou son esthétique en fonction de son employeur. Il est donc beaucoup plus compliqué pour un label de développer sa propre identité sonore, ce qui était possible quand chaque firme travaillait avec une équipe fixe qui évoluait pendant de nombreuses années dans l’entreprise, utilisait un matériel commun, dans des lieux d’enregistrement spécifiques.

Une autre évolution des conditions de production consiste en la diminution du temps attribué à toutes les étapes d’un projet d’enregistrement : installation, balance, temps de prises, post-production. Un grand nombre d’ingénieurs du son indique en effet que le temps imparti pour chacune de ces étapes a énormément diminué depuis l’âge d’or de l’enregistrement des années 1960 aux années 1980. Ceci peut obliger les ingénieurs du son à faire des compromis par rapport à leur idéal esthétique. Ainsi, un temps de balance mais aussi de mixage plus restreint limitera les possibilités d’optimisation sonore, un temps d’installation très court pourra impliquer le choix d’un set-up plus léger, etc.

En France, l’évolution économique du domaine de la production musicale a entraîné un changement important du paysage phonographique depuis les années 1980. Outre quelques structures importantes (Harmonia Mundi, Naïve, …) on observe surtout une multiplication des petites structures, liées à un artiste ou un ingénieur du son (entre 100 et 110 labels pour la musique classique en France en 2004 [22]). Il est donc beaucoup plus difficile aujourd’hui de faire un état des lieux esthétique puisque le marché n’est plus réparti entre quelques gros labels ayant une identité forte, mais entre un grand nombre de petits labels indépendants. La répartition des ventes en France se répartissait en effet de cette manière en 2004 [22] : 25% des ventes sont constituées par les parutions des multinationales, 25% par les parutions de labels français indépendants, et la moitié restante par des labels indépendants étrangers.

Cette évolution des conditions d’enregistrement a modifié le métier d’ingénieur du son. On demande maintenant une très grande flexibilité pour s’adapter à de mauvaises acoustiques, à des temps de production plus courts… Les budgets dédiés à la location de matériel sont aussi plus faibles, ce qui implique des compromis à ce niveau aussi. Pour toutes ces raisons, beaucoup d’ingénieurs du son se plaignent de ne pas avoir les possibilités d’obtenir le résultat qu’ils visent, et regrettent de devoir faire trop de compromis. Cependant, certains ingénieurs du son rappellent aussi que c’est dans la difficulté, en rencontrant des contraintes de temps ou d’acoustique, qu’ils ont parfois été amenés à trouver des nouvelles solutions pour faire face à ces obstacles.

4.2. Peut-on encore parler d’esthétique de label ?

Malgré ce changement de modèle économique, certains labels tentent tout de même d’homogénéiser les productions qu’ils produisent. C’est le cas de Deutsche Grammophon par exemple, qui a rédigé un Yellow Book [23] regroupant des instructions techniques.

Ce carnet d’instructions est communiqué préalablement à tout enregistrement Deutsche Grammophon à l’équipe technique qui le réalisera. La plupart de ces instructions concernent le format d’enregistrement (96kHz, 24 bit), les dénominations et consignes pour l’archivage des rushes et des masters, les ambiances à mettre entre les pistes, le choix de conserver les applaudissements sur un enregistrement de concert… Cependant, on peut aussi, par exemple, y lire l’instruction suivante :

Les microphones d’appoint doivent être retardés dans le mix suivant leur distance respective au système principal. Idéalement, il faudrait enregistrer une « click take » pour chaque set-up microphonique pendant l’enregistrement.⁵⁵

Nous voyons dans cet exemple que le label impose une technique particulière aux ingénieurs du son, en l’occurrence l’utilisation de delays. De plus, la création d’un « click take » pour ces delaysimplique que les retards appliqués aux micros doivent être des retards exacts, correspondant à la distance réelle. Nous avions vu dans le chapitre 3.2.3 que l’utilisation de delays n’est pas une technique utilisée par tous les ingénieurs du son. D’autre part, le Yellow Book stipule que Deutsche Grammophon se réserve le droit de soumettre le master final à un contrôle de qualité. Ainsi, on voit que le label tente de garder un contrôle et un droit de regard sur les enregistrements réalisés, même si le label n’a plus sa propre équipe technique.

Malgré cette volonté de Deutsche Grammophon de contrôler les enregistrements qui paraissent sous le label, ces instructions ont tout de même un impact limité. En effet, il n’y a pas d’indication sur l’esthétique que doit respecter l’ingénieur du son (le contrôle se fait a posteriori), ni d’indication de techniques microphoniques à utiliser (système principal, appoints, …), et les possibilités techniques et esthétiques, même en respectant les instructions données, restent très nombreuses.

En dehors de ce Yellow Book de Deutsche Grammophon, nous avons vu que la plupart des ingénieurs du son interrogés se sentent plutôt libres d’exprimer leur goût en matière de prise de son, et qu’aucun d’entre eux n’affirme avoir reçu de directives en matière d’esthétique sonore lorsqu’il a travaillé avec des labels actuels.

Nous avons aussi vu que les labels ne possèdent plus leurs propres équipes techniques, et qu’ils font donc appel à différents prestataires de service, dont ils n’ont pas l’exclusivité. Ceci nous amène donc à penser que la notion d’esthétique de label est difficilement applicable de nos jours. Quelques exemples d’enregistrements actuels de la Symphonie No 4 de Mendelssohn : (Pistes no 14 à 17)

Il faut cependant noter l’apparition d’un nouveau type de labels, qui pourraient bien dans l’avenir développer une esthétique et technique propre. Il s’agit de labels qui ont été créés par des orchestres particuliers. On peut citer l’exemple du LSO Live [24], fondé en 2000 et dont le rôle est d’enregistrer les concerts du London Symphony Orchestra, ou encore celui du Berliner Philharmoniker Recordings, label qui vient d’être fondé dans la continuité de la plateforme de streaming vidéo « Digital Concert Hall » (2008), qui retransmet les concerts de la Philharmonie de Berlin, et plus particulièrement ceux du Philharmoniker Orchester. Le premier cycle de ce label sort le 23 mai 2014, il est donc encore impossible d’analyser une éventuelle esthétique du label. [25]

On peut tout de même penser que ces labels regroupent des conditions favorables au développement d’une esthétique propre : ils travaillent très souvent avec les mêmes équipes, ont leur propre matériel, enregistrent fréquemment dans la même salle (la salle de résidence de l’orchestre), et un orchestre précis. Il sera donc intéressant de suivre l’évolution esthétique de ces labels dans les années à venir, et de voir si la notion d’esthétique de label peut s’y appliquer.

4.3. Les radios sont-elles les dernières structures à pouvoir développer une esthétique propre ?

Une distinction importante se dessine entre les personnes travaillant pour la production discographique et celles travaillant pour la diffusion radiophonique.

Si les ingénieurs du son sont actuellement beaucoup moins liés à un label qu’autrefois, les radios sont des structures qui embauchent encore à plein temps et peuvent assurer un suivi dans l’évolution professionnelle de leurs employés. En effet, certaines radios recrutent des jeunes étudiants en alternance et les forment (par exemple à la WDR) pour travailler ensuite chez eux. L’évolution professionnelle se fait de manière interne, suivant différentes étapes, qui permettent d’assimiler les techniques et esthétiques de la radio (on entre en tant qu’assistant, puis on monte en grade progressivement). Dans le secteur du disque, de la même manière que les ingénieurs ne sont pas attachés à un label, les assistants travaillent pour plusieurs labels, et ne sont donc pas « imprégnés » d’une technique précise.

Enfin, les grandes structures radiophoniques ont généralement un grand parc de matériel, des régies déjà installées dans les salles de concert où ils travaillent le plus fréquemment (la salle Pleyel et le Théâtre des Champs Élysées par exemple dans le cas de Radio France), des camions régie pour les autres lieux, ce qui leur permet de développer leurs propres techniques sans se soucier des contraintes d’achat ou de location de matériel des ingénieurs du son indépendants.

Cependant, les radios rencontrent d’autres types de contraintes qui limitent leurs possibilités de développer une esthétique propre. Le rôle principal des radios en ce qui concerne la prise de son d’orchestre est la retransmission de concerts. Cette contrainte du live (que retrouvent aussi les ingénieurs indépendants lorsqu’ils doivent enregistrer des concerts) les oblige à faire certains compromis. En effet, ils doivent obligatoirement suspendre leur système principal (ce qui n’est pas obligatoire lors d’une production sans public) et ainsi ont moins de flexibilité pour le régler. De la même manière, les microphones d’appoint doivent être placés et choisis de manière à ne pas être trop gênants visuellement pour le public. De plus en plus souvent, la captation est aussi une captation vidéo, et cette contrainte visuelle devient encore plus prédominante. D’autre part, ils doivent se plier à la disposition choisie par le chef d’orchestre pour le concert. Enfin, lors des diffusions en direct, le mixage est effectué en stéréo directe, et il n’y a donc pas d’étape de post-production qui permettrait de travailler de manière plus approfondie l’étape du mixage.

Quelques exemples d’enregistrements radiophoniques : (Pistes no 22 à 24)

4.4. Lien entre technique, esthétique et salle

Nous avons vu dans le chapitre 1.2.1 que les salles sont un critère important à prendre en compte quand on parle de technique et d’esthétique de prise de son.

Un nouvel axe de réflexion et d’analyse des résultats des questionnaires peut être proposé. Il s’agit de regarder le lien entre les salles dans lesquelles ont lieu les enregistrements et les techniques utilisées.

Nous avons vu qu’en France, durant les années 60 à 80, durant lesquelles se sont développées la plupart des techniques de prise de son stéréophonique, il n’y avait pas de salle réputée (celles qui sont aujourd’hui réputées ont été construites plus récemment). L’Allemagne comptait en revanche un certain nombre de salles à l’acoustique renommée. Ces salles étaient en particulier des salles en forme de « boîte à chaussures », très adaptées pour accueillir un orchestre symphonique (les salles italiennes et françaises étant généralement plutôt construites sur le modèle du fer à cheval, avec des acoustiques plus sèches, adaptées à l’opéra), mais aussi la salle de la Philharmonie de Berlin, révolutionnaire pour l’époque, et dont on louait déjà l’acoustique. Cette constatation est d’ailleurs confirmée par le fait que la plupart des ingénieurs français interrogés estiment que la contrainte qu’ils rencontrent principalement lors d’un enregistrement est l’acoustique de la salle, alors que les Allemands se plaignent en priorité d’un temps de production trop court.

Cette observation amène à se questionner sur un lien entre les différents types d’acoustique et la qualité des salles, et les techniques et esthétiques développées pour la prise de son. Cette problématique a été soulevée par les ingénieurs (F9) (qui évoque des écoles de prise de son liées aux salles existantes dans chaque pays) et (E1) (qui nous a expliqué avoir deux techniques de prise de son, qu’il choisit d’utiliser en fonction de la qualité acoustique de la salle dans laquelle il travaille). De plus, l’ingénieur (E1) précise que l’utilisation d’un système avec Decca Tree est selon lui extrêmement dépendante de la qualité de l’acoustique, alors que l’utilisation d’un système AB l’est moins.

Nous avons vu d’une part qu’aucun ingénieur du son français n’utilise systématiquement un Decca Tree pour ses prises de son d’orchestre, alors que c’est le cas de plusieurs ingénieurs du son allemands. D’autre part, (E1) explique que dans une salle ayant une bonne acoustique, il utilise un Decca Tree, et dans une salle ayant une mauvaise acoustique, un couple AB avec un plus grand nombre d’appoints. Si on fait un lien entre ceci et la constatation faite précédemment que l’Allemagne possède des salles avec une acoustique plus réputée que la France, on peut proposer une explication à ces choix de système de prise de son. Cette explication (parmi d’autres explications possibles) serait donc que l’absence d’utilisation du Decca Tree par les Français serait due à la mauvaise qualité acoustique des salles.

Un deuxième élément peut aussi intervenir dans ces observations. Nous avons vu que les ingénieurs allemands favorisent l’utilisation d’appoints cardioïdes sur les pupitres de cordes, alors que la plupart des ingénieurs français utilisent quand ils en ont la possibilité des appoints infra-cardioïdes (voire omnidirectionnels pour certains). La volonté d’utiliser de telles directivités en France, liée pour certains au souhait d’avoir un plus beau timbre sur les appoints, est peut-être liée à une utilisation plus importante de ces appoints dans le mix (le système principal étant trop dépendant de la qualité de la salle). Cependant, on peut aussi avoir une autre explication à ce choix de directivité sur les appoints, qui est le goût prononcé des Français pour la notion de timbre, comme nous l’avons vu dans le chapitre 3.1.6.

Il sera intéressant de voir comment ces techniques vont évoluer. En effet, nous avons vu que ces techniques se sont principalement développées avant les années 1990. Or, les salles françaises à l’acoustique réputée sont plutôt récentes (Arsenal de Metz, Auditorium de Dijon, prochainement peut-être la Philharmonie de Paris ou le nouvel Auditorium de la Maison de la Radio si leur acoustique est réussie, …). Elles n’ont donc pour le moment pas pu accompagner de véritable modification des techniques de prise de son en France. Il n’est cependant pas exclu que ces salles aient dans les années à venir un impact sur ces techniques.

4.5. Mobilité des ingénieurs du son

De nos jours, les ingénieurs du son sont beaucoup plus mobiles qu’autrefois, et beaucoup d’entre eux travaillent de temps à autre à l’étranger (avec leurs propres équipes ou avec des équipes locales).

En particulier, la quasi-totalité des ingénieurs du son interrogés indiquent avoir travaillé dans des pays européens. Il y a donc une très bonne circulation des ingénieurs en Europe, ce qui peut expliquer ce processus d’uniformisation de l’esthétique et des techniques qu’ont décrit plusieurs ingénieurs du son en réponse au questionnaire.

Cependant, si cette circulation est très bonne en Europe, seuls 4 ingénieurs parmi les 25 interrogés indiquent avoir parfois travaillé aux États-Unis, en Asie ou en Amérique du Sud. Les échanges avec d’autres continents semblent donc beaucoup plus limités.

De la même manière, les étudiants européens qui souhaitent effectuer une partie de leurs études à l’étranger le font généralement dans le cadre du programme Erasmus. Les échanges se font donc principalement (pour des raisons de proximité aussi) entre les pays européens.

D’autre part, les radios européennes (et de quelques pays proches de l’Europe) sont regroupées dans l’UER (Union Européenne de Radio-télévision), et proposent des programmes communs. De plus, des programmes de recherche sont mis en place en collaboration entre différentes radios européennes (par exemple actuellement Radio France et la BBC collaborent pour des recherches sur le binaural).

On peut donc se demander si les techniques et esthétiques de prise de son d’orchestre s’uniformisent dans le monde entier ou bien si ce processus de mélange des techniques se fait seulement en Europe. Cette piste de recherche n’a pas été étudiée dans ce mémoire, centrée sur les pratiques européennes, mais pourrait être intéressante à approfondir.

Conclusion

Ce travail de recherche a permis d’effectuer un état des lieux de la prise de son d’orchestre de nos jours en Allemagne et en France, ainsi qu’un aperçu des pratiques en Angleterre.

L’étude a montré que la notion d’esthétique de label est de nos jours beaucoup moins présente que jusqu’à la fin des années 1980. Cependant, un certain nombre de pistes de réflexions a pu être exploré.

Nous avons vu comment l’évolution du marché discographique a entraîné la disparition de ces esthétiques de label, mais aussi comment l’apparition de nouveaux labels associés à des orchestres permettra peut-être de faire apparaître de nouvelles identités sonores. De plus, les grosses structures comme les radios ont encore la possibilité de développer leurs propres caractéristiques sonores, car leurs équipes peuvent bénéficier de la transmission interne, et ces équipes travaillent très souvent avec le même matériel, dans les mêmes salles, avec les mêmes orchestres, …

Il serait intéressant d’étudier de manière plus précise et chiffrée l’évolution des conditions de production, des budgets attribués à une production musicale et la durée moyenne d’une production discographique. Cette étude n’a pas pu être menée dans le cadre de ce mémoire, car elle n’entrait pas dans le cadre des choix purement techniques et esthétiques de prise de son. L’évolution représente cependant un aspect important de l’état des lieux des pratiques de prise de son d’orchestre, et pourrait à ce titre être l’objet d’un travail de recherche complémentaire.

Nous avons aussi étudié les particularités de ce qui correspondrait à des « écoles nationales », bien que l’existence de ce type d’école de prise de son fasse débat parmi les ingénieurs du son : un type de salle plus répandu dans un pays que dans un autre, une attention particulière portée à certaines caractéristiques sonores…

Si les recherches ont été menées sur un nombre suffisant de sujets pour être représentatives des pratiques en Allemagne et en France, elles ne sont en revanche pas du tout généralisables en ce qui concerne l’Angleterre, le nombre de participants anglais au questionnaire étant trop faible. Cette recherche pourrait donc être complétée par une étude des habitudes d’un plus grand nombre d’ingénieurs du son anglais, mais aussi par un état des lieux des pratiques dans d’autres pays européens (Italie, Autriche, Russie). D’autre part, nous avons vu qu’il existe une bonne circulation des ingénieurs en Europe, mais il faudrait étudier les pratiques dans d’autres régions du monde (États-Unis, Asie, …) afin de voir si elles diffèrent des pratiques européennes.

Il serait aussi intéressant d’élargir ces recherches à d’autres types de formations (musique de chambre, opéra) pour voir si ces réflexions sont aussi valables dans ces genres instrumentaux.

Bibliographie
1. Colin Lawson. The Cambridge Companion to the Orchestra. Cambridge University Press, 2003.
2. Dictionnaire de la Musique. Larousse, 2005.
3. D. Kern Holoman. The Orchestra – A very short introduction. Oxford University Press, 2012.
4. Christian Merlin. Au cœur de l’orchestre. Fayard, 2012.
5. Rencontre avec philippe muller. Journal de l’Association Française du Violoncelle, (26), 2008.
6. Sylvie Pébrier. La notion d’école et la mondialisation. Musique et Mondialisation, Cité de la Musique, Octobre 2009.
7. Elisabeth Kemper. Realisierbarkeit und Beurteilung ästhetischer Klangkonzepte bei klassischen Musikaufnahmen. Master’s thesis, Erich-Tienhaus-Institut der Hochschule für Musik Detmold, 2007.
8. Halls for Music Performance – Two Decades of Experience 1962-1982. Acoustical Society of America.
9. Halls for Music Performance – Another Two Decades of Experience 1982-2002. Acoustical Society of America.
10. Leo Beranek. Concert and Opera Halls – How they sound. Acoustical Society of America, 1996.
11. Site officiel de l’Arsenal de Metz. http://www.arsenal-metz.fr/ dernière consultation : 23-05-2014.
12. Site officiel de l’Opéra de Dijon. http://www.opera-dijon.fr/opera-de-dijon/auditorium/ dernière consultation : 23-05-2014.
13. Site officiel de la Philharmonie de Paris. http://www.philharmoniedeparis.com/ dernière consultation : 22-05-2014.
14. François Delalande. Le son des musiques. Entre technologie et esthétique. Editions Buchet/Chastel, 2001.
15. Colin Symes. Setting the record straight – A material history of classical recording. Wesleyan University Press, 2004.
16. Denis Mercier. Le livre des techniques du son – Tome 3. Editions Eyrolles, 1993.
17. Rémy Louis, Thierry Soveaux, and Olivier Boruchowitch. Une vision de la musique : l’histoire de la Deutsche Grammophon. Editions Verlhac, 2009.
18. The Decca Sound. livret accompagnant le coffret de disques The Decca Sound, 2011.
19. The Decca Sound : Secrets Of The Engineers. site internet The Polymath Perspective. http://www.polymathperspective.com/?p=2484. dernière consultation 20-05-2014.
20. Eberhard Sengpiel. Decca Tree Recording mit Neumann-Druckempfängern M50. disponible sur le site www.sengpielaudio.com (dernière consultation mars 2014).
21. Page web présentant l’histoire de Mercury Living Presence et d’autres labels. http://www.soundfountain.com/amb/mercury.html. dernière consultation : 20-05-2014.
22. Louis Bricard. Vingt préconisations pour la survie des disques de musique classique. 2004.
23. Deutsche Grammophon. Yellow Book, 07-2013 edition.
24. Site officiel du LSO Live. http://lso.co.uk/about-lso-live. dernière consultation : 20-05-2014.
25. Site officiel du Berliner Philharmoniker. https://www.berliner-philharmoniker-recordings.com. dernière consultation 20-05-2014.
Annexe A : Ingénieurs du son interrogés

Liste des participants :
- Jonathan Allen
- Brigitte Angerhausen
- Cyril Bécue
- Laure Casenave
- François Eckert
- Jean-Martial Golaz
- Wolfram Graul
- Hannelore Guittet
- Bardo Kox
- Pierre Lavoix
- Jean-Pierre Loisil
- Paul Malinowski
- Wilhelm Meister
- Jean-Christophe Messonnier
- René Möller
- Aude-Marie Piloz
- Christian Schmitt
- Eberhard Sengpiel
- Pierre-Antoine Signoret
- Philip Siney
- Günther Wollersheim
- + 4 participants préférant rester anonymes
Annexe B : Questionnaire

Dans le cadre de mon mémoire de fin d’étude sur la prise de son d’orchestre, je vous sollicite afin de réunir les opinions et les habitudes de travail d’ingénieurs du son et directeurs artistiques venant de divers horizons en Europe.

Si vous souhaitez joindre à vos réponses des documents qui vous aident à illustrer vos propos (documents de production, patchs, photos, ou autre), n’hésitez pas à le faire.

Formation
1. Quelle est votre formation ? Avez-vous parachevé votre formation auprès d’un professionnel ou d’une structure comme assistant ou avez-vous tout de suite été autonome ?
2. Cette formation, ce compagnonnage sont-ils à l’origine de vos choix esthétiques ou aviez-vous des idées ou influences précises que vous avez cherché à réaliser et développer ?
Esthétique de la prise de son d’orchestre
1. Quel est votre goût en matière de prise de son ? Vous sentez-vous libre de l’exprimer ou êtes-vous parfois contraint par l’environnement, les artistes, les maisons de disques ?
2. Cherchez-vous à vous inscrire dans une continuité esthétique ? Votre esthétique a-t-elle évolué pendant votre carrière ? (mode ? évolution personnelle ?)
3. Durant votre carrière, vous avez travaillé pour une ou plusieurs structures de manière régulière (label, radio, studio).
Pour chacune, indiquez la période, le nom de la structure, et répondez à la question suivante : Pensez-vous que ce label/radio/studio a développé une esthétique sonore particulière ? Si oui, comment s’est-elle développée (volonté assumée par les ingénieurs/par la hiérarchie, habitudes/formation des équipes, contraintes économiques,…) ?

À quoi la reconnait-on selon vous ?
1. Pensez-vous qu’il existe aujourd’hui des écoles de prise de son (par pays, par maison de disque, par type de media : CD/radio, ou autre) ? Qu’est ce qui les caractérise ?
2. Avez-vous le sentiment d’appartenir à une de ces écoles ?
Habitudes de travail
1. Quelle est votre configuration habituelle pour une prise de son d’orchestre symphonique (de type symphonie de Beethoven) ?
Vous pouvez par exemple préciser le type de salle utilisée (salle de concert, studio,…), le système principal utilisé (nombre de micros, type de micros, directivité, espacement, etc), si vous utilisez des microphones d’ambiance et/ou des microphones d’appoints, …

Ou encore : plutôt prise de son lointaine ou proche ? Choix des appoints complémentaires ou homogènes avec le système principal ? Importance de la phase (remise en phase des micros systématique, occasionnelle) ?
1. Quels outils utilisez-vous habituellement pour le mixage ? (réverbération artificielle, delays, EQ, compression/suivi dynamique, …)
Préciser : suivi des appoints dans les solos d’orchestre ou mix statique ? Réalisme ou image spectaculaire ? (Par exemple, est-ce gênant d’avoir une image extra-large, ou des cuivres très stéréo et très larges, ou des harpes larges ?). Dans le cas d’une œuvre avec soliste(s), préférez-vous mettre le(s) soliste(s) en avant, ou plutôt respecter l’équilibre naturel ?
1. Classez ces critères par ordre d’importance selon vous : respect de l’image sonore (largeur, profondeur, localisation, …), espace (réverbération,…), homogénéité, définition, timbre, équilibre spectral, balance, dynamique, naturel, recherche de spectaculaire, autres critères (à préciser)
2. Êtes-vous plutôt influencé par la tradition symphonique, ou par la musique de film ?
3. Quelles contraintes vous limitent habituellement (contraintes de temps, choix de la salle, matériel disponible, taille de l’équipe d’enregistrement,…) ? Que changeriez-vous si ces contraintes n’existaient pas ?
Questions complémentaires
1. Quels autres critères influencent le son selon vous ? (chef d’orchestre, orchestre, organisation de l’équipe, goût des auditeurs/de la critique, effets de mode, …)
2. Avez vous travaillé à l’étranger, avec des équipes étrangères ? Quelle expérience en tirez-vous ? Sentez-vous des différences importantes (organisation, façon de travailler, esthétique sonore) ?
3. Avez-vous un enregistrement d’orchestre favori ? (pour le son)
Êtes-vous (ou avez-vous été) influencé par certains enregistrements dans vos choix esthétiques ? Lesquels ?

Préférez-vous que votre participation reste anonyme, ou m’autorisez vous votre nom dans mon travail si nécessaire ?

Acceptez-vous que je vous recontacte pour des précisions si nécessaire ?

Je vous remercie pour votre patience et votre aide !

Elsa Desjardins

Annexe C : Critères d’écoute
- Œuvre
- Compositeur
- Orchestre
- Chef d’orchestre
- Lieu d’enregistrement
- Date d’enregistrement
- Label Ingénieur du son
- Directeur artistique
- Remarques (enregistrement live, …)
Analyse sonore (d’après Guy Laporte, Radio France)
- Largeur
- Premier plan de prise de son
- Profondeur
- Relief
- Localisation
- Acoustique (niveau et longueur de réverbération, couleur de la salle, taille apparente de la salle, …)
- Homogénéité
- Balance
- Équilibre spectral
- Timbres
- Définition
- Intelligibilité
- Dynamique
- Transparence
Annexe D : Caractéristiques de quelques salles européennes

Le tableau suivant a été réalisé en réunissant des éléments des ouvrages suivants (ainsi que les sites internet de certaines salles décrites) :
[8] : Halls for Music Performance – Two Decades of Experience 1962-1982. Acoustical Society of America.
[9] : Halls for Music Performance – Another Two Decades of Experience 1982-2002. Acoustical Society of America.
[10] : Leo Beranek. Concert and Opera Halls – How they sound. Acoustical Society of America, 1996.
Remerciements

Je tiens à remercier chaleureusement Thomas Dappelo, mon directeur de mémoire, pour ses précieux conseils, son investissement et ses encouragements qui m’ont permis de mener à bien ce travail.

Merci à toutes les personnes qui par leur collaboration ont permis la réalisation de ce mémoire, à commencer par les ingénieurs du son ayant répondu à mon questionnaire, ceux qui par leurs discussions ont fait mûrir ma réflexion, et aux musiciens qui m’ont renseignée sur les spécificités de certains orchestres ou instruments particuliers.

Merci à Daniel Zalay et François Eckert, grâce à qui j’ai pu contacter un grand nombre de professionnels renommés et effectuer des stages très enrichissants en Allemagne.

Merci aux différents ingénieurs du son indépendants et structures qui m’ont permis d’expérimenter par la pratique les problématiques liées à la prise de son d’orchestre, en particulier Kali Son, le studio Teldex, la Westdeutscher Rundfunk et Radio France.

Merci à Laetitia Dimitriu, Simona Florescu et Volker Haller qui m’ont aidée lorsque j’ai rencontré des difficultés de traduction anglaise ou allemande.

Merci à la FSMS, à ses professeurs et à ses étudiants (particulièrement à la promotion 2010 : Guilhem Angot, Pierre Blaise, Thibaud Lalanne, Jonathan Lefèvre, Guillaume Le Hénaff, Yoann Saunier et Ken Yoshida) pour ces quatre belles années riches en expériences et en apprentissages. Une pensée particulière pour Guillaume Jay avec qui j’ai partagé de longues journées de travail durant la rédaction de ce mémoire.

Un grand merci enfin à mes proches et ma famille pour leur soutien sans faille.

Notes
1. On peut partir de deux postulats différents : que l’orchestre est un ensemble de musiciens, ou que l’orchestre est un instrument en soi. La distinction est en fait la même qu’entre l’orchestre en tant qu’institution et en tant que corps musical. (Cette citation a été conservée en anglais dans le texte car la subtilité de langage corporation/corporate disparaissait lors de la traduction). ↩︎
2. The warm, intimate sound of the hall itself, allowing the players not to force. Delicate, nuanced string playing sometimes called silver or velvety. Long associations with the symphonies of Bruckner and Mahler. Sophisticated percussion. ↩︎
3. Voluptuous, highly refined readings, typically ascribed to Herbert von Karajan’s instruction that left-hand vibrato was to begin before the bow touched the string. Loud, throaty brass. ↩︎
4. The “Chicago brass” : a grandeur and technical perfection ascribed variously to the conductor Fritz Reiner and to the principal trumpet player, Adolph Herseth, and tubist, Arnold Jacobs. ↩︎
5. Technical perfection, careful attention to dynamic contrasts, studied orchestral counterpoint often called transparent, and a lean, European sonority. George Szell drilled every nuance of his readings into the players during relentless rehearsals, with trademark results to be heard on an impressive discography. ↩︎
6. High-spirited extrovert readings, celebrated soloists in the ranks (James Galway, flute; Gervase de Peyer, clarinet; Barry Tuckwell, horn). Flexibility in adapting to its many distinguished visiting conductors. Film scores. ↩︎
7. Seamless string phrasing (the “Philadelphia sound”, “Those fabulous Philadelphians”). Often said to be a response to the dry acoustics of the orchestra’s former home, the Philadelphia Academy of Music ; accomplished in part by subtle overlapping of bow changes. ↩︎
8. Instruments unique to Vienna. The Vienna oboe and rotary-valve brass are small-bored with a delicate, focused quality. String instruments belong to the orchestra, not the players, and thus are handed down from generation to generation. The purity and ongoing tradition of the sound was long attributed, also, to gender and racial purity of the white European male musicians. ↩︎
9. The advent of broadcasting and recording has served to fix a standard and idealized orchestral sound. An inevitable consequence of these developments is that many orchestras have lost the distinctive elements of timbre that remained unique to certain countries before the First World War. ↩︎
10. In jedem Fall ist der Einfluss des Tonmeisters auf die Klanggestaltung größer als der des Aufnahmeraums, des Dirigenten und des Orchesters. ↩︎
11. In classical music circles, […] they never threw over the idea that the concert was the ultimate arti-culation of music and that the phonograph should defer to it. Modes of representing classical music on disc that have abandoned this concert benchmark have tended, with rare exceptions, to be marginalized. ↩︎
12. Where purist producers talk of balancing different sound sources to create a faithful impression of the original soundstage, the creative producer talks of mixing sound sources without aiming at fidelity. ↩︎
13. Es muss “natürlich” bleiben. ↩︎
14. My taste in recording sound is to reproduce a natural sounding performance ↩︎
15. eher „spektakulär“, allerdings immer so, dass es natürlich erscheint ↩︎ch erscheint ↩︎
16. I do not believe in trying to capture ‘the best seat in the house’, which is an (misguided and
  fallacious) argument one often hears. ↩︎
17. In a concert environment the eye focuses the ear. ↩︎
18. Das Klangbild ist ein Bild. Es soll zeigen, was der Zuhörer GLAUBT, gehört zu haben (in Wirklichkeit hat er ja gehört, gesehen, erlebt, plus ? ? ?). ↩︎
19. Ich mag direkte, effektvolle und spektakul¨are Aufnahme, die nicht allzu r¨aumlich ist, ohne dabei
  den warmen, offenen Klang zu verlieren… ↩︎
20. It’s the engineer’s job to create the illusion of reality. The recorded sound should engage and excite the listener, who does not have the experience of the live environment. ↩︎
21. Es gibt 2 große Quellen meiner ¨asthetischen Kriterien in zwei Kursen w¨ahrend des Studiums. In
  einem Kurs haben wir [. . . . über eine fantastische Anlage Musik aus allen Genres gehört, [. Verglichen wurden Aufnahmeästhetiken unterschiedlicher Orchester an unterschiedlichen Spielorten. Gelernt haben wir nur auf den Bass, nur auf die räumliche Darstellung, die räumliche Tiefe, nur auf die Auflösung der Höhen usw. Zu konzentrieren. Des Weiteren ein Kurs über Akustik. Im Rahmen des Kurses haben wir in insgesamt 10 Tonstudios unterschiedlichster Größe mit demselben Musiker und Mikro dasselbe Stück Gitarrenmusik aufgenommen und auch in der Regie dieselben Aufnahmen verglichen. [. . . ]Diese Arbeit beeinflusst mein Arbeiten in der Musikproduktion bis heute. ↩︎
22. Ja, Detmold ist die Quelle [meiner ästhetischen Kriterien]. ↩︎
23. Das Studium hat Anregungen zur Entwicklung eines eigenen persönlichen Stils in der Klangästhetik gegeben. ↩︎
24. In den 80er Jahren waren die Orchesteraufnahmen sehr pauschal und indifferent; heute suche
  ich einen Klang, [dem] strukturiert und klar, bei m¨oglichst großer R¨aumlichkeit, ist. Heute sind meine Stützmikrophone näher an den Instrumenten, aber sie sind verzögert und das Hauptmikrofon ist stärker.
  in der Mischung. ↩︎
25. Ich unterscheide zwischen objektiven und subjektiven Kriterien ; objektivierbare Fehler
  im Klang (z.B. Balance-, Ortungs- oder Panorama-Fehler) lasse ich nicht zu. ↩︎
26. Phase is never an issue that I worry about – if it doesn’t sound good, I move the mic ↩︎
27. I think there are different schools – probably mostly polarized as multi-microphone vs. Minimalist
  microphone techniques. ↩︎
28. Russian engineers have the reputation of highly focused and vibrant sound. ↩︎
29. and there is certainly a particular ‘style’ for radio engineers – mostly characterized by a main
  configuration of omni microphones [. . . ]I think the radio broadcast engineers are probably aiming for a more ‘natural’ concert sound. ↩︎
30. Radio engineers (especially in Germany) seem to balance a more distant and less defined mix. ↩︎
31. Die EMI liebt Hauptmikrofonaufnahmen in Koinzidenztechnik, weil einer ihrer Ingenieure Alan
  Blumlein war ↩︎
32. Decca had a strong Sound aesthetic – ‘The Decca Sound’. General use of The’ Decca Tree’ recording method involving four or five spaced Omni microphones. Capturing the natural acoustic was the heart of every recording ↩︎
33. [Deutsche Grammophon :] a totally different insight into recording in a more multi microphone technique and use of delay’s to sharpen a recording ↩︎
34. In the great period of recording during the 60’s 70’s I would say EMI/DECCA and DG had definite
  house styles. ↩︎
35. eine « firmenspeziefische Klang¨astehetik » gab es nicht, auch nicht bei der Deutschen Grammophon und bei EMI, obwohl diese genau damit Werbung machten ↩︎
36. in den 90er Jahren f¨ur Denon : ja, da gab es eine Klang¨astethik : mit wenig St¨utzmikros nat¨urliche Raumwirkung erzeugen. Uberhaupt stand hier Nat¨urlichkeit im Vordergrund. ↩︎
37. Hyperion has a reputation for a certain kind of sound. ↩︎
38. Ich habe bisher mit keinem Label gearbeitet, das bestimmte Vorgaben zum Klang gemacht hat. ↩︎
39. Sony Classical. Keine Label¨astethik ↩︎
40. Ich war im Austausch 2 Wochen bei der BBC in London und da arbeitet man genau so wie im
  WDR ↩︎
41. Ich hatte einen Tonmeister von der BBC zu Gast, er wollte alle Instrumenteneins¨atze geregelt haben (St¨utzen). ↩︎
42. Ja, ich finde der WDR bzw. die deutschen Rundfunkanstalten haben eine eigene Klang¨asthetik
  (gegen¨uber z.B. Holland, oder England, oder den USA oder Japan) ↩︎
43. WDR : keine char. Asthetik. ↩︎
44. Die Arbeit als Tonmeister beim Bayerischen Rundfunk hat mir diese Unabh¨angikeit stets gew¨ahrt ↩︎
45. NDR Hamburg, Nein, Klang¨asthetik, eher abh¨angig von Tonmeister- und Toningenieur als von der Institution. BR M¨unchen, wahrscheinlich ja, habe ich pers¨onlich zur Zeit noch zu wenig Erfahrung. ↩︎
46. choice of venue obviously played an important part in the sonic success ↩︎
47. die Akustik des Aufnahmeraumes [hat] meines Erachtens mehr Einfluß auf den Klang als die Idee
  der Asthetik, der die genaue Wiedergabe der Partitur zugrunde liegt. ↩︎
48. Es entwickeln sich vergleichbare Klangbilder, wenn man immer im selben Saal aufnimmt. ↩︎
49. Each were characterised mainly by the acoustics they used – EMI had Abbey Rd studios / DECCA
  had some of the finest concert halls / DG had some wonderful acoustics particularly in Berlin like Jesus Khriste Kirche in Dahlem. ↩︎
50. The idea is to achieve a good overall sound picture by correct placement of the main 5 omni mics.
  Spot mics are used to bring a touch of focus to the various sections rather than being totally relied upon. The above technique is totally dependent on a good natural acoustic being present in the venue. ↩︎
51. Time is the biggest problem. Today you must have the sound right from the start. . . but the best
  recordings are where you can listen in the room and have time to adjust the microphones. ↩︎
52. Zeitmangel kann dazu f¨uhren, dass ich die Mikrofonpositionen nicht optimieren kann ↩︎
53. Man m¨usste mehr Zeit haben, aber das ist zu teuer…. ↩︎
54. Im heutigen Musikproduktions und Konzertbetrieb spielt der Zeitfaktor eine immer gr¨oßere Rolle.
  Zeit ist teuer. Das bringt das Team unter Druck. Vieles muss heute auf die Nachbearbeitung geschoben werden, was fr¨uher in der Aufnahmezeit erledigt werden konnte. ↩︎
55. Spot microphones are to be delayed in the mix according to their respective distance to the main microphone array. Ideally a “click take” should be recorded for each microphone setup during the recording. ↩︎
mai 19, 2026