Blog

La séparation de sources pour le remixage en son immersif de masters monophoniques des années 1950-60

Comment servir et écouter aujourd’hui les trésors musicaux du passé ?

Par : Jean Viardot

Formation Supérieure aux Métiers du Son Directeur de mémoire : Valentin Bauer, Octobre 2023

Résumé

Les musiques afro-américaines des années 1950-60 ont influencé jusqu’à aujourd’hui plusieurs générations d’artistes. Pourtant, leurs enregistrements originaux ne sont plus aussi largement écoutés qu’autrefois. Le grand public ayant été formé à une écoute stéréophonique de haute définition, écouter des masters monophoniques au rendu bruité, déséquilibré et étriqué peut aussitôt sembler inhabituel, non spontané. C’est pourquoi, dans l’engouement suscité par l’audio immersif, notre étude cherche à savoir dans quelle mesure remixer en son immersif des masters monophoniques de blues, R&B et soul des années 1950-60 peut faire sens aujourd’hui sur le plan musical, culturel et historique.

Nous concevons une première expérience réunissant 24 ingénieurs du son, musiciens et experts du répertoire ciblé. Par un entretien semi-dirigé, une séance d’écoute avec questionnaire et une séance de remixage en son spatialisé de trois morceaux de blues, R&B, soul, elle vise à évaluer les comportements de réflexion, d’écoute et de remixage vis-à-vis de masters originaux des années 1950-60. Parmi les principaux résultats, les participants estiment pour deux morceaux que leur propre remixage favorise davantage la musique que le master original. Nous identifions le master original entravant le plus selon eux le message musical délivré, et nous en réalisons un remixage en son immersif, fidèlement à leurs commentaires et à leurs actions.

Dans une seconde expérience, un premier test d’écoute comparative du master original et de notre master remixé vise à connaître l’intérêt musical et culturel de présenter celui-ci au grand public. Huit professionnels de l’industrie phonographique jugent notre remixage respectueux de la musique, valorisant l’arrangement et susceptible de plaire. Le second test vise à connaître la préférence de 45 consommateurs de musique entre les deux versions. Une large majorité préfère écouter la chanson dans notre remixage, aurait envie de l’écouter plus souvent ainsi et de profiter en son immersif des autres chansons du label.

Abstract

African American music from the 1950s-60s has influenced various generations of artists. However, nowadays, consumers do not listen to these original recordings as widely as before. Being used to listening to high-fidelity stereo recordings, they may have difficulties listening to noised, disturbed, or tight mono recordings. Therefore, amid the current immersive audio craze, our study aims to understand how remixing in immersive audio 1950s-60s mono blues, R&B, soul recordings may be meaningful today, on the musical, cultural and historical levels.

Our first experiment gathers 24 sound engineers, musicians and experts of this musical repertoire. It aims to assess thinking, listening, and remixing behaviors towards the 1950s-60s original masters, through a semi-structured interview, a listening session with a questionnaire, and a spatialized audio remixing session of three blues, R&B, and soul recordings. Among the main results, regarding two songs, the participants think that their remix better fits the music than the original master. After identifying the worst original master with respect to the musical purpose according to them, we have remixed it in immersive audio, faithfully to their comments and actions.

In our second experiment, a comparative listening test between the original master and our new immersive audio master aims to understand the musical and cultural point to be able to introduce it to a wider audience. Eight experts from the phonographic industry assess that our remixed master respects the music, highlights the instrumental arrangement and would appeal to people. A second test aims to find out the preference between both versions of 45 music consumers. By an overwhelming majority, the participants prefer to listen to our immersive remix. Furthermore, they would like to listen to this song more often in the immersive format, and call for listening to other songs from the label in the same immersive audio conditions.

Introduction

La restauration par intelligence artificielle d’images captées au début du XXᵉ siècle⁣¹ détient le pouvoir de faire émerger en chacun de nous une nouvelle réflexion sur le temps passé. Empreint d’un réalisme inédit, ce nouvel objet nous livre en effet de cette époque une vue en tous points différente de celle que notre mémoire lui connaissait. La temporalité jusque-là évidente d’un film devient soudain sous-jacente. Au premier regard, la haute définition et le fluide enchaînement de ses images nous laissent logiquement croire à un film actuel. Mais l’instant suivant, des signes évidents d’un passé plus lointain (vêtements, accessoires, coiffures) contrarient notre première impression. Dès lors, un phénomène psychique survient en nous : la dualité époque passée (réalité) / époque simultanée (apparence). C’est cette dualité qui trouble l’œil et l’esprit, nous fait perdre la notion du temps et de l’espace, nous rend momentanément autre.

À la lumière de cette révolution technique, pouvons-nous croire à une expérience sensorielle analogue dans le domaine de l’audio ? Pouvons-nous, en remodelant le son d’un enregistrement monophonique, entendre nous situer soudain devant les musiciens de la séance, être instantanément projetés plusieurs décennies en arrière entre les murs du studio d’enregistrement ? En retravaillant l’aspect de l’objet qu’est l’enregistrement, on pourrait au moins espérer percevoir et apprécier autrement son contenu musical. Certes l’objectif est ambitieux ; mais certains procédés actuels, comme la séparation de sources et le mixage en son immersif, entretiennent aujourd’hui l’espoir de nous le faire vivre.

Toutefois, avant de songer à une quelconque expérience perceptive, il est nécessaire d’examiner le bien-fondé de cette démarche au travers d’une étude pratique et approfondie. Ce projet soulève en effet dans plusieurs domaines d’importantes questions, que nous aborderons.

Au vu de ce que nous avons évoqué, deux grandes problématiques se présentent à nous :

Dans quelle mesure remixer en son immersif des masters monophoniques fait-il sens aujourd’hui sur le plan culturel, historique et artistique ?
Cette démarche de travail répond-elle à une envie particulière des consommateurs actuels vis-à-vis des enregistrements anciens ?

Dans l’histoire de l’enregistrement musical, la période 1950-60 constitue une époque charnière. Pour la première fois en effet, le preneur de son ne dispose plus d’une seule empreinte sonore possible pour l’enregistrement d’une œuvre – celle imposée auparavant par la gravure directe sur le disque – mais d’un tout premier nuancier de couleurs sonores, grâce notamment à l’éclosion de l’enregistrement magnétique. L’une d’elles est ainsi choisie pour incarner finalement, en lien étroit avec l’œuvre et le style musical à enregistrer, l’esthétique sonore de l’enregistrement. Cette période est aussi extrêmement fertile musicalement. Dans le dur contexte de ségrégation raciale sévissant aux États-Unis, plusieurs artistes de blues, de rhythm and blues (R&B) et de soul s’installent très vite au sommet du paysage musical populaire. Grâce aux nouvelles techniques d’enregistrement, le caractère perpétuellement organique et créatif de leur musique transpire aussi désormais au travers d’esthétiques sonores bien caractéristiques.

Mais tout en pouvant considérer que la plupart des enregistrements de blues, R&B et soul des années 1950-60 ont été réalisés avec beaucoup de clairvoyance et une certaine maîtrise d’un matériel d’enregistrement certes en progrès mais encore limité, pensons-nous forcément pour autant que tous témoignent d’un rendu sonore « idéal » vis-à-vis de la musique annoncée ? Pensons-nous forcément que le rendu sonore de ces masters originaux est en tous points conforme à la manière dont l’œuvre a été pensée, composée, arrangée et interprétée ? Croyons-nous qu’il est vraiment celui qui place le potentiel de ressenti de l’œuvre à son plus haut niveau ? Cela concerne tant le respect et la mise en valeur de l’esthétique musicale, de la composition et de l’arrangement qui ont été pensés et organisés consciemment par les artistes, que le jeu d’interprétation et le son spécifique de chacun des musiciens de la séance.

Ces interrogations, orientées vers la problématique a, figurent au centre d’une première expérience que nous consacrons à trois masters originaux du répertoire cité. Celle-ci vise à étudier les comportements de réflexion, d’écoute et de remixage, lors d’une séance de remixage particulière. Nous obtenons les pistes séparées de ces enregistrements, inexistantes à partir des premiers magnétophones, grâce à une technologie récente de séparation de sources basée sur l’intelligence artificielle. Ce test, qui réunit ingénieurs du son, musiciens et experts musicaux du répertoire concerné, vise donc précisément à analyser leur évaluation du rendu sonore de ces masters originaux (Q.R.1) et de leurs masters remixés (Q.R.3) vis-à-vis de la musique, leur degré d’engagement dans la séance de remixage (Q.R.2) et la cohérence entre leurs réponses émises à l’entretien préliminaire et leurs choix de remixage (Q.R.4).

Cette première expérience donnera naissance à une seconde qui s’attachera à répondre à la problématique b. Nous tirerons en effet des remarques des participants de la première expérience l’enregistrement présentant le rendu sonore le moins en accord avec ce que suggère selon eux la musique. Nous en réaliserons un remixage en son immersif, fidèlement aux caractéristiques musicales relevées et aux choix de remixage privilégiés par l’ensemble des participants. Finalement, nous organiserons un test d’écoute comparative entre la version sonore originale de cette chanson et notre version remixée. Dans un premier test, nous solliciterons l’expertise de producteurs musicaux, de réalisateurs artistiques et d’ingénieurs du son pour savoir si notre version remixée présente aujourd’hui un intérêt culturel et musical à être entendue par le grand public, et si elle pourrait prétendre à être commercialisée aux côtés de la version originale (Q.R.5). Puis, dans un second test d’écoute comparative, nous demanderons à une partie du grand public (musiciens, non musiciens et experts du répertoire concerné) à travers laquelle des deux versions sonores ils préfèrent écouter cette chanson (Q.R.6).

Ainsi, nous serons en mesure de conclure notre étude sur le degré de pertinence musicale, culturelle et historique que présente aujourd’hui l’action de remixer en son immersif un master monophonique de blues, R&B ou soul produit dans les années 1950-60 (a). En plus de cela, nous pourrons savoir si cette nouvelle approche de travail répond en fait à une envie particulière des consommateurs actuels vis-à-vis des enregistrements anciens (b).

Notre étude s’organise donc en trois temps : une revue de littérature des principaux thèmes évoqués, l’expérience n°1 répondant à la problématique a, et l’expérience n°2 complétant la réponse à la problématique a et traitant la problématique b. Dans une discussion finale, nous confronterons les résultats de nos expériences avec les données issues de la littérature pour enrichir notre réponse aux problématiques a et b.

I. État de l’art

A. Enregistrer et écouter la musique blues/R&B/soul dans les années 1950-60 : allier organicité musicale et nouvelles techniques d’enregistrement

Nous proposons dans cette première partie une plongée dans les années 1950-60 au cœur de l’enregistrement musical aux États-Unis. Comme notre étude souhaite évaluer l’intérêt de remixer en son immersif la musique blues/R&B/soul de cette période, nous chercherons ici à comprendre ce qui fait son essence et comment les ingénieurs du son exploitent les nouvelles techniques sonores pour l’enregistrer tout en calibrant leur produit aux modes d’écoute du grand public.

1. Exprimer son identité noire dans la musique afro-américaine

Malgré l’abolition de l’esclavage, les États du Sud ne reconnaissent pas les amendements de la Constitution des États-Unis qui établit depuis 1870 l’égalité des droits civiques entre tous les citoyens américains. À travers les lois Jim Crow, ils instaurent jusqu’au milieu des années 1960 une politique de ségrégation raciale entre les Blancs et les Noirs dans tous les lieux publics (Poole, 2014). Celle-ci s’opère jusque dans les magasins de disques, dont les premiers ouvrent dans les années 1920. On y trouve alors des « pop records », des enregistrements de musique interprétée « par et pour les Blancs », et des « race records », similairement pour les Noirs (Pirenne, 1994). Notons pourtant que de nombreux Blancs américains se procurent assez tôt certains de ces « race records ». Les musiciens noirs y affirment leur identité dans trois genres dominants, le blues, le rhythm and blues et la soul, qui impliquent alors des moyens d’expression différents.

1) Le blues

Le blues naît bien avant l’industrie discographique. Il puise dans son essence dans les work songs² récités par les esclaves et travailleurs noirs durant la deuxième moitié du XIXᵉ siècle, en particulier la période esclavagiste (Woods, 2017). Bien que son style s’en éloigne dès les années 1920, notamment par l’emploi de la guitare acoustique, il en conserve l’idée de posséder peu pour exprimer beaucoup.

Traditionnellement, le Delta blues du Mississippi ne fait appel qu’à un chanteur-guitariste comme Robert Johnson qui, avec un lyrisme très organique, exprime toute la douleur, la plainte et l’amertume du peuple noir (Ausseil et al., 1995). Le tempo souvent lent mais appuyé traduit l’envie de voyager mais la difficulté pour y parvenir. Il s’accélère parfois sous la forme d’un boogie pour alléger le propos. De plus en plus, des instruments tels que la contrebasse, le piano, les vents (clarinette, saxophone, trompette, trombone), et des chœurs viennent s’ajouter à la voix (Bessie Smith, Georgia White) et à la guitare (parfois remplacée par le banjo) pour donner plus de poids aux sentiments véhiculés (Jolibert, 2002). Le blues migre ensuite à Chicago à l’aube des années 1950 (Muddy Waters, Howlin’ Wolf), où l’instrumentarium s’électrifie aussitôt, à l’image de la guitare, soliste désignée avec l’harmonica (Bas-Rabérin, 1973). Pour compenser cette nouvelle puissance de l’orchestre, la batterie apparaît. Par la douleur qu’il continue d’exprimer en fond, le blues s’exporte ensuite au-delà des frontières américaines.

Figure 1 : Muddy Waters (Source : https://digital.nepr.net) — *Figure 1 : Muddy Waters*
*(Source : https://digital.nepr.net)*

2) Le rhythm and blues

Révélé aux États-Unis au début des années 1940, le rhythm and blues est une définition musicale d’après-guerre de la population noire américaine. Bien que le terme, abrégé R&B, puisse être traduit par l’expression « rythme et mélancolie », les musiciens de ce courant entendent donner beaucoup plus de poids au rythme qu’au blues souffreteux (Hofstein, 1991). Avec cette énergie portée sur un texte plus léger et plus drôle, ils veulent faire oublier le quotidien discriminatoire que subit la population noire depuis plusieurs décennies (Hofstein, 1991). Pour lancer ce courant effervescent, ces musiciens réunissent les marqueurs de trois genres inhérents à la musique noire : le rythme du jazz, le lyrisme du blues, et bien sûr le chant gospel, qui réunit à lui seul ces deux attributs (Ripani, 2006). C’est en 1949 que Jerry Wexler, bientôt producteur d’artistes R&B chez Atlantic Records, baptise le « rhythm and blues » dans le magazine Billboard, bannissant le terme discriminatoire de « race music » (Pirenne, 1994).

*Figure 2 : Ray Charles(Source : https://www.deezer.com)*

La batterie, la contrebasse (bientôt basse électrique), le piano et parfois la guitare électrique forment le socle rythmique. Et inspirée des big bands swing, la section de cuivres (au moins un saxophone et une trompette) égaient le répertoire en dialoguant avec la voix principale. Des artistes remuants tels que Fats Domino, Big Joe Turner et Ray Charles viennent ainsi au tournant des années 1950 donner un souffle nouveau à toute la musique américaine. C’est ce courant en particulier qui entraîne dans son sillage l’émergence du rock’n’roll (Garofalo, 2002).

3) La soul

La soul se construit dès le milieu des années 1950 (Guralnick, 2003). Mais comme le rhythm and blues mêle simultanément plusieurs courants, ce n’est qu’en 1969 que le magazine Billboard lui donne un nom (Pirenne, 1994). Soul signifie « l’âme » : celle d’une chanson, d’une voix ou des musiciens. Bien que l’empreinte rythmique du R&B reste bien marquée, c’est la voix qui par son éloquence, sa grandeur, son expressivité, puisée dans la tradition du chant gospel pour incarner l’âme des Noirs américains. Guralnick (2006) raconte que c’est Ray Charles qui, au milieu des années 1950, lance ce courant en étant l’un des premiers artistes à arranger des chants de gospel dans un cadre profane³, ce qui lui vaut de nombreuses réprimandes de la population afro-américaine. Mais c’est aussi lui qui introduit le terme en 1958 dans son album Soul Brothers. La soul reprend les effectifs denses du R&B en y incluant souvent l’orgue, en référence à l’église, le tout dans une cadence rythmique tantôt très douce, tantôt frénétique. Durant toutes les années 1960, au paroxysme de tension liée à la lutte des Noirs américains pour la reconnaissance des droits civiques, les voix poignantes d’Aretha Franklin et d’Otis Redding expriment l’émotion sincère de la population afro-américaine. Toutefois à cette même période, certains labels de soul/R&B comme Motown Records abandonnent l’idée d’une culture unique en destinant ouvertement leur musique aux deux publics, Noirs et Blancs (Guralnick, 2003). Non seulement cette orientation, secondée par la fin de la ségrégation raciale, marque peu à peu la fin de la musique noire exclusive aux États-Unis, mais le blues, le rhythm and blues et la soul continuent jusqu’à aujourd’hui d’exercer leur influence.

Figure 3 : Aretha Franklin (Source : https://www.pinterest.cl) — *Figure 3 : Aretha Franklin* *(Source : https://www.pinterest.cl)*

2. L’adoption de nouveaux moyens d’enregistrement

1) L’avènement de l’enregistrement magnétique

L’arrivée de l’enregistrement magnétique dans les studios d’enregistrement à la fin des années 1940 pose les bases d’une nouvelle ère sonore, dont profitent ensuite pleinement les productions des années 1950-60.

Dans les années 1920-30, les laboratoires cherchent à remplacer l’enregistrement musical électrique par un medium plus facile à lire et à la restitution sonore moins bruitée. Ils fondent leurs recherches sur l’enregistrement magnétique, dont le principe est défini dès la fin du XIXᵉ siècle par Oberlin Smith et Valdemar Poulsen : un courant circulant dans une bobine génère un champ magnétique qui provoque l’aimantation de fines particules disposées sur un support (Mercier et al., 2010). Fritz Pfleumer invente alors en 1928 comme support d’enregistrement la bande magnétique, une bande papier kraft avec de la poudre de fer. Bien que sa grande souplesse empêche encore une magnétisation durable, elle attire l’attention de la compagnie allemande AEG qui rachète le brevet et commence à développer le Magnetophon K1 (Kimizuka, 2012). Via une bande d’acétate puis de plastique, ce dernier devient le premier enregistreur magnétique utilisé pour la diffusion radio et, dès 1936, l’enregistrement de concerts⁴. Mais l’Allemagne nazie tient en secret cette prouesse dont elle profite grandement pendant le conflit mondial (Rémond, 2015).

En juillet 1945, l’ingénieur électricien Jack Mullin est envoyé en Allemagne pour examiner les outils de communication utilisés par l’ennemi durant la guerre. Dans l’un des bunkers, il découvre plusieurs Magnetophon AEG. Il en rapatrie deux aux États-Unis, les remet en état et les présente au chanteur Bing Crosby, qui cherche justement un moyen pour enregistrer ses shows à la radio avec une qualité sonore semblable à celle d’une émission en direct (Cogan & Clark, 2003). Devinant tout le potentiel de cet outil, celui-ci soutient Mullin dans ses travaux en le faisant nommer ingénieur-chef au sein de la jeune entreprise Ampex. En 1948, Mullin ouvre les portes de l’enregistrement magnétique à la radio et très bientôt aux studios d’enregistrement, en commercialisant l’Ampex Model 200A (Kimizuka, 2012).

Figure 4 : Magnétophone Ampex 200A acquis dès 1949 par les studios Capitol(Source : https://www.historyofrecording.com) — *Figure 4 : Magnétophone Ampex 200A* *acquis dès 1949 par les studios Capitol(Source : https://www.historyofrecording.com)*

Très vite, le magnétophone monophonique⁵ investit les studios américains. Les ingénieurs du son aperçoivent aussitôt les grands atouts de production qu’offre la bande magnétique. Parmi ceux-ci, la nouvelle bande passante est sans doute la plus évidente et la plus bénéfique (Cogan & Clark, 2003). La fidélité de reproduction est alors hautement améliorée, ce qui sert particulièrement à la définition des timbres des instruments. De plus, le souffle d’enregistrement causé par le support est avec la bande magnétique bien plus faible que celui qu’occasionne le disque gravé, tel qu’on enregistrait la musique jusque-là. Mais surtout, en coupant les bandes issues de différentes prises et en les assemblant convenablement, les ingénieurs du son peuvent faire du montage entre les différentes prises. Cette nouvelle méthode de production constitue une ressource importante pour les musiciens et les producteurs qui souhaitent corriger quelques passages d’interprétation. Il devient aussi plus aisé de naviguer temporellement dans l’enregistrement grâce au rembobinage de la bande et à la réactivité de la tête de lecture. Enfin, une bande peut être effacée et donc réutilisée pour d’autres enregistrements, là où quelques années avant, il était évidemment inimaginable de pouvoir gommer le sillon gravé sur un disque.

Le magnétophone mono d’abord utilisé est dit pleine piste, car son unique piste d’enregistrement occupe toute la hauteur de la bande (Rumsey & McCormick, 2002). Pendant quasiment toute la décennie 1950, il est le maillon final de la chaîne sonore de tous les enregistrements aux États-Unis, dont ceux des artistes de blues, de R&B et de soul. Comme il est réduit à une seule piste, les instruments continuent d’enregistrer tous à la fois, en live, comme au temps de l’enregistrement acoustique puis électrique. Les ingénieurs du son lui envoient une somme de signaux provenant de plusieurs micros, qu’ils mixent en direct pendant la séance sur des mixettes de 4 ou 8 voies (Gordon, 2013) (figure 5). Ces mixettes rudimentaires limitent bien souvent le nombre de micros utilisés, et ainsi la qualité de restitution de tous les instruments. La musique comme le mixage, tout se fait en direct. Si les producteurs souhaitent une meilleure prise, il faut donc en refaire une en entier et avec tous les musiciens.

*Figure 5 : Mixette à lampes Ampex / Sigma 3761 utilisée par Tom Dowd au studio Stax (Source : https://reverb.com)*

Ainsi, l’enregistrement magnétique modifie d’abord légèrement le déroulé d’une séance d’enregistrement, il améliore surtout la qualité de restitution par rapport au disque. Le montage des bandes mixées constitue finalement une bande « master », envoyée aux stations de radio pour sa diffusion et aux compagnies de pressage de disques pour sa commercialisation (Rumsey & McCormick, 2002).

2) L’enregistrement multipiste, la question de l’overdubbing

Dès 1953, plusieurs studios commencent à se procurer des magnétophones bipistes⁶, 3 pistes, et bientôt 4 pistes. En octroyant par exemple une piste entière à la voix principale, les ingénieurs du son peuvent ajuster sa présence dans un mixage postérieur (Rumsey & McCormick, 2002).

Mais c’est à la fin des années 1950 que l’enregistrement magnétique vient possiblement modifier leurs habitudes de travail. Ampex inclut dans ses magnétophones la fonction simul-sync, qui rend la tête d’enregistrement capable de lire la bande avec une qualité de restitution acceptable.

Lecture et enregistrement peuvent donc être synchrones, lançant la mode de l’overdubbing⁷. Initiée dès 1950 par Les Paul avec deux enregistreurs mono, cette technique consiste à enregistrer une partie musicale par-dessus une autre enregistrée précédemment sur une autre piste (Bode, 1984). Pour un confort acoustique ou d’interprétation, les ingénieurs du son peuvent désormais enregistrer séparément chaque section instrumentale. En particulier, un musicien peut effectuer plusieurs prises de son passage soliste sans demander au reste de l’orchestre de jouer avec lui. Et un autre peut chanter ou jouer plusieurs voix sur un même passage.

Mais malgré l’atout apparent que représente cette pratique, les producteurs de blues, de R&B et de soul s’en tiennent d’abord à ce que suggère la musique⁸. Comme exposé en section I.A.1., la musique afro-américaine exprime avant tout un certain sentiment, une certaine énergie que les musiciens se sentent appelés à partager et interpréter collectivement, simultanément. La majorité de ces musiques reste donc principalement enregistrée dans la même pièce et en live (Gordon, 2013). Grâce au format de la prise de trois minutes, le grand public profite alors d’interprétations profondes et uniques de chanteurs de blues comme Howlin’ Wolf⁹ et de soul comme Otis Redding¹⁰, et parfois déchaînées avec Big Mama Thornton¹¹ et Ray Charles¹² en R&B.

Mais au cours des années 1960, le label de R&B Motown Records commence à se détacher de cette philosophie. Bien qu’il conserve d’abord l’enregistrement live, son fondateur Berry Gordy se procure en 1965 une nouvelle machine 8 pistes¹³. Il veut valoriser les riches arrangements des productions de la maison en les enregistrant dans des conditions acoustiques favorables (multi- cabines) et surtout séparément (overdubbing). Pour la chanson Ain’t No Mountain High Enough¹⁴ (1967), il enregistre d’abord en live la section rythmique, puis par overdubs successifs, la section de cuivres, de cordes, de percussions, et finit avec le duo vocal Marvin Gaye / Tammi Terrell. Tandis que Chess, Atlantic et Stax privilégient l’énergie musicale commune et instantanée digne des musiques afro-américaines, « Hitsville¹⁵ » veut concevoir un produit dédié à tous les publics, en exploitant tous les atouts de l’enregistrement multipiste (Bowman, 1997).

3) La chambre d’écho, signature d’un label

Les studios de musique afro-américaine veulent aussi offrir un espace sonore à leurs enregistrements ; ils construisent dans leurs locaux une ou plusieurs chambres d’écho. Dans ce volume très réverbérant, l’ingénieur du son diffuse la bande d’une piste ou d’un master. Par un micro, il y récupère la source réverbérée qu’il mixe ensuite avec les autres instruments enregistrés. Comme chaque chambre d’écho est unique acoustiquement, elle contribue à définir la signature du label, que le support magnétique est capable de retranscrire (Cogan & Clark, 2003).

Capitol Records, qui produit certains artistes de jazz convertis au R&B comme Louis Prima, en possède quatre dans les années 1950 (figure 6). À dix mètres de profondeur sous les studios de prise, leurs murs épais sont contenus dans un autre volume plus grand et séparé par un système de ressorts pour s’affranchir des vibrations extérieures (principe de la boîte dans la boîte) (Cogan & Clark, 2003). Les ingénieurs du son choisissent aussi la chambre en fonction du format mono ou stéréo du master (Cogan & Clark, 2003). Ces réverbérations naturelles marquent aussitôt le cachet du « son Capitol », comme nous l’entendrons en section II.A.1.1.

*Figure 6 : L’une des chambres d’écho des studios Capitol (Source : https://reverb.com)*

4) Le progrès du microsillon

Une fois le produit finalisé, l’enregistrement du magnétophone est gravé sur un disque acétate qui sert de modèle à des matrices utilisées pour le pressage de disques de polychlorure de vinyle (PVC), destinés au commerce (Rumsey & McCormick, 2002). Ce matériau plastique, bien moins lourd, moins fragile et moins coûteux que la gomme-laque (shellac), s’impose très rapidement et durablement sur le marché américain de l’enregistrement. En 1947, le label Columbia brevète le microsillon, un disque vinyle au sillon extrêmement fin qui accroît soudain la qualité audio des enregistrements des années 1950 et crée deux nouveaux formats commerciaux, l’album 33 tours et le single 45 tours (Kimizuka, 2012). En 1952, l’inventeur et ingénieur du son Emory Cook profite de cette finesse de gravure pour appliquer le concept de la gravure stéréophonique de Blumlein (Rumsey & McCormick, 2002) : le microsillon stéréo voit le jour (Barry, 2010). Dès 1958, plusieurs centaines d’enregistrements stéréophoniques sont commercialisés aux États-Unis. Toutefois, ce nouveau mode de gravure présente aussi d’importantes contraintes techniques, très vite compensées par les studios. Par nature, les basses fréquences ont une grande amplitude et une lente modulation (Rumsey & McCormick, 2002). La pointe peine donc à les graver à l’enregistrement et à les reproduire à la lecture du disque. Pour ôter cette contrainte, la Recording Industry Association of America instaure au début des années 1950 l’égalisation RIAA, qui indique à l’ingénieur du son d’atténuer les basses fréquences et d’amplifier les hautes fréquences avant la gravure (Rumsey & McCormick, 2002). Sans respect de cette courbe, la mauvaise gravure des basses fréquences pourrait distordre l’enregistrement et réduire le temps d’enregistrement disponible sur une face de disque. En réglant l’égalisation inverse à la lecture, l’auditeur retrouve le signal original. Cette méthode d’égalisation, approuvée dès 1954 par la majorité des studios américains, contribue grandement au succès populaire du disque vinyle (Stotzer, 2003).

3. La nécessité de privilégier le master monophonique

1) La diffusion radiophonique

Aussi précieux soient leurs nouveaux atouts d’enregistrement et de mixage, les ingénieurs du son sont priés par les producteurs de faire correspondre les masters aux moyens usuels d’écoute du grand public. Car invariablement, l’objectif reste de vendre.

Avant le succès de la télévision dans les années 1960, le moyen dominant pour la diffusion de l’information et de la musique reste la radio. En plus du poste sédentaire du salon, divers appareils à lampe plus petits, plus mobiles et parfois plus fantaisistes viennent satisfaire le quotidien de millions de personnes. Dès 1954, les consommateurs emportent partout avec eux leur petit poste à transistors. Et pour encourager cet usage, la radio FM vient grandement améliorer la qualité du signal émis (Lemesle, 2015). Les labels de distribution envoient donc les disques récemment pressés aux stations radiophoniques locales pour qu’elles diffusent le plus rapidement et le plus souvent possible. Avec cette forme consommatrice de l’écoute musicale, le but est de faire aimer au grand public le nouveau tube de l’artiste et lui donner envie de se procurer le disque 45 tours en magasin (Bowman, 1997). Or tous les postes de radio fixes et mobiles des années 1950-60 sont mono (Lemesle, 2015). Ainsi, malgré l’explosion du format stéréo, plusieurs labels importants de musique blues/R&B/soul exigent encore pendant plusieurs années à l’ingénieur du son de prioriser le rendu sonore du master mono. De cette manière, ils se garantissent une certaine corrélation entre ce qu’ils produisent et ce que les gens entendent.

2) Les disques à commercialiser

Mais la nécessité pour les maisons de disques de favoriser le master mono ne s’arrête pas à la première écoute du grand public ; elle persiste quand ce dernier a acheté leur disque.

Avec l’apparition du microsillon, plusieurs modèles de postes de radio intègrent une platine de disque vinyle. Mais la pointe d’un tourne-disque mono, qui ne se déplace que latéralement, peut user un disque stéréo. Le grand public qui possède majoritairement cet appareil moins coûteux que la platine stéréo, est donc prévenu : une platine mono (figure 8) ne peut lire que des disques mono (Gilotaux, 1967). Non seulement les ingénieurs du son doivent alors systématiquement livrer chaque nouvel album dans les deux formats, mais ils sont priés par le label de privilégier le mixage mono pour favoriser les ventes. Nous verrons alors en section II.B.1.1. et III.B.4. dans quelle mesure ce format dicté il y a 60 ans profite aujourd’hui à la musique.

*Figure 8 : Tourne-disques mono RCA Victor 7-EP-2 (1956)(Source : https://www.ha.com)*

Finalement, les entreprises phonographiques évitent cette double production en adoptant au cours des années 1960 la gravure universelle, qui modère l’amplitude verticale du sillon, ce qui met les deux canaux plus en phase et densifie donc le centre de l’image stéréo. Ces nouveaux disques stéréo compatibles peuvent être lus par toutes les platines, mais accélèrent la transition vers les platines stéréo (figure 9) pour profiter du nouvel espace sonore (Gilotaux, 1967).

Figure 9 : Tourne-disques stéréo
Westinghouse Model 52 MPS 2 (1960)(Source : https://www.pinterest.fr) — *Figure 9 : Tourne-disques stéréo*
*Westinghouse Model 52 MPS 2 (1960)(Source : https://www.pinterest.fr)*

B. Dolby Atmos, l’écoute musicale immersive

1. Mixer en Dolby Atmos

1) Présentation de la technologie

Le Dolby Atmos est une technologie de son immersif mise au point par les laboratoires Dolby en 2012. D’abord introduite dans les salles de cinéma, les disques Blu-ray et divers services de streaming vidéo payants, elle commence depuis plusieurs années à investir l’industrie musicale.

En immergeant l’auditeur au sein d’un système de haut-parleurs pouvant atteindre 64 unités, Dolby (2020) lui promet une expérience inouïe. Standardisé 7.1.4 (figure 10), ou parfois 9.1.6, 11.1.8, le Dolby Atmos est en effet l’un des seuls formats audio à proposer une dimension verticale à sa restitution. Dans les salles de cinéma équipées, et plus tard dans les salles de concert, ceci se traduit par l’alignement de deux rangées longitudinales de haut-parleurs suspendus au plafond. Un ou deux caissons de basses à l’arrière de la salle viennent aussi s’y ajouter (Cabanillas, 2020). À la demande des labels musicaux, de plus en plus de studios de mixage, comme le studio Guillaume Tell près de Paris, commencent dès 2016 à s’équiper d’une douzaine de nouveaux haut-parleurs (7 autour de soi, 4 au-dessus et 1 subwoofer pour le standard 7.1.4) et d’un moteur de rendu Dolby Atmos pour mixer ou remixer diverses productions en son immersif. Les ingénieurs du son apprennent donc à mixer en 3 dimensions (largeur, profondeur, hauteur), et à sculpter un nouvel « environnement sonore » pour la musique traitée. Par exemple, s’il le souhaite, cette technologie permet à l’ingénieur du son d’élargir la scène sonore d’un enregistrement symphonique, passant de 60° (stéréo) à 100° ou même 180°. En dissociant les sources, il est aussi en mesure de les démasquer et de former autour d’elles un nouvel espace propre (Simon, 2018).

2) Le mixage orienté objet

En mixage stéréo, l’ingénieur du son place chaque source en fonction des canaux (plutôt vers l’enceinte de gauche, plutôt vers celle de droite, etc.) (Rumsey & McCormick, 2002). En mixage immersif, il n’a plus cette contrainte frontale et peut disposer chaque source, qu’il nomme alors « objet », où il le souhaite dans l’espace sonore formé par le dôme d’enceintes. Très simplement, il peut définir la taille et l’orientation de cet objet dans l’espace, et même lui assigner des trajectoires manuelles ou automatiques, sans jamais se préoccuper de son système de diffusion (Erard, 2020). Il ne se soucie donc plus d’insérer son mixage dans une « image sonore » stéréophonique, mais de construire avec ses objets un « environnement sonore ». Le Dolby Atmos Renderer (figure 11), moteur de rendu du Dolby Atmos communicant avec la station audionumérique, peut accueillir jusqu’à 128 objets en entrée et les diffuser ou exporter vers 64 sorties physiques indépendantes (Dolby, 2021). Dedans, le mixeur peut visuellement y mixer ses sources dans un bed (7.1, 9.1, 11.1…), qui est dépendant du système de diffusion de la régie de mixage, ou bien à la manière d’un mixage orienté objet qui, comme défini précédemment, ne l’est pas. Finalement, le bed, les objets, et les métadonnées de ces objets qui contiennent toutes leurs données spatiales (position dans l’espace 3D, taille, orientation…), constituent le format Dolby Atmos (Dolby, 2020). Au terme du mixage immersif, l’ingénieur du son en réalise un export en 12 canaux, destiné aux plateformes de streaming dont nous étudierons l’offre en section I.B.3.2. Cet export est également encodé en 2 canaux, métadonnées comprises, pour une écoute binaurale au casque. D’autres logiciels de mixage orienté objet existent avec des performances similaires, comme SPAT Revolution¹⁶ développé par Flux et l’Ircam, que nous utiliserons dans le cadre de ce mémoire (voir section II.A.2.1.).

*Figure 10 : Dispositif du Dolby Atmos 7.1.4(Source : Dolby)*

*Figure 11 : Interface du Dolby Atmos Renderer(Source : Dolby)*

3) Comment mixer en Dolby Atmos ?

Les nouvelles fonctionnalités du mixage en son immersif ouvrent de nouveaux horizons aux méthodes de travail des ingénieurs du son. Néanmoins, ceux-ci doivent garder à l’esprit certains réflexes qu’ils avaient en mixage stéréo. Lors d’une table ronde consacrée au remixage et au remastering en Dolby Atmos d’enregistrements stéréo, certains d’entre eux livrent leur expérience et les habitudes de travail qu’ils ont acquises en la matière (Thornton, 2020). Tout d’abord, tous rappellent qu’il est question avant tout de musique, que comme en stéréo, « le plus important […] est de réaliser un mixage dans lequel l’artiste puisse se reconnaître ». Les ingénieurs du son restent également toujours aussi attentifs à l’écoute du grand public : « Si l’on est distrait par quelque chose qui soit étranger à la musique, alors il y a erreur dans le mixage », annonce l’un d’eux. Cependant, ils reconnaissent que « l’implication de la musique vers la spatialisation n’est pas immédiate, [que] c’est un exercice très difficile ». Par exemple, en devant remixer en son immersif un titre des Rolling Stones à partir des bandes multipistes, l’un des mixeurs déclare qu’il est « très difficile de conserver quelque chose de compact dans un mixage spatialisé ». En travaillant majoritairement en mixage orienté objet, les ingénieurs du son apprécient enfin « ne pas avoir besoin de tasser le mixage dans un petit espace », ce qui les incite souvent à mixer en Dolby Atmos « avec beaucoup plus de dynamique » qu’ils ne le feraient en stéréo, tout en se conformant aux outils de mesures. De cette expérience du mixage stéréo, ils conservent en revanche la vérification nécessaire de la compatibilité aux autres formats. Bien qu’ils reposent leur travail sur la version originale stéréo, ils vérifient davantage la compatibilité de leur mixage avec les autres formats multicanaux (5.1, 7.1…). En particulier, vérifier la compatibilité en binaural demeure essentiel selon eux, car c’est dans ce format que les auditeurs au casque entendront leur produit, après l’encodage du master sur 2 canaux. Enfin, les ingénieurs du son exploitent la nouvelle dimension verticale pour « obtenir quelque chose de plus grand », former avec les enceintes du bas un véritable dôme sonore, pour parvenir à l’immersion recherchée. Finalement, avec l’apport déterminant du mixage orienté objet, ils voient le Dolby Atmos « en passe de devenir le principal medium d’écoute musicale multicanale ». À l’inverse du précédent format 5.1, le Dolby Atmos offre selon eux un « environnement sonore retranscrit intelligemment à partir des canaux latéraux et arrière, mais aussi des informations spatiales des objets sonores ». Dans notre étude, nous observerons en sections III.B.4. et III.C.4. les apports du remixage en son immersif pour une œuvre enregistrée en mono.

2. Le remixage en Dolby Atmos de masters monophoniques : l’exemple de Pet Sounds

1) Origine du projet

Le 2 juin 2023 est sorti une version remixée en Dolby Atmos de l’album Pet Sounds des Beach Boys, enregistré en mono en 1966. Ce projet unique est intervenu à la demande du groupe lui-même, qui a confié les bandes originales multipistes à Giles Martin, fils de George Martin le célèbre producteur des Beatles (Tamarkin, 2023). Pet Sounds marque un tournant dans l’approche d’enregistrement du groupe et a ainsi grandement influencé les Beatles dans leurs productions ultérieures (Lambert, 2008). Précédemment, Giles Martin avait déjà remixé en son immersif plusieurs albums des Beatles comme Sgt. Pepper’s Lonely Hearts Club Band (1967), Abbey Road (1969) puis Revolver (1966) (Tamarkin, 2023).

2) Intérêts et objectifs de remixage

Livrant son expérience, Giles Martin nous donne de précieuses clefs pour le remixage en son immersif de masters monophoniques des années 1960. Honoré de cette demande du groupe, il raconte comment son travail de remixage repose avant tout sur son amour inconditionnel de la version mono originale : « Sur mon bureau, la version mono tourne en boucle. Par essence, je pense que l’idée est de ne pas changer l’ADN de quelque chose mais plutôt d’améliorer l’expérience d’écoute, d’être vraiment à l’écoute de votre ressenti de fan et d’essayer de s’assurer d’honorer l’esprit de l’enregistrement » (Tamarkin, 2023). Ainsi, Martin a voulu penser comme un musicien du groupe, ressentir à travers la version originale leurs intentions. « Vous écoutez le mix mono original et vous essayez de débloquer ce qu’ils essayaient de faire. Vous ne pouvez pas être eux, mais vous essayez de comprendre. Il ne s’agit pas de technologie, il s’agit d’une chanson, et si une chanson vous fait ressentir quelque chose » (Cruse, 2023). Le producteur suit ainsi fortement la priorité musicale confiée par les ingénieurs du son en section I.B.1.3. Mais selon lui, respecter cette musique, c’est aussi voir toutes les « couleurs, les textures et l’imagination » qui composent les morceaux de cet album et qui méritent d’être mieux perçues dans un nouvel espace (The Beach Boys, 2023). « Placer ces sons dans un espace immersif signifie […] que vous pouvez entendre des instruments que vous n’avez jamais entendus auparavant », déclare Martin (The Beach Boys, 2023). Par ailleurs, il est conscient des habitudes d’écoute d’une génération actuelle « qui n’écoute pas de mono » (Cruse, 2023). Ainsi, pour respecter à la fois la musique et les préférences d’écoute d’aujourd’hui, il voit à travers le Dolby Atmos une solution : « La grande chose à propos de l’audio immersif est que vous pouvez avoir des racines au milieu et faire venir des voix autour de vous » (Cruse, 2023). Guidé également par la version stéréo mixée par Mark Linett en 1997, Giles Martin dévoile la démarche qu’il a entreprise et ses principaux objectifs de remixage pour Pet Sounds : « Ce que j’ai essayé de faire, c’est […] de trouver un sens à ce que c’est d’être dans le studio avec le groupe. Je pense que l’intimité est la clé » (Tamarkin, 2023). Par ces termes, Martin annonce l’un des grands enjeux que peut présenter l’évolution immersive d’un master mono original, le réalisme sonore. Il veut ainsi signifier que se sentir devant les musiciens en écoutant un remixage immersif peut pleinement contribuer à capter toute « l’imagination » musicale contenue dans cet album. Finalement, dans cette idée, Martin se sentirait « honoré et privilégié » si ce remixage permettait de ramener l’auditeur « au temps où il a entendu l’album pour la première fois » (Tamarkin, 2023). Démocratiser l’écoute de Pet Sounds, tel est donc avec ce projet immersif le souhait ultime des Beach Boys et de Giles Martin.

3. L’offre du Dolby Atmos au grand public : les plateformes de streaming audio

Examinons à présent à travers l’offre des plateformes de streaming audio, dans quelle mesure les consommateurs de musique ont aujourd’hui accès à des enregistrements mixés ou remixés en Dolby Atmos.

1) Le streaming audio, le medium plébiscité pour l’écoute musicale

L’écoute musicale constitue une activité du quotidien de plus en plus présente. D’après une étude menée par la Fédération internationale de l’industrie phonographique¹⁷ auprès de 44000 personnes du monde entier âgées de 16 à 64 ans (2022), l’écoute hebdomadaire musicale atteint en moyenne dans le monde 20,1 heures en 2022, contre 18,4 heures en 2021. En France, ce volume horaire est passé de 16,6 à 16,9 heures. Nous apprenons qu’en plus du bien-être que la musique provoque selon les personnes sondées, l’une des principales causes de cette croissance d’activité réside dans l’offre soumise. En particulier, les plateformes de streaming audio proposent un choix de musiques extrêmement vaste et varié, le tout à la demande, et sans publicité pour les abonnés. La part des usagers des plateformes de streaming audio (abonnés et non-abonnés) représente aujourd’hui 74% des personnes interrogées dans cette étude exercée dans 22 pays qui représentent 89% des revenus du marché mondial de la musique enregistrée (IFPI, 2022). Mais nous apprenons surtout, en termes de temps d’écoute, que l’écoute musicale par abonnement aux plateformes de streaming audio est le premier moyen d’écoute musicale en France (22%, à égalité avec la radio) et dans le monde (24%). Ces services sont donc à la fois le présent et l’avenir de la consommation de la musique enregistrée dans le monde.

2) L’introduction d’un catalogue musical en son immersif

D’après les statistiques données précédemment, il appartient tout logiquement aux différents services de streaming audio de proposer un catalogue d’enregistrements mixés en son immersif. Nous résumons dans le tableau 1 leur offre actuelle en la matière.

Plateforme de streaming audio	Dolby Atmos	Sony 360 Reality Audio	Stéréo
Tidal	X	X	X
Amazon Music	X	X	X
Apple Music	X		X
Spotify			X
Tencent Music			X
Deezer			X
Qobuz			X
YouTube Music			X

Tableau 1 : présence de contenus mixés en son immersif dans les catalogues musicaux proposés par les principales plateformes de streaming audio en juin 2023

Sur les 8 plateformes de streaming audio qui comptent le plus d’abonnés, 3 proposent des catalogues musicaux en Dolby Atmos (Tidal depuis 2020, Amazon Music et Apple Music depuis 2021). Tidal et Amazon Music s’ouvrent également à l’autre format immersif existant, le Sony 360 Reality Audio (Kagan, 2022). Concentrons-nous sur Apple Music, le deuxième service de streaming le plus utilisé dans le monde en examinant son catalogue Audio Spatial qui réunit plusieurs milliers de mixages et remixages en Dolby Atmos (Apple, 2023). Entre son introduction en juin 2021 et février 2022, le volume du catalogue a été multiplié par 7, dans plus de 20 genres différents (Singleton, 2022). Rien ne garantit toutefois que tous ces enregistrements aient fait comme Pet Sounds (section I.B.2.) l’objet d’un travail de remixage immersif approfondi.

En particulier maintenant, observons à travers l’offre du catalogue Audio Spatial d’Apple Music l’activité actuelle autour du remixage en son immersif de masters monophoniques de blues/R&B/soul des années 1950-60. Nous remarquons que la très grande majorité du catalogue ne concerne que des enregistrements postérieurs à 1980, donc stéréo (Apple, 2023). Et très souvent, ces enregistrements sont contemporains, auquel cas le master immersif sort en même temps que le master stéréo. Parmi les plus anciens artistes dont plusieurs morceaux ont été remixés en Dolby Atmos, citons Neil Young, The Police, Queen, Madonna, Earth, Wind and Fire, ou encore Michael Jackson. Seul le catalogue Audio Spatial Jazz contient un grand nombre d’enregistrements des années 1950-60 (Miles Davis, Wayne Shorter, Oscar Peterson, Art Blakey…), mais tous sont stéréo d’origine, et non mono. Rares sont donc encore les enregistrements monophoniques à avoir connu une transformation immersive. À notre connaissance, les seuls albums enregistrés en mono à avoir été remixés en Dolby Atmos sont ceux des Beatles et des Beach Boys que nous avons cités en section I.B.2.1. En outre, Apple Music (2023) propose un catalogue R&B immersif, mais il s’agit là du R&B contemporain qui, même s’il prend ses racines dans le R&B et la soul que nous avons présentés en section I.A.1.2. et I.A.1.3., a esthétiquement beaucoup évolué depuis l’explosion du hip-hop dans les années 1980-90. À partir de toutes ces données, nous constatons donc qu’il n’y a pas encore d’alignement entre à la fois les enregistrements les plus populaires de blues/R&B/soul et même les enregistrements monophoniques de tout genre musical, et leur présence dans le catalogue d’enregistrements remixés en Dolby Atmos de la plateforme Apple Music.

3) Une réussite commerciale mais encore masquée

Revenons dans notre cadre général et observons si l’introduction du catalogue Audio Spatial en 2021 a produit un effet déclencheur sur la part de marché d’Apple Music dans le domaine du streaming musical. Les éléments statistiques nous obligent à répondre négativement à cette proposition. Bien qu’Apple Music soit le deuxième service de streaming audio le plus plébiscité par le grand public à l’échelle mondiale, sa part de marché (13,7%) ne représente encore que la moitié de celle du leader Spotify (30,5%) (Mulligan, 2022). Or ce dernier, qui ne propose toujours pas de qualité audio lossless¹⁸ (Spotify, 2023), semble encore bien loin de vouloir s’ouvrir à l’audio immersif. Après l’introduction de l’Audio Spatial, Apple Music n’a pas vu sa part de marché augmenter entre 2021 et 2022, passant de 15% à 13,7% (Mulligan & Mulligan, 2022). Pourtant, Oliver Schusser, vice-président d’Apple pour Apple Music, affirme : « Nous avons maintenant plus de la moitié de notre base mondiale d’abonnés Apple Music qui écoute en Audio Spatial, et ce nombre augmente en fait très, très vite » (Singleton, 2022).

Pour encourager l’adoption du Dolby Atmos, plusieurs constructeurs comme Sony, Yamaha ou Apple lui-même incluent dans leurs casques audio l’option de head tracking¹⁹ et garantissent aux utilisateurs une sensation de réalisme immersif décuplée. Les Apple AirPods sont alors de loin en France les écouteurs sans fil les plus vendus en 2022, avec 53% de part de marché (Licata Caruso, 2022). Mais la même année, 8 des 10 smartphones les plus vendus dans le monde sont des Apple iPhone (Rastogi, 2023). Avec ces informations, il semblerait donc que l’atout pratique de l’audio sans fil et surtout la compatibilité avec les autres appareils Apple soient toujours aux yeux des consommateurs les deux principaux arguments à l’acquisition des écouteurs et casques Apple, loin du souci de l’écoute avec head tracking sur Apple Music.

C. La séparation de sources

1. Définition et applications

La séparation de sources est une technologie de traitement du signal capable de séparer les différentes sources (les instruments en musique) d’un master mono ou stéréo. Elle comporte diverses applications. Disposer des voix instrumentales séparées peut faciliter la transcription de partitions, pour arranger ou illustrer le travail d’un compositeur. En pédagogie également, la séparation de sources peut permettre à un interprète de retirer une partie jouée par un musicien de l’enregistrement, pour se substituer à lui et ainsi s’entraîner virtuellement à jouer une œuvre du répertoire classique/jazz²⁰ avec les autres instruments de l’ensemble, comme proposée par l’application NomadPlay (Chalot & Guittet, 2017). Pour l’indexation musicale, la détection de certains instruments favorise l’identification automatique du style musical (Richard et al., 2013). Enfin, traiter individuellement le son de chaque source dans un travail de remixage du morceau est l’application qui nous intéresse dans notre étude, en particulier pour des enregistrements dont les multipistes n’ont jamais existé, comme expliqué en section I.A.2.1. (Clavel, 2003).

2. Les deux modes de séparation de sources

1) Factorisation en matrices non négatives (NMF)

La factorisation en matrices non-négatives²¹ est un mode de séparation pour les sources émettant des sons harmoniques. Elle se charge de scinder le signal harmonique et le signal inharmonique du signal original, sous le nom de « séparation harmonique/percussive », pour réaliser ensuite une analyse harmonique (Müller, 2021).

a. La séparation harmonique/percussive préalable

Comme rappelé par Müller (2021) et illustré en figure 12, un signal harmonique est visible dans le sens horizontal d’un spectrogramme (représentation temps/fréquence) : sa fréquence fondamentale et ses harmoniques, multiples de la fondamentale, se superposent, et sa durée peut être étendue selon l’entretien du son par l’instrument. Un signal percussif se détecte lui dans le sens vertical : il se compose de toutes les fréquences à des niveaux distincts et sa durée est limitée.

*Figure 12 : Spectrogrammes divers. (a) Note jouée par une flûte (b) Sons de castagnettes (Müller, 2021).*

Considérons un bref signal comportant un son harmonique et deux sons percussifs, dont nous obtenons le spectrogramme par Transformée de Fourier à Court Terme (STFT). L’objectif de la séparation harmonique/percussive est alors de décomposer ce dernier en deux spectrogrammes semblables à la figure 12 (Müller, 2021).

*Figure 13 : (a) Fonction H détectant les composantes percussives. (b) Fonction P détectant les composantes harmoniques (Müller, 2021).*

Pour cela, deux fonctions de filtrage doivent être créées : une fonction H avec la fréquence k variable et le temps n fixe, pour prévenir d’un événement percussif. Et une fonction P avec la fréquence k fixe et le temps n variable, pour prévenir d’un événement harmonique. En faisant défiler chaque fonction sur son axe respectif (figure 13), on obtient par détection des maximas et après filtrage le spectrogramme des événements harmoniques et celui des événements percussifs.

Or l’intensité et la précision de chaque filtrage dépend du nombre de valeurs respectives. Ces spectrogrammes pseudo-harmonique Y^H et pseudo-percussif Y^P ne peuvent donc être retenus comme denrée fiable de séparation (Müller, 2021). De ceux-ci, on préfère générer deux masques binaires définis ainsi :

On applique les masques M^H et M^P directement au spectrogramme original pour obtenir le spectrogramme harmonique (figure 14c) et percussif (figure 14d). Par transformée STFT inverse, on obtient enfin séparément le signal harmonique et le signal percussif (Müller, 2021).

b. La décomposition matricielle du signal harmonique

Tous les harmoniques d’une note jouée par instrument surgissent puis disparaissent sensiblement en même temps. Selon les termes de Gaël Richard, spécialiste du traitement du signal audio, ils « s’activent » puis « se désactivent » simultanément entre eux (I’MTech, 2020). Avant de séparer les sources en jeu dans un enregistrement, la factorisation en matrices non- négatives permet d’abord de séparer toutes les notes jouées, toutes sources confondues. Elle décompose la matrice du signal harmonique en deux matrices : la matrice « dictionnaire », qui renseigne l’ensemble des notes et leurs harmoniques jouées, et la matrice « activations », qui dit à quel moment chacun d’eux intervient dans la séquence (figure 15) (Ewert & Müller, 2012). Comme le nombre et l’intensité des harmoniques joués définit le timbre d’une source, le modèle NMF regroupe les notes ayant un même profil harmonique et leur attribue une source. Ainsi, elle reconstitue individuellement chacune d’elles en remultipliant les deux matrices décomposées et en prenant soin de fixer à 0 toutes les activations des notes au profil harmonique différent, et donc jouées par d’autres sources (Ewert & Müller, 2012).

La NMF n’est pas seulement capable de séparer des sources. Ewert et Müller (2012) ont réussi à séparer la main droite et la main gauche d’un enregistrement monophonique de piano, en renseignant au modèle NMF la partition musicale exécutée dans l’extrait sonore. Mais cette séparation de sources informée ne donnant pas encore satisfaction, ils ont vu l’intérêt de demander au modèle NMF de représenter simultanément la matrice « dictionnaire » et la matrice « activations ». Pour l’aider à cela, ils lui ont transmis au préalable les informations temporelles MIDI du signal original, ce qui lui a permis d’effectuer à part l’analyse des fréquences.

*Figure 15 : Factorisation en matrices non-négatives : décomposition matricielle de la matrice originale X en une matrice « dictionnaire » W et une matrice « activations » H (Gover, 2019).*

c. Avantages et limites

La NMF présente plusieurs avantages. D’abord, elle ne demande pas de grandes capacités de calcul, tout s’opérant par analyse spectrale (Ewert & Müller, 2012). De plus, elle exploite sa capacité d’analyse harmonique pour isoler plus d’instruments de ce type que la méthode par apprentissage profond, que nous expliquerons en section I.C.2.2.

En revanche, son modèle de décomposition matricielle ne se limite qu’aux sons harmoniques, ce qui l’oblige au préalable à les séparer des sons inharmoniques ou percussifs, dont elle n’est pas en mesure de détecter ni d’isoler les sources en cause. Le modèle harmonique contient aussi une limite importante, puisque lorsqu’une même note est jouée par plusieurs instruments, il lui est difficile de distinguer quels harmoniques appartiennent à quel instrument. Par conséquent, il n’est pas rare que la séparation de sources par NMF laisse apparaître quelques interférences entre certaines sources soi-disant isolées (Liutkus et al., 2013).

2) Apprentissage profond

a. Notions et définitions

L’intelligence artificielle (IA) est un domaine de l’informatique visant à mimer l’intelligence humaine. En s’extrayant du domaine de la programmation dans lequel la machine esclave doit exécuter des tâches assignées, la machine d’intelligence artificielle apprend, à travers différents essais et erreurs, comme le ferait un cerveau humain. (Le Cun, 2019). Dans la plupart des applications, elle agit souvent dans une recherche de gain de temps pour l’être humain, se substituant souvent à lui, comme pour effectuer un diagnostic médical ou immobilier.

L’apprentissage automatique²² est l’un des principaux champs d’étude de l’IA. À partir d’une grande quantité de données qu’on lui fournit, un algorithme d’apprentissage automatique va constituer seul des modèles qui lui permettront de prédire un résultat (Le Cun, 2019). Dans le domaine audio, ses applications sont nombreuses : reconnaissance et classification de sons (voiture, chien, marteau), conversion de texte en discours et inversement, reconnaissance d’enregistrements commercialisés (ex : application Shazam) (Facciotto et al., 2017). L’opérateur évalue alors la différence entre ce qu’il sait ou souhaite faire, et ce que livre l’algorithme.

Sous-branche de l’apprentissage automatique, la machine d’apprentissage profond²³ est plus autonome et plus perfectionniste : elle réussit à identifier les erreurs qu’elle commet, les prend en compte pour recommencer son calcul et optimiser le résultat qu’elle offre (Le Cun, 2019). S’inspirant du modèle du cerveau humain, elle comprend un vaste réseau de neurones artificiels qui se réorganise sans cesse pour améliorer son rendement. Ce réseau, réparti en plusieurs couches communicantes, s’agrandit perpétuellement au cours de l’apprentissage pour définir son niveau d’expérience et ainsi son niveau de performance. Ainsi, par analogie à la plasticité synaptique du système neuronal humain, plus la machine reçoit de données et plus elle rencontre d’expériences différentes, plus elle sera performante. Quand l’algorithme d’apprentissage automatique traite plusieurs milliers de données, les réseaux de neurones en gèrent plusieurs millions, ce qui leur demande beaucoup de ressources GPU²⁴ et donc un temps de travail plus important (LeCun, 2016). Pour toutes ces raisons, l’apprentissage profond s’étend avec une efficacité exemplaire à de nombreux domaines d’application : reconnaissance vocale et faciale, traduction automatique des langues²⁵, reconnaissance d’objets ou de personnes sur une image²⁶, création d’une œuvre « à la manière de », véhicule autonome et donc, séparation de sources sonores (LeCun, 2016).

b. Séparation par apprentissage supervisé

Dans l’apprentissage automatique supervisé, la machine est guidée. En recevant de notre part le problème original et les résultats qu’elle doit en obtenir, elle cherche en continu au cours de son apprentissage à restreindre l’écart entre ceux-ci et ceux qu’elle obtient (Le Cun, 2019). Appliqué à la séparation de sources, nous définissons un cadre à la machine : nous lui fournissons un catalogue d’enregistrements contenant notamment chacun une batterie (ou des percussions), une basse (ou une contrebasse), et une ou plusieurs voix, et en guise de modèle d’apprentissage, chaque prise de son originale de ces sources en proximité (Schulze-Forster, 2021). En confrontant ces deux types d’information, la machine détecte des similitudes entre la plupart des masters : elle identifie une même source souvent prépondérante (la voix), une autre occupant essentiellement le bas du spectre (la basse), une autre percussive, sans harmonicité (la batterie), et le reste des sources sans réelle similarité. Cette phase d’identification est typique du réseau de neurones convolutif (CNN), qui apprend à extraire les caractéristiques de chaque objet pour en établir une classification qui lui permettra de le reconnaître à nouveau (Schulze-Forster, 2021). Pour affiner son analyse du signal entrant, la machine le lit à l’endroit et à l’envers. Puis elle apprend sur tous les masters reçus à isoler ces trois sources, suivant le modèle des fichiers multipistes.

Parmi les bases de données libres de droits pour encourager la recherche, citons la RWC Music Database qui regroupe les sons multipistes et informations MIDI de 315 œuvres de musique classique, jazz, instrumentale et populaire de divers pays du monde (Goto, 2002). Le critère du libre accès s’avère en effet essentiel car, pour l’apprentissage profond, plus le réseau de neurones se confronte à des esthétiques différentes, plus il se montrera performant lors d’une prochaine séparation. Initiée en 2013, la séparation de sources par apprentissage supervisé demeure aujourd’hui la méthode la plus employée pour séparer les sources d’un enregistrement, si toutefois celui-ci répond aux conditions que nous donnons ci-dessous (Schulze-Forster, 2021).

c. Avantages et limites

Tous les outils de séparation de sources actuellement disponibles sur le marché, dont trois seront présentés en section I.C.3., emploient une méthode de séparation par apprentissage supervisé. En effet, la découverte d’architectures de réseaux très performantes, l’accroissement de la puissance de calcul des processeurs graphiques et l’amélioration de la disponibilité des données d’entrée font sans cesse évoluer le modèle, donnant des résultats en progrès constant. C’est pourquoi, à l’inverse de la méthode par NMF, une séparation de sources effectuée par apprentissage profond offre pour n’importe quelle source une meilleure qualité de séparation que celle qu’on aurait opéré il y a quelques années. Le meilleur de l’IA en matière de séparation de sources est donc à venir (Miron et al., 2016).

En revanche, le modèle d’apprentissage supervisé englobe certaines limites, des prérequis que l’enregistrement doit détenir pour une séparation de sources réussie. Tout d’abord, les réseaux de neurones sont aujourd’hui entraînés pour ne séparer un enregistrement qu’en quatre stems : voix / basse / batterie / autres, le stem « autres » regroupant tous les signaux que l’outil n’a pas su isoler (Hennequin et al., 2020). Bien qu’elle soit une première avancée en matière d’apprentissage profond, cette limite empêche ainsi pour le moment les enregistrements de grandes formations²⁷ et certains styles musicaux aux instruments différents (jazz, musiques du monde) de bénéficier de ce procédé. De plus, même lorsque l’effectif instrumental répond aux exigences, le réseau de neurones a besoin d’une grande base de données audio pour apprendre à isoler. Or il n’est pas toujours aisé d’avoir accès aux multipistes d’enregistrements ayant des caractéristiques instrumentales et sonores proches de celui que nous voulons traiter (Schulze-Forster, 2021). Par exemple, pour séparer les sources d’un enregistrement de big band des années 1930-40, il faut trouver des enregistrements multipistes de big band avec une empreinte sonore similaire à celle des enregistrements de cette période (timbres et dynamique restreints, souffle, etc.). Or comme annoncé en section I.A.2.2., l’enregistrement multipiste ne naît que 20 ans après. Comme il implique la création d’une nouvelle base de données, ce cas constitue aujourd’hui l’un des principaux intérêts de la recherche en séparation de sources. Plus généralement, même pour les modèles actuels de séparation par apprentissage supervisé, il n’est pas rare que la machine éprouve des difficultés à isoler les sources d’un enregistrement dont l’équilibre ou les timbres sont différents de ceux sur lesquels elle a appris. En particulier, si un instrument est déjà mal reproduit ou trop discret dans le mixage original à cause d’une prise de son limitée, l’outil ne peut pas l’isoler et le rendre soudain plus défini. En outre, quand beaucoup de fréquences provenant de différentes sources se chevauchent, la séparation des sources peut grandement se compliquer (Schulze-Forster, 2021). Comme la machine apprend en essayant, elle laisse d’abord apparaître dans quelques stems quelques artefacts audibles en hautes fréquences, qui s’atténuent au fur et à mesure que le réseau de neurones se développe. Et comme elle agit individuellement sur chaque canal, séparer les sources d’un master stéréo est plus facile pour elle, profitant d’un premier démasquage spatial. Enfin, l’un des principaux enjeux du procédé concerne actuellement la réverbération. Non seulement celle-ci floute la source à laquelle elle appartient, mais elle masque également les autres sources. Pour certains modèles en apprentissage profond, elle peut complexifier la séparation, en particulier en queue de réverbération dont le niveau plus faible brouille son appartenance à telle ou telle source (Miron et al., 2016).

Cela dit, malgré les éventuels artefacts et manques révélés dans chaque source isolée, la séparation de sources par apprentissage profond n’occasionne aucune perte de signal, pas même le souffle d’un enregistrement. Ainsi, si l’on additionne toutes les sources séparées, on aboutit véritablement au master original qu’on a fourni à la machine. En d’autres termes, le masquage des sources, qui contribue en fait à ce que l’on perçoit d’elles dans le mixage original, se reforme. Dans une séance spécifique que nous organiserons, nous découvrions donc en section II.B.2.2. quelles sont les limites de la séparation de sources par apprentissage profond pour un remixage en son spatialisé, qui implique d’assembler les sources isolées.

3. Les logiciels de séparation de sources disponibles

1) Le moteur primaire de séparation : Spleeter (Deezer)

En 2019, le groupe de recherches de la plateforme de streaming musical Deezer lance Spleeter, un outil de séparation de sources reposant sur le fonctionnement de réseaux de neurones conçus et pré-entraînés avec l’outil d’apprentissage automatique TensorFlow (Hennequin et al., 2020). Prenant comme modèle la base de données musdb18 qui compte 150 morceaux de genres variés et leurs fichiers multipistes (au moins une batterie, une basse et des voix), il propose trois options de séparation : une séparation en 2 stems voix/accompagnement, une autre en 4 stems voix / basse / batterie / autres, et une en 5 stems en isolant en plus le piano. Avec Open-Unmix, Demucs et Nussl, Spleeter est l’un des premiers outils de séparation de sources en libre accès à publier les codes Python qui l’ont généré, afin de permettre à chacun de peaufiner l’apprentissage des modèles pré-entraînés avec TensorFlow, aussi en libre accès (Hennequin et al., 2021). Opérant une séparation en 4 stems jusqu’à 100 fois plus vite que le temps réel en utilisant un seul GPU (entraîné pendant une semaine), il est l’un des séparateurs les plus performants sur musdb18. Toute amélioration de résultat s’effectue par un nouveau codage (Hennequin et al., 2020).

2) L’édition spectrale manuelle : SpectraLayers (Steinberg)

À son origine en 2012 et pendant plusieurs années, le logiciel SpectraLayers est un outil d’édition et de restauration spectrale audionumérique qui permet de retirer ou de corriger directement sur spectrogramme certains défauts présents dans un enregistrement, comme des bruits acoustiques, des clics numériques, du souffle, des sons sibilants, une réverbération trop présente, etc. (Dobrev, 2020). En 2020, son éditeur Steinberg décide d’inclure dans la version 7 la fonctionnalité de séparation de sources, en reprenant les modèles pré-entraînés de Spleeter (Hennequin et al., 2021). Comme celui-ci, le logiciel est donc capable de diviser un master en 2, 4 ou 5 stems selon notre choix. Mais de manière très ergonomique, il offre à l’utilisateur la possibilité de prolonger et d’améliorer manuellement la séparation effectuée automatiquement. Lorsque l’on entend et l’on voit sur le spectrogramme d’un stem issu de la séparation, par exemple celui de la « Batterie », que certaines fréquences doivent normalement appartenir au stem « Voix », nous pouvons les encadrer précisément et les déplacer dans un nouveau stem que l’on crée et que l’on superposera au stem « Voix ». Ainsi, la voix retrouve un spectre plus complet et témoigne d’une amélioration de la qualité de séparation des sources. Ici, un stem est aussi appelé layer (calque), d’où le nom SpectraLayers et son idée de corriger puis superposer des calques spectraux. Par conséquent, cet éditeur spectral peut nous permettre d’obtenir une division de master en plus de 5 stems. En effet, la retouche manuelle des spectrogrammes peut aussi bien sûr s’appliquer au stem « Autres » qui contient souvent plusieurs instruments. Si ceux-ci présentent des profils spectraux suffisamment distincts, il nous est possible de les identifier, de les sélectionner et de les placer convenablement dans un nouveau calque réservé à chaque nouvelle source isolée. Nous expliquerons et illustrerons en section II.A.1.2. notre utilisation de cet outil.

3) La détection automatique des harmoniques : RipX (Hit’n’Mix)

À l’instar de SpectraLayers, RipX n’est initialement pas un outil de séparation de sources, bien que ses premières fonctionnalités s’en approchent et finissent même par servir le processus. À l’origine, Martin Dawe, son créateur, souhaite concevoir un outil capable de générer une partition musicale à partir d’un enregistrement polyphonique (Hit’n’Mix, 2023). Son premier souci est alors d’en séparer toutes les notes jouées. Après s’être heurté aux limites d’un modèle d’analyse spectrale similaire à la NMF (section I.C.2.1.), il commence à écrire un algorithme pour la détection automatique des hauteurs de notes, qu’il voit comme la clé de la réussite. Cet outil, capable de distinguer les hauteurs de différentes fréquences (fondamentales et harmoniques), en récolte également d’autres détails (amplitude, phase, variations de hauteur) qui lui permettent de relier chaque fréquence fondamentale à ses harmoniques. Ces informations deviennent si détaillées que Dawe essaie un jour à partir d’elles de resynthétiser chaque note. Malgré les premiers essais balbutiants, Dawe a un nouveau projet : pouvoir manipuler individuellement chaque note d’un enregistrement (modifier sa hauteur, sa longueur, ajouter un vibrato…). Il publie un premier logiciel, Hit’n’mix Play, qui permet non seulement ces manipulations mais aussi d’entendre chaque instrument de l’enregistrement. Mais il est conscient que la qualité de restitution des sons est largement en-deçà de l’exigence professionnelle. Ainsi pendant près de 10 ans, il se consacre à densifier son programme pour aboutir à une qualité audio digne d’un usage professionnel. En 2019, il fait paraître Hit’n’Mix Infinity, un outil hautement salué mais dont la qualité de séparation se heurte encore parfois au problème de chevauchement de fréquences de sources à l’unisson. Or, eu égard à l’actualité, Dawe constate que les tout récents modèles de séparation de sources conçus par apprentissage supervisé, dont Spleeter, se montrent plus robustes face à ce problème, pour isoler la voix, le piano, la basse et la batterie. Il décide donc de compléter son propre programme par une phase d’apprentissage automatique, le menant à la création d’un logiciel hybride, RipX (figure 16). Comme il a été formé à détecter les harmoniques des notes, l’algorithme de Dawe peut théoriquement isoler plus de sources (guitare, cordes) que les modèles actuels d’apprentissage profond, mais ceux-ci apprennent à réaliser des tâches délicates comme la distinction des harmoniques proches. Ces deux méthodes de séparation de sources viennent donc ici se compléter. Nous examinerons avec précision les fruits de ce mariage en section III.A.1.

*Figure 16 : Séparation des notes (fragments) et des sources (couleurs) par RipX*

II. Expérience n° 1 : remixage en son spatialisé de trois masters monophoniques des années 1950-60

Pour traiter en profondeur les deux grandes problématiques a et b introduites, l’expérience n°1 s’avère fondatrice. Elle vise à étudier et à comprendre les comportements de réflexion, d’écoute et de remixage d’ingénieurs du son, de musiciens et d’experts musicaux de la période 1950-60²⁸, face à des masters originaux d’enregistrements blues, R&B et soul de ces années. Reposant sur un entretien préliminaire, une écoute de masters originaux mono, puis une séance de remixage en son spatialisé, elle s’applique à répondre aux questions suivantes :

QR1 : Dans quelle mesure les participants jugent que le rendu sonore général de la version originale est en accord avec les caractéristiques musicales de la chanson abordée, qu’ils ont eux- mêmes listées préalablement ?

QR2 : Dans quelle mesure ingénieurs du son, musiciens et experts du répertoire musical ciblé modifient-ils le rendu sonore de masters de blues, R&B, soul produits dans les années 1950-60 dans le cadre d’une séance de remixage en son spatialisé ?

QR3 : Dans quelle mesure les participants jugent que le rendu sonore général de leur version partiellement remixée est en meilleur accord avec les caractéristiques musicales de la chanson traitée, qu’ils ont eux-mêmes listées préalablement ?

QR4 : Dans quelle mesure les choix de remixage des participants sont-ils cohérents avec leur conception de la relation entre une œuvre musicale et son esthétique sonore d’enregistrement dans le contexte des musiques écrites et enregistrées dans les années 1950-60 ?

Après avoir expliqué le travail de préparation et justifié le protocole de l’expérience, nous en présenterons puis en discuterons les résultats, avant de conclure.

A. Méthode expérimentale

1. Travail préliminaire : séparation des sources de 4 masters monophoniques des années 1950-60

Pour la séance de remixage, nous devons d’abord minutieusement isoler les signaux de quatre enregistrements monophoniques de la période ciblée, avant de les présenter aux participants.

1) Choix des 4 masters monophoniques

De cette période 1950-60, nous cherchons trois enregistrements de genres précis – blues, R&B et soul – et un quatrième de genre différent, qui servira d’enregistrement-test aux participants (section II.A.3.2.c.). Comme exposé en section I.C.2.2.c., chaque enregistrement doit valider, pour une séparation optimale des sources avec un outil d’apprentissage profond, les prérequis suivants :

Un effectif instrumental mesuré : voix, piano, claviers, cuivres, guitare (optimisation éventuellement possible pour les trois derniers), basse et batterie, au maximum. Pas d’autres instruments à cordes ou à percussion ;
Eviter les morceaux avec unissons et interventions simultanées, notamment entre voix et cuivres, voix et chœurs, piano et guitare ;
Une définition et une transparence correctes d’enregistrement, pour identifier aisément chaque instrument actif.

Après une revue d’écoute attentive et motivée par ces critères, nous avons choisi pour l’expérience n°1 de séparer les sources des quatre enregistrements monophoniques suivants :

m1. Wonder What is Wrong with Me – Lightnin’ Hopkins (1956) · Blues. Effectif : voix lead, guitare électrique, contrebasse, batterie

m2. Oh, Marie – Louis Prima (1959) · Jazz/R&B. Effectif : voix lead, chœurs, cuivres, piano, guitare, contrebasse, batterie

m3. B-A-B-Y – Carla Thomas (1966) · Soul. Effectif : voix lead, chœurs, cuivres, orgue, piano, guitare, basse, batterie

m4. Just Call Me Lonesome – Jim Reeves (1959) · Country [enregistrement-test] Effectif : voix lead, guitare solo, guitare rythmique, piano, contrebasse, batterie

Les trois premières chansons, aux atmosphères contrastantes, partagent des instruments semblables aux fonctions variées selon le genre. On peut donc supposer qu’elles suscitent des réflexions distinctes chez les participants, influencées par la relation singulière entre chaque esthétique sonore et chaque style musical enregistré. L’exception à noter est que les deux guitares dans la chanson country ne peuvent pas être dissociées, ce qui n’altère toutefois pas l’objectif d’essai de cet enregistrement. Nous donnons en annexe B1 toutes les informations relatives à ces quatre enregistrements.

2) Choix du logiciel de séparation de sources : SpectraLayers

Nous allons maintenant nous pencher sur la séparation de sources des trois enregistrements – sujets de l’expérience n°1 (m1, m2, m3), bien que l’enregistrement m4 ait subi strictement les mêmes opérations. Nous avons choisi pour cela l’outil SpectraLayers, présenté dans la section

I.C.3.2. En effet, la retouche manuelle de séparation que nous avons réalisée sur les différents calques de spectrogrammes s’avère être un atout de choix, particulièrement concernant les signaux d’instruments non séparés automatiquement, comme :

La voix et les chœurs dans le stem « Voix » d’Oh, Marie de Louis Prima et de B-A-B-Y de Carla Thomas ;
Le saxophone ténor solo, les cuivres et la guitare dans le stem « Autres » d’Oh, Marie ;
Les cuivres, la guitare et l’orgue dans le stem « Autres » de B-A-B-Y.

Plus généralement, notre retouche manuelle permet de prolonger et d’affiner la séparation résultante de l’apprentissage profond. En sélectionnant certaines fréquences ou groupes de fréquences de la source A, placées par erreur dans le stem de la source B lors de la séparation initiale, nous les avons réintégrées dans le stem de la source A, nouvellement créé ou préexistant. Le bénéfice est double : libérer tous les signaux utiles de certains masques et reconstituer les sources dispersées dans différents stems par le logiciel. De toute évidence, ce dernier aurait théoriquement dû effectuer ce travail, dont on déduit déjà une première limite du modèle de séparation de sources par apprentissage profond sans détection des harmoniques des notes.

Les figures 17 et 18 montrent respectivement de façon générale et fine l’efficacité de notre édition spectrale lorsque certaines empreintes fréquentielles se trouvent par erreur dans le stem d’une autre source. Les figures 19 et 20 témoignent, elles, d’une précision certaine de l’outil quand nous sélectionnons des fréquences appartenant à une même source pour en créer un nouveau stem, non généré par l’apprentissage profond. Dans la figure 20, nous avons récupéré une quantité importante d’harmoniques dans le stem « Autres » pour la « Voix » de Prima (dont le spectre s’est aussitôt reformé). Nous l’avons ensuite scindé en un stem « Voix » définitif et un nouveau stem « Sax dialogue ». À l’instar des sources, les possibilités de remixage semblent déjà se multiplier.

Toutefois, malgré sa capacité théorique à isoler le piano, la réalité diffère. La figure 21 révèle ce défaut, le stem « Piano » original de B-A-B-Y apparaissant très peu fourni car le signal de l’instrument se trouve en fait principalement dans le stem « Autres ». Certes notre retouche manuelle corrige facilement cet écart, mais elle montre encore les limites d’un système ne détectant pas les harmoniques des notes. Mais après l’une de nos tentatives, l’isolation du piano dans un morceau où l’instrument est plus présent donne des résultats plus probants. Il semblerait donc que l’équilibre des niveaux entre les sources du master influence la qualité de leur séparation.

À l’issue de ce long travail – une vingtaine d’heures passées par morceau –, nous avons obtenu pour chaque enregistrement-sujet le signal des sources suivantes :

*Tableau 2 : Comparaison de l’identité et du nombre de sources séparées avant et après retouche manuelle pour les trois enregistrements-sujets de l’expérience n°1*

Reste à savoir dans quelle mesure cette qualité de séparation permettra aux participants de l’expérience de réaliser leurs envies de remixage. Nous l’expliciterons dans la section II.B.2.2.

2. Préparation de l’expérience

1) Conception d’une interface simplifiée de remixage à l’usage des participants

Comme abordé dans la section II.A.3.1, notre expérience s’adresse à une majorité de participants non-ingénieurs du son, non-initiés au mixage. Il est donc primordial que l’interface de remixage que nous mettrons à leur disposition soit simplifiée et intuitive pour leur permettre de penser d’abord par la musique, notre principale motivation.

Pour cette séance de remixage, nous utiliserons SPAT Revolution, un logiciel professionnel de mixage 3D orienté objet, adapté à notre expérience. En effet, chaque Room (salle virtuelle) accueillera les sources de chaque morceau. Les quatre Room (3 morceaux-sujets + 1 morceau- test) resteront actives toute la séance, évitant ainsi toute manipulation complexe, en particulier lorsque nous passerons au remixage de la chanson suivante. La session SPAT unique à chaque participant agira en fond pour collecter et quantifier les manipulations sonores lui parvenant d’un contrôleur OSC, l’interface manipulée par le participant.

Nous avons ainsi contacté Nicolas Erard, employé à l’entreprise Flux Audio conceptrice de SPAT Revolution, pour concevoir ensemble une interface de contrôle spécialement adaptée au logiciel et à nos besoins. Après discussions, Nicolas a adapté les bases d’interaction entre SPAT Revolution et son interface de contrôle existante²⁹ avec l’application OSC³⁰ Open Stage Control³¹, pour nous guider dans la personnalisation de l’interface en fonction de nos besoins pour l’expérience. De nombreux éléments ont alors rapidement convergé entre nos exigences (facilité, lisibilité, efficacité) et les fonctionnalités offertes par SPAT via Open Stage Control. Nous avons ainsi défini ensemble trois caractéristiques concrètes de notre interface de remixage :

Une limitation à 4 paramètres de mixage fondamentaux : niveau, égalisation (3 égaliseurs bas/medium/aigu à facteur Q large et fixe), localisation 360°, niveau de réverbération
Une facilité de manipulation : tout paramètre est aisément modulable par la souris
- Une clarté de la présentation : présentation en tranches, cadres, légendes, couleurs

Après plusieurs modifications d’optimisation opérées à l’issue de deux pré-tests (section II.A.4.), l’interface de remixage sur Open Stage Control se présente comme ci-dessous :

Figure 22 : Interface de remixage de la chanson B-A-B-Y proposée aux participants de l’expérience n°1 — *Figure 22 : Interface de remixage de la chanson* B-A-B-Y *proposée aux participants de l’expérience n°1*

2) Conception d’une interface de récupération des données de remixage des participants

Afin d’apporter une réponse valide aux questions Q.R.2 et Q.R.4, et comme développé en section II.A.3.2.c., nous avons souhaité connaître le nombre et l’ordre des manipulations de remixage effectuées par le participant sur chaque morceau remixé. Avec l’aide de mon directeur de mémoire, nous avons donc créé une interface chargée de retranscrire ces informations dans un fichier texte. En voici l’architecture sous Max/MSP et un exemple de script livré en sortie :

À titre d’exemple, nous décodons ci-dessous les informations récupérées en figure 24 :

« Le 11/07/2023 à 18h09, l’ingénieur du son n°1 a manipulé dans cet ordre les paramètres de remixage suivants sur l’enregistrement de la chanson Wonder That is Wrong with Me : 1. Niveau de la voix lead / 2. Localisation de la guitare / 3. Niveau de réverbération de la guitare / 4. EQ bas de la batterie / 5. Niveau de la batterie / 6. Niveau de la batterie / 7. Niveau de réverbération de la voix / 8. Localisation de la batterie. »

Nous effectuerons à l’issue de chaque remixage une capture d’écran de l’interface de remixage qui complètera ce fichier pour nous assurer une certaine finesse d’analyse des résultats.

3) Lieu d’accueil et synoptique

C’est le plateau 1 du conservatoire – une salle équipée d’un dôme de 44 enceintes commandées par le logiciel de traitement et de diffusion multicanale AFC Image (Yamaha), et donc destinée au mixage en son immersif – qui nous accueillera avec les participants.

Nous avons donc abouti pour l’expérience n°1 au synoptique suivant :

*Figure 25 : Synoptique du dispositif pour l’expérience n°1*

En plus de sa grande stabilité, la station audio Reaper nous permet d’enregistrer dans une piste audio multicanale le remixage en son spatialisé de chaque participant, comme détaillé ici :

Figure 26 : Session Reaper de la chanson Oh, Marie au terme de l’expérience n°1, regroupant l’ensemble des remixages en son spatialisé des participants — *Figure 26 : Session Reaper de la chanson* Oh, Marie *au terme de l’expérience n°1, regroupant l’ensemble des remixages en son spatialisé des participants*

3. Protocole expérimental

Le protocole présenté ci-dessous est le résultat de quelques corrections apportées à l’issue de deux pré-tests, que nous renseignerons dans la section II.A.4.

1) Profils de participants

Cette expérience ne vise pas à juger les qualités de mixeur de chacun des participants, mais entend étudier leur attitude vis-à-vis d’enregistrements anciens. Afin de discerner d’éventuelles disparités de comportement, nous avons choisi de convier plusieurs profils de participants. Tous auront toutefois en commun une oreille musicale avisée, certains termes et questions pouvant être inaccessibles pour des personnes non musiciennes.

Les ingénieurs du son, avertis des contextes technologiques d’enregistrement de cette époque méritent toute notre attention pour discuter, écouter et remixer de tels enregistrements. Sur le plan musical, les mélomanes des années 1950-60 sont essentiels pour évoquer des chansons, des artistes et des enregistrements qui leur tiennent à cœur. Enfin les musiciens, créateurs musicaux, apportent une oreille et une sensibilité uniques et alignées sur l’essence musicale de notre étude.

Pour cette expérience n°1, nous avons donc invité par e-mail 8 ingénieurs du son, 8 musiciens et 8 experts du répertoire blues/R&B/soul des années 1950-60³². Tous répondent aux variables d’âge, de sexe, de niveau d’expérience en mixage et de connaissance du répertoire musical ciblé.

*Figure 27 : Données démographiques des participants de l’expérience n°1. (a) Sexe. (b) Âge.(c) Expérience en mixage. (d) Connaissance du répertoire blues/R&B/soul 1950-60.*

2) Déroulé de l’expérience

a) Entretien préliminaire semi-dirigé : le rapport conceptuel à l’œuvre musicale, à l’esthétique sonore d’enregistrement et à leur relation

Cette première phase d’échanges, visible en annexe B2, désire sonder le participant sur la pratique du remixage d’enregistrements passés. Après en avoir établi les fondations autour de la notion d’esthétique sonore (QA1) et de sa relation avec l’œuvre qu’elle a un jour enlacée (QA2), nous poursuivrons la discussion avec des questions plus ciblées (QA3, QA4) qui éclaireront notre sondage. Si le participant montre un intérêt au remixage d’enregistrements des années 1950-60, nous lui demanderons s’il pense à un aspect sonore particulier qu’il corrigerait sur la plupart des enregistrements de cette période (QA5). Nous retiendrons cette donnée pour la comparer ultérieurement avec la réponse donnée en QB6 ainsi qu’avec les choix de remixage effectués (voir section II.B.2.1.) pour chaque morceau de l’expérience. Lorsque cela se révélait pertinent ou nécessaire pour nos objectifs de recherche, nous avons parfois choisi de suivre le participant dans des explications plus détaillées, plus illustrées, afin de mettre en lumière des conceptions plus générales (principe de l’entretien semi-dirigé).

b) Questionnaire d’écoute du master original : les désirs sonores

La deuxième partie de l’expérience devient davantage active pour le participant. Nous lui faisons écouter au même niveau sonore le master original mono des chansons de Lightnin’ Hopkins, Louis Prima et Carla Thomas, sélectionnées en section II.A.1.1.).

Le questionnaire d’écoute que nous soumettons vise à comprendre dans quelle mesure la musique appelle le participant à lui souhaiter une quelconque modification sonore du master original. Il a aussi pour objectif, en vue de la partie III, de déterminer lequel des trois enregistrements originaux présente aux yeux des participants le rendu sonore global le moins en accord avec ce que représente selon eux l’essence du morceau en question.

Comme le montre l’intitulé des questions posées en annexe B3, nous avons précisément construit ce questionnaire autour de la motivation centrale de notre étude, l’œuvre, la musique.

La question QB1 est essentielle car plus le participant alimente sa réponse, plus il lui sera facile de répondre aux questions suivantes qui concernent certes l’aspect sonore mais toujours en étroite relation avec la chanson abordée. C’est pourquoi elle fait volontairement appel à des ressentis et des évocations très personnelles liées à la musique entendue.

Les questions QB2 à QB5, consacrées au rendu sonore, constituent le cœur de notre étude des comportements d’écoute face à des masters originaux des années 1950-60. Les participants y ont alors l’occasion en pratique de donner leur avis sur la relation entre une œuvre et l’esthétique sonore de son enregistrement. Pour tirer des résultats ciblés de ce questionnaire, nous faciliterons aussi l’analyse d’écoute des participants en la portant sur trois critères sonores essentiels en écoute critique d’enregistrement : le rendu de l’équilibre entre les sources (QB3), celui de leurs timbres (QB4) et celui de l’espace dont elles disposent dans l’image sonore (QB5). La question QB5 regroupe l’aspect mono de l’enregistrement, son relief, sa profondeur et la réverbération. Guidés par la composante musicale, les participants devront ajuster ces critères selon elle en évaluant dans quelle mesure le rendu sonore du master original convient à leur propre définition –stylistique, esthétique, historique – de la chanson (QB1). Enfin, nous identifierons les éventuels désirs sonores des participants en faveur de la chanson par la question QB6 qui, sans la nommer, constitue en fait un préambule à la proposition suivante de remixage.

Lors des écoutes, pour s’affranchir d’un potentiel effet d’ordre, nous avons choisi de contrebalancer l’ordre des trois masters écoutés d’un participant à un autre. Comme six ordres sont mathématiquement possibles, nous effectuerons chacun d’eux quatre fois pour l’expérience (6×4 = 24 participants).

c) Séance de remixage : les choix sonores

La phase pleinement pratique de l’expérience a enfin lieu. Nous invitons les participants à concrétiser leurs éventuelles envies de modifications sonores formulées pour chaque enregistrement en QB6, à travers une séance de remixage en son spatialisé spécialement configurée. Pour s’assurer d’un maximum de neutralité dans nos explications, nous leur demanderons de lire l’énoncé en annexe B4 avant de se lancer pleinement dans l’exercice.

À ce moment, nous introduisons aux participants l’interface de remixage présentée en section II.A.2.1. Avant qu’ils ne commencent à s’entraîner avec elle, nous prenons le temps de leur montrer comment chaque paramètre de remixage peut être aisément ajusté avec la souris. Après cela, tous les participants seront libres de leurs choix et de leurs actions.

Devant l’intérêt que peut susciter cette séance de remixage, il est important de rappeler l’objectif de recherche de la présente expérience : examiner les comportements d’écoute et, ici, de remixage des différents profils de participants sur trois enregistrements monophoniques des années 1950-60. Le but ultime n’est donc ni pour eux ni pour nous d’obtenir pour chaque chanson une qualité de remixage irréprochable, un rendu sonore « idéal » vis-à-vis de la musique, mais de savoir quelles sont les premières manipulations sonores qu’ils entreprennent pour y parvenir. C’est en ce sens que nous avons limité le nombre de manipulations de remixage possibles. Dans cette expérience n°1, les comportements et les choix musicaux priment sur la performance.

Figure 28 : Photographie d’une séance de remixage de l’expérience n°1 au plateau 1 du CNSMDP. (Chaque participant remixe debout ou sur chaise haute pour se situer à bonne hauteur d’enceintes. Les enceintes barrées ne sont pas utilisées).

d) Questionnaire d’autocritique du nouveau master avec entretien d’auto-confrontation individuelle : les conclusions

Après chaque remixage effectué suivant l’ordre des chansons de la phase d’écoute, nous demanderons au participant d’adopter un regard critique sur son propre master en le comparant au master original, toujours vis-à-vis de sa conception de l’œuvre. Notre objectif est de savoir dans quelle mesure les premières manipulations qu’il a pu effectuer le rapprochent déjà de son rendu sonore idéal pour la chanson (Q.R.3), telle qu’il l’a présentée en QB1. Plus précisément, des questions d’auto-confrontation individuelle s’intéressent ici pour chaque morceau, en observant l’état final de l’interface de remixage, à discuter de l’esprit de cohérence du participant entre ses désirs sonores formulés en QB6 et ses choix opérés dans la phase c). Nous les mêlons finalement à la phase d’autocritique du nouveau master pour former un questionnaire oral, disponible en annexe B5, que nous présentons volontairement comme le revers littéral de celui de l’écoute du master original, toujours centré sur l’œuvre.

La question QD6 du questionnaire d’autocritique s’avère essentielle sur le plan technologique et méthodologique. Elle nous permettra de savoir dans quelle mesure la retouche manuelle d’une séparation de sources opérée aujourd’hui par apprentissage profond et sans détection des harmoniques permet aux participants de réaliser leurs envies sonores. Ainsi, nous saurons dans quelle mesure ces perturbations éventuelles jouent un rôle dans leur évaluation du rendu sonore du nouveau master vis-à-vis de la substance musicale.

Suite à l’enchaînement remixage/questionnaire d’autocritique de chacun des trois enregistrements, l’expérience prend fin.

3) Collecte et analyse des données

Nous analyserons les réponses issues de l’entretien préliminaire et les réponses verbales au questionnaire d’écoute par théorie ancrée (Glaser & Strauss, 1967). En classant les termes et expressions prononcés par les participants en concepts généraux et sous-concepts, nous définirons les idées générales qui émergent de chacune de leur réponse.

Concernant les évaluations attribuées aux rendus sonores des masters originaux et remixés, nous les synthétiserons pour chaque morceau et chaque critère sonore en créant des boîtes à moustaches pour illustrer les variations des évaluations avant et après le remixage.

Nous reprendrons les informations fournies par l’interface Max/MSP présentée en section II.A.2.2. pour élaborer pour chaque morceau remixé le digramme en barres des manipulations et des paramètres de remixage les plus privilégiés par l’ensemble des participants.

Nous calculerons et renseignerons l’ensemble de ces résultats par chanson et par profil, ce qui nous permettra d’établir des comparaisons selon ces deux axes.

4. Pré-tests : corrections apportées au protocole initial

Pour évaluer la fiabilité et la fluidité du protocole avant les premiers tests, nous avons organisé deux pré-tests avec deux étudiants en fin de cursus FSMS.

Le premier d’entre eux visait à contrôler la fiabilité du protocole : l’intitulé, l’objectivité et l’enchaînement logique de toutes les questions, le réglage du niveau d’écoute identique à tous les morceaux, les conditions de remixage (interface, nombre précis de manipulations autorisé) et le fonctionnement de l’interface de récupération des données de remixage. Comme ce protocole est dense, nous avons demandé au premier étudiant de formuler ses remarques sur le contenu de l’expérience dès qu’elles lui apparaissaient. Ainsi, sans contrainte de temps, nous avons pu noter les ajustements protocolaires que nous avons réalisés pour la première séance :

Nous inviterons les participants à orienter chaque écoute d’un master original vers les éléments du questionnaire d’écoute : évocations et caractéristiques musicales de la chanson, rendu sonore global, rendu de l’équilibre, des timbres, de l’espace des différentes sources sonores vis-à-vis de la musique. Cette préparation s’avère précieuse, car ces questions sont peu souvent explorées pour des enregistrements passés ;
Nous effectuerons oralement les questionnaires d’écoute du master original et d’autocritique du nouveau master, pour permettre aux participants de partager immédiatement des impressions, que nous retranscrirons fidèlement en direct ;
Nous étendrons à 12 le nombre de manipulations de remixage autorisé, pour offrir aux participants une plus grande latitude d’exécution de leurs idées musicales et augmenter le nombre de choix liés à celles-ci ;
Afin de ne pas entraver les idées musicales des participants, ajuster successivement les potentiomètres d’égalisation (bas, medium, aigu) d’une même source sera compté comme une seule manipulation dans l’interface Max/MSP ;
Toujours pour satisfaire les envies sonores des participants, nous leur permettrons d’éventuellement modifier dans SPAT Revolution la longueur et la queue de réverbération pendant chaque remixage, sans que cela ne compte comme une manipulation. Bien que ces paramètres aient été initialement réglés par nos soins en fonction du morceau traité ;
Nous concevrons une session OSC et une session SPAT unique à chaque participant, afin d’en sauvegarder et d’en analyser les positions et valeurs finales des paramètres touchés.

Le second pré-test, qui a entériné les précédents ajustements, entendait quant à lui vérifier la fluidité du protocole, avec l’objectif de tenir cette riche expérience en un temps limité d’1h30. À l’issue de ce pré-test au rythme plutôt modéré, nous sommes finalement parvenus à une durée d’1h45. Nous nous sommes donc finalement fixés comme objectifs de test de passer maximum 15 min sur l’entretien préliminaire (phase a) et 15 min sur chaque chanson écoutée/critiquée (phase b) et remixée/critiquée (phase d).

B. Résultats expérimentaux : analyse par morceau et par profil

1. Analyse quantitative

Préambule : mesure du degré de participation à la séance de remixage

La très grande majorité des participants a adoré cette expérience car les questions et les manipulations mises en jeu leur ont ouvert de nouvelles perspectives d’approche dans leur propre domaine d’activité³³. Nous n’avions honnêtement pas prévu cet engouement. En particulier, aucun n’a été gêné par la longueur de l’expérience (1h45-2h), et certains l’ont même fait durer davantage pour enrichir la discussion dans les différents questionnaires et/ou profiter du temps de remixage. De prime abord, il est important de savoir dans quelle mesure les différents profils de participants se sont engagés dans cette session de remixage pour chacun des trois morceaux. Nous pouvons évaluer cet aspect en calculant la moyenne et l’écart-type du nombre de manipulations de remixage par morceau et par profil :

*Tableau 3 : Moyenne et écart-type du nombre de manipulations pour les trois chansons remixées*

Premièrement, avec une moyenne totale élevée et très resserrée du nombre de manipulations (10,42 / 10,5 / 10,33 pour chaque profil respectif, sur 12 autorisées), nous pouvons voir que tous les profils de participants ont joué le jeu du remixage, et de façon assez égale. Les ingénieurs du son sont bien pleinement engagés dans la démarche de remixage. De plus, de manière positive, les experts du répertoire ne sont pas si fermés à l’idée de se prêter au jeu des modifications sonores d’enregistrements qu’ils ont coutume depuis longtemps d’écouter.

En revanche, on aperçoit différents comportements de remixage lorsque l’on confronte les trois enregistrements. Assez nettement, c’est la chanson B-A-B-Y qui a connu en moyenne à travers la session le plus grand nombre de manipulations sonores (11,33) avec la plus faible dispersion (1,04). En détail, la moyenne très élevée et l’écart-type très bas du nombre d’opérations montrent pour tous les profils un premier intérêt pour modifier en faveur de cette chanson certains aspects sonores originaux. C’est aussi sur celle-ci que les ingénieurs du son et les experts du répertoire ont opéré le plus de manipulations. Nous verrons quelles sont-elles en section II.B.1.2.

1) Évolution des notes de rendu sonore vis-à-vis de la musique entre le master original et le master remixé de chaque participant

Figure 29 : Évolution en fonction du profil de participant des notes attribuées aux rendus sonores entre le master original et le nouveau master remixé des trois chansons : Wonder What is Wrong with Me (Lightnin’ Hopkins), Oh, Marie (Louis Prima) et B-A-B-Y (Carla Thomas). Légende : 1 colonne = 1 chanson // 1 ligne = 1 critère d’évaluation sonore

La figure 29³⁴ nous apportent six résultats majeurs sur les préférences de rendu sonore des participants entre le master original et le master qu’ils ont remixé :

R1 : L’enregistrement de la chanson de Louis Prima présente aux yeux des participants le rendu sonore original le plus en accord avec les caractéristiques musicales de la chanson. Nous discuterons en section II.C. de l’enregistrement au rendu sonore original entravant le plus le propos musical.

R2 : La version des chansons de Lightnin’ Hopkins et de Carla Thomas, remixée par chaque participant a selon tous les profils en moyenne un meilleur rendu sonore vis-à-vis de la musique que la version originale, tous critères sonores confondus.

R3 : En particulier, en plus d’être plus élevées en moyenne, les notes attribuées au rendu de l’espace des sources sonores des chansons de Lightnin’ Hopkins et de Carla Thomas sont plus homogènes dans les versions remixées que dans la version originale.

R4 : Chaque profil de participant s’accorde moins sur le rendu sonore général de la chanson Lightnin’ Hopkins que de celle Carla Thomas, pour la version originale et leur version remixée.

R5 : Les experts 1950-60 sont, en moyenne sur chacun des trois morceaux et vis-à-vis des caractéristiques musicales, plus satisfaits du rendu sonore de leur version remixée que de celui de la version originale, tous critères sonores confondus.

R6 : Les ingénieurs du son sont en moyenne les moins satisfaits du rendu sonore de leur version remixée de la chanson de Louis Prima, tous critères sonores confondus.

2) Paramètres et manipulations de remixage privilégiés

Nous considérons qu’une manipulation de remixage est « privilégiée » par les participants pour le remixage d’un morceau si elle est souvent pratiquée (nombre d’occurrences élevé) et si elle est prioritaire (faible ordre d’apparition). Pour chaque chanson remixée, nous avons donc représenté ces deux informations³⁵ au sein de la figure 30.

La figure 30b confirme le résultat R1 puisque le master original d’Oh, Marie n’est pas sujet à des manipulations correctives de remixage prédominantes. Les choix sont en effet davantage personnels, ce qui occasionne ce profil de graphe équilibré.

En revanche, conformément au résultat R2, les figures 30a et 30c révèlent clairement des manipulations de remixage privilégiées. Les participants les effectuent pour ajuster des aspects sonores du master original ne leur paraissant pas en totale symbiose avec la musique : le timbre et le niveau de la guitare et de la contrebasse pour le morceau de blues, le timbre de la basse et la position spatiale de l’orgue, du piano et des cuivres pour le titre de soul.

Figure 30 : Manipulations et paramètres de remixage privilégiés par tous les participants confondus lors du remixage de chaque chanson. (a) Wonder What is Wrong with Me (b) Oh, Marie (c) B-A-B-Y. (Légende : Nombre au-dessus d’une barre : nombre d’occurrences de chaque manipulation de remixage. Abscisses : manipulations de mixage ; Ordonnées : rapport nombre d’occurrences / ordre moyen d’apparition). — *Figure 30 : Manipulations et paramètres de remixage privilégiés par tous les participants confondus lors du remixage de chaque chanson. (a)* Wonder What is Wrong with Me *(b)* Oh, Marie *(c)* B-A-B-Y. *(Légende : Nombre au-dessus d’une barre : nombre d’occurrences de chaque manipulation de remixage.* *Abscisses : manipulations de mixage ; Ordonnées : rapport nombre d’occurrences / ordre moyen d’apparition).*

Figure 31 : Manipulations de remixage privilégiées par tous les participants confondus, tous morceaux remixés confondus. (Légende : Abscisses : manipulations de mixage ; Ordonnées : rapport nombre d’occurrences / ordre moyen d’apparition). — *Figure 31 : Manipulations de remixage privilégiées par tous les participants confondus, tous morceaux remixés confondus. (Légende : Abscisses : manipulations de mixage ;* *Ordonnées : rapport nombre d’occurrences / ordre moyen d’apparition).*

La figure 31 nous offre une vue d’ensemble des manipulations sonores privilégiées par les participants pour remixer des masters monophoniques de blues/R&B/soul des années 1950-60³⁶. Contrairement à la figure 30, nous n’y renseignons pas le nombre d’occurrences au-dessus de chaque barre de manipulation, par souci de lisibilité. En particulier, nous pouvons identifier la basse comme étant pour eux l’instrument-clé pour améliorer drastiquement le rendu sonore général en faveur du message musical.

*Tableau 4 : Paramètres de remixage privilégiés par les participants pour les trois chansons remixées*

Plus généralement et directement lié à nos deux problématiques qui concernent le remixage en son immersif, nous pouvons remarquer à travers le tableau 4 que la localisation à 360° constitue le paramètre de remixage le plus privilégié en moyenne sur les trois chansons par l’ensemble des participants pour s’approcher d’un rendu sonore idéal.

2. Analyse qualitative

1) Niveau de correspondance entre les réponses à l’entretien préliminaire et les choix de remixage

Pour traiter la question Q.R.4, intéressons-nous à présent aux conceptions des participants évoquées dans l’entretien préliminaire.

Tout d’abord, pour pouvoir parler ensuite du terme, nous avons cumulé toutes les réponses données aux questions QA1, QA2 et QA3 pour établir une définition médiane des participants de l’esthétique sonore d’un enregistrement musical : empreinte ou couleur sonore particulière perceptible sur l’enregistrement d’une œuvre musicale. Liée aux techniques d’enregistrement et aux modes sonores caractéristiques d’une époque, elle constitue le plus souvent un choix, opéré en lien étroit avec l’esthétique musicale de l’œuvre et partagé par l’ingénieur du son, le producteur de séance et les artistes, qui peuvent même parfois en être à l’initiative et créer la musique autour d’elle. Ce choix, parfois réfléchi en amont de l’enregistrement, intervient le jour de la séance (acoustique de studio, positionnement des musiciens, type et positionnement de micros) et lors du mixage (quel type de timbres, de plans sonores, de réverbération) dans le but prioritaire de servir le discours musical. Pouvant avoir un impact énorme sur notre perception postérieure de l’œuvre – variant selon le style musical – et se définir comme l’identité sonore du label ou de l’artiste, elle peut prétendre à devenir une référence pour d’autres enregistrements.

Figure 32 : Positionnement des participants sur le caractère dissociable ou indissociable d’une œuvre musicale et de son esthétique sonore d’enregistrement pour les musiques écrites et enregistrées dans les années 1950-60 (question QA3 de l’entretien préliminaire)

Figure 33 : Positionnement des participants sur le remixage d’enregistrements des années 1950-60 pour lesquels « le rendu sonore dessert selon eux la musique qui a été pensée et composée » (question QA4 de l’entretien préliminaire)

*Figure 34 : Aspect sonore que les participants favorables au remixage corrigeraient en priorité en faveur de certaines œuvres enregistrées dans les années 1950-60 (QA5)*

En accord avec cette définition de l’esthétique sonore, une large majorité de participants (75%) considère qu’elle peut être dissociée de l’œuvre musicale pour les productions des années 1950-60. La figure 32 illustre leurs perspectives sur cette question analysée par théorie ancrée.

Notons le désir exprimé par deux ingénieurs du son d’entendre en audio immersif certains enregistrements mono de cette période : un concert de Charlie Parker pour l’un, un album des Beach Boys pour l’autre. Cette dissociabilité entre l’œuvre et son esthétique sonore originale revêt un caractère essentiel pour valider notre approche centrée sur la musique : modifier la seconde sans altérer la première.

Mais justement, qu’en est-il du remixage aux yeux des participants ? 83% d’entre eux (20/24) sont favorables à la modification d’aspects sonores d’enregistrements des années 1950-60 qu’ils connaissent, pour lesquels l’esthétique sonore ou au moins son rendu joue en défaveur de l’œuvre, contrairement à la définition donnée précédemment. La figure 33 montre alors les aspects positifs, limitants et négatifs que relèvent les participants pour la pratique du remixage dans ce contexte.

Les principaux avantages incluent l’éclaircissement du discours musical par un nouvel espace sonore et le moyen de revitaliser certains enregistrements au profit du grand public. Cependant, une grande prudence nous est recommandée par les participants, qui implique de se renseigner sur la nature et l’origine des aspects sonores soi-disant gênants de ces enregistrements, et ensuite d’adopter une exigence de réalisation. En confrontant ces idées aux résultats de la figure 29, nous discuterons de cette question dans la section II.C.

Enfin, la figure 34 révèle les aspects sonores que les participants favorables au remixage souhaiteraient prioritairement modifier dans les enregistrements des années 1950-60, à travers divers exemples de leur choix. En particulier, élargir l’espace de ces enregistrements mono constitue l’un des deux désirs sonores les plus fréquemment exprimés.

Pour affiner notre étude des comportements, nous avons comparé les désirs sonores exprimés par ces participants lors de l’entretien préliminaire pour divers enregistrements de la période 1950- 60, dont cinq d’entre eux pour l’espace, avec leurs choix ultérieurs lors de la séance de remixage des trois chansons. La figure 35 nous donne donc pour chaque morceau remixé et chaque participant concerné deux informations sur les aspects sonores qu’il a annoncés à l’entretien préliminaire vouloir en priorité corriger sur divers enregistrements des années 1950-60 (QA5) : combien d’entre eux figurent en effet parmi les modifications sonores prioritaires souhaitées avant le remixage de chaque morceau (QB6), et combien d’entre eux font l’objet d’une manipulation de remixage et le cas échéant, à quel niveau de priorité. Par exemple, pour la chanson de Lightnin’ Hopkins, nous voyons que le musicien n°1 a suivi son envie préliminaire de revoir la balance des enregistrements de 1950-60 (QA5), puisqu’il a émis ce souhait de modification en écoutant le master original (cercle coloré) et qu’il l’a concrétisé au remixage en l’effectuant en première position (barre du graphe). Ou encore, pour cette même chanson, l’ingénieur du son n°7, comme dit à l’entretien préliminaire, a souhaité élargir l’espace sonore en écoutant le master original, pourtant il n’a fait aucune manipulation dans ce sens lors du remixage.

De cette figure, quatre éléments nous apparaissent importants. D’abord, les participants sont globalement cohérents entre l’entretien préliminaire et le remixage puisqu’au moins la moitié des envies sonores formulées sur divers enregistrements des années 1950-60 s’est vérifiée pour chacun des trois masters originaux écoutés avant la séance de remixage. Puis, avec 12 aspects sonores communs sur 18, c’est la chanson B-A-B-Y de Carla Thomas qui présente le plus haut niveau de corrélation entre les modifications sonores que les participants souhaitent pour elle et celles qu’ils désirent en général pour des enregistrements 1950-60. Tous les aspects sonores particuliers souhaités pour certains enregistrements de 1950-60 ont été manipulés lors du remixage de la chanson B-A-B-Y, contrairement aux autres chansons. Enfin, le paramètre de localisation spatiale est celui qui affiche le plus haut degré de corrélation entre les envies sonores générales pour des enregistrements 1950-60 et les envies sonores particulières pour chacun des trois morceaux écoutés.

Figure 35 : Niveau de correspondance entre les envies sonores formulées à l’entretien préliminaire pour des enregistrements des années 1950-60, les envies sonores pour chaque chanson de l’expérience n°1 et la priorité apportée à ces envies lors de la séance de remixage.

2) Limitations des signaux isolés sans détection des harmoniques pour le remixage en son spatialisé

Nous avons élaboré la figure 36 à partir des réponses des participants aux questions QD5 et QD6 du questionnaire d’autocritique du nouveau master. Elle nous offre une première évaluation pratique de la retouche manuelle de la séparation de sources par apprentissage profond sans détection des harmoniques, présentée en I.C.3.2. et opérée en II.A.1.2, pour un remixage en son spatialisé, expliquant certains résultats quantitatifs donnés en figure 29.

Les limitations ressenties dues à la qualité des signaux lors du remixage concernent des matières spectrales dépouillées, des interférences entre sources, des éléments non séparés, et varient selon le morceau. 54% des participants ont été limités par le signal de la basse de Lightnin’ Hopkins, car son absence d’harmoniques entravait leur envie de la redéfinir. Cela dit, tous ont reconnu que la prise de son instrumentale de 1954 était responsable de cette issue. Avec une même explication, 46% des participants ont déploré la présence aléatoire du signal du piano chez Louis Prima, qui défavorisait leur souhait d’augmenter son niveau. En revanche, seuls 13% des participants ont été limités pour remixer la chanson de Carla Thomas, ce qui leur a plus aisément permis d’entendre un master remixé plus fidèle à la musique (figure 29). Notons que 29%, 8% et 8% des participants souhaiteraient disposer des éléments séparés de batterie pour l’élargir dans chacune des trois chansons blues, R&B et soul. Finalement, 38%, 38% et 63% d’entre eux n’ont ressenti aucune limitation liée aux sources séparées et retouchées en amont, pour les remixages en son spatialisé des chansons de Lightnin’ Hopkins, Louis Prima et Carla Thomas. Cette donnée s’annonce cruciale en vue de la partie III.

*Figure 36 : Limitations relevées par les participants liées à la qualité des signaux des sources isolées pour le remixage des trois chansons : (a)* Wonder What is Wrong with Me, (b) Oh, Marie *et(c)* B-A-B-Y. Légende :

C. Discussion de l’expérience n°1 et conclusions

Cette expérience s’avère riche d’enseignements sur les comportements de réflexion, d’écoute et de remixage d’ingénieurs du son, de musiciens et d’experts musicaux du répertoire vis-à-vis des masters originaux d’enregistrements blues/R&B/soul des années 1950-60. Nous y avons donc analysé leur évaluation du rendu sonore des masters originaux (Q.R.1) et de leurs masters remixés (Q.R.3) vis-à-vis de la musique, leur engagement dans la séance de remixage (Q.R.2) et leur cohérence entre leurs réponses à l’entretien préliminaire et leurs choix de remixage (Q.R.4).

Dans leur réflexion, tous les profils de participants voient de nombreux intérêts à remixer aujourd’hui certains enregistrements de cette période, bien qu’ils n’en oublient pas de rappeler certains impératifs. La majorité, qui voit en cette pratique un atout majeur pour la musique, affirme d’abord que l’œuvre musicale peut évoluer librement sans l’esthétique sonore³⁷ issue des années 1950-60 sans que son essence ne soit menacée. Au contraire, le bénéfice du remixage serait selon eux essentiellement musical : clarification du discours, fidélité sonore, découverte de catalogues enregistrés, nouvelles perspectives de composition. Cela conforte ainsi notre idée de guider notre étude par la musique, l’œuvre pensée, composée et interprétée. Une minorité pense en revanche que le remixage n’aurait qu’une utilité technique. Toutefois, plusieurs participants signalent que ce processus, exigeant et nécessairement garant de la temporalité originale, doit être documenté. Cela implique de savoir si les aspects sonores que le remixeur souhaite modifier – même dans une démarche musicale – ont constitué le jour de l’enregistrement un choix esthétique réfléchi ou un défaut technique connu. Or les ingénieurs du son de l’expérience nous rappellent que les aspects sonores perceptibles dans un enregistrement d’époque résultent le plus souvent de contingences matérielles. Il semblerait donc que l’hypothèse du défaut technique soit d’après les participants intéressés la plus fréquente pour les enregistrements de ces années. Ainsi, nous pouvons réaliser l’envie de la majorité des participants de retravailler prioritairement la bande passante et l’espace sonore – paramètre qui nous intéresse – de certains masters originaux des années 1950-60.

Ensuite, comme l’atout du remixage semble principalement musical pour les participants, écouter et évaluer de ce point de vue le rendu sonore de trois masters originaux de blues/R&B/soul de la période concernée leur a paru certes inhabituel, mais réalisable, pertinent et parfois confortable. En effet, tous ont éveillé leur sensibilité musicale et parfois leur affection marquée et fortuite pour certaines de ces chansons, pour définir ce qui les caractérise et éventuellement ce en quoi elles les touchent. Guidés par cela, en réponse à notre question initiale Q.R.1, l’ensemble des profils – y compris les experts 1950-60 – n’ont pas hésité à juger qu’un de ces masters originaux présentaient un rendu sonore desservant la musique. Le rendu sonore de l’enregistrement de la chanson B-A-B-Y a été le plus vivement critiqué par rapport à ce que l’œuvre dégage aux yeux des participants. En particulier, c’est dans ce master original que le rendu des timbres et le rendu de l’espace des sources sonores divergent selon eux le plus de la musique. Nous apercevons là une première cohérence de résultats entre les comportements de réflexion des participants (souhait de corriger en priorité la bande passante et l’espace sonore de divers enregistrements des années 1950-60) et leur comportement d’écoute (souhait de bonifier les timbres et l’espace du master original de B-A-B-Y) en faveur de la composante musicale.

Enfin, les comportements de remixage des participants sont aussi riches d’observations. En réponse à la question Q.R.2, les trois profils se sont prêtés au jeu des manipulations sonores pour chacune des trois chansons traitées. Surtout, pour répondre à la question Q.R.3, ceux-ci ont par cette séance pratique réussi à se rapprocher de leur propre rendu sonore idéal de deux chansons sur trois (What is Wrong with Me et B-A-B-Y), ce qui constitue l’un des principaux gains de cette expérience. En particulier, le rendu de l’espace des sources sonores dans ces deux versions que les participants ont remixées profite selon eux enfin à la musique. Ainsi, nous pouvons commencer à répondre à notre grande problématique a : au contraire de la chanson Oh, Marie de Louis Prima, remixer en son immersif les masters originaux monophoniques des chansons Wonder What is Wrong with Me de Lightnin’ Hopkins et B-A-B-Y de Carla Thomas fait sens sur le plan artistique, dans la mesure où l’œuvre elle-même s’en trouve régénérée au regard des participants de tout profil. Pourtant, cette conclusion intervient même alors que la séparation de sources sans détection des harmoniques, à l’origine de cette expérience, détient encore une grande marge de progression pour satisfaire toutes les envies de remixage de chacun. Nous noterons en particulier la mauvaise tendance de l’outil à regrouper des signaux dissemblables au sein d’un même stem, ce qui, malgré notre retouche manuelle approfondie, laisse apparaître quelques artefacts ou manques fréquentiels pour certaines sources essentielles comme la basse. Par ailleurs, l’incapacité de ce modèle, que nous avons présenté en section I.C.3.2., à diviser les éléments internes de la batterie et des cuivres entrave certains désirs sonores importants liés à la construction d’un nouvel espace sonore pour l’œuvre. À ce propos, la volonté portée par les participants pour ce dernier paramètre est pleinement affirmée pour le remixage de masters monophoniques des années 1950-60 : c’est l’aspect spatial qui est privilégié pour répondre à leurs attentes sonores des trois chansons, avec en prime une correspondance maximale avec les souhaits préliminaires des participants concernés. Nous comprenons donc vis-à-vis de la problématique a que la notion immersive dans le contexte de ces enregistrements passés tient artistiquement toute sa place aux yeux des participants, en théorie comme en pratique. Nous retiendrons la grande cohérence dont ont fait preuve ces derniers depuis leurs conceptions évoquées jusqu’à leurs manipulations effectuées, ce qui répond à notre question Q.R.4.

Encouragés par les résultats positifs de cette expérience, nous souhaitons maintenant les exploiter pour proposer au grand public la possibilité d’écouter un master immersif représentatif de ceux réalisés par les participants pour l’une des trois chansons. En abordant dans la partie III les choix de remixage privilégiés en faveur de celle-ci, nous complèterons ainsi notre réponse à la problématique a et parviendrons à la problématique b.

III. Expérience n°2 : Ecoute comparative du master original et d’un master remixé en son immersif de la chanson B-A-B-Y (1966)

Pour compléter notre réponse à la problématique a et traiter la problématique b, nous avons conçu une deuxième expérience qui vise à évaluer la demande du grand public pour un master en son immersif d’une des trois chansons de l’expérience n°1. Elle tend à mesurer plus directement le degré de pertinence musicale, culturelle et historique de la pratique du remixage en son immersif des répertoires afro-américains des années 1950-60. Pour ce faire, en reprenant le plus fidèlement les envies et choix de remixage des participants de l’expérience n°1, nous avons remixé en son immersif la chanson qui, au vu de leur évaluation du rendu sonore original, récolterait a priori les plus grands avantages musicaux d’une telle restructuration sonore : il s’agit de B-A-B-Y de Carla Thomas. Plusieurs résultats de l’expérience n°1 rappelés ci-dessous sont alors venus motiver notre choix de chanson :

C’est elle qui présente selon les participants le rendu sonore original le moins en accord avec ses caractéristiques musicales (figure 29) ;
Tous les profils ont pensé en moyenne de cette chanson que leur version remixée affichait un meilleur rendu sonore vis-à-vis de la musique que la version originale (figure 29) ;
C’est la chanson pour laquelle les participants ont été les moins limités par la qualité des signaux isolés lors de la séance de remixage (figure 36) ;
Le paramètre spatial³⁸ est à la fois celui qui, aux yeux des participants, défavorise le plus fortement le master original de la chanson (figure 29) et celui qui affiche le plus haut degré de corrélation entre les envies sonores générales pour des enregistrements 1950-60 et les envies sonores particulières pour chacun des trois morceaux abordés (figure 35) ;
Tous les aspects sonores particuliers souhaités pour certains enregistrements de 1950-60 ont été manipulés lors du remixage de cette chanson, contrairement aux autres (figure 35).

Après avoir employé une autre méthode de séparation de sources et opéré ce remixage immersif de la chanson B-A-B-Y, nous avons organisé deux tests d’écoute comparative aux protocoles et aux objectifs complémentaires.

Le premier, réservé aux « producteurs » de musique (des ingénieurs du son, réalisateurs artistiques et producteurs musicaux), vise à répondre à la question suivante :

QR5 : Aux yeux experts d’ingénieurs du son, de réalisateurs artistiques et de producteurs musicaux, le présent master remixé en son immersif de la chanson B-A-B-Y de Carla Thomas, enregistrée en mono en 1966, présente-t-il aujourd’hui un intérêt culturel et musical d’être entendu par le grand public ? En outre, pourrait-il prétendre aujourd’hui à cohabiter avec le master original au sein du catalogue discographique de l’artiste et du label ?

Le second, ouvert aux « consommateurs » de musique (des musiciens, des non-musiciens et des experts musicaux du répertoire soul des années 1950-60), est dirigé vers ces questions :

QR6 : A travers laquelle des deux versions sonores – version originale ou version remixée – les participants éprouvent-ils le plus de plaisir à écouter la chanson B-A-B-Y de Carla Thomas ?

QR7 : Les consommateurs de musique seraient-ils enclins à écouter la version remixée en son immersif de la chanson B-A-B-Y plus souvent que la version sonore originale, si elle était publiée à ses côtés sur leur plateforme de streaming musical favorite ?

Ainsi, la question Q.R.5 nous permettra de parfaire notre réponse à la problématique a, quand les questions Q.R.6 et Q.R.7 alimenteront notre problématique b.

Nous consacrerons la première partie au remixage en son immersif de B-A-B-Y, la deuxième au test d’écoute pour « producteurs » et la troisième au test d’écoute pour « consommateurs ».

A. Remixage en son immersif de B-A-B-Y de Carla Thomas

1. Choix du logiciel de séparation de sources : RipX

Contrairement à l’expérience n°1 où l’étude des comportements prévalait, nous sommes à présent pour notre remixage dans une recherche de performance sonore, en vue de le présenter aux participants de l’expérience n°2 et d’apporter la réponse la plus aboutie à nos questions. C’est pourquoi, après comparaison des outils, nous avons choisi de séparer les sources de la chanson B- A-B-Y avec le logiciel d’apprentissage profond RipX, basé sur la détection des harmoniques des notes et présenté en section I.C.3.3. Pour affiner ce résultat, nous avons à nouveau conclu cette séparation en retouchant les spectrogrammes des sources sur SpectraLayers.

1) La détection des notes et des harmoniques, le facteur qualité décisif

Comme nous l’avons constaté en II.A.1.2., la séparation de sources que réalise SpectraLayers affiche plusieurs limites importantes. Au contraire, RipX écarte presque toutes ces limites grâce à l’apport déterminant de la détection des notes puis de leurs harmoniques.

Figure 37 : Visualisation spectrale de l’amélioration de la qualité de séparation des sources de B-A-B-Y entre la séparation de SpectraLayers retouchée manuellement et la séparation brute de RipX avant notre retouche manuelle — *Figure 37 : Visualisation spectrale de l’amélioration de la qualité de séparation des sources de* B-A-B-Y *entre la séparation de SpectraLayers retouchée manuellement et la séparation brute de RipX avant notre retouche manuelle*

D’abord, comme RipX relie chaque note à la source qui la joue, aucune interférence n’existe par exemple dans le stem « Voix » avec les autres sources (figure 37a), contrairement à celui délivré par SpectraLayers.

Ensuite, la détection des harmoniques de RipX offre une meilleure qualité subjective de séparation et de définition pour certaines sources sonores. La figure 37b illustre ce phénomène sur la basse, dont le rendu sonore original était le plus gênant au regard de la musique selon les participants de l’expérience n°1. Sans cette détection préliminaire, SpectraLayers nous avait obligé à retirer manuellement du stem « Basse » les interférences d’autres sources, et avec elles, le peu de son contenu harmonique disponible, limitant ainsi la bande passante supérieure de l’instrument à 1 kHz environ. RipX, en détectant ses harmoniques, a su isoler proprement la basse et surtout reformer son enveloppe sonore, redéfinissant toutes ses transitoires d’attaques avec une bande passante supérieure atteignant 3 kHz.

Le passage de la séparation de sources de SpectraLayers retouchée à la séparation brute de RipX permet les bénéfices suivants : une récupération des informations harmoniques et dynamiques de l’ensemble des sources, une stabilité harmonique et ainsi présentielle de tous les signaux au cours du temps, une forte réduction du nombre et de l’intensité des interférences entre les sources et ainsi une raréfaction des artefacts numériques.

Cependant, la détection des notes et des harmoniques a aussi révélé certains évènements indésirables. Comme le souffle de l’enregistrement n’est ni un signal harmonique, ni un signal inharmonique, RipX ne le détecte pas et n’en tient donc pas compte pour la séparation. En parallèle, lorsque les harmoniques aigus ont une intensité inférieure à celle du souffle, le logiciel n’est plus capable de les repérer et est donc forcé de les ignorer également. Toutefois, cette limitation dans le haut du spectre des signaux de batterie (cymbales), de piano et de chœurs ne nous a pas paru limitante en écoutant la séparation effectuée. La séparation qui en résulte paraît finalement fidèle à notre perception de la musique multi-instrumentale, dirigée vers le sens musical non bruité et concentrée sur les aspects harmoniques et dynamiques des instruments.

2) Disparition des limitations de remixage relevées à l’expérience n°1

Sur les 12 limitations relevées par les participants de l’expérience n°1 pour le remixage de B-A-B-Y basé sur la séparation effectuée et retouchée sur SpectraLayers, nous avons constaté que 9 avaient disparu dans la séparation de RipX, avant même notre retouche manuelle. Nous donnons en annexe C1 un tableau récapitulatif de l’amélioration progressive de la qualité des signaux isolés de la chanson, depuis la séparation brute de SpectraLayers jusqu’à la séparation de RipX retouchée sur SpectraLayers. La séparation avec RipX a permis trois avantages principaux.

Premièrement, les signaux issus de RipX se révèlent intrinsèquement mieux définis et plus constants. En les écoutant isolément, nous ressentons personnellement un contact beaucoup plus fort avec chaque interprète, grâce à la nouvelle définition des enveloppes dynamiques, expliquée précédemment. Par exemple, ce logiciel révèle le jeu et le groove du bassiste, tandis que certains participants déploraient le manque d’informations livrées par SpectraLayers. De même, le piano incomplet et inconstant donné par ce dernier laisse place grâce à RipX à un instrument ayant récupéré toute la partie de la main gauche, avec toutes ses attaques, et ce tout au long du morceau.

Deuxièmement, RipX a exaucé partiellement l’un des souhaits de remixage des participants de l’expérience n°1 en rendant la grosse caisse indépendante du reste de la batterie (figure 37c), avec une présence plus constante que dans la séparation de SpectraLayers. Nous avons dû cependant retoucher le stem « Kick » pour déplacer certaines interférences de caisse claire vers le stem « Batterie ». Avec ce stem supplémentaire, RipX fait passer de 8 à 9 le nombre de sources que nous aurons à disposition pour le remixage immersif de B-A-B-Y.

Finalement, RipX estompe tous les artefacts de SpectraLayers qui limitaient des participants pour élargir l’image sonore et égaliser certains instruments comme la basse, la guitare et le piano.

2. Ligne de conduite du remixage

Fort des résultats de l’expérience n°1, nous avons souhaité respecter au maximum les remarques et les actions des participants pour remixer à notre tour, cette fois-ci sans la moindre limitation, la chanson B-A-B-Y de Carla Thomas. De plus, nous avons retenu le discours de certains participants pendant l’entretien préliminaire, qui recommandaient une documentation avisée de l’enregistrement de la chanson avant de réaliser un tel travail.

1) Objectifs musicaux de remixage issus de l’expérience n°1

Fidèlement à la visée artistique de notre recherche, nos objectifs de remixage immersif de B-A-B-Y sont avant tout musicaux. Nous les désignons donc par les cinq caractéristiques musicales de la chanson les plus souvent mentionnées par les participants à la question QB1 de l’expérience n°1, que nous chercherons à favoriser au maximum : le groove³⁹, l’originalité de l’arrangement, la voix centrale, le genre soul et le label Stax.

Ces deux derniers traits caractéristiques ont une très forte signification sur le plan musical, culturel et historique, qui mérite de notre part de plus amples informations contextuelles. Dans l’Amérique ségrégationniste que nous avons exposée en section I.A.1., la ville de Memphis (Tennessee) concentre l’activité musicale la plus intense pour conter par les mots, les cris et le rythme, tous les drames sociétaux qui touchent la région. Au 926 East McLemore Avenue, Stax Records symbolise mieux que tous les autres labels soul cette affirmation d’identité noire. Il oriente volontairement sa musique vers toute cette population pour l’extraire des maux quotidiens. Le « son Stax », aussi appelé « Memphis Sound », se reconnaît parmi toutes les esthétiques sonores de labels par un aspect brut, tranchant et parfois rêche. En particulier, le son acoustique sec et brutal de la caisse claire d’Al Jackson, le batteur maison, impulse cette couleur sonore à tous les autres musiciens du studio (Bowman, 1997). L’un des experts 1950-60 nous a confiés que le master original de la chanson de Carla Thomas⁴⁰ sonnait étonnamment […] un peu plus pop que les autres enregistrements Stax. Lors de notre remixage immersif, nous tenterons dans un rappel culturel et historique de retrouver le cachet sonore Stax et nous analyserons à travers les questions posées aux participants de l’expérience n°2 dans quelle mesure cette démarche profite à l’œuvre.

2) Choix de remixage issus de l’expérience n°1

Ensuite, nous avons relevé puis analysé par théorie ancrée l’ensemble des remarques formulées aux questions QB3 à QB5 pour lister les manipulations de remixage à opérer prioritairement, concernant respectivement l’équilibre entre les instruments, leurs timbres et leur espace propre et environnant.

Figure 38 : Remarques des participants de l’expérience n°1 concernant le rendu sonore du master original de B-A-B-Y au regard de la musique. (a) Rendu de l’équilibre entre les sources (QB3). (b) Rendu du timbre des sources (QB4). (c) Rendu de l’espace des sources (QB5) Légende : — *Figure 38 : Remarques des participants de l’expérience n°1 concernant le rendu sonore du master original de* B-A-B-Y *au regard de la musique. (a) Rendu de l’équilibre entre les sources (QB3).* *(b) Rendu du timbre des sources (QB4). (c) Rendu de l’espace des sources (QB5) Légende :*

D’après la figure 38a, nous devrons intégrer davantage la voix et la basse dans le reste du groupe et augmenter particulièrement la guitare et la batterie⁴¹. La figure 38b indique quant à elle que nous devrons en priorité clarifier la basse⁴² et la batterie⁴³, qui empêchent selon les participants de ressentir tout le groove que contient l’œuvre. Comme désiré, nous redéfinirons également dans ce but l’ensemble des sources. Spatialement, selon la figure 38c, nous élargirons l’image de l’enregistrement et nous réduirons l’espace entre les différents plans sonores, en augmentant notamment la taille de chaque source dans un nouvel espace 3D. Nous moulerons alors ce dernier en cherchant à nous sentir immergés dans le studio A du label Stax, renvoyé par exemple au jour de la séance d’enregistrement.

*Figure 39 : Modifications sonores prioritaires qu’apporteraient les participants de l’expérience n°1 au master original pour que la chanson* B-A-B-Y *connaisse leur rendu sonore idéal (QB6)*

L’abandon de l’espace mono original de la chanson mérite de notre part une réelle considération historique, de laquelle nous tirerons notre justification. Comme nous l’avons expliqué en section I.A.3.1., les enregistrements des années 1950-60 étaient produits de telle manière à aligner le master publié sur le support d’écoute dominant à l’époque, le poste radio mono. Ainsi, conformément à notre responsabilité de nous renseigner sur sa nature créative ou subie, nous sommes en mesure d’affirmer que l’aspect mono du master original de B-A- B-Y n’a pas été décidé en 1966 par les acteurs de l’enregistrement (le producteur du label Jim Stewart, l’ingénieur du son Tom Dowd et les musiciens de la séance) dans un but artistique, mais par une contrainte technique à laquelle la musique a dû au contraire se plier⁴⁴. Toutefois, en observant la popularité de cette chanson dès le moment où elle a été publiée⁴⁵, nous pouvons constater que cette contrainte a été exploitée avec succès. Mais parce que notre étude donne la priorité à l’essence musicale des chansons, que 62,5% des participants de l’expérience n°1 mentionnent que l’aspect mono du master original est en fait limitant pour la chanson B-A-B-Y et qu’en spatialiser les sources constitue pour elle leur plus grand désir de remixage (figure 39), nous avons décidé pour notre propre remixage de nous affranchir de cette contrainte mono et de libérer les instruments de ce morceau dans un nouvel espace sonore immersif. Christophe Pirenne (1994) nous fait savoir que « l’essence de la musique soul repose sur l’expression et la transmission d’émotions et de sentiments très forts ». Tel est donc ce que nous espérerons que les participants de l’expérience n°2 ressentiront à l’écoute de notre master immersif de la chanson de Carla Thomas.

3) Compromis personnels

Comme ces différents désirs restent moyennés sur les 24 participants de l’expérience n°1, nous avons dû faire des choix sur la manière exacte d’effectuer ces opérations, en tenant comme ligne directrice les objectifs musicaux qu’ils nous donnent en section III.A.2.1.

Tout d’abord, pour produire le meilleur produit sonore possible, nous ne nous sommes fixés aucune limitation concernant le nombre de manipulations de remixage. Nous aurions pu nous ouvrir à de nouveaux paramètres de mixage, mais nous avons réalisé pendant notre travail que l’interface de remixage de l’expérience n°1 combinée à SPAT Revolution était en fait en mesure de répondre à tous nos besoins sonores.

Bien qu’en nous limitant à ces mêmes paramètres de mixage, nous avons ajusté précisément la fréquence de coupure de chaque égaliseur. Comme le facteur Q de l’égaliseur ne peut être modifié dans SPAT Revolution, ce travail s’avère essentiel pour redéfinir de manière appropriée chacune des sources sonores.

Mais avant cela, nous avons réfléchi à une disposition spatiale des sources la plus pertinente musicalement. Pour favoriser l’impression de réalisme⁴⁶ du studio d’enregistrement, nous avons décidé, telle une performance live⁴⁷, de placer tous les instruments devant nous (figure 40), tandis que tout l’espace latéral, arrière et supérieur allait être réservé à la réverbération immersive de SPAT Revolution. De plus, en gardant les instruments dans une même face de l’espace tridimensionnel, nous conservons l’esprit de groupe, cher aux studios Stax⁴⁸ et donc à cette chanson. Pour éviter un aspect trop ponctuel des sources et conserver la fusion musicale qui existe entre chacune d’elles, nous avons opté pour un mixage orienté objet avec objets stéréo. Et pour sentir de façon réaliste l’espace qu’occuperait chaque source, nous avons joué sur la largeur de chaque objet. En commençant notre travail, pour honorer l’objectif musical premier qu’est le groove, nous avons réuni au centre de l’image sonore les trois instruments qui en sont selon nous les garants : la voix (et chœurs), la basse et la batterie. Nous avons légèrement écarté ces deux derniers de part et d’autre de la voix, permettant un premier démasquage. Et pour illustrer l’originalité de l’arrangement, nous avons réparti le reste des instruments de part et d’autre de ce socle rythmique. Pour sentir la cohésion de la section rythmique, nous les avons placés ensemble à gauche de l’image. Et pour permettre aux cuivres de donner toute leur puissance sans menacer d’autres instruments, nous leur avons réservé le côté droit de l’image. En ajustant la position de chaque source, nous avons finalement toujours cherché à la démasquer des autres pour mieux percevoir son rôle dans l’arrangement, sans pour autant perdre le lien musical qu’elle entretient avec les autres. En écoutant l’avancée de notre remixage, nous avons compris que c’est cet équilibre de distances entre les sources, bien que compensé en niveau et en égalisation, qui serait la clef pour valoriser simultanément le groove et l’arrangement de la chanson.

Figure 40 : Dispositif du remixage en son immersif de B-A-B-Y en plateau 1 et espace accordé aux différentes sources sonores de la chanson — *Figure 40 : Dispositif du remixage en son immersif de* B-A-B-Y *en plateau 1 et espace accordé aux différentes sources sonores de la chanson*

Enfin, pour servir notre objectif de réalisme sonore, nous nous sommes aidés de photos et d’extraits vidéo montrant le studio A de Memphis pour imaginer et paramétrer une réverbération plausible du lieu. Nous avons ensuite proportionné le niveau de réverbération de chaque source à celui que cette dernière engendrerait de manière acoustique. Avec grande parcimonie pour respecter le style musical du morceau, les sources que nous avons le plus réverbérées sont donc la voix lead, les cuivres et la batterie.

Nous verrons en sections III.B.4. et III.C.4. dans quelle mesure notre remixage immersif de B-A-B-Y remplit les objectifs musicaux énoncés en section III.A.2.1.

B. Test d’écoute pour « producteurs » : valider la réalisation et discuter la pertinence du master remixé

Comme indiqué en préambule, nous organisons deux tests d’écoute comparative du master original et de notre nouveau master immersif de la chanson B-A-B-Y. Le premier test, destiné aux « producteurs », vise à évaluer l’intérêt musical et culturel de partager au grand public notre master remixé (Q.R.5). Pour nous garantir une équité entre les deux expériences et mesurer notre étude au plus grand nombre, nous n’avons invité à l’expérience n°2 aucun participant de l’expérience n°1. L’exception concerne les trois experts 1950-60 du test pour « consommateurs », faute d’avoir pu en trouver d’autres.

1. Profils de « producteurs » de musique

Pour y recevoir une expertise technique et musicale approfondie de notre master remixé, nous avons invité à notre test par e-mail 8 professionnels de l’industrie discographique : 5 ingénieurs du son, 2 réalisateurs artistiques et 1 producteur musical, dont les renseignements personnels sont donnés dans le tableau 5. Certains de ces participants comptent parmi les plus grands spécialistes du label Stax et de son esthétique sonore particulière, ou de la pratique du mixage musical en son immersif.

*Tableau 5 : Données démographiques des 8 participants « producteurs » de l’expérience n°2*

2. Déroulé et conditions du test

D’environ 45 min, le test pour « producteurs » se déroule en trois phases condensées.

Avant tout, nous présentons au participant le contenu et les objectifs de l’expérience, et nous nous assurons de sa bonne compréhension. Pour commencer, nous l’invitons à s’asseoir sur la chaise haute que nous avons placée au centre du système de diffusion, pour écouter le master original mono de B-A-B-Y. Nous l’appelons ensuite à répondre à un questionnaire électronique, que nous donnons en annexe C2, qui reprend exactement l’intitulé des questions QB2 à QB5 de l’expérience n°1. En effet, nous visons ici à évaluer le rendu sonore de chacun des masters par rapport aux caractéristiques musicales de la chanson : nous saurons des oreilles expertes des participants lequel des deux masters répond le mieux aux exigences de la musique sur chaque critère sonore (rendu sonore général, rendu de l’équilibre, des timbres et de l’espace des différentes sources). Pour éviter de fatiguer le participant, nous ne lui avons laissé qu’une seule case de justification pour toutes ces questions (QF5).

Puis nous lui proposons la même démarche pour notre master immersif de la chanson⁴⁹ : écoute / questionnaire. Le questionnaire est identique au premier, relatif à la musique. Nous permettons au participant de réécouter à volonté chacun des deux masters, de les confronter sur des extraits de leur choix, et de se déplacer librement dans la pièce pendant les écoutes.

Nous demandons ensuite au participant de comparer les deux masters sur trois aspects musicaux primordiaux. Deux d’entre eux, le groove (QH2) et l’arrangement (QH3), proviennent de l’expérience n°1. La question QH1, qui porte sur l’âme de la chanson, tient une place majeure pour notre égard déontologique de modifier un objet sonore existant. Elle nous aidera à alimenter notre question Q.R.5 et ainsi, notre problématique a. Grâce à ces trois questions, nous pourrons donc évaluer l’intérêt musical de l’existence du master immersif.

En conclusion, nous l’invitons à jouer le rôle d’un producteur musical dans les questions QI1 à QI5, qui nous offriront alors un éclairage avisé sur le potentiel culturel et commercial de notre remixage en son immersif de la chanson B-A-B-Y. Pour rappel, ce dernier exploite un dôme de 44 enceintes. Or il est quasiment certain qu’aucun participant ne dispose d’un tel système de diffusion. Nous avons donc ajouté dans les questions QI1 et QI2 la mention « toute considération matérielle exclue », qui supposerait de pouvoir entendre ce nouveau master via un support d’écoute bien plus usuel, le casque⁵⁰.

Ainsi, nous serons en mesure de répondre entièrement à la question Q.R.5.

Dès la phase d’écoute du master original jusqu’à la fin du test, nous nous asseyons à l’arrière de la salle pour perturber le moins possible le participant. Cependant, nous restons à tout moment à sa disposition pour répondre à ses questions.

*Figure 41 : Photographie du dispositif de l’expérience n°2 en plateau 1*

3. Collecte et analyse des données

Nous collecterons les notes attribuées par les participants aux questions QF1 à QF4 et QG1 à QG4 pour en tirer des boîtes à moustaches qui décriront l’évolution de chaque critère d’évaluation sonore vis-à-vis de la chanson, du master original au master immersif. Nous rassemblerons les justifications de ces notes, écrites par les participants en QF5 et QG5, pour les synthétiser dans un tableau évolutif, visible en annexe C3. Nous récupérerons l’ensemble des réponses fermées données à la question QH1 et suivantes, pour en dessiner un tableau statistique complet. Enfin, nous réunirons les réponses des participants aux questions QI3 et QI5, pour les figurer dans un tableau conclusif, visible en annexe C4.

4. Résultats

Figure 42 : Évolution des notes attribuées par les « producteurs » de l’expérience n°2 au rendu sonore général, au rendu de l’équilibre, des timbres et de l’espace des sources sonores de la chanson B-A-B-Y entre le master original et notre master remixé en son immersif — Figure 42 : Évolution des notes attribuées par les « producteurs » de l’expérience n°2 au rendu sonore général, au rendu de l’équilibre, des timbres et de l’espace des sources sonores de la chanson B-A-B-Y *entre le master original et notre master remixé en son immersif*

D’après la figure 42, les « producteurs » trouvent notre remixage en son immersif de

B-A-B-Y conforme à ce que suggère l’œuvre, et parfois davantage que le master original.

D’abord vis-à-vis de la chanson, ils donnent minimum en moyenne une note de 5/7 à chaque critère de rendu sonore de notre master remixé, qui témoigne donc d’un certain respect de l’écriture et de l’interprétation de l’œuvre. Par ailleurs, les participants jugent que notre master immersif offre pour 3 critères sur 4 un rendu sonore plus en lien avec la musique que le master original. Nous observons également une plus faible dispersion des notes en faveur de notre travail, sur tous les critères sonores. Bien que le rendu sonore général de B- A-B-Y ne progresse que très légèrement avec le master remixé, la plupart des experts sonores et musicaux se sont dits impressionnés par le changement dément provoqué par le master immersif, très beau, très chic, qui sonne, et surtout qui améliore et respecte le morceau, sans dénaturer le master original.

En vérité, ce sont les timbres et l’espace des sources qui profitent selon eux le plus de notre travail au regard de la musique. Leur rendu respectif passe ainsi de 4,375 à 5,25 et de 4,375 à 5,5 entre le master original et le master immersif. Le master remixé nettoie la vitre qui était entre le master original et l’auditeur, grâce à des instruments magnifiés, plus beaux comme le piano, plus clairs, plus agréables. La basse, dont le timbre confus entravait le plus la musique dans le master original lors de l’expérience n°1, est mieux définie, moins bourrue, plus constante tout au long du morceau, elle n’envahit plus et reste très présente sans écraser le son. Cependant, une minorité de participants nous ont révélé une batterie trop agressive, sans doute due au cachet Stax tranchant que nous avons tenté de lui redonner.

Quant à lui, le nouvel espace sonore, naturel, plus agréable et stable en se déplaçant selon les spécialistes du mixage en son immersif, a permis à la voix et aux autres sources de gagner de l’air, offrant à l’auditeur une meilleure impression de rendu de la dynamique du groupe et plus globalement une consommation plus directe, sans effort. Toutefois, certains participants ont été gênés par la batterie placée à droite de l’image, ou ont trouvé ce master immersif encore un peu trop frontal à cause d’une réverbération certes naturelle mais trop subtile. Ils ont donc été quelques-uns à souhaiter plus d’immersion.

En revanche, les participants ont été en moyenne moins convaincus musicalement par l’équilibre entre les sources dans notre master remixé que dans le master original. Les deux instruments relevés par une minorité de participants étant la voix trop en retrait, ce qui s’avère gênant par rapport à l’idée originale d’enregistrer pour la chanteuse , et la batterie avec une caisse claire qui claque trop parfois. Cela dit, le rendu global de l’équilibre des sources dans notre master immersif reste très correct avec une note de 5/7.

Tableau 6 : Vote des 8 « producteurs » de l’expérience n°2 pour la meilleure retranscription de l’âme, du groove et de l’arrangement de B-A-B-Y entre le master original et notre master immersif — *Tableau 6 : Vote des 8 « producteurs » de l’expérience n°2 pour la meilleure retranscription de l’âme, du groove et de l’arrangement de* B-A-B-Y *entre le master original et notre master immersif*

Tableau 7 : Expertise des 8 « producteurs » de l’expérience n°2 du potentiel culturel et commercial du master immersif de B-A-B-Y — *Tableau 7 : Expertise des 8* *« producteurs » de l’expérience n°2 du potentiel culturel et commercial du master immersif de* B-A-B-Y

Comme indiqué en tableau 6, les participants ressentent plus le groove de la chanson dans le master original, tandis que tous entendent l’arrangement de la chanson mieux servi par notre master immersif. En effet, l’un d’eux pense que dissocier [spatialement] basse et batterie fait perdre du groove à notre master immersif, quand un autre trouve que ce dernier donne plus à entendre l’arrangement, dont on entend tous les détails . Mais 75% des participants s’accordent à dire que les deux masters parviennent, certes différemment, à retranscrire à égalité l’âme, l’essence de la chanson.

Comme mentionné sur le tableau 7, les participants sont très partagés sur une envie du grand public que déclencherait notre master immersif d’écouter la chanson B-A-B-Y plus souvent qu’auparavant avec le master original. Ils le sont tout autant sur celle du grand public d’entendre en son immersif l’ensemble du catalogue du label Stax. D’un côté, certains émettent des doutes quant à la capacité et à la sensibilité du grand public à dissocier le rendu original et ce remixage très respectueux, et même à entendre l’élargissement de l’image. À l’inverse, un autre participant loue les qualités d’écoute du grand public, qui pourrait être déstabilisé par le changement de « contrat d’écoute » entre le master original et le master remixé, de cette chanson enregistrée il y a presque 60 ans. De l’autre côté, d’autres participants se réjouissent de l’existence de ce nouvel éclairage qui faciliterait l’accès de cette musique au grand public, en attirant beaucoup de curieux pour un genre toujours très populaire aujourd’hui.

En revanche, presque tous les participants déclarent qu’en tant que producteurs de label, ils engageraient les démarches pour commercialiser notre master immersif de B-A-B-Y. Bien que certains ne verraient dans le label Spatial Audio qu’un argument marketing qui ne révolutionnerait pas cette musique, d’autres disent que le master original et notre master remixé, au nouvel éclairage intéressant, pourraient cohabiter pour favoriser l’accès à cette musique et laisser les gens s’amuser à comparer les deux versions.

5. Conclusions

À la lumière de ces résultats, les professionnels de l’industrie discographique que sont les ingénieurs du son, les réalisateurs artistiques et les producteurs musicaux, valident la réalisation technique de notre remixage en son immersif de la chanson B-A-B-Y de Carla Thomas. Selon eux, le rendu sonore y est en accord avec la musique, et nettement plus que le master original sur le plan des timbres et de l’espace des différentes sources. La dimension immersive et réaliste aurait pu toutefois être plus marquée d’après certains participants.

Par ailleurs, la grande majorité de ces spécialistes du label Stax et du mixage en son immersif ne voient aucune perte d’âme de la chanson à travers notre master remixé. Au contraire, ils plébiscitent à l’unanimité ce produit fidèle et respectueux de l’œuvre pour percevoir tous les détails de l’arrangement musical. C’est là aux yeux de tous les « producteurs » le grand intérêt musical de remixer aujourd’hui en son immersif la chanson B-A-B-Y de Carla Thomas (Q.R.5, problématique a). Ils notent néanmoins dans notre travail une légère perte de groove par rapport au master original, dont la cause possible est l’éclatement des sources dans l’espace, qui a justement profité à l’arrangement.

Bien que notre remixage leur paraisse réussi et convaincant musicalement, les participants sont partagés entre l’optimisme et le doute quant à la demande du grand public pour ce type de reconstruction immersive de la musique, pour cette œuvre et pour le catalogue du label en général⁵¹. Toutefois, avec une intention culturelle de partager un nouvel éclairage d’une œuvre et de favoriser ainsi son accès, ou uniquement commerciale dans le marketing actuel autour du son 3D, ils seraient quasiment tous enclins, en tant que producteurs d’un label comme Stax Records, à commercialiser notre master immersif de B-A-B-Y et à l’installer aux côtés du master original (Q.R.5, problématique a).

C. Test d’écoute pour « consommateurs » : évaluer la demande du grand public pour le master remixé

Après la validation de notre remixage en son immersif de la chanson B-A-B-Y par un cercle de professionnels de l’industrie discographique, ce dernier test d’écoute comparative qui concerne les consommateurs de musique s’avère crucial. En enrichissant notre réponse à la problématique a et en abordant seul la problématique b, c’est lui qui va clore et décider de l’issue de notre étude du remixage en son immersif de masters monophoniques des années 1950-60. Nous chercherons avec lui à savoir à travers quelle version sonore (originale ou remixage) les consommateurs préfèrent écouter B-A-B-Y (Q.R.6) et s’ils écouteraient notre version remixée plus souvent que la version originale si elle était publiée à ses côtés (Q.R.7).

Par souci de compréhension de la part des participants, nous n’emploierons pas dans toute cette partie le terme « master », mais nous préférerons parler de « version sonore ».

1. Profils de « consommateurs » de musique

Pour que le grand public soit le plus densément représenté à notre test, nous y avons convié par message le maximum de personnes. Forts du succès provoqué par l’accroche, nous avons reçu 45 participants issus pour la plupart de notre réseau de connaissances⁵² : 21 musiciens, 21 non musiciens, et 3 des 8 experts 1950-60 de l’expérience n°1⁵³. Bien que nous souhaitassions une égalité entre chaque profil pour une distribution conforme⁵⁴, nous sommes parvenus à travers cette grande assemblée à remplir notre objectif premier de rassembler.

Quant aux non-musiciens, ce sont à la fois eux les plus grands consommateurs et les plus représentatifs du grand public. Leur présence nous est donc indispensable. Ensuite, nous avons conservé le profil des musiciens pour leur sensibilité auditive, dont le discours issu nous sera profitable. Enfin, le discours avisé des experts 1950-60 nous est tout aussi précieux que dans l’expérience n°1 vis-à-vis d’une chanson, B-A-B-Y (1966), qu’ils ont toujours entendue d’une manière et qu’ils vont entendre pour la première fois d’une autre. Nous réunissons en figure 43 les informations démographiques de ces participants.

Figure 43 : Données démographiques des « consommateurs » de l’expérience n°2. (a) Sexe. (b) Âge. (c) Écoute de la musique soul/R&B. (d) Connaît Stax. (e) Connaît le son Stax. (f) Connaît B-A-B-Y. — *Figure 43 : Données démographiques des « consommateurs » de l’expérience n°2. (a) Sexe. (b) Âge.* *(c) Écoute de la musique soul/R&B. (d) Connaît Stax. (e) Connaît le son Stax. (f) Connaît* B-A-B-Y.

2. Déroulé et conditions du test

D’une durée de 30 min, le test pour « consommateurs » se déroule en trois temps. Premièrement, nous accueillons le participant au plateau 1 du conservatoire et lui demandons de répondre sur ordinateur à quelques questions démographiques (QJ1 à QJ5 visibles en annexe C5). Après cela, nous l’invitons à s’installer sur la chaise haute que nous avons placée au centre du système d’écoute de la salle (voir figure 41). Nous lui décrivons oralement l’expérience qui l’attend et lui indiquons ce qu’il va devoir déterminer : laquelle des deux versions sonores qu’il va entendre d’un même enregistrement lui procure le plus grand plaisir d’écoute. Se faisant, nous préparons le participant pour qu’il soit dans le meilleur confort pour un exercice certes plaisant mais inhabituel pour lui, en particulier pour un non musicien, qu’il puisse faire confiance à son oreille critique pendant les deux écoutes qui vont suivre. Nous commençons par lui faire écouter en intégralité la version originale et notre version remixée de B-A-B-Y, sans parler entre les deux⁵⁵. Pour ne pas influencer le participant, nous ne lui évoquons pas avant la conclusion du test l’écoute d’une « version originale » et d’une « version remixée ». Nous craignons en effet qu’il perçoive négativement le terme « remixage », ou bien qu’il se montre complaisant envers notre version remixée s’il suppose que nous l’avons réalisée. Pour qu’il traite donc les deux versions à égalité et qu’il entende ce que chacune d’elles contient et renvoie de la musique, nous avons décidé dans notre discours et notre questionnaire de nommer « version A » la première version entendue et « version B » la seconde. En complément, pour nous affranchir d’un possible effet d’ordre, nous alternons secrètement entre chaque passage l’ordre d’écoute original/remixage. À l’issue des premières écoutes entières A et B et à tout moment du test, nous permettons au participant d’en effectuer d’autres à volonté sur des extraits précis qu’il pourra choisir, pour valider sa préférence.

Lorsqu’il la connaît, nous l’invitons à répondre sur ordinateur à notre questionnaire⁵⁶. Ce dernier, disponible en annexe C5, propose toute une série de questions, souvent à choix multiples pour simplifier la réflexion du participant et garantir la fluidité du test. Nous les avons posées dans un ordre logique mais par facilité pour lui, nous lui permettons de les traiter dans l’ordre de son choix. D’abord, la question QK1 nous permet de retenir les émotions naissantes éventuelles du participant après les deux écoutes, susceptibles de s’évaporer au fil du test. Servant directement notre question Q.R.6, les questions QK3 à QK5 dominent quant à elles notre questionnaire.

Ensuite, pour confirmer notre priorité de la musique et maintenir ainsi le lien avec les deux tests précédents, nous avons inclus dans le test pour « consommateurs » les questions QK6 à QK8, identiques aux questions QH1 à QH3 du test pour « producteurs », concernant l’âme, le groove et l’arrangement de la chanson. Nos questions inverses QK9 et QK10, les plus détaillées, demandent au participant une certaine attention d’écoute. C’est là que nous rappelons oralement à ce dernier la possibilité de comparer le rendu de certains instruments en réécoutant certains extraits, qu’il peut choisir ou que nous pouvons proposer. Bien que le participant puisse cocher plusieurs critères perceptifs pour une même source, nous lui précisons bien de n’en cocher un que lorsqu’il a une préférence significative pour l’une des deux versions. Notre question QK11 rejoint les questions QK6 à QK8 des principales caractéristiques musicales de la chanson B-A-B-Y. Avant la phase de conclusion de notre test, nous suggérons aux participants une réflexion temporelle sur chacune des deux versions sonores (QK12 à QK14). Notre objectif à travers cette question est de voir certains participants se sentir dans la même époque via les deux versions sonores.

Enfin, après avoir informé le participant de l’identité des versions A et B⁵⁷, nous concluons notre test par les questions QL1 et QL2⁵⁸ qui nous permettront de vérifier les hypothèses des « producteurs » émises en III.B.4., mais surtout de répondre directement à notre question Q.R.7 et à notre problématique b.

3. Collecte et analyse des données

Nous collectons les notes d’appréciation attribuées par les participants à la version originale et à notre version remixée de B-A-B-Y (QK3, QK4), pour en dessiner des boîtes à moustaches qui illustreront la moyenne et la dispersion d’appréciation de chaque version pour chaque profil. Nous rassemblons les réponses des participants aux questions QK5 à QK8 et QK11⁵⁹ pour constituer des digrammes circulaires qui révèleront la version sonore préférentielle des participants pour chaque aspect musical mentionné. Nous sommons toutes les grilles de cases remplies par les participants aux questions QK9 et QK10 pour construire pour chaque critère sonore un digramme en barres multiples qui renseignera leur version préférée pour le rendu de chaque instrument. Nous nous aidons de leurs justifications pour interpréter ce diagramme. Nous recueillons les réponses des participants aux questions QK12 et QK13 pour composer un digramme circulaire qui dévoilera la version qui plonge les participants dans l’époque la plus éloignée d’aujourd’hui, la plus proche de l’époque d’enregistrement. Enfin, nous retenons les réponses des participants aux questions QL1 et QL2 pour former deux diagrammes circulaires qui répondront à notre problématique b.

4. Résultats

Avant tout, la grande majorité des participants ont ressenti beaucoup de plaisir à participer à ce test d’écoute comparative, un exercice qui leur a paru certes nouveau, mais stimulant pour leur écoute de la musique en général.

Les figures 44 et 45 nous révèlent un plébiscite généralisé pour notre remixage en son immersif de la chanson B-A-B-Y de Carla Thomas. En effet, les participants « consommateurs » sont 62,2% à préférer écouter cette musique à travers notre version remixée. De plus, il ne s’agit pas simplement d’une attirance pour un nouveau type de rendu sonore pour un enregistrement des années 1960, comme indiqué sur la figure 45 qui montre un réel plaisir des participants à écouter cette chanson dans la version immersive (appréciation moyenne de 7,5/10), davantage que dans la version originale (6,6/10 de moyenne). Nous notons également les 11,1% des participants qui, par choix argumenté, disent aimer autant l’une que l’autre version. Reste une minorité de participants (26,7%) qui privilégient l’écoute de la version originale, ce qui vient vérifier le constat sonore négatif de celle-ci, rendu par les participants de l’expérience n°1 en section II.B.1.1.

Figure 44 : Version préférentielle des « consommateurs » de l’expérience n°2 entre la version originale et notre version remixée en son immersif de B-A-B-Y sur chaque caractéristique musicale de la chanson. (a) Général. (b) Âme. (c) Groove. (d) Arrangement. — *Figure 44 : Version préférentielle des « consommateurs » de l’expérience n°2 entre la version originale et notre version remixée en son immersif de* B-A-B-Y *sur chaque caractéristique musicale de la chanson. (a) Général. (b) Âme. (c) Groove. (d) Arrangement.*

*Figure 45 : Appréciation de la chanson* B-A-B-Y *par les « consommateurs » de l’expérience n°2 à l’écoute de la version originale et de notre version remixée en son immersif*

Sur le plan des principales caractéristiques musicales de la chanson énoncées par ceux – ci en section III.A.2.1., les « consommateurs » estiment à 57,8% ressentir plus de groove dans notre version remixée. Ils viennent ainsi contredire l’avis des « producteurs » en section III.B.4., qui désignaient la version originale. De plus, ils sont 71,1% à penser que notre version immersive met mieux en valeur l’arrangement de la chanson. Enfin, bien que les avis soient plus partagés, les participants sont toujours plus nombreux à juger que notre réalisation retranscrit le mieux l’âme de la chanson (44,4% contre 35,6% pour la version originale).

Figure 46 : Version préférentielle des « consommateurs » de l’expérience n°2 entre la version originale et notre version remixée en son immersif de B-A-B-Y du rendu de chaque instrument pour chaque critère perceptif. (a) Présence. (b) Timbre. (c) Place dans l’espace. — *Figure 46 : Version préférentielle des « consommateurs » de l’expérience n°2 entre la version originale et notre version remixée en son immersif de* B-A-B-Y *du rendu de chaque instrument pour chaque critère perceptif. (a) Présence. (b) Timbre. (c) Place dans l’espace.*

Dans le détail, la figure 46 nous apprend que les « consommateurs » n’ont la plupart du temps pas de préférence particulière pour le rendu sonore des différents instruments. Toutefois, certaines tendances se révèlent importantes.

D’abord, parmi les trois instruments qu’ils ont pensés oralement être les garants de l’âme et du groove de la chanson⁶⁰, les participants sont les plus nombreux à préférer dans notre version remixée la présence de la voix⁶¹, et la présence et la place dans l’espace de la batterie. En revanche, ils sont très partagés concernant le timbre de la voix. La plupart d’entre eux (36%) le préfèrent dans la version originale, et d’autres (31%) dans notre version remixée. Cependant, en observant leurs justifications, nous remarquons qu’ils ne s’accordent pas sur ce qu’ils entendent : pour certains, la voix est plus présente ou bien plus agressive dans la version originale, et pour d’autres dans notre version remixée. En revanche, une tendance forte se dégage de la figure 46. Tous les participants ayant une préférence pour la présence et la place dans l’espace des instruments l’accordent très largement pour tous ceux-ci à notre version immersive. En particulier, la nouvelle présence des instruments⁶² a ravi de nombreux participants, grâce au nouvel espace propre qui apporte un vrai relief à l’ensemble. L’un des experts 1950-60 s’est réjoui de notre scène sonore pour pouvoir enfin chanter la partie de guitare et compter le nombre de cuivres : deux sax et une trompette. Plus globalement, 6 « consommateurs » ont aimé à travers notre version ressentir l’impression d’être dans le live, leur permettant de plus vivre la musique. Pour confirmer cette sensation de réalisme⁶³, l’un des experts 1950-60 nous a avoué retrouver enfin [ce qu’il attendait] du son d’Al Jackson, le batteur maison : il est un des co-fondateurs du son Stax, nous dit-il, c’est donc logique qu’il apparaisse comme cela, [avec] la soudaine brutalité du coup de caisse claire . À ce propos, de façon tout à fait surprenante, 3 des 5 participants connaissant le son Stax nous déclarent qu’il est le mieux retranscrit dans notre version remixée. Un autre expert 1950 -60, spécialiste du genre et du label, nous avance même alors que si un mixage en stéréo [de B- A-B-Y] avait été conçu à l’époque⁶⁴, cela aurait tout à fait pu être celui-là.

Figure 47 : Version sonore plongeant les « consommateurs » de l’expérience n°2 dans l’époque la plus éloignée d’aujourd’hui, la plus proche de l’époque d’enregistrement de la chanson

Nous arrivons à présent à la perception de la temporalité des versions sonores par les participants (figure 47). Pour rappel, bien qu’ils puissent s’en douter, ceux-ci ne savent pas qu’ils entendent la « version originale » et une « version remixée », et encore moins laquelle des deux versions A et B dissimule la version originale. De façon logique, c’est uniquement à travers cette version originale que la majorité des participants (53,3%) se trouvent baignés dans l’époque d’enregistrement de la chanson, qu’ils identifient souvent bien comme étant les années 1960. Les indices sonores ne leur manquent pas : un aspect plus brut, moins subtil, moins aéré de la version originale, au contraire de la modernité de notre version remixée, ressentie par la spatialisation des instruments. Mais par-dessus tout, nous sommes agréablement surpris par les 22,2% de participants qui ne se sentent plongés dans l’époque d’enregistrement que dans notre version immersive, pensant alors être la version originale. Nous n’avions pas prévu une telle perception de la part de ces participants, qui entendent dans notre version une sorte de grain musical qui correspond à leurs attentes imaginaires et les met ainsi en confiance. Ils ont été en fin de test très agréablement surpris de leur confusion⁶⁵ et ne pensaient pas que ce genre de technique de mixage existait , capable de donner un grain à une musique, comme si elle datait de plusieurs décennies . Enfin, la même part de participants (22,2%) dit se sentir dans la même époque à travers les deux versions entendues, les années 1960. Selon eux, même avec l’éclatement des sources de notre version immersive, le son très caractérisé de la moitié du XX^e siècle reste palpable. L’un des experts 1950-60 nous a même confié que le réalisme de notre version lui offrait un voyage temporel vers l’époque d’enregistrement.

Figure 48 : Envie des « consommateurs » de l’expérience n°2 d’écouter grâce à notre version remixée : (a) la chanson B-A-B-Y plus souvent qu’avec la version originale ; (b) le reste du catalogue du label Stax dans les mêmes conditions sonores — *Figure 48 : Envie des « consommateurs » de l’expérience n°2 d’écouter grâce à notre version remixée : (a) la chanson* B-A-B-Y *plus souvent qu’avec la version originale ; (b) le reste du catalogue du label Stax dans les mêmes conditions sonores*

En conclusion d’après la figure 48, les « consommateurs » sont une très large majorité (68,9%) à avoir désormais envie d’écouter la chanson B-A-B-Y avec notre version remixée, plus souvent qu’avec la version originale. En particulier, 82% des participants qui connaissent la chanson et 75% des participants qui écoutent souvent ou tout le temps de la musique soul/R&B pour leur plaisir, ressentent cette même envie. L’une des non musiciennes nous confie⁶⁶ être ébahie de découvrir que le positionnement des instruments joue à ce point sur les émotions procurées, quand l’un des experts 1950-60 nous indique qu’on aurait rêvé faire la chose pour ces artistes merveilleux de Memphis, Tennessee, et leur faire écouter . Par ailleurs, 86,7% des participants de notre test désireraient entendre le même type de transformation sonore sur l’ensemble du catalogue discographique du label Stax. En particulier, 87,5% des plus grands consommateurs de soul/R&B partagent ce désir.

5. Conclusions

En définitive, le remixage en son immersif de la chanson B-A-B-Y que nous avons opéré en section III.A. a conquis une large majorité de « consommateurs » de notre test, tant par rapport à la version originale que pour leur propre appréciation de la musique.

La plupart d’entre eux ressentent plus de plaisir à écouter cette chanson dans notre version immersive que dans la version originale, répondant ainsi à notre question Q.R.6. En attribuant à notre production une meilleure mise en valeur du groove et de l’arrangement musical, et même une meilleure retranscription de l’âme de la chanson, les « consommateurs » nous ont désigné leurs trois intérêts musicaux de remixer en son immersif la chanson de 1966 de Carla Thomas (problématique a). À leurs yeux, la musique s’épanouit dans son nouvel espace sonore qui revalorise la présence de tous les instruments et leur offre des timbres plus clairs et plus dignes du son du label Stax. En outre, bien que la majorité se sente davantage dans les années 1960 à travers la version originale, un groupe notable s’y retrouve tout autant en écoutant notre version immersive. Mieux, certains participants sont saisis par le réalisme sonore de celle-ci, qui les place soudain virtuellement devant les musiciens du groupe, en concert ou entre les murs du studio d’enregistrement.

Finalement, les « consommateurs » sont une très large majorité à éprouver l’envie d’écouter dans leur vie quotidienne la chanson B-A-B-Y plus souvent avec notre version remixée en son immersif qu’ils ne l’ont fait avec la version originale, répondant ainsi à notre question Q.R.7. Et ils sont encore plus nombreux à désirer entendre le reste du catalogue Stax, que beaucoup ne connaissent pas, dans des conditions de restructuration sonore similaires. Que le grand public exprime son envie de découvrir avec ce mode sonore un répertoire qu’il ne connaît pas suffisamment selon lui, incarne pleinement l’intérêt culturel du remixage en son immersif d’enregistrements monophoniques des années 1950 -60 (problématique a). Cela vient alors confirmer l’hypothèse des « producteurs » les plus optimistes sur la curiosité et l’engouement du grand public actuel pour ces reconstructions immersives d’enregistrements monophoniques. Néanmoins, pour répondre à notre problématique b, cet engouement ne vient pas combler une envie particulière des « consommateurs » actuels vis-à-vis des enregistrements anciens, car depuis longtemps, ils ont inévitablement appris à apprécier la musique au milieu des marqueurs temporels des versions originales. Simplement, d’après notre test, non seulement leur apprentissage ne les a pas enfermés dans une seule esthétique sonore possible pour la musique soul des années 1960, mais celle que nous avons adoptée dans notre version immersive a fait croître leur attachement à la musique, qu’ils ont pu pour la première fois apprécier dans son entièreté.

D. Discussion de l’expérience n°2 et conclusions

Cette seconde expérience nous apporte de forts enseignements sur le degré de pertinence musicale, culturelle et historique de la pratique du remixage en son immersif de masters monophoniques du répertoire soul des années 1950-60.

Initialement, les bienfaits d’une telle pratique sont musicaux. Comme nous l’avions pressenti en préambule, la chanson B-A-B-Y de Carla Thomas, dont le rendu sonore original a été le plus vivement critiqué par les participants de l’expérience n°1, a largement bénéficié de notre remixage en son immersif, d’après les participants de l’expérience n°2. Les premiers participants en sont à l’origine. En effet, nous avons retenu les principales caractéristiques musicales de l’œuvre qu’ils nous ont adressées, nous permettant de tracer notre direction de remixage. Nous avons noté leurs envies sonores dominantes vis-à-vis de la chanson, sur le plan du rendu de l’équilibre, des timbres et de l’espace des sources, et nous avons repris les manipulations de remixage qu’ils avaient amorcées pour les réaliser. À l’occasion d’une écoute comparative au cours de laquelle nous les avons invités à jouer le rôle d’un « producteur » de label, des professionnels de l’industrie discographique ont validé notre travail de remixage, respectueux de la chanson et lui offrant des timbres et un espace plus favorables à son expression. Lors d’une autre écoute comparative, les « consommateurs » de musique, que sont non musiciens, musiciens et experts musicaux 1950-60, comme les « producteurs », nous ont explicitement désigné le grand intérêt musical de remixer en son immersif des masters monophoniques des années 1950-60 : mettre en lumière l’arrangement d’une chanson (problématique a). En effet, certains éléments qui étaient dissimulés dans la version originale de B-A-B-Y sont soudain apparus aux oreilles de tous ces participants de manière claire et directe dans le nouvel espace de notre version immersive. Au contraire des « producteurs », les « consommateurs » y ont même mieux ressenti un autre aspect de la chanson : le groove. Cependant, l’observation des « producteurs » vérifie la nôtre pendant notre remixage. Comme le groove repose sur la fusion entre les instruments et que l’arrangement peut être éclairé par un éclatement spatial, il est difficile dans un remixage en son immersif d’améliorer réellement les deux aspects à la fois. C’est pourquoi nous avions choisi d’ouvrir l’espace conformément aux désirs des participants de l’expérience n° 1, et d’optimiser le groove en revoyant le niveau et le timbre de la basse et de la batterie, comme ils nous l’avaient également suggéré. Mais ce sont bien ces deux aspects musicaux réunis, qui constituaient alors notre direction de remixage tracée par les participants de l’expérience n°1, qui ont conduit la grande majorité des « consommateurs » à aimer écouter B-A-B-Y avec notre version immersive, plus qu’avec la version originale. Simultanément, cette majorité confirme l’expertise des « producteurs » sur le respect de l’œuvre dont fait preuve notre remixage. La recherche documentaire que nous avons effectuée sur l’identité du label Stax dans le contexte musical et politique des années 1960 nous a été très précieuse. Elle nous a aidés à éclairer l’œuvre sans la dénaturer, à changer drastiquement le rendu sonore du master original tout en respectant le style de la chanson et les intentions originelles des musiciens et des arrangeurs. Au vu des résultats des deux tests d’écoute comparative, nous y sommes parvenus.

Ainsi, par la musique, le remixage en son immersif de masters monophoniques des années 1950-60 trouve son intérêt culturel. Les « consommateurs », en montrant leur envie d’écouter de manière immersive B-A-B-Y comme le reste du catalogue Stax, répondent à l’adhésion des « producteurs » de commercialiser notre produit. La grande majorité de ces « consommateurs » exprimant cette envie nous ont avoué dans le même temps ne connaître que très vaguement le répertoire de ce label légendaire. La perspective pour eux serait ainsi alléchante : le découvrir en intégralité et avec le même plaisir d’écoute (problématique a).

Tandis que la question culturelle s’intéresse à la relation entre l’auditeur et les œuvres, la question historique pourrait concerner celle entre l’auditeur et les interprètes. Certains résultats de notre ultime test montrent cette tendance. Les « consommateurs » n’éprouvent pas d’envie particulière vis-à-vis des enregistrements anciens (problématique b), car ils se sont naturellement formés à l’idée que ceux-ci ne peuvent exister que dans leur apparence originale mono. Pourtant, en découvrant à travers notre test que cette démarche est en fait techniquement possible, ils sont surpris et fascinés. Plusieurs participants nous ont confié en écoutant notre version immersive avoir l’impression de se sentir virtuellement devant les musiciens, en concert ou sur le plateau du studio d’enregistrement. Bien que ces sensations de réalisme soient ici minoritaires, nous pensons juste et responsable de les prendre au sérieux dans le cadre du remixage en son immersif de masters monophoniques des années 1950 -60. En effet, les « producteurs » nous ont spontanément affirmé que la dimension immersive de notre nouveau master aurait pu être plus forte. Mais pensons au fait que, pour renforcer sa présence, nous pourrions continuer d’affiner les contours acoustiques de l’espace que nous souhaitons recréer en lien étroit avec le style musical. Alors ces participants immergés pourraient être en fait bien plus nombreux. Finalement, la large majorité des « consommateurs » conquis par la spatialisation des instruments d’une chanson enregistrée en 1966 s’accompagne de la sensibilité de certains participants au réalisme de notre master remixé pour nous indiquer le chemin à suivre des futurs travaux en matière de remixage immersif de masters monophoniques des années 1950-60 : préciser et renforcer vraiment l’immersion. Au regard de l’expérience n°2, nous sommes en mesure d’affirmer que le grand public semble prêt. De cette manière, si ces nouveaux produits réalistes et immersifs intègrent leurs habitudes d’écoute, ils créeront un espace commun entre deux époques distantes de plus de 60 ans, atout historique majeur pour les générations actuelles.

Discussion générale

Notre étude démontre l’intérêt musical, culturel et historique de remixer aujourd’hui en son immersif des masters monophoniques de blues/R&B/soul des années 1950-60. Pour cela, nous avons conçu deux expériences complémentaires : la première, qui évaluait les comportements de réflexion, d’écoute et de remixage de 24 participants face à des masters originaux de cette époque, nous a indiqué celui dont le rendu sonore défavorisait le plus le message musical, à savoir la chanson B-A-B-Y de Carla Thomas ; nous l’avons donc remixé en son immersif et l’avons soumis à 8 professionnels de l’industrie phonographique et 45 consommateurs de musique dans une seconde expérience d’écoute comparative avec le master original. D’abord, pour deux des trois morceaux du répertoire ciblé proposés à l’expérience n°1, les participants ont jugé en moyenne que le rendu sonore de leur version remixée servait davantage le propos musical que la version originale. Puis dans l’expérience n°2, les professionnels de l’industrie phonographique ont révélé le respect de l’œuvre originale dont faisait preuve notre version remixée en son immersif de B-A- B-Y, quand les consommateurs l’ont en grande majorité préférée à la version originale et seraient désormais prêts à écouter cette chanson plus souvent ainsi.

Plus précisément, les consommateurs éprouvent beaucoup de plaisir à entendre dans notre version remixée tout ce que la chanson B-A-B-Y comprend et véhicule d’un point de vue musical et émotionnel. Grâce au nouvel espace immersif introduit, comme les professionnels de l’industrie phonographique, ils ont aimé mieux percevoir les instruments qui constituent l’arrangement. Cet attrait confirme l’analyse de Giles Martin, qui a tout récemment remixé en son immersif l’album Pet Sounds des Beach Boys : « Placer ces sons dans un espace immersif signifie […] que vous pouvez entendre des instruments que vous n’avez jamais entendus auparavant. Ils sont dans l’enregistrement, mais ils sont maintenant dans un espace où vous pouvez les identifier » (The Beach Boys, 2023). En outre, selon les consommateurs, notre version remixée retranscrit mieux l’âme de la chanson, ce qui vient confirmer l’expertise des professionnels de l’industrie phonographique sur le respect de l’œuvre. « Les gens n’écoutent jamais de la technologie, ils écoutent de la musique », affirme Martin (Tamarkin, 2023). De même, nous n’avons pas souhaité faire un remixage technologique, mais musical de B-A-B-Y. Les résultats positifs de l’expérience n°2 viennent donc approuver l’intérêt pour la musique de penser réciproquement par elle lors du remixage, et bien avant déjà. Certes le rendu sonore du master original découle du magnétophone 2 pistes utilisé et du mixage de 8 voies effectué en direct. Mais la majorité des participants de l’expérience n°1 jugent que ces failles entravent le message musical des interprètes.

Par ailleurs, les moyens d’écoute du grand public ont bien évolué depuis les années 1960, et le casque, très usuel aujourd’hui, ne semble pas encourager les auditeurs à écouter de la musique en mono. Si l’on souhaite que ces trésors musicaux afro-américains traversent les époques, il serait opportun de l’adapter aux moyens d’écoute actuels. Nous suivons ainsi le discours de Martin : « Il y a une génération qui n’écoute pas de mono, alors comment respectez-vous cela ? » (Cruse, 2023). Comme les labels l’ont fait dans les années 1960 en privilégiant le master mono pour encourager le plus grand nombre d’écoutes à la radio, nous pourrions tout autant aujourd’hui satisfaire le grand public en lui proposant à la mesure de son medium favori un master binaural après réduction du master immersif. C’est là la politique menée par Apple avec ses catalogues musicaux en Dolby Atmos. Mais plutôt que de ne réserver ceux-ci qu’aux enregistrements stéréo, il serait aujourd’hui opportun de se pencher sur le cas des enregistrements mono. En effet, bien que nous le pensions encore améliorable, notre remixage en son immersif de B-A-B-Y a provoqué chez plusieurs participants une immersion si forte que pour la première fois en écoutant cette chanson de 1966, ils se sont sentis devant les musiciens entre les murs du studio d’enregistrement. Cette sensation a capté leur imaginaire, et leur a donné envie, comme bien d’autres, d’écouter les autres chansons du label Stax dans les mêmes conditions. L’intérêt culturel du remixage en son immersif de masters monophoniques des années 1950-60 est donc prolongé par un intérêt historique, puisque cette pratique, via la sensation de réalisme, pourrait permettre de construire pendant trois minutes un pont virtuel entre le moment actuel d’écoute et le jour d’enregistrement d’une chanson. Cette idée rejoint celle de Martin lorsqu’il a remixé Pet Sounds : « Ce que j’ai essayé de faire, c’est d’être plus proche de l’enregistrement […] et de trouver un sens à ce que c’est d’être dans le studio avec le groupe » (Tamarkin, 2023). Bien que les participants immergés auraient peut-être été plus nombreux si nous avions basé notre remixage sur la construction d’une scène sonore réaliste, ce phénomène donne en tout cas une réelle indication sur le potentiel perceptif de l’approche immersive. Notre étude illustre enfin la grande avancée aujourd’hui que représente la séparation de sources par apprentissage profond. Celle-ci satisfait un désir, celui de se réapproprier le son des enregistrements anciens, aux bandes multipistes alors inexistantes.

Grâce à sa détection décisive des harmoniques du signal, RipX nous a permis de remixer B- A-B-Y sans la moindre limitation, et le démasquage spatial des sources n’a pas fait ressortir d’artefact issu de la séparation. Pourtant, avant de le découvrir, nous avions opté pour l’outil SpectraLayers, pensant alors que retoucher aussi précisément les spectrogrammes des sources allait nous offrir un meilleur résultat de séparation que tous les autres outils automatiques du marché. Cette orientation spontanée, qui peut s’expliquer par notre expérience manuelle d’ingénieur du son, a conduit à une limite de notre étude, celle de ne pas avoir utilisé RipX en vue de l’expérience n°1. Cependant, découvrir successivement ces deux outils nous a permis d’approfondir notre connaissance de l’état de l’art de la séparation de sources et de choisir chaque outil en fonction de nos besoins. En particulier, si nous n’avions pas découvert l’éditeur SpectraLayers, nous n’aurions pas pensé pouvoir optimiser par retouche manuelle la séparation livrée par RipX, ultime étape qui a ouvert la voie de notre remixage final.

Par ailleurs, pour faciliter et donc améliorer encore la séparation de sources de RipX, nous aurions pu plutôt lui fournir le master stéréo de B-A-B-Y. Comme celle-ci a été enregistrée sur un magnétophone 2 pistes, toutes les sources sont totalement situées sur le canal gauche ou droit de la stéréo. Cette image sonore offre un démasquage avantageux entre les sources, ce qui permettrait donc pour elles une séparation plus aisée, plus proche encore d’une véritable bande multipiste. Par exemple, les accords secs de guitare confondus avec la caisse claire dans le master mono, auraient été mieux séparés depuis le master stéréo, où ils le sont déjà dans l’image.

Mais ces deux limitations n’ont ni entravé nos objectifs musicaux de remixage de B-A-B-Y, ni altéré les choix de remixage des premiers participants. En profitant des outils actuels de séparation de sources, nous sommes d’ailleurs finalement heureux d’avoir pu réaliser dans l’expérience n°1 le projet de Clavel (2003, p.5) de « proposer à [ceux-ci] d’effectuer [eux-mêmes leur] opération de mixage en [leur] laissant la possibilité de placer les sons à [leur] convenance ».

Avec les progrès constants des techniques de séparation de sources et l’engouement pour l’audio immersif, les perspectives de recherches s’avèrent exaltantes. Remixer en son immersif d’autres répertoires, d’autres époques d’enregistrement, en désigne sûrement une. En particulier, mesurer la grandeur acoustique d’un big band des années 1930-40 et se sentir soudain devant cette masse de musiciens est un projet crédible, mais hautement exigeant. Pour l’apprentissage supervisé, cela impliquerait de constituer un catalogue d’enregistrements de big band multipistes, caractérisés par un souffle, des timbres, un espace et une dynamique typiques de cette époque. Et recueillir une part de réalisme induirait d’améliorer sensiblement la bande passante originale. Parmi les méthodes actuelles d’apprentissage profond, les réseaux adverses génératifs (GAN) se démarquent. Ils peuvent générer de nouvelles données en analysant les modèles existants, redéfinir ainsi une image, en créant de nouveaux pixels à partir des pixels voisins. Il serait alors stimulant d’observer dans quelle mesure ce réseau est capable de créer de nouveaux harmoniques aux sources d’un enregistrement ancien. L’apprentissage profond peut-il donc créer l’illusion sonore ? Pour Yann Le Cun (2019), l’un des inventeurs de l’apprentissage profond, le réseau GAN est « l’idée la plus intéressante des 10 dernières années en matière d’apprentissage automatique ».

Conclusion

En constatant que les enregistrements de blues, R&B, soul des années 1950-60 ne sont plus aussi largement écoutés qu’autrefois, notre étude vise à évaluer le sens musical, culturel et historique de les remixer aujourd’hui en son immersif, et à savoir si cette pratique répond en effet à une envie des consommateurs actuels vis-à-vis de ces enregistrements. Finalement, elle démontre l’intérêt musical, culturel et aussi historique de cette pratique, qui ne répond certes pas à une envie particulière des consommateurs, n’ayant pas eu connaissance de son existence, mais qui suscite en eux un vif intérêt au regard de la musique.

Pour y parvenir, nous avons lié deux expériences. La première visait à observer les comportements de réflexion, d’écoute et de remixage de 24 ingénieurs du son, musiciens et experts du répertoire ciblé, face à trois masters originaux des années 1950-60. Sur deux morceaux, les résultats ont montré que leur version remixée présentait en moyenne un rendu sonore plus favorable à la musique que la version originale. À l’aide d’un outil de séparation de sources détectant les harmoniques, nous avons alors réalisé un remixage en son immersif l’une de ces deux chansons, que nous avons présenté dans une seconde expérience. Un premier test d’écoute comparative avec le master original visait à mesurer l’intérêt musical et culturel de présenter notre remixage au grand public. Huit professionnels de l’industrie phonographique ont jugé notre version respectueuse de l’œuvre originale, et le nouvel espace sonore éclairant musicalement. Presque tous ces experts du label ou du mixage immersif ont affirmé qu’ils la commercialiseraient s’ils dirigeaient un label. Un second test comparatif demandait à 45 consommateurs de musique leur préférence d’écoute entre les deux versions. La majorité, qui a préféré écouter notre remixage, a été ravie d’entendre tout ce que cette chanson contenait. Comme les professionnels, ils ont vu le grand intérêt musical du remixage immersif : valoriser l’arrangement qui a été pensé pour une œuvre en donnant une place nouvelle à tous les instruments. Un intérêt culturel ressort également, puisque les consommateurs ont été très nombreux à exprimer l’envie d’écouter cette chanson plus souvent en son immersif qu’en mono, et de découvrir ainsi le reste du catalogue du label. L’atout historique de cette pratique réside enfin dans l’illusion de certains d’avoir été projetés devant les musiciens de l’enregistrement. Remixer en son immersif des masters monophoniques peut donc établir pendant trois minutes une passerelle entre deux époques lointaines. Tous nos objectifs de recherche ont été atteints, bien que, si nous l’avions découvert plus tôt, nous aurions pu utiliser dès l’expérience n°1 l’outil RipX, avec lequel nous avons séparé les sources de cette chanson. Toutefois, cela n’a pas faussé nos résultats. Toujours guidé par un sens musical, ce procédé peut être étendu à d’autres catalogues d’enregistrements et bientôt des effectifs plus denses, grâce aux progrès constants des systèmes de séparation de sources par apprentissage profond.

Bibliographie

Apple. Audio Spatial, 2023. https://music.apple.com/us/curator/apple-music-audio- spatial/1564180390?l=fr-FR

Ausseil, D., Contamine, C.-H., & Chapoullié, D., La Route du blues. Éditions d’Art J. P. Barthélémy, 1995.

Barry, E. D., High-fidelity sound as spectacle and sublime, 1950–1961. Dans Sound in the Age of Mechanical Reproduction, pp.115-138, 2010. DOI: 10.9783/9780812206869.115

Bas-Rabérin, P., Le blues moderne, 1945-1973. Paris: Albin Michel, 1973.

Bode, H., History of electronic sound modification. Dans Journal of the Audio Engineering Society, 32(10), pp.730-739, 1984.

Bowman, R., Soulsville, U.S.A.: The Story of Stax Records. New York: Schirmer Books, 1997. Cabanillas, R., Mixing Music In Dolby Atmos [Capstone Projects and Master’s Theses].

California State University, Monterey Bay (Fresno, États-Unis), 2020.

Chalot, C., & Guittet, H., NomadPlay : FAQ, 2017. https://www.nomadplay.app/fr/faq Clavel, C., Séparation des sons musicaux. Approche bayésienne et méthode de Monte-Carlo [Stage DEA ATIAM]. Télécom Paris (Paris-Saclay, France), 2003.

Cogan, J., & Clark, W., Temples of sound : Inside the great recording studios. San Francisco: Chronicle Books, 2003.

Cruse, R., Les « Pet Sounds » séminaux des Beach Boys arrivent dans le mix Dolby Atmos de Giles Martin. Dans Maison Du Jeu !, 2023.

Dolby, Webinar 1/3 : Introduction Dolby Atmos [Vidéo], 2020. https://www.youtube.com/watch?v=naTJwllCmCw

Dolby, Webinar 3/3 : Mixage Dolby Atmos [Vidéo], 2021. https://www.youtube.com/watch?v=rGCngKQOxpw

Dobrev, L., SpectraLayers 7: More AI, less clicks for Steinberg’s spectral editor. Dans Gearnews, 2020.

Erard, N., La spatialisation dans le spectacle vivant : Quelles différences entre la chaîne audio de sonorisation d’un spectacle traditionnel et d’un spectacle spatialisé ? [Mémoire FSMS]. CNSMDP (Paris, France), 2020.

Ewert, S., & Müller, M., Using score-informed constraints for NMF-based source separation. Présenté à la IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) à Kyoto, Japon, 2012. DOI: 10.1109/ICASSP.2012.6287834

Facciotto N., Troiani E., Martinez M. J., Source Identification and Classification of Acoustic Emission Signals by a SHAZAM Inspired Pattern Recognition Algorithm. Présenté l’International Workshop on Structural Health Monitoring (IWSHM) à Palo Alto, États-Unis, 2017. DOI: 10.12783/shm2017/13989.

Garofalo, R., Crossing Over : From Black Rhythm & Blues to White Rock’n’Roll. Dans Rhythm and Business: The Political Economy of Black Music, Kelley, N., New York: Akashit Books, pp.112-137, 2002.

Gilotaux, P., La fabrication des disques. Dans Groupe d’Acoustique Musicale (28), 1967. Glaser B. G., & Strauss A. L., The Discovery of Grounded Theory: Strategies for Qualitative Research. Piscataway: Aldine Transaction, 1967.

Gordon, R., Respect Yourself: Stax Records and the Soul Explosion. Bloomsbury Publishing USA, 2013.

Goto, M., RWC Music Database, 2002. https://staff.aist.go.jp/m.goto/RWC-MDB/ Gover, M., Score-Informed Source Separation for Choral Music [Master Thesis]. McGill University (Montréal, Canada), 2019.

Guralnick, P., Sweet Soul Music: Rhythm & Blues et rêve sudiste de liberté. Paris: Editions Allia, 2003.

Hennequin, R., Khlif, A., Voituret, F., & Moussallam, M., Spleeter: A fast and efficient music source separation tool with pre-trained models. Dans Journal of Open Source Software, 5(50), 2020.

Hennequin, R. & al., Spleeter by deezer, 2021. https://github.com/deezer/spleeter Hit’n’Mix, History of Audio Separation 2001 to Now, 2021. https://hitnmix.com/2023/07/17/history-of-audio-separation/

Hofstein, F., Le rhythm and blues (coll. Que sais-je ?), Paris: Presses universitaires de France, 1991.

I’MTech, Gaël Richard, chercheur du son. Dans I’M Tech, 2020.

International Federation of the Phonographic Industry (IFPI). Engaging with Music, 2022. Jolibert, B., Le blues et sa musique. Dans Expressions (20), pp.171 187, 2002.

Kagan, A., How To Listen to Immersive Audio. Dans Sonarworks Blog, 2022.

Kimizuka, M., Historical Development of Ma0gnetic Recording and Tape Recorder. Dans

Survey reports on the systemization of technologies, vol.17, pp.185-273, 2012.

Lambert, P., Brian Wilson’s Pet Sounds. Dans Twentieth-Century music, vol.5(1), pp.109-133, 2008. DOI: 10.1017/S1478572208000625

Le Cun, Y., L’apprentissage profond, une révolution en intelligence artificielle. Dans La lettre du Collège de France, (41), p.13, 2016.

Le Cun, Y., Quand la machine apprend : La révolution des neurones artificiels et de l’apprentissage profond. Paris: Odile Jacob, 2019.

Lemesle, P., Il était une fois… La T.S.F. : Les Années 60…, 2015. https://radio- passion.pagesperso-orange.fr/annees60/frameannees60.htm

Licata Caruso, D., Les insolentes ventes d’écouteurs sans-fil portées par les AirPods d’Apple. Dans Le Parisien, 2022.

Liutkus, A., Durrieu, J.-L., Daudet, L., & Richard, G., An overview of informed audio source separation. Présenté au 2013 14th International Workshop on Image Analysis for Multimedia Interactive Services (WIAMIS) à Paris, France, 2013. DOI: 10.1109/WIAMIS.2013.6616139 Mercier D. & al., Le livre des techniques du son (4^e ed.). Paris: Dunod, 2010.

Miron, M., Carabias-Orti, J. J., Bosch, J. J., Gómez, E., & Janer, J., Score-informed source separation for multichannel orchestral recordings. Dans Journal of Electrical and Computer Engineering, (11), p.1-19, 2016. DOI: 10.1155/2016/8363507

Müller, M., Fundamentals of Music Processing : Using Python and Jupyter Notebooks (2^nd ed.). Cham: Springer, 2021.

Mulligan, M., Music subscriber market shares Q2 2021. Dans MIDiA Research, 2022. https://www.midiaresearch.com/blog/music-subscriber-market-shares-q2-2021 Mulligan, M., Music subscriber market shares 2022. Dans MIDiA Research, 2022. https://www.midiaresearch.com/blog/music-subscriber-market-shares-2022

Pirenne, C., Vocabulaire des musiques afro-américaines. Paris: Minerve, 1994.

Poole, A., The strange career of Jim Crow archives: Race, space, and history in the mid- twentieth-century American south. Dans The American Archivist, vol.77(1), pp.23-63, 2014. Rastogi, H., Apple First to Capture 8 Spots in List for Global Top 10 Smartphones. Dans Counterpoint Research, 2023.

Rémond, A., L’enregistrement magnétique : Vers la bande magnétique et le magnétophone. Dans Radiofil Magazine, (69), pp. 16-25, 2015.

Richard, G., Sundaram, S., & Narayanan, S., An overview on perceptually motivated audio indexing and classification. Dans Proceedings of the IEEE, vol.101(9), pp.1939-1954, 2013. Ripani, R. J., The New Blue Music : Changes in Rhythm & Blues, 1950-1999. Jackson: University Press of Mississippi, 2006.

Rumsey, F., & McCormick, T., Son & enregistrement. Paris: Eyrolles, 2002.

Schulze-Forster, K., Informed audio source separation with deep learning in limited data settings [PhD Thesis]. Institut polytechnique de Paris (Palaiseau, France), 2021.

Simon, G., Vers une salle d’écoute dédiée à la musique spatialisée [Mémoire FSMS]. CNSMDP (Paris, France), 2018.

Singleton, M., Apple Music’s Spatial Audio Strategy Is Paying Off With More Listeners, Major Releases. Dans Billboard, 2022.

Spotify. Qualité Audio, 2023. https://support.spotify.com/fr/article/audio-quality/

Stotzer, S., VisualAudio : Caractéristiques matérielles des disques phonographiques. Dans

Département d’informatique, Université de Fribourg, 2003.

Tamarkin, J., ‘Pet Sounds’ in Dolby Atmos: Respect the feelings. Dans Tidal Magazine, 2023. The Beach Boys, Giles Martin introduces The Beach Boys’ ‘Pet Sounds’ in Atmos [Vidéo]. https://www.youtube.com/watch?v=2drX6yEhktg

Thornton, M., Dolby Atmos – Remastering Music – An Introduction [Vidéo], 2020. https://www.production-expert.com/home-page/2020/1/6/remastering-music-in-immersive- audio

Woods, C., Development Arrested: The Blues and Plantation Power in the Mississippi Delta. New York: Verso Books, 2017.

Annexes

Annexe B1 : Expérience n°1 – Informations relatives aux enregistrements sélectionnés

Wonder What is Wrong with Me – Lightnin’ Hopkins (1956), du répertoire blues

Compositeur, parolier : Lightnin’ Hopkins

Enregistrée en avril 1954 aux studios ACA à Houston, Texas

Sortie chez Ace Records sous ce titre, puis chez Herald Records sous le titre

Lightnin’ Don’t Feel Well

Disques :[45T] Wonder What is Wrong with Me / Bad Boogie, Ace Records [Ace 516], mai 1956 [45T] Lightnin’ Don’t Feel Well / My Little Kewpie Doll, Herald Records [H-520], mai 1958

Labels : Ace Records / Herald Records ISWC : ACA 45-3313

Lightnin’ Hopkins – voix, guitare Donald Cooks – basse

Ben Turner – batterie

Oh, Marie – Louis Prima (1959), du répertoire jazz/R&B

Compositeurs : Eduardo di Capua, Alfred Mazzucchi Parolier : Vincenzo Russo, Louis Prima

Enregistrée aux studios Capitol à Los Angeles, Californie, pour le film Hey Boy! Hey Girl! de David Lowell Rich, sorti le 5 août 1959

Album : [33T] Music from the Soundtrack of the Columbia Picture “Hey Boy! Hey Girl!” [T- 1160]

Label : Capitol Records Producteur : Voyle Gilmore ISWC : T-902.878.576-4

Louis Prima – voix, trompette

with Sam Butera & The Witnesses:

Sam Butera – saxophone ténor, chœurs Lou Sino – trombone, chœurs

Robert J. Carter – piano

Bob Roberts – guitare, chœurs

Antony Liuzza – basse, chœurs Paul Ferrara – batterie

B-A-B-Y – Carla Thomas (1966), du répertoire soul

Compositeur : Isaac Hayes Parolier : David Porter

Arrangeurs : Booker T. Jones, Steve Cropper

Enregistrée les 18-19 juillet 1966 aux studios Stax à Memphis, Tennessee

Sortie en 45T [S-195] le 27 juillet 1966, puis en 33T dans l’album Carla [S-709] en octobre 1966 Label de production : Stax Records

Label de distribution : Atlantic Records Ingénieur du son : Tom Dowd Producteur : Jim Stewart

ISWC : T-070.232.055-5

Classement : N°3 R&B / N°14 pop

Carla Thomas – voix, chœurs with Booker T. & the MG’s :

Booker T. Jones – orgue Hammond Steve Cropper – guitare

Donald “Duck” Dunn – basse Al Jackson Jr. – batterie

and The Memphis Horns : Wayne Jackson – trompette

Andrew Love – saxophone ténor Floyd Newman – saxophone baryton

Just Call Me Lonesome – Jim Reeves (1959), du repertoire country [test de remixage]

Compositeur et parolier : Rex Griffin

Enregistrée le 19 décembre 1958 aux studios RCA Victor à Nashville, Tennessee

Sortie en septembre 1959 dans l’album Songs to Warm the Heart [LSP-2001] Label : RCA Victor

Ingénieur du son : Bob Farris Producteur : Chet Atkins

Jim Reeves – voix, guitare Chet Atkins – guitare Floyd Cramer – piano Bob Moore – basse Buddy Harman – batterie

Annexe B2 : Expérience n°1 – Questions de l’entretien préliminaire semi-dirigé

QA1 : Comment définiriez-vous l’« esthétique sonore » d’un enregistrement musical ? Que vous évoque ce terme ?

QA2 : En général, comment considérez-vous la relation entre une œuvre musicale et l’esthétique sonore choisie pour son enregistrement ?

Comment considérez-vous la relation entre l’esthétique sonore choisie et notre perception postérieure de l’œuvre enregistrée ?
Selon vous, à quoi ressemblerait l’esthétique sonore qui serait dans une « relation idéale » avec l’œuvre musicale qu’elle doit embrasser ? Vous pouvez brièvement illustrer vos propos par un exemple d’artiste ou d’enregistrement dans lequel vous pensez que cette relation est idéale, et un autre dans lequel vous pensez qu’elle ne l’est pas.

Plaçons-nous dès à présent dans le contexte des musiques écrites et enregistrées dans les années 1950⁶⁷ (Ray Charles, Ella Fitzgerald, Miles Davis, Art Blakey, Muddy Waters, Elvis Presley, Little Richard, Johnny Cash, The Chordettes, Edith Piaf, Georges Brassens…).

QA3 : Comment pensez-vous cette même relation ?

Conceptuellement, l’œuvre musicale et l’esthétique sonore qui a été choisie pour son enregistrement sont-ils selon vous deux éléments aujourd’hui dissociables ou indissociables ? Pouvez-vous illustrer vos propos par un exemple d’artiste ou d’enregistrement qui vous est familier ?

Si cela n’est déjà fait, pensez à un enregistrement de musiques dites « actuelles » que vous connaissez des années 1950, pour lequel le rendu sonore, voire l’esthétique sonore dans son ensemble, dessert selon vous la musique qui a été pensée et composée.

Imaginez qu’il en soit possible de modifier le rendu sonore dans le but d’optimiser la relation œuvre/esthétique.

QA4 : Quel regard porteriez-vous sur cette pratique ?

Cela impliquerait-il de toucher à l’œuvre musicale elle-même selon vous ? Si oui, qu’en pensez-vous ?

QA5 : Si vous aviez la possibilité d’en modifier certains aspects sonores, le feriez-vous ?

→ Oui : dans quel(s) but(s) ? Travailleriez-vous avec l’idée d’une certaine fidélité vis- à-vis de l’œuvre musicale originale, vis-à-vis de l’esthétique sonore originale, ou bien en toute indépendance ? Pensez-vous à un aspect sonore en particulier ?

→ Non : pourquoi ?

Annexe B3 : Expérience n°1 – Questionnaire d’écoute du master original

QB1 : Qu’entendez-vous dans cette musique ? Qu’est-ce qui y est important pour vous ? Que vous inspire-t-elle ? Quelle image, quel sentiment vous vient en l’écoutant ? Vous pouvez par exemple évoquer le genre, le style, les instruments, le tempo, les nuances, le caractère… et toute considération personnelle.

QB2 : Comment évaluez-vous le rendu sonore de ce master original, au regard du morceau et de ses caractéristiques musicales précédemment évoquées ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Expliquez brièvement votre notation.

QB3 : Comment évaluez-vous le rendu de l’équilibre entre les différentes sources sonores, au regard du morceau et de ses caractéristiques musicales ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Expliquez brièvement votre notation.

QB4 : Comment évaluez-vous le rendu du timbre des différentes sources sonores, au regard du morceau et de ses caractéristiques musicales ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Expliquez brièvement votre notation.

QB5 : Comment évaluez-vous le rendu de l’espace des différentes sources sonores, au regard du morceau et de ses caractéristiques musicales ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Expliquez brièvement votre notation.

QB6 : Finalement, si à vos yeux la relation œuvre/esthétique sonore n’est ici pas idéale, et si vous en aviez la possibilité, quelles modifications sonores prioritaires apporteriez-vous pour que ce morceau connaisse selon vous son rendu sonore idéal ? N’hésitez pas si possible à en préciser le but.

Annexe B4 : Expérience n°1 – Enoncé de la séance de remixage en son spatialisé

Selon votre convenance, vous allez avoir la possibilité de modifier certains aspects sonores de ces trois enregistrements précédemment entendus.

Les sources de chaque enregistrement ont alors été préalablement séparées par un dispositif technique spécifique, afin de vous permettre d’agir individuellement sur chacune d’elles pour cette séance personnelle de remixage.

Phase d’entraînement

Tout d’abord, vous disposez d’un temps illimité pour prendre connaissance des outils qui sont face à vous et qui vous permettront, si vous le souhaitez, d’effectuer selon votre convenance un remixage de ces trois extraits musicaux des années 1950-60. Porté sur un enregistrement-test de musique country, ce temps d’entraînement vous est réservé pour vous familiariser avec la présente interface, et en particulier avec l’action des 4 paramètres de mixage qui vous sont proposés pour chaque source sonore :

Gain (= volume)
Egalisation spectrale (= timbre)
Localisation spatiale
Niveau de réverbération

Chacun de ces paramètres influe sur un aspect sonore précis et facilement audible de la source envisagée. Pour entendre leur impact respectif distinctement, vous pouvez par exemple les poussez à leurs extrêmes.

Ne passez donc à la phase suivante que lorsque vous vous sentez bien à l’aise avec l’outil en main, et que vous avez bien entendu et intégré l’action de ces paramètres de mixage.

Phase de réalisation : remixage des morceaux A, B et C

Une fois l’outil bien en main et le morceau A bien en tête, la phase de remixage commence.

Une règle se présente à vous : vous avez jusqu’à 12 manipulations pour remixer ce morceau selon vos envies. La manipulation d’un paramètre est comptabilisée à partir du moment où vous commencez à en manipuler un autre, et ainsi de suite. Donc par exemple : si vous modifiez le gain d’une source en plusieurs fois d’affilée, cela sera compté comme 1 manipulation. En revanche, si après cela vous décidez de modifier le niveau de réverbération pour cette même source et que vous recorrigez ensuite le gain, l’ensemble sera compté comme 3 manipulations (gain – réverbération – gain). Le seul contre-exemple est le suivant : toucher successivement aux différents potentiomètres d’égalisation d’une même source ne comptera que comme 1 manipulation.

Important : si tel est votre choix, vous pouvez très bien signifier que vous avez terminé votre remixage sans même avoir atteint ce nombre de 12 modifications.

Vous pouvez à tout moment et librement déplacer la tête de lecture pour vous concentrer sur les sections du morceau qui vous intéressent.

Cette séance unique n’est pas un examen, mais une expérience : il n’y a donc ni bon, ni mauvais choix. Sentez-vous simplement vous-même, et surtout, faites-vous plaisir !

Annexe B5 : Expérience n°1 – Questionnaire d’autocritique de chaque nouveau master remixé par les participants

QD1 : Comment évaluez-vous le rendu sonore de ce nouveau master, que vous venez de produire, au regard du morceau et de ses caractéristiques préalablement évoquées ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Pouvez-vous brièvement expliquer votre notation et le but de vos manipulations de remixage ? Lesquelles sont particulièrement à vocation corrective ?

Lesquelles sont particulièrement à vocation esthétique ?

QD2 : Comment évaluez-vous le rendu de l’équilibre entre les différentes sources sonores, au regard du morceau et de ses caractéristiques ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Expliquez brièvement votre notation.

QD3 : Comment évaluez-vous le rendu du timbre des différentes sources sonores, au regard du morceau et de ses caractéristiques ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Expliquez brièvement votre notation.

QD4 : Comment évaluez-vous le rendu de l’espace des différentes sources sonores, au regard du morceau et de ses caractéristiques ?

1	2	3	4	5	6	7
(Hors de propos)						(Idéal)

Expliquez brièvement votre notation.

QD5 : Avez-vous été perturbé(e) par un quelconque élément durant :

l’écoute du master original du morceau ? Précisez si possible.
le remixage du morceau ? Précisez si possible.
l’écoute de votre propre master ? Précisez si possible.
un autre moment de l’expérience ? Précisez si possible.

QD6 : Le processus préalable de séparation de sources a pu restituer des signaux incomplets ou endommagés par divers artefacts. Vous ont-ils perturbé(e), limité(e) dans vos différents choix de remixage ? Illustrez vos propos le cas échéant.

QD7 : Avez-vous d’autres remarques que vous souhaitez formuler pour ce morceau ?

Annexe B6 : Expérience n°1 – Retours généraux

Légende : IS = Ingénieur du son / M = Musicien / P = Expert 1950-60

Participant	Retour général de l’expérience n°1
IS1	Pas l’habitude de me poser ces questions, qui m’ont finalement animée.
IS2	Expérience intéressante. C’est une pratique très utile et fructueuse pour modifier l’équilibre général et certains timbres. Mais la qualité des signaux limite fortement la possibilité d’élargir l’image sonore de ces masters. La génération d’harmoniques sur ces signaux pourrait ouvrir le champ des possibles sur l’aspect spatial.
IS3	–
IS4	–
IS5	Expérience vraiment intéressante, très cool. Analyser et critiquer ce qu’on fait. Je me rends compte que ce n’est pas simple d’enregistrer des vieux enregistrements. Exercice ludique, c’est agréable. Seule frustration : 12 manipulations. Je me rends compte ici que le bouton « solo » ne sert à rien ici. L’interface de remixage est bien.
IS6	Vos choix de morceaux sont bien, à la fois peu et beaucoup de sources. J’ai été très surpris sur les morceaux R&B (première fois que je vois une piste dégradée (piano) apporter au mix musicalement ET esthétiquement) et soul (amélioration très rapide du rendu sonore avec si peu de manipulations et de paramètres, très agréablement surprenant). J’ai été intéressé par cette expérience, qui me confirme que le bouton « solo » devrait été banni. On s’en fout comment une source sonne seule. Le bouton « mute », lui, est beaucoup plus musical, on doit le conserver, car c’était avec celui-ci qu’on se rend compte de l’apport de la source dans l’arrangement musical.
IS7	Très sympa, on devrait faire ça plus souvent. Le fait de mixer change la perception par rapport à une phase d’écoute.
IS8	C’était marrant !
M1	–
M2	Très rigolo !
M3	–
M4	–
M5	Super ludique. Super intéressant. C’est un terrain sur lequel je vais peu avec la parole. Cette expérience me permet de revoir beaucoup de termes, d’être précis dans ce que je dis. L’outil de remixage est instinctif, ce qui permet de se concentrer sur l’essentiel et rend l’écoute plus fine et plus directe, ce qui est très important, c’est cool.
M6	C’est fou de sentir qu’on peut isoler un instrument et l’entendre seul… La séparation de sources serait très utile pour retranscrire des partitions, « repiquer un solo ». J’en ai rêvé plein de fois dans ce but musical, pour savoir dans l’orchestre ce qui fait que ça groove autant, « chercher les fonds de sauce », pour pouvoir le réappliquer à l’identique dans un autre morceau, une composition personnelle. Il faudrait à la limite refaire les mêmes défauts à la prise, pour préparer ce processus de son. C’est un outil pédagogique fabuleux. Retoucher le son d’enregistrements passés m’intéresse, il est vrai…
M7	C’était trop bien !
M8	Très riche expérience, qui permet d’analyser ses propres analyses.
P1	J’attendais ce genre d’expérience depuis longtemps. Je m’attendais un petit peu à cela, j’étais un peu excité. Cela a tout à fait répondu à mes attentes. J’avais connaissance de la chose [la séparation de sources], mais je n’avais jamais pu remixer des œuvres de cette époque, que je connais bien. Je pourrais rester pendant longtemps devant la machine à remixer …
P2	Expérience intéressante ! Je comprends la nécessité de limiter les outils pour le remixage. La séparation de sources ne permet pas encore de remixer en profondeur ou au moins selon nos envies…
P3	Mon idée de ne pas toucher à la mono d’un master mono s’est confirmée à travers cette expérience. Cela doit rester mixé et écouté en mono, si l’on s’appuie sur le même objet d’origine (au contraire d’un réenregistrement).
P4	Le son, cela me passionne. Cette salle est un laboratoire, c’est super. Voir qu’on peut améliorer le rendu sonore, cela m’intéresse beaucoup, même sur des enregistrements plus récents.
P5	Très intéressant. Avec ces exemples, je me rends compte que c’est intéressant d’avoir ces outils pour remixer. La technologie de séparation est impressionnante, cela pose des questions sonores et éthiques qu’on ne se posait pas avant, parce que ce n’était tout simplement techniquement pas possible.
P6	Vous atteignez toutes mes capacités à travers vos questions après l’écoute des masters originaux : vos questions sont très bonnes, c’est très intéressant. Heureusement que je n’ai pas cet outil à la maison, je ne dormirais plus ! Je serais plus addict à cela qu’aux jeux vidéo, on joue à l’apprenti sorcier ! (rires)
P7	Cela peut être un très bon outil pour la pédagogie d’oreille, pour les personnes qui apprennent la musique. Super intéressant.

Super intéressant. Cela donne envie de bidouiller pour voir comment on peut changer ces rendus. J’ai toujours tendance à penser qu’il manque quelque chose en mono, un manque de relief, d’espace. Cela est lié à mes pratiques d’écoute car j’écoute beaucoup au casque. L’audio immersif m’a déjà fasciné dans quelques expériences passées, j’ai voulu appliquer cela ici à ma manière.

Annexe C1 : Expérience n°2 – Tableau récapitulatif de l’amélioration progressive de la qualité des signaux isolés de la chanson B-A-B-Y de Carla Thomas

Stem/Source	SpectraLayers brut	SpectraLayers retouché	RipX brut	RipX retouché
Global	Souffle conservé	–	Souffle retiré	–
	Aucune perte de signal	–	Perte d’harmoniques aigues (cymbales/piano/chœurs)	–
	Spectre entièrement conservé	–	Coupure des fréquences >20 kHz	–

Voix	Cohabitation avec orgue/cuivres	Peu d’interférences orgue	Cohabitation avec orgue	Faibles interférences orgue
	Interférences batterie	Interférences batterie/piano/guitare/cuivres	Aucune interférence	–
	Présence de souffle	–	Aucun souffle	–
	Réverbération perçue	–	Peu de réverb perçue	–

Cuivres	[Stem « Autres »] Cohabitation avec piano/orgue/guitare / Interférences basse	Pas de cohabitation	[Stem « Strings »] Cohabitation avec orgue/guitare	Pas de cohabitation
		Interférences guitare/batterie	–	Faibles interférences guitare
		Spectre légèrement plus complet que RipX	Spectre rarement plus complet que SpectraLayers	Spectre moins complet que SL retouché / Spectre incomplet à 2’20 car mélange accord guitare

Orgue	[Stem « Autres »] Cohabitation avec cuivres/piano/guitare / Interférences basse	Pas de cohabitation	[Stem « Strings »] Cohabitation avec cuivres/guitare	Pas de cohabitation
		Peu de transitoires		Transitoires un peu plus nombreuses

Piano	Quasiment aucun signal, fréquences parasites	Piano sans main gauche, donc étriqué vers l’aigu	Piano complet, récupération de la main gauche	–
		Instabilité de la réponse du signal isolé (alors qu’ostinato)	Stabilité de la réponse du signal	–
		Transitoires manquantes en tutti	Transitoires récupérées en tutti	–

		Artefacts	Très peu d’artefacts	–
		Interférences basse/batterie/voix	Aucune interférence	Faibles interférences cuivres
		Récupération du souffle en intro	Aucun souffle repris	–

Guitare	[Stem « Autres »] Cohabitation avec cuivres/piano/orgue / Interférences basse	Aucune cohabitation	Cohabitation avec cuivres	Pas de cohabitation
		Interférences voix	Interférences piano/orgue/basse	Faibles interférences cuivres
		Spectre incomplet (bas, harmoniques) / Instrument parfois méconnaissable	Spectre complet	Spectre plus dense que SpectraLayers retouché (bas, harmoniques) / Instrument net

Basse	Enveloppe floue (pas d’attaque, pas de release)	Enveloppe floue (pas d’attaque, pas de release) / Aucune perception du jeu du bassiste	Enveloppe beaucoup plus définie (perception attaque/release) / Perception du jeu et du groove du bassiste	–
	Interférences cuivres/orgue/piano/ guitare/kick	Interférences minimes kick	Interférence orgue	Aucune interférence
		Irrégularité harmonique du signal	Régularité harmonique du signal	–

Batterie	Stem Percussions unique	Stem Percussions unique	Stem Kick (interférences snare) Stem Drums Stem Percussions	Stem Kick (aucune interférence) Stem Drums (« Drums » + « Percussions »)
	Interférences voix/cuivres/orgue/ guitare	Interférences harmoniques voix/guitare	Interférences orgue/guitare	Brèves interférences guitare (sur les coups de snare)
		Coups de kick inégaux en niveau	Coup de kick égaux en niveau	–
		Irrégularité harmonique du signal (snare)	Régularité harmonique du signal (snare)	–

Annexe C2 : Expérience n°2 – Questionnaire du test d’écoute pour « producteurs » Bienvenue à ce test d’écoute comparative ! Pour vous connaître un peu mieux…

QE1 : Vous participez en tant que…

□ Ingénieur(e) du son □ Réalisateur(rice) artistique □ Producteur(rice) musical(e) QE2 : Quel âge avez-vous ?

QE3 : Connaissez-vous le label Stax Records ?

□ Oui □ Non

QE4 : Connaissez-vous le « son Stax », aussi appelé « Memphis Sound », caractéristique du label Stax Records ?

□ Oui □ Non

QE5 : Connaissez-vous le format audio Dolby Atmos ?

□ Oui □ Non

QE6 : Pratiquez-vous le mixage en son immersif ?

□ Oui □ Non

Ecoute du master original de B-A-B-Y

QF1 : Après cette écoute, comment évaluez-vous le rendu sonore global du master original B-A- B-Y, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QF2 : Comment évaluez-vous le rendu de l’équilibre entre les différentes sources, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QF3 : Comment évaluez-vous le rendu du timbre des différentes sources, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QF4 : Comment évaluez-vous le rendu de l’espace des différentes sources, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QF5 : Pouvez-vous expliquer en quelques mots vos notations et vos impressions du rendu sonore du master original de la chanson B-A-B-Y, au regard de ce que suggère selon vous la musique ?

QF6 : Avez-vous été perturbé(e) par un ou des éléments sonores extérieurs durant l’écoute du master original ?

Ecoute du master remixé en son immersif de B-A-B-Y

QG0 : Quelles sont vos toutes premières pensées générales au sortir de cette seconde écoute ? (Facultatif)

QG1 : Comment évaluez-vous le rendu sonore global du master remixé de B-A-B-Y, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QG2 : Comment évaluez-vous le rendu de l’équilibre entre les différentes sources dans le master remixé, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QG3 : Comment évaluez-vous le rendu du timbre des différentes sources dans le master remixé, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QG4 : Comment évaluez-vous le rendu de l’espace des différentes sources dans le master remixé, au regard des caractéristiques musicales et stylistiques de la chanson ?

1	2	3	4	5	6	7
Hors de propos						Idéal

QG5 : Pouvez-vous expliquer en quelques mots vos notations et vos impressions du rendu sonore du master remixé de la chanson B-A-B-Y, au regard de ce que suggère selon vous la musique ?

QG6 : Avez-vous été perturbé(e) par un ou des éléments sonores extérieurs durant l’écoute du master remixé ?

Comparons les deux masters…

QH1 : Selon vous, l’âme (soul) de la chanson est…

□ mieux retranscrite dans le master original □ mieux retranscrite dans le master remixé

□ également retranscrite dans les deux masters □ Je ne sais pas

QH2 : Lequel des deux masters entendus vous fait le plus ressentir le groove de la chanson ?

□ Le master original □ Le master remixé □ Les deux à égalité □ Je ne sais pas

QH3 : Selon vous, lequel des deux masters entendus met le mieux en valeur l’arrangement de la chanson ?

□ Le master original □ Le master remixé □ Les deux à égalité □ Je ne sais pas

Conclusion

QI1 : Toute considération matérielle exclue, pensez-vous que le master remixé en son immersif donnerait envie au grand public d’écouter la chanson B-A-B-Y plus souvent qu’avec la version originale ?

□ Oui □ Non □ Je ne sais pas

QI2 : Toute considération matérielle exclue, pensez-vous que le master remixé en son immersif donnerait envie au grand public d’écouter dans les mêmes conditions sonores le reste du catalogue du label Stax ?

□ Oui □ Non □ Je ne sais pas

QI3 : Pouvez-vous justifier ces deux dernières réponses ?

QI4 : Si vous étiez le producteur de Stax ou d’un autre label, engageriez-vous les démarches pour commercialiser ce master remixé en son immersif de la chanson B-A-B-Y ?

□ Oui □ Non □ Je ne sais pas

QI5 : Pouvez-vous justifier votre réponse ?

QI6 : Merci de votre participation à ce test d’écoute ! Souhaitez-vous ajouter quelque chose ?

Annexe C3 : Expérience n°2 – Commentaires des « producteurs » sur le rendu sonore du master original et celui de notre master remixé en son immersif de la chanson B-A-B-Y

Légende : IS = Ingénieur du son / RA = Réalisateur artistique / PM = producteur musical

Spécialiste de Stax Records / * Spécialiste du mixage en son immersif

Participant	Commentaire du master original	Commentaire du master remixé
IS1	Les timbres m’ont dérangé à cause de leur hétérogénéité : certains très durs (voix, cuivres) d’autres très mous, effacés (piano, drums). Les espaces sont très différents entre les sources (piano et drums lointains). Le propos musical passe mal à	Wow ! Assez impressionnant. Le groove passe très bien, les sources sont équilibrées. Les timbres sont plus agréables mais ils restent souvent pauvres et parfois agressifs. La saturation de la voix est moins gênante mais continue de me sortir de la musique

	cause des « défauts » de mix, de prises et de support. Si le morceau reste agréable, c’est grâce à l’ancrage historique de cette musique et de ce son. La saturation et le souffle m’ont aussi parfois sorti de la musique.	parfois. Le placement dans l’espace « stéréo » complimente le groove. La réverbération est subtile, naturelle et agréable. Au tout début du morceau on entend des artefacts sur la basse mais rapidement ils disparaissent et on est dans la musique. Solo de cuivres à droite trop fort et snare au même moment trop fort aussi. Le mix devient assez déséquilibré et l’énergie trop à droite.
IS2*	Compte tenu du format, la balance des sources est super, on entend tout bien, malgré une voix très devant et peut-être un peu trop dynamique, le propos musical est là pour moi. Parfois, la voix est un peu rêche et certains éléments se perdent mais ça ne change pas la musique pour moi.	Le rendu sonore a gagné en précision, le son est plus clair. Le piano semble plus beau, c’est mieux pour le coup. Mais je trouve que la dissociation basse / batterie fait perdre du groove, et la batterie placée à droite fait perdre le fil car trop agressive. Ce qui est super, c’est l’air gagné et le respect de la musique dont fait preuve le mixage en format immersif. Mais il est sobre, il aurait peut-être fallu prendre plus de parti sur la spatialisation de certaines choses.
IS3*	Enregistrement conforme à ce que l’on peut attendre de Stax. Les défauts que l’on pourrait noter après une écoute analytique font partie de la signature sonore du label, c’est donc tout à fait conforme.	Avec cette musique et cette interprétation, on est en attente de quelque chose de bien précis, et là, il nous est proposé autre chose. Cela peut être perturbant car on n’est plus dans le « contrat d’écoute » initial. Cela donne par contre un nouvel éclairage pour cette musique. C’est presque autre chose. Mieux ou moins bien, ce n’est à mon sens pas la question. On peut considérer qu’écouter ces musiques sous ce nouvel angle apporte réellement quelque chose d’intéressant au même titre qu’il est intéressant d’écouter des versions plus ou moins datées d’œuvres de musique classique. Impression d’un rendu moins dynamique (peut-être moins de groove ?) que la version mono. Plus équilibré spectralement. Donne plus à entendre l’arrangement. On en entend bien tous les détails.
IS4*	J’aime le master original au regard de la façon dont la musique était censée sonner à cette époque avec leur type de support (l’esthétique sonore fait corps avec la technologie utilisée). Dans une approche d’écoute réaliste en concert, les timbres et l’espace sont en deçà des performances que peuvent donner ce genre d’instruments joués en groupe.	De l’espace et de l’air. Super boulot, ça sonne. Bravo pour la séparation des sources, on n’entend aucun artefact. L’esthétique de production est conservée (avec ses défauts sur les timbres mais ça fait partie du truc) mais avec l’espace frontal en plus. Il n’y a pas de démasquage spatial car il n’y avait pas de masquage avant, même en mono (merci à l’arrangement et au démasquage fréquentiel déjà réalisé sur le mix original). C’est juste plus agréable et ça reste stable avec les déplacements (mais la mono était stable aussi ;-). L’immersion est quasi absente dans le sens où il n’y a pas (ou très peu) de sensation de pièce ajoutée par les surrounds. C’est donc pour moi un master surtout frontal immersif avec quasiment pas d’immersif (ou en tout cas pas assez perceptible).
IS5	Cet enregistrement me donne l’impression que beaucoup d’éléments de cet enregistrement ont été contraints par la technique. À mon sens les enregistrements d’Isaac Hayes pour Stax sont autrement beaucoup plus qualitatifs (certes ils sont plus récents) et représentatifs du son Stax. Il n’en reste pas moins que ce style de musique est ancré dans une époque et donc tous les « défauts » ou imperfections techniques des enregistrements de cette époque sont intrinsèquement liés à la musique.	Tout est mieux pour moi sauf une chose. Plus de place à la voix, c’est bien. Meilleur équilibre entre les différents éléments de l’orchestration. La ligne de basse est mieux définie, moins bourrue, et plus constante tout au long du morceau. L’espace aussi est plus agréable, on a moins le sentiment que tout le monde est ou veut être au premier plan. Le côté négatif : la batterie à droite est une étrangeté pour moi, car cela place l’enregistrement de la chanson à un autre moment de l’histoire de la musique enregistrée (une certaine époque où ingénieurs du son et producteurs expérimentaient la stéréo). Est-ce que la version remixée a toujours le son Stax ? Musicalement oui, mais d’un point de vue historico- culturel, je me pose la question.
RA1	Avec de la stéréo sur certains éléments, on profiterait mieux de l’arrangement. Le son est splendide mais manque d’aigus sur certaines sources (orgue, cymbales).	Impressionnant. C’est très beau. Je suis moins dans l’écoute de la voix principale que dans la version originale. En revanche j’ai une meilleure impression de rendu de la dynamique du groupe, des espaces. Je perçois mieux les arrangements. J’ai plus

		l’impression d’une captation live où j’identifie le placement des instruments. Je trouve cependant l’ensemble un peu trop large (orgue trop à gauche, piano trop loin de basse/batterie, qui ne fait plus bloc avec eux comme dans la version originale). On a les mêmes « marqueurs » esthétiques (rimshot de snare très fort, peu de réverb, équilibres de l’orchestre, timbre vintage saturé). Les timbres me semblent plus beaux. Version très chic donc pour moi.
RA2*	Excellent rendu de la spatialisation grâce au mix. On retrouve l’atmosphère enfumée d’un club, dont un enregistrement tel que celui-ci est une tentative de reproduction.	Le master remixé à la fois améliore et respecte le morceau, je trouve cela très bien fait. C’est un « gadget » intelligemment utilisé, car il ne cherche pas à dénaturer l’original. Au contraire, j’y vois une grande fidélité. Je pense que l’autre avantage est de nettoyer la « vitre sale » qui était entre le master original et l’auditeur. Je pense que ce master nous permet de voir à quel point une écoute est subjective, et à quel point notre cerveau recrée entièrement l’espace dans la version originale. La spatialisation reçue ici se fait naturellement, la consommation est plus directe, il y a moins d’efforts à faire. Je trouve tout de même cela un peu trop frontal, j’aurais aimé avoir des éléments sur les côtés, avoir plus d’immersion. Je trouve aussi les cuivres un peu trop au centre, j’aurais aimé les entendre plus à droite.
PM1*	La basse est trop envahissante. Je suis habitué à la mono pour cette musique. La source du master est importante : numérisé ? disque ? Beaucoup de différences déjà entre rendu un 45T et un 33T.	Le changement est dément… Les instruments sont magnifiés. La batterie est beaucoup plus mise en avant (caisse claire claque trop parfois). La basse est plus agréable, elle n’envahit plus, elle est très présente sans écraser le son. Elle remplit enfin son rôle. Meilleure distinction des instruments. Mais le grand point gênant : la voix est trop en retrait. Cela est gênant par rapport à l’idée originale de l’enregistrement : enregistrer pour la chanteuse. Si ces enregistrements sont disponibles au grand public, il faut absolument renseigner qu’il ne s’agit pas du master original mais d’un master retravaillé. Ce master remixé me rappelle beaucoup ce qu’on pouvait obtenir à partir des égaliseurs Hi-Fi de l’époque, surtout au niveau des aigus très surélevés.

Annexe C4 : Expérience n°2 – Avis des « producteurs » sur le potentiel culturel et commercial de notre master remixé en son immersif de la chanson B-A-B-Y

Légende : IS = Ingénieur du son / RA = Réalisateur artistique / PM = producteur musical

Spécialiste de Stax Records / * Spécialiste du mixage en son immersif

Participant	Avis sur le potentiel culturel du master remixé en son immersif de B-A-B-Y	Avis sur le potentiel commercial du master remixé en son immersif de B-A-B-Y
IS1	Son global moins repoussant, moins daté. On est beaucoup plus facilement dans la musique et pas dans les défauts sonores. Musique soul toujours très populaire aujourd’hui. Catalogue Stax très bon (j’imagine).	Mode du multicanal grand public en ce moment (binaural, Apple).
IS2*	Je ne sais pas à quel point le grand public est sensible et est capable de dissocier le rendu entre la mono et ce remixage car il est très respectueux ce qui est super mais la spatialisation reste quand même assez discrète. À moins de les sensibiliser à ce genre de format pour qu’ils aient déjà un élément de comparaison et qu’ils comprennent le gain en termes d’espace et de dynamique.	Je ferais changer certaines choses mais c’est quand même intéressant de donner une nouvelle relecture et de le partager.

IS3*	Je ne sais pas répondre car le public pourrait être déstabilisé par le changement de « contrat d’écoute », mais en même temps pourrait être intéressé par ce nouvel éclairage de cette musique. Par contre, je pense que dans le cadre d’une écoute au casque, il y aurait sans doute un vrai avantage à avoir une version spatialisée de ces musiques uniquement disponibles en mono, qui me semblent plus gênantes à écouter au casque qu’aux enceintes.	Apporter un nouvel éclairage sur une musique me semble toujours intéressant.
IS4*	L’immersion n’est pas assez flagrante pour un public lambda. Tout juste entendrait-il l’élargissement de l’image. Un public mélomane et passionné de ce label serait enthousiaste avec ce remix, un public lambda pas sûr…	Le label Spatial Audio serait juste un argument commercial mais ça ne révolutionne pas ce genre de musique (qui sonnerait toujours avec ces timbres un peu fragiles, ce qu’un public lambda entend).
IS5	Musicalement, les modifications sonores apportent un plus à la chanson. Mais encore une fois, je ne suis pas sûr que le grand public y soit très sensible (le mp3 128kb a malheureusement encore de beaux jours devant lui, je pense).	Marketing…
RA1	–	L’éclairage apporté me semble très intéressant, j’imagine que la VO et cette version pourraient cohabiter.
RA2*	Je pense que le master remixé faciliterait l’accès de cette musique au grand public. S’ils peuvent découvrir cette musique ainsi, tant mieux !	Si cela favorise l’accès à cette musique aux gens qui ne la connaissent pas, oui bien sûr ! Et on pourra toujours avoir accès au master original, donc quel est le problème ? J’aimerais bien que cette version remixée existe. Je pense que j’écouterais plus volontiers la version originale, mais cela m’amuserait d’accéder aux deux versions pour les comparer.
PM1*	Cela va attirer beaucoup de curieux, tant mieux !	Cela permettrait d’éveiller la curiosité des gens, la connaissance de ce répertoire !

Annexe C5 : Expérience n°2 – Questionnaire du test d’écoute pour « consommateurs »

Bienvenue à ce test d’écoute comparative !

Pour vous connaître un peu mieux…

QJ1 : Quel âge avez-vous ?

QJ2 : Vous êtes…

□ un homme □ une femme

QJ3 : A quelle fréquence écoutez-vous de la musique soul/rhythm and blues ?

□ Jamais □ Rarement □ Occasionnellement □ Souvent □ Tout le temps

QJ4 : Connaissez-vous le label Stax Records ? En voici quelques artistes : Otis Redding, Sam & Dave, Rufus Thomas, Carla Thomas, Johnnie Taylor, The Staple Singers…

□ Oui □ Non

QJ5 : Connaissez-vous le « son Stax », aussi appelé « Memphis Sound », caractéristique du label Stax Records ?

□ Oui □ Non

Placez-vous sur la chaise haute…

[Ecoute des deux versions sonores A et B]

Après ces deux écoutes

QK1 : Quelles sont vos toutes premières pensées générales au sortir de ces deux écoutes ? (Facultative)

QK2 : Connaissez-vous cette chanson ? Il s’agit de B-A-B-Y, interprétée par Carla Thomas en 1966 pour le label Stax.

□ Oui □ Non

QK3 : Comment aimez-vous cette chanson telle que vous l’avez entendue dans la version A ?

0	1	2	3	4	5	6	7	8	9	10
Pas du tout										Follement

QK4 : Comment aimez-vous cette chanson telle que vous l’avez entendue dans la version B ?

0	1	2	3	4	5	6	7	8	9	10
Pas du tout										Follement

QK5 : A travers laquelle des deux versions sonores entendues préférez-vous écouter la chanson B- A-B-Y de Carla Thomas ?

□ La version A □ La version B □ Les deux à égalité, par choix

□ Les deux à égalité, par indifférence □ Je ne sais pas

QK6 : Selon vous, laquelle des deux versions sonores entendues retranscrit le mieux l’âme (soul) de la chanson ?

□ La version A □ La version B □ Les deux à égalité □ Je ne sais pas

QK7 : Laquelle des deux versions sonores entendues vous fait le plus ressentir le groove de la chanson ?

□ La version A □ La version B □ Les deux à égalité □ Je ne sais pas

QK8 : Selon vous, laquelle des deux versions sonores entendues met le mieux en valeur l’arrangement de la chanson ?

□ La version A □ La version B □ Les deux à égalité □ Je ne sais pas

QK9 : Appréciez-vous plus le rendu sonore de certains instruments dans la version A que dans la version B ? Si oui, lesquels ?

Pouvez-vous détailler vos réponses ?

QK10 : Appréciez-vous plus le rendu sonore de certains instruments dans la version B que dans la version A ? Si oui, lesquels ?

Pouvez-vous détailler vos réponses ?

QK11 : Si vous connaissez le « son Stax », laquelle des deux versions sonores entendues en désigne selon vous la plus fidèle illustration ?

□ La version A □ La version B □ Les deux à égalité □ Je ne sais pas

□ Je ne connais pas le son Stax

QK12 : A quelle époque vous sentez-vous en écoutant la version A ? QK13 : A quelle époque vous sentez-vous en écoutant la version B ?

QK14 : Pouvez-vous en donner les causes ?

Comment appréhendez-vous cette différence (ou similitude) d’époques ressenties depuis une même interprétation musicale ?

QK15 : Avez-vous été perturbé(e) par un ou des éléments sonores extérieurs pendant l’écoute de la version A ?

QK16 : Avez-vous été perturbé(e) par un ou des éléments sonores extérieurs pendant l’écoute de la version B ?

Information : la version A (ou B) est la version sonore originale de la chanson / la version B (ou A) en est une version remixée.

Conclusion

QL1 : Toute considération matérielle exclue, pensez-vous que la version remixée vous donnerait envie d’écouter la chanson B-A-B-Y plus souvent qu’avec la version originale ?

QL2 : Toute considération matérielle exclue, pensez-vous que la version remixée vous donnerait envie d’écouter dans les mêmes conditions sonores le reste du catalogue du label Stax ?

QL3 : Merci de votre participation à ce test d’écoute ! Souhaitez-vous ajouter quelque chose que vous n’avez pas dit ?

Annexe C6 : Expérience n°2 – Commentaires de fin d’expérience des « consommateurs »

Légende : P = Expert 1950-60 / M = Musicien / NM = Non musicien

Participant	Commentaires de fin d’expérience des « consommateurs »
P1 (= P8 Test 1)	Beau travail !
P2 (= P1 Test 1)	Bravo et encore bravo ! On aurait rêvé faire la chose pour ces artistes merveilleux de Memphis Tennessee, et leur faire écouter !
P3 (= P5 Test 1)

M1
M2
M3
M4
M5
M6
M7	L’espace les amis, l’espace !
M8
M9
M10	C’est intéressant déjà de comparer différentes versions, mais là de voir même au sein du même morceau, des différences à l’écoute, c’est bluffant. Ça fait réfléchir sur l’importance du matériel d’écoute. Par exemple pour mon cas personnel, si quelqu’un découvrait l’opéra sur un enregistrement bon mais avec un mauvais matériel, alors il n’apprécierait peut-être pas à sa juste valeur l’œuvre ou même dans ce cas le genre ! Donc très important.

M11	Je préfère garder le côté original pour comprendre l’objet artistique de l’époque et non pas vu de 2023.
M12
M13
M14
M15	J’étais concentré sur le timbre des instruments dans la première écoute [remixée], parce que je m’attendais à trouver là les différences entre les deux versions. Après, j’ai changé mon écoute, je me suis aperçu de l’espace, de la présence des instruments et du souffle, ce qui m’a aidé à décider finalement. Cela a été positif d’avoir changé d’écoute et de m’être concentré sur d’autres paramètres. Les questions m’ont aidé à cela.
M16
M17	J’ai été surpris par le fait que la version A soit le remix, mais très agréablement, car ce dernier rajoute de l’âme et du caractère au morceau, et permet de faire mieux entendre l’arrangement.
M18	Etonnement positif quant à découvrir que la version que je croyais être l’original est en fait le remixage, bon travail de mixage !
M19
M20
M21	Bravo

NM1
NM2
NM3	C’était passionnant merci beaucoup
NM4
NM5
NM6	Eh ben c’est ouf ! Je pensais instinctivement que la version studio originale était la première [remixée] et je ne pensais pas que ce genre de technique de mixage existait.
NM7	J’aurai imaginé que la version B [remixée] était l’original, cela a été surprenant d’apprendre l’inverse. Même si une fois l’information donnée, cela fait sens, la version B [remixée] me semblant plus moderne et plus équilibrée. Découvrir que le positionnement des instruments joue à ce point sur les émotions procurées est dingue. Il y a une vraie douceur, une sensibilité et en même temps de la puissance dans cette seconde version [remixée] qui est étonnante. Cela donne envie de mieux comprendre et d’écouter différemment la musique et donne des clefs d’analyse qui sont précieuses pour pouvoir profiter encore mieux des instruments, du rythme et des petits chamboulements que cela crée dans le ventre. Alors un grand merci pour cette découverte.
NM8
NM9	Merci
NM10	C’était trop bien 🙂
NM11	C’était une drôle expérience. Merci beaucoup !
NM12	J’ai été surprise de voir que la version A [remixée] était une version remixée, je pensais l’inverse. Notamment par rapport à la place plus assumée de l’orgue dans la version B [originale] qui, à mon sens, rend l’écoute plus intéressante et change totalement le style de la musique (ça la rend plus contemporaine). Je trouve ça très étonnant que la version B [originale] date des années 60, je dois avoir une vision trop cliché du style de musique de cette époque.
NM13	Merci beaucoup c’était super ! (Vive l’orgue)
NM14	Bon travail !
NM15	Surprise d’apprendre que la version B est l’originale, un peu « mono », mais logique quand on sait pourquoi. Je serais curieuse d’entendre la version A [remixée] avec une bonne qualité d’écoute et la version B [originale] dans ma cuisine sur la radio.
NM16	Merci
NM17
NM18	Je tombe des nues d’apprendre que la version B est la version originale. Je trouve ça surprenant qu’on puisse donner un tel « grain » à une musique remixée, comme si elle datait de plusieurs décennies. C’est une surprise positive.
NM19
NM20	Vive la version B [remixée], on sent beaucoup plus le groove et le rôle de chaque instrument !
NM21

Remerciements

Je tiens à remercier profondément Valentin Bauer, mon directeur de mémoire qui, par son écoute et son engagement, a été mon moteur pendant un an. Je lui dois énormément.

Merci à tous les ingénieurs du son, réalisateurs artistiques, producteurs, professeurs, musiciens, non musiciens, journalistes, disquaires, pour leur précieuse participation à l’une des deux expériences, leur sincère intérêt, et toutes les informations essentielles qu’ils m’ont transmises. J’y ai fait là des rencontres importantes que je ne suis pas près d’oublier.

Merci aux chercheurs et développeurs qui m’ont accordé de leur temps pour me confier des clefs de compréhension dans un domaine d’étude captivant et que je ne connaissais pas.

Merci à Nicolas Erard et à François Longo pour leur aide et leur disponibilité.

Merci à l’ensemble de l’équipe pédagogique de la FSMS qui m’a beaucoup appris et m’a donné toutes les clefs pour réaliser de merveilleux projets artistiques, visuels et sonores dans cette formation unique en son genre. Une mention spéciale à Olivier Montagnon, Justine Huet, Virginie Evennou et Denis Vautrin, qui m’ont offert tous les moyens pour mener à bien ce mémoire.

Merci à ma famille, mes parents pour leur soutien important pendant ces quatre années.

Et un remerciement très spécial à celle qui, par son écoute, sa patience, sa tendresse, a été d’un soutien de tous les instants durant plus d’une année.

L’Arrivée d’un train en gare de La Ciotat (1896) de Louis Lumière, restaurée en 4K et 60 i/s par Denis Shiryaev : https://www.youtube.com/watch?v=gwSw_WLgekE ↩︎
Chants de travail. ↩︎
Il s’inspire du titre It Must Be Jesus des Southern Tones pour écrire I Got A Woman (1954). ↩︎
Dès 1943, les techniciens allemands parviennent même à enregistrer des concerts sur une bande contenant deux pistes, permettant déjà une reproduction stéréophonique. Au sortir de la guerre, l’URSS retrouve à Berlin des centaines de bandes, mais seulement trois stéréophoniques (Rémond, 2015). ↩︎
Pour la suite de notre étude, nous abrégerons parfois le terme « monophonique » par « mono ». ↩︎
Le magnétophone bipiste contient une bande dont les deux pistes sont séparées par un intervalle de garde qui garantit une diaphonie minimale entre elles. À l’inverse, il est impossible de ne traiter qu’une seule des deux pistes d’un magnétophone stéréo, destiné à générer un master (Rumsey & McCormick, 2002). ↩︎
Réenregistrement. ↩︎
Le label de R&B/soul Atlantic Records est en 1958 le premier studio à posséder un enregistreur 8 pistes, mais rarement avec l’idée de pratiquer l’overdubbing (Moorman, 2003). ↩︎
Smokestack Lightnin’ (1956, Chess Records) : https://www.youtube.com/watch?v=PnXTpkugcHo ↩︎
Ole Man Trouble (1965, Volt Records) : https://www.youtube.com/watch?v=oKsiukdz0xI ↩︎
Hound Dog (1956, Peacock Records) : https://www.youtube.com/watch?v=ucqhmFyzMgs ↩︎
Mess Around (1953, Atlantic Records) : https://www.youtube.com/watch?v=u37gVPLpRNE ↩︎
Beaucoup de labels de blues/R&B/soul continuent de travailler avec des enregistreurs 2, 3 ou 4 pistes. ↩︎
Ain’t No Mountain High Enough (1967, Motown) : https://www.youtube.com/watch?v=7PItshAEAC4 ↩︎
« L’usine à tubes », le surnom de Motown Records. ↩︎
SPAT Revolution : https://www.flux.audio/project/spat-revolution/ ↩︎
International Federation of the Phonographic Industry (IFPI). ↩︎
Sans perte. Perte générée par l’échantillonnage des données audio. ↩︎
La scène sonore suit les mouvements de la tête. ↩︎
Souvent, les sources séparées des enregistrements de jazz sont les fichiers multipistes eux-mêmes, car la stratégie de prise de son en proximité le permet. ↩︎
Non-negative matrix factorization (NMF). ↩︎
Machine learning. ↩︎
Deep learning. ↩︎
Graphics Process Unit : processeur graphique. ↩︎
Natural Language Processing (NLP) en anglais. ↩︎
Computer vision en anglais. ↩︎
Marius Miron (2016) a élaboré une méthode de séparation de sources d’un orchestre symphonique par apprentissage supervisé et informée de la partition. Pour s’affranchir de la contrainte de réverbération des enregistrements existants et donc pour concevoir sa propre base de données pour l’apprentissage du réseau (mixages stéréo et sons isolés), il a réenregistré individuellement chaque section de l’orchestre et en a reconstitué artificiellement un mixage stéréo. Cette innovation a été intégrée par l’application The Orchestra, qui permet désormais d’entendre isolément chaque section de l’orchestre. ↩︎
Ces experts sont des personnes connaissant bien le répertoire blues/R&B/soul des années 1950-60 pour l’avoir abondamment écouté, sans forcément en connaître parfaitement toutes les références. Ils en connaissent surtout l’esprit de la musique. Ils ne peuvent pas être ingénieurs du son mais musiciens. ↩︎
Spat Revolution Remote : https://www.flux.audio/project/spat-revolution-remote/ ↩︎
Open Sound Control. Langage de transmission unidirectionnelle de données en temps réel entre plusieurs logiciels, possiblement actifs sur plusieurs appareils numériques (ordinateur, smartphone, synthétiseur…). ↩︎
Open Stage Control : http://openstagecontrol.ammd.net/ ↩︎
Afin de bien distinguer les profils et leurs comportements, les experts 1950-60 ne peuvent pas être ingénieurs du son. Cependant, afin de recruter plus facilement, ils peuvent être musiciens. ↩︎
Voir retours généraux des participants de l’expérience en annexe B6. ↩︎
Faites à partir des réponses aux questions QB2 à QB5 (II.A.3.2.b.) et QD1 à QD4 (II.A.3.2.d.). ↩︎
Provenant du fichier texte généré par l’interface présentée en II.A.2.2. ↩︎
Un aperçu seulement, car nous n’entendons pas recouvrir la totalité des répertoires musicaux ciblés avec ces trois seuls enregistrements. ↩︎
Voir définition donnée par les participants en section II.B.2.1. ↩︎
Prépondérant dans un remixage en son immersif ↩︎
Qualité rythmique qui incite à bouger, à danser. ↩︎
Surnommée “The Queen of Memphis Soul”. ↩︎
Au-delà du masquage des sources engendré par la mono, ces défauts de balance peuvent s’expliquer par le fait que l’ingénieur du son Tom Dowd a dû mixer en direct les 8 entrées micro sur 2 mixettes 4 voies Ampex 3761, à cause d’un simple magnétophone stéréo en sortie, le Scully 280. ↩︎
La limitation à 8 entrées micro a obligé l’ingénieur du son Tom Dowd à ne placer qu’un seul micro par instrument, ce qui a pu créer des inégalités de qualité de captation entre divers instruments. ↩︎
Nous pourrons ainsi nous rapprocher du son Stax de la batterie, dont notre référence sera Tramp (1967), interprétée par la même Carla Thomas en duo avec Otis Redding, au tempo proche. ↩︎
Grâce à son magnétophone stéréo Scully 280, Stax a aussi publié un master stéréo de B-A-B-Y mais qui n’a en fait pas été à l’origine du succès de la chanson, révélée comme tous les autres hits par la radio. ↩︎
Classée n°3 des meilleures ventes de disques R&B et n°14 des meilleures ventes de disques pop US. ↩︎
Envie spatiale formulée par deux ingénieurs du son de l’expérience n°1 (figure 38c). ↩︎
Caractéristique musicale mentionnée par un ingénieur du son de l’expérience n°1. ↩︎
Jim Stewart, fondateur de Stax Records : « Il n’était question que de coopération et d’implication totale. Il n’y avait aucune limite imposée à l’apport de chacun. Il n’y avait pas parmi nous de producteur au sens qu’a pris aujourd’hui ce terme. Les crédits disaient juste : « Produit par l’équipe Stax. » » ↩︎
Bien que nous informions le participant qu’il écoutera d’abord le master original, puis le master remixé, nous ne lui disons ni comment ni par qui ce dernier a été généré, afin qu’il conserve sa neutralité et continue de guider sa critique des masters par la musique. ↩︎
En vérité, à l’aide de SPAT Revolution, nous transposons actuellement en binaural le remixage immersif de B-A-B-Y que nous avons réalisé sous le dôme de haut-parleurs du plateau 1. ↩︎
Nous vérifierons cette hypothèse des « producteurs » dans le test « consommateurs » en section III.C.4. ↩︎
Ceci explique le déséquilibre démographique entre les différentes classes d’âge (figure 43b), qui est la contrepartie d’inviter beaucoup de participants à notre expérience, en particulier des musiciens. ↩︎
Faute de pouvoir obtenir davantage d’experts 1950-60, après de multiples tentatives de recrutement auprès de divers musiciens, disquaires et dans les groupes spécialisés des réseaux sociaux. ↩︎
Moins essentielle que pour l’expérience n°1 qui comparait les comportements des différents profils. ↩︎
Il est important que le participant puisse conserver sa concentration pour mémoriser tous les aspects positifs et négatifs qui lui sont apparus dans la première écoute et les confronter dans la seconde. ↩︎
Durant tout le test, nous nous plaçons en retrait dans la salle pour altérer le moins possible la relation entre la musique et l’auditeur (figure 41). ↩︎
Nous avons créé un questionnaire pour chaque ordre d’écoute : A (original) / B (remixage) pour la moitié des participants, A (remixage) / B (original) pour l’autre moitié. ↩︎
« Toute considération matérielle exclue » comporte le même sens que dans le test pour « producteurs ». ↩︎
Si suffisamment de participants connaissent le son Stax. ↩︎
Responsables de l’âme et du groove de la chanson, d’après les remarques orales des « consommateurs ». ↩︎
Corrigeant ainsi l’aspect « mal intégrée dans le groupe » soulevé dans l’expérience n°1 (figure 38a). ↩︎
Guitare et batterie manquaient de présence dans la version originale d’après l’expérience n°1. ↩︎
Permise aussi par RipX, qui indirectement a retiré le souffle de l’enregistrement (section III.A.1.1.). ↩︎
Une version stéréo a bien été exportée et publiée par le label Stax en 1966, mais très différente de notre présente version immersive (espace très latéralisé, aucune source au centre de l’image sonore, etc.). ↩︎
5 de ces participants ont préféré écouter notre version remixée, 4 la version originale et un a autant aimé l’une que l’autre. ↩︎
Voir l’intégralité des commentaires de fin d’expérience en annexe C6. ↩︎
Nous avons décidé de réduire cette question aux seules années 1950, car l’aspect mono de l’enregistrement, essentiel à notre propos, est de moins en moins fréquent dans les années 1960 (premières commercialisations stéréo en 1958). ↩︎

juin 4, 2026

Optimisation de la diffusion des basses fréquences face au problème de voisinage
Par : Julie Grisel

Formation Supérieure aux Métiers du Son

Directeur de mémoire : David Rousseau Septembre 2017

Résumé

La technologie des enceintes de sonorisation permet aujourd’hui de délivrer de grandes puissances dans les très basses fréquences. En parallèle, la quantité de basses dans les styles musicaux n’a fait que croître au cours de l’histoire. Du fait de l’augmentation progressive du niveau sonore en basse fréquence, les nuisances sonores sur le voisinage se sont aussi multipliées.

Par ailleurs, les salles de concerts sont souvent situées dans des bâtiments anciens et l’amélioration de l’isolation acoustique engendre dans la plupart des cas, une reconstruction quasi-totale de la structure (réalisation d’une « boîte dans la boîte »). Cette solution très onéreuse est rarement envisageable et souvent impossible structurellement. Nous nous tournons donc vers l’optimisation des systèmes de diffusion et nous nous focalisons sur la question suivante :
« Comment rendre directive la diffusion des basses fréquences pour limiter l’impact sur le voisinage et concentrer l’énergie sur le public ? ».

Aujourd’hui, l’usage de systèmes directifs, parce qu’il est récent, est difficile à appréhender et le paramétrage est souvent simplifié et donc réducteur. La méthodologie de recherche consiste donc à démystifier l’effet « preset magique » afin de mieux comprendre les bases physiques qui régissent le phénomène physique de directivité.

Afin d’enlever toute zone d’ombre dans la conception du système, et d’éliminer les spécificités des caissons de basse (« subwoofer »¹) industriels, nous avons décidé de construire nos propres subwoofers, au comportement le plus simple possible.
Nous avons également programmé un logiciel de simulation afin d’avoir une souplesse d’analyse et de pouvoir automatiser des processus de comparaison non disponibles sur les logiciels commerciaux. Ceci nous a permis de pouvoir simuler puis mesurer avec une grande flexibilité les différentes configurations que nous voulions tester.

Afin de pouvoir qualifier les résultats, la première étape a été de mettre au point un système et une méthodologie de mesure juste et reproductible dans les basses fréquences. Après avoir optimisé les subwoofers et validé les simulations en champ libre, nous nous sommes confrontés à l’influence de la salle, nettement plus complexe. Dans un deuxième temps, nous avons mis en pratique ce savoir lors de situations de concerts, utilisant des systèmes de sonorisation de grande ampleur.

Les résultats les plus efficaces observés lors de notre étude montrent que dans tous les cas la rigueur et la méthodologie de mesure dans les basses fréquences sont indispensables. L’optimisation du système consiste à créer une réjection dirigée sur les zones à protéger. Plus le nombre d’enceintes disponibles est grand plus il est facile de le rendre directif. Les systèmes directifs en minimisant l’énergie sur les murs, engendrent moins de modes de résonance et améliorent la qualité du son sur le public et sur le voisinage. En particulier, les assemblages dont le retard correspond à la distance entre les sources permettent d’optimiser les deux critères en même temps.

Le nouveau décret apporte une nette progression notamment dans la prise en compte de la protection auditive des enfants. Il réaffirme également la nécessité de protéger en tous points, ce qui au regard des pratiques actuelles était effectivement nécessaire. Cependant, si l’objectif de protéger dans les basses fréquences est primordial, son application va nécessiter une refonte totale des techniques de diffusion et des pratiques musicales. Par la complexité de mise en œuvre, il peut être craint que l’effort financier soit trop important pour les petits lieux, et que l’accroche techniquement nécessaire des subwoofers en hauteur augmente nettement les problèmes de voisinage. En l’absence d’une règlementation prenant en compte les basses fréquences (63Hz), la protection du public qui nécessite l’accroche des subwoofers en hauteur risque de se faire au détriment du voisinage.
Mots clefs : basses fréquences ; difficultés de mesure ; directivité ; voisinage ; qualité sonore ; cardioïde ; règlementation ; logiciels de simulation

Avant Propos

Genèse du sujet de mémoire et problématique

C’est au cours de mes expériences en sonorisation que j’ai réalisé la difficulté de maîtriser les niveaux sonores dans les basses fréquences, tout d’abord en termes de couverture sur le public, mais aussi vis-à-vis de la règlementation et du voisinage. Les exigences d’homogénéité et de couverture, et influences des salles sur la propagation des basses fréquences constituent des phénomènes physiques et technologiques extrêmement complexes. Ils sont d’autant plus complexes qu’ils sont multi variables et intrinsèquement imbriqués. Peu d’outils et d’ouvrages aujourd’hui permettent d’avoir une vue d’ensemble des problématiques de mesure nécessaires à la caractérisation et à l’optimisation d’un système dans les basses fréquences. J’ai donc souhaité décomposer les différents paramètres permettant d’optimiser le système en éléments simples, comprendre leur fonctionnement, puis les synthétiser dans le sens de la meilleure optimisation possible entre qualité du son sur le public et protection des riverains.

Introduction

Contexte et problématique

Au tout début des concerts amplifiés, la technologie des enceintes et des amplificateurs ne permettait pas d’atteindre des niveaux élevés dans les très basses fréquences. Ces dernières années, les progrès technologiques et l’évolution de la musique actuelle (techno, rock…) ont fait apparaître un niveau sonore croissant dans les graves. Or, beaucoup de salles de spectacle exploitent des bâtiments historiques. Leur structure n’a jamais été pensée pour isoler les niveaux en très basse fréquence et il est souvent quasiment impossible de faire évoluer les bâtiments. Ces trente-cinq dernières années, le niveau sonore en basse fréquence ayant progressivement augmenté, la gêne sur le voisinage a augmenté proportionnellement. Les décrets se succèdent dans le but d’assurer aussi bien la protection auditive du public que la santé des riverains, en 1998 et tout dernièrement en août 2017. Malheureusement, les limitations associées aux basses fréquences ne permettent pas de faire un concert et les décrets présentent des manques notamment dans l’absence de prise en compte des très basses fréquences pour le voisinage. Il y a urgence ! En effet, l’ancien et le nouveau décret engendrent d’importantes difficultés d’application et les salles de concert se retrouvent en difficulté dans la capacité d’appliquer le texte. Faire perdurer l’activité culturelle et le bien-vivre ensemble nécessite de mettre en œuvre des solutions conciliant attente des spectateurs, protection auditive et respect des riverains….

Améliorer l’isolation étant une opération extrêmement coûteuse et souvent structurellement impossible, nous avons décidé de concentrer notre étude sur des solutions touchant à l’optimisation des systèmes de sonorisation eux-mêmes. L’idée est de mettre en avant des solutions permettant de concentrer l’énergie sur le public et de limiter les émissions vers le voisinage. En effet, rendre directifs les systèmes de sonorisation permet généralement de diminuer le niveau sonore dans le voisinage d’une proportion équivalente à multiplier par quatre l’épaisseur des murs. Cette optimisation est donc fondamentale car peu coûteuse en relatif au coût des travaux. Aujourd’hui, cette solution est rarement utilisée, car acousticiens et sonorisateurs ont tendance à travailler chacun de leur côté alors que la solution que nous mettons en évidence nécessite un travail commun de ces deux professions.

Plan

Nous commencerons par décrire dans la revue de littérature les problématiques de mesure des basses fréquences et quelles solutions permettent d’obtenir des mesures représentatives. La maîtrise de la directivité étant au cœur des solutions permettant de respecter l’absence de trouble vis-à-vis du voisinage, nous décrirons quelques configurations fondamentales permettant d’atteindre ces objectifs. Nous rappelons à la fin de cette partie le contenu du contexte réglementaire en vigueur.
Dans un deuxième temps, nous poursuivrons en donnant une description théorique des solutions permettant de créer de la directivité dans les basses via la programmation d’un logiciel de simulation. Nous validerons par la mesure en laboratoire (hangar) le modèle théorique en se confrontant à l’influence de la salle et aux difficultés de mise en œuvre associées.
Vous trouverez à la fin du mémoire un exemple pratique permettant de mettre en avant les résultats concrets qu’il est possible d’obtenir grâce à ces techniques.

Cadre
- Fréquentiel :
  Ce mémoire de recherche se focalise sur les basses fréquences générées dans les installations de sonorisation par les enceintes de renfort de grave, les « subwoofers » (appelés subs par la suite). La plupart des constructeurs donnent comme limite inférieure en basse fréquence des subs entre 25 Hz et 30 Hz, et 100 Hz pour la limite supérieure. Nous nous focaliserons donc sur l’intervalle de 25 à 100 Hz.
- Solutions d’optimisation
  Le mémoire ne traite pas des solutions relatives aux isolations acoustiques des bâtiments. C’est une opération très coûteuse et rarement possible pour les salles. Nous nous sommes donc concentrés sur l’optimisation des systèmes de diffusion dans les basses fréquences. Concentrer l’énergie sur la zone utile constituée par le public se réalise en créant une directivité. Le but n’était pas de tester l’ensemble des installations possibles mais de se focaliser sur quelques configurations fondamentales. Et enfin de se rendre compte des difficultés de mesure et donc d’optimisation.
- Types de lieux
  Notre étude concerne les évènements dans des salles moyennes à grandes (à partir de 300 places) ainsi que les concerts en plein air.
  L’objectif du mémoire n’était pas de détailler la méthodologie propre à la réalisation d’une étude d’impact acoustique. Nous nous sommes focalisés sur la maîtrise des concerts de grande ampleur de type festivals, qui n’ont pas les mêmes impératifs que ce qu’exigerait la réalisation d’une étude d’impact pour un bar ou une boîte de nuit. Les techniques qui sont décrites sont plus complexes et plus coûteuses mais permettent une meilleure gestion des niveaux sonores dans les infrabasses.
- Protection du public
  Il est important de noter que le décret traite aussi bien de la protection auditive du public que de celle du voisinage. En effet, l’augmentation de niveau très significative de ces dernières années rend la protection auditive du public primordiale. Cependant, l’optimisation des systèmes de diffusion vis-à-vis de la protection du voisinage est un sujet déjà très complexe. Nous nous sommes ainsi focalisés sur la partie protection du voisinage.
Abréviations utilisées dans ce mémoire

c : vitesse de propagation du son (344 m/s)
λ : longueur d’onde de la fréquence considérée
Sub : subwoofer (enceinte de renfort de grave)
Cardio : configuration cardioïde
Cardio natif : configuration cardioïde dont la distance entre les sources vaut λ/4
HP : haut-parleur
Omni : Omnidirectionnel

Revue de littérature

A. Les basses fréquences dans le contexte actuel.

Trois évolutions simultanées ont contribué à l’augmentation du niveau des basses fréquences dans les concerts amplifiés.

1. Contexte musical : évolution du niveau des basses fréquences au cours des 20 dernières années

Dans son mémoire de recherche en 2010, Pierrick Saillant [23] effectue un comparatif des balances spectrales sur une trentaine d’enregistrements répartis entre 1980 et 2010. Ses analyses permettent d’obtenir des informations sur l’évolution des habitudes d’écoute. « On observe que les productions actuelles contiennent plus de graves que les productions effectuées il y a une vingtaine d’années. Cette différence est reproduite dans le domaine de la sonorisation. Les systèmes de diffusion doivent être capables de produire plus de basses fréquences». La musique électronique en particulier, est en explosion depuis les années 1995 et est caractérisée par une forte accentuation de la rythmique et des lignes de basses.

2. Contexte technologique : un matériel de sonorisation de plus en plus puissant

D’un point de vue technologique les systèmes ont aussi beaucoup évolué. Dans le tableau ci-dessous, nous avons comparé à l’aide des documentations techniques [28] des fabricants, des haut-parleurs historiques et récents. Dans l’infrabasse, la pression générée est proportionnelle au volume d’air déplacé. On calcule donc le volume d’air déplacé par la formule :

𝑣𝑜𝑙𝑢𝑚𝑒 = 𝑇𝑎𝑖𝑙𝑙𝑒 𝐻𝑃 * 𝐷é𝑝𝑙𝑎𝑐𝑒𝑚𝑒𝑛𝑡 𝑐ô𝑛𝑒

Ce tableau met en évidence qu’un HP actuel est capable de déplacer environ 10 fois plus de volume d’air que l’historique 416-8A.

Nous donnons également ci-dessous quelques ordres de grandeur de subs récents.

Les subwoofers récents peuvent comporter plusieurs HPs. Ils ont plus de capacité de débattement et supportent beaucoup plus de puissance. Le T21 atteint un niveau sonore de
146.5 dB SPL à 1 m !…

3. Contexte sociologique : recherche de sensations lors des concerts « live »

« To be played at maximum volume »². La puissance sonore parce qu’elle favorise l’immersion et qu’elle provoque un déconditionnement participe à l’expérience d’écoute de la musique (Guibert, 2007, [11]).

« Aujourd’hui, ce qui motive les jeunes à assister à des concerts, c’est la recherche de sensations physiques générées par les basses et les infrabasses. Car ce qu’on appelle « le gros son », c’est-à-dire le son très charpenté avec énormément de basses, permet de ressentir de fortes compressions, surtout au niveau de la cage thoracique et de l’abdomen, sensations qu’ils n’ont pas et qu’ils n’auront jamais avec leurs écouteurs, leur casque ou leur chaîne HIFI. […] » (David Rousseau, 2006, [21]).

« La puissance sonore favorise l’immersion dans la musique. Lorsqu’on arrive sur le lieu d’où émane le son amplifié, on est brusquement coupé de l’environnement perceptif antérieur. Le bruit accapare l’appareil sensoriel en mobilisant l’ouïe, mais aussi le toucher (on ressent le son par le corps) et provoque un déconditionnement. Cette présence physique du son reconditionne l’auditeur à une expérience onirique. Le volume sonore élevé rend difficile la parole et transforme les rapports sociaux. Il donne à la matière sonore une épaisseur qui le rapproche des arts plastiques tridimensionnels. » (Gérôme Guibert, 2007, [11])

La recherche des forts volumes sonores n’est pas nouvelle. C’est un phénomène sociologique qui ne peut être ignoré et qui participe à l’expérience d’écoute de la musique dans notre société. Cependant, si les techniques d’amplification apparaissent déjà dans les années 30, les niveaux que l’on peut atteindre aujourd’hui en basse fréquence sont extrêmement élevés. Il est donc d’autant plus nécessaire pour la santé du public que celle du voisinage d’apprendre à bien maîtriser les basses fréquences pour permettre le bien-vivre ensemble et la protection auditive.

4. Pourquoi les basses fréquences posent elles problème chez les riverains?

Isolement des bâtiments vis-à-vis des basses fréquences émergeant des concerts de musique amplifiée.

L’impact des nuisances dues aux musiques amplifiées peuvent être extrême : « [Lors d’]évènements musicaux comme des festivals ou rave parties, sorties en discothèques […] les basses fréquences sont tellement fortes qu’elles font vibrer les vitres aux alentours. » (CIDB, 2014, [3]).

« Il faut savoir que, dans les basses, on a d’une part, le coup de pied, c’est-à-dire le toum toum de la grosse caisse qui se situe entre 50 et 63 Hz et d’autre part, la nappe de graves en continu qui se situe entre 30 et 40 Hz, ce qui, d’ailleurs, n’est pas perçu par le système auditif. L’autre problème, c’est qu’il y a vingt ans, on envoyait 20 décibels de moins qu’aujourd’hui. Quand on sait qu’un DJ diffuse systématiquement du 140 dB(C) – le dB(C) tient compte des basses fréquences –, cela laisse perplexe ! On atteint donc de très forts niveaux sonores!» (David Rousseau, 2006, [21]).

Or, un niveau d’émission aussi important et centré sur les fréquences comprises dans la bande d’octave 63 Hz ou 30 Hz est catastrophique en termes d’impact sur le voisinage. En effet, l’isolation pour ces bandes de fréquence est très difficile à obtenir.

« Les parois, qu’il s’agisse des murs, du plafond ou de plancher, vibrent davantage à certaines fréquences qu’à d’autres. Plus une paroi vibre, plus elle est perméable au passage des sons et plus la pièce s’agrandit. Si par hasard, la fréquence de résonance naturelle d’une paroi coïncide avec la résonance de la pièce, les propriétés isolantes deviennent très médiocres, voire quasi-inexistantes. On observe ce phénomène avec les cloisons de doublage acoustique en panneaux de plâtre mince. Par exemple, une cloison en BA13 disposant d’un plénum de 10 cm rempli de laine de verre, résonne à 63 Hz. Adossée à un mur en parpaing creux de 20 cm, le doublage censé améliorer l’isolement, le dégrade de 7 décibels, passant de 39 dB (courbe verte) à 32 dB seulement (courbe rouge). Si la pièce possède une dimension physique de 2,58m (plafond) ou 5,16m, la dimension acoustique sera 2,68m (f1=63Hz) ou 5,36m (f2 63Hz). En supposant que la résonance amplifie le niveau de pression de 6dB à cette fréquence, l’isolation ne sera plus que 26 décibels (courbe bleue)». (Lafont, [15]).

Figure 1 : La courbe verte représente l’affaiblissement du mur en parpaing creux. La courbe rouge représente l’affaiblissement de l’ensemble mur + doublage. Les performances se dégradent en dessous de 85Hz. La courbe bleue tient compte de la résonance de la pièce. (Lafont)

Ces matériaux étant couramment utilisés dans les habitations standards, et les niveaux dans la bande 63 Hz étant de plus en plus marqués dans les musiques actuelles, les conséquences en termes d’isolement sont donc terribles.

Effets sur la santé

L’exposition au bruit dans l’environnement urbain est difficile à évaluer à cause de l’exposition à des nuisances multiples. Les impacts sur la santé sont à considérer car les effets peuvent nuire à l’état de bien-être mental, physique et social de la population. « On constate […], en restant au plus près des réponses des enquêtés, d’une part que les sonorités graves semblent perçues autant, si ce n’est plus, par le corps que par les oreilles ; d’autre part qu’elles sont assimilées à des bruits pénibles, qui relèvent de la nuisance sonore. Il est frappant que les enquêtés aient presque tous répondu dans ce sens, alors que ce n’était pas la question qui leur était posée. » « Les bruits graves remplissent donc l’espace, mais avant tout, ils remplissent, ils envahissent les oreilles (assourdissant), la tête (entêtant, lancinant), le corps tout entier (perçus par tout le corps) » (Guastavino C. & Cheminée, P, 2003, [10]).

Les basses fréquences dans l’environnement sonore peuvent ainsi entrainer des perturbations du sommeil, des dépressions, et bon nombre d’autres effets secondaires.

« S’il est difficile d’établir un lien direct de cause à effet entre l’état de santé des personnes s’adressant au CIDB et les nuisances sonores – de nombreux facteurs tels que la solitude ou un handicap physique peuvent interagir –, il est en revanche indéniable que les personnes confrontées à des problèmes de bruit sont en souffrance, physique ou mentale, pour la plupart depuis longtemps. Ce constat, les psychologues du CIDB le font de manière quotidienne à travers leur mission d’écoute et de conseil. Certains plaignants, à bout de souffle, en larmes ou au bord de la crise de nerfs, sont d’autant plus désemparés qu’ils ont entrepris pour la plupart de nombreuses démarches mais en vain.» (CIDB, [3])

Les contextes musicaux, sociaux et technologiques ont fait apparaître un niveau sonore croissant dans les graves. Les choix de conception des systèmes de diffusion sont très étendus, complexes et leurs conséquences, aux vues des puissances mises en jeu, doivent être maîtrisées. Pour maîtriser un système il faut pouvoir le caractériser et donc le mesurer.

B. Problématiques de mesure des basses fréquences

1. Contraintes dues à la salle

1.1 Modes de résonance dans une salle

Lorsque du son est diffusé dans une pièce, les ondes sonores vont rencontrer des obstacles : murs, scène, objets de toute taille. Une partie de l’onde sonore va être absorbée tandis que l’autre partie va être réfléchie ou diffusée. En fonction de la taille de la longueur d’onde (λ) par rapport à la taille de l’obstacle, les réflexions vont être différentes :

Figure 2 : (A) un obstacle très petit devant la longueur d’onde (B) un obstacle plus grand que la longueur d’onde (Everest F. Alton, [5])

Dans la figure (A), l’obstacle est si petit par rapport à λ qu’il n’influence pas la propagation du son. Le son ne le voit pas et le contourne. En revanche, dans la figure (B), les dimensions de l’obstacle font plusieurs longueurs d’onde. Cela a pour effet de créer une zone d’ombre derrière l’obstacle qui tend à être irradiée par le front d’onde des sources qui rencontrent l’obstacle. Cela met en évidence que l’impact d’un objet, d’une forme, sera très différent en fonction de la fréquence observée. Pour les basses fréquences, on peut approximer qu’un objet de moins de 1 m n’a pas d’impact significatif sur la propagation du son.

Les longueurs d’onde des basses fréquences (25 Hz – 100 Hz) soumises à notre étude s’étalent de 13m80 à 3m40, et sont donc souvent proportionnelles aux dimensions des salles (longueur, hauteur de plafond, diagonales…). Les ondes vont être réfléchies par les parois, se propager dans plusieurs directions et interférer avec leurs propres réflexions circulant dans le sens inverse.
« Lorsque deux trains d’ondes se propageant en sens contraire se rencontrent, il se forme des ondes stationnaires. Les ondes stationnaires sont formées par des zones où l’air est soumis à des mouvements de compression et de décompression qui ne se déplacent pas. Ces zones sont situées à une distance l’une de l’autre égale à la moitié de la longueur d’onde des signaux qui la produisent. Ce sont des ventres, mouvements de compression maximale, et des nœuds acoustiques où ils sont nuls» (Besson R. & Alary J., 2007, [2])

Figure 3 : Cas en 2D d’ondes stationnaires entre deux parois rigides et réfléchissantes (Jouhaneau J., 1992, [13])

Ainsi, pour une longueur d’onde donnée, en partant du point de réflexion, on rencontre un ventre à λ/4 et à 3λ/4 et un nœud à λ/2. Dans cette figure on note également que les modes font intervenir les fréquences propres et leurs harmoniques physiques.

Figure 4 : Vue dans l’espace. Modes axiaux 1D (a), Modes tangentiels 2D (b) et modes obliques 3D (c) (Jouhaneau J., 1992, [13])

Les différentes fréquences auxquelles le phénomène apparaît s’appellent les modes propres de la pièce ou fréquences de résonance. Les modes propres dépendent directement de la géométrie de la salle. Il apparait alors de très fortes différences de niveaux sonores entre les ventres (max) et les nœuds (annulations).

Nous avons simulé à l’aide du logiciel CARACAD, l’effet d’un haut-parleur situé dans l’angle d’une pièce de petites dimensions. Voici ci-dessous une sélection de modes propres apparaissant lors de la simulation.

Figure 5 Modélisation par le logiciel CAD des modes propres pour une petite salle

Pour rappel,
- entre deux murs espacés d’une distance L, les fréquences propres seront : 𝑓𝑛 = 𝑛 * 𝑐/2𝐿
- Pour une salle parallélépipédique de dimensions Lx, Ly et Lz, on a :
l, m et n sont 3 entiers relatifs associées respectivement aux dimensions x, y et z ([20]).

1.2 Sources Image

Lorsque l’on positionne un haut-parleur dans une salle, son rayonnement est en partie réfléchi par les murs selon les mêmes lois que l’optique géométrique (lois de Descartes).

Les distances de parcours entre le son direct et le son réfléchi contre le mur (D1, et D2) ne sont pas les mêmes. Ainsi, le rayon réfléchi arrive avec un décalage de temps au microphone. Il va donc apparaître un phénomène d’interférence dit de « filtre en peigne » qui va varier en fonction de la fréquence, du retard de propagation et du niveau de la réflexion par rapport au son direct.

Dans le cas du schéma ci-dessus, on obtient : D1 = 10.05 m et D2 = 11.18 m. le décalage entre les deux impulsions émises par chaque sub vaut 3,28 ms. On affiche le résultat dans le logiciel Spectralab et on observe le filtrage en peigne correspondant :

Figure 6 : Filtrage en peigne de deux impulsions décalées de 3.28 ms et convoluées avec du bruit rose-jaune (1 impulsion), rouge (2 impulsions décalées de 3.28 ms)

Un tel phénomène physique est donc catastrophique en termes de mesure. On peut remarquer la présence de nombreuses annulations en amplitude alors que le micro est soumis aux réflexions de la paroi.

Dans cet exemple, nous avons relevé un premier ventre à 315 Hz et un premier nœud à 152 Hz. En effet, on obtient la fréquence du premier nœud lorsque les deux impulsions sont espacées de λ/2 (ici 1/(3,28 * 2 * 10−3) soit 152 Hz environ).

L’écart maximal mesurable entre les valeurs de sommation et d’annulation les plus fortes peut atteindre 30 dB, d’où la nécessité de mesurer en plusieurs points. D’un point de vue de la mesure, il est toujours préférable de mettre le microphone au sol pour éviter ces effets de filtre en peigne et obtenir des résultats plus caractéristiques. En moyenne, si le microphone est à 1,30 m du sol, le filtrage en peigne intervient dans le haut grave.
D’un point de vue homogénéité du son dans la salle, si l’on met l’enceinte contre la paroi, la source image est très proche, et donc la directivité n’est pas modifiée dans les basses. En revanche, dès que l’on éloigne un peu l’enceinte, l’effet de filtrage en peigne devient non négligeable. En pratique, trois cas se présentent :
- Si le subwoofer est le plus possible collé au sol ou au mur :
  Ceci permet de bénéficier d’un minimum de distance entre la source image et la source réelle. La directivité est hémisphérique et l’on gagne +6 dB de rendement sous réserve que la hauteur naturelle du sub soit petite vis-à-vis de la longueur d’onde (pour 100 Hz par exemple, la hauteur du sub ne doit pas dépasser 1m13 pour éviter des filtrages en peigne. En effet, 120° à 100 Hz correspond à 1m13 cf. le cercle des phases au paragraphe suivant). On obtient donc un gain de 6 dB sans engendrer de modification majeure de la directivité. Cependant, se rapprocher des murs sur un sujet où l’on tient compte du voisinage n’est pas une bonne idée … !
- On place le subwoofer à une distance de 1m70 du sol afin de créer une directivité verticale. En effet, le dipôle formé par le subwoofer et la source image annule l’énergie vers le plafond (cf. figure 7)
Figure 7 : Exemple d’une implantation cardioïde où la hauteur des subwoofers a été choisie pour que la source image générée par sol annule l’énergie vers la toiture.

À partir du moment où la distance entre le point d’écoute et la paroi est importante (par exemple la source image crée par le mur de derrière), l’impact dans les basses fréquences est fondamental. Si l’on reprend l’exemple ci-dessous mais « retourné », le mur générant la source image devient le mur derrière le sub et il se produit alors une annulation à 50 Hz au point d’écoute…
- Si le sub est très loin du sol : les effets ne sont pas déterminés facilement mais il apparait de forts phénomènes constructifs et destructifs (filtres en peignes). Nous rappelons donc encore une fois la nécessité de mesurer en plusieurs points.
Pour comprendre ce phénomène, il faut étudier les influences de trois grands paramètres :

La Phase

La longueur d’onde d’une sinusoïde peut être reliée au cercle trigonométrique.

Figure 8 : Phase et longueur d’onde (Pietquin D. 2008, [18])

Si l’on additionne deux ondes de même fréquence et de même niveau en augmentant la phase entre ces deux signaux, comment les ondes s’additionnent-elles ?

Figure 9 : Cercle des phases et valeurs d’annulation pour deux signaux de même niveau (Van Veen M., 2008, [24])

Figure 9, on observe que tous les décalages de phase compris entre 0° et 120° permettent de gagner entre 0 et 6 dB. En revanche, dès que l’on dépasse 120°, on perd de 0 à -∞ dB (hors phase).

Le Niveau relatif des signaux directs et réfléchis

Figure 10 : niveaux de sommation en fonction du niveau relatif et de la phase entre les deux signaux (Mc Carthy B., 2016, [24]) (NB : « ripple » signifie maximum de variation entre l’addition et la soustraction)

Il faut distinguer 3 comportements en fonction de la différence de niveau (offset) entre le son direct et le son réfléchi :
- 0 dB < offset < 4 dB : Zone de filtrage en peigne (« Combing zone ») : les phénomènes d’annulation et de sommation sont très importants. Ils peuvent varier de +6 dB à – 60 dB. Ces valeurs sont déterminées par le déphasage entre les deux signaux (cf. cercle des phases de la figure 9)
- 5 dB < offset < 10 dB : Zone de Transition les phénomènes de filtrage vont varier entre +4 dB et – 8 dB.
- 11 dB < offset : Zone d’isolation : le niveau de l’onde réfléchie étant plus de
  10 dB moins fort, les effets du filtrage sont minimes. Les signaux sont décorrélés.
Le Temps

Jusqu’à présent nous n’avons pas spécifié de valeur de retard. Un décalage de temps donné crée un décalage de phase différent à chaque fréquence.

Plus le décalage en temps augmente plus la première fréquence atteinte par le filtrage en peigne est basse. Par exemple, pour 1 ms de décalage, on aura un premier maximum d’annulation à 500 Hz (180°). C’est 360° à 1 000 Hz (premier maximum) mais aussi 720° à 2 kHz. Tous les maximums se retrouveront pour tous les multiples de 1 kHz, et les minimums à tous les multiples de 500 Hz…

Par conséquent, il faut faire très attention aux positionnements des enceintes près des murs. Celles-ci génèrent un filtrage en peigne dans les zones de diffusion à proximité et le placement du microphone de mesure peut s’avérer très difficile à optimiser.

Figure 11 : zones de sommation en fonction des fréquences et du décalage temporel (McCarthy B., 2016,[6]])

1.3 Impact du positionnement des sources sur l’excitation des modes propres

L’impact du positionnement de la source est crucial. En effet, son positionnement détermine quels sont les modes propres qui vont être excités.

Courbe de réponse et positionnement dans la salle

Figure 12 : Courbe de réponse d’un HP dans 3 situations différentes : Chambre anéchoïque (1), Angle d’une cabine en bois (2), Centre de la cabine en bois (3) (Rossi M., 2007, [20])

On observe sur la figure 12, de grandes irrégularités des courbes de réponse 2 et 3 par rapport à la 1, manifestant des pics et des creux selon les excitations des modes. On remarque aussi une différence d’amplitude assez marquée entre les réponses dans la cabine et la réponse en salle anéchoïque.

2. Comment mesurer les basses fréquences ?

2.1 Signaux de mesure

Les quatre principaux signaux utilisés pour caractériser un système sont : le bruit rose, la musique, le balayage en fréquence (« sweep »), et les séquences MLS.

Bruit Rose

C’est un signal aléatoire dont l’intensité de chaque portion de bande d’octave est constante. Cela permet de se rapprocher de la perception de l’oreille qui est logarithmique. Le bruit rose donne un spectre plat quand il est analysé par un analyseur de spectre standard (sonomètre par exemple).

Avantages :
- Ce signal est très simple d’utilisation. En effet, lorsqu’il est nécessaire de faire des moyennes aussi bien spatiales que temporelles, le bruit rose est relativement constant sur tous les facteurs possibles.
Inconvénients :
- Il nécessite une très forte dynamique d’émission pour avoir un rapport signal sur bruit suffisant. pour que le bruit de fond ne perturbe pas la mesure, il faut que le bruit généré par les enceintes soit largement supérieur.
- Mélange le signal et les distorsions
- Ne fournit pas d’information temporelle
- Nécessite des mesures longues
Musique

Avantages :
- La musique actuelle étant naturellement beaucoup plus compressée que le bruit rose, le facteur crête est beaucoup plus faible et permet donc de générer beaucoup plus d’énergie pour la même dynamique maximum (que le bruit rose).
- Elle permet de faire en plus une mesure dans les conditions réelles d’exploitation et de mettre en évidence des phénomènes vibratoires associés à la dynamique du signal.
Inconvénients :
- Ce signal doit être utilisé avec beaucoup de précaution, l’usage de plusieurs morceaux est indispensable pour maximiser la répartition en fréquence.
« Sweep »

C’est un signal qui balaye toutes les fréquences nécessaires pendant une durée prédéfinie. Si les signaux sinusoïdaux sont employés depuis longtemps en audio et en mesures acoustiques, ce n’est que depuis une vingtaine d’années que les progrès informatiques ont permis d’étendre leur usage : grande amélioration des mesures de réponses impulsionnelles, de distorsion et de systèmes à la fois non linéaires et non invariants dans le temps. Le « sweep » permet de gagner un rapport signal sur bruit inatteignable avec la méthode MLS, car il permet de s’affranchir de la distorsion harmonique due aux non-linéarités du haut-parleur. (Farina, A., 2007, [7])

Comme il est très difficile de générer beaucoup d’énergie en 1s, l’idée est de répartir le sweep sur plusieurs secondes, puis de reconvoluer le signal mesuré. (Il est impossible d’envoyer 10 000 W en 1s mais facile d’envoyer 1 W pendant 10 000 secondes…) En reconvoluant le signal mesuré, on ramène toute l’énergie mesurée fréquence par fréquence en un seul instant.

Figure 13 : Gain en SNR³ en fonction de temps de mesure du sweep en relatif à une mesure en bruit rose (Rousseau D.,[22])

Plus le temps de mesure est grand (Figure 13), meilleure est l’amélioration du rapport signal sur bruit. Dès 3 s de mesure, on gagne 20 dB par rapport à un bruit rose.

Avantages :
- Il permet de mesurer le niveau et la réponse impulsionnelle en même temps, de s’affranchir des bruits constants, et du bruit de fond. Un « sweep » de 47 s permet un gain de 33 dB de SNR par rapport à un bruit rose de même durée… Le « sweep » permet de mesurer avec virtuellement 2000 fois plus de puissance…
- Il permet de vérifier la reproductibilité et de connaître intrinsèquement le rapport signal/bruit de chacune des mesures
Inconvénients :
- Nécessite un dépouillement plus complexe
- La mesure en plusieurs points nécessite soit de faire plusieurs mesures discrètes et d’en faire la moyenne, soit d’utiliser un système multi micros.
Signal MLS

Maximum Length Sequence. C’est une séquence binaire pseudo aléatoire permettant d’extraire la réponse impulsionnelle. Dans la pratique, il s’agit d’un signal que l’on pourrait confondre avec un bruit rose s’il est préalablement refiltré, mais qui permet par un traitement informatique de retrouver une réponse impulsionnelle si le système est invariant.

Avantages :
- Il permet de gagner artificiellement du rapport signal bruit mais de façon moins importante que le « sweep ».
- Le son du signal MLS est un son relativement peu dérangeant pour l’audition là où le
  « sweep » présente des séquences caractéristiques de sons d’ovnis….
Inconvénients :
- Inutilisable à très grande distance car une variance du temps de propagation de groupe rend inopérante la reconstruction de l’impulsion.
- Usage plus compliqué car nécessite le bon choix des critères du traitement du signal (taille et type de la fenêtre).
2.2 Techniques d’analyse

i. Pondérations et perception des basses fréquences par l’oreille humaine

La mesure des basses fréquences doit prendre en compte le comportement de l’oreille humaine. En effet, l’oreille humaine n’est pas aussi sensible aux basses fréquences qu’aux sons médiums ou aigus émis à la même pression acoustique. Le schéma ci-dessous reproduit les courbes d’isosonie de Fletcher et Munson (1933) qui représentent la sensibilité moyenne de l’oreille pour la plage des fréquences audibles. Ces courbes indiquent, pour chacune des fréquences du spectre audible, le niveau de pression acoustique (SPL pour Sound Pressure Level) nécessaire à la perception d’une même intensité par un être humain. D’où le terme « courbe d’égale (iso)sensation sonore (sonique) ».

Figure 14 : Courbes isosoniques (Fletcher et Munson, 1933)

Cela signifie que les sons graves demandent plus de niveau sonore que les sons aigus pour être perçus à la même intensité. Ce phénomène est très marqué à faible niveau. Par exemple pour avoir la même sensation sonore de 30 dB SPL à 1000 Hz, il faut mettre +30 dB à 50 Hz. Même à fort niveau ce comportement reste vrai même s’il est fortement atténué : à 100 dB SPL il faut toujours 10 dB de plus à 50 Hz qu’à 1000 Hz.

Il est possible d’approcher ce comportement relatif au fonctionnement de l’ouïe humaine à l’aide de filtres de pondération pour un niveau donné. Il existe quatre filtres de pondération. Pour notre étude nous nous concentrerons sur les filtres A et C qui sont stipulés dans les règlementations pour la mesure de niveaux en salle et sur le voisinage.

Une pondération fréquentielle c’est « la différence entre le niveau du signal indiqué sur le dispositif d’affichage et le niveau correspondant d’un signal d’entrée sinusoïdal permanent d’amplitude constante, cette différence étant spécifiée dans [la] norme en fonction de la fréquence » (NF EN 61672-1, Electroacoustique et sonomètres, Juin 2003). Dans la réglementation, les pondérations A et C sont définies par la norme CEI 61672-1 sous la forme de tableaux de coefficients à appliquer aux mesures par octave ou tiers d’octaves.

Figure 15 : Pondérations A B C D définies par la norme CEI 61672-1

La formule définie dans la norme et permettant de calculer en décibels, les pondérations C et A est la suivante :

𝐶1000 et 𝐴1000sont des constantes de normalisation, en décibels, qui représentent les gains électriques nécessaires pour obtenir des pondérations A et C égales à 0 dB à 1 kHz. Pour la pondération C, deux pôles sont situés à la fréquence f1 pour les basses fréquences et deux pôles sont situés à la fréquence f4 pour les fréquences élevées. La pondération A est réalisée en ajoutant à la pondération C deux filtres passe-haut du premier ordre couplés, dont les pôles sont les fréquences f2 et f3.

Voici un extrait des coefficients fournis dans les tableaux de la norme et calculés grâce aux formules ci-dessus. Ils sont volontairement plus détaillés dans les basses fréquences :

La pondération A correspond à la sensibilité de l’oreille pour les sons purs à faible volume, et donne donc peu d’importance aux basses à l’inverse de la pondération C. Physiquement parlant, les pondérations A et C reproduisent approximativement sous forme inversée les courbes d’isosonies (Le Haut Conseil à la Santé (figure 16 ci-dessous) met en évidence que la courbe 40 phones se rapproche de la pondération A et que celle de 100 phones correspond environ à la pondération C).

Figure 16 : courbe du champ auditif et de pondération acoustique (HCSP, [26])

ii. FFT et analyse en bande fine

1. Résolution fréquentielle de FFT

La transformée de Fourier Rapide (Fast Fourier Transform) est le principal outil mathématique utilisé pour l’analyse de spectre fréquentiel dans beaucoup de logiciels. Son paramétrage doit être choisi très précisément pour la mesure en basse fréquence. La Transformée de Fourier permet de passer du signal audio temporel à l’analyse de sa composition dans domaine fréquentiel (amplitude et phase) et inversement.

Figure 17 : Source: getting started with Smaart 7.2

Figure 18 : Influence de la taille de la FFT sur la résolution fréquentielle (Van Veen M., 2017, [24])

La fenêtre d’analyse de la FFT sélectionne une partie du signal dont la taille détermine le nombre de points d’analyse. Plus la fenêtre d’analyse est grande plus la résolution fréquentielle entre deux points diminue.

« Le traitement commence par le remplissage d’une mémoire de taille donnée (généralement une puissance de 2. Par exemple, un bloc de N = 1024 = 2^10 échantillons temporels) qui sera la base temporelle d’analyse. Ces N échantillons temporels seront ensuite passés dans un algorithme de calcul FFT » (01dB, [27]).

La durée de remplissage des N échantillons dans la mémoire correspond à la durée minimale pendant laquelle il faut observer le signal pour pouvoir l’analyser (c’est-à-dire sa sélectivité temporelle). Si l’on échantillonne à la fréquence Fe et que l’on doit prendre Ne échantillons, il nous faudra attendre un temps T = Ne/Fe secondes (1024 points à 44.1 kHz = 23 ms).
La résolution fréquentielle obtenue est B = Fe/Ne Hz (1024 points à 44.1 kHz = 43 Hz). Cela signifie que l’on a un point d’analyse tous les 43 Hz, donc un seul point pour l’analyse de toutes les fréquences graves.

Pour les basses fréquences, il est donc important de prendre une taille de FFT largement plus grande que 1024. Il est typique d’utiliser une fenêtre de 65000 points pour une fréquence d’échantillonnage de 44.1KHz.

« Le produit BT = Fe/Ne * Ne/Fe =1. Si l’on veut mesurer un signal avec une résolution de 1 Hz, il nous faudra l’examiner pendant au moins 1 seconde, avec une résolution de 2 Hz pendant 0.5 s, 0.5 Hz pendant 2 s, et ce quelque soit l’instrument de mesure utilisé. Les limites de résolution temporelle et de résolution fréquentielle sont données par le produit BT= 1.» (01dB, [27]).

Il y a un donc compromis entre la résolution fréquentielle et temporelle, il faut adapter la fenêtre d’analyse à la nature du phénomène observé. Un phénomène stable pourra être décrit avec une grande précision fréquentielle en prenant une taille de FFT importante, par contre un signal relativement variant devra être observé avec une taille de FFT courte si l’on souhaite pouvoir visualiser sa variation temporelle. Dans ce compromis, quand on observe un phénomène aléatoire, il est souvent plus simple d’utiliser une technologie en bande de filtres plutôt qu’une technologie FFT du fait des artefacts de mesure (c’est en ce sens que la norme n’autorise pas l’utilisation de la FFT pour les sonomètres de classe 1). Caractériser l’enveloppe demande de faibles tailles de FFT, alors que caractériser sa fréquence demande une grande taille de FFT.

2. Limites de la FFT

Cependant, le signal que l’on cherche à mesurer est un signal physique réel, non prédictible. Il est à priori non périodique… « Monsieur le baron Fourier indique de travailler sur un temps infiniment long, sauf si la fonction est périodique. Aucune mémoire n’est suffisamment importante pour accueillir la totalité du signal ! Le fait de limiter la durée d’observation à un bloc de longueur donnée entraîne comme conséquence de considérer notre signal comme périodique, de période égale à la durée d’observation (la longueur du bloc temporel) » ([27]).

Figure 19 : Analyse des discontinuités introduites dans le signal temporel lors de l’utilisation d’une fenêtre rectangulaire (01dB, [27])

« Cette périodisation artificielle crée des discontinuités dans le signal temporel. De telles discontinuités dans le domaine physique correspondent à des énergies infinies. […] [Le signal étant numérisé], la discontinuité ne se traduit pas par un saut à énergie infinie mais par un saut de pente plus ou moins raide, donc une énergie plus ou moins importante qui vient s’ajouter au signal. En fait on vient de regarder notre signal avec une fenêtre rectangulaire, c’est à dire que l’on a ouvert les yeux de l’analyseur à un moment donné dans la vie du signal, que ses yeux sont restés ouverts pendant la durée d’observation et que brutalement, ils se sont refermés à la fin de l’observation. L’analyseur a taillé dans le vif le signal. Il n’a respecté aucune périodicité. » (01dB, [27])

Pour éviter les discontinuités introduites par une telle fenêtre, impliquant des erreurs d’estimation de l’énergie portée par le signal, on impose à l’analyseur d’utiliser d’autres fenêtres temporelles.

3. Fenêtrage

Nous ne détaillons pas tous les types de fenêtres utilisés dans le calcul de la FFT, mais nous nous concentrons sur les deux fenêtres les plus standards et utilisées par la suite pour les analyses des données.

« La définition d’une fonction utilisable en tant que fenêtre de pondération doit suffisamment déformer le signal temporel pour le rendre périodique tout en respectant suffisamment le signal pour que les résultats trouvés restent représentatifs. » (01dB, [27]) Beaucoup de fenêtres temporelles existent et font un compromis entre l’optimisation de l’erreur maximale commise sur le niveau mesuré et la résolution fréquentielle. Par exemple, Blackman-Harris est très adaptée au repérage fréquentiel, « Flat-Top » est adaptée à la quantification de l’énergie et donc à la mesure de niveau… Les fenêtres seront donc à choisir en fonction du type de signal analysé et du compromis désiré.
La fenêtre de Hanning est de loin la plus utilisée et optimise bien le compromis résolution fréquentielle / résolution en amplitude.

Figure 20 : Effet de la fenêtre de Hanning sur une fonction (01DB, 1996, [27])

La fenêtre de Hamming est dérivée de la fenêtre de Hanning (même utilisation), mais l’accent a été mis sur la résolution fréquentielle (donc au détriment de la résolution en amplitude). Elle est à conseiller lors de la recherche de la fréquence « exacte ».

4. « Overlap »

Pour un analyseur donné, il faut choisir le pourcentage d’« overlap » entre deux fenêtres d’analyse. Plus les fenêtres sont imbriquées, plus l’on est précis dans notre analyse mais plus cela nécessite de la puissance de calcul.

iii. Conversion en affichage par bandes de fréquences

Une fois la taille de FFT choisie, on découpe le spectre en bandes de fréquences afin d’améliorer la lisibilité des données et se rapprocher du phénomène d’intégration de l’audition humaine.
L’idée est d’appliquer au signal des filtres normalisés par bandes à largeur relative constante Δƒ/ƒ (c’est-à-dire dont la bande passante est proportionnelle à leur fréquence centrale).
Il existe trois grands types de résolution d’affichage : par bande d’octave (sonomètres par exemple), par tiers d’octave (la plupart des appareils de mesure le proposent), ou bande fine (résolution variable en fonction de l’analyseur, par exemple 1/48).
Dans le cas d’une analyse de mesures d’un sub en salle, et donc soumis à des phénomènes acoustiques complexes vus précédemment, il est nécessaire d’affiner la résolution d’affichage afin de pouvoir mettre en évidence ce qui relève des modes propres. On utilise alors l’analyse en bandes fines. Elle sert à caractériser les problèmes.

Figure 21 : fréquences (Hz) en tiers d’octave et octave (Mario Rossi, 2007, [20])

Si l’on veut obtenir un résultat quantitatif, le tiers d’octave est un très bon moyen de visualiser le résultat. Par exemple, pour un signal présentant des tonalités marquées (trompette) l’affichage en octave et en tiers donne :

Figure 22 : spectre en bande d’octave, tiers d’octave et 24e d’octave de la trompette jouet de Toutankhamon (Mario Rossi, 2007, [20])

2.3 Techniques de prise de son : robustesse des mesures en basse fréquence

Comme expliqué précédemment, lors d’apparition d’ondes stationnaires, il apparait des nœuds et ventres de vibrations pour les fréquences dont la demi-longueur d’onde est multiple de la distance interparois. Les basses fréquences soumises à notre étude étant précisément les fréquences concernées par les ondes stationnaires, il apparait donc que si l’on place un microphone de mesure sur un nœud de vibration, le niveau observé sera nul alors qu’un quart de longueur d’onde plus loin le niveau atteindra un maximum. Il est donc très facile de faire une erreur de mesure s’il l’on place un microphone fixe dans une pièce.

Le tableau ci-dessous réalisé par David Rousseau et Igor Prade montre les écarts de mesure pour une position fixe du microphone à l’émission (local contenant les enceintes) et à la réception (pièce adjacente). Les mesures ont été réalisées sur 4 types de signaux différents (bruit rose, techno 40 Hz, techno 50 Hz, techno 63 Hz).

On remarque que plus l’on descend en fréquence, plus l’écart de mesure est important. L’écart maximum à 63 Hz peut atteindre 24 dB (12 dB à l’émission et 12 dB à la réception) ce qui est colossal aux vues des exigences des législations.

Comment mesurer si les écarts de mesure dus à la position du microphone sont si importants ? Il faut multiplier le nombre de points de mesure pour diminuer la probabilité de tomber sur la seule et unique valeur d’un nœud de vibration de la fréquence mesurée. La question qui découle immédiatement de ce système de mesure est celle du nombre de microphones qu’il faut employer. Cela diffère-t-il pour chaque fréquence ?

Dans leur étude « Estimation de la robustesse des mesures à 63 Hz », David Rousseau et Igor Prade ont effectué l’expérience suivante. Dans une salle fermée type cave, 4 morceaux de musique ont été joués, et 11 mesures ont été réalisées par morceaux à l’aide de 4 sonomètres Solo 01dB. Les valeurs retenues correspondent donc à la moyenne des 4 morceaux et sont donc basées sur 44 mesures.

« Fixe » : sonomètre immobile durant la mesure.

« en 8 » : On fait une forme de 8 sur 1m environ afin de moyenner dans l’espace

« moy de 5 » : moyenne énergétique de 5 points au hasard.

Analyse des résultats :

La comparaison de plusieurs mesures en 1 point donne des résultats de niveaux sonores totalement aléatoires pouvant approcher une variance de plus de 14 dB pour un écart type proche de 4 dB. L’énergie fournie dans les basses fréquences (octave 63 Hz) est donc techniquement difficile à évaluer ou estimer.

En revanche, l’usage d’un système à plusieurs microphones, ou la mesure en plusieurs points (en simultané ou en séquentiel) permettent de réduire ces différences dans les résultats. En effet, le fait de moyenner énergétiquement 4 points répartis aléatoirement dans la pièce (à 1 mètre minimum des parois) permet d’obtenir une fiabilité sur les mesures à 63 Hz équivalente à celles réalisées actuellement à 125 Hz en fixe (pour une même variance de 3).

On peut conclure que sur la base d’un écart type de 1,5 dB et un écart maximum d’environ 7 dB (statistiques réalisées sur 55 000 échantillons), la moyenne dans l’espace (« en 8 ») et la moyenne multi micros sur 5 positions permettent de mesurer les octaves 63 Hz et 125 Hz avec la même fiabilité.
Voici ci-dessous la description de ces deux techniques de façon plus détaillée.

iv. Mesures mobiles ou « Moyenne spatiale »

La mesure s’effectue en continu avec le sonomètre en main et en déplaçant le microphone tant sur le plan horizontal que vertical dans toute la pièce.

Contraintes techniques : durant la mesure, une attention particulière sera à apporter lors du déplacement dans le local afin qu’il ne soit pas source de bruit pouvant perturber le relevé en cours (Exemple : parquet qui craque sous les pas). La hauteur du microphone de mesure ne devra pas être fixe, notamment afin d’éviter le mode 1 de la hauteur du local. Une durée minimum de 2 minutes est nécessaire.

Pour chaque mesure, il s’agit de bouger en continu le microphone autour de sa position jusqu’à ce que la mesure soit stabilisée.

v. Mesures fixes ou « multi micros »

Il s’agit de positionner plusieurs microphones de mesure. 4 ou 5 points sont nécessaires notamment pour la mesure à 63 Hz. Il faut ensuite en calculer la moyenne énergétique. Une durée de mesure de 1 minute est suffisante. Deux méthodes sont possibles :

La méthode FFT a pour avantage de nécessiter moins de ressources de calcul. En revanche, comme vu dans § 2.2.ii, les fenêtres de pondération introduisent des erreurs de calcul. La méthode par bande de filtres est simple à utiliser, comporte peu d’erreurs mais nécessite un processing plus important. La FFT permet également d’accéder facilement à l’analyse en bande fine, alors que la bande de filtre ne le permet que très difficilement.

La connaissance des difficultés de mesure dans les basses fréquences permet de caractériser le système de diffusion. Une fois le système caractérisé, il faut pouvoir maîtriser la diffusion des basses fréquences et limiter les émergences sur le voisinage. La directivité permet de concentrer l’énergie sur le public. De nombreux travaux ont déjà été synthétisés sur la manière de créer de la directivité avec des subwoofers. Nous donnons ici des informations sur les configurations que nous allons ensuite simuler dans le logiciel, puis vérifier via les mesures au hangar et dans la pratique sur un concert.

C. Configurations standards

1. Cardioïde

« En disposant deux enceintes l’une derrière l’autre, écartée d’une distance d (entre les faces avant), et en retardant l’enceinte avant de τ = d/c (c, vitesse du son dans l’air), on obtient des interférences modulées par la fonction cardioïde : 1 − cos(θ). La première annulation à l’arrière a lieu à la fréquence f1 dont la longueur d’onde λ1 est égale au quart de la distance
d. » (Pierrick Saillant, 2010, [23]).

La méthode la plus théorique consiste à placer une distance entre les sources correspondant au quart de la longueur d’onde de la fréquence d’accord. Cette configuration sera appelée dans la suite du mémoire « NATIVE ». Toutes les autres variations de distance entre les subs correspondent à des configurations dites non natives.

2. Cardioïde à gradient

Une autre possibilité d’accord de la configuration en cardio consiste à utiliser le hors phase en même temps que le délai. Le principe consiste à utiliser le hors phase pour la réjection arrière, tandis que le délai assure la sommation à l’avant. La valeur du délai correspond à la distance entre les subs.

Figure 23 : Configuration cardioïde à gradient (Bob Mc Carthy, 2016, [6])

3. End Fire

Le End Fire consiste à aligner plusieurs sous-ensembles cardioïdes les uns derrière les autres.

Figure 24 : Configuration End Fire (Bob Mc Carthy, 2016, [6])

D. Décrets réglementaires relatifs aux nuisances sonores

1. Définitions essentielles

Pour comprendre les réglementations il est tout d’abord nécessaire de définir quelques termes et concepts physiques essentiels.

Unités de mesure des niveaux dans la règlementation

Tous les niveaux réglementés se mesurent à l’aide d’un sonomètre intégrateur homologué (Norme AFNOR NF S 31-109). En effet, la Transformée de Fourier Rapide (FFT) n’est pas utilisée car elle n’est exacte que pour des signaux impulsionnels. Pour des signaux réels elle commet une approximation. On utilise donc un sonomètre comportant des bandes de filtre normalisées. Dans la première partie nous avons vu que le niveau de pression acoustique brut ne correspond pas à la perception sonore humaine ; pour cela, des pondérations de type A et C sont nécessaires. Lors de la mesure d’un niveau, les sonomètres appliquent tout d’abord cette pondération fréquentielle A ou C à l’aide d’un filtre, puis, ils calculent la moyenne énergétique équivalente du signal (Leq,T exprimé en dB). C’est un indice énergétique. En considérant un son stable ou fluctuant perçu pendant une durée T, le niveau énergétique équivalent représente le niveau de bruit constant qui aurait été produit au même point de mesure et durant la même période.

« […] Un son véhiculant une énergie W pendant un temps t est équivalent à un son d’énergie W/2 pendant un temps 2t.» (Meyer-Bisch C., 2005, [16])

À partir des niveaux pris comme référence pour la santé au travail, soit 85 dBA sur 8 h nous avons calculé des équivalences de dose perçues dans le tableau ci-dessous. « Valeurs d’exposition supérieures déclenchant l’action de prévention prévue à l’article R. 4434-3, au 2° de l’article R. 4434-7, et à l’article R. 4435-1. Niveau d’exposition quotidienne au bruit de 85 dB(A) sur 8 h » ([25])

Figure 25 : échelle des niveaux de bruits nocifs pour l’audition (dB A) en comparaison iso-énergétique.

Si l’échantillonnage a été effectué avec une pondération fréquentielle (A par exemple), le niveau équivalent, sera alors exprimé en dB(A) et symbolisé par LAeq,t. Ce niveau est très régulièrement utilisé comme indicateur de gêne. On observe en effet, dans la pratique, une bonne corrélation entre cette valeur et le risque auditif ressentie par un individu exposé au bruit. Le dBA n’a pas été crée pour la règlementation sur les risques auditifs. En revanche, c’est le seul indice historique pour lequel il existait beaucoup de données épidémiologiques.

Définitions des termes réglementaires associés à la protection du voisinage

Considérons la situation standard d’une boîte de nuit et d’une habitation adjacente. Les niveaux sont mesurés à l’aide d’un sonomètre en Leq. Définissons les variables suivantes :

Musique = niveau d’émission à l’intérieur de la boîte de nuit

Emergence

Définition officielle

Article R.48-4 du Code de la santé publique :

«La différence entre le niveau de bruit ambiant, comportant le bruit particulier en cause, et celui du bruit résiduel constitué par l’ensemble des bruits habituels, extérieurs et intérieurs, dans un lieu donné, correspondant à l’occupation normale des locaux et au fonctionnement normal des équipements.»

Figure 21 : Analyse à 500 m des niveaux enregistrés à l’octave 40 Hz par le sonomètre sur un concert

Sur la figure 21, nous avons exporté des enregistrements de sonomètre effectués sur un concert pour illustrer les différents termes règlementaires.

Annexe [Les pièges à éviter lors de la mesure de l’isolement]

2.1 Listes des articles visant les diffuseurs de musique amplifiée

Quels sont les articles en vigueur pour les établissements diffusant à titre habituel de la musique amplifiée?

Remarque : Les règlementations distinguent le voisinage contigu et non mitoyen. «Dans les textes il est question de contiguïté et non de mitoyenneté. Tous les espaces mitoyens à un autre sont contigus mais tous les espaces contigus ne sont pas mitoyens. La contiguïté est à interpréter en termes de ponts acoustiques possibles entre le local d’émission et celui de réception. Par exemple, une ou des basses fréquences peuvent se transmettre par un conduit de ventilation qui est fixé au niveau d’un dernier étage. La transmission vibratoire se faisant par un accrochage de la fréquence de résonance du conduit (et de ses harmoniques), va impacter uniquement le dernier étage et non le 1ᵉʳ étage. Il y aura bien contiguïté car les vibrations se transmettent effectivement comme si l’appartement du dernier étage était mitoyen du conduit, ce qu’il est effectivement au niveau des accroches du conduit, ce dernier étant une extension et donc faisant partie intégrante du local d’émission.»⁴
[Décrets] en Annexe

Un nouveau décret est apparu le 7 Août 2017.Quelles sont les dispositions réglementaires de ces deux décrets et quelles sont leurs différences ?

2.2 Le décret fondamental n°98-1143 du 15 décembre 1998 et le nouveau décret n°2017-1244 du 7 août 2017

Exemples d’application des termes correctifs

Les termes correctifs font appel à la notion de dose de perturbation. En quelque sorte, plus la durée d’exposition est longue moins on autorise de dépassement.
- Une discothèque qui diffuse de 23H00 à 5H00 : durée cumulée = 6 heures
Période nocturne :

Tolérance d’émergence en niveau global (habitation contigües et non contigües) ≤ 3 dB(A) + terme correctif (6h = 1 dB(A)) = 4 dB(A)
- Un bar qui ouvre de 9 heures à 2 heures du matin et qui diffuse de la musique amplifiée sans interruption.
Période diurne : Le bar fonctionne en période diurne de 9h00 à 22h00, soit une durée cumulée = 13 heures

Tolérance (habitation contigües et non contigües) ≤ 5 dB(A) + terme correctif (6° = 0dB(A))= 5 dB(A)

Période nocturne : Ce même bar qui fonctionne, en période nocturne, débute la soirée à 22H00 pour fermer à 2H00, durée cumulée = 4 heures (un peu moins car il commence à fermer plutôt vers 1H45)

Tolérance (habitation contigües et non contigües) ≤ 3 dB(A) + terme correctif (5° = 2 dB(A))= 5 dB(A)

Clause spécifique aux enfants

Du fait de l’augmentation très importante des niveaux sonores et des pratiques à risques, le nouveau décret rajoute également une clause pour les enfants : « Lorsque ces activités impliquant la diffusion de sons amplifiés sont spécifiquement destinées aux enfants jusqu’à l’âge de six ans révolus, ces niveaux de pression acoustique ne doivent pas dépasser 94 décibels pondérés A sur 15 minutes et 104 décibels pondérés C sur 15 minutes»

Mise en œuvre

« Dans le cas où l’isolement du local où s’exerce l’activité est insuffisant pour respecter ces valeurs maximales d’émergence, l’activité de diffusion de musique amplifiée ne peut s’exercer qu’après la mise en place d’un limiteur de pression acoustique réglé et scellé par son installateur.»

Exigences d’application

Il est imposé aux lieux concernés par le décret, de faire une étude d’impact acoustique chargée de faire l’inventaire des problèmes d’isolation et des travaux d’isolations nécessaires. Si les valeurs d’isolation données par l’étude d’impact ne permettent pas de respecter les niveaux d’émergence : l’installation d’un limiteur est exigée. (Limiteur global ou par bande)

« L’étude acoustique ayant permis d’estimer les niveaux de pression acoustique, tant à l’intérieur qu’à l’extérieur des locaux, et sur le fondement de laquelle ont été effectués, par l’exploitant, les travaux acoustiques nécessaires. La description des dispositions prises pour limiter le niveau sonore et les émergences aux valeurs fixées par le présent décret, notamment par des travaux d’isolation phonique et l’installation d’un limiteur de pression acoustique»⁵

Un limiteur est un appareil inséré à la sortie de la console de mixage et limitant le niveau du signal sonore.

Quelles peines encourues ?

Pour le dépassement des niveaux en salle et des valeurs d’émergence (article R571-96) :
- Amende de 1 500 euros et/ou confiscation du matériel de sonorisation
- En cas de récidive : amende (3 000 euros) et/ou fermeture administrative de la salle.
- Si plainte au civil de la part des riverains : tribunal
Nota Bene important

À l’heure d’écriture de ce mémoire, la nouvelle règlementation n’est toujours pas fixée.

« L’interprétation des textes va être clarifiée par une note interministérielle avant sa mise en application en 2018. Dans l’immédiat, à partir du moment où [l’ancien texte] n’a pas été officiellement abrogé, sa validité perdure. (Quoiqu’il arrive, les niveaux à l’émission, pour le respect des 3 dB d’émergence par bandes d’octave pour les habitations contiguës, sont habituellement calculés par rapport aux taux d’isolement des locaux, donc que ce soit reconduit ou pas, la technique d’approche des bureaux d’étude restera la même, qu’elle soit officielle ou pas).»⁶

E. Problématique

Revue de littérature et mesure des basses fréquences

La propagation des basses fréquences à l’intérieur d’une salle est un phénomène physique très complexe et les techniques de mesures associées sont rarement décrites autrement que dans une vision universitaire. Il manquait donc une description pratique des méthodes à appliquer, et ce vis-à-vis de la protection du voisinage.

Revue de littérature et optimisation des systèmes de diffusion

Par ailleurs, les pratiques standard visent à optimiser l’énergie sur le public et à garantir un son sur scène acceptable. Il est par contre très rare d’associer à ces deux précédents critères la protection du voisinage. Il s’agit de montrer que l’on peut trouver une technique de diffusion permettant à la fois de garantir la qualité du son l’ensemble scène et public, et la protection du voisinage.

Ainsi, la caractérisation des systèmes vis-à-vis des problèmes de voisinage est rarement vue dans son ensemble et il manquait une synthèse des différentes techniques de mesure et de création de la directivité permettant d’offrir une vision globale au lecteur.

Revue de littérature et règlementation

Enfin, les textes légiférant sur les niveaux sonores sont très difficilement accessibles et compréhensibles car ils relèvent d’une méthodologie spécifique au domaine du droit qu’un technicien ou un ingénieur du son n’est pas à même d’appréhender facilement. De plus, dans leur rédaction actuelle, les textes présentent des incohérences technologiques qui rendent impossibles leur usage sans une interprétation qui demande d’importants retours d’expérience. Il est par exemple spécifié dans le 98-1143 un niveau sonore de 120 dB crête en tous points accessible au public alors que cette contrainte est impossible à mettre en œuvre lors d’un concert (explication détaillée dans le III. Discussion §A). Il est donc fondamental de connaître les us et pratiques qui ne sont pas décrits dans un document mais qui font appel à une expertise des professionnels du métier.

« Comment rendre directive la diffusion des basses fréquences pour limiter l’impact sur le voisinage et concentrer l’énergie sur le public ? ».

Objectifs, questions de recherche et approche méthodologique

Les objectifs de ce mémoire s’adressent aux ingénieurs du son sonorisateurs, acousticiens, caleurs systèmes, étudiants et tous ceux qui sont confrontés à des problèmes de voisinage liés à une sonorisation. Pour ce faire, ce mémoire offre des éléments de réponse aux questions de recherche suivantes :
1. Les règlementations anciennes et nouvelles sont-elles adaptées à la protection du voisinage ?
2. Comment mesurer de façon fiable les basses fréquences pour optimiser les systèmes de diffusion au regard des problèmes de voisinage ?
3. Comment choisir la configuration de subs la plus adaptée ?
4. En pratique, quelle est la procédure à adopter pour optimiser un système vis-à-vis du voisinage ?
Méthodologie de recherche :

Nous avons dans un premier temps cherché à définir une méthode de mesure juste et reproductible dans les basses fréquences. La méthode s’appuie sur la multiplication du nombre de points de mesure pour l’obtention de moyennes énergétiques.
Dans le but d’éliminer les spécificités des subwoofers industriels, nous avons décidé de construire nos propres subwoofers, au comportement le plus simple et prévisible possible. Leur taille très compacte a permis de se rapprocher le plus possible d’une source théorique et d’obtenir les résultats les plus généraux possibles.

Nous avons également programmé un logiciel de simulation afin d’avoir une souplesse d’analyse et de pouvoir automatiser des processus de comparaison non disponibles sur les logiciels commerciaux. Ceci nous a permis de pouvoir simuler puis mesurer avec une grande flexibilité les différentes configurations que nous voulions tester. Les mesures et simulations ont été confrontées aux logiciels actuels pour s’assurer de la validité des résultats obtenus. Les configurations de subs testées s’appuient principalement sur les études de Bob McCarthy.

Après avoir optimisé les subwoofers et validé les simulations en champ libre, nous nous sommes confrontés à l’influence de la salle, nettement plus complexe.

Enfin, nous avons mis en pratique les simulations ainsi que notre méthodologie de mesure lors de situations de concerts, utilisant des systèmes de sonorisation de grande ampleur.

Le sujet n’était pas de produire des données statistiques sur la qualité perçue mais plus de donner les bases théoriques et pratiques qui permettent au praticien de garantir un résultat optimal le plus vite possible.

Nous nous sommes intéressés à des mesures quantitatives du niveau sonore afin d’estimer les performances des différentes configurations. L’information qualitative résulte plus du traitement des données permettant d’évaluer la préservation de la réponse intrinsèque du système. La frontière entre qualitatif et quantitatif n’apparait pas simplement sur les problématiques de sonorisation car tout est lié. La méthode de recherche est donc mixte.

I. Optimisation de la directivité pour la maîtrise des basses fréquences dans l’environnement.

A. Logiciel d’agencement de plusieurs subs

1. Les logiciels de simulation et leurs limites

Spécificité relative aux marques d’enceintes

Le logiciel Soundvision produit des simulations spécifiques au constructeur. Par exemple, du fait de la spécificité constructeur du SB28⁷, la simulation par le logiciel Soundvision pour ce subwoofer à 100 Hz n’est pas omnidirectionnelle. En programmant notre propre logiciel, nous voulions nous rapprocher le plus possible d’un modèle théorique, afin de faciliter la compréhension des simulations.

Figure 26 : Simulation Soundvision à 100 Hz d’un SB28

Nécessité d’un affichage synthétique de la directivité par fréquence

Soundvision affiche un résultat de directivité pour une fréquence donnée ou bien pour une plage de fréquence dont il fait la moyenne énergétique. Ceci ne permet donc pas d’identifier les problèmes de lobes, fondamentaux dans la maîtrise de la directivité, de façon rapide. Prenons un exemple pour une configuration de 2 subwoofers espacés de 3,40 m.

Figure 27 : 2 subs espacés de 3m40. Nécessité d’une visualisation par fréquence pour comprendre les lobes de directivité

Dans la figure ci-dessus, la visualisation de 20 à 100 Hz ne présente pas de lobes de directivité tandis que les vues fréquence par fréquence font apparaître les lobes de directivité.

La nécessité d’avoir une vue synthétique des directivités pour chaque fréquence sur une seule et même image est ainsi un besoin décisif qui nous a poussé à concevoir notre propre logiciel.

Efficacité des relevés de données

Pour évaluer l’efficacité en amplitude d’une directivité, il faut mesurer les niveaux à 0°, 90° et 120° (directivité dans l’axe sur le côté et réjection à l’arrière). Sous Soundvision cela signifie que pour une configuration donnée, il faut pour chaque fréquence :
- Simuler la configuration à la fréquence mesurée
- Mesurer chaque point à la main
- Exporter les données
- recommencer le tout pour la nouvelle fréquence d’analyse.
Par exemple, pour un cardio simple, relevons 3 points à 50 Hz :

Cette procédure est beaucoup trop longue par rapport aux objectifs de notre étude.

Pour résumer, les problématiques suivantes nous ont poussés à développer ce logiciel :
- La volonté de se rapprocher du modèle théorique et de s’affranchir des spécificités fabriquant
- Le temps nécessaire à l’export des données.
- La visualisation séquentielle rend difficile la synthèse du phénomène par rapport à une visualisation instantanée des répercussions, pour chaque fréquence.
- Mettre en œuvre des concepts théoriques dans le logiciel de simulation pour mieux les appréhender, ce qui est essentiel pour pouvoir développer une capacité d’analyse des systèmes existants.
- Avoir une flexibilité totale dans le choix des éléments que l’on souhaite analyser.
2. Simulation des configurations

2.1 Méthode

i. Hypothèses préliminaires

La simulation utilise des sources considérées comme parfaitement pulsantes et omnidirectionnelles.
Le niveau de référence étant arbitraire, la directivité d’encastrement n’influe pas sur les calculs tant que la différence de distance entre la source image et la source réelle est faible (un sub unique ne voit pas sa directivité modifiée, par contre une ligne de subs verticale doit être considérée comme faisant deux fois sa longueur quand elle est posée au sol et crée un dipôle quand elle est placée en l’air à faible hauteur §I.1.2 « Source Image »). En effet, la hauteur du centre acoustique d’un caisson standard de 46 cm est d’environ 30 cm. Ce qui veut dire que le sub et sa source image se comportent comme deux subs espacés de 60 cm. Or, deux subs espacés de 60 cm ont un comportement omnidirectionnel dans la gamme des basses fréquences du sub. Comme le montre la figure ci-dessous, la simulation est omnidirectionnelle dans la gamme de fréquence qui nous intéresse (≤ 100 Hz).

Figure 28 : Courbes de directivités en fonction des fréquences et de l’angle d’observation pour deux subs espacés de 60 cm⁸

Par ailleurs, l’objectif est d’avoir un raisonnement simple même si la réalité est effectivement plus compliquée. La majorité des logiciels de simulation raisonnent sans les effets de sol pour des commodités d’interprétation.

ii. Fonctionnement du logiciel

Fonctionnement du logiciel pour un cas particulier à 2 subs que l’on peut facilement généraliser.

Le résultat de la simulation est calculé en coordonnées polaires. L’ensemble des points simulés sont situés sur le cercle de rayon la distance d’observation et de centre O, centre acoustique de la configuration simulée.

Pour chaque point du cercle, on calcule les distances de parcours D1 et D2 par le théorème de Pythagore.

Puis, chaque sub émettant une impulsion, on calcule :
- L’atténuation des impulsions due à la distance de parcours du son.
- Le retard total, somme du retard physique lié à la différence de temps de parcours (D2 – D1) au point P et du retard numérique de la configuration cardioïde.
- Le décalage en échantillon correspondant au retard.
- La FFT.
- Puis, on affichage la FFT en phase et en amplitude dans deux graphiques différents.
Nous résumons dans le programme écrit en pseudo-code le déroulé de l’algorithme.

Variables utilisateur :

Distance Observation
List_Freq (liste des fréquences à analyser) Fs (fréquence d’échantillonnage)
Tps (taille de la fenêtre d’analyse)

Pour tous les angles

Pour tous les subs

Calcul de la distance de propagation du point d’analyse au sub Calcul de la distance de parcours
Calcul de l’atténuation
Niveau = -20 log10(Distance)

Calcul du retard de propagation
Retard = Distance/Célérité + Retard Source(Sub)/Célérité;
Calcul du nombre d’échantillons correspondant au retard Decalage_Echantillons = Retard * Fs

On place une impulsion décalée du retard dans la fenêtre d’analyse Impuls(Decalage_Echantillons) = Amplitude;

End

FFT = FFT (Implusions_Subs)

Data_SPL_Angle = 20 log10 (abs (FFT (List_Frequences)) (amplitude de la FFT) Data_Phase_Angle = FFT_Phase (List_Frequences) (angle de la FFT)

End

Pour tous les angles

Calcul de la phase relative entre la phase pour 0° et la phase du point recherché

Data_Phase_Angle = Valeur_O_Degrés – Data_Phase_Angle

End

Ceci nous permet d’obtenir trois graphiques différents :
- Vision surfacique de la directivité pour la fréquence de notre choix.
- Vision polaire de la directivité pour toutes les fréquences.
- Limitations liées à la phase.
Prenons l’exemple concret d’une configuration cardioïde. Calcul des distances, atténuations et retards pour P à α = 120°

Calcul D1 et D2 :

Atténuation : on prend comme référence de niveau, le niveau à 1 m et on calcule en relatif :

𝑁𝑖𝑣𝑒𝑎𝑢_𝐷1 = −20 log10(49.26) = −33.85 𝑑𝐵
𝑁𝑖𝑣𝑒𝑎𝑢_𝐷2 = −20 log10(50.74) = − 34.10𝑑𝐵

Retard dû à la distance de parcours et au retard numérique :

Ainsi au point P, les deux impulsions arrivent avec
- Impulsion du sub 1 : -33.85 dB d’atténuation et 143 ms de retard
- Impulsion du sub 2 : -34.10 dB d’atténuation et 152 ms de retard
On calcule la FFT de la somme de ces impulsions décalées de l’équivalent en échantillons de ce retard. On récupère dans une matrice les informations d’amplitude et de phase pour toutes les fréquences à ce même point P.

L’algorithme répété pour tous les points P du cercle de rayon R permet d’obtenir les courbes de directivité en fonction de la fréquence et de l’angle : il permet donc de regrouper sur un seul et même graphique l’ensemble des diagrammes polaires, pour chaque fréquence. L’objectif du logiciel de simulation était justement d’afficher le comportement pour toutes les fréquences « en un clic », et pouvoir observer en un seul coup d’œil l’apparition des lobes parasites des structures complexes.

La phase est affichée de la même façon car pour chaque point calculé la FFT donne en même temps l’information en amplitude et en phase.

Enfin, si l’on reprend le même algorithme en coordonnées cartésiennes, et en considérant une fréquence donnée, on obtient une vue surfacique proche de la vue usuelle des logiciels du commerce tels que Soundvision (cf. §ii suivant). Cette fois-ci, on calcule le résultat non pas pour les points d’un cercle autour de la configuration, mais pour toute une surface.

Figure 29: Explication de la vue synthétique des directivités en fonction des fréquences pour tous les angles

iii. Modélisation des configurations et comparaison avec Soundvision

Pour vérifier la validité de notre logiciel, nous avons vérifié que nos résultats étaient conformes à la théorie, puis nous les avons comparés à ceux d’un logiciel commercial comme Soundvision.⁹

Figure 30 : Vérification de la simulation par Sound vision (gauche) et notre logiciel Schouf : vue surfacique à 50 Hz

iv. Configurations simulées

Focalisation sur la configuration Cardioïde

Procédure
1) Configurations cardioïdes par calage en retard
1. Nous simulons tout d’abord le cas permettant d’avoir la configuration cardioïde la plus théorique possible, c’est-à-dire un cardio dont la distance entre les sources correspond à λ/4. On appellera NATIVE cette configuration. Dans la pratique, la fréquence d’accord la plus efficace est de 50 Hz ce qui demande un espacement entre les subs de 1.7 m.
2. Les situations de la vie pratique amènent souvent à des distances entre les subs différentes de λ/4 (cardio dit non natif). Par exemple, il est fréquent que l’espacement physique existant entre la scène et le public ne permette pas de placer les subs à 1m70 de distance… Nous simulons donc dans un deuxième temps plusieurs configurations non natives en faisant varier la distance intersub entre 0 et λ/2 m. Nous en avons sélectionné 5, qui permettent d’avoir une visualisation représentative de l’évolution du comportement cardioïde en fonction de la distance entre les sources.
  2) Configurations cardioïdes par la méthode des gradients (cf. Revue de littérature C.§3)
3. Nous simulons le cas d’un cardio espacé de 0.85 m. Le sub arrière est hors phase et retardé. De la même manière que pour les cardios par calage en retard, nous simulons plusieurs gradients en faisant varier la distance entre les subs de
  0.75 m à 1.5 m.
4. Nous généralisons pour différentes distances entre les subs en suivant le tableau de Bob Mc Carthy [6].
Algorithme de construction des cardios non natifs : Quel retard numérique faut-il rentrer ?

Pour obtenir la rejection à l’arrière, les signaux sonores doivent arriver en opposition de phase à l’arrière du cardio. Ainsi, la somme des retards physique et numérique vaut λ/2 à 50 Hz à l’arrière.

Soit c la célérité du son On a :

Distance_Intersub + c / Retard_Numérique = λ/2

Ainsi :

Retard_Numérique = (1(2*50Hz) – Distance_Intersub/c)*c

Ce calcul est généralisable à n’importe quelle fréquence d’accord du cardio.

Procédure de construction des cardios par gradient

Le délai numérique à insérer correspond à la distance intersub. Dans tous les cas de figure le sub arrière est mis hors phase. Les différents cas simulés sont :

Simulation de la configuration « End Fire »

On simule un End Fire de 5 boîtes, espacées de 1.7 m chacune. Cela revient à positionner 4 cardios les uns derrière les autres.

Simulation de la ligne

1) Ligne de 4 subs répartis sur une longueur d’onde (6.8 m)
2) Ligne de 9 subs répartis sur une longueur de façon à observer l’influence de l’augmentation du nombre de sources
3) Ligne de 4 subs répartis sur une demi-longueur comme exemple de configuration à éviter…

Simulation du cardio dipolaire

Le cardio dipolaire est formé de deux ensembles cardioïdes en parallèle (cf. p88). Il est fréquent de voir apparaître cette configuration. Nous l’avons donc simulée.

Procédure d’analyse des résultats des cardios non natifs.
Pour évaluer l’efficacité d’action d’un cardio vis-à-vis de la qualité du son sur le public et du voisinage il faut définir plusieurs critères d’analyse.

¹⁰

L’angle d’ouverture habituellement utilisé dans les documents des fabricants n’est pas un critère adapté aux assemblages en basse fréquence à partir du moment où beaucoup de lobes de directivités apparaissent. Nous essayons de montrer par ce logiciel que ces angles d’ouverture sont variables en fonction de la fréquence, et qu’il est compliqué de pouvoir ramener ce critère 3D en 2 valeurs numériques. C’est justement l’utilité du logiciel de simulation qui permet de visualiser ce critère pour toutes les fréquences : p77-78, pour un exemple simple, l’angle de réjection n’est plus un critère valable à partir de 2 m de distance entre les subs.

La quantité de rejection à l’arrière n’est pas un critère d’analyse car sur ce modèle théorique elle est uniquement dépendante de la distance d’observation.

Distance d’observation : Nous avons calculé sous Matlab quelle était l’erreur d’évaluation en fonction de distance de mesure. L’algorithme consiste à calculer la distance à partir de laquelle les subs sont au même niveau à l’arrière. C’est une des conditions majeures pour que le son s’annule.

Nous plaçons la distance d’observation à 50 m de façon à avoir le moins d’erreur de mesure. Par ailleurs, plus la distance de mesure est grande, plus le niveau de réjection mesuré est important. Nous avons donc programmé sous Matlab les niveaux de réjection théoriques d’un cardio natif en fonction de la distance de mesure.

On observe sur les figures ci-dessous que plus l’on s’éloigne du cardio, plus la réjection est importante.

50 m est donc à la fois la distance permettant de faire un minimum d’erreur de mesure, et d’observer la réjection maximum.

Nous rappelons que tous les résultats sont interprétés en détail dans la partie discussion (III §C.)

2.2 Résultats

v. Focalisation Cardioïde

1. Cardio Natif

2. Configurations cardioïdes Non Natives

Nous expliquons de façon détaillée pour ce résultat les critères d’analyse définis dans la partie Méthodes. Par la suite, la plupart des résultats sont donnés sous forme de tableaux.

Calcul du gain à l’avant du cardio (0°)

Calcul de la largeur fréquentielle de la réjection
- Calcul de la courbe de réjection (Courbe de réponse avant – Courbe de réponse arrière) en fonction de toutes les fréquences.
- On regarde à partir de quelles fréquences autour de 50 Hz, on obtient une réjection de
  -6 dB.
Calcul de l’angle de réjection

Figure 34 : Courbe de directivité à 50 Hz en fonction de l’angle

L’angle de réjection n’est pas un critère significatif pour cette configuration. En effet, un critère prenant comme hypothèse de base que la directivité s’exprime à -6 dB n’a plus de sens, car le niveau dans l’axe est déjà 6 dB inférieur à celui produit à 90°. Le critère angulaire n’est adapté qu’à un rayonnement ne comportant qu’un lobe principal. Le système se comportant de plus en plus en rayonnement dipolaire, l’énergie sur le côté devient très importante (formation de lobes à 90°). A la fréquence de coupure de 76 Hz, on affiche le résultat surfacique pour visualiser l’apparition des lobes.

Dans les deux tableaux qui suivent, merci de lire les deux pages comme sur du A3.

Généralisation des résultats des configurations cardioïdes à retard pur

Résultats en termes d’angles de réjection (largeur de réjection). Ce critère permet de visualiser la zone de voisinage qui sera couverte par la réjection.

Dans un premier temps, nous avons calculé la courbe de répartition de l’énergie générée à 50 Hz pour tous les angles en fonction de la distance entre les subs. Ceci nous a permis d’estimer l’énergie générée pour toutes les distances intersubs.

Energie dans l’axe

Dans un deuxième temps, nous avons calculé à partir de la courbe précédente l’énergie relative à la réponse observée dans l’axe. On est donc en mesure de caractériser le lobe de directivité qui permet de déduire la largeur de l’angle de rejection, estimé à -6 dB.

On observe bien qu’à mesure que l’on écarte les subs le comportement devient dipolaire et il se forme des lobes sur les côtés. Le critère de largeur angulaire ne devient plus pertinent.
En revanche, en deçà de 2 m entre les subs environ, la largeur de réjection varie de 180° de couverture pour la distance intersub la plus petite (très grande largeur de réjection), à 120° pour 2 m de distance inter sub.

Résultats principaux
- Une configuration cardioïde est active sur une octave au maximum
- Diminuer la distance inter sub permet d’élargir la réjection mais au dépend de la quantité à l’avant et de la qualité du son. En effet, le gain de sommation et la fréquence de coupure de la courbe de réponse avant s’abaisse à mesure que l’on s’éloigne du natif.
- Augmenter la distance intersub entraine l’apparition de lobes sur les côtés. On ne peut plus parler de largeur angulaire de réjection. De la même manière la qualité de la réponse impulsionnelle diminue fortement.
3. Cas du cardioïde par gradient

Résultats principaux du cardioïde par gradient
- Plus de réjection sur les côtés et sur l’arrière
- À l’arrière, réjection constante quelque soit la fréquence.
- A l’avant, moins d’énergie que le cardio natif et courbe de réponse filtrée : déformation de la réponse impulsionnelle dans les très basses fréquences Par exemple, on obtient -6 dB à 35Hz sur la courbe de réponse avant. La déformation de la réponse impulsionnelle engendre une différence de timbre entre un paquet de subs en omni et le cardio ainsi réalisé. De plus, les pertes de 6 dB à 35 Hz nécessite de doubler la quantité de subs pour obtenir la même énergie sur le public.
Généralisation des résultats des configurations cardioïdes en gradient

Résultats principaux de la généralisation des résultats des configurations cardioïdes à gradients
- Réjection forte en amplitude et constante en fréquence : très intéressant d’un point de vue protection du voisinage…
- Réponse en fréquence avant : filtrage important de la courbe de réponse avec très forte perte de niveau SPL à l’avant, notamment dans l’infrabasse. La qualité du son pour le public en pâtit grandement….
vi. “End Fire”, 5 subs espacés de 50 cm

Gain à l’avant :

+13.9 dB (nous avons 5 subs donc à l’avant la somme vaut 20*log10(5) = 13.9 dB)

Figure 35 : Directivité à 50 Hz de l’End Fire 5 boites

D’après la figure 35, la largeur angulaire de réjection vaut 180°.

Résultats principaux End Fire 5 subs espacés de 50 cm :
- Réponse Impulsionnelle dans l’axe : Parfaite
- Largeur de réjection fréquentielle : Large Bande (24 Hz à 177 Hz)
- Réponse fréquentielle à l’avant : Parfaite.
- Les zones hors phase étant très faibles en énergie, l’End Fire a l’avantage de ne pas créer de lobes de directivité très marqués quand il est additionné avec un autre système. Très directif dans le haut mais pas très directif dans le bas du spectre
vii. Ligne

1. Comparaisons pour la configuration ligne

Résultats principaux :
- Dans l’axe les courbes de réponse sont droites
- En dessous de 30 Hz le comportement est omni (mais à cette fréquence il rare de pouvoir générer beaucoup de puissance).
- Autant d’énergie à l’avant qu’à l’arrière.
- L’angle d’ouverture se resserre avec la fréquence dans le haut grave. On observe la formation d’un faisceau à mesure que la fréquence augmente. Si l’on cherche une homogénéité du son sur le public, il faut donc faire attention à la gamme de fréquence utilisée.
- Plus on augmente le nombre de HPs moins on a de lobes parasites.
2. Ligne de 9 avec une ligne de 9 derrière en cardio

Pour pallier le lobe arrière on insère une ligne cardioïde de 9 subs, derrière la ligne de 9 subs utilisée précédemment.

LIGNE de 9 couplée à un cardio en phase

Résultats principaux :
- On annule les lobes sur les côtés
- À l’arrière, il reste quelques lobes, c’est normal, le cardio n’est actif que sur une octave maximum.
3. Cardio dipolaire
- Dès que l’on dépasse l’octave autour de 50 Hz, le comportement devient extrêmement modal
- Certains paquets dont l’énergie est importante sont hors phase avec le système principal dès que l’on n’est plus dans la zone de la fréquence d’accord.
- Il est donc fondamental de n’utiliser ce système que pour des bandes passantes restreintes afin que les lobes parasites plus hauts en fréquence ne viennent pas perturber la sommation avec le système principal.
B. Mesures en « laboratoire » (hangar) et vérification des simulations

1. Méthode

1.1 Conception et fabrication d’un subwoofer adapté à l’étude des réseaux de subs

Les fabricants cherchant à se différencier les uns des autres, et ayant pour objectif d’obtenir des subs reproduisant un maximum de niveau sonore, utilisent dans la majorité des cas des configurations en « Bass reflex », afin de maximiser le niveau de pression au regard du débattement du haut-parleur. La contrainte d’une fréquence d’accord suffisamment basse pour un système Bass reflex engendre des volumes de charge¹¹ très importants. Il n’y a donc pas de subwoofer capable de générer de l’infrabasse dans des petites dimensions. En effet, la seule technologie standard qui le permette consiste à placer le haut-parleur dans un caisson clos. En effet, accorder l’évent en très basse fréquence est impossible à réaliser dans un petit volume. Le clos n’étant pas adapté à reproduire de forts niveaux sonores nécessaires pour la sonorisation, on ne trouve pas de sub très compact capable de descendre en fréquence.

Nos besoins étaient très largement différents des considérations standards : la puissance n’a pas besoin d’être importante pour effectuer les mesures, mais il était fondamental de se rapprocher d’un modèle théorique omnidirectionnel. Ceci nécessite que les dimensions physiques des subs utilisés soient les plus petites possibles afin de limiter les effets des parois.

De plus, le fait d’utiliser des modèles clos permet après égalisation de la courbe de descendre aussi bas en fréquence que nécessaire tant que le débattement limite du haut-parleur n’est pas atteint.

Nous avons donc décidé de construire les subs les plus compacts possibles, et restant omnidirectionnels jusqu’à plus de 100 Hz. Nous avons également utilisé des 38 cm à fort débattement capables de générer un spectre plat jusqu’à 20 Hz. Le modèle de HP utilisé a été conçu pour fabriquer des caissons de basse de Home Cinéma, par nature beaucoup plus compacts qu’un sub dédié à la sonorisation de forte puissance. Nous avons donc respecté les préconisations du fabricant pour la définition du volume de charge le plus adapté.

1.2 Procédure

i. Taille de la salle de mesure

Les mesures ont été effectuées dans le Hangar de menuiserie dans lequel les subs ont été fabriqués.

Dimensions de la pièce : 26m (longueur) * 15m (largeur) * 6.5m (hauteur)

ii. Procédure de mesure en lien avec les problématiques de mesure BF

1) Signal de test

Un signal de bruit rose était joué dans les subs pour la mesure des configurations car il permet le moyennage dans l’espace. Pour la mesure de la courbe de réponse du HP, nous avons utilisé un sweep.

Afin d’estimer auditivement la qualité perçue nous utilisions un « kick » filtré à 100 Hz.

Nous nous sommes également assurés d’avoir un rapport signal sur bruit de 40 dB minimum afin d’assurer la précision et la fiabilité de la mesure.

2) Paramétrage de l’analyseur

Nous avons utilisé le logiciel Spectralab pour analyser les résultats.

Taille de la FFT : 524288 samples équivalent à une résolution fréquentielle de 0.084 Hz pour la fréquence d’échantillonnage de 44100 Hz

Fenêtre de Pondération : Hamming car elle est considérée comme l’une des plus générales.

Affichage : En fonction des besoins nous avons sélectionné la bande fine pour caractériser les phénomènes acoustiques complexes, et le tiers d’octave pour des valeurs plus quantitatives. En bande fine, la résolution d’affichage était au 1/48eme d’octave.

Averaging : infinite (moyennage sur toute la durée de la mesure)

3) Système de prise de son

a. Calibration de la mesure
- Compensation de la courbe de réponse du microphone
Nous avons utilisé un microphone de référence MBC550 préalablement étalonné par le LNE (Laboratoire National d’Essai) pour calibrer mon microphone de mesure (Superlux ECM 999).

Nous avons mesuré la courbe de réponse des deux micros et nous avons appliqué dans le logiciel la compensation fréquentielle permettant que le microphone économique affiche la même courbe de réponse que le microphone de référence.
- Calibration des niveaux
À l’aide d’un calibrateur 01dB générant 94 dB SPL à 1 kHz, nous avons étalonné le logiciel de mesure afin qu’il nous affiche des niveaux cohérents avec la réalité physique. Cette étape, même si elle peut paraître superflue, est fondamentale pour analyser a posteriori les mesures et notamment dans l’estimation des perturbations liées au bruit parasite.

b. Position du microphone

Dans la zone des basses fréquences, la position du microphone est déterminante sur le résultat (par exemple si l’on se trouve dans un nœud de vibration) comme vu précédemment dans la partie revue de littérature B§2.3. Afin que les mesures soient reproductibles sans d’importants moyens tels que le multi micro, nous avons choisi la méthode de moyennage spatial. Nous avons déplacé en continu le microphone de mesure autour de sa position pendant 2 minutes, en horizontal et en vertical sur une envergure de 2/3 m. Cela était plus représentatif de ce qu’il était possible d’obtenir à partir du matériel de mesure standard.

c. Distance de mesure

Le point de repère est toujours le centre acoustique de la configuration testée.

À l’intérieur de la salle de mesure

Il était nécessaire de faire un compromis entre les 3 paramètres suivants :
- La taille du système mesuré (certaines configurations de subs peuvent s’étaler sur une dizaine de mètres) : le micro ne doit pas être trop près car l’effet de proximité des subs les plus proches fausseraient la mesure.
- La distance critique : pour avoir des mesures facilement analysables il faut placer le micro de telle sorte qu’il ne soit pas dans la zone du champ réverbéré.
- Taille de la pièce
Afin d’évaluer la distance de mesure rappelons le programme Matlab conçu dans la partie précédente, calculant la variation de l’erreur de mesure en fonction de la distance du micro pour la configuration cardioïde. La distance entre les subs est fixée à 1.7 m.

On observe que l’on a 3 dB d’erreur en se plaçant à 4 m du centre de la configuration testée. Dans un premier temps, nous avons effectué les mesures à 4 m pour voir l’impact en proximité dans une zone potentielle d’écoute. Puis, nous avons mesuré à 12 m de distance, contre le mur afin de visualiser le gain à espérer vis-à-vis des problèmes de voisinage.

A l’extérieur :

Les zones de voisinage immédiates adjacentes au Hangar ne nous ont pas permis de placer le micro à une distance très éloignée du système pour observer l’impact sur un voisinage lointain. Bien qu’étant en extérieur, nous n’étions pas en champ libre. Ainsi, les murs des habitations adjacentes ont également influencé la mesure. Ceci était très intéressant car cela permettait d’observer une situation réelle (il est rare d’être en champ libre) et de mettre en évidence les difficultés de mesure. Pour éviter l’impact des sources images, nous nous sommes placés en proximité immédiate des murs de l’atelier. Ainsi, la source image n’engendre plus de filtrage en peigne et n’engendre qu’une modification du niveau sonore, sans modifier la directivité ou la réponse en fréquence dans la gamme étudiée. Par ailleurs la courbe affichée précédemment est théorique. En pratique nous allons voir dans cette partie l’influence des murs et de la salle sur la distance de mesure.

4) Utilisation des symétries

Nous avons vérifié le caractère omnidirectionnel de nos subwoofers. Après avoir validé l’absence de directivité jusqu’à 100 Hz, le retournement des HPs pour la mesure à l’arrière n’était plus nécessaire. En effet, la courbe de directivité entre l’avant et l’arrière variait de moins de 1 dB.
Par ailleurs, pour des raisons de rapidité et surtout pour pouvoir évaluer l’impact du réglage pur à configuration identique, les mesures avant/arrière ont été effectuées en intervertissant les retards c’est-à-dire en tournant logiciellement le système de 180°.

iii. Procédure de simulation des configurations

1) Vérification du caractère omni des subs fabriqués pour ces mesures
- Courbe de réponse
  Il s’agit dans un premier temps de mesurer la courbe de réponse des subs fabriqués dans l’atelier. En effet, nous devons avoir le comportement en fréquence le plus plat possible, pour que nos simulations ne s’appliquent pas au cas particulier de nos subs mais puissent être étendues à d’autres dispositifs. Cela était possible grâce au fait qu’il n’était pas en Bass Reflex. Il avait donc un seul centre d’émission. Pour ce faire, nous avons égalisé la courbe mesurée grâce à l’égaliseur du processeur DCX2496.
- Vérification du caractère omnidirectionnel
  Du fait de sa propre taille, un sub n’est pas omnidirectionnel pour toutes les fréquences. Or, les subs conçus pour cette expérience ont justement été construits de très petit format de façon à ce qu’ils aient un minimum de directivité due à la diffraction et donc qu’ils soient nativement le plus constant possible. Afin de ne pas mesurer les réflexions nous avons décidé de mesurer la réponse en fréquence du HP à 1m50, en face, à 90° et à l’arrière. Nous nous sommes placés à l’extérieur du Hangar de façon à s’affranchir au maximum des réflexions sur les murs.
  NB : Il est important de noter que le rapport signal sur bruit est très difficile à avoir dans l’infra grave. Ceci justifie de nouveau la construction de subs dont les HP ont un débattement important, ce qui permet d’augmenter le niveau du signal généré.
2) Fréquence de réjection

Dans la plupart des configurations, nous avons choisi comme fréquence de réjection la fréquence de 50Hz, autrement dit, on « accorde » les subs à 50 Hz. En effet, c’est à cette fréquence que l’on envoie le plus d’énergie dans le sub (fréquence centrale) et donc, il est important de centrer la réjection sur cette fréquence.

3) Focalisation Cardioïde

Il est impossible de tester l’ensemble des configurations pour des raisons pratiques évidentes. Après avoir simulé dans la partie précédente les configurations essentielles pour la maîtrise de la directivité, nous nous sommes concentrés pour cette partie en laboratoire sur le cardio natif, non natif principalement et de façon moins détaillée sur l’End Fire et la Ligne.
- Cardio natif
Il s’agit d’espacer les subs d’un quart de la longueur d’onde à 50Hz (1.7m) puis de retarder le sub avant de cette distance (1.7/340) de façon à ce que l’onde se propageant à partir du sub avant annule le sub arrière en arrivant avec un décalage de la demi-longueur d’onde à 50Hz.

Cette configuration est testée en extérieur et en intérieur. Puis, nous avons effectué une moyenne des valeurs de réjection obtenues sur plusieurs configurations.
- Cardio non natif
Les configurations testées sont :
– Distance intersub = 1m70, Frejection = 40 Hz
– 2 configurations cardioïdes pour des subs espacés de 70 cm, Fréjection = 50 Hz (HP1 HP2 puis HP2 et HP3)

Nous avons utilisé une méthode empirique de calage du cardioïde non natif par l’optimisation de la réjection en faisant varier le retard manuellement.

On raisonne directement sur l’annulation en réjection. On fait jouer les deux subs sans retard et sans phase. On regarde le spectrogramme. Le retard atteint la bonne valeur lorsque l’on obtient la meilleure annulation sur la bande 40 – 63 Hz. Il est important lors d’un réglage de ce style de connaître les ordres de grandeur des retards que l’on doit trouver afin d’éviter de procéder à un calage sur un multiple de 2pi.

Dans un premier temps, on conserve la distance intersub de 1m70 et l’on essaie d’accorder le cardio à une autre fréquence. Dans un deuxième temps on modifie la distance intersub et on essaie de garder la fréquence d’accord à 50 Hz.
- End Fire
  On espace 6 subs de 50 cm, puis 70 cm et 1 m.
Exemple pour 50 cm :

On réajuste les retards à chaque fois que l’on modifie la distance entre les subs
- Ligne
6 subs collés (longueur totale de 2m50), puis 5m10, puis 7m30.

On compare les mesures dans un second temps avec un « stack¹² » de 6 subs omnis pour avoir une référence de niveaux. Pour une configuration ligne, les mesures sont toujours trop près des hauts parleurs aux vues des longueurs des lignes. On se place sur la porte ou sur le mur car c’est ce qui arrive chez les voisins.

1.3 Analyse des résultats

Pour plus de lisibilité de certains résultats, nous avons développé un programme Matlab d’affichage des analyses spectrales issues de Spectralab, en bande fine et en tiers d’octave. Pour le tiers d’octave, les données étant exportées en bande fine, nous avons réalisé la somme énergétique des valeurs mesurées par bande fine.

2. Résultats

Nous rappelons que les interprétations détaillées des résultats sont dans la partie discussion III. C§3

2.1 Mesure de la courbe de réponse du sub

i. Mesure

Avant de mesurer la courbe de réponse, nous avons mesuré le niveau bruit de fond et de bruit électrique. En moyenne le signal est 60 dB au-dessus du bruit de fond. De plus, à 2 kHz, on remarque que c’est le bruit de fond électrique qui domine. Nous avons donc augmenté le gain d’entrée du signal pour que le bruit de fond natif de la carte soit plus faible.

Figure 36 : Courbe de réponse du sub (verte) et mesure des bruits électriques (jaune) et du bruit de fond (rouge)

ii. Egalisation

On égalise les subwoofers grâce au DCX de façon à avoir une courbe de réponse plate. Les valeurs nécessaires afin de rendre la courbe de réponse la plus plate possible ont été les suivantes à titre indicatif :

L’objectif étant d’avoir une courbe plate de 20 à 200 Hz, le plus efficace a été de traiter la bosse à 68 Hz correspondant à la fréquence d’accord du caisson, en la corrigeant avec un facteur de Q large sur l’égaliseur.

Figure 37 : Egalisation de la courbe de réponse (jaune) et superposition sur la courbe de réponse native (verte)

Adaptation de la courbe théorique afin d’en permettre l’écoute.

Afin que les écoutes subjectives soient cohérentes avec la bande passante utilisée en standard, nous avons limité par une bande passante à 20 Hz et à 100 Hz. Le filtre à 20 Hz permettait d’éviter de casser les haut-parleurs en lui faisant prendre du débattement excessif, et le filtre à 100 Hz permettait de focaliser notre écoute sur les zones de fréquence recherchées.

Figure 38 : insertion des filtres coupe-bas et coupe-haut.

Jusqu’où le sub est-t-il omnidirectionnel ?

Pour notre étude, nous avons voulu vérifier que notre sub est bien omni jusqu’à 100 Hz pour que les conclusions de nos expérimentations soient les plus générales possibles.
Après l’égalisation et le filtrage, nous avons vérifié que la valeur du bruit de fond n’avait pas d’impact sur les mesures. À titre d’information, le rapport signal sur bruit (SNR) était supérieur à 40 dB.

Lors de la manipulation, on remarque que lorsque l’on tourne l’enceinte pour effectuer la mesure à 90°, le niveau des très basses fréquences a diminué alors que 20 Hz est sensé être parfaitement omnidirectionnel. En réalité, le centre acoustique n’étant plus au niveau de la membrane du HP comme ce que l’on pourrait penser intuitivement, il est courant de mal l’estimer dans la mesure de directivité.

Figure 39: erreur de mesure due au défaut d’estimation de la position du centre acoustique.
Mesure en face du HP (violet) et sur le côté à 90° (jaune)

Il est très difficile de déterminer précisément la position du centre acoustique d’un sub. La méthode que nous avons suivie fut donc de déplacer le sub jusqu’à obtenir les mêmes niveaux de fréquences infrabasses puisque constructivement parlant, un sub est forcément omni à ces fréquences. Après décalage de quelques cm du sub nous avons pu vérifier le caractère omni du sub jusqu’à 100 Hz. On observe quelques bosses et creux par rapport aux mesures précédemment effectuées en proximité. Ceux-ci sont dus aux réflexions des murs extérieurs au hangar.

2.2 Focalisation sur la configuration cardioïde

i. Mesure du cardioïde natif
1. Cardio en extérieur
Mesure à 4 m de distance :

Figure 40 : courbes de réponse avant (vert) et arrière (bleu) du cardio natif en intérieur

Le résultat en bande fine, exporté sous Matlab donne 9 dB de réjection à 50 Hz. On remarque également que la mesure devient très sensible aux réflexions des ondes sonores contre le mur qui créent des interférences et des annulations dans la courbe de réponse.

On affiche ensuite le résultat en tiers d’octave afin de pouvoir donner une valeur moyenne de la réjection autour de 50 Hz et de rendre le résultat plus lisible.

On observe que la réjection au tiers d’octave à 50 Hz est très faible : en moyenne 8 dB. C’est un exemple de difficulté de mesure. On ne place pas le micro suffisamment loin pour observer une réjection importante.

Mesure à 12 m de distance :

On observe une réjection nettement plus importante, de 19 dB à 50 Hz. Le cardio se mesure donc en champ lointain.

L’analyse en tiers donne en moyenne 12.5 dB de réjection sur le tiers d’octave à 50 Hz.

La réjection obtenue est de 12 dB. On observe que le cardio se met en place sur une plus grande distance que la distance théorique. Également, la présence des murs adjacents et des immeubles aux alentours créée un champ réverbéré qui diminue l’efficacité de la réjection.
1. Cardio en intérieur
  a. Ça ne marche pas…
On raisonne par l’absurde en créant volontairement une configuration mettant en évidence les problématiques de placement des sources sonores dans une salle.
Positionnement problématique d’une configuration cardioïde dans la salle.

Figure 41 : configuration cardioïde native sans réjection car positionnée en proximité du mur. Courbe avant (rouge), arrière (violet)

Les subs sont en configuration cardioïde standard pour 50 Hz. On les place proches d’un mur de façon à créer des sources images qui vont engendrer des modifications de la directivité (filtrage en peigne…) et de mettre en évidence la nécessité de positionner correctement les sources dans la salle. On remarque en effet, une absence de différence de niveau entre l’avant et l’arrière. Il y a bien une annulation mais valable à la fois pour l’avant et pour l’arrière, alors que nous devrions observer une réjection. Le cardio ne fonctionne pas, et ce précisément à cause de la salle. Ceci souligne la difficulté de positionnement d’un système et la nécessité de mesurer l’installation.

b. Mesure à 4 m, au centre de la pièce

Figure 42 : avant (rouge)/arrière (blanc) et côté 90° (jaune)

Lorsque le micro est positionné à l’arrière du système cardioïde, à 4 m, on mesure 15 dB de différence par rapport au niveau situé à l’avant à 50 Hz. On s’aperçoit donc que la configuration cardioïde est efficace en réjection arrière mais que son fonctionnement est limité : la mesure sur le côté à 90° ne montre que 1.5 dB d’atténuation par rapport à la mesure frontale. En termes de voisinage, cette configuration ne marche pas sur les côtés. La simulation sous Soundvision montre au contraire que sur les côtés le signal est 3 dB moins fort. La salle, et les réflexions contre les murs augmentent le niveau mesuré et l’on n’obtient pas 3 dB. Cette configuration ne fonctionne donc pas si la zone à protéger est uniquement à l’arrière.

Par ailleurs, nous avons vu dans la partie précédente que le cardio devait se mesurer en champ lointain. Ici, on obtient une forte valeur de réjection de 15 dB en champ assez proche (4 m) par rapport à la mesure en extérieur à la même distance (4 m). Cette valeur de réjection est proche de la valeur théorique.

Ceci est une illustration des sensibilités de positionnement des sources dans un lieu donné. En effet, la salle permet, pour ces positionnements de HP et pour cette configuration une réjection de 15 dB à 50 Hz cohérente avec la théorie, alors que la valeur en extérieur sensée être moins soumise aux réflexions donne une valeur inférieure.

Mettre en place une configuration cardioïde s’essaie, s’ajuste et se mesure, mais n’est ni prévisible ni mesurable de façon simple. Il existe malgré tout une part d’aléatoire due à la complexité globale du phénomène.

c. Mesure à 12 m, contre le mur

Cette mesure a été effectuée pour la configuration cardioïde à une autre position. On mesure en moyenne spatiale à 12 m.

Figure 43 : subs cardioïdes avant (vert)/arrière (bleu)

Figure 44 : tiers d’octave

La réjection est de 8 dB à 50 Hz alors que nous avions 15 dB à 4 m pour la position précédente. Cette différence de résultat est normale et s’explique assez facilement car la prise de mesure a été effectuée contre le mur. L’impact des résonances du local devient donc fondamental, ce qui atténue l’efficacité de la réjection.

Moyennage du résultat pour plusieurs sources

Le positionnement de la source impactant de façon non négligeable les valeurs de réjection obtenues, nous avons effectué la mesure à 12 m en multipliant le nombre de positions en configuration cardioïde pour obtenir un indice statistique permettant de mettre en avant la robustesse liée à la position dans l’espace. (6 subs espacés de 1,70 m et mesurés 2 par deux).

(Les subs sont orientés vers le haut de façon à trouver le centre acoustique plus facilement)

Nous calculons sous Matlab une valeur moyenne de la réjection et pouvons donner un ordre de grandeur valide pour cette pièce.

Figure 45 : comparaison avant/arrière de cardio à différentes positions

Moyenne des 4 mesures à 50 Hz : 8.3 dB de réjection

Écart type des 4 mesures à 50 Hz : 2.3 dB

En moyenne, on crée bien un cardio dont la réjection est de 8.3 dB à 50 Hz bien que le local soit très résonnant.

ii. Configuration cardioïde pour un écartement différent du quart de la longueur d’onde

Dans un premier temps, on conserve la distance intersub de 1m70 et l’on essaie d’accorder le cardio à une autre fréquence (40 Hz). Dans un deuxième temps, on conserve cette fois ci la fréquence d’accord à 50 Hz, et on modifie la distance intersub.
1. Cardioïde d=1m70 Frejection = 40 Hz
Pour accorder les deux subs à 40 Hz, nous avons validé par la méthode empirique que l’on retrouvait bien le calcul théorique du retard numérique.

On ajoute à la configuration précédente (1m70 de retard entre les subs) des retards par pas de 50 cm jusqu’à 3 m.

On observe en bande fine pour plus de précision sur la réjection

On observe que l’on ne parvient pas à produire la même réjection à 40 Hz qu’à 50 Hz. L’annulation se décale bien en fréquence au fur et à mesure que l’on ajoute les retards, mais on n’arrive pas à atteindre 40 Hz avec une réjection propre. On s’aperçoit donc qu’en pratique il existe une limite au changement de la fréquence de réjection pour une distance fixe. Dans cet exemple précis, au-delà d’un retard de 3 m, l’effet cardioïde n’était plus visible.
1. 2 configurations cardioïdes pour des subs espacés de 70 cm, Faccord = 50 Hz (HP1 HP2 puis HP2 et HP3)
La fréquence centrale est conservée, mais la distance entre les subs est de 70 cm. On fait varier le retard progressivement pour accorder le cardio à 50 Hz.

Dans le cas précédent l’écart était de 1,70 m, et nous n’arrivions pas à établir la réjection en faisant varier le retard. En revanche, cette configuration où l’écart entre les subs est réduit (70 cm) nous laisse penser que le fait de diminuer la distance entre les subs facilite la mise en place de la réjection. Plus les HP sont proches plus leurs courbes de réponse ont des comportements modaux similaires et plus il est facile de mettre en œuvre un cardio.

2.3 End Fire

i. End Fire 6 boîtes espacées de 50 cm On place les 6 HP espacés de 50cm de membrane à membrane.

Figure 46 Analyse en bande fine End Fire 6 boîtes avant (rouge) arrière (vert)

On observe bien que la réjection n’est plus accordée à une seule fréquence mais que la réjection est très large bande. On observe en moyenne 10 dB de réjection sur l’ensemble du spectre.

Dans ce cas, il est aussi visible que la multiplication du nombre de sources a diminué le comportement modal de la réponse à l’avant. Cependant, on observe encore quelques accidents.

À l’écoute, l’effet de réjection ne fonctionne pas bien sur les côtés. A l’avant, nous nous sommes rendu compte de la difficulté d’évaluer le niveau de gravité du fait du phénomène de masquage sonore par les hautes fréquences. En revanche, à l’arrière, comme l’annulation est pleine bande mais moins forte, l’oreille a en moyenne plus de sensation sonore d’annulation.

ii. End Fire 6 boîtes espacées de 70 cm

Figure 47 : End Fire 70cm avant-arrière (violet/vert) en 1/3 octave

On a en 8 dB en moyenne de réjection sur le haut du spectre (jusqu’à 200 Hz) Comparaison des courbes 50 cm et 70 cm:

Figure 48 : 50cm avant/arrière (violet/vert) 70cm avant/arrière (blanc/rouge), bruit de fond (jaune)

PS : Par rapport aux comportements très modaux observés pour les configurations cardioïdes simples, l’End Fire à 70 cm a homogénéisé le tiers d’octave 63 Hz en multipliant le nombre de sources.

iii. End Fire 6 boites espacées de 1 m

Figure 49 : End Fire 1m avant et arrière (jaune/vert)

A l’oreille, on remarque que la réjection sur les côtés (90°) est meilleure mais que le comportement devient modal. La réjection devient plus efficace dans le bas du spectre que dans le haut. 12 dB dans la zone 40/50 Hz.

Pour résumer, plus l’End Fire est long, plus la directivité augmente sur le côté. Plus le nombre de HP est important, meilleur est le comportement en haute fréquence à l’avant. Cependant, au-delà d’un écartement de 70 cm, le haut grave redevient perturbé. En pratique, en fonction des situations, on cherche à faire un compromis entre le haut et le bas de spectre. Généralement, on met un espacement de 70 cm.

2.4 Ligne de 6 subs collés sur 2m50

Figure 50 : ligne de 6subs de 2m50 de long avant / côtés (violet/vert)
- Beaucoup de réjection au niveau des fréquences aiguës (attention l’export est sur une échelle plus large)
II. Validation pratique sur un concert de grande ampleur anticipé

Lors du festival « Jazz à la Villette » (31/08/2017), il s’agissait de mettre en application, sur un exemple pratique de grande ampleur, la méthodologie de mesure dans les basses fréquences au service de l’optimisation du système de diffusion vis-à-vis du voisinage.

A. Méthode

La méthode suit les étapes du tableau de synthèse en annexe.

1) Identification des «voies de propagation» (fuites acoustiques)

Une cartographie de la Grande Halle de la Villette a été effectuée ces dernières années et a montré que la toiture présente des fuites acoustiques au niveau du raccord avec les « chiens assis ». Ainsi, la première optimisation a été de modifier le rayonnement du Line Array, naturellement omni en basse fréquence, en rajoutant une ligne de caissons de basse afin de le rendre cardioïde. L’optimisation consiste donc à orienter la réjection vers le plafond, de façon à exciter cette zone le moins possible.

2) Validation des choix d’optimisation du système de diffusion par la simulation.

Une configuration a donc été étudiée pour limiter l’impact du festival sur le voisinage et donc maximiser l’isolement apparent (différence intérieur de la salle / extérieur de la salle). Nous avons simulé les configurations à l’aide du logiciel Soundvision. En effet, le matériel utilisé étant spécifique à L-Acoustics, le choix de ce logiciel était plus adapté.

3) Définition de la zone de mesure des nuisances sonores

Il faut placer le système de mesure au plus près des zones de voisinage les plus concernées par les nuisances. La cité A est située à environ 200 m de la Grande Halle, et à 90° du système de diffusion. Cet emplacement géographique correspond bien à la zone la plus impactée par le système de diffusion de la salle de concert. Les chiens assis sont aussi orientés vers cette zone.

4) Utilisation d’un dispositif de mesure conforme aux méthodes de mesure dans les basses fréquences chez les voisins.

Nous avons utilisé le système de mesure déjà mis en place par la Grande Halle à la cité A. Il s’agit d’un système multi micros permettant de mesurer les basses fréquences de façon représentative (voir détails ci-dessous)

5) Mise en place d’afficheurs de niveaux et d’un réseau de communication

Nous avons installé un réseau de communication entre la zone de mesure des émergences et la salle où se déroulait le festival, pour avoir en temps réel et simultanément, l’affichage des niveaux en salle et chez les riverains.

Puis, nous avons installé dans la salle de concert, ainsi qu’à la cité A des afficheurs de niveaux par bande.

6) Optimisation de chaque sous-groupe d’éléments de diffusion

Par la mesure, et via le réseau de communication et les afficheurs installés à l’étape 5, nous avons pu mesurer l’impact de chaque élément de diffusion par un aller et retour en temps réel

entre les émergences sur les riverains, et les réglages en salle. Il s’agissait d’optimiser l’isolement apparent pour limiter l’impact des émergences chez les voisins.

7) Mesures et interaction entre le sonorisateur et l’acousticien pendant le concert

Nous avons utilisé un analyseur en bande fine à la cité A en plus du dispositif de mesure, de façon à avoir des informations précises sur les fréquences émergentes dans le voisinage. Ceci nous a permis, pendant le concert, de donner en temps réel à l’ingénieur du son des informations précises sur les fréquences problématiques.
N’ayant pas participé aux étapes 1 et 3 du processus méthodologique, nous détaillerons les résultats des parties 2, 4, 5, 6 et 7. Voici les résultats.

B. Résultats

i. Validation des choix d’optimisation du système de diffusion par la simulation

Les optimisations envisagées par le festival ont été les suivantes :

1) Limiter l’envoi de son sur les zones présentant l’isolement le plus faible.

La tête de la façade était formée par l’ensemble cardioïde K1 Sub et VDOSC¹³ (Line Array).

Figure 51 : simulation Soundvision 40-63Hz VDOSC seul et VDOSC + K1 sub

La simulation sous Soundvision confirme l’efficacité de la réjection sur le plafond.

2) Limiter l’envoi de son à 90° du système dans la direction des zones de voisinage à protéger.

Le choix de la configuration en ligne a été privilégié pour rejeter à 90°. En effet, si la longueur de la ligne fait une longueur d’onde à 50 Hz, il y aura une annulation sur les côtés à cette fréquence. (cf. partie I). Cependant dans les fréquences haut grave, la ligne devient très directive et engendre un point de focalisation qui porte sur de très longues distances.

Figure 52 : Soundvision ligne de subs entre 80 Hz et 100 Hz sur une échelle de 500 m

Par conséquent, il a été décidé de modifier la structure de la ligne en créant une forme de V sur les côtés et d’éviter le peigne de directivité. L’objectif est d’avoir un point focal au niveau du mixeur plutôt qu’en champ lointain.

Figure 53 : forme de V pour les SB28 sur les côtés

Pour mieux illustrer l’efficacité en termes de réjection à 90°, nous avons simulé sous Soundvision sur une échelle de 500 m l’impact des subs au sol pour un niveau usuel de 108 dBC à la console. Et nous avons ensuite comparé cette simulation à l’impact qu’aurait un line Array de SB28 suspendu afin de se rendre compte de l’efficacité du système directif.

Figure 54 : comparaison entre SB28/KS28 au sol et SB28 accrochés (dessous) sur une échelle de 500m

ii. Installation du dispositif de mesure

Détails de l’installation

Mesures à 200 m :

Comme vu dans la première partie, il faut multiplier le nombre de points de mesure en basse fréquence. L’installation comporte 8 microphones de mesure calibrés (MBC550) et répartis sur une longue distance en extérieur. La multiplication de nombre de sondes permet ainsi de s’affranchir des lobes de directivités crées par le système et la structure de la grande halle, et des interactions des ondes sonores avec l’environnement proche.

Les 8 microphones sont ensuite récupérés dans une carte son reliée à un ordinateur comportant un analyseur développé par David Rousseau. Celui-ci effectue la moyenne énergétique des 8 micros par tiers d’octave en appliquant des filtres passe bande à 48 dB par octave. L’analyseur affiche les résultats en tiers d’octave. Il effectue également une recherche de cohérence entre les microphones. Si l’un des microphones est perturbé (personne qui passe à côté en parlant) son signal n’est pas pris en compte dans la moyenne pour ne pas la fausser.

iii. Installation d’un réseau de communication

La surveillance des niveaux sonores ne peut se faire sans mettre au point un réseau de communication. En effet, il faut pouvoir connaître ce qui se passe au même moment en salle et au point d’observation à 200m. La connaissance de ces deux informations permet alors de mesurer l’impact d’un réglage ou d’une modification du niveau en salle sur les émergences observées dans le voisinage. Nous avons donc crée un réseau de communication permettant de connaître en temps réel ce qui se passait à la cité A et dans la salle.

Pour ce faire, le routeur à la cité A transmet les analyses de l’afficheur via le réseau en fibre jusqu’à la salle de concert « Nef Nord » de la Villette. Nous avons installé un pont wifi avec un émetteur et récepteur 5GHz de façon à pouvoir établir un réseau de communication accessible jusqu’à la console. Lors des concerts, la présence du public peut affecter la transmission des ondes wifi. Par conséquent, le pont en 5GHz permet de créer une liaison sans fil très directive et garantir sa robustesse à toute heure car l’émetteur et les récepteurs sont placés en hauteur sur des zones sans public. Nous avons disposé à la console un premier ordinateur qui relayait les mesures effectuées à la cité A en tiers d’octave. On installe également à l’intérieur de la salle, devant la console, un système de mesure relié à un deuxième ordinateur pour l’affichage des niveaux par bande d’octave (conformément à la règlementation, l’octave est choisie comme référence). Ce deuxième ordinateur est lui même relié au réseau « son ». Ainsi, les deux afficheurs de niveaux sont accessibles dans les 2 lieux (cité A et salle de concert) à tout instant.

iv. Calage système et mesures de l’impact sur le voisinage

Sans alignement temporel, toutes les optimisations pensées lors du choix de design du système de sonorisation peuvent ne pas fonctionner. En effet, les enceintes peuvent s’annuler au point d’écoute et créer une directivité catastrophique. (Ex : rayonnement de façon erratique dans toutes les directions du fait d’un mauvais alignement entre les deux lignes de subs qui s’opposent au lieu de s’additionner).

Nous avons eu la chance d’assister au calage système pendant lequel j’ai pu utiliser notre dispositif de mesure pour évaluer l’impact des réglages sur les émergences sonores à 200 m.
Nous ne détaillons pas ici les réglages du calage système mais nous vérifions, pour chaque élément l’impact sur le voisinage grâce aux micros positionnés à la cité A.

Ensemble cardioïde K1 Sub et VDOSC :
- Impact sur le voisinage
Le calage du cardioïde a été effectué pour que la sommation à l’avant soit la plus optimale possible (6 dB) et que la réjection soit orientée à l’arrière sur le plafond.

Il a également été nécessaire d’égaliser le K1 sub à 35 Hz et 70 Hz, fréquences qui résonnaient avec le plafond.

Une fois le calage effectué nous avons vérifié l’influence de l’ajout des K1 subs par rapport au VDOSC seul sur le voisinage aux bandes de fréquence 40 Hz, 50 Hz et 63 Hz.

NR : équivalent perçu en très basse fréquence

À partir de 16h42, on coupe les K1 subs et on n’observe pas de différence de niveau majeure.

Sur la durée de la mesure, la moyenne énergétique donne 63 dB à 50 Hz avant et après la coupure des K1 Subs.

Le couplage VDOSC et K1SUB permet donc une somme de 6 dB en salle dirigé sur le public et n’envoie pas plus d’énergie chez les voisins en relatif au VDOSC seul. Nous avons environ 64 dB au tiers d’octave 50 Hz.
- Homogénéité de la répartition sonore dans la salle
Le calage étant effectué au point FOH¹⁴, nous avons donc vérifié que ce réglage ne fonctionnait pas qu’en un seul point. À l’aide de bruit rose, nous avons mesuré en moyenne spatiale la courbe de réponse de l’ensemble VDosc + K1 sub sur l’ensemble de la surface. Le résultat en bande fine exporté depuis Spectralab sous Matlab donne :

On remarque qu’il n’y a pas d’accident majeur sur la courbe de réponse et que la sommation est effective sur l’ensemble de la surface. Par ailleurs, l’ajout des K1 Sub a permis d’aplatir la courbe de réponse à 50 Hz, ce qui donne une sensation de graves plus profonde.

Influence de la ligne de subs au sol :
- Impact respectif de la tête et des subs
¹⁵

Pour toutes les fréquences l’isolement apparent est moins bon pour les têtes. On a 4 dB de plus chez les voisins avec les têtes qu’avec les subs au sol. C’est donc la tête dans son ensemble qui crée le plus de nuisance sonore par rapport à la ligne de subs.

Le caractère écrêté de la réponse des têtes seules s’explique car le plafond est plus excité. Par conséquent il apparait plus de résonances pour les têtes que pour les subs au sol.
- Impact des KS28 sur la ligne de subs SB28
L’adjonction des KS28 ne modifie pas les émergences en relatif à ce qui est déjà produit par le SB28. La réjection sur le côté de la ligne est donc très efficace. L’agrandissement de la ligne au sol permet bien d’obtenir plus de pressions sur le public sans augmenter la gêne sur le voisinage.

v. Mesures pendant le concert

À l’aide d’une carte son et d’un ordinateur autonome en énergie, nous avons réalisé un spectrogramme mobile. Celui-ci nous a permis d’afficher en bande fine et en temps réel l’évolution des niveaux sonores sur plusieurs zones de voisinage autour de la Villette.

Observations

Quelques émergences à 87 Hz sont apparues pour plusieurs groupes. Il s’agissait donc d’une émergence du système de diffusion et non propre au mixage. Le dialogue par téléphone avec l’ingénieur système tout au long du concert a permis de demander des rectifications au niveau des fréquences qui émergeaient le plus en extérieur.

Figure 56 : 22H54 De la Soul – 87Hz

Nous avons récupéré les enregistrements de l’évolution temporelle des niveaux sonores après le concert.

On observe que l’optimisation du système a permis de respecter pour toutes les bandes sensibles (40 Hz, 50 Hz, 63 Hz) le seuil de 65 dB fixé préalablement comme objectif.

Résultats principaux
- Optimiser le système en concentrant l’énergie sur le public et limitant l’impact sur le voisinage est souvent issu d’un compromis. Dans notre cas pratique, les éléments du système de diffusion qui émergent le plus sont le grave des têtes. Le calleur système, en coopération avec l’ingénieur système ont donc essayé de limiter le plus possible l’usage du grave des têtes pour le répartir plus sur les subs. Or, très vite, si l’on diminue de façon trop importante la quantité de grave dans les têtes, la diffusion devient très focalisée (l’aigu est très localisé sur les têtes et le grave tout en bas au sol). Il a donc fallu faire un compromis entre efficacité et qualité.
- S’il faut parfois faire un compromis, l’optimisation du système pour le voisinage permet dans d’autres cas d’augmenter significativement la qualité du son pour le public. Pour ce cas particulier, la création d’un cardio au niveau des têtes de diffusion permet de gagner 6 dB sur le public, d’obtenir un grave plus rond (courbe de réponse qui redevient presque plate) sans modifier le niveau d’émergence à l’extérieur. De même l’ensemble KS28 et SB28 rajoute 6 dB sur le public sans rajouter d’émergence.
- C’est avant tout le dialogue avec le sonorisateur qui permet d’arriver au meilleur des compromis. Le contrôle des niveaux sonores est souvent perçu comme contraignant et bridant. Lorsqu’un dialogue constructif est mis en place avec l’acousticien, tout le monde peut trouver un compromis avantageux pour le public et les voisins en même temps. Dans notre cas pratique c’est grâce à l’étude sur les émergences que le sonorisateur peut gagner 6 dB sur le public sans craindre d’augmenter les nuisances sonores. Il est donc important d’arriver en amont des balances de façon à pouvoir optimiser la répartition des subs et le calage système. Puis, pendant le concert, la mise en place d’un réseau de communication Wifi permettent au sonorisateur de connaitre en temps réel les bandes de fréquences concernées par les émergences. De même pour l’acousticien qui a également accès aux informations de la salle et de l’extérieur et qui peut en même temps contrôler les niveaux en bande fine. L’affichage en bande fine donne des informations extrêmement précises sur les fréquences à traiter (valeur en Hz de la fréquence, niveau et largeur de l’égalisation). L’ajustement effectué par l’ingénieur système est donc spécifique à une fréquence et non à la bande de fréquence concernée, ce qui optimise la qualité du son pour le public. Dans ce cas précis, cela réduit les résonnances sur le plafond tout en ayant un impact très limité sur la qualité du son sur le public.
- C’est donc possible de gagner du niveau dans les salles. 10 dB dans une salle de jauge moyenne, et dans ce cas précis très optimisé 20 dB comparé au système non optimisé
III. Discussion

A. Les règlementations anciennes et nouvelles sont-elles adaptées à la protection du voisinage ?

Les musiques actuelles ont fortement évolué ces dernières années et aux vues des puissances mises en jeu la protection auditive du public et du voisinage sont devenues primordiales. Si la protection auditive du public n’est pas le sujet direct du mémoire, il est important de comprendre que ces décrets traitent aussi bien de la santé du public que des nuisances sur le voisinage. Nous donnons tout de même un bref rappel du contexte, essentiel à la compréhension du nouveau décret.

Depuis plusieurs années, le HCSP (Haut Conseil de la Santé Publique) alerte sur les niveaux en basses fréquences auxquels le public est exposé. Dans le rapport « Expositions aux niveaux sonores élevés de la musique : recommandations sur les niveaux acceptables de septembre 2013 » [26], on peut lire : « Les bruits d’exposition riches en basses fréquences engendrent non seulement des atteintes auditives localisées à des fréquences basses mais aussi dans la plage des fréquences conversationnelles […]. Si l’encoche sur la bande de fréquence de 6000 Hz est fréquente sur les sujets exposés au bruit, les pertes auditives mises en évidence sur les fréquences graves constituent un phénomène nouveau, et résultent très probablement des niveaux sonores excessivement élevés dans les basses fréquences ».

Plusieurs études ont en effet observé depuis longtemps que les basses fréquences à très forte intensité pouvaient induire des surdités permanentes mais sur des fréquences moyennes éloignées de plusieurs octaves. Pour citer quelques exemples fournis par le HCSP :
- Jerger et al. (1966) ont observé chez dix-neuf sujets humains qu’une exposition à 22 Hz à des niveaux de 119 – 144 dB SPL, soit 69 – 94 dB A, provoquait une perte de 10 à 22 dB de 3 000 à 8 000 Hz.
- Patterson et al. (1977) observent chez des sujets humains qu’une bande d’octave centrée sur 63 Hz et d’un niveau de 120 dB A pendant quatre heures produit des pertes maximales vers 1 000 – 3 000 Hz.
Ces études ont mis en évidence la nécessité de prendre en compte l’impact sanitaire sur l’audition du public des niveaux sonores élevés dans les basses fréquences. L’ancienne règlementation n’était pas appliquée sur tous les critères pour les raisons que nous allons exposer ci-dessous et le rapport du Haut Conseil de la Santé Publique a conduit à l’écriture d’un nouveau décret le 7 août 2017.

1. Problèmes suscités par l’ancien décret 98-1143

La réglementation qui était en vigueur (décret 98-1143) imposait un niveau de pression acoustique limité à 105 dBA sur 10 à 15 minutes ainsi qu’un niveau de 120 dB crête.

Niveau moyen

Tout d’abord, le niveau sonore continu équivalent pondéré A n’est pas adapté pour prendre en compte les effets du bruit à des niveaux élevés dans les basses fréquences (cf. Revue de littérature §B.2.2 i. Pondérations et perception des basses fréquences par l’oreille humaine) Du fait de l’augmentation des niveaux sonores comprenant une très forte contribution de l’énergie sonore dans les basses fréquences (faiblement pondérée dans les mesures règlementaires actuelles utilisant la pondération en dBA) et des effets sanitaires suspectés dus aux basses fréquences, il fallait élargir le champ d’application de l’ancien décret et utiliser la pondération en dBC. Le dBC est apparu comme un moyen simple pour la limitation en basse fréquence.

Niveau crête

« Un niveau crête à 120 dB était systématiquement dépassée alors que le niveau équivalent en continu de 105 dBA était respecté. » (HCSP, 2013, [26])

Le niveau crête « […] représente le niveau de pression acoustique maximal mesuré sur un intervalle de temps très court de l’ordre de quelques millisecondes. Cet indicateur permet de caractériser les bruits impulsionnels notamment ceux générés par les instruments tels que la batterie »¹⁶. L’indicateur LAeq,t en tant que moyenne énergétique, gomme les pics d’amplitude de courte durée observés durant la période considérée. Un niveau à 105 dBA correspond plutôt à un niveau crête de 137 dB … Pour donner un ordre de grandeur, dans la figure ci-dessous, voici un relevé d’un sonomètre placé à la console, située à 60 m des premiers subs, lors d’un festival en plein air. Pour un niveau moyen de 99,7 dBA, on a 132,9 dB crête donc, pour 105 dBA on obtient environ 137 dB Crète.

Figure 57 : Export du logiciel 01dB, utilisé à la console lors d’un festival (les courbes ont été lissées sur un Leq 1 minute)

Par ailleurs, dans les petites salles, il est beaucoup plus difficile de gérer les limitations de pression acoustique. En effet, du fait de la proximité du public par rapport à la scène et le niveau important de champ réverbéré dans la pièce, le niveau de 102 dBA est systématiquement dépassé pour les premiers rangs avant même de mettre en route le système de sonorisation ! Une batterie à elle seule peut atteindre 105 dBA sur plusieurs secondes sans sonorisation.

Fréquences prises en compte par le décret et problèmes de voisinage

Le décret 98-1143 ainsi que le décret de 2006 ne prévoient des limitations que pour les bandes d’octave à partir de 125 Hz. Or les musiques électroniques et actuelles concentrent l’énergie dans l’octave 63 Hz qui n’est pas prise en compte dans la règlementation. Ces fréquences sont justement les fréquences les plus polluantes pour les riverains.

Voici ci-dessous un schéma simplificateur résumant la plupart du temps le résultat de l’étude d’impact d’un établissement diffusant de la musique amplifiée. Il met en évidence que les basses fréquences qui sont les plus fortes en salle sont les moins bien isolées. Il y a donc une contradiction entre les besoins et la nature des matériaux utilisés.

Dans la partie Revue de littérature §4, Lafont insiste sur la difficulté d’isoler les basses fréquences. L’ensemble formé par une plaque de BA13 et un mur lourd en parpaing creux est utilisé dans la grande majorité des habitations. « Par exemple, une cloison en BA13 disposant d’un plénum de 10 cm rempli de laine de verre, résonne à 63 Hz. Adossée à un mur en parpaing creux de 20 cm, le doublage sensé améliorer l’isolement, le dégrade de 7 décibels […]». (Lafont, [15])

Si l’on reprend plus précisément cet exemple :

A 63 Hz, la cloison en BA 13 résonne et se comporte comme un système masse-ressort. Ainsi, si l’on veut diminuer la fréquence de résonance pour améliorer l’isolement à 63 Hz, il faut soit augmenter la masse surfacique de la cloison, soit augmenter l’espace d’air entre le mur et la cloison. Mettre un grand espace entre les deux parois engendre une très forte perte de place, et augmenter significativement la masse surfacique provoque des problèmes structurels importants (modification des fondations du bâtiment souvent nécessaire). L’absence de règlementation pour la bande de fréquence 63 Hz est donc particulièrement problématique en termes de protection du voisinage… Pourquoi n’est elle pas prise en compte ? Comme montré dans la partie « problématiques de mesures dans les basses fréquences », ces fréquences sont difficilement mesurables. L’erreur de mesure dans les basses fréquences peut aller jusqu’à 24 dB à 63 Hz si l’on cumule les erreurs de mesure à l’émission et à la réception. La solution la plus simple pour pallier à ces erreurs consiste à utiliser des moyennes spatiales mais à l’heure actuelle il n’existe pas de norme qui décrive une manière simple de mesurer les basses fréquences.

Nous rappelons aussi l’importance des impacts sur la santé suite à l’exposition à des nuisances importantes et régulières. Les basses fréquences dans l’environnement peuvent entrainer des perturbations du sommeil, des dépressions, et bon nombre d’autres effets secondaires (cf. Revue de littérature, §effets sur la santé). « Certains plaignants, à bout de souffle, en larmes ou au bord de la crise de nerfs, sont d’autant plus désemparés qu’ils ont entrepris pour la plupart de nombreuses démarches mais en vain.» (CIDB, [3])

Étude d’impact et pose du limiteur de niveau

Comme beaucoup de salles de concert sont dans des bâtiments historiques, elles n’ont pas été conçues pour isoler les infrabasses des musiques actuelles. La seule solution pour isoler en infrabasses est d’utiliser des structures lourdes totalement découplées dont la masse surfacique est d’environ 500 kg/m².¹⁷ Les solutions constructives étant très couteuses voire structurellement impossibles, le premier paramètre à améliorer consiste à positionner et à rendre directif quand cela est possible le système de sonorisation. En dernière limite, quand toutes les autres voies ont été optimisées, la règlementation impose la mise en place d’un limiteur de pression acoustique¹⁸, pour garantir la tranquillité du voisinage et protéger l’audition du public. Quelles sont les problématiques associées à cette solution ?
- Pour les grandes salles de concert, le sonorisateur utilise souvent plusieurs sorties de console de façon à pouvoir régler séparément le niveau des front fills¹⁹, de la façade, des subs, … Or les limiteurs n’agissent que sur deux entrées, ce qui le rend incompatible avec les grosses structures.
- Les applaudissements générant un niveau supérieur à la réglementation, ils déclencheront inéluctablement le limiteur et ce, indépendamment des niveaux de diffusion en salle.
- Les limiteurs normalisés correspondant à la norme NF31-122 (AFNOR 2003, ICS : 17.140.01) et actuellement disponibles utilisent une technologie VCA (contrôle de gain automatique) qui ne savent réagir qu’après la perturbation. Cette action postperturbation engendre donc deux problèmes majeurs : les crêtes ne sont pas atténuées instantanément et le gain à l’instant t est maîtrisé par son passé. Par conséquent, sur des musiques dont la dynamique n’est pas constante (live), il apparait des effets de pompage très problématiques à l’usage. Malheureusement seuls les limiteurs à action multi bandes et à traitement instantané de la dynamique peuvent être adaptés au live. Il n’existe cependant pas sur le marché de limiteurs exerçant ces fonctions, et seuls des limiteurs sur mesure permettent de les réaliser. De plus, la plupart des limiteurs du commerce se contentent de moduler le niveau global en fonction des mesures de niveau par bande. L’utilisation de structures plus complexes telles que de vrais limiteurs multi bandes associées a des enregistreurs homologués, ne sera possible que lorsque la nouvelle norme NF31-122 (janvier 2017) sera mise en application (limiteurs de type classe 3)²⁰. La solution physique consiste à séparer le signal par bandes de fréquences, et traiter la dynamique séparément. Dans un deuxième temps, on recompose le signal en passant préalablement chacune des bandes dans des filtres permettant d’éliminer la distorsion créée par la limitation brute et de remettre en phase toutes les bandes.²¹
- Enfin, si l’isolement est insuffisant en basse fréquence, le niveau sonore ne permet pas d’exploiter le lieu, ce qui rend l’usage du limiteur incompatible avec l’exploitation. Plutôt que de mettre un limiteur qui rendrait le lieu impropre à sa destination finale, il convient donc de chercher une solution dans le système de diffusion, par la maîtrise de sa directivité, lorsque cela est possible.
Conclusion sur les points problématiques du décret 98-1143

En raison du coût et des impossibilités structurelles de réaliser des travaux dans certains bâtiments pour s’affranchir des infrabasses, bon nombre de salles ne peuvent pas respecter la règlementation. Certains exploitants ont réalisé des travaux d’isolation mais sont encore confrontés aux problèmes de voisinage. Outre l’impossibilité de produire un concert avec 120 dB crête, les fréquences infrabasses (notamment à 63 Hz) ne sont pas prises en compte alors qu’elles traversent toutes les structures et constituent la gêne principale pour les riverains. Par ailleurs, la pose du limiteur est souvent insuffisante à la protection des riverains, et les travaux sont très onéreux. L’optimisation des installations de sonorisation par la création de directivité dans les basses fréquences est donc dans ce contexte fondamentale pour que les salles puissent continuer leur activité sereinement. Le limiteur ne peut pas être une solution unique. Elle doit être pensée avec une optimisation du système de diffusion.

Du fait de l’augmentation de l’énergie sonore dans les basses fréquences et des effets sanitaires suspectés, un nouveau décret est paru tout récemment en août 2017. Il étend le champ d’application du 98-1143 de diffusion en lieu clos à la diffusion en plein air et intègre des spécificités de niveaux à ne pas dépasser pour les enfants.

2. Le nouveau décret 2017-1244

En partant de l’analyse du décret dans la revue de littérature, nous mettons en évidence les difficultés d’exploitation d’une règlementation à 102 dBA et 118 dBC en tous points accessible au public, estimés sur une moyenne de 15 minutes.

Ce décret a été conçu dans l’objectif de protéger le public lors des concerts les plus critiques en termes de niveau sonore en basse fréquence, par exemple les concerts de musique électronique en plein air. Dans les festivals ou dans les discothèques, la musique est souvent très compressée, sa diffusion s’effectue avec de très forts niveaux en basse fréquence, et sur des durées très importantes. Si la baisse de niveau est primordiale, il faut cependant qu’elle reste dans des proportions exploitables. Sur le schéma et les calculs ci-dessous, on raisonne en niveau de pression. Le temps n’intervient pas dans les calculs. Le but de ces figures est de montrer les problèmes d’homogénéité des niveaux sonores. Ces calculs sont vrais pour des simulations en champ libre, dans des cas tels que les festivals de plein air.

Dans une configuration standard, l’obligation de respecter un niveau sonore de 118 dBC en tous points accessible au public, engendre soit de placer des barrières de sécurité à une très grande distance de la scène soit d’accrocher les caissons quand cela est possible, malgré tous les effets négatifs sur le voisinage que cela va engendrer.

Voici ci-dessous l’explication détaillée de ces implications.

2.1 Illustration des impossibilités difficultés techniques de mise en œuvre

i. Cas des subs au sol

Positionnons un subwoofer à 20 m de la console de mixage. En général les barrières se placent à environ 2 m des subs. Quel est donc le niveau sonore mesuré au point mixeur? Nous effectuons les calculs en champ libre, ce qui correspond au cas pratique d’un festival en plein air.

Calculons l’atténuation du niveau sonore due à la distance parcourue par le son pour les deux points de référence : la barrière et le point mixeur. Comme pour la programmation du logiciel de simulation, tout est basé sur un niveau relatif dont la référence est à 1 m du sub.

Atténuation_barrière = 20 * log10(Distance_Barrière)
= 20*log10(2)

Atténuation_mixeur = 20 * log10(Distance_Mixeur)

= 20*log10(20)

Atténuation_relative = Atténuation_barrière – Atténuation_mixeur
= 20 dB

Ainsi,

Niveau_mixeur = Niveau_Barrière – Attenuation_relative = 98 dBC

Pour le calcul en dBA, le rayonnement n’étant pas omnidirectionnel, la loi de propagation n’est pas simple. Nous avons donc utilisé Soundvision afin de simuler l’homogénéité créée par un Line Array en hauteur.

En respectant le nouveau niveau règlementaire de 102 dBA et en accrochant à 10 m de haut les Line Array, on obtient 98 dBA au niveau de la console de mixage, soit seulement 4 dB de différence avec le niveau le plus exposé. Dans une configuration standard, il y a donc une différence d’homogénéité de 16 dB entre le dBA et le dBC lorsque les subs sont posés au sol. La perte liée à la propagation sphérique des basses engendre une très grande différence de balance tonale²² entre les personnes à proximité des subs et le point moyen sur le public. Le respect des niveaux règlementaires engendre donc des niveaux équivalents en dBC et dBA (98 dBC et 98 dBA à la console), ce qui musicalement parlant, est perçu comme un son très agressif.

Actuellement, il est courant de mesurer plus de 118 dBC à la console. S’il est effectivement important de diminuer les niveaux sonores maximums actuellement générés sur le public, il est en revanche compliqué d’imposer une baisse de 20 dB au sonorisateur. C’est un saut beaucoup trop important pour qu’il soit physiquement réalisable et applicable.

Comme démontré dans l’exemple précédent, s’il est aujourd’hui courant d’obtenir une homogénéité correcte du dBA sur tout le public, en utilisant le système en ligne source Line Array, il est par contre quasiment impossible d’avoir le même résultat pour le dBC en laissant les subs au sol. Le dBC étant essentiellement constitué dans les musiques actuelles par les basses fréquences générées par les caissons de basse, il est donc nécessaire d’éloigner les subs du public. L’accroche en hauteur devient donc obligatoire.

ii. Cas des subs en hauteur

L’usage montre qu’un niveau de concert perçu comme minimaliste demande des niveaux sonores de l’ordre de 96 dBA sur l’ensemble du public. Positionnons la console à 50 m (cas usuel dans un festival de grande ampleur). Il faut accrocher les subs à 14 m de haut pour respecter 118 dBC en tous points accessibles au public. Accrocher des subs à 14 m de hauteur est la plupart du temps physiquement impossible.

Nous détaillons le calcul de la hauteur d’accroche pour une distance de barrière usuelle à 2 m et un niveau à la console de 96 dBA. On prend comme valeur de balance tonale 10 dB ce qui correspond à un cas pratique usuel.

Vous trouverez ci-dessous un abaque permettant de voir la hauteur du sub nécessaire en fonction de la distance avec les barrières pour 99 dBA à la console et 50 m de distance entre les subs et le mixeur.

Nous concluons qu’en utilisant qu’un petit stack omni de subs le décret n’est pas applicable, car soit la hauteur d’accroche des subs est trop importante, soit la distance des barrières de sécurité est trop importante.

Afin d’essayer de diminuer la hauteur d’accroche, essayons d’utiliser deux stacks en hauteur (subs stéréo) espacés de 16 m. On obtient donc +6 dB sur la ligne centrale, et moins de niveau en dessous de chaque sub en relatif au sub seul suspendu. On aperçoit ci-dessous d’importants phénomènes constructifs et destructifs entraînant une grande perte de qualité sonore sur le public.

Figure 58 : Simulation Soundvision à 50 Hz de deux stacks de 2* SB28 espacés de 16m sur une échelle de 500 m

Une des solutions consiste à suspendre des grandes lignes de subs comme l’exemple ci-dessous, des End Fire, ou des arcs subs²³. Dans ce tableau, il faut suspendre 14 K1 Subs à 10 m pour obtenir une couverture homogène.

Nous arrivons donc à la conclusion que ce système coûte excessivement cher car il nécessite beaucoup d’enceintes et des structures d’accroche complexes.

Outre la difficulté technologique d’accrocher les subs, si l’on considère le point de vue scénographique, la taille des subwoofers est incompatible avec la visibilité minimale nécessaire pour le public.

Ce raisonnement s’applique également dans le cas d’une salle. Même si les modes de résonance contribuent à rendre le système plus homogène, il sera tout de même nécessaire d’accrocher les subs en hauteur pour respecter le nouveau décret. La proximité avec le plafond risque d’augmenter très fortement les nuisances sonores chez les riverains.

2.2 Impossibilité d’effectuer les mesures de niveau max dans le public

La réglementation imposant 118 dBC en tous points accessibles au public il faut donc effectuer la mesure de niveau au point le plus fort se situant généralement dans la fosse où le public est le plus énergique. Effectuer des mesures avec un sonomètre par nature fragile et coûteux au milieu d’une foule déchaînée parait donc extrêmement difficile.

2.3 Nécessité d’effectuer des mesures en plusieurs points impossibles avec le matériel existant

La majorité des systèmes de sonorisation de grande ampleur utilisant des subs séparés nécessitent un point de mesure physiquement différent pour le dBA et pour le dBC. Le niveau maximum en dBC sera mesuré en proximité des subs. En effet, à cet emplacement, les subs généralement accordés en passe bande à 63 Hz avec une pente de 24 dB par octave, la courbe de réponse de la mesure en dBC reproduit la courbe de réponse du sub. La mesure en dBC devient donc homogène avec la mesure en basse fréquence. À cette position, le Line Array est extrêmement directif et son maximum est situé plus loin. Le niveau maximum en dBA sera mesuré dans le champ direct des enceintes médium aigues ou au niveau du point central de sommation. Il y a donc des cas où il sera nécessaire d’utiliser un système composé au minimum de 2 microphones afin de surveiller respectivement le dBA et le dBC.

Actuellement, seuls des limiteurs sur mesure sont susceptibles d’effectuer ces mesures en multipoints mais il n’existe pas de systèmes commerciaux standards adaptés à cette contrainte.

2.4 Influence de la scène et du public sur le respect des niveaux en tous points

Les instruments sur scène émettent à eux seuls des niveaux sonores supérieurs à 102 dBA. Par conséquent, un limiteur dont le microphone de mesure sera placé au devant de la scène zone typique du maximum d’émission sonore, sera entièrement maîtrisé par le niveau sonore sur scène.

De plus, l’influence du public (cris, applaudissements…) est très souvent largement supérieure à 102 dBA.

De même que pour le précédent décret, on aura donc entre l’impact de la scène et le bruit du public un limiteur donc le comportement n’est plus relié au niveau de diffusion en salle.

Le niveau de scène et le public court-circuitant le niveau généré par le système de sonorisation, le limiteur se mettra en défaut et coupera le son du système de sonorisation.

3. Synthèse

Si le 120 dB crête dont l’objectif était de protéger le public dans les basses fréquences n’a jamais pu être appliqué, il est important de comprendre que le nouveau critère de 118 dBC en tous points ne sera pas non plus compatible avec la réalisation d’un concert sans de coûteux aménagements. Il risque donc comme le précédent, de ne pas être respecté, et ce au détriment de la protection du public. Cela serait particulièrement dommageable car il est urgent de limiter les niveaux sonores actuels.

Malheureusement, la protection du public qui nécessite l’accroche des subs en hauteur, risque de se faire au détriment de celle du voisinage car le 63 Hz n’est pas pris en compte dans la règlementation. Par ailleurs, une baisse aussi importante du dBC risque de réserver certaines pratiques musicales à des concerts de très grande ampleur, ce qui est dommage vis-à-vis de la diversité culturelle.

L’objet des questions de recherche suivantes se concentrent sur l’optimisation par la directivité des systèmes de diffusion. Une des problématiques majeures dans l’optimisation des systèmes consiste à les caractériser. Il est donc fondamental de commencer par définir des méthodes de mesure permettant de caractériser réellement les performances des systèmes de diffusion.

B. Comment mesurer de façon fiable les basses fréquences pour optimiser les systèmes de diffusion au regard des problèmes de voisinage ?

1. Méthodes de mesure

Synthèse sur les méthodes de mesure :

Techniques de mesure en moyenne spatiale et temporelle :

Les basses étant modales il faut faire plusieurs points de mesure. 3 solutions se présentent :
- Soit on se déplace dans la pièce en faisant une moyenne Leq pendant 2 min
- Soit on mesure plusieurs points discrets pendant au moins 30s et on en fait une moyenne statistique
- Soit on utilise la technique multi micros en sweep
Méthode de mesure de niveaux sonores :
- Cas simple où l’on a beaucoup d’émergence : on mesure en bruit rose avec un sonomètre en se déplaçant dans l’espace pendant minimum 2 minutes.
- Cas où l’émergence n’est pas suffisante : l’usage d’un échantillonnage de musique permet de générer des niveaux plus forts.
- Cas extrême (très peu d’émergence) : les mesures en sweep permettent de gagner jusqu’à 34 dB de rapport signal / bruit en mesurant en plusieurs points ou en utilisant un système multi micros.
- Il est aussi fréquent de pouvoir utiliser un échantillonnage de musique, par exemple plusieurs répétitions pour pouvoir faire les mesures d’isolement. Cela permet de faire l’étude d’impact en interférent un minimum avec la mise du système de sonorisation.
Spécificités des techniques d’optimisation du système :
- Utiliser les techniques de calage temporel pour mettre en phase le système de diffusion.
- Ne pas oublier la distance de mesure. Les configurations cardioïdes s’optimisent à grande distance. Il faut placer le micro de mesure au lointain.
- Mesurer l’impact de chaque élément du système de diffusion séparément, en bande fine chez le voisin, puis l’impact de l’ensemble. Hiérarchiser les impacts de chacune des boîtes.
- Mettre en place un retour en temps réel des mesures d’émergence sur le voisinage.
Spécificités des mesures chez les voisins :

Pour bien choisir les endroits où l’on mesure les émergences. Il faut se baser sur :
- La directivité du système.
- Le choix de l’emplacement présentant le bruit de fond le plus constant possible et une émergence significative (supérieure à 15 dB ou 20 dB pour toutes les bandes de fréquence où l’on souhaite imposer une limitation).
- Privilégier les architectures défavorisantes (habitations hautes et grandes surfaces réfléchissantes) qui amplifient naturellement le son.
- Se méfier des impacts des conditions atmosphériques (vent) : faire particulièrement attention aux rafales de vents. Faire des moyennes statistiques.
- Lors des concerts, utiliser un analyseur en bande fine pour connaitre précisément les bandes de fréquences qui posent problème et pouvoir faire un retour en temps réel à l’ingénieur système. Il est pratique de fonctionner par fonction de transfert afin de pouvoir faire la mesure au droit des fenêtres des riverains et non à l’intérieur des bâtiments afin d’éviter tout dérangement.
- Ne pas oublier de faire une moyenne spatiale. Insistons encore une fois, les basses se mesurent toujours en plusieurs points.
2. Tableau récapitulatif

C. Comment choisir la configuration de subs la plus adaptée ?

1. Tableau de synthèse sur la configuration cardioïde

Nous synthétisons l’ensemble des résultats sur la configuration cardioïde dans le tableau ci-dessous.

2. Tableaux de synthèse généraux

Sur le tableau et les courbes ci-dessous, on peut voir que seul l’End Fire est constant en fréquence et permet une sommation parfaite. 50 Hz 70 Hz 100 Hz.

Bilan des résultats fondamentaux
- Seules les configurations où le retard compense la distance physique à l’avant permettent de garantir que dans l’axe toutes les réponses impulsionnelles seront parfaitement synchronisées dans le temps et qu’il n’y aura donc pas de déformation de timbre.
- Plus on a de subs moins on a de lobes
- Un cardio avec les deux HPs en phase ne peut pas être utilisé sur plus large qu’une octave. Il faut donc utiliser un preset d’enceinte qui coupe le plus bas possible.
- Le gradient procure de très fortes réjections sur une très large bande passante, mais a l’inconvénient d’engendrer des distorsions de la réponse impulsionnelle.
- Dans le cas où la bande passante du sub se limite à une octave et où l’on ne veut aucune déformation de la réponse impulsionnelle, il faut utiliser un cardio natif. Si l’on cherche à maximiser la réjection pour toutes les fréquences, l’emploi du gradient est plus efficace au détriment de la qualité du son à l’avant. L’End Fire, lorsque son encombrement est admissible, il cumule bonne sommation, réjection large bande, et qualité de la réponse impulsionnelle.
3. Interprétation des résultats des mesures dans le hangar

Les mesures en laboratoire nous ont permis de vérifier les résultats fournis par les simulations informatiques. Par ailleurs, cette expérience a surtout permis de mettre en évidence un critère d’analyse supplémentaire spécifique à la robustesse de chaque configuration vis-à-vis des interactions avec une pièce.
- Configuration cardioïde : OUI, le cardio marche dans une pièce !
Un cardio se mesure en champ lointain et moyenné dans l’espace ! Il faut trouver un compromis entre la distance permettant au cardio de se mettre en place et rester dans le champ direct prédominant vis-à-vis du champ réverbéré.

Il faut trouver un compromis entre la qualité de la réponse impulsionnelle et la réponse modale de la pièce. La configuration cardioïde accordé à λ/4 sonne mieux mais est plus assujettie aux modes de résonnance de la pièce. En effet, la distance entre les sources de 1m70 augmente les chances d’exciter différents modes dans la pièce. Nous avons remarqué que les hauts parleurs sont assujettis à une réponse modale dans la pièce qui varie en fonction de leur position. Ils n’ont donc ni la même courbe de réponse ni la même courbe de phase. Il est important pour créer un cardioïde que les deux HPs excitent les mêmes modes, qu’ils aient la même énergie et que la phase soit bien inversée au point de réjection arrière. Le comportement modal de la pièce pourrait donc être un des phénomènes fondamentaux expliquant la complexité de mise en œuvre des cardioïdes en salle.

Lorsque l’on combat les modes il faut essayer de les contrer : il existe différents types de position et différents types de cardio. Rapprocher les subs offre plus de possibilités et permet d’obtenir plus facilement une réjection mais cette facilité se paie au prix d’une moins bonne sommation en puissance ainsi qu’une réponse impulsionnelle déformée. Parfois, il vaut mieux mettre une distance plus petite et créer la directivité.

La mesure permet de se rendre compte de ces difficultés, c’est un compromis à trouver. Il faut ajuster en fonction des lieux
- End Fire
  
  Il permet bien d’augmenter la largeur fréquentielle de la bande de réjection
  
  Il est moins assujetti aux phénomènes de modes de la pièce
  
  Il permet quand il est relativement long de maîtriser l’énergie sur le côté
  
  Il a par contre l’inconvénient majeur d’être difficile à mettre en œuvre de par ses dimensions physiques.
- La ligne
  
  Très directive sur les côtés
Bilan : Comment faire quand la pièce est difficile ?
- Si le cardio espacé de λ/4 ne marche ne pas ou s’il n’est pas mécaniquement implémentable : il faut trouver une configuration les subs s’annulent à l’arrière mais qui ne soit pas trop mauvaise à l’avant. Rapprocher les subs offre plus de possibilités et permet d’obtenir plus facilement une réjection mais cette facilité se paie au prix d’une moins bonne sommation.
- Si le système veut avoir une fréquence de coupure plus élevée, le cardioïde n’est plus adapté et il faut absolument utiliser un End Fire ou un système en gradient malgré la déformation de la réponse impulsionnelle qu’ils engendrent.
- Plus on augmente le nombre de sources, plus le système de diffusion peut imposer son front d’onde, et être moins sujet aux modes de résonance de la salle. Par ailleurs, une fois de plus, le fait d’avoir construit des subs de petite taille facilite le système à s’affranchir de la salle.
Dans la réalité, il est souvent difficile de multiplier le nombre de sources. Si tel est le cas, par exemple si l’on a que deux subs, quelles seraient les solutions ?

L’égalisation et les niveaux peuvent permettre de gagner en réjection arrière. La méthode consiste à obtenir l’annulation en égalisant les HPs et en modulant le gain, de telle sorte que leur courbe de réponse soit identique en niveau et en fréquence dans la zone 40/63 Hz que l’on souhaite rejeter. On traite séparément les deux HPs puis on vérifie l’annulation. De façon imagée, l’un des HPs va faire le signal et l’autre l’annulation.

D. En pratique, quelle est la procédure à adopter pour optimiser un système vis-à-vis du voisinage ?

1. Méthode Globale

Il faut identifier la localisation des zones de voisinage à protéger ainsi que les parois les plus sensibles de la salle étudiée.

Il s’agit ensuite de choisir l’orientation du système et la configuration de subs qui permet de minimiser l’énergie sur les zones précédemment identifiées.

Pour ce faire, la première étape consiste à trouver dans le tableau précédent la configuration qui parait naturellement la plus adaptée, et qui soit physiquement réalisable. Une fois le principe physique établit, il est pratique d’utiliser les logiciels de simulation afin de réadapter le système de diffusion aux particularités du lieu (couverture du public, gradins…)

On installe ensuite la configuration choisie. On mesure chacun des éléments séparément chez les voisins et on optimise la directivité de chacun des sous groupes de diffusion séparément.

Puis, on ajuste les niveaux globaux en relatif afin de diminuer l’impact des éléments les plus problématiques.

Afin de respecter un niveau d’émergence adapté, il convient de placer un afficheur de niveaux permettant d’indiquer les niveaux sonores à ne pas dépasser. Il peut prendre trois formes différentes ;
- Soit un retour en temps réel de mesure de niveau sonore directement chez les riverains (cas idéal mais rarement applicable).
- Soit à partir d’une mesure effectuée à l’endroit le plus proche possible des riverains, accessible mais non perturbée par les éléments extérieurs (cas le plus souvent optimal)
- Soit à partir des niveaux mesurés en salle et donc les valeurs sont fixées par l’étude d’impact (cas le plus simple mais très impacté par les changements de configuration de diffusion et par les conditions atmosphériques.
Dans tous les cas, rien ne remplacera le dialogue humain : le retour en temps réel avec le sonorisateur pour maîtriser le son généré permet l’optimisation la plus qualitative possible. En effet, le son d’un limiteur n’est pas satisfaisant (cf. limitations des décrets Partie A Discussion). Par ailleurs, le dialogue avec les voisins, le fait de prêter une oreille à leurs problématiques est essentiel.

Dans tous les cas, nous rappelons l’absolue nécessité d’utiliser plusieurs points de mesure pour définir les niveaux en basse fréquence.

2. Tableau de synthèse de la procédure

3. Zoom sur le mémoire de recherche

Optimisation des systèmes de diffusion pour la protection du voisinage

Contributions
- Contributions intellectuelles
  
  Synthèse et limites des configurations cardioïdes afin de rendre leur usage plus instinctif.
  
  La compréhension du système et la méthode de mesure permettent de créer de la directivité dans les salles. Cette solution représente un gain significatif face au problème d’isolation actuelle liée à la structure des bâtiments.
- Contribution pratique
  
  Proposition d’une méthode de mesure synthétique pour l’optimisation des systèmes de diffusion dans les basses fréquences vis-à-vis du voisinage.
- Contributions technologiques
  
  Programmation d’un logiciel de simulation permettant notamment la production d’un tableau de synthèse des configurations pour mieux comprendre leur fonctionnement et donc leurs limites.
  
  Construction de subs compacts et clos visant à mesurer de façon plus précise les configurations.
Aujourd’hui, les notions de directivité vis-à-vis des problèmes de voisinage sont peu abordées dans le métier pour plusieurs raisons : peu de liaison directe s’établissent entre l’acousticien qui sait ce qui se passe chez les voisins et le sonorisateur à l’intérieur de la salle de concert, lors de la conception des salles ou de leur exploitation. L’objectif est de relier les deux métiers pour trouver une solution commune. Le sonorisateur ne peut pas se contenter d’un limiteur et il est très difficile pour les acousticiens d’isoler dans les basses fréquences. Par ailleurs, établir une bonne relation avec le voisinage est également fondamental pour trouver les bonnes solutions. La communication est donc fondamentale et seule une vision globale permet d’obtenir de vrais résultats.

Techniquement parlant, une fois la communication établie, la solution consiste à comprendre les faiblesses de la salle et à créer de la directivité pour maximiser l’isolement apparent. En pratique, l’optimisation est compliquée et ne peut se faire que si l’on traite séparément les problèmes pour pouvoir in fine viser à l’optimisation globale. Pour caractériser il faut savoir mesurer. Le problème majeur que constitue l’estimation des basses ne peut se résoudre que par du moyennage spatial ou de la mesure multi micros. Lorsque l’on applique des méthodes de mesure par moyennage, on passe d’un système qui parait chaotique à un phénomène caractérisable.

Il est courant, dans les petites salles d’avoir un gain de 5 à 8 dB, et jusqu’à plus de 20 dB pour les configurations dans les grandes salles ou en plein air.

Les salles sont tellement variables que nous avons souhaité avoir des résultats et des méthodes d’optimisation généralisés sans s’attacher à des cas particuliers. C’est en mesurant dans la salle et chez les voisins les configurations de subs que l’on a sélectionnées que l’on peut se rendre compte si elles fonctionnent, s’il faut les déplacer ou en utiliser d’autres (par exemple rajouter des sources pour imposer plus le front d’onde etc.) Il n’y a pas de réponse toute faite, l’optimisation se fait par allers et retours successifs (cf. schéma de synthèse p 158).

Limitations
- Créer une directivité ne peut évidemment s’appliquer que dans des cas où le voisinage est sur les côtés ou à l’arrière du système de diffusion. Si la zone à protéger est localisée en face du système, les techniques étudiées dans ce mémoire ne permettent pas de résoudre le problème.
- Il aurait été bien de faire une étude plus approfondie sur d’autres techniques de mise en phase pour la création directivité : passe tout, gradient, lignes de subs ou End Fire à fréquence de coupure progressive.
- Il n’a pas été possible par manque de moyens et de temps de rechercher à fournir des informations statistiques sur la qualité perçue des différentes configurations car cela aurait été le sujet d’un mémoire autonome.
- L’objectif du mémoire n’était pas de détailler la méthodologie propre à la réalisation de l’étude d’impact. Nous nous sommes focalisés sur la maîtrise des concerts de grande ampleur de type festivals, qui n’ont pas les mêmes impératifs que ce qu’exigerait la réalisation d’une étude d’impact pour un bar ou une boîte de nuit. Les techniques qui sont décrites sont plus complexes et plus couteuses mais permettent une meilleure gestion des niveaux sonores dans les infrabasses
- Le temps disponible dans le hangar était très limité. J’aurais aimé pouvoir faire plus de points de mesure pour valider les résultats de façon plus rigoureuse. Il aurait été également intéressant de pouvoir comparer la directivité intrinsèque du sub avec d’autres modèles du commerce (manque de temps également).
Apport Personnel
- Ce mémoire m’a permis de passer de connaissances théoriques à une connaissance appliquée tant d’un point de vue des concepts associés à la physique du son que d’un point de vue pratique. J’ai pu développer une capacité d’analyse et de synthèse vis-à-vis de la maîtrise des phénomènes de directivité, indispensable dans la vie pratique pour être à la fois efficace et créatif.
- J’ai pris conscience lors de retours de riverains pendant les expériences pratiques, des conséquences psychologiques engendrées par les problèmes d’émergence. J’ai réalisé à quel point la communication humaine était fondamentale dans résolution de problèmes dont on a parfois l’impression qu’ils sont insolubles quand on les limite à des critères purement techniques.
- Plus qu’un mémoire, ce travail de recherche m’a donné envie de poursuivre dans cette voie. Mon orientation première se dirige vers la sonorisation mais il me semble que concilier un travail d’optimisation des systèmes de sonorisation vis-à-vis du voisinage et sonorisation en elle-même serait un alliage passionnant permettant de relier ces deux domaines si interdépendants.
Perspectives

Pour les différentes configurations de subs, il aurait été profitable de pouvoir écouter dans des cas concrets et avec un processus d’auralisation les réponses impulsionnelles dans la zone d’écoute, afin de pouvoir associer aux différentes configurations un critère qualitatif permettant de discriminer la qualité de la réponse impulsionnelle des différentes configurations. Aujourd’hui seules les configurations où le retard compense la distance physique, permet de s’affranchir de cette étude, car il est réaligne temporellement toutes les réponses impulsionnelles de chaque sub.

Références

[1] AUFFRET, M., Rapport « Préventions des traumatismes sonores des musiques électro-amplifiées». Paris: CNRS, février 1998

[2] BESSON, R., ALARY, J., Sonorisation et prise de son (4e ed). Paris: Dunod, 2007

[3] CIDB, Le coût sanitaire, économique et social du bruit. Dans Echo Bruit, Numéro Hors série, 2014

[4] DESCHAUX, R., Cours d’Acoustique du Bâtiment. Repéré à http://www.acgrenoble.fr/lycee/roger.deschaux/documents/Cours/Acoustique/Acousti que-Cours_1.pdf

[5] EVEREST, F. ALTON, Master Handbook of Acoustics (4e ed). New York: McGraw-Hill Professional, 2001

[6] McCARTHY, B., Sound Systems Design and Optimization (3e ed). New York et Londres:
Focal Press, 2016

[7] FARINA, A., Advancements in impulse response measurements by sine sweeps. Dans la 122e convention AES, le 5–8 2007 Mai, Vienne, Autriche

[8] FARINA, A., MULLER, S., MASSARANI, P., Transfer-Function Measurement with Sweeps. Dans JAES, Vol. 49, N° 6 pp. 443, 2001

[9] FINAND, F., La diffusion acoustique. Repéré à http://www.acouphile.fr/diffusion.html
[10] GUASTAVINO, C., CHEMINEE, P., Une approche psycholinguistique de la perception des basses fréquences : Conceptualisations en langue, représentations cognitives et validité écologique. Article publié dans la revue Psychologie Française, 48 (4), pp. 91-101, 2003

[11] GUIBERT, G. Sociologie du volume sonore dans les musiques amplifiées. Dans Echo Bruit, n°116, Musiques amplifiées et gestion du risque auditif, mars 2007

[12] JOUHANEAU J., Notions élémentaires d’acoustique, électroacoustique. Paris: Lavoisier,
Tec & Doc, 1999

[13] JOUHANEAU, J., Acoustique des salles et sonorisation. Paris: Lavoisier, Tec & Doc, 2003

[14] LEIPP, E., Acoustique et Musique. Montreuil: Mines Paris Teich, 2010

[15] LAFONT, JP., Résonances stationnaires : l’influence des parois sur le calcul des fréquences modales. Repéré à http://www.lafontaudio.com/dossiers/limites.htm

[16] MEYER-BISCH, C., Les chiffres du bruit. Dans Médecine et Sciences, vol. 21, p.546-550 mai 2005

[17] PION, J., Les musiques amplifiées dans l’agglomération parisienne face au problème des nuisances sonores. Université de Reims, 2002

[18] PIETQUIN, D., Phase notions essentielles. Repéré à https://www.techniquesduson.com/phase1.html, 2008

[19] ROSSI, M., Traité d’électricité. tome 21, Electroacoustique, Presses Polytechniques et Universitaires Romandes, 1993

[20] ROSSI, M., Audio. Presses Polytechniques et Universitaires Romandes, 2007

[21] ROUSSEAU, D., La mesures des basses fréquences engendrées par les musiques amplifiées. Présenté aux Rencontres Acoustique & Technique à Paris, France, le 05 et 06 juin 2015

[22] ROUSSEAU, D., Retour d’expérience sur les mesures basses fréquence d’origine musicale, 63Hz.fr

[23] SAILLANT, P., Les dispositifs de reproduction des fréquences les plus basses en sonorisation. ENS Louis Lumière (Paris, France), 2010

[24] VAN VEEN, M., Calibration & Design Techniques for Modern Sound Systems the Hague. Présenté à la conférence à MVV Seminar, Den Haag, Hollande, le 6 – 11 Février 2017

[25] SERVICE DE SANTE AU TRAVAIL, Le Bruit, les principaux aspects réglementaires. Repéré à http://www.cihl45.com/index.php/les-risques-physiques/le-bruit-les-principaux-aspects-reglementaires, le 16 février 2015

[26] HCSP (Haut Conseil de la Santé Publique), Expositions aux niveaux sonores élevés de la musique : recommandations sur les niveaux acceptables. Repéré à http://www.hcsp.fr/explore.cgi/avisrapportsdomaine?clefr=378, Février 2013

[27] 01dB Industries, DUMAS J., LAMBERT F., Analyse Fréquentielle premier niveau.
Paris, le 05 septembre 1996

[28] DOCS HP ET SUBS
ADAMSON, Document technique T21. Repéré à https://adamsonsystems.com/Support/Downloads/SPEC_SHEETS/SUBS/T21_Techni calData.pdf
ALTEC, Document technique 416-8A, http://www.yesterdays-tech.com/Altec/416-8A.pdf
BCSPEAKER, Document technique 21 Pal, http://www.bcspeakers.com/en/products/lf-driver/21-0/1/21ipal
L-A COUSTICS, Document technique KS28. Repéré à http://www.l-acoustics.com/admin/product_files/KS28_SPS_FR_1.0.pdf

Quelques sites Internet de Référence

CIDB : http://www.bruit.fr/ AGISON : http://agi-son.org/ LEGIFRANCE : https://www.legifrance.gouv.fr/
LAFONT AUDIO ACOUSTIQUE & DESIGN : http://www.lafontaudio.com/

Annexes

A. Glossaire

Bass trap : matériau, généralement passif, absorbant les basses fréquences.

Balance tonale : différence de niveau en dB entre le dBA et le dBC

dB : décibel. Le dB exprime le niveau de pression sonore par rapport à la plus faible intensité d’un son perçue par l’oreille humaine. Cette unité s’inscrit sur une échelle logarithmique.

Cardio NATIF : configuration cardioïde dont la distance entre les sources vaut λ/4. λ étant la longueur d’onde de la fréquence d’accord de la configuration.

Cardio NON NATIF : configuration cardioïde dont la distance entre les sources est DIFFERENTE de λ/4. λ étant la longueur d’onde de la fréquence d’accord de la configuration

End-Fire Array : réseau dont la directivité est maximale dans la direction d’alignement des transducteurs.

Line Array : réseau linéaire d’enceintes acoustique permettant d’augmenter la zone de couverture du public.

L1 : niveau dépassé pendant 1 % du temps (bruit maximal).

L10 : Niveau dépassé pendant 10 % du temps : il indique le niveau moyen de bruit qui émerge du bruit de fond.

L90 : Niveau dépassé pendant 90 % du temps ; indique le « bruit de fond ».

Leq : Indice énergétique, niveau de bruit équivalent. En considérant un bruit variable perçu pendant une durée T, le Leq représente le niveau de bruit constant qui aurait été produit avec la même énergie que le bruit réellement perçu pendant cette durée. Le Leq s’exprime en dB.

MLS : Maximum Length Sequence. C’est une séquence binaire pseudo aléatoire permettant d’extraire la réponse impulsionnelle

LFE (Low Frequency Effect) : canal réservé aux basses fréquences (10-120 Hz). Sa présence est généralement précisée par le terme « .1 » (exemple système 5.1).

Réponse Impulsionnelle : Lorsque l’on met en entrée d’un système une impulsion (Dirac), la réponse impulsionnelle est la sortie qui est obtenue. Dans un système réel, la sortie n’est en général plus une impulsion, mais un signal décroissant proportionnellement à la durée de réverbération de la pièce. La réponse impulsionnelle permet la représentation d’un système en fonction de son entrée et de sa sortie uniquement.

Sonomètre : Appareil destiné à la mesure des niveaux de pression acoustique, pondérée ou non, dans le domaine des fréquences audibles, suivant des applications déterminées. (Norme NF S30-101. Septembre 1973. Vocabulaire de l’acoustique)

Subwoofer : caisson de graves ou caisson de basses sont des termes désignant les enceintes chargées de reproduire les fréquences inférieures à 80 Hz.

Sweep : signal audio qui balaye toutes les fréquences audibles entre 20 Hz to 20 kHz en dans un espace de temps donné. Lorsque l’échelle est logarithmique, émettre un sweep entre 20 Hz et 40 Hz (une octave) ou entre 10kHz et 20kHz prend la même durée. Dans le cas d’une échelle linéaire, l’octave 20/40Hz sera beaucoup plus rapide et égalisera la durée entre 10 kHz to 10.02 kHz.

B. Les pièges à éviter lors de la mesure de l’isolement

Attention Piège !

Le bruit particulier, c’est le niveau mesuré chez le voisin lorsque la boite de nuit est en activité. Il comprend donc le bruit que fait la musique chez le voisin ET le bruit résiduel habituel. Comme la mesure est effectuée en niveau énergétique équivalent, si le bruit de la musique chez le voisin est aussi fort que le bruit résiduel, alors les signaux se somment a +3 dB. Ainsi on mesure 3 dB d’émergence et non 0 dB. La règlementation vise justement à avoir un niveau de bruit de fond au même niveau que celui généré par la musique, ce qui donne 3dB d’émergence.

Par conséquent, il faut faire très attention lorsque l’on calcule l’isolement (atténuation du son du fait des murs). En pratique, deux cas se présentent :
- Emergence > 10 dB
  Isolement ≈ Musique – Bruit Particulier
- Emergence < 10 dB
  Il faut soustraire la compensation issu de l’addition en niveau énergétique du bruit résiduel avec le bruit de la musique chez le voisin :
  Isolement = Musique – Bruit Particulier + Correction
Nous avons calculé sous Excel à partir de quelles valeurs le bruit résiduel devient négligeable en relatif au bruit particulier. Puis dans un deuxième temps, quelles sont les valeurs des compensations à appliquer dans le cas contraire.

Soit « Bruit Sono » la variable définissant le niveau de bruit généré par la musique de la boîte de nuit chez le voisin sans bruit de fond. On calcule le bruit particulier et la correction à appliquer pour un écart croissant entre BR et Bruit Sono²⁴.

Figure 59 : calcul du bruit particulier et de la correction à appliquer pour un écart croissant entre BR et Bruit Sono

On voit qu’à partir d’une émergence de 10 dB, la correction devient négligeable. Donc si BR est 10 dB moins fort que le bruit de la sono, alors Isolement ≈ Musique – Bruit Particulier

Dans la plupart des situations pratiques, l’isolement permet de calculer le niveau maximum d’émission pour un établissement. La procédure consiste à :
- mesurer le bruit de fond chez le voisin la nuit.
- De manière à éviter toute nuisance sonore, on mesure le bruit particulier en journée.
  
  On émet un bruit rose dans la salle de concert
  
  Emergence > 10 dB
  
  Isolement = Musique – Bruit particulier
  
  3 dB < Emergence < 10 dB et BR stable
  
  Isolement = Musique – Bruit particulier + Correction
  
  Si Emergence < 3dB ou que le bruit de fond est instable
  
  On fait des statistiques avec différents bruits musicaux à différentes périodes
  
  Dans le cas ou la mesure est trop perturbée, on utilise un sweep (plus complexe d’interprétation mais permet de gagner jusqu’à 30dB sur un bruit rose)
- Ainsi Niveau_Max = BDF + Isolement car quand les deux niveaux sont équivalents on a bien 3dB d’émergence.
Exemples concrets :
- Cas où le bruit résiduel n’est pas négligeable devant le Bruit Sono
On mesure : 90 dB en salle, 30 dB de BR, 32 dB de bruit particulier. Le bruit résiduel est stable.

Le Bruit particulier est 2 dB plus fort que le Bruit Résiduel, ainsi la correction est de 2,33 dB il y a donc un Bruit de Sono égal à 30 – 2,33 = 27,67 dB Donc l’isolement vaut = 90 – 27,67 = 62,33 dB

Figure 60 : Calcul du Bruit Sono pour un écart croissant entre le Bruit Particulier et le BR
- Cas où le bruit résiduel est négligeable
  99dB dans la salle, 45dB de bruit particulier et 20 dB de bruit résiduel. Le bruit particulier est 25 dB au dessus du bruit résiduel, ainsi il est négligeable (cf. 1e tableau).
Donc Isolement = Musique – Bruit Particulier = 99 – 45 = 54 dB

Par exemple, si le Bruit Particulier mesuré est 4 dB plus fort que le Bruit Résiduel, alors le Bruit sono sera 1.80 dB plus fort que le bruit résiduel.

En dessous de 0.5 on estime que la correction est négligeable. Ce qui correspond bien aux 10 dB que l’on a trouvé précédemment.

Utilisations de l’isolement et de l’émergence

En pratique, l’isolement est utilisé pour les études d’impact de nuisance sonore Par exemple pour calculer les niveaux limites applicables la nuit car il permet de mesurer de jour l’isolement et de mesurer le bruit de fond de nuit. Exemple d’une mesure, pour une boîte de nuit, quel est le niveau maximum applicable la nuit ?
Par exemple si l’on calcule un isolement de 30 dB d’atténuation et que l’on a un bruit de fond mesuré la nuit de 40 dB. Le niveau limite à l’émission sera de 40+30 = 70 dB avec 3 dB d’émergence (deux signaux : arrivée + BDF qui s’additionnent se somment à 3 dB)

C’est l’émergence qui est explicitement formulée dans la règlementation, car c’est elle qui reflète et caractérise la gêne occasionnée. Dans les textes de loi que l’on décrit plus précisément ci-dessous, elle est limitée à 3 dB par bande de fréquence et 3 dB A. Cette valeur est déjà très importante ! En effet, prenons un kick qui joue à chaque seconde pendant une durée 100 ms. Un niveau énergétique équivalent se calcule sur une seconde. Comme une seconde contient 10 fois 100 ms, on a donc dix fois plus d’énergie sur 100ms que sur 1s. Par conséquent on a 10 dB de gain en niveau crête en plus des 3dB d’émergence. Ainsi on obtient 13 dB Crête de Kick !

C. Décrets

D. Documents techniques enceintes

E. Limiteur

Limiteur standard AMIX SNA70-3

Figure 61 : limiteur SNA 70 AMIX

Figure 62 : mis en place à La Grande Halle de la Villette

Remerciements

Je tiens à remercier chaleureusement David Rousseau pour son aide dans mon travail de recherche. J’ai beaucoup appris à ses côtés aussi bien en termes de connaissances techniques qu’en méthodologie scientifique.

Merci infiniment à Laurent Burrus pour sa disponibilité et les moyens mis en œuvre pour la réalisation de la partie pratique du mémoire.

Je remercie toute l’équipe de la grande Halle et particulièrement Benoît Weber.

Merci à Igor Prade, Florent Fourmy pour leur participation lors des mesures et leurs conseils. Le CIDB pour l’accès à son espace documentaire extrêmement complet.
Je remercie tous les ingénieurs du son et directeurs techniques qui ont donné de leur temps pour mon mémoire.
Pour finir, je remercie mes proches pour leurs relectures, leurs conseils et leur soutien.

Notes
1. On utilise le terme « subwoofer » dans le milieu professionnel pour caisson de basse. Nous emploierons ce terme tout le long du mémoire ↩︎
2. David Bowie, 1972 ↩︎
3. SNR : Signal Noise Ratio : Rapport signal sur bruit ↩︎
4. Interview d’un inspecteur de salubrité, intervenant formateur auprès du CIDB sur la thématique «nuisance sonore » ↩︎
5. Article 5 du décret 98-1143 ↩︎
6. Interview d’un inspecteur de salubrité, intervenant formateur auprès du CIDB sur la thématique «nuisance sonore » ↩︎
7. SB28 : subwoofer L-Acoustics. Documents techniques en annexe ↩︎
8. Ce graphique est expliqué plus précisément par la suite. ↩︎
9. Nous avons appelé notre logiciel de simulation Schouf qui signifie « regarde » en arabe. ↩︎
10. Définition précise dans le glossaire ↩︎
11. Volume de charge = volume interne de l’enceinte ↩︎
12. Pile de subs ↩︎
13. La directivité est liée à l’assemblage mais vous trouverez les fiches techniques des K1 Sub, VDOSC et SB28 en annexe ↩︎
14. Point FOH (Front Of House) : point localisant la console de mixage dans la pièce ↩︎
15. Ensemble des enceintes constituant la façade ↩︎
16. AUFFRET, M., Rapport « Préventions des traumatismes sonores des musiques électro-amplifiées», CNRS, février 1998. ↩︎
17. DESCHAUX, R., Cours d’Acoustique du Bâtiment, Repéré à http://www.ac-grenoble.fr/lycee/roger.deschaux/documents/Cours/Acoustique/Acoustique-Cours_1.pdf ↩︎
18. Limiteur en annexe ↩︎
19. Renfort de sonorisation de faible puissance pour les auditeurs placés juste devant et dans l axe de la scène ↩︎
20. Nous n’avons pu avoir une information précise sur la date d’applicabilité de la nouvelle norme au moment de la rédaction car elle n’a pour le moment pas encore été visée dans les textes règlementaires. ↩︎
21. Rousseau D., Gestion des graves vers l’environnement, JAES, 28/10/2010 ↩︎
22. Différence entre le niveau en dBA et en dBC ↩︎
23. Plusieurs enceintes espacées ou non sur lesquelles on applique des retards créant virtuellement un arc. Retarder les enceintes extérieures permet de réduire le lobe présent au centre du système et d’augmenter la cohérence aux extrémités du système. ↩︎
24. BP = 10 * log10 (10^ (Bruit Sono/10) + 10^ (BR/10)) et Correction Isolement = BP – BR ↩︎
juin 3, 2026

Perception subaquatique : adaptation de l’écoute stéréophonique en petit bassin

CONSERVATOIRE NATIONAL SUPÉRIEUR DE MUSIQUE ET DE DANSE DE PARIS, FORMATION SUPÉRIEURE AUX MÉTIERS DU SON, MÉMOIRE DE FIN D’ÉTUDES

Photographie de couverture: ***Résonance d’une goutte d’eau à 30,5 HZ***, ***Alexander Lauterwasser***

Présenté par: Soutenu en: ETIENNE OURY, Juin 2008

Dirigé par: CORSIN VOGEL

0. Introduction

L’eau recouvre 70% de notre planète, et elle est habitée par une multitude de sons. Dans ce milieu, la lumière se propage très mal et la vue ne tient qu’une place minime. C’est donc l’ouïe qui est le sens le plus développé chez les habitants des mers. Les mammifères marins sont là pour nous le rappeler : une baleine entend dans la bande de fréquence 10 Hz – 200 kHz, et elle est capable d’entendre un chant d’une de ses voisines à des dizaines de kilomètres à la ronde. Notons au passage que sur 2000 chants de baleines enregistrés dans le golfe du Saint- Laurent en 2005, seulement 2 étaient simultanés… Comme quoi les baleines sont des êtres civilisés qui ne se coupent jamais la parole.

Partant du constat que la musique est pour beaucoup de personnes un moment de relaxation et de détente, et que les supports d’enregistrement actuels nécessitent que l’auditeur soit placé à un point d’écoute précis (le sweet spot), écouter de la musique sous l’eau peut s’avérer une expérience très intéressante. Si l’on restreint l’étude à une utilisation domestique, c’est-à-dire un volume de petite taille (une piscine privée, ou même une baignoire), nous avons là une situation qui réunit les points suivants : temps libre, détente, point d’écoute (dans une baignoire)… et bien sûr immersion.

L’intérêt de cette démarche est avant tout de voir s’il est possible d’optimiser l’écoute de musique enregistrée en stéréo (format d’écoute le plus utilisé) et d’apprécier le rendu musical de différents styles de musique. Cela permettrait de répondre à la question suivante: est-il possible d’apprécier sous l’eau un enregistrement prévu pour une écoute aérienne, ou faut-il repenser la musique autrement, en termes de composition mais aussi de mixage.

Les études sur ce sujet sont peu nombreuses, et il n’existe pratiquement pas d’études alliant les aspects physiques, perceptifs et musicaux du sujet. Les études psychoacoustiques sont réalisées en champ libre pour des applications en pleine mer. Il est donc très difficile de prévoir comment va se comporter un bassin. De plus, ces études utilisent essentiellement des stimuli simples (fréquences sinusoïdales pures, bruit blanc), et ne permettent pas de tirer des conclusions quant à la restitution des timbres. Enfin, certaines études montrent qu’il est possible de localiser sous l’eau (Savel, 2001; Bernaschina, 2003), alors que certaines personnes qui sont habituées à écouter de la musique sous l’eau soutiennent que l’on perçoit de la monophonie (discussions lors du Salon de la Piscine et du Spa, nov. 2007). Ce mémoire va donc tenter d’apporter des éléments de réponse à ces questions en abordant l’écoute subaquatique d’un point de vue scientifique et acoustique, mais aussi psychoacoustique et musical.

1. État de l’art

1.1. Historique

Le milieu aquatique est très propice à la propagation d’ondes sonores. Les humains se sont d’ailleurs intéressés au son dans l’eau depuis longtemps. Aristote et Pline le Jeune se demandaient déjà si les poissons entendaient. Dans la Chine antique, les pêcheurs localisaient les bancs de poissons en écoutant le bruit de la mer à l’aide d’une tige de bambou dont l’une des deux extrémités plongeait dans l’eau, pratique qui existe encore dans certaines tribus de Malaisie. Léonard de Vinci avait aussi remarqué que « si l’on se place sur son bateau immobile et si l’on place le bout d’un long tube dans l’eau et l’autre extrémité sur son oreille, on entendra les bateaux éloignés ».

Les premières études scientifiques ont été menées en 1810 dans le port de Marseille par le physicien français François- Sulpice Beudant qui arrive à déterminer la valeur de propagation de 1500 m/s à l’aide d’une cloche et d’un stéthoscope. En 1826, sur le Lac Léman, Jean- Daniel Colladon réalise les premières grandes expériences sur la propagation acoustique.

Fig.1: Jean-Daniel Colladon sur le Lac de Genève (d'après J.C. Cailliez) — Fig.1: Jean-Daniel Colladon sur le Lac de Genève *(d’après J.C. Cailliez)*

En 1869, Jules Verne écrira:

« Les moindres Bruits se transmettaient avec une vitesse à laquelle l’oreille n’est pas habituée sur terre. En effet, l’eau est pour le son un meilleur véhicule que l’air, et il s’y propage avec une rapidité quadruple. (…)Des bruits profonds, nettement transmis par ce milieu liquide, se répercutaient avec une majestueuse ampleur. »

Jules Verne,

Vingt Mille Lieues Sous Les Mers

Les premières applications de l’acoustique sous- marine sont envisagées à la fin du XIXᵉ siècle afin de guider les navires transatlantiques aux abords des côtes américaines à l’aide d’émetteurs sonores. Par la suite, la construction des sous-marins fait apparaître un nouveau besoin : repérer les sous- marins en plongée. Le premier sonar est inventé en 1915 par Paul Langevin, et les sonars américains causeront la perte des sous- marins allemands en 1943.

1.2 Recherches scientifiques actuelles

Depuis ce temps, la recherche en acoustique sous- marine est essentiellement restreinte à l’étude des fonds marins et à des applications militaires : détection de sous- marins et de mines.

Les premières études psychoacoustiques sont menées dans les années cinquante, en marge néanmoins des études pour le milieu aérien. Des sous- mariniers appelés « Oreilles d’Or » se sont spécialisés dans la reconnaissance des sons subaquatiques. Il s’agit dans un premier temps de retranscription dans le domaine aérien de sons subaquatiques. Ensuite, des études sur la perception subaquatique montrent assez vite que les mécanismes de l’oreille sont altérés (Sivian, 1947).

Enfin, de nos jours, les recherches ont lieu avant tout au sein de l’armée américaine, mais aussi au LMA (Laboratoire de Mécanique et d’Acoustique) de Marseille, et au laboratoire IFREMER (Institut Français de Recherche pour l’Eploitation de la MER) à Brest. Sophie Savel a présenté une thèse en 2001 sur la localisation auditive subaquatique avec pour objectif d’améliorer l’orientation des plongeurs à l’aide de balises sonores, et François Bernaschina a présenté un travail sur le même sujet en 2003 à Genève.

1.3 La musique subaquatique

Les études scientifiques sont toujours menées avec des signaux sinusoïdaux, quelquefois des bruits blancs, mais guère plus. Si l’on cherche à obtenir des informations sur le rendu musical sous l’eau, c’est vers les compositeurs qu’il faut se tourner. Michel Rédolfi (« La Citta Liquida », Venise 2006, ou « Oniris- The Dream Tank », Nuit Blanche, Paris 2006) donne des explications très intéressantes sur la perception subaquatique car elles sont exprimées d’un point de vue musical et artistique. Il explique notamment que les timbres subaquatiques sont perçus comme médium/aigus (500- 5000 Hz) ce qui leur confère une fragilité cristalline. La perception est monophonique, à l’intérieur du crâne. Il explique qu’il existe un masquage temporel de 50 ms qui masque les premières réflexions et donnent l’impression de champ direct permanent. Selon lui, le milieu aquatique se prête à une musique éthérée, et nécessite qu’elle soit pensée différemment et composée spécialement pour le milieu aquatique.

Noêl Canivenq, fondateur de la société Aquamusique, avance l’hypothèse du « massage intra », soit « la conjonction de deux écoutes: l’une, traditionnelle, amplifiée via l’oreille, et l’autre, corporelle, et non-décodée par l’oreille mais ressentie par le corps sous forme d’une vibration ayant pour origine une tension alternative modulée ».

2. Cadre théorique

Certaines données scientifiques ont été vérifiées à partir des expériences menées dans ce mémoire. Elles seront exposées dans la partie 4.7. Il n’est traité ici que des recherches effectuées a priori.

2.1 Éléments d’acoustique sous-marine

2.1.1 Caractéristiques du milieu

2.1.1.1. Masse Volumique

L’eau a pour masse volumique:

p_eau =1000 kg/mx

Celle-ci ne varie quasiment pas en fonction de la température, du moins dans la gamme 20°C – 40°C qui nous intéresse (température classique de « baignade »). Le cas de l’eau salée peut être mentionné car il existe de plus en plus de piscines salées. La masse volumique de l’eau salée est p_mer =1030 kg/mx

2.1.1.2. Célérité

La vitesse de propagation de l’onde est imposée par les caractéristiques du milieu. L’eau étant un fluide incompressible, la célérité c dépend de la masse volumique p et du module d’élasticité E de ce milieu. Elle est donnée par la relation :

Avec E=2,25.10⁹ Pa , ce qui donne:

c=1500 m.s^—¹

La vitesse de propagation augmente avec la salinité de l’eau et avec sa température (+3 m.s^—1 par degré).

2.1.1.3. Impédance acoustique

Nous pouvons ensuite obtenir l’impédance acoustique caractéristique de l’eau :

Z _eau=p_eau c=1,5. 10⁶ Pa.s.m^—1

Cette impédance est beaucoup plus élevée que celle de l’air. L’impédance de l’air est Z _air =360 Pa.s.m^—1 à 20°C (soit un rapport de 3 500). Comme l’eau est un fluide incompressible, sa densité se rapproche plus des matériaux solides, et aussi de la densité du corps humain. Les impédances sont proches et cela va entraîner des changements dans la transmission des ondes d’un milieu à l’autre. Dans l’eau, les ondes sonores traversent le corps humain et celui-ci est perçu comme transparent par l’onde.

2.1.1.4. Facteur d’amortissement

Voici un tableau du facteur d’amortissement a en fonction de la fréquence:

f (kHz)	0,1	0,3	1	3	10	30	100	300	1000
a (dB/km)	0,001	0,01	0,07	0,1	1	5	30	100	500

Dans le spectre audible on remarque que les pertes sont minimes en fonction de la distance parcourue. L’atténuation sera donc entièrement due aux pertes par divergence (cf § suivant) et aux pertes par transmission au niveau des parois.

2.1.2 Les ondes élastiques de compression

Les ondes acoustiques dans les liquides et les gaz obéissent aux mêmes lois de la mécanique des fluides. Comme pour le milieu aérien, on peut donc partir de l’équation de d’Alembert pour déterminer la pression acoustique p :

Pour une propagation dans une seule direction, l’équation devient :

et admet comme solution :

avec f ₀, la fréquence de l’onde sinusoïdale.

Lorsque l’on considère la propagation selon les trois directions de l’espace supposé isotrope, on montre que la solution est une onde sphérique d’équation :

avec une décroissance en 1/r de l’amplitude de l’onde, soit -6 dB par doublement de distance.

L’intensité acoustique I à une distance R du point d’émission est donnée par la relation:

L’intensité acoustique est une grandeur homogène au carré de la pression acoustique. Elle décroit donc en 1/r² soit -3 dB par doublement de distance.

2.1.3 Échelle de mesure et pression de référence

L’unité de mesure utilisée sera toujours le décibel, et l’abréviation « log » signifie logarithme de base 10. Lorsque l’on souhaite parler d’un niveau absolu de pression, il est nécessaire d’avoir une pression de référence. Sous l’eau, celle- ci n’est pas 20 µPa comme dans l’air (seuil d’audition à 1 kHz) mais de 1µPa, soit 26 dB de plus que pour l’air.

p_ref=1.10^—6 Pa

On ne parle donc plus de dB SPL (Sound Pressure Level), mais de dB SL (Sound Level), à ne pas confondre avec le dB SL (Sensation Level) utilisé en psychoacoustique.

2.2 Perception auditive en milieu aérien

Cette partie a pour objectif d’expliquer brièvement le fonctionnement de l’oreille, ainsi que les facteurs de localisation. En effet, si les mécanismes des différentes parties des oreilles jouent un rôle dans la perception aérienne classique, ce n’est plus vraiment le cas sous l’eau.

2.2.1 Fonctionnement de l’oreille humaine

Fig.2: Schéma de l'oreille (d'après D. Pickard) — Fig.2: Schéma de l’oreille *(d’après D. Pickard)*

2.2.1.1. L’oreille externe

L’oreille externe est composée du pavillon (pinna) et du conduit auditif externe.

Elle joue un rôle d’amplification pour certaines bandes de fréquences :

La forme du pavillon permet d’amplifier un signal sonore de 10 à 15 dB vers 5 kHz.
Le conduit auditif externe amplifie le signal de 15 à 20 dB vers 2 kHz.

2.2.1.2. L’oreille moyenne

L’oreille moyenne va du tympan à la fenêtre ovale en passant par les osselets qui sont au nombre de trois: le marteau, l’enclume et l’étrier. Elle comprend aussi la trompe d’Eustache, qui permet de rétablir la même pression de part et d’autre du tympan grâce à sa communication avec le pharynx.

La chaîne des osselets est solidaire du tympan. La transmission est donc solidienne et elle joue le rôle d’adaptation d’impédance. Le rapport des surfaces entre le tympan et l’étrier est de 20 pour 1. Si l’on ajoute un effet de levier engendré par les osselets, la pression se retrouve multipliée par 26, soit une hausse de 30 dB environ. Cela nous donne la fonction de transfert suivante:

Fig.3: Fonction de transfert de l'oreille moyenne (Nedzelnitsky 1980) — Fig.3: Fonction de transfert de l’oreille moyenne *(Nedzelnitsky 1980)*

2.2.1.3 L’oreille interne

L’organe principal de l’oreille interne est la cochlée. C’est là qu’opère la transduction mécanique/électrique. Elle joue le rôle d’analyseur de spectre grâce à la membrane basilaire. Les fréquences s’étalent des aigus aux graves sur cette membrane à rigidité décroissante en forme d’escargot. Elles sont transmises à des cellules ciliées situées dans l’organe de Corti. Les influx nerveux sont ensuite envoyés au cerveau et sont traités dans le système auditif central.

Fig 4: Cochlée
(d'après R. Pujol) — Fig 4: Cochlée
*(d’après R. Pujol)*

Fig.5: Membrane basilaire
(d'après S. Blatrix) — Fig.5: Membrane basilaire
*(d’après S. Blatrix)*

2.2.2 Écoute binaurale

2.2.2.1 Définition

L’écoute binaurale est la capacité de percevoir un stimulus sonore dans les deux oreilles. La localisation se fait par différence interaurale d’intensité (DII), et de temps ou de phase (DIT).

2.2.2.2 Différences interaurales de temps

Les différences interaurales dites de temps correspondent à une différence de temps d’arrivée, ce qui équivaut à une différence de phase. On trouvera donc dans la littérature les deux termes pour désigner les DIT.

La différence de temps d’arrivée peut être calculée pour une source provenant de l’infini (approximation valable pour une distance grande par rapport aux dimensions de la tête) de façon suivante:

Fig.6: Calcul des DIT, modélisation de Woodworth

Dans la modélisation de Woodworth, la tête est modélisée par une sphère. La différence de temps d’arrivée de l’onde aux deux oreilles est :

Δ t= Δ d / c= r (α+sin α) / c

La différence de phase permet de localiser si la longueur d’onde de l’onde incidente est grande devant la différence de marche Δ d, c’est-à-dire pour les basses fréquences (jusqu’à 1,5 khz).

2.2.2.3 Différences interaurales d’intensité

Les différences d’intensité (DII) se produisent car les ondes sonores sont partiellement diffractées par la tête, de telle sorte que le signal atteignant l’oreille opposée à la source est atténuée. Ces différences sont donc propres à chaque individu,

et on peut les mesurer en réalisant une fonction de transfert de l’oreille, appelée HRTF (Head- Related Tansfer Function).

Fig.7: Evolution de la différence d'intensité en fonction de la position de la source sonore aux fréquences 200 Hz, 1 kHz, 4 kHz et 6 kHz
(d'après Fedderson, Sandel, Teas et Jeffress) — Fig.7: Evolution de la différence d’intensité en fonction de la position de la source sonore aux fréquences 200 Hz, 1 kHz, 4 kHz et 6 kHz
*(d’après Fedderson, Sandel, Teas et Jeffress)*

Les aigus étant plus diffractés par la tête, les DII permettent donc de localiser plutôt les hautes fréquences à partir de 1,5 kHz. On peut ainsi définir des domaines fréquentiels de localisation qui privilégient l’une ou l’autre méthode:

DIT∈1,5kHz∈DII

2.2.2.4 Localisation dans le plan azimutal

Dans le cas d’une écoute stéréophonique, quel que soit l’espacement des enceintes, celles- ci se trouvent dans le plan azimutal. Voici quelques expériences psychoacoustiques concernant la localisation dans le plan azimutal.

En 1796, Venturi met en évidence des confusions avant/arrière. En 1877, Ralegh note des confusions entre positions symétriques par rapport à l’axe des oreilles : cela crée des cônes de confusion dont l’axe de symétrie est celui des oreilles.

Le MAA (Minimal Audible Angle) a été étudié par Mills à partir de 1958 : il caractérise le pouvoir séparateur du système auditif dans le plan azimutal.

Fig.8: MAA pour des son purs à 0°, 30°, 60° et 75° (Mills, 1972) — Fig.8: MAA pour des son purs à 0°, 30°, 60° et 75° *(Mills, 1972)*

L’oreille arrive à séparer des sons purs dans le plan azimutal espacés de 1 à 3 degrés pour une source frontale, et les performances se dégradent vers l’axe des oreilles (cône de confusion). Les performances se dégradent aussi vers 2 kHz (le son est toujours perçu à l’avant) et vers 8 kHz (le son est perçu en haut).

2.2.3 Indices monauraux

Les cavités pavillonnaires de l’oreille externe créent des réflexions et des résonances. Cela induit une amplification de certaines fréquences (cf § 2.2.1.1.).

La géométrie des pavillons implique également des réflexions du signal incident : une partie de ce signal est réfléchie vers le conduit auditif avec un certain retard. De ce fait, l’addition du signal primaire et de ces réflexions constitue un indice supplémentaire de localisation qui permet notamment de résoudre des ambiguïtés avant/arrière.

2.3 Perception auditive en milieu subaquatique

Sous l’eau, le mode de conduction des ondes sonores est totalement différent du milieu aérien ; cela va entraîner notamment des pertes de sensibilité (au sens des décibels), et des changements dans les mécanismes de localisation.

2.3.1 Mode de conduction

La forte impédance de l’eau (Z_eau =1,5. 10⁶ Pa.s.m^—1 ) est responsable de la perte des mécanismes de l’oreille externe et de l’oreille moyenne. L’énergie est alors transmise à l’oreille interne par conduction osseuse de la boîte crânienne.

2.3.1.1 Détérioration des mécanismes de l’oreille

À partir du milieu du XXᵉ siècle, des travaux montrent l’inactivité des mécanismes de l’oreille (Sivian, 1947, Hamilton, 1957). Trois raisons sont avancées:

Z_eau=Z_pavillon : les pavillons ne jouent plus leur rôle d’amplificateur.
Le canal auditif se trouve rempli d’un liquide ayant une vitesse de propagation importante. Cela provoquerait un raccourcissement du canal, et donc un abaissement des ∆t.
L’onde qui arrive aux osselets n’est plus correctement transformée. Hollien (1973) explique cela de la façon suivante: dans l’air, le son se propage sous forme haute amplitude/faible force (Af), alors qu’en milieu liquide, c’est une propagation faible amplitude/haute force (aF). L’oreille moyenne ope$re dans l’air en convertissant la force du signal pour que celui- ci soit proche des propriétés du liquide cochléaire. Ainsi, les adaptations d’impe#dance implique#es dans l’audition ae#rienne sont du type Af-aF. Mais si l’oreille est immerge#e, les transformations subies sont de type aF-Af-aF, a$ cause de la présence d’eau dans le canal en amont des osselets. L’oreille moyenne aurait une fonction de réduction d’énergie dans l’air qui ne pourrait pas être maintenu dans l’eau…

On pourrait aussi penser que c’est la transition eau/air (bulle d’air dans l’oreille) qui ne s’opèrerait pas, mais il se trouve qu’on entend aussi bien avec de l’eau jusqu’au tympan (Hollien & Brandt, 1969). L’expérience a aussi été menée lors de ce mémoire et elle invalide l’hypothèse de la transition eau/air.

2.3.1.2 Conduction osseuse et conduction du crâne

Notre squelette, et particulièrement notre crâne, rentrent en résonance aussi bien dans l’air que dans l’eau. L’énergie est transmise à l’oreille interne via l’os temporal (os pair du crâne situé au niveau de la tempe). Les basses fréquences notamment sont ressenties physiquement à fort niveau en aérien. Seulement, dans l’eau, les seuils de perception de l’oreille sont 30 à 50 dB plus élevés que les seuils de perception « crâniens », ce qui fait que la perception par conduction osseuse prend le dessus dans notre perception.

2.3.1.3 Conséquences sur la sensibilité auditive

Les seuils de sensibilité subaquatiques sont donc de 30 à 50 dB supérieurs aux seuils aériens. La perte de l’amplification par le pavillon et le conduit auditif mettent donc la perception « crânienne » au même niveau que la perception par les oreilles (cf expériences oreilles bouchées/débouchées § 4.6.4). Ces seuils montent encore lorsque le crâne est recouvert d’une capuche, et ils augmentent aussi en fonction de la profondeur.

Le seuil de la douleur sous l’eau est d’environ 160 dB, mais il faut être prudent en pratique car on ne sait pas à quel point des vibrations puissantes (de basses fréquences notamment) peuvent avoir un impact sur le crâne.

2.3.2 Mécanismes de localisation

Les rares études consacrées à la localisation auditive subaquatique ont abordée le sujet à partir d’une estimation théorique de la taille des indices spatiaux, en prenant en compte la célérité et l’impédance de l’eau. D’après cette estimation, les propriétés acoustiques de l’eau causent une telle dégradation des indices de localisation que les auditeurs immergés devraient être incapables de localiser des sources.

Néanmoins, des études récentes ont montré que des plongeurs arrivaient à localiser de façon convenable et bien supérieure au hasard (S. Savel, 2001; F. Bernaschina, 2003), ce qui permet d’aborder les tests à venir avec un certain optimisme.

2.3.2.1 Différences interaurales de temps

La célérité dans l’eau étant de 1500 mètres par seconde, les différences interaurales de temps (DIT) sont divisées par 4,5. Il faut rajouter à cela le fait que la distance à prendre en compte n’est plus la distance interaurale (environ 18 cm) mais la distance inter- cochléaire (10 cm) et qu’il n’y a plus de contournement du crâne puisque les ondes traversent le cerveau, soit un rapport 9 entre les DIT aériennes et subaquatiques.

Pour une onde arrivant avec une incidence θ par rapport à l’axe de la tête, la différence inter- cochléaire de temps est donc donnée par:

Voici une courbe qui compare le modèle aérien et le modèle subaquatique:

Fig.9: Comparaison des DIT aériennes et subaquatiques (Savel, 2001) — Fig.9: Comparaison des DIT aériennes et subaquatiques *(Savel, 2001)*

Les DIT subaquatiques sont largement inférieures aux DIT aériennes. On retrouve le rapport 9 entre les mesures sous l’eau et hors de l’eau pour un même azimut.

2.3.2.2 Différences interaurales d’intensité

La tête étant « transparente » sous l’eau, il ne peut théoriquement pas y avoir de différence interaurale d’intensité. Cela supposerait, si l’on prend en compte uniquement la perception « crânienne », qu’on localiserait uniquement grâce aux DIT, c’est-à-dire que les basses fréquences seraient localisables, mais pas les aigus. Mais on ne peut pas affirmer que la perception par les oreilles ne fonctionne plus. Si les oreilles jouent encore un rôle, il se peut que les DII existent encore.

2.3.2.3 Localisation dans le plan azimutal

Une des hypothèses serait que les DIT sont perçues comme dans le milieu aérien et qu’un angle réel serait diminué d’un rapport 5 à 10. Ce qui veut dire qu’une base stéréophonique classique de 60° serait ramenée à 10° environ. Il faudrait donc se mettre quasiment entre les enceintes pour pouvoir localiser sous l’eau.

Fig.10: Angle subaquatique de 120° perçu comme un angle de 20° en aérien

Quoi- qu’il en soit, Fenstein a montré que l’angle minimum audible (MAA) subaquatique était en moyenne de 15° dans l’axe frontal pour des sons sinusoïdaux, et que les performances pouvaient augmenter et atteindre 10° pour des sons complexes et des sinus basse fréquence (Feinstein, 1973)

Sophie Savel a réalisé des tests en 2001 sur la localisation dans le plan azimutal (Savel, 2001). Les plongeurs étaient assis dans une nacelle à 3 mètres de profondeur en Mer Méditerrannée et ils étaient entourés de 8 haut- parleurs répartis régulièrement sur le plan azimutal (0°, 45°, 90°, 135°, 180°, -45°, -90°, -135°). Elle a notamment déduit de ses expériences que les oreilles contribuaient à améliorer la localisation, même si elles n’amplifiaient pas les signaux. L’oreille joue donc encore un rôle dans la perception. Il est donc recommandé de faire des expériences avec les oreilles dégagées. De plus, des mouvements de tête augmentaient de manière significative le pourcentage de bonnes réponses et levaient l’ambiguïté avant/arrière.

2.4 Écoute musicale en petit bassin, contribution acoustique du bassin

2.4.1 État de la recherche

La recherche concernant l’audition dans un bassin rempli d’eau est inexistante, et il est très difficile de prévoir a priori comment va se comporter un tel bassin. Les recherches psychoacoustiques ne portant que sur des expériences en champ libre, à notre connaissance, aucune recherche rendue publique n’a été menée à ce jour sur le sujet.

Les commentaires susceptibles de pouvoir nous aider sont ceux des personnes qui pratiquent régulièrement des écoutes subaquatiques. Le compositeur Michel Redolfi explique que pour lui, les premières réflexions sont masquées car elles nous reviennent avant 50 ms (effet Haas), et que cela donne une impression de champ direct. Les mélomanes subaquatiques parlent de son précis et intracrânien, ce qui correspond plutôt à une acoustique sèche.

2.4.2 Éléments d’acoustique des salles

Voici quelques formules fondamentales d’acoustique des salles. Le tableau suivant donne deux résultats selon l’approche de Sabine ou d’Eyring.

(a : coefficient d’absorption, S : surface, St : surface totale, V : volume)

2.4.3 Adaptation au milieu subaquatique

En suivant la même démarche qu’en aérien, il est possible de déterminer par l’expérience des coefficients d’absorption pour les parois du bassin. En tenant compte de la nouvelle célérité, la formule d’Eyring deviendrait:

et ce, seulement au-dessus de la fréquence de Schroeder qui augmenterait. C’est donc une démarche hasardeuse.

Une certitude, cependant est que l’échange à la surface est quasiment nul car l’impédance de l’eau est beaucoup plus élevée que celle de l’air. Toutes les ondes sont donc réfléchies à la surface (facteur de transmission : 0,005). Il existe donc une quantité non négligeable de premières réflexions dans un bassin. De plus, une musique diffusée sous l’eau n’est presque pas audible de l’extérieur, et cela peut être intéressant car un milieu isolé est alors créé.

Lors d’une écoute réalisée dans le SPA musical proposé par Aqua Musique en novembre 2007, j’ai pu constater la présence de nombreux modes propres. Ils peuvent être dus aux dimensions restreintes du SPA, mais aussi à des phénomènes plus complexes de vibration mécanique du fait de l’incompressibilité de l’eau.

Il semble donc prudent d’attendre les commentaires des tests avant d’avancer des théories sur le champ acoustique sous l’eau.

3. Problématique et cadre expérimental

Cette partie traite de la méthodologie qui a conduit à l’élaboration des tests à partir de la problématique du mémoire, et des aspects pratiques nécessaires au bon déroulement de ces tests.

3.1 Problématique

3.1.1 Écoute musicale en bassin

La problématique principale de ce mémoire, comme elle a été mentionnée dans l’introduction, est de travailler sur une écoute la plus représentative possible d’une écoute domestique : piscine privée ou baignoire. C’est seulement dans le cadre d’une écoute confortable avec un auditeur plutôt statique qu’une écoute musicale peut être étudiée et optimisée. Dans l’optique d’expériences avec un nombre suffisant de sujets, le lieu idéal est un petit bassin de piscine municipale (6 mètres par 12 généralement).

3.1.2 Écoute stéréophonique

Même s’il s’agit avant tout de faire une étude sur la perception subaquatique au sens large, à commencer par des questions concernant le ressenti physique et la restitution musicale, la question de la localisation est majeure. Il existe à l’heure actuelle une véritable contradiction entre les études scientifiques qui affirment qu’il est possible de localiser sous l’eau et les personnes qui ont l’habitude d’écouter sous l’eau et qui soutiennent que l’écoute est monophonique. Il semblait donc intéressant de faire quelques expériences sur ce sujet.

Pour le format de diffusion, la stéréo a été choisie pour plusieurs raisons. Tout d’abord, il est très difficile de placer un système multicanal dans une piscine. De plus, les résultats positifs n’étant même pas garantis pour une simple écoute stéréophonique, il serait hasardeux de s’attaquer au multicanal. Enfin, c’est le format le plus employé et qui offre le plus large choix d’enregistrements à diffuser.

3.1.3 Sur une comparaison avec l’écoute aérienne

La problématique d’une comparaison avec un système stéréophonique hors de l’eau, la ne sera pas abordée. En effet, la perception subaquatique est trop différente de la perception traditionnelle.

Plutôt que de comparer avec le milieu aérien, il s’agit d’optimiser une écoute sous l’eau en partant du ressenti des participants et de chercher à valider un système stéréophonique nouveau.

3.2 Partenariat avec Aqua Musique

3.2.1 Domaine d’activité

Aqua Musique est une société franco- espagnole qui développe des haut-parleurs subaquatiques. Elle est fournisseur officiel de l’équipe de France de natation synchronisée, et elle a équipé plus de 15 000 piscines. Elle développe aussi des accessoires pour l’écoute subaquatique comme des nattes de flottaison.

Récemment, cette société est entrée dans une ère nouvelle avec la naissance du SPA musical, une baignoire spécialement dédiée à l’écoute subaquatique (fig 11).

3.2.2 Les haut-parleurs H062m

Ces haut- parleurs sont la version mobile d’Aqua Musique (voir fiche technique en annexe 7.1.2). Les courbes de réponses sont disponibles en annexe 7.1.2. Le système est le même que pour un haut- parleur classique, avec une membrane fixée sur une bobine mobile. L’ensemble est moulé dans un matériau plastique étanche. Un boîtier fusible de 2 ampères (bleu foncé sur la photo) placé à l’extrémité du câble isole les parties sous tension de l’installation (amplificateur) de l’eau afin d’éviter l’électrocution.

Fig. 12: Haut-parleur subaquatique H062m

Deux haut- parleurs ont été utilisés pour les expériences (un jaune et un rouge).

3.2.3 Les attitudes d’écoute

L’aide d’Aqua Musique a été précieuse pour ce qui est des attitudes d’écoute. En effet, il y a plusieurs façons d’écouter sous l’eau. Le rendu n’est pas le même en fonction de la position de l’auditeur. On peut aussi bien écouter sur le dos en faisant la planche, sur la ventre à la surface, sur le ventre au fond du bassin, assis au fond du bassin. Cela dépend aussi des appréhensions de chacun.

Pour cela, outre les masques et les tubas prêtés par la piscine, Aqua Musique a mis à disposition des nattes de flottaison qui permettent une écoute en surface, sur le dos, particulièrement adaptée pour ceux qui se sentent moins à l’aise dans l’eau, ou qui ne souhaitent pas rester en apnée.

3.3 La Piscine Mathis

C’est dans le petit bassin de la piscine Mathis, 15 rue Mathis dans le XIXᵉ arrondissement de Paris, que se sont déroulés les tests.

Ce bassin fait 6 mètres de large, 12 mètres de long, et le fond est incliné dans le sens de la longueur. La pente est d’inclinaison régulière. La profondeur est de 55 cm d’un côté et de 1,30 m de l’autre. Des marches permettent de rentrer dans l’eau à l’endroit où l’eau est à 55cm. Cela représente un volume de 66,6 m³ et une surface totale de 128 m² de parois (200 m² en comptant la surface de l’eau).

Fig. 14: Schéma du petit bassin de la piscine Mathis

3.3.1 Choix de la piscine

Il fallait avant tout rechercher une piscine avec un petit bassin qui simule le mieux possible une piscine privée. Le choix a été motivé par la proximité avec le Conservatoire National Supérieur de Musique de Paris d’où venaient une grande partie des participants. La piscine Mathis (Métro Crimée) répondait à ces critères. La profondeur d’eau limitée était un atout dans le sens où les participants n’avaient pas à faire d’effort pour flotter et pouvaient se consacrer pleinement à l’écoute.

De plus, le petit bassin se trouvait tout près de locaux pouvant être utilisés (infirmerie, vestiaire pour handicapés), ce qui a permis d’installer une mini- régie à l’abri des éclaboussures et des jets d’eau intempestifs provoqués par certains utilisateurs de tubas…

3.3.2 Les séances de tests

Sachant que de nouvelles questions allaient arriver au fur et à mesure des expériences, il a été décidé de faire une première série de tests comprenant des mesures physiques du bassin ainsi qu’un premier questionnaire afin de donner des pistes de recherches pour la suite. Après observation des résultats de ce premier test, une deuxième série a été programmée avec des nouveaux points à étudier.

Il a été très compliqué d’arriver à trouver des créneaux horaires pour faire les tests. Entre les horaires d’ouverture au public, les plages réservées aux scolaires, et celles réservées aux clubs, nous avons réussi à dégager des créneaux aux dates suivantes :

	*Date*	*Horaires*	*Motif*
Premier test	Vendredi 22 février	13h- 16h	Mesures physiques & 1er questionnaire
Deuxième série de tests	Jeudi 13 mars	14h- 16h	2ᵉ questionnaire
	Vendredi 14 mars	14h- 16h	2ᵉ questionnaire
	Jeudi 20 mars	14h- 16h	3ᵉ questionnaire
	Vendredi 21 mars	14h- 16h	4ᵉ questionnaire

3.4 Déroulement des tests

3.4.1 Description des tests

Il a été convenu que la durée des tests serait d’une heure. Les sujets peuvent difficilement rester statiques dans l’eau plus longtemps sans ressentir le froid.

Il fallait ensuite trouver un moyen de faire remplir à chaque participant un questionnaire à chaud. Les données auraient été moins précises si le questionnaire avait été rempli après la séance. Les séances ont donc été découpées en quatre parties de 15 min environ. Pendant 10 min, les participants faisaient des écoutes dans le bassin, ensuite ils avaient 5 min pour répondre aux questions de la dernière partie écoutée (les questionnaires étaient répartis sur le bord de la piscine à proximité des serviettes pour éviter les flaques et laisser le questionnaire à peu près lisible).

3.4.2 Sujets

Durant cette série de tests, 41 questionnaires ont été remplis, 6 personnes étant passées aux deux séries, cela représente 35 individus âgés de 19 à 43 ans. Les sujets possèdent pour la plupart une formation musicale de haut niveau et/ou une formation d’ingénieur du son.

Il était demandé à chaque participant en début de questionnaire s’il était ingénieur du son ou en formation, et s’il appréhendait un peu le milieu ou s’il se sentait comme un poisson dans l’eau.

3.4.3 Contenu du premier questionnaire

Les questionnaires sont disponibles dans leur intégralité en annexe (cf. § 7.3).

Une attention particulière a été apportée à la formulation des questions dans les questionnaires. Les questions sont ouvertes, posées de façon la plus objective possible, afin que les sujets soient libres de répondre comme ils l’entendent, avec leur propre vocabulaire.

Les principaux thèmes sont abordés ici afin d’avoir une vision globale des expériences, et de voir l’évolution d’un questionnaire à l’autre. (Les nouveautés (bleu) par rapport aux questionnaires précédents et les parties inchangées (orange) sont en couleur).

3.4.4 Contenu du deuxième questionnaire

On notera pour la suite que la première partie est quasiment inchangée. En effet, l’expérience étant nouvelle pour beaucoup, il est nécessaire de passer par une phase de découverte et de familiarisation.

3.4.5 Contenu du troisième questionnaire

On peut voir que l’étude sur la localisation est améliorée

3.4.6 Contenu du quatrième questionnaire

Dans ce quatrième questionnaire, la partie sur la dynamique est abandonnée. L’étude sur la localisation est encore améliorée et elle intègre maintenant une nouvelle partie sur la position d’écoute optimale.

4. Expérimentation

Les mesures réalisées à l’aide de l’hydrophone lors de la première séance ont permis de caractériser l’acoustique du bassin. Les résultats sont exposés au point suivant. Les tests perceptifs sont ensuite résumés et analysés. La totalité des réponses des sujets est disponible en annexe.

4.1 Mesures physiques

4.1.1 Description du matériel de mesure

Lors de la première séance d’expérimentation, quelques mesures ont pu être menées afin de mesurer l’acoustique du bassin et les caractéristiques des haut-parleurs. Ces mesures ont été faites à l’aide de sinus glissants de 30 secondes (générés à l’aide du logiciel Altiverb), et de bruit blanc (généré sur le logiciel Pyramix).

Si l’on cherche à déterminer les « facteurs limitants » de la chaîne audio en termes de qualité, ce sont sans aucun doute les haut- parleurs. Il était donc inutile de chercher à utiliser le matériel le plus performant possible. L’utilisation de matériel Hi-Fi se rapproche d’ailleurs d’une écoute domestique telle qu’on peut la retrouver sur des installations de ce genre. L’hydrophone qui captait le signal étant omnidirectionnel, il était positionné la tête en bas et attaché sur des « frites » en mousse. Il pouvait donc être déplacé à loisir.

4.1.2 Résultats

La remarquable linéarité de la réponse en fréquence de l’hydrophone (voir annexe 7.1.1) permet de n’imputer les résultats qu’aux haut-parleurs et au bassin.

4.1.2.1 Mesures à 1 mètre

La première mesure réalisée est celle d’un sweep de 30s à un mètre et avec un seul haut- parleur. Cela permet d’obtenir le champ acoustique généré par le couple enceinte/acoustique du bassin. Une analyse spectrale réalisée sur Wavelab permet de le visualiser, et permet aussi de comparer les résultats obtenus en fonction des deux méthodes (les fichiers audio ont été calibrés grâce à une impulsion avant chaque sweep).

Fig. 17: FFT du sweep dans le bassin à 1 m.

Cette transformée de Fourier montre un spectre audible très « chaotique ». On note deux bosses de fréquences très marquées vers 120 Hz et entre 400 et 700 Hz. L’hydrophone était positionné à 50 cm de la surface. Cette courbe correspond à ce qu’ont ressenti certains sujets, en particulier à la surface (voir parties suivantes). Elles sont probablement dues à des modes de résonance du bassin (cf. § 4.7), d’autant plus que ces bosses n’apparaissent pas sur les courbes de réponses mesurées en annexe (cf §7.1.2.3).

On peut noter aussi que le bruit de fond est assez élevé dans une piscine municipale (en dessous de 20 Hz, il s’agit uniquement de bruit de fond). Il est dû à la filtration du bassin que nous n’avons pu stopper.

L’amplificateur délivrant une puissance telle que le haut-parleur soit proche de la saturation, on en déduit que la dynamique disponible avec le matériel d’expérimentation se limite à 35/40 dB.

Cette courbe est à comparer avec la FFT du sweep émis:

Fig.18: FFT du sweep original généré par Altiverb

La courbe théorique devrait être plate puisque qu’un sinus glissant est sensé balayer le spectre de manière uniforme. Or, on voit qu’il existe notamment une atténuation dans les aigus…, contrairement à la transformée de Fourier d’un bruit blanc comme le montre la courbe ci-dessous :

Fig. 19: FFT du bruit blanc généré par Pyramix

Voici une comparaison de la mesure du bassin avec le sweep d’une part, et avec le bruit blanc d’autre part.

Fig. 20: Comparaison du sweep (en haut) et du bruit blanc (en bas) à 1 m

On remarque que les deux courbes sont assez ressemblantes si ce n’est qu’on observe une bosse dans le haut du spectre avec le bruit blanc. Cela peut être dû à deux facteurs :

Le sweep avait une baisse dans les hautes fréquences: on le retrouve ici.
Le niveau de diffusion ayant été calibré pour le sweep, le bruit blanc a probablement fait saturer le haut- parleur. Le spectre instantané d’un bruit blanc étant large bande, la puissance efficace est plus élevée à niveau de diffusion égal.

4.1.2.2 Mesures à 8 m

Par comparaison avec le milieu aérien, ce point de mesure est situé dans le champ réverbéré. Il devrait donc permettre de juger de la contribution réelle du bassin.

Fig. 22: Comparaison du sweep à 1 m (en haut) et du sweep à 8 m (en bas)

Les courbes permettent difficilement de tirer une conclusion. Elles sont en effet très ressemblantes, et la légère hausse entre 1,5 kHz et 2,5 kHz est probablement due à la présence de clapotis sur la fin de la mesure. Le peu de différence indique néanmoins qu’on a bien 2 modes de résonance du bassin.

4.1.2.3 Mesures dans une baignoire

Le champ acoustique a aussi été mesuré dans une baignoire. Il s’agit d’une baignoire classique, qui est posée sur des pieds (elle n’est donc pas moulée).

L’analyse spectrale du sweep obtenu montre la très grande « activité vibratoire » de la baignoire. Lors de l’expérience, le sweep était audible aussi fort dans l’eau que hors de l’eau. Il y a deux grands pics vers 100 Hz et vers 4 kHz. En effet, lors des écoutes en baignoire réalisées en marge des expériences à la piscine Mathis, nous avons pu nous rendre compte de l’aspect très « creusé » du spectre, avec beaucoup de basses, peu de médiums, et beaucoup d’aigus (4 kHz- 10 kHz).

4.1.2.4 Implémentation dans l’altiverb

Des réponses impulsionnelles (IR) du bassin ont été déterminées à partir des différents sweeps diffusés dans le bassin. Elles ont été obtenues par déconvolution (il s’agit en fait d’une nouvelle convolution du sweep original avec celui enregistré dans le bassin).

Cinq réponses impulsionnelles ont été implémentées (en mode mono to mono):

A 1 mètre dans l’axe du haut- parleur
A 1 mètre à 45° par rapport à l’axe du haut- parleur
A 1 mètre à 90° par rapport à l’axe du haut- parleur
A 8 mètres dans l’axe des hauts parleurs
Dans une baignoire classique

Fig. 25: Implémentation des IR dans l'Altiverb — Fig. 25: Implémentation des IR dans l’Altiverb

Cela donne une bonne idée du résultat. Même si le mode de perception n’est plus le même, on ressent quand même le resserrement du spectre qui était caractéristique sous l’eau. Les haut-parleurs semblent assez peu directifs, on perçoit néanmoins une légère perte dans les aigus à 45° et à 90°. À 8 mètres, même s’il y a quelques modifications, on garde en effet l’impression d’être dans un champ direct des enceintes, enfin dans la baignoire, le déséquilibre spectral est flagrant. Les bosses de résonance sont très prononcées, mais le rendu garde toujours l’aspect « aquatique » perçu dans la piscine Mathis.

4.2 Introduction aux tests perceptifs

Comme certains points ont été abordés lors de plusieurs séances, voici un tableau récapitulatif des différents points étudiés ainsi que du nombre de personnes qui y ont répondu:

Les expériences sont regroupées par thème, sans tenir compte de l’ordre chronologique des séances de tests. Les points étudiés sont néanmoins exposés dans le même ordre que celui utilisé dans chaque questionnaire.

4.3 Ressenti physique

Cette première question (la toute première du questionnaire) est très importante car elle concerne le premier ressenti des participants après avoir écouté plusieurs extraits de styles différents. Il leur était demandé de réfléchir plus spécialement au ressenti physique mais aussi de donner leurs impressions générales. De ce fait, certains éléments relatifs aux questions ultérieures sont déjà donnés. Les aspects spectraux sont vus dans la partie suivante (partie 4.4).

4.3.1 Analyse

Pour ce test, les auditeurs pouvaient se déplacer à loisir dans le bassin et essayer différentes attitudes d’écoute. Les descriptions du ressenti permettent d’accéder à une représentation mentale des sujets et à leur façon d’aborder l’expérience. Elles ont été retranscrites dans le tableau suivant telles que les 41 participants les ont notées dans le questionnaire. Elles sont classées par ordre décroissant d’apparitions dans deux catégories : points positifs et neutres/points négatifs. Seuls les mots de racine commune ont été assemblés (ex. surpris/surprenant) ou les synonymes vraiment proches (ex. détendant/relaxant).

*Points positifs ou neutres*				*Points négatifs*
Agréable	18	Détendant/ Relaxant	3	Pas de localisation/ Mono	9
Ressenti physique/ Dans le corps	10	Enorme/ Terrible	2	Ressenti physique des basses gênant	5
Ressenti physique/ Dans le corps	10	Douceur/ Pas agressif	2	Ressenti physique des basses gênant	5
Dans la tête	6	Etrange	2	Désagréable à fort niveau	3
Immersion/ Entouré	6	Amusant/ Sympa	2	Inhomogène	2
Surpris	5	Pur	1	Fatiguant	2
Différences oreilles bouchées ou non	4	Pas de bruits extérieurs	1	Est-ce que c’est dangereux pour le cœur?	1
Différences oreilles bouchées ou non	4	On se sent bien	1	Est-ce que c’est dangereux pour le cœur?	1
Comme au casque	3	Écoute naturelle	1	Pas assez fort	1
Même oreilles bouchées	3	Original	1	Bruit du tuba gênant	1
On perçoit la reverb originale	3	Partout	1
On perçoit la reverb originale	3	Propre	1

Pour ce qui est du ressenti physique, 74 remarques sont positives, contre 23 négatives, qui plus est si l’on considère que le fait de ne pas localiser est un point négatif. En effet, une véritable question se pose quant à l’utilité de la localisation (cf. discussion § 4.6.).

C’est donc pour beaucoup de participants une expérience « agréable », « surprenante ». Beaucoup de sujets ne s’attendaient pas à ce que la perception subaquatique fonctionne aussi bien. D’ailleurs, sur les 11 personnes qui ont participé au premier test, 6 sont revenues lors de la deuxième série…

Le ressenti dépend aussi de la familiarisation avec le milieu. En effet, les commentaires négatifs ont pour la plupart été écrits par des sujets qui se considéraient comme peu à l’aise dans l’eau. Leur appréhension s’est donc traduite par une crainte vis-à-vis des vibrations.

4.3.2 Conclusions

Il s’agit donc d’une expérience très positive pour la plupart des sujets. C’est une expérience nouvelle, qui est « surprenante » et « agréable ». Les sujets sont

« immergés » et ils « perçoivent la musique physiquement », « dans la tête ». Ces « vibrations » peuvent néanmoins s’avérer « gênantes » dans les basses fréquences et à fort niveau. Enfin la « localisation semble impossible », le son étant perçu « dans le crâne ».

4.4 Rendu spectral, musical et dynamique

4.4.1 Rendu spectral

Comme pour le ressenti physique, le rendu spectral était une des pistes d’écoute lors de la première partie de chaque séance. Les réponses sont donc diverses et variées. Elles traduisent de nouvelles sensations et le vocabulaire employé par chacun et important. Cette partie sera donc traitée comme celle sur le ressenti physique, avec un tableau recensant les mots employés par les sujets et leur fréquence d’apparition. Les participants pouvaient de nouveau se déplacer dans le bassin.

*Points positifs ou neutres*		*Points négatifs*
+ de basses au fond	12	Trop de graves	9	Résonances gênantes	1
³ en fonction de la profondeur	8	Pas assez de graves	9	Extrêmement changé	1
³ en fonction de la profondeur	8	Pas assez d’aigus	7	Basses agressives	1
³ en fonction de la position	7	Les mediums moches en surface	7	Son téléphonique	1
³ en fonction de la position	7	Les mediums moches en surface	7	Aigus trop doux	1
Voix pop bien rendue	3	Trop d’aigus	6	Provenance floue	1
Audible	2	Pas assez de médiums	4	Mauvaise précision	1
Reconnaissable	2	Bande passante réduite	4	Filtrage en peigne	1
Écoute de qualité	2	Timbres modifiés	4	Sourd	1
Intelligibilité	2	Saturation/ distorsion	4
Timbres conservés	2	Manque de clarté	2
+ fort près des parois	2	Étouffé/émoussé	2
Large spectre	1	Lointain	2
Fin	1	Inégal/ Déséquilibré 2

Pour ce qui est du rendu spectral, les remarques sont formulées avec la perception aérienne comme référentiel, d’où la présence de nombreuses modifications spectrales qui peuvent apparaître comme « négatives » (62 % des remarques). La perception du timbre sous l’eau est donc très différente de celle en milieu aérien. Il est aussi intéressant de voir qu’il y a souvent une impression et son contraire (trop de graves/pas assez de graves, ou pas assez d’aigus/trop d’aigus). Bien sûr, ce sont des termes assez vagues mais cela montre bien que c’est une approche totalement nouvelle et assez difficile à décrire.

Néanmoins, deux points mis en évidence lors de ce test peuvent expliquer ces contradictions. Il s’agit des différences en fonction de la profondeur (8 fois mentionnées) ainsi que des différences en fonction de la position (7 fois mentionnées). Cela met en évidence le fait qu’un bassin est un volume inhomogène, et que la perception varie en fonction de la position (même indépendamment de la distance aux hauts- parleurs). Les auditeurs ont donc répondu différemment en fonction de leur attitude d’écoute et de leur position dans le bassin. Un fait à peu près certain est qu’il y a beaucoup de médiums à la surface et beaucoup de basses au fond.

4.4.2 Rendu musical

À la question « Trouvez-vous que certains extraits sont moins bien restitués que d’autres ? », 38 sujets ont répondu « oui », soit 93% des participants.

Comme tous les sujets n’ont pas écouté les mêmes extraits, le tableau suivant regroupe les données des différents tests et permet d’établir un classement subjectif des extraits qui ont été perçus comme ayant « le moins bon rendu »:

*Genre musical*	*Moins bon rendu*	*Sujets* *interrogés*	*Pourcentage*
Classique	31	41	73 %
Electro	7	41	17 %
Voix Parlée	2	11	18 %
Jazz	1	11	9 %
Techno	2	11	18 %
Chant grégorien	11	28	39 %
Pop	1	28	3%

Les raisons principales évoquées pour expliquer le mauvais rendu de certaines musiques sont :

La dynamique de certains extraits qui est très mal restituée sous l’eau, ce qui est vrai pour la musique classique (notamment pour l’extrait symphonique qui était un grand crescendo orchestral).
Les extraits qui demandent de la finesse au niveau de la restitution des timbres, ainsi que de la richesse spectrale. Les transitoires étaient altérées dans l’orchestre.
Pour la techno et l’électro, les raisons avancées étaient souvent des basses qui étaient désagréables et trop présentes. Ce sont d’ailleurs les mêmes personnes qui ont été sensibles aux vibrations et aux basses fréquences lors de la question sur le ressenti physique.

Lors du premier test, les très bons résultats concernant l’intelligibilité de la voix parlée (10 sur 11 ont tout compris, et le dernier a presque tout compris) ont permis d’abandonner des idées de tests d’intelligibilité pour les séances ultérieures, la qualité d’écoute étant globalement très bonne.

4.3.3 Rendu dynamique

Le premier test avait permis de mettre en évidence le fait qu’une grande dynamique était mal restituée lors d’une écoute subaquatique, d’où l’idée d’un test sur la compression.

Deux extraits (un jazz et un classique) ont été diffusés à trois reprises, dans la version originale, avec une compression de 2:1 (Seuil: -40 dBFS, Attaque: 10 ms, Release: 300 ms) et avec une compression de 10:1 (mêmes réglages). Les trois extraits étaient diffusés dans un ordre pris au hasard et il était demandé aux participants d’identifier les versions. La notion de compression étant délicate pour certains, seuls les résultats des ingénieurs du son (ou ingénieurs du son en devenir) sont exposés ici :

Pour l’extrait Jazz, il y a eu 73 % de bonnes réponses (le probabilité de donner la bonne réponse en répondant au hasard est de 16,6 %). C’était un morceau qui était déjà compressé par ailleurs. Par contre, pour l’extrait classique, il n’y a eu que 46 % de bonnes réponses, alors que les versions compressées à 10:1 en auraient fait bondir plus d’un en aérien. De plus, si l’on considère que deux personnes ne se sont pas prononcées pour l’extrait classique, le pourcentage de réussite passe à 40 %. Cela reste néanmoins supérieur au hasard.

La perception de la dynamique semble donc très limitée sous l’eau. Quant à savoir s’il peut être intéressant de compresser des œuvres avec une grande dynamique, les réponses sont partagées. Certaines personnes ont estimé que la compression était nécessaire sur certains extraits (classique notamment) alors que d’autres pensaient que dans un contexte moins bruyant, une grande dynamique aurait pu être intéressante.

4.4.4 Conclusions

Cette première approche avec l’écoute subaquatique a rencontré un vif intérêt et a permis de fixer les points suivants :

4.5 Contribution du bassin

4.5.1 Acoustique du bassin

Une première expérience sur l’acoustique du bassin a été faite lors de la première série de tests. Comme les références sur la question manquaient cruellement, les questions étaient d’ordre général. Il était demandé aux 11 participants de prêter attention aux notions de champ proche, de champ lointain et de distance critique.

Les enceintes étaient disposées à mi-hauteur, là où il y avait 1m 30 de profondeur, et dirigées vers le reste du bassin. Par analogie avec le modèle aérien, une partie de la piscine était dans un champ supposé proche (près des haut- parleurs), l’autre partie était dans un champ supposé diffus.

La première question posée après 10 minutes d’écoute était :

« Peut-on adapter la théorie aérienne sous l’eau et considérer qu’il y a un champ direct et un champ réverbéré ? »

Sur 11 participants, 7 ont pensé que c’était impossible. Il leur semblait que le « rapport son/direct son réverbéré ne changeait pas », qu’il n’y avait « aucun espace ». La seule différence entre une position proche et une position lointaine était une différence de niveau. Certains sujets ont aussi remarqué que le volume augmentait à proximité des parois.

Ceux qui ont dit que la théorie aérienne pouvait s’appliquer parlaient néanmoins de réverbération « sèche », « assez neutre » ou encore d’« acoustique peu réverbérante ». Les différences entre son direct et son réverbéré étaient perçues comme des modifications spectrales.

Pour tous les sujets qui ont répondu à la question (9 sujets), le point d’écoute optimal se trouvait être dans la zone où il y avait le plus de niveau sonore.

Fig. 27: Zone d'écoute préférentielle — Fig. 27: Zone d’écoute préférentielle

Enfin, un point intéressant qui correspond à la théorie est que la présence de personnes entre l’auditeur et les enceintes ne modifie en rien la perception. Le corps est donc bien perçu comme transparent par l’onde. Cette question était nécessaire au premier test afin de savoir si les écoutes devaient être individuelles ou non par la suite.

4.5.2 Homogénéité du bassin

Lors de la deuxième série de tests, une expérience a été menée pour essayer de caractériser l’inhomogénéité du bassin, et plus particulièrement les différences en fonction de la profondeur qui avaient été mises en évidence lors du premier test.

Deux extraits de 30 s chacun (classique puis jazz latino) ont été diffusés à deux reprises avec deux positionnements d’enceintes différents.

Les participants devaient écouter au fond du bassin et en surface afin de noter les différences entre les 2 placements d’enceintes. Ils devaient ensuite essayer de déterminer une position d’écoute et un positionnement d’enceintes préférés.

Les résultats pour ce qui est des différences de perception en fonction de la profondeur vont dans le même sens que lors des impressions générales à la première question:

Plus de basses au fond et plus fort
Médium renforcé en surface
Immersion meilleure au fond

Néanmoins, la position des enceintes joue un rôle non négligeable:

Plusieurs personnes trouvent que les enceintes en surface donnent un rendu plus homogène.
Les personnes en faveur des enceintes au fond font ressortir une meilleure définition ainsi qu’un gonflement des basses agréable.

Peut- on alors déterminer un couple « position d’écoute/placement d’enceintes » qui serait optimal?

Fig. 29: Position d'écoute, placement des enceintes — Fig. 29: Position d’écoute, placement des enceintes

On voit que les résultats sont assez variés, et dépendent des goûts de chacun.

Néanmoins, certaines lignes ressortent :

Préférence pour une écoute au fond (64 %)
- avec les enceintes en surface (équilibre, immersion)
- avec les enceintes au fond (volume, immersion, plus de basses)
Lors d’une écoute en surface il vaut mieux mettre les enceintes au fond (si par exemple les enceintes sont encastrées).
Certaines personnes ont proposé d’elles- même une version intermédiaire (trop de graves au fond, pas assez en surface)

4.5.3 Conclusions

Les expériences relatives au champ acoustique dans le bassin permettent de tirer les conclusions suivantes:

4.6 Localisation

Les tests de localisation subaquatiques ont été très surprenants. Les adeptes de l’écoute subaquatique affirment que la perception est mono, dans la tête. Une autre question se posait : « Quel intérêt avons-nous à localiser ? » En effet la sensation interne, qui est « laissée pour compte après la naissance » (N. Canivenq), serait peut-être affaiblie en cas de localisation. Les trois points suivants montrent l’évolution qu’ont connu les questionnaires afin d’arriver à des résultats probants.

4.6.1 Localisation frontale

Lors du premier test, quatre extraits ont été proposés:

Un extrait symphonique diffusé uniquement à gauche ou uniquement à droite (4 fois le même extrait, dans l’ordre G, G, D et D)
Un extrait de maracas qui passait d’une enceinte à l’autre (aucun indice sur le nombre de changements, le chemin parcouru était G, D, G, D et puis Centre)
Un extrait de Rock (une guitare à gauche, l’autre à droite)
Un extrait de musique symphonique (pour essayer de distinguer des plans sonores)

Les 11 sujets étaient placés sur la ligne médiane (autant que possible vu le manque de place).

Fig. 30:
Placement des auditeurs — Fig. 30: Placement des auditeurs

Les réponses correctes sont uniquement les séquences reconnues dans leur totalité. La réponse G,D,G,D était considérée comme bonne pour les maracas.

Les résultats sont donc très bons (resp. 64 % et 73 % de bonnes réponses), la réponse aléatoire se situant à 12,5%. De plus, ce ne sont pas les mêmes sujets qui n’ont pas trouvé chacune des séquences : en effet, 3 de ceux qui n’ont pas trouvé l’extrait symphonique se sont rapprochés du plan des enceintes pour les maracas et ont donné la bonne réponse. Les réponses sont en effet meilleures pour les personnes situées devant. Certains ont même trouvé cela « facile ». Cela confirme l’idée que l’angle d’écoute sous l’eau est beaucoup plus élevé qu’en aérien, pour obtenir de bons résultats (cf § 2.3.2.3)

Après discussion, il a été mis en évidence qu’on localisait « par hémisphère », mais que cela restait une perception intra- crânienne.

Par contre pour les extraits plus complexes, les réponses sont nettement plus mitigées. En effet, les rares personnes qui ont entendu les guitares en stéréo dans l’extrait Rock ont avoué avoir été influencés car c’est une pratique fort courante, ou encore parce qu’ils connaissaient le morceau. Et en ce qui concerne l’extrait symphonique, personne n’a pu répondre, ou alors c’était encore une fois par connaissance avouée de la disposition d’un orchestre symphonique.

4.6.2 Localisation dans le plan des enceintes

4.6.2.1 Séances du 13 et 14 mars 2008

Comme la localisation se fait par hémisphère, les résultats devraient être maximisés dans le plan des enceintes. C’est ce qui a été fait lors de ces deux séances.

Les 13 sujets passaient par quatre au maximum, en carré, entre les deux enceintes.Les extraits étaient diffusés par ordre de complexité croissante:

Un duo de guitares acoustiques (pané G/D)
« Bang Bang » de Nancy Sinatra (guitare électrique à droite, voix à gauche)
Un extrait électro (voix panées, sons tournants)
Un extrait symphonique (la difficulté ultime, une fois de plus)

Les réponses s’affinent nettement lorsqu’on se trouve dans le plan des enceintes. Par contre, pour ce qui est de l’intérêt de la localisation, les voix ne sont pas unanimes : 55 % pensent que c’est intéressant, 45 % pensent que cela ne vaut pas la peine. Cela dit, les sceptiques vis-à-vis de la stéréophonie existent aussi pour les écoutes aériennes…

4.6.2.2 Séances du 20 et 21 mars

Pour vraiment entendre quelle était la contribution de la stéréo par rapport à la mono, il a été décidé lors des deux dernières séances de diffuser d’abord chaque extrait en mono, puis en stéréo.

Les résultats ne sont pas meilleurs en termes de localisation avec une écoute monophonique au préalable. Au contraire, les résultats sont moins bons, mais c’est probablement lié au fait que plusieurs sujets n’étaient pas ingénieurs du son. Par contre, les sujets se sont accordés à dire que la stéréo donnait un meilleur rendu (surtout pour la musique classique). Les mots qu’ils ont employés sont restitués par fréquence d’apparition :

Sensation d’espace	4	Précision	1
Aéré	3	Largeur	1
Plus de définition	2	100 fois meilleur	1
Clarifie	2	Plus Ample	1
Profondeur	1	Mieux	1
Enveloppement meilleur	1	Ça respire	1
Plus agréable	1

Ces réponses sont collectées sur les 17 personnes qui ont pu comparer chaque extrait en mono et en stéréo.

4.6.3 Point d’écoute

Une dernière question est survenue suite aux résultats précédents. Maintenant que l’apport de la stéréo a été démontré, rien ne nous oblige à localiser complètement à 180°. Trois sujets ont même dit que la localisation les fatiguait. De plus, nous sommes plus habitués à écouter de la musique en position frontale. Il s’agirait donc de trouver un compromis entre localisation et confort d’écoute et d’essayer de définir un point d’écoute optimal. Cela permettrait de valider l’hypothèse théorique selon laquelle l’angle d’écoute est environ 6 fois plus grand en aérien (cf. § 2.3.2.3).

La formulation de la question il est vrai suggérait une réponse en retrait par rapport à l’axe des enceintes. Voici néanmoins ce que les participants ont noté :

Fig. 31: Point d'écoute optimal — Fig. 31: Point d’écoute optimal

Lorsque l’auditeur n’est plus dans le plan des enceintes, la sensation d’espace est quand même bonne avec une diffusion stéréo, et la localisation est encore possible (le test de localisation frontale l’avait partiellement démontré). Il est donc possible de choisir une position d’écoute plus frontale. Les sujets disent que l’on « perd en définition », mais on « gagne en confort ». La définition peut cependant être améliorée en orientant les enceintes dans l’axe de l’auditeur (forte directivité des enceintes (cf § 4.1.2.4, et page 94).

4.6.4 À propos des oreilles bouchées

Lors de la dernière séance, les sujets ont pu écouter avec une indication supplémentaire : oreilles bouchées ou oreilles libres. Il se trouve que la perception est changée lorsque les oreilles sont bouchées. Certainesw personnes l’avaient d’ailleurs noté dans les premières impressions:

Le son est plus défini
On a une perte de niveau dans les basses fréquences
On perd une partie de la sensation d’espace

Cela signifie que les mécanismes de l’oreille jouent quand même un rôle dans la perception subaquatique. La perception solidienne serait doublée d’une perception

« classique », essentiellement dans les basses fréquences, et cela créerait un nouvel espace. La contribution sonore des oreilles serait analysée avec un certain retard par rapport à la perception « crânienne », et c’est ce qui créerait cette nouvelle sensation d’espace.

Ces résultats vont dans le sens de la théorie : puisque les éléments de localisation sont donnés par les différences interaurales de temps, ce sont bien les basses fréquences qui donnent la sensation d’espace (cf. § 2.3.2.1). Cela confirme aussi les résultats de Sophie Savel qui avait noté que les mécanismes de l’oreille jouaient un rôle dans la localisation (cf. § 2.3.2.2).

La sensation d’espace, de réverbération liée au bassin ne serait donc essentiellement qu’une illusion due à notre double perception.

4.6.5 Conclusions

Cette conclusion récapitule les points importants concernant la localisation:

4.7 Recherche post-expérimentale

Les études ci-dessous ont été effectuées a posteriori, après analyse des tests perceptifs, afin d’essayer de faire concorder les dires des participants et les résultats scientifiques.

4.7.1 Étude modale

4.7.1.1 Pour la piscine Mathis

La forme du bassin étant presque parallélépipédique, une étude modale peut apporter des éléments de réponse quant au champ acoustique mesuré dans le bassin.

Les modes sont susceptibles de s’installer :

Dans la largeur (entre les parois de 6m)
En hauteur (entre l’eau et le fond). Il existe une pente d’inclinaison très faible, mais cela comprend les deux plus grosses surfaces du bassin
Dans la longueur, mais les marches du petit bain cassent le parallélisme

L’étude des premiers modes axiaux avec une célérité de 1500 m/s donne:

Le mode suivant la longueur n’est en effet pas présent dans le bassin, par contre, les modes de 125 et 680 Hz correspondent exactement aux deux bosses trouvées avec le sweep à 1 m (il y avait 1m 10 de fond environ au niveau de la prise). Ces modes sont hauts en fréquence en comparaison avec les modes d’acoustique des salles. Cela est dû à la célérité du son dans l’eau qui est 5 fois plus élevée que dans l’air. Le mode qui s’installe en hauteur est même plus fort que celui de la largeur puisque la surface est très réfléchissante.

Néanmoins, on remarque sur le sweep à 8m que la bosse qui correspond au mode propre en hauteur reste à peu près dans la même zone de fréquence, alors qu’elle devrait être plus haute en fréquence (vers 900 Hz pour h=85 cm) ce qui laisse quelques doutes. De plus, on devrait quand même apercevoir des raies correspondant aux modes (0,2,0) à 250 Hz, (0,3,0) à 375 Hz, (0,4,0) à 500 Hz et (0,5,0) à 625 Hz, ce qui n’est pas le cas.

On peut cependant formuler l’hypothèse suivante:

4.7.1.2 Pour la baignoire

Les dimensions de la baignoire sont approximativement de 145 cm dans la longueur (à mi-hauteur), 50 cm dans la largeur (à mi-hauteur toujours), et elle était remplie d’eau à hauteur de 30 cm environ.

L’étude des premiers modes axiaux avec une célérité de 1500 m/s donne:

On remarque que cette fois, l’analyse modale ne donne aucun résultat valable puisque les deux bosses mesurées étaient à 100 Hz et à 4 kHz (cf. § 4.1.2.3). Ces modes tombent en plein dans la zone creusée du spectre. Il s’agit donc bien de phénomènes vibratoires complexes de la structure, plutôt que de modes acoustiques.

4.7.2 Acoustique des matériaux

L’extrême sécheresse de l’acoustique ajouté au fait que la musique s’entend à plusieurs mètres du bassin lorsque l’on pose son oreille contre le sol, a fait germer quelques pistes de recherche en acoustique des matériaux. De plus, la largeur des bosses de présence relevées avec l’hydrophone ne peut pas être due uniquement à des modes propres (la bosse de présence serait plus sélective). D’où l’idée de partir des caractéristiques physiques des matériaux.

La piscine est considérée comme entourée de béton. L’impédance acoustique d’un matériau tel que le beton est :

Z_beton=p_beton c_beton

La masse volumique du béton varie en fonction de la qualité. Pour un béton ordinaire on peut prendre:

p_beton=2200kg.m^—3

Pour ce qui est de la vitesse, elle varie aussi en fonction de la quantité de bulles d’air enfermées dans le béton. Pour un béton ordinaire :

c_beton=3200m.s^—1

soit :

Z_beton = 7.10⁶ kg.m^—2.s^—1

Le facteur de transmission est :

La moitié de l’onde est transmise! En comparaison, le facteur de transmission air beton est 1.10^—4, soit un rapport 3500.

Le libre parcours moyen d’une onde entre deux parois étant :

l_m= 4V / S_beton =2,10 m

En 10 ms, l’onde a parcouru 15 mètres environ. Son amplitude est (1—0,35)⁶=0,075 par rapport à l’amplitude initiale, soit une perte de 23 dB ! Et cela, sans compter les pertes en 1/r dues à la divergence sphérique. Le bassin serait donc un espace anéchoïque, excepté à la surface.

De plus, dans les matériaux solides, le transport d’énergie se fait aussi par ondes transversales, ou ondes de cisaillement, et non plus uniquement par l’onde acoustique longitudinale. Le bassin rentrerait donc en vibration. Cela installerait des résonances aux fréquences qui correspondent aux dimensions du bassin. Il ne s’agit plus de modes au sens acoustique avec des réflexions et une notion temporelle de la résonance, mais d’un état de résonance établi, d’où une deuxième hypothèse:

Les courbes de réponse mesurées à l’Ifremer de Toulon montrent de plus que ces vibrations dépendent de l’encastrement du bassin. Autant le bassin de la piscine Mathis rentre facilement en vibration car il n’est pas ancré dans le sol (une salle des machines se situe juste en dessous), autant le bassin d’essai de l’Ifremer vibre peu car il est en bord de mer et les ondes peuvent donc « s’échapper » vers le large (cf § 7.1.2).

5. Discussions, conclusions et perspectives

5.1 Synthèse des différentes expériences

Lors de chaque expérience, le premier quart- d’heure étaitdestinéé à la familiarisation des sujets avec ce nouveau milieu et cette nouvelle façon d’écouter de la musique.

Ce qui est ressorti de ces premières impressions subaquatiques est que la musique est vraiment ressentie physiquement, organiquement, grâce aux vibrations transmises par l’eau. Les oreilles ne fonctionnent pas sous l’eau de la même manière qu’en aérien. Le son est perçu à l’intérieur de la tête, ce qui augmente l’effet d’immersion qui existe par nature sous l’eau. Les ondes traversent d’ailleurs le corps humain, et le nombre de personnes dans l’eau ne modifie donc pas le champ acoustique dans le bassin;

Plusieurs remarques ont porté sur le rendu spectral. Il est en effet différent en fonction de la position de l’auditeur en profondeur. A distance équivalente des haut-parleurs, il existe une bosse dans les mediums lors d’une écoute en surface, alors que les basses sont renforcées au fond du bassin. De ce fait, les non- linéarités du spectre relevées à l’aide d’un hydrophone sont certes imputables à la réponse en fréquence des haut- parleurs, mais aussi aux caractéristiques du bassin, qui est un milieu inhomogène.

Pour la plupart des participants, les différents styles de musique n’ont pas le même rendu sous l’eau. Le milieu aquatique restitue très mal les dynamiques, et les finesses de timbre ne sont pas toujours perçues. La restitution d’instruments acoustiques est assez délicate.

La contribution acoustique du bassin est originale : ce dernier ne donne aucune impression d’espace, et l’auditeur a l’étrange sensation d’être en permanence dans le champ direct des enceintes, même lorsqu’il est à l’autre bout du bassin. Les seuls indices de l’éloignement par rapport aux haut- parleurs sont des différences de niveau. En plus des différences liées à la profondeur d’écoute citées plus haut, le bassin possède une empreinte acoustique : une bosse de présence entre 100 et 120 Hz, ainsi qu’une bosse vers 600, 700 Hz. Ces deux bosses de présence correspondent aux deux premiers modes axiaux dans le sens de la largeur et de la hauteur. Ils sont néanmoins perçus comme une coloration du son direct et non comme une réverbération. La position d’écoute ainsi que l’emplacement des enceintes est très important car la perception en est vraiment modifiée.

Contrairement aux premières impressions, la localisation sous l’eau est possible. Nous avons sous l’eau l’impression de localiser par hémisphère de cerveau. Cela induit une localisation optimale dans le plan des enceintes, avec un espacement d’enceintes de 180 degrés. La localisation ne marche que pour des morceaux avec des sources très latéralisées. Cependant une écoute stéréophonique apporte une réelle sensation d’espace, comme si les sources se répartissaient dans le cerveau, ce qui augmente l’intelligibilité de la musique et le confort d’écoute.

Enfin, les oreilles semblent quand même jouer un rôle dans la perception subaquatique. Le rendu des basses fréquences est modifié. Lorsque nos oreilles sont dégagées, elles donnent une sensation d’espace supplémentaire grâce à ce nouvel apport de basses fréquences. La perception classique additionnée avec un léger retard à la perception « crânienne » créerait une illusion d’espace.

5.2 Perspectives de recherche

Ce mémoire permet de proposer des idées diverses afin d’optimiser une écoute subaquatique.

Tout d’abord, lestestst perceptifs et les mesures réalisées dans le bassin permettent d’établir plusieurs pistes pour améliorer le système de diffusion et pour l’adapter au volume dans lequel il est immergé:

La courbe de réponse du système peut être linéarisée, afin de rétablir une écoute plus naturelle, minimisant ainsi les résonances engendrées par le bassin.
Les résonances engendrées par les vibrations du bassin peuvent être atténuées grâce à une étude sur la composition des matériaux. Les formes de bassin peuvent aussi jouer un rôle et atténuer ces résonances.
Un travail sur la diffusion stéréophonique ainsi que sur le positionnement des haut- parleurs peutaugmenterr la qualité de la perception, notamment si la position de l’auditeur est fixe.
Un traitement en fonction de la profondeur est aussi envisageable afin de rendre le champ acoustique plus homogène.

Des pistes de recherche sont aussi lancées pour créer de la musique prévue spécialement pour ce milieu:

Les morceaux qui ont le meilleur rendu sont ceux qui ont un spectre très large et creusé dans le bas- médium.
Le bassin ayant peu ou pas d’acoustique, les morceaux qui offrent déjà une grande sensation d’espace et de réverbération sont très bien restitués.
Les sources gagnent à être panoramisées dans une image sonore, et elles sont d’autant mieux définies qu’elles ont des timbres différents.
Les morceaux doivent avoir une dynamique assez réduite, excepté si le bruit ambiant est vraiment bas, ce qui est loin d’être le cas dans une piscine municipale.

Le résultat peut être aussi intéressant dans l’autre sens : donner une sensation de morceau aquatique lors d’une diffusion aérienne. Les réponses impulsionnelles du bassin permettent d’implémenter une écoute subaquatique dans des logiciels de réverbération à convolution, et donnent donc un rendu spectral très fidèle à la réalité, même si la sensation est évidemment différente.

5.3 Éléments thérapeutiques

Même si ce n’est pas le sujet du mémoire, l’écoute subaquatique gagne aussi à être étudiée à des fins thérapeutiques. En effet, les bienfaits de l’eau sont utilisés dans bien des domaines médicaux (thalassothérapie, rééducation, pédiatrie…), et ses vertus relaxantes ne sont plus à démontrer. L’écoute subaquatique peut donc ouvrir un nouvel univers de bien- être, un « massage musical » (N. Canivenq, Auamusique).

5.4 Epilogue

« Ça marche! » Comme l’ont si bien décrit certains des sujets qui ont participé avec enthousiasme à ce mémoire, la diffusion musicale sous l’eau fonctionne tout à fait. Les résultats des expériences réalisées donnent de nouvelles pistes pour optimiser une telle écoute et permettre à tout un chacun d’allier deux grands plaisirs terrestres : la musique et le bain.

6. Bibliographie

Blauert (1997), Spatial Hearing :The psychophysics of human sound localization, revised edition, The MIT press

Bernaschina F. (2003), Localisation spatiale acoustique en milieu subaquatique, Thèse présente#e a$ la faculté de Psychologie et des Sciences de l’Éducation de l’Université de Genève

Cailliez J.C.(2005), « Jean Daniel COLLADON (1802-1893) », www.pionnair-ge.com

Feddersen W. E., Sandel T. T., Teas D. C. et Jeffress L. A. (1957), « Localization of high-frequency tones », Journal of the Acoustical Society of America, vol. 29

Feinstein S. (1973), « Acuity of the human sound localisation response underwater », Journal of the Acoustical Society of America, vol. 53

Grau G. (1996), Principes de l’hydroacoustique, Océanis, Documents océaniques vol 22-4, ed. Institut océanographique

Hamilton P. M. (1957), « Underwater hearing thresholds », Journal of the Acoustical Society of America, vol. 29

Hollien H. (1971), « Underwater sound localization in humans », Journal of the Acoustical Society of America, vol. 53

Hurtado A. (2006), Cours d’acoustique des salles, FSMS 2e année

Jouhaneau J. (1994), Notions élémentaires d’acoustique, électroacoustique, Acoustique appliquée, CNAM, ed. Tec & Doc

Landau L., Lifchitz E.(1990), Physique théorique, tome 7 : Théorie de l’élasticité, Ed. MIR, Moscou

Lesueur C. (1988), Rayonnement acoustique des structures, Ed. Eyrolles

Lurton X. (1998), Acoustique sous-marine, présentation et applications, Ingénierie et technologie, ed. IFREMER

Lurton X., Augustin J.M. et Voisset M. (2001), « La cartographie sous-marine », in. Le monde des sons, Pour la Science, Dossier N°32, Juillet/Octobre 2001

Mercier D. (2001), Le livre des techniques du son, notions fondamentales, Coll. Audio-Video, 3e édition, ed. Dunod

Mills, A.W. (1958), « On the minimum audible angle », Journal of the Acoustical Society of America, vol. 30

Poitrenaud N. (2006), Cours d’Acoustique et Sonorisation, FSMS 2e année

Potter J. (2001), « Le bruit de l’océan », in. Le monde des sons, Pour la Science,

Dossier N°32, Juillet/Octobre 2001

Rayleigh Lord J. W. (1877). « Acoustical observations », Phil. Mag.

Salin D., Martin J. (1999), La mécanique des Fluides, Sciences 128, ed. Nathan Université

Savel S. (2001), Localisation Auditive Subaquatique: d l’idendification des mécanismes impliqués à la démonstration de la plasticité du système auditif et à l’application sur les plongeurs, Thèse, ed. Atelier National de reproduction des Thèses

Sivian L. J. (1947), « On hearing in water vs. hearing in air », Journal of the Acoustical Society of America vol. 19.

Urick R.J. (1983), Principles of underwater sound, 3^rd edition, Peninsula pub.

Venturi, J. B. (1796),.Considérations sur la connaissance de l’étendue que nous donne le sens de l’ouïe, Mag. Encycl.

Vogel C. (1999) Etude se#miotique et acoustique de l’identification des signaux sonores d’avertissement en contexte urbain, Thèse ed. Atelier National de reproduction des Thèses

Vogel C. (2005), Cours de Psychoacoustique FSMS 1e année

7. ANNEXES

7.1 Documentation technique, p.67

7.1.1 Hyprophone DPA 8010, p.67
7.1.2 Le haut-parleur H062m, p.69
- 7.1.2.1 Description, p.69
- 7.1.2.2 Conditions expérimentales, p.70
- 7.1.2.3 Réponses en fréquence, p.71
- 7.1.2.4 Directivité, p.72
- 7.1.2.5 Discussions, p.73

7.2 Disques d’écoute, p.74

7.2.1 Pour le 22 février 2008, p.74
7.2.2 Pour les autres séances, p.75

7.3 Questionnaires, p.76

7.3.1 Pour le 22 février 2008, p.76
7.3.2 Pour le 13 et 14 mars 2008, p.80
7.3.3 Pour le 20 mars 2008, p.83
7.3.4 Pour le 21 mars 2008, p.84

7.4 Réponses des sujets, p.87

7.4.1 Ressenti Physique/Rendu spectral et musical, p.87
7.4.2 Acoustique du bassin/ Homogénéité, p.94
7.4.3 Dynamique/ Compression 98
7.4.4 Localisation, p.99

7.1 Documentation technique

7.1.1 Hyprophone DPA 8010

7.1.2 Le haut-parleur H602m

7.1.2.1 Description

7.1.2.2 Conditions expérimentales

Trois haut- parleurs de type H062m ont été mesurés le 29 septembre 2008 dans le bassin d’essai du laboratoire IFREMER à la Seyne- sur-Mer, près de Toulon. Ils seront nommés par la suite HP1, HP2 et HP3.

Le bassin d’essai est une fosse de 10 mètres sur 15 avec une profondeur de 6 mètres. Un amplificateur de marque Faze a été utilisé (la réponse en fréquence a été mesurée en sortie pour évaluer la contribution de l’ampli dans la chaîne audio). Pour toutes les mesures, les réglages de l’amplificateur sont identiques. Un hydrophone B&K 8103 a été utilisé pour ces mesures. Le signal excitateur est un sweep de 30 secondes généré par Altiverb, comme pour les mesures dans la piscine Mathis.

FFT du sweep après d'amplification — FFT du sweep après d’amplification

FFT du bruit de fond dans le bassin d'essai — FFT du bruit de fond dans le bassin d’essai

7.1.2.3 Réponses en fréquence

Les mesures sont prises à un mètre du haut- parleur, à 2m 50 de profondeur.

HP2 à 1 mètre dans l'axe — HP2 à 1 mètre dans l’axe

7.1.2.4 Directivité

C’est le HP3 qui est représenté ici. Les mesures sont effectuées à 0°, 45° et 90° à 1 mètre.

7.1.2.5 Discussions

Les trois premiers modes axiaux de ce bassin sont aux fréquences 50 Hz, 75Hz et 135 Hz et ils n’apparaissent pas sur les courbes de réponse. Les fréquences 50Hz et 75Hz sont en dessous de la bande passante des haut- parleurs, et la fréquence de 135 Hz (correspondant à la profondeur d’eau de 5,50m) n’apparaît pas.

De plus, le bassin se situe à proximité de la mer et est construit dans une terre gorgée d’eau, ce qui laisse supposer que la transmission des ondes dans le sol se fait assez bien.Il est donc bien ancré et a une activité vibratoire moins importante que le bassin de la piscine Mathis. Le bassin peut être considéré comme relativement neutre, avec une « empreinte acoustique » faible (cf hyp n°2 page 59) et les courbes de réponse mesurées sont donc imputables en grande partie aux haut- parleurs.

Les mesures sont assez différentes d’un haut- parleur à l’autre, notamment le HP2. Les HP1 et 3 sont plus proches, et leurs courbes de réponse réelles (après compensation par rapport à la sortie de l’amplificateur) sont exposées ci-dessous :

Réponses réelles des HP 1 et 3

De 350Hz à 5kHz, les points restent dans une fourchette de 10 dB, par contre les deux haut- parleurs ont une bosse de présence dans le bas médium (entre 100 et 300Hz) et ont une perte prononcée dans les aigus (-12 dB par octave à partir de 5kHz) avec des pics (+10dB) à 8k, 11k et 15kHz..

On remarque enfin que les haut-parleurs sont peu directifs dans le plan horizontal : les courbes dans l’axe, à 45° et à 90° sont quasiment identiques.

7.2 Disques d’écoute

7.2.1 Pour le 22 février 2008

CD D’ÉCOUTE	TRACK
Ecoutes Première Partie
RESSENTI PHYSIQUE / RENDU SPECTRAL / POSITION
D’ECOUTE
Chant du Rossignol- Stravinski	8
All I Need- Air	9
Voix Parlée- Recette des truffes au chocolat	10
Blue in Green- Miles Davis	11
Three Little Birdies- Chemical Brothers	12
Ecoutes Deuxième Partie
ÉTUDEE DU CHAMP ACOUSTIQUE / POINT D’ECOUTE
Passion selon St Matthieu- Bach	13
Tell It Like It Is-Art Blackey	14
Ecoutes Troisième Partie
LOCALISATION STEREOPHONIQUE
Premier espacement d’enceintes
Back In Black- AC/DC	15
Symphonie n°3- Honnegger, écoute aléatoire G/D (4 chgmts)	16
(pause)
Symphonie n°3- Honnegger	16
Maracas n°1	17
Deuxieme espacement d’enceintes
Back In Black- AC/DC	18
Symphonie n°3- Honnegger, écoute aléatoire G/D (4 chgmts) (pause)	19
Symphonie n°3- Honnegger	19
Maracas n°2	20

7.2.2 Pour les autres séances

Pour les deux dernières séances, les morceaux de la dernière partie étaient mono pendant 45 secondes, puis les mêmes extraits étaient diffusés en stéréo pendant encore 45 secondes.

CD D’ÉCOUTE	TRACK
Ecoutes Première Partie
Gustav Holst – Mars, Les Planètes	1
Sting – Hounds of Winter	2
Chant Grégorien – La tradition du chant grégorien	3
Laurent De Wilde – Moaning	4
Écoutes Deuxième Partie
Vivaldi – Griselda	5
Michel Camillo – One More Once	6
Ecoutes Troisième Partie
Brad Mehldau – Blackbird VO	7
Brad Mehldau – Blackbird HC	8
Brad Mehldau – Blackbird LC	9
Stravinski – Le Chant Du Rossignol HC	10
Stravinski – Le Chant Du Rossignol VO	11
Stravinski – Le Chant Du Rossignol LC	12
Ecoutes Dernière Partie
Dialogue Gauche/Droite	13
Mediterranean Sundance – Di Meola, Di Luca, Mc Laughlin	14
Nancy Sinatra – Bang Bang	15
Chemical Brothers – Lost in the K-Hole	16
Gustav Holst – Mars, Les Planètes	17
Bonus Chant Grégorien – La tradition du chant grégorien	18&19

7.3 Questionnaires

7.3.1 Pour le 22 février 2008

7.3.2 Pour le 13 et 14 mars 2008

7.3.3 Pour le 20 mars 2008

7.3.4 Pour le 21 mars 2008

7.4 Réponses des sujets

Les réponses de chaque participant sont exposées ici. D’une part, il aurait été difficile de mettre chaque questionnaire en entier (150 pages en tout), et d’autre part l’écriture manuscrite ainsi que certaines allusions auraient nuit à l’anonymat de certains. Les réponses sont donc triées par questions, indépendamment de chaque questionnaire, et chaque participant est appelé « sujet N », N allant de 1 à 41. L’ordre chronologique de passage est respecté, ce qui donne la répartition suivante:

22 février 2008	Sujets 1 à 11
13&14 mars 2008	Sujets 12 à 24
20 mars 2008	Sujets 25 à 30
21 mars 2008	Sujets 31 à 41

7.4.1 Ressenti Physique/Rendu spectral et musical

Questions:

Quelles sont vos premières sensations, vos impressions générales?

Comment pouvez-vous décrire le rendu spectral et la restitution des timbres?

Sujet 1: Qualité bien supérieure à celle que j’imaginais. Extraits très reconnaissables. La conduction osseuse donne un ressenti très étrange, ainsi que la localisation qui n’est pas possible. Rendu différent selon la profondeur à laquelle on se trouve. Restitution des timbres: est dans la plupart des cas très reconnaissable, également en classique, jazz, plus compliqué sur les sons électro. Voix parlée très audible, on reconnaît même la personne qui parle. Rendu spectral: difficilement descriptible, meilleures sensations dans le grave.

Sujet 2: Ça marche!! De la douceur, pas d’agressivité. « son téléphonique », gêné par les bruits ambiants. Bande passante de téléphone?

Sujet 3: Ecoute agréble, la son est mono dans la tête. En surface (méthode d’écoute plus simple) les graves et les médiums sont très filtrés.

Sujet 4:Physiquement, le fait de devoir rester la tête bien immergée n’est pas super confortable pour moi… mais:

le buit du tuba est gênant
le fait de n’entendre vraiment que la musique diffusée est très agréable, sensation d’immersion totale.

Spectralement: assez déséquilibré, bosse vers 100 (dimensions de la piscine peut-être). Il manque le haut évidemment…& pas mal de bas aussi. Impression qu’au fond c’est mieux (que la surface est plus « médiums »). Il y a un temps d’adaptation (1 ou 2 extraits). Pas de sensation de localisation.

Sujet 5 : Étonné, je ne pensais pas qu’on percevait un spectre si large.L’image stéréo me semble inexacte. Tout est localisé à l’intérieur de la tête Impression générale excellente. C’est énorme, Etienne t’es le meilleur. Bande passant réduite. Bcp de basses lorsqu’on est en contact avec le fond du bassin. Peu d’aigus, impression qu’on écoute derrière une porte…

Sujet 6: Le son n’est pas très fort. Les basses sont désagréables surtout (air et le jazz). Globalement, c’est agréable et relaxant d’avoir cette musique sous l’eau. Rendu spectral: gêne dans les basses qui sont fortes par rapport aux autres sons, on a la sensation que le haut du ventre résonne. Les timbres sont bien reconnaissables.

Sujet 7 : Expériencee agréable, « bonne » diffusion mais pas homogène, en fonction de la localisation (profondeur) et de la hauteur d’eau. Phénomènes bizarres dans les coins. Rendu spectral inégal ++ dans le haut médium et aigus. Surtt pour les basses (7 pour le classique), présente pour electro et techno: agressivité très proche du fond.

Sujet 8 : Écoute agréable, assez naturelle. Les sons sont « à l’intérieur de la tête » et l’écoute globale fait penser à une écoute au casque. Les bosses qui cognent sont bien ressenties physiquement! C’est plutôt agréable, à voir si ce n’est pas fatiguant à long terme. Étonnant aussi : on perçoit très bien la reverb originale, beaucoup beaucoup plus qu’en écoute aérienne, c’est surprenant. Spectre variable selon la profondeur au niveau des basses: proche de la surface on en perd. Médium grave un peu absent.

Sujet 9: C’est agréable d’écouter de la musique sous l’eau, mais cette ambiance semble assez incontrôlable en localisation. Les timbres sont extrêmement changés. Assez reverb « plate »

Sujet 10: Comme au casque, écoute interne, à l’intérieur de la tête. J’entend mieux les oreilles bouchées (ou alors c’est que j’atténue la conduction osseuse en pressant le crâne…) (rendu spectral et restitution des timbres). Pas mal ! Je trouve que les basses ont du mal à être présentes (on n’a pas le ressenti du choc, comme avec un sub). C’est assez fin mais semble toujours un peu lointain (niveau?)

Sujet 11: Jue suis surprise par autant d’intelligibilité, d’aiguës… etc. Par contre on ressent la musique dans tout notre corps. C’est assez désagréable à fort niveau (techno) (on se demande si le cœur ne fait pas n’importe quoi) on sent que ça ne passe pas forcément par les oreilles car lorsqu’on met la tête hors de l’eau, on n’entend plus mais on sent. Intelligibilité, suffisamment d’aigus pour un son correct. Par contre les graves sont BEAUCOUP trop forts. (tessiture de la contrebasse) et du coup c’est insupportable. En gros ça manque de médium.

Sujet 12: C’est surprenant, on a l’impression d’écouter au casque. L’image a l’air centrale et quand je tourne sur moi- même, je n’ai pas la sensation d’avoir le son qui tourne… Super sur le kick de Sting. J’ai l’impression que c’est un peu « trop » doux dans l’aigu. La zone basse par contre dépend de la profondeur + que de l’endroit o on se trouve dans la piscine. C’est agréable de façon générale.

Sujet 13 : Écoute assez facile et agréable. De grandes différences de timbre, d’intensité et de ressenti physique (vibrations sur le corps) selon la position dans le bassin: très intéressant. Le grace très « bouilli » à la surface de l’eau et en règle générale partout dans le bassin, excepté à proximité du fond et le long des côtés (murs). Les aigus et le ht med se transmettent beaucoup mieux. Les caractéristiques de rythme et des instruments se distinguent de moins en moins bien en s’éloignant des HP.

Sujet 14: Terrible. Bravo pensait pas que ça pouvait marcher aussi bien!! En surface « nasillard » le mieux: dans le fond, coins de la piscine +grave (dès qu’on est près d’une paroi!! le meilleur rendu spectral: totalement immergé et = on veut du grave, plus on se rapproche du fond.

Sujet 15: Sensations agréables mais déroutantes: pas de source précise (sauf très près des enceintes). Le son entoure. Variations en fonction de la profondeur. Bande passante limitée, les transitoires sont écrasées (sensible sur le classique). Rendu inhomogène selon la position dans l’eau.

Sujet 16: Sensations agréables!! Entourée de musique, sans pour autant ressentir précisément sa provenance ( à moins d’être proche des HP) On reconnaît aisément le genre musical, néanmoins: par exemple les basses et les sons percussifs du morceau de variété passent aussi par des sensations physiques, et sont rendus bcp + important que les autres composantes du morceau. Intelligibilité des voix moyenne… Dans l’ensemble: précision moyenne (que ce soit des paroles ou des jeux instrumentaux).

Sujet 17: C’est agréable. Au fond on ressent mieux les basses. A la surface c’est plus équilibré, moins de niveau. Hors de l’eau on perçoit surtout les basses physiquement par le corps resté dans l’eau. La variété et l’électro passent mieux: sons = courts, percussifs, rythmés: rendu moins flou. Rendu spectral: + on va au fd = on perçoit les basses. Dans l’eau à la surface on entend que les aigus, on ressent les basses aussi physiquement. Les timbres sont bien conservés pas de sensations désagréables (à la surface l’image sonore est moins bien définie).

Sujet 18: Wahouu! Etrange sensation que cette omniprésence du son quelle que soit la direction dans laquelle on écoute: il est en nous. (d’ailleurs on l’entend aussi oreilles bouchées) Localisation intérieur du crâne. Très variable en fonction de l’endroit:

pas de basses et de médiums en surface
augmentation de la bande passante si on va plus en profondeur, qui va jusqu’à une très bonne restitution des basses… Fréquence de coupure 100 Hz environ?

Sujet 19: Agréable et surpris en bien par la qualité globale de restitution « propre ». Aigu clair mais peut faire un peu penser au résidu de son entendu l à l’extérieur d’un casque. Quand trop de graves, peut être agressant physiquement. Bonne perception des reverbs. Bas et bas médium pas précis, voire même bourdonnant et gênant physiquement. Médium en retrait. Aigu présent précis et plutôt agréable.

Sujet 20: C’est original et amusant de pouvoir écouter de la musique sous l’eau. Mauvais voire médiocre dans le bas du spectre, moyen – dans le medium. Aigus: moyen, dépend de l’emplacement dans la piscine. Violon peu audible ou uniquement en attaque franche. Instruments sonores tels que la trompette passent assez bien.

Sujet 21 : Agréable, le son est audible. On perçoit les ondes au maxi lorsqu’on est entre les haut- parleurs. Le son est clair, meilleur rendu au fond.

Sujet 22 : l’impression globale est la sensation d’homogénéité du volume. Lorsque l’on se déplace, l’amplitude change peu (sauf si on s’approche beaucoup des haut- parleurs évidemment).Une fréquence ressort dans les médiums (do au milieu du piano). Le son est assez sourd (peu d’aigus, et les basses gonflées.

Sujet 23 : Un son étouffé. Je pensais avoir une écoute plus claire. Pas de son régulier dans tout le bassin, pas de son englobant. L’intensité varie peu selon l’endroit de la piscine, en profondeur, mais de peu. De manière générale les basses sont très présentes excepté pour le morceau classique. Là où il y a peu d’eau, j’ai plus ressenti les vibrations.

Sujet 24 : J’imaginais que l’eau était l’endroit idéal pour écouter de la musique, malgré la double sensation auditive et celle des vibrations, j’ai trouvé que ça manquait de clarté. On entend bien plus les graves à la surface et la musique devient plus homogène en profondeur.

Sujet 25 : La sensation d’immersion est vraiment agréable. Sur le classique, brouillon dans le médium filtrage en peigne.

Sujet 26 : Impression générale agréable, comme un poisson. Spectre manquant beaucoup de médium. Basses augmentent en se rapprochant du fond. Mode audible dans le grave (surtout sur la basse variété).

Sujet 27 ; Surprenant, bonne surprise d’ailleurs… Sensation d’enveloppement entre les HP. Bon ressenti des basses, même avec la tête hors de l’eau. Timbre un peu déformé, devient plus nasal… Le timbre change selon la position d’écoute (entre les HP, en face, pas en face).

Sujet 28 : Sensations agréables des vibrations corporelles dues au son. Vibrations fortement ressenties au niveau des reins et des fesses. Manque de basse globalement. L’extrait du symphonique c’est catastrophique : timbres méconnaissables.

Sujet 29 : La musique est partout, et surtout dans la tête. Il n’y a que là où il y a très peu de fond (loin des enceintes) qu’on entend moins, et encore. Pas trop de remarques à faire pour le rendu spectral. Les aigus sont assez désagréables (oreilles qui « grésillent »). Les timbres semblent un peu « émoussés ».

Sujet 30 : On a une très bonne immersion, j’ai senti une petite différence en me bouchant les oreilles (un peu moins d’aigus). Bien mais on perçoit les résonances gênantes surtout sur le chant grégorien.

Sujet 31 : (deuxième impression) C’est toujours agréable, mais la 1ère surprise passée, le son est moins top… Très variable selon l’emplacement : près des enceintes beaucoup de grave qui traîne et bave entre les enceintes beau medium mais moins de grave et moins d’aigus (comme à travers une petite paroi).

Sujet 32 : Plus fort près des parois et au fond. Bonne température de l’eau, siège confortable, fil ennuyeux pour passer avec le tuba. Beaucoup de basses, surtout près des coquilles Saint- Jaques. Aigus bien rendus au niveau du timbre mais il faut les chercher. Reverb bien rendue pour le grégorien.

Sujet 33 : Le son est très « pur » (comme une écoute dans un casque). Surtout au fond du bassin. J’ai l’impression qu’il y a une légère distorsion.

Sujet 34 : Surprise. Agréable Détendant Envie de faire la planche et de rester immobile. Plongé dans la musique on n’entend pas du tout le bruit extérieur (il y a un groupe bruyant dans l’autre bassin). Étonnamment complet. J’ai l’impression de tout entendre, des basses aux aigus. Il me semble que ce qui passe le moins bien est le grave. Dans la musique classique, le vrombissement des violons n’est pas clairement audible et provoque un peu de saturation.

Sujet 35 : Sympa d’entendre la musique. Bien sûr pas d’image stéréo. Sonne pas très bon par contre. Sting marche très bien, Holst moche. Graves, à la proximité de l’enceinte, pas si t’es loin. A la surface, pop beaucoup des aigus, pas de fondament. Holst, beaucoup de rumble dans les graves ! Vers 1kHz, tout est plus fort, à la surface, son est « loin ».

Sujet 36 : Une sensation de gêne lors de l’audition des graves (cf sensation dans une boîte de nuit avec des basses surpuissantes). Spectral : graves surdimensionnés. Médiums assez bien définis, aigus relativement audibles. Timbres : instrumentaux amplifiés sonnent bien, mieux qu’acoustiques, et que la voix, les cuivres à l’orchestre sont toujours aussi présents…

Sujet 37 : Immersion géniale, + de bas au fond et médium bizarre en surface, Sting passe ++. Pb des oreilles. Oreilles bouchées : son filtré dans le bas, et aigus acides ! Le bas passe par les oreilles !

Sujet 38 : Je me sens bien. On entend très bien. On entend mieux près des enceintes. C’est agréable, surprenant. Globalement, c’est un peu assourdi (surtout les graves, par exemple dans l’électro) (même pour le chant grégorien…). On entend un peu moins les aigus ? La voix (pop) me semblait bien « rendue ». (pop= la mieux ?)

Sujet 39 : Classique : pas assez fort, difficile à dire. Le reste, cool ! Tjrs mono dans la tête. Le masque atténuerait-il la sensation ? (il comprime la tête donc amortit les vibrations). Les basses : impression de « saturation » au niveau des enceintes. L’aigu : s’amorti à mesure que l’on s’enfonce en profondeur : + haut = meilleur équilibre spectral. + bas = moins bon équilibre, peu de haut. Collé au sol = tout se brouille (ça se joue à qq centimètres). Les BF perception difficile de la hauteur, et manque la sensation de choc comme en sono.

Sujet 40 : Pas de sensation de localisation. « environnement sonore », pour moi, meilleures sensations sans masque ni accessoires, plutôt assez immergée (meilleur enveloppement), plus de basses au fond ? Rendu spectral frustrant sur la symphonie (manque de définition et de clarté des timbres) globalement, spectre assez bas-medium.

Sujet 41 : 1. Très agréable sur certains extraits. 2 Assez fatiguant de rester assez de temps en apnée pour avoir le temps d’écouter. La bande passante est réduite en haut (& un peu en bas) Le bas tourne parfois. Timbres « pincés » dans le symphonique. Timbres agréables ds pop (par ex. la voix) & grégorien.

Question : Quelle est votre position d’écoute préférée ? (22fev. 2008)

Sujet 1 : Au fond contre le sol

Sujet 2 : Dans le plan des enceintes : grave et volume Sujet 3 : Au fond du bassin, mais c’est difficile à tenir

Sujet 4 : Vers le fond car : plus de niveau, plus équilibré mais il faut bien se vider les poumons.

Sujet 5 : Plat ventre près du fond. Sensation physique.des basses

Sujet 6 : Allongé sur le dos à l’horizontale

Sujet 7 : Près du fond en eau peu profonde Sujet 8 : Sur le ventre la tête bien immergée Sujet 9 : Près des enceintes

Sujet 10 : N’importe, pourvu qu’on ne soit pas trop près d’une des deux enceintes par rapport à l’autre.

Sujet 11 : Assis par terre avec l’eau au niveau des oreilles

Question : Si elle est différente (de la position d’écoute), quelle est celle qui donne la meilleure écoute ?

(22 fév. 2008)

Sujet 1 : + de détails dans le fond mais pas la plus homogène

Sujet 2 : pas trop loin des enceintes

Sujet 5 : Plat ventre, 50 cm du fond Sujet 10 : j’attends la suite…

Sujet 11 : la même

Question : Si certains morceaux sont moins bien rendus que d’autres, pouvez-vous expliquer pourquoi ?

Sujet 12 : (Symphonique) Peut-être la dynamique. Comme ma nage était elle-même dynamique (je me suis pas mal baladé), je perdais un peu le fil.

Sujet 13 : (Pop) Une prédominance de HM&aigus dans les marqueurs de tempo (over head…), la voix est bien restituée.

Sujet 14 : (Symphonique, chant) moins bien mais ça marche quand même vachement. Trop grande dynamique, passage piano un peu flou. Peu de transitoires, ça définit moins bien. (sympho) trop d’instruments, on perçoit plus facilement si y a juste K+Sn+Bass+Gt+Voix. moins de choses qui s’entrelacent

Sujet 15 : (symphonique, chant) le fait d’entendre de fortes modulations du spectre est gênant sur le chant, et les transitoires manquent au classique.

Sujet 16 : (symphonique) Ts les instrus sont noyés (sans jeu de mot…), je perçois difficilement les différences de timbre globalement

Sujet 17 : (chant) les sons sont trop tenus, masse sonore pas bien définie, brouillée

Sujet 19 : (symphonique) manque de dynamique, médium en retrait, cordes notamment sonnent petit. (electro) bas gênant, trop inhomogène avec le reste du spectre

Sujet 20 : (symphonique, chant) pas vraiment, peut- être pourrait- on adapter les enregistrements pour le subaquatique adapter la dynamique (les – grdes possible) et les fréquences (pas trop de bas medium +de graves et + d’aigus.

Sujet 21 : (symphonique) Symphonie très douce, feutrée

Sujet 23 : (symphonique) trop de finesse dans l’interprétation ou trop de complexité pour les instruments utilisés.

Sujet 26 : (symphonique, chant) Pas de sensation de salle, localisation intra crânienne. Dynamique peu audible

Sujet 31 : (symphonique) trop de dynamique sur le classique, on n’entend correctement que les fortissimi.

Sujet 32 : (symphonique, chant) Parce que la pop et l’électro ont besoin de moins de précision dans le spectre car plus rythmique, et moins de dynamique globale. Les graves sont trop présents, grandes dynamiques (classique)

Sujet 34 : (symphonique, chant) je pense que les instruments se détachent d’avantage les uns des autres. il s’agit plus de sons séparés (que l’on reconnaît individuellement) que d’un ensemble sonore.

Sujet 35 : (symphonique) rumble dans les graves, on entend presque que du bruit. Quand ça devient fort on n’a aucune transparence.

Sujet 36 : (chant) rendu du timbre vocal beaucoup moins fidèle dans l’eau. Musique qui demande une plus grande finesse d’écoute.

Sujet 37 : (symphonique) il faut vraiment être dans un calme supérieur pour apprécier les nuances.

Sujet 38 : (electro) les sons dans l’eau sont « bizarres », (problème de timbre) le chant grégorien pas très clair…(en même temps c’est plus ou moins des fréquences et des timbres proches ?) (j’ai mal écouté l’extrait symphonique)

Sujet 39 : (symphonique) niveau (mastering ?)

Sujet 40 : (symphonique, électro) Peut- être lié aux habitudes d’écoute. On entend souvent du grégorien dans des grandes églises très réverbérantes, donc avec le même type de sensation d’immersion, et on écoute de la pop sur n’importe quel système d’écoute (enfin moi personnellement, donc je suis moins exigeante au niveau spectral que pour du symphonique par exemple.

Sujet 41 : (symphonique) + pop :des sons artificiels= moins déformés. Pas d’espace réel, pas de problème. – symphonique : n’était pas assez fort… Trop complexe et comme il n’y a plus d’espace tout se chevauche comme en mono. Timbres trop altérés. + chant : le signal est bien rendu fréquentiellement & il y a un espace (une reverb) qui rend assez bien dans ce cas là.

7.4.2 Acoustique du bassin/ Homogénéité

Question : Pouvez-vous caractériser l’acoustique du bassin ?

Sujet 1 : Je ne suis pas sûr d’arriver à différencier la part de responsabilité entre ma position d’écoute et l’acoustique du bassin, sur ce que je perçois dans l’eau. Je ne peux donc pas caractériser l’acoustique du bassin.

Sujet 2 : Relativement sec, mais de bonne qualité

Sujet 3 : le champ direct est bien perçu entre les enceintes, mais dès le triangle équilatéral, on a beaucoup de champ diffus.

Sujet 4 : En fait je ne perçois AUCUN espace. La seule « signature » du bassin est cette bosse vers 100Hz (aussi dans les médiums sur les chœurs de l’extrait classique c’était un peu désagréable). Tout ce que je perçois c’est : 1. un changement de niveau (+ près + fort). 2 ; une direction (perte du haut et du bas si je ne suis pas en face). Je ne perçois tellement aucun espace que si je suis loin, j’arrive à imaginer que les HP sont juste à côté de moi et moins fort.

Sujet 5 : Difficilement. On a une différence de niveau en fonction de la distance, et une différence de spectre (pertes de basses et d’aigus en s’éloignant).

Sujet 6 : Plus on va profond plus la sensation d’enveloppement est grande dans la zone « champ proche », on a des sortes de saturation sur les sons forts.

Sujet 7 : Acoustique inhomogène. Peu voir pas réverbérante.

Sujet 8 : Difficile, elle est assez neutre j’ai l’impression. Le son diffus manque juste de pêche et d’extrêmes graves aigus.

Sujet 9 : On a une acoustique qui ressemble un peu à une plate. C’est- à-dire : des aigus claquants et réverbérés assez fortement. Pas d’extrême basse, des basses plutôt colorées, tout comme l’ensemble du spectre.

Sujet 10 :Difficile, la vitesse du son dans l’eau est rapide… Cependant, il y a certains points qui marchent vraiment bien. Pas de notion de réverbération, mais de niveau oui.

Sujet 11 : Le rapport son direct son réverbéré ne varie à aucun moment. Par contre il y a des endroits où il y a globalement un peu plus de niveau.

Question : Avez-vous d’autres remarques ? (partie acoustique du bassin, 22 fév. 2008)

Sujet 1 : Questionnaire assez difficile, je répond par ressenti. Sujet 2 : Il me faut plus de temps pour me faire une idée désolé.

Sujet 5 : L’extrait classique est déjà bien réverbéré, ne nous donne pas d’info sur l’acoustique du bassin. Ceci dit, je n’arrive pas à percevoir d’acoustique sur les autres extraits.

Sujet 8 : La perception change quand on tourne la tête dans le plan horizontal ou dans l’axe du corps. Par contre la localisation est très difficile voire impossible. J’ai perçu de fortes résonances dans le Bach (sur des fréquences de la voix, 2-4kHz). Je ne sais pas si elles viennent des enceintes, de l’acoustique du bassin ou autre.

Sujet 9 : Le son paraît plus grave au centre de la piscine (nœud de résonance ?) la perception solidienne du son est très agréable (vibration des basses dans la tête), et ne dépend pas trop de la position.

Sujet 10 : Etonnant, les bruits humais sont faibles par rapport à la musique !! (bruit de nage, d’eau etc…) Localisations sonnent vers le haut de la tête, un peu vers l’arrière (filtrage ?)

Sujet 11 : Les vaguelettes font de l’aigu en plus, pas autant que ce à quoi je m’attendais, mais quand même un peu. Pas eu le courage de regarder en profondeur, du coup ce que je dis n’est valable qu’à proximité de la surface.

Question : Percevez-vous une différence entre une écoute en surface et une écoute au fond du bassin ?

Sujet 12 : Plus de basse au fond, plus naturel en surface (c’est moi qui suis au fond ou en surface)

Sujet 13 : Une écoute en surface est toujours moins précise et moins agréable qu’une écoute au fond. A la surface, l’éloignement par rapport à l’axe diminue très rapidement la bonne qualité d’écoute.

Sujet 14 : Surface : nasillard. La tête à 30 cm sous l’eau, bosse de 1 à 2kHz assez marquée. Au fond : bosse dans le grave.

Sujet 15 : Différences de spectre : + de basses au fond. Différences du niveau global.

Sujet 17 : À la surface, on perd des basses et de l’intensité : aigus agressifs. Tout au fond : excès de basses, résonances, vibrations

Sujet 19 : En surface, perte de médium et grave boueux. A mi-hauteur, plus équilibré, grave plus propre. Au fond, à nouveau grave boueux, sensation de plus de niveau, mieux qu’en haut, mais un peu comme si on était calé à un mur dans l’air

Sujet 21 : saturation des basses HP en surface et aigus atténués.

Sujet 22 : en surface, on est gêné par les « clapotis », alors qu’en immersion, forcément la restitution est sans parasite, par ailleurs, plus on s’approche du fond plus les graves prennent le dessus.

Sujet 23 : L’écoute est plus forte au fond du bassin. On perçoit mieux les basses (pour les morceaux salsa) et les aigus pour le classique.

Sujet 24 : oui pour le classique la musique est plus limpide, le rendu est plus proche d’une écoute en surface, avec le nid sonore que la piscine peut offrir

Sujet 26 : Nette différence au niveau des basses (+ de basses au fond) si les enceintes sont au fond (trop de basses même)

Sujet 27 : oui 1. Plus on va au fond, plus on arrive à s’affranchir du son extérieur. 2. plus de basses au fond en général.

Sujet 29 : oui, moins « agressif » comme son quand on est en surface, plus agréable. 2 remarques : 1 :le deuxième extrait rend beaucoup mieux que le premier (l’opéra sous l’eau, c’est bof). 2 : En surface on entend les bruits ambiants de la piscine (enfants) alors qu’on ne les entend pas du tout au fond.

Sujet 30 : Au fond on a plus de basses et là on est plus cohérents (en phase ?) En surface, on est un peu détimbré.

Sujet 31 : beaucoup plus de niveau et de grave au fond du bassin à condition d’équilibrer la pression des oreilles au fond !!!

Sujet 32 : + de basses au fond (trop quand enceintes au fond)

Sujet 33 : On entend un peu l’extérieur quand on est à la surface mais le son paraît plus clair, d’où senti plus de graves au fond du bassin.

Sujet 34 : Oui, son plus « plein », plus « enveloppant » en profondeur. Sujet 35 : En bas il y a bien sûr d’autres résonances (modes je crois)

Sujet 36 : L’écoute au fond avec compensation des tympans permet une meilleure définition, surtout dans le medium et l’aigu lorsque les enceintes sont à la surface.

Sujet 37 : En surface, toujours pb de réflexions des mediums. Au fond, équilibré mais manque de corps.

Sujet 38 : Au fond on entend plus fort, mais j’ai l’impression qu’on n’entend pas tout ? On avait un plus grand spectre plus en surface, mais on perd en « puissance ».

Sujet 39 : Le mieux, c’est quand on est placé à mi-hauteur (je l’ai déjà dit à sujet 41, mais il n’est pas d’accord)

Sujet 40 : Oui a priori plus de basses au fond du bassin, plus de définition en surface.

Sujet 41 : J’ai l’impression que lorsqu’on écoute vers la surface, il y a comme une sorte d’accentuation des modes dans les médiums (comme l’apparition d’une mini- acoustique, une réflexion peut- être).

Question : La position des enceintes en hauteur a-t-elle une influence sur ces différences ?

Sujet 12 : Complètement, effet tuning avec gros loudness (100- 200 Hz) qd on est au fond, et en surface, le timbre est moins équilibré (médium 800 Hz renforcé)

Sujet 13 : Faiblement, le champ d’écoute entre les deux HP est plus localisé quand les HP sont en bas. Les localiser en haut n’améliore pas ce phénomène.

Sujet 14 : oui : le rendu des graves est beaucoup plus important avec les enceintes au fond du bassin mais c’est un peu moins défini.

Sujet 15 : oui : résultat plus homogène avec les enceintes en haut. Avec les enceintes en bas, forte différence spectrale entre haut et bas.

Sujet 16 : HP au fond : + grande homogénéité globalement, mais petite amélioration quand on est vers les 2/3 de la profondeur. Pas de préférence entre au fond et à la surface. HP en haut : Attaques molles et peu de précision quand on écoute à la surface. + on se rapproche du fond, + le son est précis et clair : + de dynamique, + de différence entre les sons.

Sujet 17 : Oui je trouve que les enceintes en hauteur augmentent la différence d’homogénéité du spectre et de l’intensité. Enceintes au fond : la musique paraît plus présente on est plus imprégné.

Sujet 18 : Oui a niveau de diffusion égal, le niveau m’a semblé plus important avec les HP posés au fond. Impression que la restitution est plus linéaire avec les HP en surface. Excitation de certains modes propres avec les HP posés au fond.

Sujet 19 : Meilleur équilibre avec les enceintes au fond, mais semble plus homogène hormis extrême grave avec les enceintes en haut.

Sujet 21 : Pour les aigus, meilleure perception. (au fond)

Sujet 22 : Les basses gonflées lorsque les enceintes sont au sol.

Sujet 23 : Oui , l’écoute est marquée par les basses, le son est plus diffus. Sujet 24 : J’imagine que oui

Sujet 26 : Dans les basses en hauteur il manque ce tapis. Si enceintes en hauteur, les diff sont moins perceptibles entre une écoute surface et fond.

Sujet 27 : + de basses lorsque les enceintes sont au fond avec perte de medium lorsqu’on va au fond. Le son est plus précis lorsque l’on reste entre les enceintes dans leur axe de directivité.

Sujet 29 : Que les enceintes soient au fond ou en surface, c’est toujours au fond que le son est le plus fort. Par contre c’est possible que le son soit plus homogène lorsque les enceintes sont au fond (mais c’est très vague comme impression).

Sujet 30 : On entend plus les détails quand on est à la même hauteur que les enceintes

Sujet 31 : La position près de la surface me paraît plus homogène car le son est meilleur en surface. (au fond, c’est assez proche de la position au fond de l’eau).

Sujet 32 : Non, tjs plus de basses au fond, mais plus de basses globalement pour les enceintes au fond. (spectre petit pour une écoute surface (enceintes surface)

Sujet 34 : Oui, lorsqu’elles sont au fond du bassin, on a la sensation que le son est plus fort. J’ai trouvé les basses saturées

Sujet 35 : oui comme j’ai essayé de décrire en haut.

Sujet 36 : Oui, grande différence de rendu global des dynamiques pas musicales au fond (les enceintes), l’écoute est bien meilleure, mais les basses sont surdimensionnées.

Sujet 37 : Carrément ! Enceintes au fond plus de niveau, notamment en écoutant en surface.

Sujet 38 : Enceintes en bas, on entend encore plus fort quand on est au fond, j’ai l’impression que les enceintes en surface améliorent la qualité (la puissance) de l’écoute en surface.

Sujet 39 : J’ai l’impression que ça change moins (que c’est plus homogène en fonction de la hauteur) avec les enceintes en bas, au fond mais bon.

Sujet 40 : J’ai eu l’impression qu’une position des enceintes au fond du bassin accentuait le côté « boumy ». Moins de définition et plus de basses globalement. (Mais c’est peut-être dans ma tête !!)

Sujet 41 : Difficile à dire, peut-être plus de basses quand les HP sont au fond : le son paraît alors moins medium…

Question : Percevez-vous une éventuelle directivité des enceintes ? Pouvez-vous évaluer un angle de directivité ?

Sujet 13 : HP près du fond du bassin je dirais un angle de 60° environ.

Sujet 14 : Bof, qd in se décale, on sent des résonances selon la position, genre des modes selon l’angle.

Sujet 15 : Oui, on perçoit une directivité, mais de là à la chiffrer.

Sujet 16 : Pas de là à définir un angle de directivité ! Disons que dans l’axe des 2 enceintes, on a plus de niveau et de son… c’est plutôt égal partout ailleurs.

Sujet 18 : Oui, surtout au niveau du bas medium (étonnamment ?) 45° Sujet 22 : Non pas vraiment

Sujet 23 : NON Sujet 24 : NON

Sujet 26 : Environ 30° (+/- 15°), en étant proche des enceintes. Sujet 27 : environ 90°.

Sujet 28 : Non

Sujet 30 : La directivité dans l’aigu me paraît très étroite (+/-20°, difficile à estimer)

7.4.3 Dynamique/ Compression

Question : Pensez-vous qu’il soit intéressant de compresser certaines musiques sous l’eau ?

Sujet 12 : Pas eu le temps d’écouter, mais en tout cas ça marche plus sur Sting que sur de la musique classique…

Sujet 13 : Non, je pense que plus om compresse un morceau, moins l’écoute sous l’eau est précise. On a ce sentiment de bouillie, les fréquences ce mélangent.

Sujet 14 : oui : un peu classique trop de dynamique. Non, si on peut rester immobile sous l’eau pour écouter sans perturbation.

Sujet 15 : Oui car certains pics sont très désagréables.

Sujet 16 : Classique : je ne vois pas beaucoup de différence, en même temps, j’étais gênée dans la première partie par les nuances faibles du sympho… Ok pourquoi pas un peu de compression. Jazz : non ! à la compression des trois extraits, je préfère de loin le 2e.

Sujet 17 : Les basses rendent mieux un peu compressées, mais trop de compression rend l’image plate – vivante, les son plus aigus sont moins intéressants (piano par exemple).

Sujet 18 : À part protéger les HP…

Sujet 21 : Par rapport à un phénomène de distorsion de basses, la compression peut devenir un facteur limitant de qualité d’écoute.

Sujet 22 : Pas vraiment

Sujet 26 : Sincèrement non ! Les différences sont difficilement perceptibles. Sujet 27 : Pour l’extrait classique, la compression détériore beaucoup le signal,

moins bonne compréhension de la musique, mauvaise intelligibilité. Pour le jazz, les différences sont moins flagrantes.

Sujet 28 : Peut-être moins pour le classique.

Sujet 29 : Je ne suis pas sûre que ce soit lié à la compression, mais dès qu’il y a un orchestre et surtout beaucoup de violons, le classique sonne un peu soupe. D’un autre côté, dès qu’on s’éloigne un peu de la surface, il y a très peu de bruits qui viennent parasiter la musique. Tout est net, et la compression n’apporte peut-être pas grand- chose (surtout pour le jazz).

Sujet 30 : J’ai l’impression que les forts niveaux font mal plus vite que dans l’air, donc oui pour protéger les oreilles. J’ai aussi l’impression que les Haut- parleurs saturent vite, donc oui à cause de la qualité des HP

7.4.4 Localisation

Troisième partie 22 fév. 2008 :

Sujet 1 : AC/DC : pouvez-vous donner des éléments de localisation ? Caisse claire ?

Connaissiez-vous ce mix auparavant ? oui Extrait symphonique : DDGG

Extrait symphonique stéréo, percevez-vous des plans sonores ? Pas du tout Extrait de maracas : GDGD facile à localiser

Sujet 2 : AC/DC : pouvez-vous donner des éléments de localisation ? NON Connaissiez-vous ce mix auparavant ? non

Extrait symphonique : CCCC

Extrait symphonique stéréo, percevez-vous des plans sonores ? Localisé dans la tête ??

Extrait de maracas : Droite

Sujet 3 : AC/DC : pouvez-vous donner des éléments de localisation ? Non Connaissiez-vous ce mix auparavant ? non

Extrait symphonique : DDGG

Extrait symphonique stéréo, percevez-vous des plans sonores ? Extrait de maracas : GDGDG, pas de problème

Sujet 4 : AC/DC : pouvez-vous donner des éléments de localisation ? Non, éventuellement j’entends les guitares doublées donc je les sépare G/D parce que je connais ?

Connaissiez-vous ce mix auparavant ?oui Extrait symphonique : DDGG

Extrait symphonique stéréo, percevez-vous des plans sonores ? Pas vraiment de localisation sur l’image diffusée.

Extrait de maracas : très difficile à localiser, ponctuel, mais partout en même temps. Ça me fait penser : 1. Aux effets de phase qui rendent la localisation difficile. 2. Quand tu diffuses le même signal sur les 5 HP en 5.1.

Sujet 5 : AC/DC : pouvez-vous donner des éléments de localisation ?non Connaissiez-vous ce mix auparavant ?oui

Extrait symphonique 😕 J’étais derrière

Extrait symphonique stéréo, percevez-vous des plans sonores ? Extrait de maracas : GDGD

Sujet 6 : AC/DC : pouvez-vous donner des éléments de localisation ? non

Connaissiez-vous ce mix auparavant ? non

Extrait symphonique : DDGG position milieu du groupe

Extrait symphonique stéréo, percevez-vous des plans sonores ? Extrait de maracas : GDGD

Sujet 7 : AC/DC : pouvez-vous donner des éléments de localisation ? Très rapidement, semblant de localisation de guitares

Connaissiez-vous ce mix auparavant ? Extrait symphonique : GGGG

Extrait symphonique stéréo, percevez-vous des plans sonores ? non Extrait de maracas : Au point proche, localisation possible GDGD

Sujet 8 : AC/DC : pouvez-vous donner des éléments de localisation ? Peut-être la guitare à gauche ?

Connaissiez-vous ce mix auparavant ? non

Extrait symphonique : DDGG (j’étais à 2m du plan des enceintes). Extrait symphonique stéréo, percevez-vous des plans sonores ? Extrait de maracas : GDGDC

Sujet 9 : AC/DC : pouvez-vous donner des éléments de localisation ? J’étais à peu près à 2m du bord de la piscine, tout est un peu flou.

Connaissiez-vous ce mix auparavant ?oui Extrait symphonique : DDGG

Extrait symphonique stéréo, percevez-vous des plans sonores ? Aucun plan sonore Extrait de maracas : J’entend tout sur la droite, sauf le dernier sur la gauche.

Sujet 10 : AC/DC : pouvez-vous donner des éléments de localisation ?

Connaissiez-vous ce mix auparavant ?non Extrait symphonique : DDGG (j’étais derrière)

Extrait symphonique stéréo, percevez-vous des plans sonores ? Extrait de maracas : GDGD (j’étais devant)

Sujet 11 : AC/DC : pouvez-vous donner des éléments de localisation ?non Connaissiez-vous ce mix auparavant ?non

Extrait symphonique : DDG ?

Extrait symphonique stéréo, percevez-vous des plans sonores ?

Extrait de maracas : GDGDCentre Ouais, on sent que ça se déplace mais pfou ! Faut être concentré.

Question : Pouvez-vous donner des éléments de localisation ?

Sujet 12 : Duo Guitaristes : Localisation des QR OK

Bang Bang : voix à gauche (jaune) et guitare à droite. Je me suis éloigné du centre vers le bord, ça marche encore.

Chemical Brothers : HH à droite (j’ai eu l’impression), puis synthé qui se ballade clairement. J’ai pas fait attention aux voix.

Mars Gustav Holst : Trompette à gauche légèrement (jaune)

Sujet 13 : Duo Guitaristes : 1ère gt jaune, 2e guitare rouge Bang Bang : Voix jaune, guitare rouge

Chemical Brothers : Bass Drums centre, Voix 1 HP jaune, Voix 2 HP rouge, Key se ballade

Mars Gustav Holst :

Sujet 14 : Duo Guitaristes : oui 1 gt solo rouge Bang Bang : Nancy vers jaune, gt vers rouge

Chemical Brothers : Rythmique Mono FX se promènent Mars Gustav Holst : Violons vers rouge, cuivres vers jaune

Sujet 15 : Duo Guitaristes : 1 guitare de part et d’autre Bang Bang : Voix côté jaune

Chemical Brothers : Rien si ce n’est plus de basses côté rouge Mars Gustav Holst : Répartition normale d’orchestre

Sujet 16 : Duo Guitaristes : Je galère pr les guitares… y en avait combien ?

Bang Bang : guiatre d’un côté, voix de l’autre

Chemical Brothers : Batterie à 30°, 1 voix de chaque côté, pas de mémoire pour le reste… Rien de très flagrant pour moi quoi.

Mars Gustav Holst : oulala ! Gros Pb… C’est très large et l’harmonie est à droite. Je devais être face vers l’arrière.

Sujet 17 : Duo Guitaristes : Guitare aigue à droite, + grave à gauche. Percus Bang Bang : Voix à gauche guitare à droite

Chemical Brothers : Voix à droite, mvt gauche droite (je crois). Batterie, je ne me souviens plus, pt-être plutôt centré

Mars Gustav Holst : Position orchestre classique Violon à gauche, cuivres percus à droite

Sujet 18 : Duo Guitaristes : 1 gtr de chaque côté

Bang Bang : Voix sur hp jaune (très clairement) gtr sur hp rouge (un peu moins c) Chemical Brothers : Globalement mono, élément mélodique en arpège (genre mélotron) se baladant g/d

Mars Gustav Holst : Globalement mono, violons un peu sur HP jaune

Sujet 19 : Duo Guitaristes : Deux Gt 1J 1R Bang Bang : Voix a Gauche J guitare droite R Chemical Brothers : Scratch mvt

Mars Gustav Holst : violon et cor enceinte R

Sujet 20: Duo Guitaristes : bof Bang Bang : voix à droite, reste ?

Chemical Brothers 😕

Mars Gustav Holst : violon légèrement à gauche Timbale/ Cor à droite

Sujet 21 : Duo Guitaristes :

Bang Bang : On entend bien les guitaristes dialogues G/D

Sujet 22 : Duo Guitaristes : Deux guitare, une à gauche une à droite Bang Bang : Nancy, jaune, guitare rouge

Chemical Brothers : La voix et le clavier qui se balade de droite à gauche

Sujet 23 : Duo Guitaristes : guitare plutôt ampli jaune Bang Bang : Voix ampli rouge/ musique ampli jaune

Chemical Brothers :Voix ampli jaune/ Instrument ampli rouge Mars Gustav Holst : désespérément mono

Sujet 24 : Duo Guitaristes : Droite

Bang Bang : voix à gauche, instrument à droite Chemical Brothers : à droite

Mars Gustav Holst : au centre et à droite

Sujet 25 : Duo Guitaristes : Ok, un à gauche, l’autre à droite Bang Bang : idem

Chemical Brothers : Pas flagrant. OK pour les voix G/D, pas pour le synthé Mars Gustav Holst : Un peu plus d’air en stéréo, sur réponse cuivres

Sujet 26 : Duo Guitaristes : au début, rythmique rouge, mélodie jaune Bang Bang : Gtr plus large, voix également Gt vers l’enceinte rouge Chemical Brothers : Voix comme avec un traitement HRTF

Mars Gustav Holst : Difficile à définir, mais incomparablement mieux en stéréo

Sujet 27 : Duo Guitaristes : 1ère gt sur rouge Bang Bang : Nancy sur rouge

Chemical Brothers : Mvt Rouge- Arrière- Jaune sur les voix

Sujet 29 : Duo Guitaristes : 1 guitare à J, 1 gt à R Bang Bang : Nancy est à Jaune

Chemical Brothers : Aucune idée pour la localisation, mais c’est carrément mieux en stéréo.

Mars Gustav Holst : C’est un peu de la soupe dans l’eau, cuivres à jaune

Sujet 30 : Duo Guitaristes : 1 guitare de chaque côté, solo à J, rythmique à R Bang Bang : Nancy est à J, la guitare à R

Chemical Brothers :Difficile à localiser

Sujet 31 : Duo Guitaristes : Gauche/Droite assez bien définie Bang Bang : voix jaune, guitare rouge

Chemical Brothers : ? déplacements rouge vers jaune ?

Mars Gustav Holst : Localisation difficile mais sensation d’espace

Sujet 32 : Duo Guitaristes : Gt grave sur R aigue sur J (+ de sensation d’espace)

Bang Bang : Voix sur jaune

Chemical Brothers :Bruitages sur rouge

Mars Gustav Holst : Violons, cors sur R, tp sur J Sujet 33 : Bang Bang : voix côté jaune

Sujet 34 : Duo Guitaristes : Je ne perçois pas l’origine gauche ou droite des sons.

Bang Bang : Idem

Chemical Brothers : Le son grave est très saturé dans les deux cas, encore plus en stéréo

Mars Gustav Holst : Petit son, un peu saturé en mono et beaucoup en stéréo. Très mauvaise qualité d’écoute (je me demande si je n’ai pas les oreilles bouchées).

Sujet 35 : Duo Guitaristes : Localisation guitares vers gauche et droite, le son général est plus transparent.

Bang Bang : Gt d’un côté, voix de l’autre côté, donc localisation Chemical Brothers : pas trop stéréo

Mars Gustav Holst : résonant vers 1 kHz, et pas qu’en mono, localisation pas trop.

Sujet 36 : Duo Guitaristes : Impossible de localiser Bang Bang : Idem

Chemical Brothers : Idem Mars Gustav Holst : Idem

Sujet 38 : Duo Guitaristes :

Bang Bang : La voix côté jaune, le guitariste plutôt rouge (mais bouge un peu) Chemical Brothers : les graves plutôt jaune, voix 1 jaune, Voix 2 rouge

Mars Gustav Holst : Impression des cuivres graves plutôt jaune. J’ai localisé plusieurs sons, mais comment l’écrire ?

Sujet 39 : Duo Guitaristes : Il y a de l’espace, mais difficile à décrire Bang Bang : fille à droite, le reste plus au milieu

Chemical Brothers : Il y a de l’espace mais difficile à décrire

Mars Gustav Holst : les cuivres sont facilement localisables, le reste moins

Sujet 40 : Duo Guitaristes : Bonne stéréo, large sur dialogues guitares

Bang Bang : Basses floues, bonne localisation en fin d’extrait, dans les voix gauche/droite

Chemical Brothers :

Mars Gustav Holst : Localisation assez floue. Impression de largeur sur l’orchestre

Sujet 41 : Duo Guitaristes : Clairement g/d, même quand on s’éloigne

Bang Bang : les sons sont artificiels (pas acoustiques je veux dire, dc c’est plus difficile de percevoir un espace, donc de localiser

Chemical Brothers : ? encore plus dur, Par contre dans la version mono,on entend vraiment les masquages du mono.

Mars Gustav Holst : Cette fois j’ai l’impression de percevoir une image avec un peu de profondeur… (illusion ?), par contre, pas de G/D

Question : Avez-vous des remarques concernant la localisation ?

Sujet 12 : C’est moins évident que dans l’air, mais on y arrive, même loin des HP (dans l’axe)

Sujet 13 : Je trouve dans cet exercice, la localisation est relativement facile à distinguer.

Sujet 14 : Ça marche bien !!

Sujet 16 : Ce n’est pas évident mais c’est possible.

Sujet 17 : On la ressent vraiment dans la tête : côté gauche ou droit qui résonne, c’est étrange comme sensation, pas habituel mais sympa.

Sujet 18 : Des questionnements …! Les règles doivent être différentes Les Δt sont peut-être plus importants que les Δi ? Donc à établir.

Sujet 19 : Meilleure en immersion qu’en surface !!

Sujet 20 : PAN à 100% marche bien, du stéréo mélangé moyen

Sujet 23 : De manière générale, la musique est plutôt englobante et je distingue mieux la provenance des voix.

Sujet 26 : La stéréo, c’est plus aéré ! C’est ça l’avantage de localiser un minimum.

Sujet 27 : Rendu 100 fois meilleur en stéréo.

Sujet 28 : Bien meilleure restitution de l’espace, sensation d’enveloppement, et meilleure précision en stéréo.

Sujet 29 : La stéréo est plus agréable

Sujet 31 : La localisation est très floue, par contre la sensation d’espace est largement meilleure en stéréo (peut- être le problème de repli de la stéréo en mono est-il à incriminer)

Sujet 32 : Il y a une énorme différence lorsqu’on bouche les oreilles : le son devient plus précis et avec moins de graves, la reverb de la piscine doit être perçue via le conduit auditif…

Sujet 33 : La stéréo donne plus d’espace, de sensation de volume, de reverb, même si on ne détermine pas la localisation. Même sensation de « respirer » que l’écoute hors de l’eau (mono/ stéréo)

Sujet 34 : la localisation est plus spatiale qu’en aérien, j’ai eu l’impression d’entendre des bruits en haut et en bas en plus de droite et gauche.

Sujet 35 : J’ai eu du mal à localiser sur l’exemple du dialogue (j’ai dû me concentrer), et sur les autres morceaux, une sensation globale, mais impossible de localiser. Le son stéréo semble plus fort, plus « ample »

Sujet 36 : Je localisais pas grand- chose. Orchestre : presque rien. Selon moi, la localisation n’a pas d’importance dans la piscine, plutôt il faut essayer d’améliorer le son en général, et trouver une solution pour essayer d’avoir un son à peu près égal/ pareil dans tout le bassin.

Sujet 37 : Grosse différence de dynamique et de définition entre mono et stéréo au profit de la stéréo.

Sujet 38 : Je localise peu précisément (est difficile à retranscrire sur papier).

Sujet 39 : C’est un peu comme au casque mais moins large. Il faut que cela soit marqué pour être prégnant.

Sujet 40 : Localisation des basses assez floues.

Sujet 41 : Je crois que pour bien localiser il faut que gauche et droite soient bien séparés (rien au centre) que les sons soient plutôt acoustiques et plutôt simples.

Question : Avez-vous des remarques pour finir ?

Sujet 8 : La musique dans l’air ça sonne c’est clair, dans l’eau c’est beau.

Sujet 12 : C’est super. Bosse dans le bas medium (200, 300Hz) faiblesse un peu dans les aigus, mais c’est agréable.

Sujet 23 : L’écoute sous l’eau demande de la concentration et peu d’activité physique.

Sujet 28 : Expérience très agréable physiquement, détente et massage corporel.

Sujet 31 : Le son est essentiellement dans la tête (surtout oreilles bouchées) avec un espace autour (oreilles débouchées) qui brouille un peu, surtout pour niveau fort.

Sujet 32 : Il finit par faire froid (d’où écriture tremblante). Oreilles bouchées= moins de graves.

Sujet 33 : J’ai senti des différences importantes dès que ma tête était complètement immergée.

Sujet 34 : C’est quand je suis entre les enceintes que le son est le plus distordu.

Sujet 35 : Je ne me sentais pas trop bien dans l’eau à cause de manque d’air et mal aux yeux donc en pratique, pour le confort dans une piscine, on veut se détendre, se relaxer plutôt, c’est-à-dire on veut rester à la surface – là, symphonique ne marche pas, la variété marche mieux, rumble dans les graves. Si on bloque les oreilles avec les doigts, la différence entre bloqué et ouvert n’est pas du tout très grande en comparaison avec dans l’air.

Sujet 36 : Boucher les oreilles coupe les graves de façon spectaculaire (cf. chemical brothers).

Sujet 39 : oreilles bouchées, on perd les graves mais on éclairci le discours, débouchées, on a + de niveau : intéressant. À voir aussi la fréquence de résonance dans le bassin : ça brouille le bas, pb de sensation de hauteur, ça bave, ça sature.

Sujet 40 : Oreilles bouchées : pas de localisation, perte de toutes les basses.

Remerciements

Merci à Corsin Vogel, mon directeur de mémoire, qui m’a accompagné tout au long de l’année avec enthousiasme et clairvoyance.

Merci à Noël Canivenq, fondateur de la société Aquamusique, qui a cru en ce projet, et qui m’a prêté le matériel nécessaire au déroulement des tests. Son aide a aussi été précieuse pour trouver une piscine pour les expériences.

Merci à Bernard Boulet, de la Fédération Française de Natation, et au personnel de la piscine Mathis, pour leur accueil et leur disponibilité. Merci plus particulièrement à Mme Linh Do, la responsable du Service du Sport de Proximité de la ville de Paris.

Merci à Cédric Joder, qui a attrappé une bonne bronchite en m’aidant à faire des expériences préliminaires dans ma baignoire, et qui est quand même revenu à la piscine par la suite.

Merci enfin à tous ceux qui se sont mouillés dans ce projet, et qui m’ont rendu des questionnaires tout trempés, à peine lisibles mais fort intéressants.

Dans l’ordre alphabétique : Romain Allender, Alexis Anerilles, Elise Boisseau, Julien Bourdin, Virginie Burgun, Natacha Canton, Sophie Canton, Sebastien Chonion, Baptiste Chouquet, Clément Damès, Jeanne Delacroix, Mariette Girard, Camille Giuglaris, Mireille Faure, Pierre Favrez, Aurélie Ferrière, Axelle Ferrière, Géraldine Foucault, Julien Hulard, Cédric Joder, Laurent Malys, Aurélie Martin, David Menke, Pierre Merle, Cyrille Métivier, Sylvain Morizet, Matthias Muracciole, Christian Oury, Aude- Marie Piloz, Benjamin Ribolet, Roland Seilhes, Corsin Vogel, Jacques Warnier

juin 2, 2026

La texture en musique : sa contribution pour la composition, l’apprentissage de la musique et ses effets sur la perception et la cognition des enfants sourds implantés

UNIVERSITÉ DE BOURGOGNE FRANCHE-COMTÉ : ÉCOLE DOCTORALE SEPT (Société, Espace, Pratiques, Temps) LEAD UMR 5022

Doctorat de MUSICOLOGIE par Sandrine PERRAUDEAU

Introduction

Au cours de la deuxième moitié du XXᵉ siècle, l’émergence de la notion de texture a ouvert de nouvelles perspectives en matière de composition et d’appréhension de la musique. Le terme apparaît dans le discours de musiciens, analystes, compositeurs et musicologues, chacun lui donnant sa propre définition : nous le trouvons chez Ligeti « Textur » (en langue allemande) dans plusieurs articles de référence¹, chez Peter Niklas Wilson à propos de Ligeti (1992)² et de façon beaucoup plus systématique chez les anglo-saxons avec l’ouvrage « Analytic Approaches to Twentieth-Century Music » de Joel Lester (1989)³ notamment. L’exploration de nouveaux territoires sonores au cours du XXe siècle a bouleversé la perception des auditeurs et des compositeurs, habitués aux règles syntaxiques énoncées dans le cadre du système tonal. Les compositeurs ont alors envisagé l’écriture sous un angle nouveau : l’élargissement de l’instrumentarium (particulièrement dans les familles des vents et percussions), l’emploi de nouvelles techniques instrumentales et vocales, l’influence de la musique électroacoustique fonctionnant avec des masses sonores et des trames autour de l’écriture instrumentale, ainsi que le recours aux nouvelle technologies ont permis de développer une réflexion innovante autour de la matière sonore et de sa spatialisation.

« La musique de demain sera spatiale. »⁴ À cette déclaration du compositeur Edgar Varèse, Zao Wou-Ki, son ami de toujours, répondra en réalisant un tableau « hommage », un an avant la mort du musicien en 1964. Dans cette toile, nous pouvons voir une texture singulière, laissant suggérer la

« collision entre les sons », recherchée par Varèse, où Zao Wou-Ki jouera avec des effets picturaux et des masses colorées grâce à l’utilisation de multiples techniques, de l’aplat au graphisme le plus brut. D’une certaine manière, le tableau produit une partition visuelle engageant une musicalité. Zao Wou-Ki déclarait lui-même : « Vaincre la surface était devenu mon obsession, un défi qui me posait de nombreux problèmes. […] Ainsi, d’une peinture du sentiment, j’étais passé à une peinture de l’espace. »⁵

Figure 1 : Hommage à Edgar Varèse – 25.10.64, de Zao Wou-Ki, (225 x 345 cm), Musée cantonal des Beaux-Arts de Lausanne, 1964. — Figure 1 : *Hommage à Edgar Varèse – 25.10.64*, de Zao Wou-Ki, (225 x 345 cm), Musée cantonal des Beaux-Arts de Lausanne, 1964.

De même, la réflexion du compositeur, théoricien et musicologue, Hugues Dufourt nous semble particulièrement intéressante d’être mentionnée afin de mieux comprendre le contexte :

En 1970, la scission du sonore et du musical était totale. Les musiciens emportaient avec eux le formalisme, les règles, la syntaxe, les lois de la combinatoire, mais ils n’avaient plus prise sur un monde sonore en pleine effervescence. De leur côté les électroacousticiens libéraient les puissances du son, réabsorbant dans de larges trames le bruit, les sonorités complexes et le raz de marée des mixtures inharmoniques. Mais sans accès à l’écriture, ils ne pouvaient formaliser intégralement leurs opérations ni par conséquent contrôler leurs trouvailles. Tel était le dilemme : ou bien une écriture condamnée à fonctionner à vide, dans l’autarcie des systèmes formels ; ou bien une production sonore effective, mais frappée d’une inintelligibilité de principe.⁶

Dès lors, la sensibilité auditive évolue, elle se focalise sur les transitoires d’attaque et d’extinction, les oscillations, le grain, la rugosité et résonancence. À ce propos, la texture bouleversera les codes de l’écriture instrumentale et vocale avec pour représentants des compositeurs comme Morton Feldman, György Ligeti, Gérard Grisey, Iannis Xenakis et Hugues Dufourt. Les musicologues ont alors élargi leur palette analytique en s’emparant de la notion de texture. Les œuvres sont analysées en termes de trames, de lignes, d’étendue spectrale, de masses, de densité, de rugosité, etc. Le musicologue américain Leonard Meyer dans son ouvrage de référence Emotion and Meaning in Music (1956)⁷ consacre un chapitre entier à la texture. L’approche essentielle de ce dernier a permis de mettre en lumière les processus cognitifs et émotionnels de la musique, en faisant référence au jeu des tensions et détentes induites par la matière musicale. Dans ce contexte, « la texture correspond à l’émergence de propriétés à un niveau supérieur. On peut imaginer qu’elle est la manifestation d’un processus d’auto-organisation guidé par diverses contraintes cognitives et attentionnelles. Le cerveau procéderait à des choix, des groupements, des hiérarchies selon des contraintes attentionnelles et mnémoniques et selon l’acculturation et les stratégies d’écoute de l’auditeur. »⁸ Mais c’est surtout les études dans le cadre de « l’analyse de scène auditive », compilées dans le célèbre ouvrage de Bregman, qui vont apporter un cadre théorique à l’analyse de la texture (1990).⁹

Au regard de tout cela, comment étudier et comprendre les fondements cognitifs de la perception de la texture ? Il nous semble intéressant de voir également comment nous pourrions utiliser la texture pour l’analyse d’œuvres de musique contemporaine.

« J’imagine être au bord d’un lac où tout est paisible, lisse. » Ce témoignage d’enfant sourd n’est pas isolé quand il s’agit d’expliquer leur savoir-faire pour classer des textures musicales. Pour certains, la texture est assimilée à une « onde visuelle » qui serait la réunion entre « le sentiment et le mouvement ». Dans notre enseignement au quotidien, l’intérêt porté pour la matière sonore et sa perception chez des enfants sourds nous a toujours fasciné et interrogé : car d’une part, le fait d’écouter de la musique contemporaine ne les rebute pas du tout, contrairement à leurs camarades normo-entendants du même âge, elle semble même stimuler leur imagination, d’autre part, leur musicalité se traduit spontanément par le mouvement car elle est le produit intérieur et instinctif imaginé par leur conscience visio-spatiale tout à fait singulière. Cette capacité d’entrer en résonance corporelle avec des contenus musicaux ou avec les gestes de l’autre nous a permis de changer de point de vue et de remettre en cause notre enseignement pour nous diriger vers des méthodes axées sur les aspects psychomoteurs de l’apprentissage et de l’expression musicale. L’utilisation du corps comme premier instrument repose sur des principes pédagogiques énoncés dans les années 1920 avec des pédagogues comme Jacques-Dalcroze, Orff et Martenot notamment. Ces méthodes actives musicales nous semblent tout à fait adaptées à des enfants sourds. Partant de cela, l’ensemble de nos travaux de recherches ont tenté de comprendre et d’expliquer leur perception de la texture et leur attrait pour la musique contemporaine. Est-ce que la texture ne serait pas un formidable levier pour l’éducation musicale de ces enfants ?

Dans un premier temps, nous nous sommes donc consacrés à faire une revue de la texture d’un point de vue pluridisciplinaire. Par exemple, en synthèse d’image, une texture correspond à une région dans une image numérique ayant des caractéristiques homogènes. Ces caractéristiques sont par exemple un motif basique qui se répète, ou des caractéristiques fréquentielles. Ici, une texture est composée de textels, l’équivalent des pixels. En science des matériaux, et en particulier en métallurgie, la texture désigne une orientation cristalline préférentielle, par rapport à une distribution isotrope des orientations. En science des aliments, la texture est l’ensemble des propriétés rhéologiques (résistance à l’écoulement) et de structure (géométrie et surface) d’un produit alimentaire perceptible par les mécano-récepteurs, les récepteurs tactiles et éventuellement les récepteurs visuels et auditifs. En peinture, la texture désigne la consistance de la toile ou du support sur lequel est réalisée l’œuvre.

Puis, dans notre second chapitre, nous exposerons la texture du point de vue des musicologues et compositeurs, pour définir ensuite les principes d’organisation auditive qui permettent de comprendre sa perception (chapitre 3).

Après l’exposition des implications de la texture d’un point de vue pluridisciplinaire, musicologique et cognitiviste, nous aborderons son statut auprès des enfants sourds. Pour cela, dans notre quatrième chapitre, nous présenterons la surdité et ses conséquences sur leur développement ainsi que les différents moyens de réhabilitation existants. Au regard des multiples travaux expliquant les bienfaits de la musique sur notre cerveau (Kirschner et al., 2009¹⁰ ; Herholz et al., 2012¹¹ ; Tillmann et al., 2014¹² ; Bigand, 2018¹³), nous postulons que la musique pourrait être un outil de stimulation auditive pertinent pour ces enfants. Selon Jacques-Dalcroze, « on n’écoute pas uniquement la musique avec les oreilles, on l’entend résonner dans le corps tout entier, dans le cerveau et dans le cœur. »¹⁴ C’est particulièrement cette écoute corporelle qui nous intéresse aujourd’hui et qui nous a poussé à enseigner la musique tout autrement. Il suffit de penser à la percussionniste et compositrice sourde Evelyn Glennie qui explique : « entendre plus avec son corps qu’avec ses oreilles »¹⁵. Sa déficience auditive lui a permis de mieux comprendre la musique qu’elle aime et de mieux s’y connecter. Elle est le sujet du documentaire Touch the Sound, qui explore cette approche peu conventionnelle et intriguante de la percussion.¹⁶

Dans la première partie du cinquième chapitre, nous nous sommes attachés à donner notre point de vue sur cette notion en proposant deux axes : un axe vertical qui correspondrait aux dimensions de la texture, la densité versus aéré, l’étendue, la couleur, le bruit, etc. et un axe horizontal qui lui se conformerait à la trame, la dimension temporelle, le grain ou la nature (strié ou lisse), etc. C’est pourquoi il nous a semblé intéressant de présenter dans le cadre de ce travail de recherche, quatre analyses texturales à l’aide de l’informatique, en nous limitant aux techniques de visualisation du signal audio. Puis la deuxième partie se focalisera sur les résultats de nos deux expérimentations menées autour de la perception de la texture chez des enfants sourds implantés versus enfants et adultes normo-entendants.

Toute notre démarche musicale auprès des enfants sourds s’est largement nourrie des « méthodes actives » entièrement centrées sur l’enfant, comme celles de Orff, Jacques-Dalcroze, Martenot, etc., que nous détaillerons dans notre dernier chapitre. Chercher tout ce qui permet à l’enfant d’acquérir ce qui lui est nécessaire : recherche par tâtonnement, exploration du mouvement, le corps comme premier instrument. Comme l’écrit si justement Monique Désy Proulx, « la musique nous lie les uns aux autres. En chantant, en jouant ou en dansant à plusieurs, nous ressentons en même temps les mêmes émotions, ce qui nous révèle à quel point nous sommes semblables et nous faisons partie d’un tout. »¹⁷ La musique est avant tout source de plaisir, de sensations, d’expressivité et de création. C’est dans cette perspective que nous avons élaboré nos expérimentations en suggérant que la texture permettrait de stimuler l’expérimentation d’autres pratiques pédagogiques, davantage liées à la découverte du corps, de l’expression du mouvement et de la voix dans toutes ses potentialités.

Chapitre 1 : La texture d’un point de vue pluridisciplinaire

Pour tenter de construire une réflexion intéressante autour de la notion de texture, il nous semble nécessaire de proposer un état de l’art afin de montrer son importance dans des domaines fort variés, car dans notre environnement, la texture est omniprésente. Elle contient des informations visuelles importantes sur un objet et nous permet de distinguer les animaux, les plantes, les aliments et les tissus. Cela fait de la texture une partie importante de l’apport sensoriel que nous recevons chaque jour. Dans les arts visuels, la texture est la qualité de surface perçue d’une œuvre d’art. C’est un élément de conceptions bidimensionnelles et tridimensionnelles qui se distingue par ses propriétés visuelles et physiques perçues.¹⁸ Du point de vue de la recherche, les textures sont classées en textures tactiles et visuelles. Les premières, également appelées textures réelles ou textures physiques, sont des variations de surface comme la fourrure, le sable et les surfaces lisses de la toile, du métal, du verre, ou encore du cuir. La texture physique se distingue de la texture visuelle par une qualité physique qui peut être ressentie au toucher.¹⁹ La texture visuelle est l’illusion de la texture physique. Chaque matériau a sa propre texture visuelle. Les photographies, les dessins et les peintures utilisent une texture visuelle pour représenter de manière réaliste et avec interprétation leur matière. Nous parlerons également dans ce chapitre des textures physiques telles que la géologie, l’anatomie et de l’immensément grand avec la cosmologie. La métaphore du tissu associée à la littérature ou aux arts plastiques questionnera la notion de texture. De plus, l’aspect multidimensionnel de la texture dans la cosmétique et dans la science des aliments sera tout autant abordé dans ce chapitre.

Au demeurant, il s’agit de proposer un parcours autour de la notion de texture à travers une lecture pluridisciplinaire.

1. La texture en cosmologie

En cosmologie, la texture est un défaut topologique de l’univers. Le cosmologiste, Neil Turok est un grand pionnier dans ce domaine. Il a émis une théorie nouvelle sur l’origine du Big-bang. Il propose que le Big Bang ne représente juste qu’un stade d’un cycle infiniment répété de l’expansion de l’Univers et de ses contractions. Ainsi, cela implique que ni le temps ni l’univers n’ont de commencement ni de fin. Des physiciens pensent que cette théorie mérite que l’on s’y intéresse car les équations sur les lois qui régissent l’univers vont à l’infini. Le scientifique est proche de la Théorie des Cordes, développée par Edward Witten, en 1995.

Les défauts topologiques tels que les textures et les cordes cosmiques (à ne pas confondre avec les cordes de la théorie des cordes) sont des structures hypothétiques présumées stables qui se seraient formées dans les premiers instants de l’univers. Les théories impliquant la formation de défauts topologiques prédisent qu’ils seraient apparus à l’issue de la période inflationnaire. Ces textures expliqueraient la formation des grandes structures.

Joseph Silk nous explique que la texture correspondrait à un nœud topologique tridimensionnel. Il considère que le cas des textures est particulièrement intéressant :

Dès lors que la distance parcourue par la lumière depuis le big-bang devient comparable au rayon d’une texture, celle-ci s’effondre et emporte avec elle toute la densité d’énergie associée. Lorsque sa taille atteint environ 10-30 centimètres, le nœud se défait. Ce phénomène s’accompagne de l’émission d’une salve de particules interagissant faiblement connues sous le nom de « bosons de Goldstone ». La densité d’énergie associée à la texture et à la couche en expansion de ces bosons pousse la matière ordinaire environnante, qui forme alors les structures

que l’on observe aujourd’hui. La matière ambiante répond par des fluctuations en densité qui conduisent à la formation de galaxies, d’amas de galaxies et de structures plus vastes encore.²⁰

Néanmoins pour le moment, depuis les observations du satellite Cobe, les modèles basés sur des cordes cosmiques et les textures sont considérés en général comme non viables. Les observations ne permettent pas d’expliquer majoritairement l’apparition des grandes structures de l’Univers à partir de zones de surdensité créées par des cordes cosmiques, ou en liaison avec les textures. Mais cela ne veut pas dire qu’il n’en existe pas ! Simplement, leur rôle ne peut être que très minoritaire.

2. La texture et l’anatomie

L’anatomie humaine se divise en deux grandes parties : l’anatomie physiologique qui étudie les organes sains, et l’anatomie pathologique qui étudie les organes malades. « Lorsque l’anatomie s’occupe de toutes les qualités des organes qu’on peut observer sans les diviser, elle prend le nom d’Anatomie des formes, des connexions, ou d’Anatomie descriptive. Quand elle s’occupe de leur texture intime, elle est désignée sous le nom d’Histologie ou d’Anatomie de texture. »²¹

Aujourd’hui, l’Histologie fait référence à l’étude des tissus biologiques. Elle étudie la structure de ces tissus à un niveau microscopique et permet de comprendre leur fonctionnement normal ou pathologique. Elle se situe au carrefour de la biologie cellulaire, de l’anatomie, de la biochimie et de la physiologie. Le terme de tissu désigne un ensemble de cellules présentant une structure semblable et remplissant une (ou des) fonction commune. Un tissu peut être un tissu simple ou un tissu composé. Dans le corps humain, il existe quatre tissus simples ou primaires : le tissu épithélial, le tissu conjonctif, le tissu musculaire et le tissu nerveux. Un tissu composé est une combinaison de tissus simples associés morphologiquement et fonctionnellement.

Ainsi, « la plupart de nos organes contiennent des tissus des quatre groupes primaires, la disposition de ces derniers au sein de l’organe, avec la participation d’éléments vasculaires et d’éléments nerveux, déterminant sa structure et ses capacités fonctionnelles. »²²

Figure 2 : Description générale des quatre tissus fondamentaux.²³

3. La texture en géologie

La texture, observable au microscope, concerne la disposition élémentaire des minéraux, définie par leur taille (granulométrie), leur forme et leur arrangement. La texture d’une roche est comme une empreinte digitale car elle nous renseigne sur son environnement de formation.

Nous distinguons ci-après une liste des principales textures souvent associées à des roches magmatiques et métamorphiques.²⁴ Toutefois la variété des textures est si grande qu’il n’est pas envisageable dans le cadre de notre recherche d’en faire un catalogue exhaustif.

3.1. Les roches magmatiques

Texture phanéritique (ou grenue) : concerne les roches magmatiques dont le grain est visible à l’œil nu. La taille des minéraux varie entre 1 et 5 mm et sont le plus souvent équigranulaires. La texture phanéritique indique un refroidissement lent du magma. Le granit en est l’exemple le plus courant.

Texture aphanitique : concerne les roches magmatiques qui ne montrent pas de cristaux visibles à l’œil nu, ni même au microscope. La taille de ces minéraux est généralement plus petite que 1 mm.

Texture vitreuse : cela correspond aux roches magmatiques qui sont entièrement ou en grande partie constituées de verre.

Texture pegmatitique : texture d’une roche magmatique ayant des minéraux de dimension centimétrique, décimétrique ou exceptionnellement métrique. La texture pegmatitique indique un refroidissement très lent du magma.

3.2. Les roches métamorphiques

Texture granoblastique : C’est une texture sans orientation des minéraux. Les roches sont formées de minéraux en granules, comme par exemple les quartzites et les marbres.

Foliation : Texture avec orientation des minéraux. Alternance de lits de minéraux différents. La roche présente des feuillets alternés de divers minéraux, tantôt clairs, tantôt sombres.

Schistosité : C’est une texture avec orientation privilégiée des minéraux. Disposition orientée des minéraux en plans parallèles, plus ou moins marqués.

Depuis longtemps en géologie-géophysique, l’analyse quantitative de textures a pu fournir des informations essentielles sur l’histoire des déformations des roches et pour interpréter l’anisotropie observée dans la propagation sismique.²⁵ L’obtention de matériaux texturés a subi, de fait, un essor sans précédent. Il nous semble par conséquent important de faire le point sur les textures cristallographiques.

4. Texture et Cristallographie

La cristallographie est la science qui se consacre à l’étude des substances cristallines à l’échelle atomique. Les propriétés physico-chimiques d’un cristal sont étroitement liées à l’arrangement spatial des atomes dans la matière. Elle étudie la formation, la croissance, la forme extérieure, la structure interne, et les propriétés physiques de la matière cristallisée. Après avoir fait partie de la minéralogie, la cristallographie est devenue, depuis la fin du XIXᵉ siècle, une science indépendante apte à pouvoir mener l’étude de la morphologie, de la texture et de la structure des cristaux. Elle est le fondement de plusieurs autres domaines, dont la physique, la chimie, les mathématiques, la biophysique, la métallurgie en général, l’électronique, etc. Comme le souligne l’historien Denis Guthleben, « En pénétrant la structure des matériaux, la cristallographie a ouvert un champ immense de connaissances. Et ce champ n’a fait que s’élargir à mesure de l’amélioration des générateurs de rayons X, puis de la découverte de nouvelles méthodes pour l’étude de structures toujours plus complexes. »²⁶ Cette science trouvait déjà ses racines dans la philosophie grecque antique avec Platon et ses disciples, en grande admiration devant la perfection de la forme de ces cristaux.

Dans ce domaine, la texture est la description de la forme, des dimensions, et de l’orientation mutuelle des monocristaux dans un matériau polycristallin (constitué d’un ensemble de monocristaux) comme un métal, une poudre, un sol, une céramique, etc. La diffraction des rayons X ou des neutrons permet d’accéder à cette texture. Il apparaît essentiel aujourd’hui de développer un maximum de techniques afin de caractériser au mieux la texture pour une bonne maîtrise des propriétés d’usage des matériaux.²⁷

Figure 10 : Exemples de résultats de l’analyse quantitative de texture magnétique présentés sous la forme de figures de pôles directes.²⁸

Dans le domaine de la science des matériaux, un grand nombre de travaux ont pour objectif de décrire et d’optimiser le comportement macroscopique des métaux et alliages, à partir de la caractérisation et de l’analyse de leur microstructure et de leurs mécanismes fins de déformation. Pour cela, les scientifiques ont alors besoin de mesurer la texture, les déformations, pour suivre au plus près le comportement du matériau étudié. Nous ne détaillerons pas ici les différents principes des mesures de ces textures, car ce domaine d’étude scientifique fort complexe n’est pas le nôtre.

5. Texture et sciences des aliments

La texture et la sensation en bouche sont des propriétés sensorielles fondamentales des aliments. Datant d’un siècle environ, l’analyse de la texture des aliments est un domaine scientifique qui a réellement pris son essor au début des années 1960, notamment grâce aux travaux de R.H. Scott Blair et A.S. Szczesniak.²⁹ La définition donnée par Szczesniak en 1998 est la plus représentative :

La texture est la manifestation sensible et fonctionnelle des propriétés structurales et mécaniques des aliments, détectées par les sens de la vision, l’ouïe, ainsi que le toucher et les perceptions kinesthésiques.³⁰

L’analyse de la texture dépendra donc de la sensation ressentie lorsque ce produit est mis en bouche avant son ingestion. « Un des premiers travaux de l’analyse de texture va consister à nommer ces sensations le plus objectivement possible, c’est-à-dire à interpréter un champ sensoriel par la parole. »³¹ La texture est un des critères principaux utilisés par les consommateurs pour juger de la qualité et de la fraîcheur des produits. Dans le domaine alimentaire, la texture est considérée essentiellement comme une propriété sensorielle et regroupe un grand nombre de termes. Nous pouvons citer, entre autres, la tendreté pour la viande, l’onctuosité ou la fermeté pour des fromages, l’aspect collant pour des pâtes ou encore les caractères craquant, friable, dur et croustillant pour des biscuits, etc.

Figure 11 : Exemples de différents types de textures alimentaires.

Le développement de nouvelles textures peut être considéré comme une source d’innovation majeure pour le secteur alimentaire. Lors de la dégustation, la texture est appréciée en trois phases : une phase d’attente, de mastication et de déglutition. Au cours de cette dernière phase, les informations de textures peuvent être de nature très variée. Selon ses caractéristiques de surface, la texture peut se révéler rugueuse, lisse, fibreuse, humide, grasse, etc. Elle peut avoir des caractéristiques mécaniques primaires comme la dureté, l’élasticité, la viscosité, etc., ou encore des caractéristiques géométriques telles que la granulosité ou la forme et l’arrangement des particules dans le produit en question.

Divers travaux autour de l’évaluation sensorielle de la texture ont démontré l’importance des sensations acoustiques pour la perception du croustillant.³² La hauteur du son émis lors de la morsure et de la mastication nous permet par exemple de différencier le croustillant (bruit aigu, correspondant à une fréquence élevée) du croquant (bruit grave, correspondant à une faible fréquence). Les stimulus auditifs ont donc une importance capitale dans la perception de la texture.

Quant à la vue, elle nous permet d’anticiper la texture de l’aliment qui va être consommé : elle nous prépare à mordre avec une vigueur appropriée.

Ainsi, tous les sens sont concernés : le toucher lors de la prise du produit et dans la mise en bouche, la vue lors du choix, l’ouïe lors de la mastication. Le goût et l’odorat interviennent également dans notre perception des différentes saveurs. Le goût permet d’identifier les substances chimiques sous forme de solutions par l’intermédiaire de chémorécepteurs. Quant à l’odorat, il permet de détecter les substances chimiques volatiles.³³

De plus, il existe également des méthodes instrumentales. Elles révèlent de la rhéologie. Il existe trois grandes catégories de mesures de la texture : des méthodes fondamentales (mesure de la viscosité, de la dureté, de la résistance ou de la fragilité d’un matériau alimentaire), des méthodes empiriques basées sur trois principes fondamentaux de la déformation (la flexion, le cisaillement et la compression) et enfin les méthodes imitatives (imitation de l’action des dents par exemple).³⁴ L’analyse instrumentale peut conforter l’analyse sensorielle dans le cadre du respect de certaines réglementations, voire en matière d’innovation.

6. La cosmétique et la texture

La texture d’un produit est une notion complexe et multidimensionnelle. Comme nous l’avons exposé précédemment pour le domaine alimentaire, avec la définition de Szczesniak notamment (1963), elle peut être définie de manière similaire pour l’évaluation de produits cosmétiques. Ainsi, la perception de la texture de produits cosmétiques, types crème ou lait, peut être divisée en 4 étapes, correspondant à l’ensemble des sensations perçues au fur et à mesure qu’elles apparaissent lors de l’évaluation d’un produit (Schwartz, 1975³⁵ ; Civille & Dus, 1991³⁶) :

L’apparence, comprenant les propriétés visuelles d’un produit avant toute manipulation,

Le pick-up, correspondant aux propriétés sensorielles du produit perçues avant application, lorsque le produit est prélevé dans son contenant,
L’application ou pénétration, comprenant les propriétés du produit développées durant son application sur la peau,
L’apparence résiduelle et la sensation au toucher, correspondant aux effets visuels, tactiles, olfactifs et kinesthésiques du produit sur la peau, après application.

Ainsi, la perception globale de la texture est rendue possible par l’intégration de nombreux stimuli rendant compte de cette muldimensionnalité.³⁷

Le secteur de la cosmétique adapte les textures de ses produits et innove avec des expériences sensorielles surprenantes. L’efficacité d’un produit de soin cosmétique passe aussi par sa texture. D’ailleurs, les acteurs de ce marché l’ont très bien compris. Depuis quelques années, l’innovation dans ce domaine consiste à créer des textures à transformation : par exemple, une mousse qui se transforme en huile, une crème qui devient un masque caoutchouteux ou encore un gel qui se métamorphose en mousse pétillante. Toutes ces années de recherche scientifique payent et donnent des résultats tout à fait surprenants.

Figure 12 : Exemples de différents types de textures en cosmétique.

7. La texture et l’image

La texture est une caractéristique importante pour la segmentation de divers types d’images, que ce soit de l’imagerie médicale, agronomique ou industrielle. Parmi les principaux éléments d’interprétation du message visuel pour un observateur humain, nous pouvons citer les contours, la couleur, la forme, etc… Le système visuel humain se révèle extrêmement performant pour caractériser les textures en utilisant des termes comme lisse versus rugueuse, fine versus grossière, granuleuse versus fibreuse, régulière versus irrégulière, etc. Nous verrons que ces termes seront également pertinents pour l’analyse de la texture musicale.

De manière générale, nous pourrions dire que l’analyse de l’image consiste à extraire un certain nombre de propriétés caractéristiques puis de les exprimer sous forme paramétrique. Par conséquent, les divers paramètres calculés vont permettre de décrire, de caractériser, de segmenter et d’analyser les images. Selon la situation, l’analyse sera tantôt globale ou locale. Malgré son importance en traitement d’images, la texture ne présente pas de définition précise universelle à ce jour.³⁸

Un grand nombre de méthodes existe pour la discrimination de textures. Cependant, il est possible de les regrouper en deux grandes familles : les méthodes statistiques et les méthodes structurelles. Dans la première, représentée entre autres par les nombreux travaux d’Haralick dans ce domaine, la texture est considérée comme étant un phénomène à deux dimensions. Les caractéristiques requises sont obtenues par des approches telles que les matrices de co-occurence, la fréquence spatiale, la corrélation ou les modèles paramétriques.³⁹

Quant aux méthodes structurelles, elles caractérisent la texture par des primitives élémentaires appelées texels et par l’arrangement spatial de ces primitives. Même si elles sont apparemment plus proches de la manière dont le système visuel opère, les méthodes structurelles sont souvent plus complexes que les méthodes statistiques. Elles réagissent de manière aléatoire quand elles rencontrent des textures faiblement structurées comme l’herbe, le feuillage ou la laine par exemple.⁴⁰

Gagalowicz propose une synthèse des deux approches en considérant « la texture comme une structure spatiale constituée de l’organisation de primitives (ou motifs de base) ayant chacune un aspect aléatoire ».⁴¹ Il semblerait que l’approche statistique soit mieux adaptée à une approche neuronale notamment. « En effet, l’expérience montre que les réseaux de neurones présentent leurs pleines potentialités lorsqu’il s’agit de traiter des données floues, bruitées, partiellement incohérentes. Lorsque les données à traiter sont de haut niveau (ce qui sera le cas avec une approche structurelle), une approche système expert est généralement supérieure. De plus, un grand nombre de textures naturelles peuvent être vues comme des champs aléatoires. »⁴²

La création de plusieurs bases de données d’images de « textures couleur » démontre l’intérêt grandissant de la communauté scientifique concernant l’analyse de celles-ci. La nécessité de disposer de bases de références communes témoigne de cette importance. La base Brodatz est devenue la base de référence des textures monochromes par exemple.⁴³

Figure 13 : Extraits de textures de la base de Brodatz.

La base VisTex est une autre collection d’images couleur de textures représentatives de ce que l’on peut trouver dans le monde réel.⁴⁴ L’étude de la texture des objets d’une image peut avoir des objectifs très divers : obtenir des informations sur la nature d’un objet, segmenter l’image en régions homogènes, améliorer la qualité de l’image (restauration), identifier la texture afin de la réduire à un ensemble de paramètres (compression d’images) etc…

8. La texture et la photographie

En photographie, la texture se définit comme un outil visuellement dynamique qui sert à accentuer les grains de la surface d’un objet. Elle est la structure même de la matière dont les éléments ne sont pas distinguables à l’œil nu. Ainsi, par extension, une texture désigne toute image représentant une surface d’aspect irrégulier qui ne représente rien d’autre que cette matière. C’est pourquoi la texture se rattache davantage au sens du toucher qu’à celui de la vue, car une photo de texture réussie est une photo que l’on a envie d’effleurer. La lumière est essentielle pour rendre compte de la texture. Selon Jacques Fontanille, la texture et sa relation avec la lumière est entièrement déterminée par la dichotomie représentation versus ostension et s’incarne dans le concept de « lumière-matière ».⁴⁵ Dans le cas de la texture ostensive, la lumière rencontre les différentes discontinuités de surface et produit des ombres. Dans l’autre cas, la lumière représente les différences tonales. Ce qui ne relève pas du tout de la même perception, l’une est bien réelle tandis que l’autre est fictive. La texture serait comme une « fiction du matériau de l’objet (verre, métal, etc.)» pour reprendre une expression de la sémioticienne Anne Beyaert.⁴⁶

La texture d’une photographie dépendra aussi de la pellicule utilisée. Selon la nature du grain, le rendu de la texture sera très différent : un photographe choisira toujours sa pellicule en fonction de l’environnement dans lequel ses photos seront prises, c’est-à-dire avec peu ou beaucoup de lumière et en fonction du type de texture qu’il désirera obtenir. La taille du grain photographique dépend de la sensibilité du film à la lumière. Moins un film est sensible, plus son grain sera fin. La sensitométrie permet de mesurer de manière scientifique la réaction d’une pellicule à la lumière, le seuil de sensibilité à partir duquel elle réagit et d’en tracer la courbe. Cette sensibilité est codifiée par la norme ISO (International Standards Organisation) qui regroupe les deux anciens systèmes les plus utilisés : ASA (American Standards Association) et DIN (Deutsches Institut für Normung).

Dans un souci de conserver ou d’archiver des photos, la composition de la texture est primordiale afin de connaitre l’origine d’une photographie d’art notamment. Pour s’assurer de l’authenticité ou de l’origine d’une photographie d’art, les conservateurs de musée ou les experts spécialisés examinent une à une les oeuvres, et les comparent à des photographies de référence.

Figure 14 : Berenice Abbott, Soap Bubbles, 1945-46, New York. — Figure 14 : Berenice Abbott, *Soap Bubbles*, 1945-46, New York.

L’inspection des caractéristiques visuelles et tactiles de la texture du papier photographique permet de s’assurer que deux photos différentes ont bien été tirées sur des feuilles produites par un même fabricant, grâce à l’utilisation d’une quantification de l’évolution de la rugosité de la texture sur tout un continuum d’échelle.⁴⁷ La texture de la surface du papier photographique est une caractéristique essentielle de sa fabrication, de sa commercialisation et de son utilisation.

9. La texture et le texte

Dans ce contexte, de façon générale, la texture correspond à la manière de disposer les différentes parties d’une œuvre (poème, texte, etc.). Plus précisément, le linguiste Jean Michel Adam, auteur de nombreux ouvrages de linguistique textuelle, s’est particulièrement intéressé à cette notion de texture.

Figure 15 : Schéma général de la Textualité de Jean Michel Adam.⁴⁸

Rappelons que la problématique du texte renvoie à la problématique de la parole chez Saussure notamment⁴⁹, comme le souligne le sémanticien François Rastier :

La façon la mieux éprouvée de réduire Saussure, c’est d’en faire un théoricien de la Langue, alors même que la valeur est déjà un phénomène contextuel, et qu’il envisageait explicitement dans ses cours deux linguistiques complémentaires, celle de la langue et celle de la parole.⁵⁰

Pour Adam, le discours est une pratique discursive qu’il faut étudier dans sa dimension communicationnelle-discursive, d’une part, et dans sa dimension textuelle, plus purement linguistique, d’autre part. « C’est ce qu’illustrent les deux parties du schéma général de la textualité (cf. figure ci-dessous) et de la discursivité, parties aussi inséparables, pour reprendre l’analogie saussurienne, que le recto et le verso d’une feuille de papier. »⁵¹

Jean Michel Adam explique que la grammaire de phrase et la grammaire de texte sont responsables de ce qu’il appelle la « texture phrastique et transphrastique » (cf. schéma ci-dessous).

Figure 16 : Plan d’organisation de la texture.⁵²

Pour le philosophe Jacques Derrida, la notion de texture est fondamentale. Il nous conduit à voir la texture du texte et la texture du sens en utilisant trois métaphores : la métaphore géologique de la « couche », la métaphore textile du « tissu » et de la « couture », et enfin la métaphore organique de la « greffe ». Toutes ces métaphores sont intimement liées, donc impossible de les traiter séparément.⁵³ Joseph Igor Moulenda nous relate que pour Derrida, « la structure du sens et du langage en général, est semblable à celle d’un tissu, composée d’un enchevêtrement inextricable de fils. »⁵⁴ Cette métaphore du « tissu » est très importante pour le philosophe car « tissu veut dire texte ».⁵⁵ Comme aucun tissu n’est tissé d’un seul fil :

C’est donc à la manière d’un tissu que Derrida décrit la texture d’un texte comme rapport irréductible et inextricable de différents fils entrelacés les uns sur les autres, agissant les uns sur les autres et jamais les uns sans les autres. Tout ceci se fait de la manière dont se tisse une toile d’araignée. Derrida dresse d’ailleurs un parallèle entre les notions de tissu, de toile, d’étoffe, de voile, en voyant en elles un seul trait commun, le tissage. A ce titre, aucun prélèvement, aucun démêlage, aucun isolement de fils n’est possible.⁵⁶

Finalement, le tissu comme support, matière ou modèle traverse toute l’histoire des arts : que ce soit en philosophie sous la forme de métaphore chez Derrida ou comme nous le verrons dans le chapitre suivant, sous forme d’analogies dans d’autres disciplines artistiques. Françoise Bort et Valérie Dupont l’ont magnifiquement démontré dans leur ouvrage Textes, texture, textile. Variations sur le tissage dans la musique, les arts plastiques et la littérature :

La racine étymologique qui lie la notion de texte au champ lexical du tissage établit un jeu d’échos entre la patience de Pénélope à défaire et refaire son ouvrage et le travail même du poète et l’image du tissage surgit encore, tout naturellement, dans la terminologie de Derrida pour définir ce qui fait l’essence même d’un texte.⁵⁷

10. La texture et les textiles

Depuis toujours, dans chaque région du monde existe des tissus, des textiles divers et variés, fabriqués selon des processus plus ou moins élaborés. Ces procédés de fabrication proviennent de deux matériaux naturels, à savoir les matériaux d’origine animale ou végétale. Dans la première catégorie, « nous pouvons citer la laine, la soie, la peau, les tendons, les écailles de poisson et les plumes. Les matières végétales correspondront au coton, lin, chanvre, ramie, graines, écorce. »⁵⁸ Aujourd’hui, les fibres synthétiques que nous connaissons, sont obtenues par synthèse moléculaire. À chaque matière est associée une action particulière : tissage, peignage, traction, tension, etc. Toutes ces manipulations correspondent à un grand nombre de traitements produit par les hommes de tout temps et de toutes origines sur des fibres naturelles, cultivées ou artificiellement produites.⁵⁹ Erik Orsenna en témoigne dans son ouvrage Voyage Aux Pays du Coton : Petit Précis de la Mondialisation :

« Pour comprendre les mondialisations, celles d’hier et celle d’aujourd’hui, rien ne vaut l’examen d’un morceau de tissu. Sans doute parce qu’il n’est fait que de fils et de liens, et des voyages de la navette ».⁶⁰ De cette façon, la texture d’un tissu est déterminée par la fibre, le fil, la structure (c’est-à-dire le tissage, le tricot, etc.) et la finition. Les fibres sont les plus petits composants d’un tissu, néanmoins leurs caractéristiques influencent considérablement la texture. Par exemple, la laine donne généralement des textures douces tandis que le lin donne des textures nettes. De courtes longueurs de fibres discontinues ou de longues fibres continues à filaments, sont torsadées pour former des fils. Le type de fibre, leur procédé d’assemblage et la quantité de torsion du fil peuvent être modifiés pour produire différentes textures.

La structure du tissu peut être tissée (ensemble de fils insérés à angle droit par rapport à un autre ensemble qui est tendu), tricotée (série de points de boucle interbloquants), non tissée (bande de fibres synthétiques comme la résine, la chaleur et la pression, ou l’aiguilletage), ou d’autres constructions telles que le feutre ou la dentelle. La manière dont les fils sont combinés dans la structure du tissu détermine des aspects de texture tels que le poids, la souplesse, la fermeté ou la compressibilité, ainsi que les caractéristiques de stabilité ou d’étirement du tissu.

L’artiste américaine Sheila Hicks, sculptant le textile depuis plus de 50 ans, a fait l’objet d’une magnifique exposition au Centre Pompidou à Paris, au printemps 2018. Certaines propriétés de la matière textile, à savoir la texture et la couleur qui attirent les regards, vont devenir les points centraux du travail de cette artiste. On peut remarquer combien la texture du textile participe du sentiment de la couleur.

Figure 17 : Sheila Hicks, The Silk Rainforest (fils de soie), 1975, silk, linen, and cotton, (243.8 x 685.8 x 7.6 cm), Smithsonian American Art Museum. — Figure 17 : Sheila Hicks, *The Silk Rainforest* (fils de soie), 1975, silk, linen, and cotton, (243.8 x 685.8 x 7.6 cm), Smithsonian American Art Museum.

La perception sensible du coloris teint est totalement différente de ce qui se rencontre dans d’autres arts : l’artiste n’utilise pas les pigments, comme un peintre, mais des matières le plus souvent déjà colorées dont l’éblouissement dépend de la nature du matériau. Les différences de teintes seront multiples puisqu’un même colorant n’imprègnera pas de la même manière de la laine, du coton, du lin ou de la soie. Elle explique d’ailleurs ceci à propos de ses installations :

Le textile est un moyen incomparable pour construire le dialogue avec l’autre. Chacun peut venir ici, s’asseoir, commencer la conversation tout en manipulant des fibres. Il n’y a pas une bonne manière de faire ou une mauvaise. Vous pouvez tisser de manière incorrecte et quelque chose en sortira, un « bâtard » très intéressant. Bien sûr les couleurs et les textures sont très importantes dans ce que je fais. Il y a un aspect expérimental. Il y a de l’humour mais c’est aussi une chose sérieuse. Il faut faire l’effort de comprendre comment ça fonctionne.⁶¹

Les gestes de tisser, de broder, de coudre etc., se retrouvent dans le travail d’un grand nombre d’artistes venant d’horizons très différents, que ce soit chez Ghada Amer, Mona Hatoum ou encore Hella Jongerius.

Figure 18: Mona Hatoum, Pom Pom City, 2002, Natural wool, (5,1 x 365,8 cm), The Barbara Lee Collection of Art by Women. — Figure 18: Mona Hatoum, *Pom Pom City*, 2002, Natural wool, (5,1 x 365,8 cm), The Barbara Lee Collection of Art by Women.

L’artiste libanaise Mona Hatoum aime travailler les matériaux et employer des techniques traditionnelles comme la broderie, le tissage sur métier, la pratique des nœuds.

L’exposition Entrelacs, une recherche tissée de l’artiste néerlandaise Hella Jongerius se déroule en ce moment à la Fondation Lafayette Anticipations à Paris (du 7 juin-8 septembre 2019). Elle a conçu tout un projet autour du textile et du tissage. Hella Jongerius compte aujourd’hui parmi les figures les plus importantes du design international. Au sein du Jongeriuslab, basé à Berlin, ses recherches théoriques et expérimentales portent conjointement sur la couleur, le matériau et les textures explorées à l’infini. Dans ces méandres de textiles, des morceaux hybrides de différentes épaisseurs et textures – tressés, rembourrés ou effilochés provoquent une vibration qui frôle l’illusion perceptive. Dès cette installation monumentale et radicale, l’ambition de la designer Hella Jongerius est annoncée : transformer la fondation Lafayette Anticipations en un immense atelier explorant les riches et nombreuses potentialités du fil. Ainsi, les visiteurs sont amenés à suivre la designer et son équipe dans l’entièreté du bâtiment : un métier monumental de 16 mètres de haut nous accueille dès le hall d’entrée.

Figure 19: Vue d’exposition : Hella Jongerius, Entrelacs, une recherche tissée (2019), Lafayette Anticipations, Paris © Valentin Le Cron. — Figure 19: Vue d’exposition : Hella Jongerius, *Entrelacs, une recherche tissée* (2019), Lafayette Anticipations, Paris © Valentin Le Cron.

Au 1er étage, trois personnes actionnent simultanément un second métier, sans couture, en vue de créer des objets textiles en trois dimensions. Avec lui, on découvre l’une des particularités de cette exposition : ouvrir l’atelier au public pour y montrer toute la journée, les designers en plein travail. Le métier Jacquard, au deuxième étage, explore quant à lui une technique tout à fait contemporaine : la création de tissages à partir de fichiers numériques, où chaque pixel se transpose en croisure de fil.

Figure 20: Vue d’exposition : Hella Jongerius, Entrelacs, une recherche tissée (2019). — Figure 20: Vue d’exposition : Hella Jongerius, *Entrelacs, une recherche tissée* (2019).
Lafayette Anticipations, Paris © Roel van Tour.

11. La texture des peintres

Kandinsky, dans son célèbre cours du Bauhaus, expose son système d’analogies sensorielles :

Le jaune est dur et piquant ; le bleu, doux et simple. Le jaune est résistant contrairement au bleu qui se rapproche du velours. Le jaune évoque l’écharde, le clou, le couteau et l’épine. Son goût est acide tandis que celui du bleu, insipide, rappelle la figue fraîche. L’odeur du jaune pique comme l’oignon, le vinaigre ou les acides. Le bleu, en revanche, est aromatique comme la violette. S’il est un son, le jaune aigu et pénétrant, chanterait comme un canari. La fanfare est jaune mais les sons profonds du bleu s’apparentent à l’orgue.⁶²

Deux grandes oppositions naitront de sa théorie des couleurs : chaleur versus froideur et clarté versus obscurité. Ici Jaune versus Bleu. Au-delà des qualités spirituelles et mystérieuses de la couleur, des pratiques artistiques nouvelles apparaissent au XXᵉ afin de souligner « sa texture et sa chair ».⁶³ Le peintre travaille sa couleur, manipule sa pâte, sa matière à l’effigie d’un sculpteur avec sa glaise. Tous les deux adaptent leurs outils et leurs gestes à l’effet désiré. Ils transcrivent visuellement une sensation tactile. L’épaisseur de la couche pigmentaire redonne à la peinture toute sa matérialité. Chez Monet, Cézanne, ou chez Van Gogh, la texture devient une véritable priorité. Il suffit de penser à Nuit étoilée où les couleurs vives et les textures épaisses des arbres et des bâtiments semblent palpiter de vie. Ce tableau révèle les coups de brosse expressifs et puissants du peintre hollandais. En effet, l’énorme spirale centrale semblable à une vague, envahit cette œuvre. Van Gogh a certainement voulu faire référence à l’astronomie très en vogue à cette époque pour laquelle il vouait une véritable passion. Des astrophysiciens ont d’ailleurs constaté que les étoiles et la lune représentées dans La nuit étoilée correspondaient à la configuration céleste visible à Saint-Rémy-de-Provence le 25 mai 1889. Ici, Vincent Van Gogh applique une texture rugueuse d’une manière irréelle pour rendre une image émotionnellement active et esthétiquement dynamique à l’extrême.

D’ailleurs, fasciné par la peinture de Van Gogh et notamment par la texture émanant de ses toiles, Henri Dutilleux a été complètement séduit en découvrant Nuit étoilée par l’atmosphère s’en dégageant. Ainsi, il a composé en 1978, Timbres, Espace, Mouvement. Ce « mouvement » singulier qui agite le ciel correspond à un des éléments fondateurs transposé dans la musique du compositeur. C’est du reste ce qu’il a choisi de faire en l’incluant dans le titre de son œuvre :

Dans Timbres, Espace, Mouvement […] que j’ai écrit en 1978 pour l’Orchestre de Washington, j’ai composé très rapidement, au contraire de mes habitudes, mais avec une extrême rigueur dans le choix de la formule orchestrale. Mon inspiration a été une toile de Van Gogh, La nuit étoilée, où l’espace et la vie se trouvent dans le délire des étoiles. Ma composition n’est pas une illustration du tableau, mais j’ai éliminé les violons et les altos de mon orchestre afin de recréer ce mouvement d’espace, ce choc émotif. Je me suis peu à peu aperçu que le graphisme de ma partition reprenait les spirales, les nébuleuses de la toile.⁶⁴

Figure 21 : Vincent Van Gogh, Nuit étoilée, 1889, huile sur toile, (73 X 92 cm), Musée d'art moderne à New-York. — Figure 21 : Vincent Van Gogh, *Nuit étoilée,* 1889, huile sur toile, (73 X 92 cm), Musée d’art moderne à New-York.

Nous pouvons relever un grand nombre de correspondances entre ces deux œuvres. Les combinaisons infinies de textures et de couleurs orchestrales sont corrélées magnifiquement avec les couleurs employées par le peintre. Cependant Dutilleux n’a cessé de vouloir s’en détacher :

Je désirais écrire quelque chose qui évidemment ne serait pas, servilement, une illustration musicale. Je trouve que la musique doit rester à sa place, ne pas être reléguée au second rôle ; d’autre part, c’est un peu faire »de l’art sur l’art » et Van Gogh se suffit à lui-même. […]C’est étrange de penser que lui, Paul Jenkins, peintre new-yorkais, a entendu cette œuvre, Timbres, Espace, Mouvement ; il a écouté des enregistrements et, à partir de là, il a imaginé quelque chose de très différent de l’original, bien sûr… Il m’a un peu, si vous voulez, délivré de cette obsession de Van Gogh : en écoutant cette musique, je pensais toujours à lui.⁶⁵

À son tour, le peintre new-yorkais, Paul Jenkins, s’est lui-même inspiré de Timbres, Espace, Mouvement pour une de ses toiles. Le fait de s’inspirer d’une œuvre qui s’inspire elle-même d’une autre, démontre cette singulière et infinie correspondance entre les arts et souligne son alchimie. L’importance de la texture dans l’art visuel du XXᵉ est considérable. Anne Beyaert nous éclaire sur ce sujet dans son article, Texture, couleur, lumière et autres arrangements de la perception.⁶⁶ Cette critique d’art, spécialisée en sémiotique dans l’art du XXᵉ siècle et les médias (photo-journalisme et image numérique), en souligne la portée. Selon la description de Fernande Saint-Martin, une autre sémioticienne, d’un côté, la texture est une « fiction du monde » offerte à la perception, de l’autre, c’est une propriété de la surface. Elle explique :

[…] l’art figuratif a […] largement exploité les possibilités fictionnelles de la représentation de l’expérience tactile par l’élaboration de textures picturales dissociées de leur référence. Souvent, une matière relativement lisse donnera, par le jeu des tonalités, des éclairages, des glissements entre formes et couleurs, l’illusion de textures rugueuses, chaotiques, poilues, etc.⁶⁷

Cette conception de la texture se rapproche sans ambiguïté de celle définie par le Groupe μ. Dans leur célèbre Traité du Signe Visuel (1992)⁶⁸, les chercheurs belges abordent la texture selon trois grandes modalités : le support, la matière et la manière. Ainsi, selon la nature du matériau (pigments en poudre, liant, résines encre, etc.), le support (sur bois, verre, toile, carton, papier etc.) et les différentes techniques utilisées par l’artiste, les résultats seront multiples. La texture varie donc indéfiniment en fonction de ces trois éléments.

Il suffit de penser à Jackson Pollock (1912-1956) qui a utilisé entre autres la technique de projection, qui consiste à projeter de la peinture à distance sur un support. Jackson Pollock tient véritablement une place à part dans l’Action Painting (peinture gestuelle).

Figure 22: Jackson Pollock dans son atelier.

Ce terme fut utilisé pour la première fois par le critique d’art, Harold Rosenberg dans l’article American Action Painters, publié dans le numéro de décembre 1952 d’Artnews :

A un certain moment, les peintres américains […] commencèrent à considérer la toile comme une arène dans laquelle agir, plutôt que comme un espace dans lequel reproduire, recréer, analyser ou “exprimer” un objet réel ou imaginaire. Ce qui devait passer sur la toile n’était pas une image, mais un fait, une action.⁶⁹

Au demeurant, Jackson Pollock fait le choix de s’exprimer sur des toiles de très grands formats, nécessaires pour la réalisation de sa technique appelée le dripping. Même si la paternité de ce terme ne lui revient pas complètement, car d’autres l’ont expérimenté avant lui, comme Miró ou Picabia notamment, cette technique artistique lui est finalement attribuée.

Pour cela, ce que l’on distingue sur la figure 22, Pollock utilise des boîtes avec des fonds percés qui lui permettent de répartir la peinture sur sa toile, tout en superposant des coulures obtenues par un bâton qu’il trempe et sort d’un récipient dans une sorte de transe chamanique. En fin de compte, ses gestes sont au service de la texture, de la matière. C’est une véritable chorégraphie : cette technique picturale implique le mouvement du corps tout entier.

Willem de Kooning se rapproche de Pollock dans sa peinture avec ses coups de pinceaux très spontanés. Il est un des plus grand maître de l’expressionnisme abstrait. Comme beaucoup d’œuvres de De Kooning datant de la fin des années 1940 et des années 50, la série des Woman est remarquable pour sa texture et son illusion de profondeur, qui résulte en grande partie des matériaux choisis par l’artiste.

Figure 23: William De Kooning, 1952, Woman II, huile et fusain sur toile, (149.9 x 109.3 cm). — Figure 23: William De Kooning, 1952, *Woman II,* huile et fusain sur toile, (149.9 x 109.3 cm).

Comme dans d’autres œuvres de l’époque, De Kooning se plaît à ajouter à ses peintures des matériaux grossiers et granulaires, accentuant la rugosité de ses toiles. Des échantillons pigmentaires ainsi que des analyses microscopiques ont permis de révéler qu’il avait mélangé du quartz, probablement du sable et des petits cailloux.

Dans une autre démarche tout aussi singulière, le Colorfield, littéralement « champ coloré », émergea en réaction ou parallèlement à l’Action Painting. Ce terme fut utilisé pour la première fois par le critique d’art Clement Greenberg, dans son célèbre essai, Modernist Painting (1960).⁷⁰ Il y développe l’idée selon laquelle la peinture se doit de retrouver son intégrité par l’aspect minimaliste et conceptuel de la démarche d’artistes comme Mark Rothko, Barnett Newman ou encore Adolph Gottlieb.

Figure 24: Barnett Newman, Onement III (1949), huile sur toile, (182.5 x 84.9 cm), Musée d'Art Moderne à New-York. — Figure 24: Barnett Newman, *Onement III* (1949), huile sur toile, (182.5 x 84.9 cm), Musée d’Art Moderne à New-York.

Cette autre école du geste amène un sentiment de profondeur, une sorte d’expérience spirituelle. De son côté, la sémioticienne Anne Beyaert définit la texture comme une « répétition d’unités produisant une discontinuité tonale ».⁷¹ Cette conception est intéressante car elle permet de dégager la texture de toutes les connotations d’épaisseur qui lui sont attachées : « une texture peut être épaisse et satisfaire une conception « matiériste » à la façon de Tàpies, par exemple, mais elle peut tout aussi, sans sacrifier sa définition, présenter la fine granulosité d’une peinture de Rothko ».⁷²

Figure 25: Mark Rothko, Orange and Yellow (1956), huile sur toile, (231.1 x 180.3 cm), Albright-Knox Art, Buffalo (États-Unis). — Figure 25: Mark Rothko, *Orange and Yellow* (1956), huile sur toile, (231.1 x 180.3 cm), Albright-Knox Art, Buffalo (États-Unis).

Elle poursuit en soulignant que « Dubuffet s’est efforcé de rendre compte de cette coopération qui caractérise la texture en peinture. »⁷³ « L’art doit naître du matériau et de l’outil et doit garder la trace de l’outil et de la lutte de l’outil avec le matériau. L’homme doit parler mais l’outil aussi et le matériau aussi ».⁷⁴ La texture correspondrait ici à « la trace ».

Avant de terminer ce chapitre, il nous semble important de mentionner un autre illustre représentant de la texture-matière, Pierre Soulages. Pendant des décennies, il a travaillé avec un même et unique noir, qu’il a nommé « l’outrenoir ». Il l’applique à la brosse et au spalter pour dessiner la matière, lui donner une texture. C’est la lumière qui donne toute sa force au travail de Soulages : elle accroche la peinture et, à travers les différentes textures créées, dessine d’infinies variations. Le spectateur est également impliqué dans cette perception de la texture car les reflets du tableau changent avec ses déplacements. La mobilité du spectateur a pour effet de multiplier les points de vue et contribue à élargir l’espace de rencontre entre le spectateur et la peinture.

Figure 26: Pierre Soulages, Peinture, 9 mars 2014, Acrylique sur toile, (57 × 81 cm), © Pierre Soulages, Photo : Vincent Cunillère, Courtesy Galerie Karsten Greve Köln, Paris, St Moritz.

Chapitre 2 : Texture et musique du point de vue musicologique classique

Selon Thomas Messenger, la notion de texture serait apparue dès l’époque de la Renaissance. Des compositeurs de la période Tudor, tels que Robert Fayrfax (1464-1521), Nicholas Ludford (1485-1557) ou encore John Taverner (1490-1545), pensent déjà la texture dans leur écriture, sans pour autant se référer au concept. Ici elle serait plus comparable à l’idée de « couleur ». Cette association Texture-couleur est utilisée pour apporter des éléments d’analyse dans la messe de Fayrfax : « La messe de Fayrfax composée durant les vingt premières années du XVIᵉ siècle montre une utilisation très sophistiquée du traitement de la texture-couleur, ce qui a une importance vitale pour la compréhension de la structure à quatre mouvements de la messe », selon Messenger.⁷⁵

Ce terme est tout à fait novateur, ce qui pourrait expliquer le temps qu’il a fallu pour le définir. Il n’apparaît pas dans les dictionnaires de référence que nous connaissons, comme dans le Oxford English dictionary (1933) ni dans le Grove Dictionary of Music and Musicians (1954), ni dans l’Encyclopédie Fasquelle (1958-1961). Ce sera seulement dans les années 1980 qu’une première définition claire de la texture sera énoncée dans le New Grove Dictionnary of Music and Musicians, édité par Stanley Sadie : « Texture is a term used loosely when referring to any of vertical aspect of a musical structure, usually with regards to the way in which individual parts or voices are put together ».⁷⁶ Cette définition tardive est probablement corrélée avec le plein essor de la musique contemporaine.

Au sein de ce courant, la texture décrirait la manière dont les éléments d’une chose se combinent, s’interconnectent ou s’entrelacent. Elle se réfère tant à la structure d’un corps ou d’une œuvre (forme) qu’à la disposition ou à l’interaction entre les particules qui le constituent (procédures), ou encore à la nature de celles-ci (paramètres). D’un point de vue linguistique, le terme « texture » ne comporte aucun antonyme. Il se présente comme un substantif associé à des adjectifs tels que « transparente », « claire », « foncée », « uniforme », « dense », « opaque », « rugueuse », « âpre », « diaphane » etc., et apparaît le plus souvent associé au concept de timbre. Si la polysémie de ce dernier nous permet d’approcher les qualités physiques d’un son et les aspects sémantiques d’une pièce ou d’un fragment musical, l’analyse des propriétés de la trame d’une texture polyphonique suscite une certaine ambiguïté conceptuelle.

1. La texture comme combinaison de lignes musicales : Dunsby, Benward and Saker, Berry, Lester

De manière générale, la texture concerne la manière dont les parties individuelles ou les voix sont assemblées (Benward & Saker, 2003).⁷⁷ Quatre types de textures émergent de cette définition :

La monophonie ou monodie : une seule voix, un chant à l’unisson ou à l’octave, un solo d’instrument monodique.
La polyphonie : superposition de deux ou de plusieurs voix indépendantes formant un ensemble homogène. L’indépendance porte principalement sur les mouvements mélodiques.
L’homophonie : plusieurs voix émises à l’unisson strict, avec aussi parfois des doublures à l’octave.
L’hétérophonie : superposition d’une mélodie à ses propres variations (nuances, ornements, légers décalages rythmiques, mélismes étendus, etc.). Ce type de texture est courante dans la musique orientale et africaine. Elle peut être utilisée comme procédé d’improvisation notamment dans le jazz.

Par exemple dans le Scherzo de la Sonate en si majeur pour piano de Schubert, nous pouvons retrouver plusieurs types de textures s’enchaînant rapidement.

Figure 27: Texture monophonique (mesures 1 à 4).

Figure 28: Texture homophonique (mesures 5 à 10).

Figure 29: Texture polyphonique (mesures 11 à 20).

La monodie et la polyphonie correspondent plus à la dimension horizontale de l’écriture. Leur organisation est linéaire comme dans l’écriture contrapuntique (canon et fugue). En revanche, l’homophonie et l’hétérophonie se rapportent à la dimension verticale, elles privilégient la pensée harmonique (cf., exemple de Schubert).

Afin d’illustrer au mieux notre propos, voici d’autres exemples présentés dans Music: In Theory and Practice de Benward & Saker⁷⁸:

– Texture monodique :⁷⁹

– Texture polyphonique : ⁸⁰

– Texture homophonique :

Plusieurs théoriciens ont tout particulièrement développé cette notion de texture. Dans son ouvrage Analytic Approaches to Twentieth-Century Music,⁸¹ Joel Lester envisage les origines de la texture chez Mozart et chez Malher. Chez Dyson,⁸² l’écriture contrapuntique de Bach est un modèle textural exemplaire. Même approche chez Larry Starr de l’université de Washington mais autour de la musique de Bartok.⁸³ Quant à Piston, dans son traité d’orchestration,⁸⁴ il a dénombré sept types de textures différentes : unisson orchestral, mélodie et accompagnement, mélodie secondaire, écriture en parties, texture contrapuntique, texture en accords, texture complexe.

Wallace Berry lui consacre un chapitre entier dans son ouvrage Structural functions in music (chapitre 2). Il considère que « la Texture est en partie conditionnée par le nombre de ses composants intervenant simultanément ou de manière consécutive, ses qualités étant déterminées par les interactions, interrelations ainsi mises en jeu ».⁸⁵ À partir d’exemples musicaux éclectiques allant de la Renaissance avec Josquin Desprez jusqu’à la musique du XXᵉ avec Elliott Carter, Berry envisage différents cas de progression, récession et variation de texture en tant que facteurs structurels. Il explique que ces différents cas peuvent s’appliquer aussi bien au rythme qu’à l’espace, à la densité, à la délinéation de la forme, voire au style.⁸⁶

Berry a distingué l’aspect qualitatif de la texture de ses aspects quantitatifs. Pour cela, il a établi une typologie en dix catégories : polyphonique, homophonique, harmonique (accords avec des voix souvent homorythmiquement liées), doublure (homorythmiquement, homodirectionnellement et homointervalliquement associées), miroir (homorythmiquement, homointervalliquement associées), miroir (homorythmique, homointervalliquement, contradictoire), hétérophonique (homodirectionnel et hétérointervallique), hétérorythmique, sonorité (caractère sonore global), contrepoint (interaction interlinéaire) et monophonique (une seule voix).⁸⁷

Quant à Charles Rosen, dans son ouvrage sur Schœnberg, il énonce « les innovations de textures les plus remarquables du compositeur autrichien qui intéressent trois aspects différents de cette notion à savoir : le rythme, la couleur orchestrale et l’espacement ou au contraire le resserrement de l’harmonie. »⁸⁸

2. La texture du point de vue des compositeurs

2.1. Arnold Schoënberg (1874-1951)

Dans son essai Du Spirituel dans l’art, le peintre Kandinsky affirme que « l’audition des couleurs est tellement précise qu’on ne trouverait certainement personne qui tente de rendre l’impression de jaune criard sur les basses d’un piano ou compare le carmin foncé à une voix de soprano. »⁸⁹ Le foisonnement de ses réflexions synesthésiques trouve évidemment de multiples échos dans les innovations techniques de l’époque, qui permettent l’entrée en jeu de la lumière dans la quête de visions sonores. À travers ces mots, Vassily Kandinsky nous révèle sa conviction au sujet des étroites résonances existant entre les arts. Une très belle rétrospective a particulièrement mis en évidence cela, au Centre Pompidou Metz en 2017, où de nombreuses textures sonores ont été intimement liées aux arts plastiques, depuis l’héritage du Bauhaus notamment (école d’art dont l’enseignement est basé sur le décloisonnement des pratiques artistiques et techniques). Un parcours Musicircus, en hommage à John Cage, a été créé par Emma Lavigne et Anne Horvath, commissaires de cette exposition : « D’Alexander Calder à Arman, de Marcel Duchamp à Yves Klein, de Nicolas Schöffer à Cerith Wyn Evans, l’exposition est traversée de flux, dans un esprit de jubilation qui convoque et réactive l’esprit de l’œuvre collective et chaotique Musicircus de John Cage créée en 1967, où tout musicien est invité à jouer ou à performer dans une totale liberté au sein d’un orchestre ouvert à tous. »⁹⁰ Selon elles :

Parmi les nombreuses métaphores musicales employées par Kandinsky, le concept de « contrepoint » est décisif dans l’analyse de la composition, art de combiner la forme et la couleur. Réalisée au Bauhaus, Accent en Rose révèle la grammaire picturale esquissée alors par l’artiste,

inspiré par son dialogue permanent avec Arnold Schœnberg qui le sensibilise à la théorie musicale.⁹¹

Figure 34: Vassily Kandinsky, Akzent in Rosa (Accent en Rose), 1926, — Figure 34: Vassily Kandinsky, *Akzent in Rosa (Accent en Rose)*, 1926, Huile sur toile, 100,5 x 80,5 cm, Centre Pompidou, Musée Nationale d’Arts Modernes, Paris.

Ainsi, l’opposition jaune-bleu est ici équilibrée grâce à la présence du cercle rose, rassurant et apaisant, tout en déplaçant la composition vers le haut, créant une tension qualifiée par Kandinsky de « lyrique ». Schoënberg échangera une longue et précieuse correspondance avec son ami Kandinsky (1911-1936). Ensemble, chacun à leur manière, ils ont concrétisé leur idée de « l’Audition Colorée ».⁹² Le drame musical, Die glückliche Hand (« La main heureuse ») de Schoënberg (1913) et Der gelbe Klang (« La Sonorité Jaune ») de Kandinsky (1909) illustrent singulièrement leur amitié et la richesse de leurs points de vue artistiques à travers une correspondance marquante pour l’Histoire des Arts.⁹³ Philippe Albéra traite justement de la texture chez Kandinsky et Schoënberg au sujet de Die glückliche Hand.⁹⁴

2.2. Claude Debussy (1862-1918)

Dans un autre registre, nous pensons tout particulièrement à Claude Debussy, qui est sans conteste le compositeur du tournant du XIXᵉ siècle qui trouva une grande partie de son inspiration dans le domaine des arts visuels. D’emblée, lui aussi, il s’intéressa aux artistes les plus en marge des académismes en cours : Degas, Whistler, Turner, Redon, Camille Claudel. « Moi qui aime les images presque autant que la musique », s’écrie Debussy dans une lettre, et cette déclaration, si singulière chez un musicien, exprime le rôle central de l’inspiration visuelle dans sa création. Dans les années 1890, il fréquente assidûment les milieux symbolistes en pleine ébullition. Aux Mardis de Mallarmé, il rencontre Whistler, Verlaine et les jeunes poètes du groupe symboliste. Dans le programme des premières auditions de son triptyque symphonique Nocturnes, Claude Debussy parle de « l’agonie grise, doucement teintée de blanc » pour introduire Nuages, la première des trois pages.⁹⁵

Figure 35: James Abbott McNeil Whistler, Nocturne: Blue and Silver – Chelsea (1871), Huile sur toile, 50 x 60.8 cm, Tate Britain, London. — Figure 35: James Abbott McNeil Whistler, *Nocturne: Blue and Silver* – *Chelsea* (1871), Huile sur toile, 50 x 60.8 cm, *Tate Britain*, London.

Son écriture texturale, impressionniste, proche de la conception texture-couleur décrite en ce début de chapitre avec la messe Fayrfax, est directement inspirée d’un tableau de Whistler. Chez Debussy, le rêve, les associations d’images, se substituent à la cohérence traditionnelle du discours musical. Avant de penser écriture, il pense sonorités, espaces sonores. « Je veux chanter les paysages intérieurs » disait-il.⁹⁶

Nous savons que Debussy est une des références majeures de Pierre Boulez (1925-2016) car il est fréquemment cité dans ses écrits. Boulez le considère comme l’un des pères de la modernité musicale. Il s’est intéressé tout particulièrement à la conception de la forme chez Debussy :

Ce que nous trouvons chez le dernier Debussy, c’est un sens, d’abord de la forme vécue non plus comme architecture. Mais c’est la forme dans laquelle, pour la comprendre, on doit passer au travers. En somme, une espèce de forme tressée, par tuilage des objets qui la composent. Il y a, chez Debussy, un souci constant du renouvellement du matériel sonore à partir soit d’un intervalle, soit d’une idée génératrice formant ce matériau. Certes dans les études, on trouve des pièces conçues suivant une architecture déjà assimilée. Quelques études, en particulier, sont construites sur la forme bien connue ABA, mais dans la plupart, la forme se crée au fur et à mesure de son engendrement.⁹⁷

Lorsque Boulez commente l’œuvre de Debussy, il déclare qu’« on pourrait parler là encore de narration, mais ce serait une narration très condensée, […], elliptique par essence ».⁹⁸ Les écrits de Debussy ont énormément influencé les écrits de Boulez. Laurent Feneyrou, dans Debussy au miroir des écrits de Boulez⁹⁹, en fait une analyse détaillée. Boulez se sert singulièrement de Debussy pour annoncer son propre programme esthétique. Boulez a également été un grand interprète de la musique de Debussy tout d’abord en tant que pianiste, notamment au début des années soixante en duo avec Yvonne Loriod, puis bien sûr, en tant que chef d’orchestre. Jeux et Iberia figurent dans son tout premier concert symphonique donné, le 16 juin 1956 à Caracas, avec l’orchestre symphonique du Venezuela. Un enregistrement radio historique de ce concert a d’ailleurs été conservé. Suivront de nombreux enregistrements dédiés à la musique de Debussy, grâce à son contrat avec la maison de disque CBS.

Dans Jeux (poème dansé, 1913), appelée « la forme tressée ou tissée » par Boulez, l’organisation générale est aussi instantanée qu’homogène dans son développement. L’analyse d’Herbert Eimert, publiée en 1959, rejoint la pensée de Boulez. Il considère que « le caractère « sériel » de Jeux dépend de la façon dont ornement, tempo, mètre, dynamique, timbre et texture participent de manière égale aux configurations de la forme ».¹⁰⁰ Boulez l’enregistrera à deux reprises : en 1966 avec le New Philharmonia et en 1995 avec l’orchestre de Cleveland.

2.3. Pierre Boulez (1925-2016)

Dans son livre Le pays fertile : Paul Klee,¹⁰¹ Pierre Boulez condense ses réflexions autour des principes de composition du peintre et la nourriture que ceux-ci ont pu apporter à sa composition musicale. Dans son analyse de la peinture de Paul Klee, il établit des liens entre structure et composition musicales. Ce qui donna naissance en 1952 à une pièce musicale intitulée Structure 1a, inspirée du tableau de Paul Klee Monument à la limite du pays fertile, organisé en barres parallèles avec parfois une rupture qui réintroduit le chaos dans l’équilibre structural. Ainsi, les relations entre peinture et musique sont d’abord de nature structurale, avec cette différence que la perception d’un tableau est toujours globale puis s’oriente vers le fond ou les détails.

Comme l’écrit le musicologue Robert Piencikowski :

Le premier livre de Structures pour deux pianos (1952) marque une étape importante non seulement dans l’évolution de Pierre Boulez, mais également dans le développement de la conscience musicale occidentale, par l’extension du phénomène sériel aux quatre composantes sonores (hauteurs, durées, attaques, intensités) et la fonctionnalité de la conception sérielle désormais responsable de l’espace acoustique et formel à l’intérieur duquel elle est destinée à se mouvoir.¹⁰²

Figure 36: Monument en pays fertile, Paul Klee, 1929, Aquarelle, Centre Paul-Klee (Zentrum Paul-Klee) de Berne, Suisse. — Figure 36: *Monument en pays fertile*, Paul Klee, 1929, Aquarelle, Centre Paul-Klee (Zentrum Paul-Klee) de Berne, Suisse.

Ce dernier propose une analyse de l’œuvre en s’appuyant sur la première division du mode de valeurs et d’intensités d’Olivier Messiaen :

Ia. Brève succession de séquences exposant différents éclairages possibles du matériau sériel réduit à sa plus simple expression.
Ib. Vaste opposition de textures faisant alterner une trame dépouillée avec des développements à densité croissante jusqu’à l’épuisement de la matière sonore.
Ic. Concluant sur un flux rapide et ininterrompu de figures imprévisibles.

Figure 37: Structures pour deux pianos. — Figure 37: *Structures pour deux pianos*.

Ici, la série se transpose sur elle-même et l’objet sonore définit l’espace dans lequel il évolue. Car si l’objet sonore entretient des relations inharmoniques avec ses composantes, l’espace acoustique sera relatif. Il s’agit véritablement de démultiplier l’instrument, le piano, grâce à ses propriétés acoustiques. Structure Ia est souvent présentée comme l’exemple de l’école de Darmstadt et l’apogée de l’impasse du modernisme dans une rationalisation extrême : le sérialisme total. Il existe de nombreuses analyses approfondies sur les compositions de Boulez, dont plusieurs touchent des idées esthétiques. La première étude majeure de l’un de ses travaux est l’analyse de Structure Ia en 1958 de Ligeti.¹⁰³

Les théorisations bouléziennes seront concrétisées dans Penser la musique aujourd’hui ¹⁰⁴ en 1963, résumant l’ensemble des techniques d’écriture utilisées dès 1949. Boulez insiste sur la notion de texture afin de définir les critères de combinaisons ou d’arrangements des organismes sériels. Il décrit avec beaucoup de détails l’hétérophonie, la structure la plus éloignée de nos habitudes, dans un souci d’expliciter le caractère fragile des dimensions traditionnelles du vertical et surtout de l’horizontal, le régime sériel polarisant la perception vers l’oblique. En effet, Boulez cherche à s’éloigner de la typologie classique afin d’introduire de nouvelles catégories qui lui permettent de classer toutes les combinatoires imaginables.

Jusqu’à ma rencontre avec Klee, je ne raisonnais qu’en musicien, ce qui n’est pas toujours le moyen de voir clair. C’est parce qu’un problème identique avait été simplifié de manière exemplaire par Klee que j’ai été amené à réfléchir autrement, sous un autre angle. Et il me semble possible, avec un élargissement de l’hétérophonie, d’appliquer ses idées sur la perspective.¹⁰⁵

De ce fait, Boulez considère deux dimensions : d’une part, la dimension dans laquelle se produisent les événements (horizontale, verticale, diagonale), et d’autre part, celle qui se rapporte au type d’utilisation des événements (individuel, collectif). Il utilise ces deux paramètres afin d’élargir son écriture. Il distingue le contrepoint libre (horizontal-individuel/collectif) du contrepoint rigoureux (horizontal-individuel/individuel), ainsi que l’harmonie fonctionnelle de l’harmonie non fonctionnelle.¹⁰⁶

2.4. György Ligeti (1923-2006)

L’esthétique de György Ligeti, l’un des premiers compositeurs à employer le terme texture dans ses écrits théoriques, prend sa source dans une critique du sérialisme. Ainsi, s’exprimant sur Apparitions et Atmosphères, dans un entretien avec Peter Varnai, en 1978, Ligeti déclarait explicitement avoir écrit ces œuvres en complète réaction au sérialisme et à l’aléatoire de Cage. Tout comme la conception de Lewis Rowell que nous détaillerons dans le chapitre sur la texture comme matière, le compositeur hongrois recourt à la métaphore du « tissage » lors de son analyse détaillée de Structure Ia pour deux pianos de Boulez :

À l’écoute de cette composition, donc, se déploie une structure en trame d’un tissage plus ou moins grossier ou fin d’une perceptibilité auditive changeante. Elle consiste en une quantité de “points” sonores intelligemment ordonnés qui s’assemblent pour constituer des fils d’une épaisseur variable, qui parfois se profilent et parfois se fondent. Les fils à leur tour sont tissés de manière plus ou moins serrée. […] Vu de plus près, c’est l’aspect de la détermination, de la régularité qui prédomine ; à distance, en revanche, la structure – résultat de nombreuses régularités distinctes – se présente comme quelque chose d’extrêmement variable et fortuit, comparable à l’éclairage clignotant du réseau d’enseignes lumineuses de la rue d’une grande ville.¹⁰⁷

Dans sa propre musique, Ligeti emploie différents types de textures qui constituent à la fois le matériau mélodique des parties instrumentales (traité le plus souvent en contrepoint) et le matériau harmonique des superpositions verticales. Ses textures sont variées, transformées, grâce à plusieurs procédés techniques opérant sur l’ambitus, la densité, le degré de changement, la fusion ou l’individualisation des parties instrumentales. Au demeurant, Pierre Michel souligne l’importance des aspects dynamiques de cette « écriture en trame » en partant cette fois-ci du premier mouvement du Concerto de Chambre (1969/70). Le musicologue distingue deux familles de textures qui se dégagent à l’audition : « l’une, caractéristique de la première partie, faite de lignes instrumentales savamment mêlées au point qu’il est souvent impossible de distinguer les timbres individuels (même lorsqu’il y a peu d’instruments) et l’autre, caractéristique de la seconde partie, représentée par des textures beaucoup plus éclatées et agitées où les instruments ressortent nettement de l’ensemble (mais le plus souvent de façon très ponctuelle). »¹⁰⁸ Nous reviendrons plus longuement sur cette œuvre dans notre cinquième chapitre, car nous proposerons une analyse de la texture du troisième mouvement du Concerto de Chambre.

Quelques années plus tôt, Ligeti compose son œuvre manifeste Atmosphères, pour orchestre, en 1961 : « Ma musique donne l’impression d’un courant continu qui n’a ni début ni fin. Sa caractéristique formelle est le statisme, mais derrière cette apparence, tout change constamment… »¹⁰⁹ Il ne recherche ni mélodie ni harmonie, mais des couleurs sonores dans une musique « statique » dont la densité est héritée de Bartòk. Clusters, micro-changements, micro-intervalles, micro-polyphonie transforment, sans césure, une matière sonore perpétuellement mouvante. Ce travail sur la matière sonore, les textures et le rapport au temps se retrouve dans la plupart de ses œuvres. Le compositeur cherche un équivalent musical aux leçons de peinture de Paul Cézanne, où la couleur remplace les contours, et où les contrastes de poids et de volumes engendrent les formes.

Figure 38: Paul Cézanne, Le Lac bleu, 1896, Huile sur toile, 65x81 cm, Institut Courtauld à Londres. — Figure 38: Paul Cézanne, *Le Lac bleu*, 1896, Huile sur toile, 65×81 cm, Institut Courtauld à Londres.

Dans son entretien avec Pierre Michel en 1981, Ligeti soulignait l’importance de la texture dans son écriture : « […] je pense toujours en voix, en couches, et je construis mes espaces sonores comme des textures, comme les fils d’une toile d’araignée, la toile étant la totalité et le fil l’élément de base. […] Si vous me demandez : « Pourquoi le canon ? », je vous répondrai : pour l’unité horizontale/verticale. »¹¹⁰

De plus, Marc Chemillier aborde d’une façon très détaillée et inventive les textures de Ligeti à partir de l’œuvre Melodien (1971, pour petit orchestre) en parlant de « logique des textures » directement inspirée des règles de la croissance minérale ou organique.¹¹¹

2.5. Morton Feldman (1926-1987)

De même, Morton Feldman (1926-1987) a toujours entretenu des liens étroits avec les arts visuels. Célestin Deliège souligne le fait que pour Feldman, « Il ne s’agissait plus de composer mais de projeter le son dans le temps, comme le geste pictural dont il était témoin, projetait la couleur sur la toile. »¹¹² Projection 1 pour violoncelle solo (1950) témoigne de ses influences artistiques. Il est vrai qu’il a toujours tissé des liens professionnels et amicaux avec des peintres de l’expressionnisme abstrait new-yorkais. C’est d’ailleurs John Cage qui le présentera à Pollock, de Kooning et Rothko, ce qui influencera considérablement son travail de compositeur. Ces rencontres donneront naissance à des pièces comme Music for the film Jackson Pollock (1951), de Kooning (1961), Rothko Chapel (1971). Très souvent, Feldman aimera employer des termes relevant du domaine de l’image pour faire référence à sa musique, préférant parfois, comme nous l’avons vu avec Deliège, utiliser des gestes plus appropriés à un peintre qu’à un musicien. Du reste, il se plaît à nommer ses œuvres « des toiles de temps » teintées « d’empreintes musicales ». De plus, l’artiste nous relate ceci : « J’avais appris que plus on compose ou on construit, plus on empêche le temps non encore troublé de devenir la métaphore de contrôle de la musique. »¹¹³ De façon systématique, Feldman préfère utiliser une terminologie visuelle pour décrire sa musique. Son intérêt pour la peinture ainsi que pour les tapis du Moyen-Orient lui permettra de développer un vocabulaire singulier. Des problématiques telles que la surface, le relief, la texture, les structures, le degré de symétrie des matériaux, etc., toutes ces questions contribueront à définir l’esthétique de ses œuvres. Son approche de la texture y est tout à fait singulière. D’ailleurs pour exemple, en introduction à la partition de Coptic Light (1985), Felman écrit ceci :

Ayant un intérêt avide pour toutes les variétés de tissages du Moyen-Orient, j’ai récemment contemplé les étonnants tissus coptes anciens à l’exposition permanente du Louvre. Ce qui m’a frappé dans ces fragments d’étoffes colorées, c’est la façon dont ils transmettent l’atmosphère essentielle de leur civilisation. Transposant cette idée dans un autre domaine, je me suis demandé quels aspects de la musique depuis Monteverdi pourraient restituer leur atmosphère, si on les écoutait dans deux mille ans. Selon moi, l’analogie serait une des figures instrumentales de la musique occidentale. Telles sont quelqu’unes des métaphores qui occupaient mes pensées tandis que je composais Coptic Light.¹¹⁴

La texture y est tout particulièrement dense, serrée car toutes les familles d’instruments jouent tout du long ensemble formant un tissage orchestral complexe, comme le « tissage de la musique » décrit par Lewis Rowell. (Cf. partitions en annexes)

Nous nous sommes particulièrement intéressés à cet espace particulier qu’est Rothko Chapel (1970). C’est une pièce pour alto, célesta, percussions, chœur, soprano et alto, une œuvre destinée à être jouée dans l’édifice qui abrite quatorze grandes toiles du peintre disparu en 1970. À partir d’un dessin de Rothko, l’architecte Phil Johnson s’est occupé de la construction de cette structure minimaliste que représente cette grande salle octogonale. Selon le critique d’art Vladimir Safatle

« Tous les tableaux de Rothko dans la chapelle sont marqués par la manifestation d’une hétérogénéité interne au champ même de chaque couleur. Aucun champ chromatique n’est plat. Tous sont marqués par des oppositions et des conflits qui dévoilent une conscience de la dissolution de l’unité. »¹¹⁵ A sa manière, Feldman a bien compris tout cela car dans ses textures, nous percevons bien ces champs sonores remplis de micro-variations.

Figure 39: Vue intérieure de la chapelle (Thomas Struth for The New York Times). — Figure 39: Vue intérieure de la chapelle (Thomas Struth for *The New York Times*).

De plus, Rothko réussissait à amincir la matière jusqu’à ce que les particules de pigments soient dissociées de la fine pellicule et adhèrent à la surface de façon à laisser la lumière pénétrer la couche de peinture. Le procédé spécifique de Rothko pour préparer ses toiles a été décrit par Youssef Ishaghpour : « En variant les textures, les gradations tonales et la profondeur des couches, en expérimentant des degrés de transparence avec des mixtures d’huile, de tempéra à l’œuf et du diluant, Rothko portait ses couleurs au seuil de la désintégration pour créer leur luminosité. »¹¹⁶ En effet, dans une émission radio consacrée à Rothko sur France Culture, Une vie, une œuvre, présentée par le journaliste Matthieu Garrigou-Lagrange, le plasticien invité Didier Mencoboni, décrivait ce mélange tempera à l’œuf, procédé de la Renaissance, et pratiqué par Piero Della Francesca, comme étant une préparation secrète à laquelle Rothko « ajoutait de l’acrylique pour obtenir des couleurs lumineuses d’une grande finesse. »¹¹⁷

Joseph Delaplace affirme que « la prise en compte très précise de la lumière, dans le travail de Rothko, trouve une réplique musicale dans la gestion de l’intensité chez Feldman. De même, l’utilisation de la brosse et du chiffon, le travail sur les frontières entre différentes zones picturales, peuvent être mis en relation avec le gommage de l’attaque de certains sons, ainsi qu’avec la suppression après-coup de matériaux sonores. »¹¹⁸ C’est un remarquable travail autour de la texture. A propos de la distribution des toiles dans la chapelle, Rothko avait précisé qu’« il n’était pas intéressé par un caractère symétrique ou asymétrique quelconque, mais plutôt par des proportions et des formes ».¹¹⁹ Selon Steven Johnson, qui a fait l’une des premières analyses musicales de Rothko Chapel, la « symétrie et l’asymétrie jouent un rôle majeur en tant que thème narratif » dans la spatialisation des toiles.¹²⁰

Il en fait une remarquable description :

La chapelle présente une progression d’états affectifs mis en mouvement entre deux arcs symétriquement liés. La progression commence avec un état de statisme neutre, continue à travers des états de plus en plus sombres et tragiques, pour finalement arriver à des états brillants, élevés. Le triptyque de l’abside nord et le panneau sud – les seules images isolées (sans une contre-représentation en face) – forment un axe. Le triptyque fonctionne comme point d’origine car il est face à l’entrée et parce que l’abside, encastrée six pieds à partir des murs, reçoit la plupart de la lumière zénithale. Étant donné que les panneaux extérieurs du triptyque (nord) contiennent le même pourpre noirâtre et le panneau central un pourpre légèrement éclairé, le triptyque est en soi symétrique. (…) La chapelle arrive à un obscur climax avec la forme en croix établie par les presque identiques triptyques Est et Ouest, où le noir profond prédomine.¹²¹

Figure 40: disposition des panneaux dans la chapelle.¹²²

Ainsi, que ce soit en termes de forces utilisées, d’équilibre, de timbre et de texture, le choix instrumental de Feldman fut tout autant conditionné par l’espace de la chapelle que par les peintures. Feldman explicite son rapport à l’espace de la chapelle : « L’image plastique de Rothko va droit jusqu’au bout de la toile, et je voulais atteindre le même effet avec la musique ; c’est-à-dire qu’elle emplisse l’espace global, de forme octogonale, et qu’elle ne puisse pas être entendue à une certaine distance ».¹²³ Feldman a également conçu la forme musicale de sa pièce d’après la chapelle :

Le rythme d’ensemble des peintures de Rothko, telles qu’il les a disposées, créait une continuité sans faille. Tandis qu’il était possible, avec les peintures, de répéter couleurs et gammes tout en maintenant un intérêt dramatique, je sentais que la musique devait appeler une série de sections enchaînées fortement contrastées. Je voyais une procession immobile semblable aux frises des temples grecs.¹²⁴

Alex Ross souligne dans son ouvrage de référence The Rest is Noise que « la fixité apparente de Rothko Chapel incite à se concentrer sur des détails qui semblent insignifiants, de telle sorte que le moindre changement est perçu comme un véritable cataclysme : un simple chromatisme descendant dans une ligne de basse suffit à donner le frisson. »¹²⁵ Cette œuvre empreinte de spiritualité, est certainement la plus personnelle et la plus émouvante de Feldman. « Comme Messian, Feldman s’attachait à créer par sa musique une sorte d’ailleurs spirituel […].¹²⁶

2.6. Iannis Xenakis (1922-2001)

Au début des années soixante, l’ancienne fascination pour le sérialisme et la musique aléatoire a laissé une grande place à l’intérêt des compositeurs pour la texture, le son, la matière sonore. Avec Metastasis (1954) et Pithoprakta (1955-1956), Xenakis fut l’un des pionniers de la musique de textures. En ce sens l’analyse de Pithoprakta du compositeur Panayiotis Kokoras¹²⁷ nous semble particulièrement intéressante. Le but de Pithoprakta était de fusionner les sons individuels en un ensemble cohérent. Kokoras propose une analyse en s’appuyant sur les travaux de Bregman¹²⁸ et de McAdams.¹²⁹ L’un des facteurs les plus importants, qui affectent la perception des textures, dépend de la fusion de composants séparés du passage musical. Une telle fusion est possible dans certains cas. Les propriétés principales, qui favorisent la fusion dans un passage musical, comprennent les densités d’attaques et les similarités timbrales des sons joués. Ce dernier élément comprend diverses caractéristiques spectrales des sons. De plus, le registre des parties instrumentales et leur gamme dynamique favorisent la fusion texturale. Il serait intéressant d’analyser les différents types de texture musicale utilisés dans Pithoprakta en fonction de leur degré de fusion ou de séparation. Xenakis a certainement été l’un des premiers compositeurs à utiliser de façon systématique la fusion entre la matière et la forme. Makis Solomos qualifie le produit de cette fusion forme/matériau de « sonorité ». Il propose une tout autre analyse de Pithoprakta qui nous semble intéressante de citer.

Figure 41 : Pithoprakta : description globale des transformations progressives. — Figure 41 : *Pithoprakta* : description globale des transformations progressives.¹³⁰

Le musicologue insiste sur le fait que Xenakis métamorphose continuellement les textures sonores par des transformations continues ou discontinues de toutes sortes. Le compositeur explore des textures bruitées avec des techniques instrumentales singulières comme des coups sur la caisse des cordes par exemple pour conduire progressivement l’auditeur vers des sons purs avec les harmoniques finales. Ses œuvres sont réellement conçues comme des expériences perceptives du son. Il proposera des expériences de l’espace en architecture, des expériences visuelles-sonores avec les polytopes. Il nous semble intéressant de mentionner ce qu’écrit Xenakis à propos du son justement :

Le son en acoustique s’analyse en équations physico-mathématiques (il est une vibration élastique de la matière) qui se mesurent : intensité, couleur, temps. Dans la couleur entrent la hauteur, les harmoniques, les sons additifs et soustractifs, les ondulations, etc. Par conséquent, le son est une grandeur quantitative. Mais dès qu’il franchit le seuil de l’oreille, il devient impression, sens, grandeur qualitative par conséquent. La psychophysiologie de la musique n’est pas encore une science. Le bon compositeur pourra exprimer les sens qu’il désire.¹³¹

Solomos écrit sur cette dichotomie quantitatif/qualitatif. Pour le musicologue, l’aspect qualitatif reste flou dans sa définition, alors que l’aspect quantitatif est clairement explicité, à savoir le son. « Celui-ci n’est plus défini comme un simple niveau d’articulation, un matériau neutre. Posé comme le lien entre toutes les musiques, il constitue pour Xenakis le « fond même » de la musique : son fondement, pourrait-on ajouter. »¹³²

Le travail d’Anne-Sylvie Barthel-Calvet autour de la conception texturelle chez Iannis Xenakis apporte un autre éclairage de perspective analytique.¹³³

3. La Texture comme matière

Une autre compréhension de la texture fut développée par certains théoriciens de la musique, dans le souci d’analyser les œuvres après 1945. Ainsi, la texture est tantôt comparée à un grain, une toile, ou bien à une surface ou une nappe (Morgan, 1991¹³⁴, Smith-Brindle, 1966). Voici ce qu’écrit à ce sujet le compositeur britannique Smith-Brindle :

Texture, en un sens, peut être définie comme structure, ou arrangement des parties constituantes. Toutefois, bien que l’on puisse parler de texture contrapuntique, le genre précis ou la nature du contrepoint ne peut être décrit par une telle terminologie. On se réfère au caractère général du son, plutôt qu’au type précis de construction. La définition alternative de texture comme « grain, réseau, surface ou nappe » est plus juste. Elle définit le « sentiment » extérieur de la musique, plutôt que la structure interne. Les adjectifs habituellement utilisés en relation avec la texture musicale confirment cette définition rude, lisse, épais, fin, chaud, froid, lourd, riche, maigre, léger, soyeux, velouté, dentelé toutes décrivent des sensations extérieures.¹³⁵

De la même manière, Jonathan Dunsby, dans son article Considerations of Textures, écrit à ce sujet : « Lewis Rowell écrit à propos de la distinction entre focus et interaction, entre économie et saturation, entre le mince et le dense, entre le lisse et le rugueux, dans lequel on peut discerner l’étymologie du terme musical « texture » au sens physique. »¹³⁶ En effet, Lewis Rowell a dédié dans son chapitre Values, un sous chapitre sur la texture dans son ouvrage de référence Thinking about Music : An Introduction to the Philosophy of Music où il caractérise la texture comme étant « le tissage de la musique » si on conçoit celle-ci comme « une surface esthétique » ou comme « la fibre (les hauteurs, l’axe vertical, la simultanéité) et la trame (le temps, l’axe horizontal, la séquentialité) du tissu musical. »¹³⁷ Nous en avons montré un exemple dans Coptic Light de Morton Feldman précédemment. Comme le suggère Robert Erickson, dans Sound Structure in Music (chap.6 Timbre in Texture) bien que la texture puisse être avant tout considérée comme une description de la sensation d’un objet, l’interaction imaginée ou tangible de la sensation avec sa matière, c’est aussi un moyen de décrire l’aspect tactile des mondes sonores.

La texture dénote toujours une qualité globale, la sensation des surfaces, le tissage des tissus, l’apparence des choses. Les mots pour les modalités sensorielles visuelles et tactiles sont souvent adaptés aux descriptions des sons et de leur combinaison: acéré, rugueux, terne, lisse, mordant, clair, brillant, cassant, grossier, épais, mince, sec, diaphane, aéré, effilé, flasque, fluide, vaporeux, pailleté, granuleux, dur, brumeux, lourd, glacé, incomplet, déchiqueté, limpide, liquescent, luxuriant, doux, trouble, souple, décontracté, ondulant …¹³⁸

Le point de vue de Robert Strizich est très spécifique et nous apparaît également important d’être mentionné :

À mon avis, nos concepts, définitions et termes traditionnels sont inadéquats pour la discussion et l’analyse de nouvelles textures dans la musique de l’après-Seconde Guerre mondiale. En effet, une grande partie de la musique écrite depuis 1945 est complètement hors de la portée de la terminologie analytique standard, principalement parce que beaucoup de ces travaux utilisent exclusivement des textures et des procédures de textures qui s’écartent significativement des pratiques conventionnelles.¹³⁹

Après avoir analysé plusieurs exemples de textures dans la musique après 1945, Strizich propose une typologie où les textures sont regroupées en trois grandes catégories générales : polyphonie complexe (disjointe, multicouches), textures pointillistes (trois types nommés a, b, c) et texture de masse (nuage, polyphonie dense, micropolyphonie, bandes de fréquences). Les textures sont caractérisées selon leur densité verticale (opacité relative ou transparence) et leur composition constitutive (homogénéité ou hétérogénéité).

Dans la création de musiques populaires enregistrées, l’organisation des timbres et des textures est une préoccupation essentielle, car elle est déterminante dans l’appréciation des auditeurs, plus que les hauteurs ou le rythme. Plusieurs études ont d’ailleurs montré que les musiques pop étaient davantage appréciées pour leur sonorité, pour leur couleur, que pour leur structure¹⁴⁰ Les outils de l’analyse musicale traditionnelle ne sont pas toujours appropriés pour dégager les éléments intéressants de la musique populaire (Tagg, 1979¹⁴¹, Middleton, 1990¹⁴², Lacasse, 2000¹⁴³). Richard Middleton soutient que « Les musicologues qui s’intéressent aux musiques populaires doivent entendre l’harmonie autrement, repenser l’analyse rythmique, porter une attention particulière aux nuances de timbres et aux fluctuations de hauteurs et saisir les textures et les formes en les associant aux caractéristiques d’un genre et à des fonctions sociales. » ¹⁴⁴

Quant au musicologue Albin Zak, il définit la texture comme la qualité du son qui réside dans les relations créées par l’interaction des éléments constitutifs d’une piste. Cette qualité générale est le caractère général des gestes musicaux. Il comprend entre autres le timbre, la dynamique, le rythme, l’ambiance, la gamme de hauteur, l’espace harmonique et le placement spatial des sons constitutifs. Le concept de texture musicale chez Zak est multiforme et bien adapté à l’analyse des enregistrements rock.¹⁴⁵ Son travail commence à partir du studio d’enregistrement, où il se demande quels effets esthétiques pourraient être obtenus par les manipulations que les preneurs de son appliquent dans le processus d’enregistrement.¹⁴⁶ Au sujet de la musique populaire, Simon Zagorski-Thomas nous expose le lien entre le développement des technologies et la complexification de notre univers sonore :

Le développement des technologies peut avoir une influence, de plusieurs façons, sur le caractère des sons enregistrés. Par exemple, une série de modifications techniques sur un produit peut générer une plus large palette d’options sonores, comme le démontre le développement des technologies liées aux microphones ou des compresseurs dynamiques depuis des années.¹⁴⁷

Certains auteurs ont explicité l’importance du timbre et de la texture au sein du mix en fonction de leur importance hiérarchique. C’est le cas d’Allan Moore qui a proposé un modèle représentant un espace virtuel en trois dimensions afin de désigner les principaux paramètres d’un mix.¹⁴⁸ « La Sound-Box de Moore et Dockwray est un modèle de représentation de l’espace stéréophonique interne d’un enregistrement musical. »¹⁴⁹ Elle se présente comme un pavé droit (qui représente la scène virtuelle (Cf. figure ci-après). Nous pouvons y placer les différentes sources sonores du titre en fonction de leur emplacement dans la stéréophonie. C’est actuellement le modèle de représentation le plus employé lorsque nous effectuons des analyses d’espaces internes dans les œuvres phonographiques. Selon Moore, « Bien que l’analyse musicale soit normalement l’analyse de la partition, une analyse du Rock ne peut suivre cette même procédure. Elle doit se référer au « Primary text », qui est, dans ce cas, ce qui est entendu. »¹⁵⁰

Figure 42: Exemple de la Sound Box d'Allan Moore : Cliff Richard, Congratulations. — Figure 42: Exemple de la *Sound Box* d’Allan Moore : Cliff Richard, *Congratulations*.¹⁵¹

Ce modèle a le mérite d’offrir une terminologie pratique qui décrit les aspects considérés prioritaires dans l’agencement d’un mix : soit la répartition des fréquences et la localisation spatiale notamment. De ce fait, grâce à l’importance que revêt le son, de nombreux grands producteurs verront le jour tels que Phil Spector, George Martin, Brian Eno, Quincy Jones, etc.

William Moylan développe dans The Art of Record Production¹⁵² , une méthode de transcription tout à fait adaptée pour analyser la texture dans la musique populaire. Cet ouvrage propose un cadre de référence et un vocabulaire qui permet de décrire les principaux paramètres importants dans la production de ce type de musique, à savoir les caractéristiques de l’espace, le contour, l’enveloppe spectrale et l’intensité. L’approche de Moylan se révèlera une source d’inspiration pour Lacasse, notamment autour du concept de « mise en scène phonographique ». Celle de Lacasse apporte une vision intéressante pour l’étude du traitement sonore de toutes formes de sons enregistrés, malgré le fait que son approche s’intéresse particulièrement au traitement de la voix.¹⁵³ Cette réflexion autour de la notion de texture à travers les propos d’analystes, compositeurs et musicologues, nous apporte un éclairage intéressant sur les multiples façons de se l’approprier. D’une part, nous avons pu comparer et confronter des points de vue divers, notamment, chez les anglo-saxons avec l’ouvrage Analytic Approaches to Twentieth-Century Music de Joel Lester,¹⁵⁴ et celui de Wallace Berry, Structural Functions in Music. D’autre part, chez les français, les articles de référence de Marc Chemillier, Jean-Baptiste Barrière et Anne-Sylvie Barthel-Calvet, réunis dans la revue Analyse musicale, réalisé et coordonné par Pierre Michel, ont bien évidemment enrichi notre vision de la texture.

Chapitre 3 : Principes d’organisation auditive et perception de la texture

Différentes étapes de traitement de l’information auditive ont été distinguées (McAdams et Bigand, 1993).¹⁵⁵ L’une d’elles semble directement reliée à la notion de texture : l’analyse des scènes auditives. En effet, notre environnement auditif quotidien est composé de mixtures de sources sonores diverses. La complexité des scènes auditives et la densité des textures acoustiques auxquelles nous sommes régulièrement confrontés, nous empêche de tout traiter de manière pertinente. Pour des sujets sourds, ce traitement demande un entrainement spécifique pour obtenir des résultats significatifs. Nous développerons ultérieurement cette question. C’est pourquoi un apprentissage spécifique devra être mis en place de façon régulière afin d’améliorer leurs performances. L’analyse de scènes auditives s’avère cruciale pour comprendre au mieux le monde environnant. La psychologie cognitive a décrit des principes fondamentaux pour la perception visuelle, ainsi que pour la perception auditive, notamment des règles de groupement que nous détaillerons dans notre second sous-chapitre sur l’analyse de scènes auditives chez Bregman¹⁵⁶ et Mc Adams.¹⁵⁷ Dans une perspective Gestaltiste, l’organisation perceptive procède par ségrégations des différents flux sonores. « La formation des flux est un phénomène complexe dont les nombreuses recherches de Bregman ont permis l’analyse. »¹⁵⁸ En guise d’introduction, nous expliciterons en quoi consiste la théorie de la Gestalt. La notion de fond/figure a surtout été repris d’un point de vue compositionnel et musicologique, dans des domaines comme l’orchestration ou le mixage notamment. La perception visuelle est la mieux connue car la plus étudiée. Les lois de l’organisation perceptive sont les règles qui imposent de voir des éléments de notre environnement comme un tout. Lorsque nous voyons un objet, nous en voyons simultanément la forme, la couleur, la texture, les contours, la position et éventuellement le mouvement. L’approche essentielle de Meyer (1956) a permis de mettre en lumière les processus cognitifs et émotionnels de la musique. Le fonctionnement de la musique repose sur les lois générales relatives aux relations de tension/détente. Les structures cognitives, en lien avec ces phénomènes de tension/détente, ont été formalisées sur la plan théorique et expérimental (Bigand, 1993¹⁵⁹, 2006¹⁶⁰, 2009¹⁶¹ ; Bigand, Parncutt et Lerdahl, 1996¹⁶²). Selon Emmanuel Bigand (2009), ce type de relations serait d’ailleurs, un aspect central de l’écoute musicale, permettant de lier intimement cognition et émotion.

1. La théorie de la Gestalt

1.1. Définition

Gestalt est un terme relativement complexe qui n’a pas vraiment d’équivalent dans les autres langues. En français, ce terme désigne tout autant la théorie de la forme, la gestalt-théorie, qu’une thérapie comportementale humaniste : la gestalt-thérapie. Gestalten en allemand, signifie mettre en forme, donner une structure signifiante. Gestalt désigne un ensemble ou une totalité organisé qui transcende ses parties constituantes. En musique, des parties d’une mélodie sont perçues dans une succession ou une séquence temporelle, mais ces parties sont perçues comme un tout, ou une Gestalt.

1.2. Historique

Au début du XXᵉ siècle, ont émergé deux courants opposés : le behaviorisme et la psychologie de la forme. Il est important de noter que la psychologie cognitive dès la fin des années 1940, par ses fondements objectifs et formels, les remplacera et continue aujourd’hui à définir le cadre théorique des recherches en psychologie. Néanmoins, les théories du formalisme et de la Gestalt sont utiles pour comprendre la perception et l’expérience musicales car ce sont des principes primordiaux qui ne dépendent pas seulement d’une époque donnée. Nous verrons comment cette théorie a inspiré certains compositeurs et musicologues au cours de ce chapitre.

Conduit par Max Wertheimer¹⁶³, Kurt Koffka¹⁶⁴ et Wolfgang Köhler¹⁶⁵, la psychologie de la forme est un courant d’idées qui se développa en Allemagne dans les années 1920 et 30. Ils émigrèrent par la suite aux États-Unis, à cause de la montée du nazisme en Allemagne. La théorie de la Gestalt trouve cependant son origine avant le début du XXᵉ siècle. Ce fut le philosophe autrichien Christian Von Ehrenfels qui développa cette théorie dans son article de 1890 « Über Gestaltqualitäten » (sur les qualités de formes). La question centrale réside dans le fait d’affirmer que le tout est supérieur à la somme des parties. Nous percevons d’abord un objet de façon globale avant d’en voir les parties constituantes. En musique par exemple, lorsque nous nous rappelons d’une mélodie, nous nous souvenons de sa structure globale et non d’une suite successive de notes prises isolément. De plus, la reconnaissance d’une mélodie est possible malgré l’altération de nombreux paramètres, comme la hauteur, le tempo ou le timbre. Les lois de la Gestalt, que nous détaillerons ci-après, mettent en forme une mélodie, grâce à une diversité de moyens sans qu’elle perde néanmoins son identité.

Ainsi, ces propriétés dites « émergentes » sont omniprésentes dans tout ce qui nous entoure : un visage est plus qu’une paire d’yeux, un nez et une bouche par exemple.¹⁶⁶ En France, Köhler sera de loin le plus connu grâce à son ouvrage publié chez Gallimard, La psychologie de la forme. L’ouvrage de Paul Guillaume (1878-1962), également intitulé La Psychologie de la forme, paru chez Flammarion à la veille de la Seconde Guerre mondiale reste encore à ce jour un ouvrage de référence pour certains psychologues.¹⁶⁷ Merleau-Ponty, également, ne cessera tout au long de sa vie de penser la forme. Dans La structure du comportement, son projet est de construire une véritable philosophie de la forme qui serait en quelque sorte le prolongement de la psychologie de la forme.¹⁶⁸

1.3. Perception : une approche systémique

D’après la théorie de la Gestalt, comme nous venons de le décrire, nous percevons essentiellement des formes globales et non des détails. Notre cerveau réalise très rapidement une synthèse, un assemblage qui rend l’ensemble compréhensible et cohérent. L’observateur cherche à percevoir une « bonne forme ». Ainsi, il va regrouper des données similaires afin d’y chercher une continuité. Prenons le cas des étoiles : lorsque nous admirons le ciel étoilé, notre cerveau s’organise de telle manière à percevoir des groupes et à les structurer. Il essaie d’en dégager des formes. L’étoile, unité première, sera associée à d’autres étoiles pour s’organiser en forme (gestalt), ce qui correspondra à la constellation. Cette approche, telle qu’elle a été définie par la Gestalt est systémique. C’est-à-dire multiple et globale.

1.4. Les principes de la Gestalt dans le domaine visuel

« La théorie de la Gestalt propose des lois pour rendre compte de la formation des groupements et des configurations. »¹⁶⁹ Claude Bonnet explique qu’une « scène visuelle se compose de formes et de surfaces que l’organisme doit discriminer les unes des autres. Phénoménalement, certains éléments vont ensemble en ce qu’ils appartiennent par exemple au même objet. »¹⁷⁰

Voici les principales lois de la Gestalt : bonne forme, continuité, proximité, similitude, destin commun et clôture. Ces mêmes lois seront reprises par Albert S. Bregman au sujet de l’analyse de scènes auditives. Nous reviendrons en détail sur ces principes perceptifs s’appliquant également dans le domaine auditif et comment ils peuvent être illustrés à l’aide de la musique.

– Loi de la bonne forme ou prégnance : c’est le principe fondamental de la Gestalt. Nous préférons les choses simples, claires et ordonnées. Selon cette loi, les éléments s’organisent en une forme plutôt qu’une autre. C’est le cas par exemple des figures géométriques simples comme le carré, le cercle ou le triangle formant ensemble l’icône du Bauhaus.

Figure 43: Illustration de la loi de prégnance.

– Loi de la continuité : notre œil suit les lignes que nous percevons. Lorsque la proximité des éléments visuels est importante, nous les voyons dans une continuité comme s’ils ne formaient plus qu’une seule et unique partie.

Figure 44: Illustration de la loi de continuité.

Loi de proximité : les éléments les plus proches sont spontanément associés à un même groupe. Dans cet exemple, la série de points consécutifs sera perçue comme étant un enchaînement de séries de deux points.

Figure 45: Illustration de la loi de proximité

Le groupement par similarité : Nous avons tendance à regrouper les éléments qui se ressemblent. Notre cerveau regroupe ces éléments semblables ayant des traits communs (forme, taille, couleur, etc.).

Figure 46: Illustration de la loi de similarité.

Loi de destin commun : Lorsqu’un ensemble d’objets se déplace dans une direction commune, cet ensemble est perçu comme appartenant à un même groupe. Ces éléments n’ont pas nécessairement besoin de bouger pour qu’on leur attribue une synchronicité. Le plus important, c’est la destination commune.

Figure 47: Illustration de la loi de destin commun.

Dans cette photo, le mouvement de ce groupe d’oiseaux va dans la même direction.

Loi de Clôture : comme pour la loi de la bonne forme, la loi de clôture cherche la simplicité. Elle est l’opposé du résultat de la loi de prégnance, car nous simplifions un ensemble, en un groupe de formes simples. Tandis qu’avec la loi de clôture, nous remplissons les vides d’une forme ou d’un ensemble de formes pour former un tout cohérent.

Figure 48: Illustrations de la loi de clôture avec notamment le célèbre logo de l’ONG pour la protection de la nature WWF (World Wildlife Fund).

Comme nous l’avons souligné précédemment, ces lois de l’organisation perceptive n’interviennent pas seulement pour la vision mais également pour l’audition. Quand nous écoutons une œuvre musicale, nous avons alors tendance à regrouper les sons similaires. Il est intéressant de remarquer que le groupement par similarité a été exploité par les musiciens compositeurs bien avant qu’il soit étudié par les psychologues. On a aussi tendance à regrouper les sons qui se suivent très rapidement dans le temps. Il s’agit d’un groupement par proximité. L’apport intéressant des gestaltistes à travers les lois de l’organisation perceptive est d’avoir montré que la perception n’est pas une copie du réel mais possède ses propres lois d’organisation pouvant conduire à des rajouts ou à des suppressions dans le réel perçu.

Nous verrons dans le chapitre suivant, à travers les travaux de Bregman notamment, que les principes de l’analyse de scènes auditives, semblent mettre en évidence des principes analogues aux principes de groupements décrits par les psychologues gestaltistes. Nous nous appuierons majoritairement sur le cadre de référence théorique proposé par Bregman.

2. Analyse de scènes auditives : Bregman et McAdams

La psychoacoustique se révèle être un outil puissant pour comprendre comment le système auditif parvient à classifier les sources sonores et à les séparer. Les sons que nous percevons proviennent généralement d’un ensemble de sources acoustiques. Les ondes acoustiques émises par chacune de ces sources se propagent jusqu’à l’entrée de l’oreille où elles se combinent pour former un signal sonore unique appelé « mixture ».¹⁷¹ Cette mixture sonore qui atteint nos oreilles doit être interprétée par notre système auditif. Lorsque nous sommes entourés de signaux sonores provenant de différentes sources, ce qui entre dans l’oreille est un agrégat de vibrations complexes où toutes les sources sont entremêlées. Le rôle du système auditif est alors de déterminer ce qui appartient à quoi, et de bâtir une image cohérente du monde sonore environnant. En résumé, l’analyse de scène auditive se réfère à la capacité des auditeurs à analyser des scènes acoustiques complexes en objets cohérents. Selon Laurel Trainor, cette aptitude auditive aurait des fondements très anciens dans l’évolution.¹⁷²

La situation d’écoute la plus courante correspond à une situation où l’auditeur cherche à comprendre ce qu’un locuteur dit alors que ses paroles sont noyées dans un bruit de fond. C’est l’effet « Cocktail Party »¹⁷³ qui a été décrit en 1953 par Colin Cherry où il étudie l’attention auditive à l’aide d’un protocole d’écoute dichotique qui sera réutilisé plus tard par Diana Deutsch. Il consiste à faire entendre des signaux acoustiques distincts à chaque oreille à l’aide d’écouteurs. Pour Deutsch, cette situation artificielle d’écoute permettra la découverte d’illusions auditives, alors que pour Cherry il s’agit d’appréhender le pouvoir inhibiteur dans une situation de filtrage d’information. Nous reviendrons sur les illusions perceptives avec les travaux notamment de Pressnitzer dans notre quatrième sous-chapitre.

Les questions sur cette capacité essentielle de la perception auditive sont bien plus anciennes : Helmholtz s’interrogeait déjà sur notre capacité à percevoir les qualités individuelles des instruments de l’orchestre.¹⁷⁴ « Selon lui [Helmholtz], l’observateur met en œuvre des lois perceptives qui donnent naissance à l’interprétation la plus efficace de l’environnement. Ce type de raisonnement pourrait expliquer pourquoi les lois gestaltistes ont été élaborées. »¹⁷⁵ Pour réaliser cette analyse, l’auditeur utilise des informations qui doivent caractériser les différentes sources acoustiques qu’il tente d’isoler. C’est la représentation perceptive de ces traits acoustiques que l’on appelle « indices perceptifs ». Grâce à ces indices, l’auditeur peut séparer la mixture en flux auditifs. Pour parvenir à effectuer cette séparation, Bregman rend compte des processus d’analyse des scènes auditives, qui expliquent les lois décrites intuitivement par les gestaltistes : bonne forme, continuité, proximité, similitude, destin commun et clôture. Avec la collaboration du musicologue James Wright (1987)¹⁷⁶, Bregman introduit la notion essentielle de « propriété émergente ». Steve McAdams nous explique à ce sujet que « les propriétés des événements émergent de la fusion simultanée des informations acoustiques alors que les propriétés des flux émergent de l’intégration séquentielle des événements. »¹⁷⁷

Vingt années de recherches sont alors réunies et publiées sous l’intitulé Auditory Scene Analysis : Perceptual Organization of Sound ¹⁷⁸, où Bregman condense tous les principes de l’analyse de scènes auditives (ASA) sur les bases de deux grandes classes de mécanismes : les mécanismes de ségrégation simultanée, qui traitent les événements sonores simultanés et les mécanismes de ségrégation séquentielle, qui traitent les événements sonores ne se recouvrant pas dans le temps. En étudiant ces mécanismes, certaines caractéristiques acoustiques permettant à des sons d’être séparés ont pu être associées à des variables ou fonctions auditives. Ainsi, il a été montré que la sélectivité fréquentielle était un des facteurs déterminants pour la perception de la hauteur fondamentale. Outre la clarification de nos connaissances sur le fonctionnement de l’appareil auditif, ces études ont ouvert des pistes de réflexion pour améliorer la réhabilitation des malentendants, et plus particulièrement en milieu bruyant. Bregman explique :

Forgée par des informaticiens dans le domaine de la vision […] l’« analyse de scènes » désigne la stratégie par laquelle l’ordinateur regroupe l’ensemble des propriétés visibles – pourtours, textures de surface, couleurs, distances, etc. – d’un même objet. Ce processus permet de déterminer la forme globale et les propriétés correctes d’un objet. Par analogie, l’analyse de scènes auditives est le processus réunissant en une unité perceptive l’ensemble des signaux provenant, dans une période de temps donnée, d’une seule source sonore de l’environnement.¹⁷⁹

Les processus d’organisation séquentielle suivent plutôt les principes de similarité et de continuité alors que les processus d’organisation simultanée reposent surtout sur le principe de destin commun.

Bregman propose également une autre catégorisation de ces mécanismes. Lorsque le processus de groupement/séparation se fait en groupant les éléments qui partagent un même indice, nous parlons plutôt de processus « primaire ». Ce type de processus est communément étudier comme bottom-up (ascendant), c’est-à-dire que l’information permettant la ségrégation circule de la cochlée vers le cerveau. Ces mécanismes devraient permettre d’exploiter de façon automatique les indices extraits par les voies auditives primaires. Par contre, il ne faudrait pas mettre de côté une possible contribution de processus basés sur des schémas de type top-down (decendants). Ce type de mécanisme doit permettre d’exploiter nos connaissances a priori des sons qui nous sont familiers. L’auditeur effectue un aller-retour entre les étapes perceptives élémentaires et les processus de traitement de haut niveau (représentations mentales, prise de décision, inférence, interprétation).

Stephen McAdams résume sous forme d’organigramme les cinq processus de traitement de la reconnaissance auditive :

Figure 49 : Schémas des étapes de traitement qui interviennent dans la reconnaissance et l’identification.¹⁸⁰

2.1. Le groupement simultané

Les mécanismes du groupement simultané reflèteraient le mieux notre capacité à comprendre la parole dans le bruit par exemple. Spontanément, les auditeurs groupent ensemble les composants acoustiques simultanés qui commencent et s’arrêtent en même temps. Les fréquences entendues sont liées harmoniquement. Nous sommes par exemple capables de fusionner les harmoniques d’un saxophone pour former une image auditive cohérente et reconnaissable de l’instrument.¹⁸¹

Les processus de ce type de groupement font appel aux indices suivants :

L’harmonicité : lorsqu’un ensemble de sons présente des fréquences harmoniques (multiples entiers de la fréquence fondamentale), celles-ci fusionnent. La perception de la hauteur en est un bon exemple, car toutes les harmoniques fusionnent en une seule hauteur. Ce processus « consiste plus en l’annulation d’un masque harmonique qu’en l’extraction d’une cible harmonique. »¹⁸²
La localisation : « le système auditif tend à grouper les éléments acoustiques de même provenance spatiale et à séparer ceux qui proviennent d’azimuts différents »¹⁸³. Le système auditif utilise donc des processus de localisation pour l’analyse des scènes auditives. La spatialité s’avère être un indice majeur dans l’acte d’écoute d’un individu entouré d’autres personnes conversant.
Le synchronisme des attaques et des chutes : les sources concurrentes sont rarement synchrones (sons commençant, variant et se terminant simultanément). Ainsi, une asynchronie d’attaque donnera l’impression d’une perception d’objets multiples.
Le synchronisme de modulation : quand plusieurs sources simultanées sont concurrentes, les sons modulés en amplitude et/ou en fréquence de façon identique sont regroupés.

2.2. Le groupement séquentiel

Comme le souligne le musicologue Philippe Lalitte, « le groupement séquentiel se fonde soit sur le principe de similarité ou de continuité des évènements (hauteur, timbre, sonie ou position spatiale), soit sur le principe de proximité temporelle entre les évènements. »¹⁸⁴ L’organisation séquentielle crée certains aspects de l’expérience musicale comme le rythme et la mélodie.

Le premier principe est la similarité : le système auditif interprète deux évènements sonores évoluant dans le temps comme appartenant à deux sources sonores distinctes si les sons appartiennent à deux régions fréquentielles éloignées comme une flûte et un piano par exemple. Cet éloignement conduit de fait, à la perception de timbres différents. Par contre si les sons sont proches du point de vue fréquentiel, il ne percevra qu’une seule source. Les tâches de streaming sont le plus souvent utilisées pour l’étudier.¹⁸⁵ Enfin, deux événements séparés dans l’espace seront plus facilement séparés en flux distincts que deux évènements rapprochés. Il peut donc s’agir d’une similarité de hauteur, de timbre, de position spatiale, de sonie, etc.
Le deuxième principe est associé à la proximité temporelle : le rythme et le tempo jouent également un rôle important dans la perception de l’organisation auditive séquentielle. Selon Bregman et Campbell, si une suite de six sons est présentée lentement, on entendra un seul flux auditif de six notes ; a contrario, si le tempo est rapide, une fission perceptive se produit et deux flux de trois sons seront perçus.¹⁸⁶ Les indices temporels sont donc mobilisés dans ce processus qui s’établit suivant les modifications des propriétés acoustiques des événements acoustiques au cours du temps.

2.3. Le groupement segmentationnel

McAdams distingue un groupement supplémentaire impliqués dans la formation d’une scène auditive, à savoir le groupement segmentationnel ou segmental.¹⁸⁷

Figure 50: Différents types de groupements et leurs effets perceptifs.¹⁸⁸

Ce groupement affecte le « découpage » des flux en unités musicales plus larges, telles que les motifs, les phrases et les thèmes. Les principes de similarité et d’invariance (tonalité, mode, métrique, rythme, harmonie, texture…) et le principe de familiarité (ce que l’auditeur a déjà entendu au cours de la pièce musicale notamment) sont employés dans ce groupement par segmentation. Dans ce contexte, les processus de groupement auditif sont impliqués dans de nombreuses pratiques d’orchestration, notamment la fusion de timbres d’instruments due à un groupement simultané, la ségrégation de mélodies basée sur des différences de timbre dans le groupement séquentiel, et des échanges de type réponse ou écho par le biais de contrastes orchestraux pour le groupement segmentationnel. Tout comme dans le groupement séquentiel, il met en œuvre également les principes de similarité et d’invariance (tonalité, mode, harmonie, métrique, rythme, texture…) et le principe de familiarité (ce qui a déjà été entendu au cours du déroulement d’un morceau ainsi que les reprises).

Dans une perspective analytique, on pourrait rapprocher la dimension verticale de la texture du groupement simultané et la dimension horizontale des groupements séquentiel (échelle temporelle locale) et segmental (échelle temporelle plus large). Dans la musique après 1945, et notamment dans les musiques qui accordent une importance majeure au timbre, à la texture et à l’espace, le groupement segmentationnel correspond à des qualités sonores émergentes telles que la densité (opacité vs transparence), l’étendue (large vs étroite), le centre de gravité tonal (léger vs lourd), la brillance (clair vs sombre), la dissonance sensorielle (rugueux vs soyeux) pour la dimension verticale. Alors que la striation (pulsé vs lisse), la régularité (fluide vs saccadé), la vitesse (rapide vs lent), la stabilité (mouvant vs statique) et la densité temporelle (aéré vs compact) illustrent plutôt la dimension horizontale.

2.4. Les processus de concurrence entre ces trois groupements

Nous avons énoncé précédemment chez Bregman et McAdams, les différents principes perceptifs concernant les groupements simultanés, séquentiels et segmentationnels. En musique, ces trois ensembles de principes opèrent en même temps afin de créer une représentation mentale cohérente avec la conduite des sources sonores de notre environnement.¹⁸⁹ Le processus d’analyse de scène auditive est considéré comme réussi lorsque l’image auditive formée est cohérente en séparant correctement chaque source et chaque flux auditif. Cependant, il peut arriver que les indices ne soient pas cohérents entre eux ce qui conduit à tromper le cerveau qui fait alors émerger une image auditive ne correspondant pas aux sources et aux flux du monde physique, et qui, par voie de conséquence, crée des ambiguïtés perceptives ou des chimères auditives. Le phénomène de concurrence a été étudié par Bregman et Pinker.¹⁹⁰ Ils ont élaboré des stimuli sonores afin de comprendre comment interagissaient ces principes d’organisation séquentielle et simultanée. Il en résulte que plusieurs principes opèrent en compétition : d’une part, la proximité fréquentielle (sons conjoints) concernant l’organisation séquentielle et d’autre part l’harmonicité et le synchronisme des attaques pour l’organisation simultanée. En musique, d’autres principes peuvent potentiellement entrer en concurrence comme la comodulation des fréquences et des amplitudes ainsi que la proximité des timbres. Une autre étude du musicologue Wright et de Bregman a montré comment les compositeurs et théoriciens du XVIᵉ siècle se servaient intuitivement de ces principes d’organisation auditive dans leurs compositions¹⁹¹. Par exemple, les principes du contrepoint soulèvent les mêmes problématiques qu’ont rencontré Bregman et Pinker, car nous retrouvons une compétition entre synchronisme harmonique et proximité mélodique. Nous reparlerons de cela en détail dans notre chapitre sur les liens entre la texture, l’ASA et les illusions auditives.

3. Application des principes de la Gestalt à la musique

3.1. Chez Meyer

Dans son ouvrage, Emotion and meaning in music¹⁹², Léonard B. Meyer, en exposant le fondement musical essentiel de la musique tonale, à savoir la relation tension/détente au cœur des émotions, est véritablement le premier à intégrer les principes psychologiques de la gestalt à un discours sur la musique. Bien que son travail soit centré sur l’aspect émotionnel, il s’agit assurément d’un travail d’analyse musicale et non pas d’esthétique. C’est justement cette caractéristique qui rend son travail exceptionnel et fait de lui un pionnier. Il tente de se distinguer du courant dominant de l’analyse de la musique de son époque en intégrant le sujet ou la perception et non pas seulement l’objet, c’est-à-dire la partition. « Les théoriciens de la musique, en règle générale, se sont attachés à élucider la grammaire et la syntaxe de la musique plutôt que les significations ou les expériences affectives auxquelles elle donne lieu. »¹⁹³

Nous pensons tout particulièrement aux travaux d’Ernst Kurth, avec notamment Musikpsychologie écrit en 1931.¹⁹⁴ Ce dernier ouvrage publié par le théoricien vise à jeter les fondements de la psychologie de la musique, prolongeant la « Tonpsychologie » de Carl Stumpf et synthétisant les trois grand livres grâce auxquels Kurth s’est fait connaître : le premier sur Bach, le deuxième sur Wagner et le dernier sur Bruckner. Il s’est d’ailleurs beaucoup intéressé à la musique de Debussy car cette nouvelle écoute, totalement affranchie du modèle cognitif propre à la musique tonale, ne s’applique plus à l’accord pris isolément mais aussi à la succession des accords. Ce qui signifie que cette succession d’accords entendue ne s’inscrit plus dans un réseau de relations syntaxiques gouvernés par un principe général, celui de la logique tonale, mais forme une progression qui justifie sa seule couleur, sa texture propre.¹⁹⁵ Kurth parlait déjà de « flux de forces » parcourant la matière acoustique et de « traits sonores fusionnés » pouvant être déchirés par « des lignes qui ressortent »¹⁹⁶, ce qui n’est pas sans rappeler la notion de texture chez Meyer.

La grande originalité de Meyer a été d’appliquer les grands principes de la Gestalt dans le domaine de l’écoute musicale et non pas seulement dans celui de l’audition. L’écoute musicale s’inscrit alors dans un véritable processus communicationnel. Ainsi les notions de style et d’acculturation inscrivent ce processus dans une dimension culturelle et écologique, multipliant ainsi les paramètres pertinents dans l’étude de l’écoute musicale. Meyer va donc considérer les principes de groupement dans les termes d’une « attente perceptive ». Dans son deuxième chapitre, il nous explique que « les attentes nées de la nature même des processus mentaux humains sont toujours conditionnées par des possibilités et probabilités inhérentes aux matériaux et à leur organisation tels qu’ils se présentent dans un style musical donné. »¹⁹⁷ Car, selon Meyer, l’émotion musicale serait le résultat de nos attentes : elles peuvent être provisoirement inhibées, voire complètement frustrées. Nous pouvons dire que Meyer adapte ici à l’écoute musicale, la loi de la continuité, puisque ces attentes déterminent la valeur affective que l’auditeur attribue à la musique. Selon le philosophe Gaston Bachelard, « l’action musicale est discontinue, (et) c’est notre résonance sentimentale qui lui apporte la continuité. »¹⁹⁸ La continuité s’exprime comme une tendance au prolongement de l’organisation la plus simple. Une « bonne continuation » est celle qui est attendue.

Afin d’expliquer cela, le musicologue américain se réfère aux travaux de Koffka et à la Gestalt en nous renseignant sur la texture musicale notamment et pour démontrer comment le fonctionnement des structures musicales (rythme, régularité, symétrie) est à la base de l’évocation des émotions, en contribuant à la satisfaction de l’esprit (loi de prégnance). Par exemple, Meyer souligne la nécessité d’une répartition figure-fond dans le domaine visuel, tandis que dans « l’espace auditif, en musique, il n’y a pas de fond établi ; il n’existe pas de stimulation continue et nécessaire par rapport à laquelle toutes les figures devraient être perçues ».¹⁹⁹ Selon lui, notre cerveau est capable d’organiser de multiples façons les données que nous percevons. Pour cela, il énonce cinq manières distinctes :

Une figure unique sans fond, comme une composition pour instrument seul,

Plusieurs figures sans fond, comme une polyphonie où nous percevons clairement les différentes parties séparément,
Une figure accompagnée par un fond, comme les textures homophoniques du XVIIIᵉ et XIXᵉ,
Un fond seul, comme dans l’introduction d’une œuvre,

Une superposition de petits motifs similaires sans être identiques, comme dans les textures hétérophones.²⁰⁰

3.2. Chez James Tenney et Larry Polansky

A la suite de Meyer, d’autres musicologues se sont intéressés à la théorie de la Gestalt et en ont tiré des fondements pour élaborer leurs propres théories analytiques. Par exemple dans le modèle de James Tenney et Larry Polansky²⁰¹, les auteurs proposent quatre niveaux hiérarchiques de la Gestalt temporelle :

Element : il n’est pas divisible perceptuellement en plus petite unité.

Clang : correspond à une succession de deux éléments, ou plus.

Segment : correspond à une succession de deux Clang, ou plus.

Section : correspond à une succession de deux segments, ou plus.

La pièce entière correspond quant à elle à un autre niveau.

Dans cet article, Tenney et Polansky ont réalisé une analyse segmentationnelle de Densité 21,5 de Varèse en comparant avec celle de Nattiez. La seule pièce pour instrument soliste de Varèse, Densité 21,5, crée en 1936, est sa pièce la plus jouée et la plus représentée de son catalogue discographique. Elle est également sa pièce la plus analysée. L’analyse de Nattiez, une des plus complètes sur le sujet, repose sur une analyse paradigmatique.²⁰² Il a mis en évidence notamment l’alternance systématique des mouvements intervalliques ascendants et descendants. Quant à Tenney et Polansky, ils se basent sur deux lois de la Gestalt-theory afin d’établir des critères de segmentation perceptivement plausibles, tels que la proximité temporelle et la similarité intervallique : « La formation perceptuelle des

Gestalt temporelles à n’importe quel niveau hiérarchique est déterminée par un certain nombre de facteurs de cohésion et de ségrégation, dont les plus importants sont la proximité et la similarité. »²⁰³

Figure 51: Extrait de l'analyse de Tenney et Polansky, p. 222. — Figure 51: Extrait de l’analyse de Tenney et Polansky, p. 222.

Les différentes lois de la Gestalt sont repérées spontanément par l’auditeur. Elles lui permettent de grouper et de séparer les flux auditifs. Les expériences référées à ces modes de discrimination ont été synthétisées par Diana Deutsch.²⁰⁴ Célestin Deliège explique à ce sujet : « De telles règles ne sont sans doute pas limitatives des normes de groupement, mais leur seule énumération constitue un guide précieux pour la psychologie, la pédagogie, mais surtout, on voudrait l’espérer, pour la composition musicale : leur apparente consistance et leur universalité semblent pouvoir inspirer une démarche imaginative. » ²⁰⁵

3.3. La Théorie Générative de la Musique Tonale (TGMT)

En 1973, le compositeur Leonard Bernstein donne une série de conférences à Harvard et appelle les chercheurs à proposer une grammaire musicale comparable à la théorie de la « grammaire générative » de Noam Chomsky. Ce dernier propose une nouvelle théorie du langage basée sur le postulat d’une grammaire universelle par définition dépourvue de contraintes sémantiques. En réponse à cela, dès l’année suivante, l’institut de technologie du Massachusetts, le célèbre MIT, organise un séminaire sur musique et langage où le compositeur musicologue Fred Lerdahl s’associe au linguiste Ray Jackendoff pour proposer une théorie générative de la musique tonale.²⁰⁶ Cette théorie, appelée TGMT, travaille également sur la question de groupement des structures musicales selon les principes de la Gestalt. Cette théorie propose un ensemble de règles formelles expliquant comment les auditeurs pourraient dégager la structure d’une pièce de musique sous forme d’une hiérarchie d’événements. Il est important de souligner qu’autant Meyer que Lerdahl et Jackendoff partagent l’idée selon laquelle une pièce de musique tonale possède une structure fortement hiérarchisée où chaque évènement s’intègre dans un réseau de relations. La TGMT décrit la façon dont les processus mentaux d’un « auditeur expérimenté » répondent à la structure musicale, reprenant l’idée du linguiste américain Chomsky d’un « parleur écoutant idéal ». Les unités de base de la grammaire musicale de Lerdahl et Jackendoff correspondent à des notes ou à des accords, alors que nous parlons de phonèmes en langage. Le développement de cette théorie a été influencé par la théorie d’Heinrich Schenker (1935), notamment par le concept des structures sous-jacentes à la surface musicale.²⁰⁷ Sa théorie s’apparente également à la théorie de la Gestalt, qui lui est contemporaine, et plus généralement, elle se rattache au développement de la phénoménologie et du structuralisme du début du XXᵉ siècle.

Ainsi, quatre types de structures sont définies et décrivent l’organisation d’une pièce de musique :

La structure de groupe (« grouping structure ») : l’auditeur perçoit un ensemble de notes qu’il regroupe intuitivement en unités de différentes longueurs. Ces unités proposent une hiérarchie de groupements mélodico-rythmiques : motifs, périodes, phrases, etc…

Figure 52: Exemple de représentation de la structure de groupe avec le début du *Scherzo* de *la Sonate* de Beethoven *opus 2, n°2,* Extrait de Lerdahl and Jackendoff (1983), p. 15.

Les accolades représentent les différents groupes d’éléments et leur hiérarchie.

La structure métrique (« metrical structure ») : à partir de la pulsation, l’auditeur dégage une hiérarchie d’accents qui dépend de la mesure, tels que les temps forts et les temps faibles.

Figure 53: Exemple de représentation de la structure métrique avec le début de la Symphonie en sol mineur de Mozart. Extrait de Lerdahl and Jackendoff (1983), p. 23.
Dans la représentation des structures métriques de la TGMT, le nombre de points verticaux indique le niveau hiérarchique : plus il y a de points, plus le niveau est fort. Les premiers temps de chaque mesure sont des temps forts : 4 points dans la représentation de la structure métrique. — Figure 53: Exemple de représentation de la structure métrique avec le début de la *Symphonie en sol mineur* de Mozart. Extrait de Lerdahl and Jackendoff (1983), p. 23.
Dans la représentation des structures métriques de la TGMT, le nombre de points verticaux indique le niveau hiérarchique : plus il y a de points, plus le niveau est fort. Les premiers temps de chaque mesure sont des temps forts : 4 points dans la représentation de la structure métrique.

La réduction des trames temporelles (« time-span reduction ») : elle s’appuie sur les deux niveaux hiérarchiques précédents pour former un arbre temporel avec plusieurs niveaux d’enchâssements.

Figure 54: Représentation des structures de groupe et métrique de l’Ouverture du Menuet de la Symphonie n° 104 de Haydn. Extrait de Lerdahl and Jackendoff, p. 26. — Figure 54: Représentation des structures de groupe et métrique de *l’Ouverture du Menuet de la Symphonie n° 104* de Haydn. Extrait de Lerdahl and Jackendoff, p. 26.

La TGMT repose sur l’interaction entre structures de groupes et structures métriques. Celle-ci peut conduire à certaines ambiguïtés, notamment dans un contexte d’écoute de musique contemporaine. Les structures métriques et de groupement servent à l’auditeur à hiérarchiser les événements en laps de temps afin de déterminer quels événements sont les plus importants structurellement parlant. C’est là qu’intervient la notion de réduction empruntée à la théorie de Schenker : certaines notes sont ornementales, d’autres sont structurelles. Cependant, Lerdahl et Jackendoff ne reprennent pas à leur compte l’idée que toute composition est prolongation d’une structure fondamentale (Ursatz).

– La réduction prolongationnelle (« Prolongational Reduction ») : elle est fondée sur l’augmentation ou la réduction de la tension tonale. Elle exprime les relations de tension et de détente entre les éléments musicaux ainsi que la stabilité des événements en termes de continuité et de progression, de degré d’ouverture et de fermeture.

Figure 55 : Exemple d'une réduction prolongationnelle de Là ci darem la mano de Don Giovanni de Mozart : les branchements à droite représentent les éléments de tension et ceux de gauche la détente, extrait de Lerdahl and Jackendoff, p. 200. — Figure 55 : Exemple d’une réduction prolongationnelle de *Là ci darem la mano* de *Don Giovanni* de Mozart : les branchements à droite représentent les éléments de tension et ceux de gauche la détente, extrait de Lerdahl and Jackendoff, p. 200.

Ces deux dernières catégories sont essentiellement basées sur le principe de la stabilité tonale.

Figure 56: Analyse générative de la première phrase de l’Aria des Variations Goldberg de Bach. — Figure 56: Analyse générative de la première phrase de *l’Aria des Variations Goldberg* de Bach.

Pour chacune de ces structures, la TGMT définit un nombre limité de règles permettant de prédire les structures hiérarchiques perçues par les auditeurs : règles de bonne formation, règles préférentielles et règles transformationnelles.

En conclusion, la TGMT a posé un cadre de référence dans l’étude de la perception musicale en décrivant des principes de structuration des événements musicaux au cours du temps. Cette théorie repose sur un ordre très précis d’opérations. Emmanuel Bigand en a proposé une représentation schématique :

Figure 57: Représentation schématique de la TGMT (d'après E. Bigand, 1994) — Figure 57: Représentation schématique de la TGMT (d’après E. Bigand, 1994).²⁰⁸

La TGMT a révolutionné la recherche en sciences cognitives de la musique en servant de base théorique à de nombreuses études expérimentales (Bigand²⁰⁹, Deliège²¹⁰, Krumhansl²¹¹). Selon Sloboda notamment, cette théorie marque l’âge de maturité de cette discipline.²¹² Elle a permis une meilleure compréhension de la perception des structures syntaxiques de la musique tonale, néanmoins la TGMT a complètement laissé de côté les aspects sonores de la musique : dynamique, timbre, texture et espace. Cela reste une vision très graphocentrique de la musique.

Afin de visualiser l’ensemble de la TGMT, voici le diagramme général proposé par les auteurs :

Figure 58 : Diagramme général de la théorie de Lerdhal et Jackendoff.²¹³

3.4. Le modèle Implication-Réalisation de Narmour

Eugene Narmour, disciple de Léonard Meyer, développe le concept d’implication proposé par ce dernier. Pour cela, Narmour propose une théorie de la cognition des structures mélodiques simples sous le nom de Implication-realization model.²¹⁴ Ce modèle d’implication-réalisation s’inspire lui aussi des principes d’organisation de la psychologie de la Gestalt. Cette théorie postule deux systèmes perceptuels distincts: les systèmes d’implication mélodique ascendants et descendants. Tandis que les principes des premiers sont considérés comme étant câblés, innés et universels, les principes des seconds sont censés être appris et donc dépendants de l’expérience musicale. Ce modèle est centré sur les intervalles. En particulier, les petits intervalles mélodiques impliquent un processus (l’intervalle réalisé va dans le même sens que l’intervalle implicatif et sera de taille similaire), tandis que les grands intervalles mélodiques impliquent un renversement (l’intervalle réalisé est dans une direction différente de celle de l’intervalle implicatif et est de taille plus petite). Bien que ce modèle soit présenté de manière très analytique, il a une pertinence psychologique car il avance des hypothèses sur des principes de perception généraux qui sont spécifiés de manière précise et quantitative et peuvent donc faire l’objet d’une investigation empirique (Krumhansl, 1995²¹⁵; Schellenberg, 1996²¹⁶, 1997²¹⁷ ). Narmour considère que la tonalité est un intervalle de seuil assumant la fonction d’un intervalle petit ou grand (c’est-à-dire impliquant un prolongement ou un renversement) en fonction du contexte. Les cinq principes sur lesquels se base Narmour sont : la « direction liée au registre », la « différence d’intervalle », le « retour au registre », la « proximité », et la « fermeture ».

De ce fait, Narmour développe ses arguments à partir d’un ensemble d’axiomes de base, presque sous la forme d’une preuve mathématique. Il interprète finalement la mélodie comme un assemblage de structures mélodiques élémentaires pouvant être identifiées à plusieurs niveaux hiérarchiques. Les structures mélodiques individuelles ne comprennent que quelques notes séquentielles et sont supposées émerger d’implications mélodiques déterminées de manière innée. Narmour insiste sur le fait que les principes fondamentaux d’implication qui génèrent une structure mélodique sont déterminés de manière innée et reflètent les lois de la Gestalt. Cette affirmation suggère que le modèle devrait être applicable à toutes les mélodies : tonales occidentales, post-tonales, pré-tonales et non occidentales.

Enfin, le modèle de Narmour a été une source d’inspiration pour plusieurs autres modèles d’attentes musicales qui ont repris en partie les principes sur lesquels il est basé ( Schellenberg et al., 2002²¹⁸ ; Margulis, 2005²¹⁹; Pearce & Wiggins, 2006²²⁰).

4. Application de l’ASA dans la musique

Les principes de l’analyse de scènes auditives ont été utilisés pour l’analyse de la texture musicale, quelles que soient les périodes dans l’histoire de la musique. Comme l’a affirmé Bregman bien que l’organisation de la texture puisse résulter d’un style musical particulier « elle est basée sur l’organisation générale de l’audition ».²²¹ Dans la littérature scientifique, il n’existe que relativement peu de travaux appliquant les principes de l’ASA à la musique. David Huron (1989)²²² a proposé une catégorisation des quatre textures de base en se fondant sur la co-modulation de fréquence (mouvement similaire ou parallèle) et sur la synchronie des attaques. Dans son récent ouvrage, Voice leading, The Science behind a Musical Art. (2016),²²³ nous détaillerons comment Huron a étudié les bases perceptives de la conduite des voix en s’appuyant sur les principes de l’ASA.

4.1. L’analyse de la texture dans Eight Lines de Steve Reich (1983)

Steve Reich a posé les fondements de son esthétique dans son ouvrage de référence Music as Gradual Process (1968)²²⁴ dans lequel il explique ceci : « Je veux pouvoir entendre le processus se produire tout au long du déploiement sonore de la musique. Pour faciliter une écoute d’une grande précision, le processus musical doit être extrêmement progressif. »²²⁵ Il s’agit du premier texte théorique de la musique minimale répétitive dont la critique et les études consacrées à Reich, se sont le plus inspirées :

Je ne veux pas parler du processus de composition, mais plutôt de morceaux de musique qui sont, littéralement, des processus. Le trait pertinent des processus musicaux, c’est qu’ils déterminent simultanément l’ensemble des détails note après note et la totalité de la forme. Ce qui m’intéresse, ce sont les processus que l’on puisse percevoir. Je veux être à même d’entendre un processus dans son déroulement sonore. Pour que l’écoute soit fine et précise, un processus musical devrait se produire très graduellement.²²⁶

Nous utiliserons pour mettre en avant les propos du compositeur, l’œuvre Eight Lines, où la texture et les processus sont singulièrement fusionnés. De plus, Philippe Lalitte souligne le fait que « La texture est l’un des moyens privilégiés par Steve Reich pour manipuler des indices perceptifs afin de créer des fusions ou des ségrégations de flux auditifs, des patterns virtuels, des percepts bistables et des attentes musicales. »²²⁷

Eight Lines a été composée entre 1978 et 1983, et créé par le Steve Reich Ensemble, orchestre exclusivement destiné à sa musique, qu’il a fondé en 1966. Elle a été écrite pour deux quatuors à cordes, deux pianos, deux flûtes et piccolo, deux clarinettes en si bémol et deux clarinettes basses. Cette pièce se compose de procédés canoniques et implique la déconstruction et la reconstruction de motifs répétés.

L’écoute d’une pièce musicale implique des processus perceptifs et des focus attentionnels différents selon l’échelle de temps concernée (locale, intermédiaire ou globale). La texture est l’un des moyens privilégiés par Steve Reich pour manipuler des indices perceptifs afin de créer des fusions ou des ségrégations de flux auditifs, des patterns virtuels, des percepts bistables et des attentes musicales.²²⁸

Philippe Lalitte a proposé une analyse centrée sur l’écriture de la texture chez le compositeur minimaliste américain Steve Reich pour qui le souci d’induire des stratégies d’écoute spécifiques chez l’auditeur est primordial. En accord avec la description de la texture proposée par Bregman, dans l’analyse de scènes auditives²²⁹, Lalitte nous expose une analyse pertinente basée sur trois niveaux hiérarchiques différents :

« Les primitives de la texture à échelle de temps locale »,

« La stratification et échelle de temps intermédiaire »,

« Le regroupement de plusieurs types de textures à une échelle de temps globale ».

Concernant le premier niveau, Reich favorise une ambiguïté perceptive en multipliant les instruments et les timbres identiques, ce qui aboutira à une ambiguïté sur la position des temps forts, et à l’émergence d’un flux auditif dans le registre grave. « À une échelle de temps locale, la texture des primitives est donc conçue pour produire des ambiguïtés perceptives ou des patterns virtuels (non écrits dans la partition) qui offrent à l’auditeur différentes possibilités d’orienter son écoute. »²³⁰ Selon Deutsch, en référence à la règle de proximité de la Gestalt psychologie et aux travaux sur l’ASA de Bregman :

La proximité est une puissante loi d’organisation dans la perception des structures de hauteur des sons. C’est particulièrement vrai pour des séquences de notes présentées à un tempo rapide. Lorsque les notes d’une telle séquence sont issues de registres de hauteurs différentes, l’auditeur perçoit deux lignes mélodiques en parallèle, l’une qui correspond aux notes les plus aiguës, l’autre aux notes les plus graves. Les compositeurs ont fréquemment exploités ce phénomène perceptif.²³¹

C’est pourquoi dans le cas des parties de piano combinées d’Eight Lines, le cerveau tend à regrouper les notes les plus graves des deux parties de piano. (Cf figure ci-dessous, les cellules entourées de pointillés). Ce flux émergeant n’est pas écrit spécifiquement sur la partition, c’est pourquoi nous pouvons parler d’illusions auditives. Nous développerons cette notion dans notre chapitre suivant dédié à ce sujet.

Figure 59: Pianos 1 & 2, altos et violoncelles (chiffre 9), extrait de Philippe Lalitte.²³²

Dans le second niveau hiérarchique, l’échelle temporelle semi-globale correspond à ce que l’on pourrait nommer un « présent perceptif élargi ». Philippe Lalitte fait ici référence au « présent perceptif » défini par Paul Fraisse comme étant un acte mental unifié, indispensable à la perception du successif.²³³ Selon Lalitte, « le procédé de remplacement graduel des silences par des notes se situe dans un temps semi-global qui pourrait correspondre au « présent perceptif élargi ». Ce procédé consiste à ne pas présenter un pattern complet dès son apparition dans la pièce, mais à le construire note après note jusqu’à sa complétude. » Dans cette œuvre, Philippe Lalitte souligne le fait que Reich compose la texture en offrant à l’auditeur différentes possibilités de focalisation auditive. À une échelle temporelle semi-globale, en utilisant des procédés tels que le remplacement des silences par des notes, l’étirement temporel d’accords, les fondues d’entrée et de sortie ou la répétition sans changement d’une mélodie, Reich agit sur le degré de prégnance des patterns qui seront perçus, selon la stratégie d’écoute choisie, comme une figure ou un fond.

Pour finir, dans la troisième partie de cette analyse, au sujet du regroupement de plusieurs types de textures à une échelle de temps globale, selon le compositeur, « le trait sans doute le plus intéressant, cependant, consiste en ce que la transition entre les sections a été rendue aussi peu abrupte que possible, par des chevauchements entre les parties, ce qui fait qu’il est parfois difficile de savoir quand une section finit et quand la suivante commence ».²³⁴ En effet, le fait de délimiter précisément les frontières à l’audition, en raison des chevauchements de sections, se révèle être fort complexe. Philippe Lalitte nous explique que « la transition entre les sections est réalisée avec la technique du fondu d’entrée ou de sortie qui fait progressivement émerger ou disparaître une ou plusieurs strates de la texture. » Ainsi Reich, grâce aux éléments de continuité, de retour, de renouvellement ou de rupture qui jalonnent sa pièce, induit chez l’auditeur des phénomènes d’attente et de tension/relâchement, largement décrit par Leonard Meyer.

4.2. Voice leading, The Science behind a Musical Art de David Huron

Dans Voice leading ²³⁵, David Huron fournit une explication scientifique en démontrant pourquoi certaines textures musicales sont plus convaincantes que d’autres pour l’oreille humaine. En s’appuyant sur les règles de l’analyse de scènes auditives, Huron développe une argumentation convaincante sur les principes fondamentaux du système auditif humain régissant la perception des textures musicales. Les musiciens et les auditeurs doivent pouvoir entendre le mieux possible les voix d’une polyphonie, d’un motet, d’une fugue, d’une symphonie, etc. Une texture claire, avec des parties distinctes, qui ne se masquent pas ou qui ne fusionnent pas facilite la ségrégation des flux auditifs et donc la construction mentale d’une image auditive cohérente. Si un musicien choisit de créer une musique dans laquelle deux ou plusieurs parties ou voix simultanées sont destinées à être perçues distinctement, certaines règles de préférences doivent être observées. Huron souligne que les règles du contrepoint ne se sont pas formées de manière arbitraire, elles correspondent aux principes de l’organisation auditive humaine. Au total, douze principes de l’analyse de scène auditive sont évoqués : tonicité, fusion harmonique, masquage auditif, continuité, proximité de la hauteur, co-modulation de la hauteur, asynchronisme des attaques, densité limitée, différenciation du timbre, localisation de la source, attention et attente.

De plus, Huron a établi 37 règles préférentielles de conduite des voix, parmi lesquelles :

La règle d’étendue : préférer les notes situées entre Mi 1 et Sol 4, centrées autour de Ré 3.

La règle du son soutenu : préférer des sons continus ou en succession serrée, avec peu de longs silences.
La règle d’espacement : préférer un espacement large entre les notes les plus graves d’un accord.
La règle des intervalles parallèles : éviter les unissons, quintes et octaves parallèles.

La règle des attaques asynchrones : préférer des attaques asynchrones entre les voix.

La règle du mouvement conjoint : éviter les grands intervalles.

La règle de préparation oblique : à l’approche d’un unisson, d’une quinte ou d’une octave, il est préférable de conserver la même hauteur dans l’une des voix, etc.

Dans ce livre, Huron revient sur le concept d ’« attention », introduit par l’auteur une décennie plus tôt, pour expliquer comment, parmi de nombreux autres principes de perception, les auditeurs peuvent se concentrer sur différents niveaux de la structure musicale hiérarchique (Huron 2007).²³⁶ Nous reviendrons longuement sur ce concept au cours du chapitre dédié aux émotions.

Par exemple, nous savons que la séparation des sources sonores est l’un des moyens les plus efficaces d’améliorer la ségrégation des flux (Divenyi et Oliver 1989)²³⁷. Bien que ce principe soit assez évident dans les œuvres électroacoustiques, il a été beaucoup moins exploré dans les périodes précédentes, à l’exception remarquable des œuvres antiphonales de Giovanni Gabrieli. Le terme de « Cori Spezzati », littéralement « chœurs rompus », était utilisé pour décrire la division des effectifs utilisés (voix et/ou instruments) et la séparation dans l’espace des groupes qui en résultent. Cet effet antiphonal est caractérisé par un aller-retour alternatif du son, d’un bout à l’autre de la pièce, ou d’un haut-parleur à l’autre sur une chaîne stéréo. Dans la Venise de la fin du XVIᵉ et du début du XVIIᵉ siècle, Giovanni Gabrieli a largement utilisé cet effet en divisant le chœur en deux afin de créer une sorte de polychoralité. Cette disposition s’est répandue après la publication des « Salmi spezzati » d’Adrien Willaert (1550) dont les deux groupes étaient installés dans les deux tribunes d’orgue de la basilique Saint-Marc à Venise. Pour des raisons pratiques, Huron développe ce principe en soulignant le fait que les musiciens ont besoin d’un bon retour visuel et auditif pour pouvoir jouer ensemble.

Ainsi, Voice leading permet de créer des outils d’analyse et de conception de scènes musicales allant au-delà des règles de la musique instrumentale occidentale canonique. Les œuvres de Tristan Murail (Gondwana et L’esprit des Dunes) en sont des exemples typiques.²³⁸ Ces œuvres bénéficient en particulier d’une analyse de la musique fondée sur la perception et une analyse de la texture où la ségrégation des flux est révélée grâce à un renouvellement de l’espace sonore. Dans Gondwana (1980, pour grand orchestre), Murail s’appuie sur le modèle de la synthèse par modulation de fréquence, inventé par le compositeur John Chowning, « pour constituer des champs harmoniques et développer des processus d’interpolation entre divers spectres instrumentaux. »²³⁹ L’idée principale est de transformer un son de cloche en un son de trombone. Dans L’esprit des Dunes (1993-94) pour onze instruments et sons de synthèse, Philippe Lalitte nous relate le fait qu’une « grande part de la magie qui émane de L’Esprit des dunes provient de ces illusions sonores qu’a su distiller Murail au sein de sa partition. On croit entendre des sons réels – le vent, la tempête, des voix -, mais ce ne sont que des mirages, des sons entièrement synthétisés dont l’ambiguïté ne fait que renforcer l’impression de mystère. »²⁴⁰

4.3. Le monde du studio d’enregistrement

Dans une tout autre perspective, les principes de l’ASA peuvent être appliqués aux techniques de l’enregistrement musical. Par exemple, une des techniques importantes utilisées par l’ingénieur du son est l’emplacement spatial des nombreuses pistes enregistrées dans deux, trois, ou plusieurs haut-parleurs espacés. L’un des aspects de l’art du mixage consiste à décider quelles pistes enregistrées seront mélangées dans le même haut-parleur, ou seront séparées en plusieurs haut-parleurs, etc. Les solutions sont multiples. Dans cette perspective, Woszczyk et Bregman (2005)²⁴¹ nous explique qu’il serait normal de postuler qu’en mélangeant deux sons A et B, dans le même haut-parleur ou dans tous les haut-parleurs, ils se mélangeront aisément et si on désire les mélanger dans des haut-parleurs séparés, ils seront perçus comme plus distincts. Cependant, séparer deux sons stables dans l’espace ne les rend pas plus faciles à séparer. La séparation spatiale semble fonctionner en accentuant la ségrégation qui repose sur d’autres différences entre les sons. De façon judicieuse, leurs attaques ne se chevauchent pas exactement dans le temps, leurs hauteurs ne changent généralement pas en parallèle. Par conséquent, Bregman et Woszczyk soulignent le fait que l’ingénieur du son peut utiliser efficacement les différences spatiales pour séparer les signaux, en particulier lorsqu’ils diffèrent par leurs caractéristiques temporelles et lorsque leur différence de distance ou de séparation angulaire est grande.

Dans le quatrième chapitre sur le filtrage et l’équalisation, ces chercheurs mettent en avant que :

Le groupement séquentiel des sons est affecté par leurs timbres : cela signifie que l’oreille pourra plus facilement suivre le même instrument ou la même voix au fil du temps si son timbre est unique. Le timbre peut affecter la perception de deux manières : (a) en fournissant des fonctionnalités que l’auditeur peut suivre volontairement dans le temps; et (b) en influençant le regroupement automatique des sons dans une séquence. Il n’est pas du tout certain que chaque fonctionnalité autorisant le suivi volontaire constitue également une base pour le groupement séquentiel automatique.²⁴²

Chaque instrument musical a une structure de formant distincte, qui lui fournit une « signature auditive » pouvant être suivie dans le temps. Cependant, la structure transitoire (début et décalage) ainsi que l’enveloppe dynamique et les fluctuations sont également très importantes pour l’identification et le suivi d’une source sonore. De plus, la « luminosité », la « netteté » et la « rugosité » sont des caractéristiques d’identification essentielles. L’utilisation de filtres et d’égaliseurs peuvent jouer un rôle dans l’accentuation des différences de luminosité et peuvent modifier l’équilibre spectral des formants et des transitoires.

Dans le cas de la synchronisation temporelle (chapitre 5)²⁴³, Woszczyk et Bregman parle de l’intérêt de l’utilisation de « l’effet rubato » où l’ingénieur du son peut décaler dans le temps certaines pistes par rapport à d’autres. Par exemple, retarder ou avancer une piste par rapport aux autres pendant la post-production peut être utilisé pour synchroniser des pistes enregistrées sans synchronisation avec d’autres. Cela peut augmenter l’intégration perceptuelle du groupe d’instruments lorsque cela est souhaité notamment. Les auteurs ont l’espoir que les recherches dans ce domaine aideront les ingénieurs du son à améliorer leur technicité.

Nous avions déjà abordé la question de l’enregistrement musical dans notre chapitre précédent, avec entre autre le modèle de la Sound Box d’Allan Moore, et l’analyse de la texture chez Zak et Moylan où les principes de groupement chez Bregman et McAdams (1979)²⁴⁴ ont été repris dans leurs travaux. Dans son ouvrage Understanding and Crafting the Mix : The Art of Recording²⁴⁵, William Moylan nous expose sa conception du son et de l’enregistrement en se focalisant dès le début sur la nature acoustique du son et de ses différents paramètres physiques. Il poursuit en décrivant comment notre système auditif transforme ce son lors de l’écoute et quelles sont les implications pour notre perception. Dans son troisième chapitre, il est question de forme et de structure musicale, d’organisation et de hiérarchie sonore. En s’inspirant de la théorie de l’analyse de scène auditive de Bregman, Moylan met particulièrement en avant les caractéristiques timbrales, qu’il nomme « sound quality », car selon lui, elles peuvent déterminer si une source sonore pourra se détacher des autres ou au contraire se fondre dans un ensemble. Il a recours à des modes de transcription alternatifs qui reflètent concrètement les préoccupations d’un créateur de musique pop. Pour l’étude des timbres et des textures, Moylan avait déjà exposé cette méthode d’analyse dans The Art of Record Production en 1992.²⁴⁶ Cet ouvrage propose un cadre de référence et un vocabulaire qui décrit les principaux paramètres considérés dans la production de musiques populaires enregistrées tels que les caractéristiques de l’espace, le contour, l’enveloppe spectrale et l’intensité. Sa démonstration est appuyée par une série de graphiques décrivant ces paramètres à partir de la manière dont l’auditeur ou le créateur devrait les percevoir. Voici un graphique illustrant la perception des distances fréquentielles pour chaque strate sonore de la pièce « A Day in the Life » :

Figure 60: Évaluation des distances des strates sonores de la pièce A Day in the Life des Beatles — Figure 60: Évaluation des distances des strates sonores de la pièce *A Day in the Life* des Beatles

Un autre psycho-acousticien William Yost a fourni une liste similaire en décrivant ces indices de fusion : la séparation spectrale, le profil spectral, l’harmonicité, la séparation temporelle, la synchronisation des attaques et des chutes ainsi que les modulations d’amplitude et de fréquence.²⁴⁷

5. Texture, ASA et illusion auditive

« La vie a besoin d’illusions, c’est-à-dire de non-vérités tenues pour des vérités. » Friedrich Nietzsche (1844-1900), Le livre du philosophe.

Notre connaissance du monde est façonnée par nos sens qui nous renseignent sur notre environnement. Mais nos sens peuvent être trompés. La question des illusions est au cœur de l’approche occidentale depuis l’antiquité. Les illusions auditives ont commencé à susciter l’intérêt des communautés scientifiques et musicales, essentiellement à partir de la seconde moitié du XXème siècle. Par définition, « la perception est une interaction de l’information extraite du monde par les sens avec des connaissances déjà acquises sur ce monde. Lorsque ces deux types d’informations ne coïncident pas, une illusion perceptive en résulte. »²⁴⁸ Au tout début des années cinquante, les recherches de George Miller et Joseph Licklider²⁴⁹, de Richard Warren²⁵⁰ ont mis en évidence les phénomènes de nature illusoire, notamment les effets de continuité et de complétion ou l’effet « Picket Fence ».

Figure 61: Illustration de l’effet de continuité.

Par exemple pour illustrer l’effet de continuité, lorsqu’un son pur est coupé par un ou plusieurs silences, il sera logiquement perçu comme interrompu. Par contre, lorsque des bruits d’intensité supérieure à celle du son pur remplacent le silence, le son semble ne pas s’interrompre (a) et l’alternance de sons purs et de bruits brefs génère le même effet (b). Et lorsque le son pur se poursuit pendant le bruit et s’arrête en même temps que lui, le son pur paraît s’arrêter quand le bruit commence (c).

En 1957, la naissance de la synthèse sonore par ordinateur sous l’impulsion de Max Mathews²⁵¹ marque un tournant capital dans l’histoire des illusions auditives.²⁵² Le premier programme de synthèse Music III (1959) est réalisé par une équipe de la Division Recherche de la Bell Telephone Laboratories dirigée par Mathews, dont fait partie le compositeur Jean-Claude Risset : l’informatique musical est née. Cette synthèse par ordinateur donne l’accès au « son organisé » dont Edgar Varèse rêvait depuis le début du XXème siècle. Au demeurant, le compositeur s’est véritablement passionné pour ces travaux.

Il nous semble important de mentionner une œuvre singulière de Varèse, Poème électronique (1958), quelquefois nommée L’homme et la machine, même si elle a été totalement conçue de manière analogique (magnétophone) et non pas avec des ordinateurs. Varèse utilisa des voix, des cloches, de l’orgue, un ensemble de free jazz (avec Charlie Mingus, Teo Macero, etc.) ainsi que des sons électroniques à travers une série de filtres, modulateurs en anneau, distorsions, fondus et diverses manipulations de la bande magnétique telles que mises à l’envers et changements de vitesse. Cette pièce musicale a été composée pour le spectacle « lumière, couleur, rythme, son, image » conçu par Le Corbusier et Xenakis (en tant qu’architecte) dans le cadre de la construction du Pavillon Philips à l’exposition universelle de Bruxelles en 1958. Théoriquement divisé en sept séquences, l’ouvrage place le spectateur au centre d’émotions et de sensations visuelles, fruit d’une collaboration fructueuse entre photographes, cinéastes, éclairagistes, tandis que l’électroacoustique permettait à Varèse de déclencher une composition sonore et mobile conçue en fonction de l’espace. Il fut composé en 3 pistes, et spécialement conçu pour le lieu où il devait être joué sur 450 haut-parleurs. Grâce à la synthèse sonore, explique Jean-Claude Risset, il est devenu possible de « faire surgir des illusions en construisant des structures sonores spécialement conçues pour faire jouer certains mécanismes perceptifs ».²⁵³ De même, Ligeti s’est passionné pour la musique-machine. Avec des œuvres comme Poème symphonique pour 100 métronomes et Continuum pour clavecin, Ligeti a créé des illusions auditives. Joseph Delaplace nous relate que « l’utilisation des mécanismes qui se détraquent […] montre l’importance que revêt pour Ligeti la question d’une musique- machine ».²⁵⁴ Lorsque Ligeti compose Poème symphonique pour 100 métronomes en 1962, Pierre Michel nous explique que « les décalages et transformations dus à la superposition de différents tempi, ainsi que les illusions d’accélération et de ralentissement qui en résultent auront une influence capitale sur la conception rythmique de certaines œuvres ultérieures. »²⁵⁵ Dans Continuum pour clavecin, crée en 1968, Ligeti joue délibérément sur ces trompe-l’oreille en proposant une organisation perceptive basée sur la ségrégation des flux auditifs.²⁵⁶ Cette œuvre a fait l’objet de nombreuses analyses : nous pensons tout particulièrement à celle d’ Emilios Cambouropoulos et Costas Tsougras²⁵⁷ et à celle de Douglas, Noble et McAdams²⁵⁸, plus récente, basées sur les principes de l’ASA de Bregman. Ces principes nous semblent un point d’entrée fondamental pour une analyse approfondie de la texture musicale et pour comprendre la façon dont l’auditeur la perçoit. Le fait d’utiliser une seule valeur rythmique répétée régulièrement à un tempo extrêmement rapide permet à Ligeti d’opérer des subtils changements de hauteurs de manière imprévisible, brisant cette régularité rythmique initiale. En s’appuyant sur les recherches de son temps en psycho-acoustique, Ligeti postulait que pour qu’une succession de notes jouées au clavecin soit perçue comme un continuum sonore, le nombre de notes devait être de 18 par seconde.²⁵⁹

Selon Douglas et al., d’autres facteurs entrent en ligne de compte dans la perception de ce continuum. Le taux d’attaque requis pour la perception de la masse sonore n’est pas une valeur absolue, comme cela a été suggéré par le compositeur lui-même. Il interagit avec d’autres facteurs musicaux et psychoacoustiques tels que la durée, le registre, le timbre et l’organisation musicale. La structure de la hauteur et le contexte subjectif semblent également pertinents, comme le laissaient prévoir les principes de l’analyse de scène auditive.

Ce processus compositionnel produit de magnifiques illusions auditives. Pressnitzer, Suied et Shamma (2001)²⁶⁰ ont également abordé la question de l’illusion auditive dans la musique chez Ligeti. Ils ont appliqué un modèle de calcul de l’ASA (modèle de cohérence) inspiré de la neurophysiologie du système auditif afin de comparer le degré de cohérence temporelle dans deux extraits de pièces d’orchestre de Ligeti : Lontano (1967) et San Francisco Polyphony (1973-1974) Ligeti disait lui-même : « Oui, c’est vrai, je travaille souvent avec les illusions acoustiques, très analogues aux illusions d’optique, à de fausses perspectives, etc. Nous ne connaissons pas très bien les illusions acoustiques. Mais elles sont très analogues et on peut faire des choses très intéressantes dans ce domaine. »²⁶¹

Ces phénomènes sonores insolites ont beaucoup fasciné les compositeurs, qui ont cherché à les imiter avant de les placer, pour certains d’entre eux, au cœur même de leur démarche compositionnelle. Ainsi, la synthèse numérique a permis l’invention de sons très particuliers donnant lieu à des illusions acoustiques, comme les mouvements illusoires des sources sonores de John Chowning (1971)²⁶² , la gamme chromatique perpétuelle de Roger N. Shepard (1964)²⁶³ , les accélérations perpétuelles de Kenneth Knowlton (1964)²⁶⁴ ou encore les glissandi infinis ou paradoxaux de Jean-Claude Risset.²⁶⁵ Le scientifique américain Shepard réalise un équivalent auditif à l’escalier perpétuel de Penrose (cf. figure ci-après).²⁶⁶ Ce procédé s’appuie sur la synthèse préalable par ordinateur des « Shepard tones », des sons périodiques complexes qui résultent de l’addition de signaux sinusoïdaux de même intensité, séparés par des intervalles d’octave. La structure spectrale correspond à un empilement d’octaves, « ce qui a pour effet de rendre la tessiture de chaque son ambiguë (il est difficile d’estimer à quelle octave se situe la note).²⁶⁷ Quand plusieurs sons se succèdent pour former les degrés d’une gamme ascendante ou descendante, et si nous la répétons plusieurs fois, nous obtenons alors l’illusion d’un mouvement perpétuellement ascendant ou descendant.

Figure 62 : Sonagramme d’une gamme de Shepard (échelle des fréquences linéaires). — Figure 62 : Sonagramme d’*une gamme de Shepard* (échelle des fréquences linéaires).²⁶⁸

Figure 63 : L’escalier de Penrose (Deutsch, 2010). — Figure 63 : *L’escalier de Penrose* (Deutsch, 2010).²⁶⁹

Quant à Jean-Claude Risset, il a réussi à le transcrire dans le domaine rythmique en s’inspirant des travaux de Kenneth Knowlton.²⁷⁰ Le compositeur nous éclaire sur ce processus de synthèse sonore :

Dans le processus de synthèse, on est à la source des choses : on peut composer les timbres comme des accords ; on peut transformer intimement les sons de synthèse en modifiant l’évolution dans le temps de leurs composantes. On peut ainsi orienter à son gré l’écoute vers une appréhension fusionnée, focalisée, globale, synthétique, ou au contraire dissociée, distribuée, locale, analytique. On peut fondre des objets sonores en textures fluides, strier ou lisser le temps, plonger dans les profondeurs du timbre dissocié par l’asynchronie temporelle comme la lumière blanche est dispersée par le prisme, et le scinder en constituants élémentaires qui s’allient en mélodie et harmonie.²⁷¹

Les paradoxes sonores créés par Jean-Claude Risset s’inscrivent dans une réelle nécessité esthétique. La réalisation de sons hybrides comme dans son œuvre Sud (1985) par exemple, lui permet de faire cohabiter des oiseaux de métal à côté de grillons de bois.

Figure 64 : Jean-Claude Risset dans un laboratoire de la compagnie Bell en train de suivre une composition pour trompette d’Henry Purcell interprété par un ordinateur. Crédit : Hulton Deutsch.

En 1972, le compositeur et théoricien John Chowning a fait sensation avec son œuvre Turenas et ses impressionants mouvements sonores illusoires, entièrement réalisée par ordinateur avec le programme Music IV de Max Mathews. Turenas est une pierre angulaire de la musique cinétique.

Figure 65: Turenas (1972) : pièce pour bande quatre pistes réalisée sur ordinateur. — Figure 65: *Turenas* (1972) : pièce pour bande quatre pistes réalisée sur ordinateur.

L’œuvre musicale de John Chowning ne peut être séparée de ses recherches sur la localisation et le mouvement des sons dans l’espace.²⁷² Il a utilisé la synthèse des sons par ordinateur, afin de produire des illusions de sons en mouvement très efficaces : rapprocher ou éloigner des sources sonores, les déplacer de droite à gauche, de haut en bas, leur faire remplir une pièce. Des sources individuelles peuvent tourbillonner au-dessus de la tête. Pour cela, certains effets, comme la simulation de l’effet Doppler (léger changement de fréquence lié au mouvement des sources) seront exploités.

Dans son avant-propos à l’ouvrage collectif La spatialisation des musiques électroacoustiques, John Chowning souligne son intérêt conjoint pour la création sonore et la conception d’espaces électroacoustiques : « j’étais convaincu que le contexte spatial du son est tout aussi important que le son lui-même, on entend le son, mais on sent aussi l’espace ».²⁷³

Dans cette période de foisonnement intellectuel, Bregman débute ses recherches sur l’analyse de scènes auditives. Peu de temps après, en 1974, Diana Deutsch découvre une illusion spatiale surprenante : l’illusion d’octave.²⁷⁴ Pour obtenir cela, elle propose l’alternance à plusieurs reprises de 2 tons séparés par une octave, de telle sorte que lorsque l’oreille droite reçoit la tonalité aiguë, l’oreille gauche reçoit la tonalité grave, et vice versa. Diana Deutsch a constaté dans ses expériences que la perception de ce phénomène varie selon les individus : en général, les gauchers et droitiers n’entendent pas la même chose. Puis en 1979, Les illusions auditives seront même référencées pour la première fois dans l’Encyclopaedia universalis, dans un célèbre article réalisé par David Wessel et Jean-Claude Risset.²⁷⁵ Ils dénombrent 6 grandes catégories afin de décrire au mieux ce phénomène : la restitution perceptive des sons, la polyphonie à une seule voix, les paradoxes liés à la dissociation de la hauteur sonore, les paradoxes de rythmes, l’intégration auditive et la localisation auditive.

Il nous semble intéressant de clore ce chapitre sur les illusions auditives en prenant pour exemple un phénomène acoustique singulier issu d’un chant religieux polyphonique du nord de la Sardaigne, principalement à Castelsardo : celui de la quintina. Littéralement « la petite quinte » est un terme générique utilisé pour désigner toute fusion d’harmoniques dans la partie aiguë du spectre. Contrairement à ce que le mot laisse supposer, elle n’est pas nécessairement en relation de quinte avec l’une ou l’autre des voix qui la produisent. La quintina consiste en l’apparition, au sein d’un chœur d’hommes (appelés du grave vers l’aigu : bassu, contra, bogi, falzittu) d’une cinquième voix aiguë qui se situe à l’octave supérieure de la voix principale, celle à laquelle est confié le cantus firmus (Fig. 66).

Figure 66: Spectrogramme et transcription d'un extrait du Miserere Dietro l’Altare enregistré par Bernard Lortat-Jacob (1996/1998) à Castelsardo. — Figure 66: Spectrogramme et transcription d’un extrait du *Miserere Dietro l’Altare* enregistré par Bernard Lortat-Jacob (1996/1998) à Castelsardo.

Cette technique vocale est de tradition orale, transmise depuis des générations. Ce chant qui scande les temps forts de la vie collective (funérailles, fêtes religieuses et patronales) trouve son apogée et sa plus belle manifestation dans les rituels de la Semaine sainte. Cette voix quasi féminine qui naît des quatre voix masculines prend alors dans le contexte dramatique de la « Passion », un sens singulier : « la voix de la vierge » est entendu, dit-on sur place à ce sujet.²⁷⁶

Selon Stephen McAdams, la perception de cette cinquième voix est construite de toute pièce par notre cerveau car elle n’est pas une simple source sonore, elle est tributaire d’un « patron acoustique correspondant à nos connaissances catégorielles des registres vocaux. »²⁷⁷

Cela suppose de la part des chanteurs une grande maîtrise vocale afin que la quintina émerge, notamment la justesse spectrale de la voix qui cherche la consonance de l’accord en concordance avec les harmoniques de la fondamentale, la qualité du répertoire musical liturgique et de l’écriture (technique de faux-bourdon, octave, quinte et quarte), la transformation de la couleur vocalique par l’altération des voyelles du texte chanté afin de privilégier certains formants du spectre harmonique, ainsi que la puissance sonore de la voix dans un espace réverbérant. Bernard Lortat-Jacob, ethnomusicologue et chercheur au CNRS, a analysé les spécificités du chant choral de ces chanteurs sardes de la Confraternità de Castelsardo dans le très bel ouvrage Chant de passion, au cœur d’une confrérie de Sardaigne.²⁷⁸

Figure 67: photo de Bernard Lortat-Jacob.

Bernard Lortat-Jacob explique :

Pour que le phénomène se produise les chanteurs doivent satisfaire à une double exigence : une parfaite intonation (fusion harmonique) et un ajustement précis des voyelles. Seuls quatre chanteurs très avertis, en interaction étroite, capables de s’écouter tout en percevant le résultat d’ensemble peuvent parvenir à une telle perfection, et donner naissance à la mystérieuse quintina.²⁷⁹

6. Texture et émotions

« L’émotion étant le but de toute bonne musique […], je me suis donc attaché avec une application et des efforts non négligeables à le retrouver ».

Claudio Monteverdi.²⁸⁰

6.1. La musique, qu’est-ce que ça nous fait ?

Depuis l’antiquité, les relations entre musique et émotion sont constamment étudiées par une multitude d’auteurs provenant de disciplines très diverses : musicologues, philosophes, sociologues, psychologues, écrivains, historiens, etc. Dans le remarquable ouvrage de Francis Wolff, « Pourquoi la musique ? », le philosophe nous renseigne sur ce que la musique nous fait, en proposant une analyse approfondie, conceptuelle et argumentée sur ce sujet.²⁸¹ En s’introduisant par tous les pores de notre peau, la musique nous fait vibrer. Elle nous agite, nous secoue, nous soulève : « Le son vient d’un corps qui vibre, et lorsque l’onde nous en parvient, elle fait vibrer le nôtre. Les deux corps entrent en sympathie. La musique tient d’abord de ce corps à corps. »²⁸² Distinguant pulsation, mesure et rythme, Wolff analyse avec beaucoup d’intelligence et de finesse, le rythme du discours musical qui contrarie la mesure en nous : « notre attente de l’accent sur le temps fort de « notre » mesure est déjouée par la musique elle-même qui accentue le temps faible. »²⁸³ Pour Eduard Hanslick, à la moitié du XIX^ème siècle, « la forme, par opposition au sentiment, est le vrai contenu, le vrai fond de la musique, elle est la musique même : le sentiment provoqué en nous on ne peut l’appeler ni forme ni fond, il n’est qu’un effet, qu’une résultante ».²⁸⁴ Alors que pour Schopenhauer, la musique rejoint l’âme avec le langage universel du sentiment, en exprimant non un sentiment particulier et déterminé mais l’essence d’un sentiment : la joie, la douleur, etc., une véritable « métaphysique de la musique » en somme. La position d’Hanslick ou de Schopenhauer donne finalement la même place centrale à l’émotion : soit pour l’éviter et rejoindre la forme musicale pure soit, au contraire, pour en souligner l’importance.

Ainsi, probablement de par sa nature répétitive, la musique a servi de support privilégié à de nombreuses études en psychologie cognitive avec un focus particulier sur les attentes de l’individu (Bissell, 1921, Meyer, 1956, Narmour, 1990, Eerola²⁸⁵, 2003, Huron, 2006). Francis Wolff souligne également qu’une grande partie du plaisir musical réside dans la répétition :

La musique est une affaire de répétition, c’est là sa caractéristique la plus constante et la plus propre. Une chanson, c’est souvent un refrain qui revient à l’identique entre les couplets, et les couplets se répètent tous sur le même air. De là la forme rondo B-A-C-A-D-A, etc. Et puis il y a la ritournelle. « Encore ! Encore ! » exige l’enfant. Dans la forme sonate, on expose au début et on réexpose à la fin du mouvement. On répète ou on varie, on imite, on module, que ce soit dans le contrepoint ou dans l’écriture harmonique.²⁸⁶

En général, les études citées précédemment, traitent des attentes suscitées par la musique comme une source de significations et d’émotions chez l’auditeur. En 1921, Arthur Dart Bissel écrivait déjà ceci :

[…] la musique possède un grand avantage sur tous les autres arts – à l’exception possible de la danse – en ce qui concerne la question de l’attente dans sa position unique en ce qui concerne la répétition. Les autres arts admettent la répétition (la danse en particulier), mais la musique l’exige ; elle [la répétition] entre dans la musique comme un facteur essentiel.²⁸⁷

La théorie proposée par Meyer en 1956 est certainement l’étude sur les attentes la plus citée. Elle est devenue une référence incontournable. D’ailleurs, David Huron et Elizabeth Hellmuth Margulis écrivent à ce propos que « Meyer a été bien en avance sur son temps en intégrant les aspects cognitifs et affectifs du fonctionnement mental. En attirant l’attention sur la notion d’attente, il a anticipé d’un demi-siècle les conclusions de la neuroscience cognitive. »²⁸⁸

Etant donné l’immensité des recherches existantes autour de l’émotion en psychologie cognitive et sachant que ce n’est pas le cœur de notre sujet, nous ne pourrons malencontreusement pas être exhaustifs à ce propos. Nous présenterons néanmoins un cours chapitre sur la définition de l’émotion chez les psychologues ainsi que son lien avec le langage musical. Notre objectif n’est pas de faire une synthèse de tout ce que nous savons aujourd’hui des émotions musicales, mais bien de présenter les théories principales dans ce domaine en lien avec la texture. Nous nous servirons pour cela du brillant ouvrage de David Huron, Sweet Anticipation (2006)²⁸⁹ et de l’ouvrage de référence de Meyer largement cité, Emotion et Signification en Musique.²⁹⁰

6.2. Définition de l’émotion musicale

La musique est un stimuli particulièrement puissant. Elle pénètre dans notre corps par les voies auditives et nous sommes tout simplement obligés de donner du sens à ce signal sonore. Cette interprétation se fait à une vitesse extrêmement importante : 500 millièmes de seconde suffisent pour identifier la valence d’un extrait musical (par exemple Vieillard, Peretz, Gosselin, Khalfa, Gagnon et al., 2008).²⁹¹ Et chez Bigand et collaborateurs (2005)²⁹² seulement 250 ms d’un stimuli sonore suffit à notre cerveau pour se synchroniser. Le terme d’« émotion », pour les psychologues, correspond à:

[…] une très brève mais intense réaction affective qui implique généralement un certain nombre de sous-composantes – sentiment subjectif, l’excitation physiologique, l’expression, l’action et tendance, et la régulation – qui sont plus ou moins « synchronisées ». Les émotions se concentrent sur des « objets » spécifiques et durent de quelques minutes à plusieurs heures (par exemple le bonheur, la tristesse).²⁹³

Avec l’émotion et le comportement, l’émotion est l’un des concepts clés de la psychologie expérimentale, car les principales émotions comme la colère, la peur, le bonheur ou encore la tristesse guident et dynamisent les comportements humains dans des situations de vie cruciales. La théorie de Darwin est l’une des premières à avoir posé les bases scientifiques des émotions. Selon l’auteur, elles sont d’une grande utilité pour assurer la survie des individus et les divers aspects expressifs et biologiques des émotions sont indissociables. Pour cela, Darwin a sélectionné huit émotions fondamentales : la tristesse, la joie, la colère, la peur, le dégoût, la honte, le mépris et la surprise.²⁹⁴ A sa suite, les psychologues de la musique se sont notamment appuyés sur les travaux d’Ekman (1980) portant pareillement sur les émotions dites de base que sont la joie, la tristesse, la colère et la peur.²⁹⁵ Tout comme Darwin, ce dernier a en effet démontré qu’il était possible de corréler ces émotions avec des indices faciaux de manière universelle.

Le modèle de Plutchik est également intéressant d’être mentionné : il a abordé le problème d’analogie avec les couleurs en proposant un dictionnaire d’émotions similaires au dictionnaire de couleurs.²⁹⁶

Figure 68: Modèle du *Circumplex* de Plutchik en trois dimensions (en haut à gauche), en dessous à droite en deux dimensions.

De ce fait, tout comme il existe des couleurs primaires et des nuances de celles-ci variant en intensité et constituant le spectre des couleurs, il existerait des émotions primaires et des nuances qui varieraient en intensité. Ce qui aboutitait à des combinaisons possibles entre certaines émotions de base. Ce modèle est défini par le circumplex ci-dessus qui représente un modèle multidimensionnel basé sur des émotions primaires de base dont vont découler des émotions secondaires. Plutchik considère qu’il existe huit émotions de base faites de 4 paires opposées : joie-tristesse, acceptation-dégoût, peur-colère, surprise et anticipation.

De même, plus récemment, dans l’article de Nathalie Fernando et al. (2014), ces chercheurs ont souligné que « la catégorisation de ces émotions repose sur le postulat d’un substrat biologique commun relevant de l’innéité, et sur la différenciation des comportements physiologiques qu’elles engendrent. »²⁹⁷ Les nombreux travaux de Panksepp²⁹⁸(1995-1998)²⁹⁹ et de Peretz (2010)³⁰⁰ y font également références.

6.3. L’émotion dans le langage musical

« La musique est une structure sonore composée qui met en œuvre des systèmes complexes de relations entre les signaux acoustiques. Pour de nombreux auteurs, ces systèmes de relations, plus encore que les propriétés immanentes des sons, sont porteurs d’expression et d’émotion. »³⁰¹ La musique n’est pas seulement destinée au divertissement et au plaisir, mais elle a été utilisée à diverses fins en raison de ses effets sociaux et physiologiques. Nous savons par exemple que la musique agit sur les composantes neurophysiologiques associées à l’état de stress en diminuant le taux de cortisol sécrété par les glandes salivaires. Et, ces effets sont présents dès les premiers stades du développement.³⁰² David Huron souligne que, les fonctions prééminentes de la musique étant sociales et psychologiques, la caractérisation la plus utile serait basée sur quatre types d’informations : le style, l’émotion, le genre et la similitude.³⁰³ Pour Isabelle Peretz, c’est la fonction première de la musique que de renforcer la cohésion sociale³⁰⁴ : « la musique répond à un besoin biologique : un besoin d’appartenance. L’humain est une espèce éminemment sociale. Pour préserver ce trait, elle aurait conservé, dans une petite partie de son cerveau, la musique comme moyen unificateur. Encore plus qu’à communiquer, la musique sert à communier ».³⁰⁵

Rappelons que « le cerveau humain et le reste du corps constituent un organisme dont la cohésion est assurée par des circuits biochimiques et neurorégulateurs mutuellement interactifs, et soulignant l’indissociabilité du corps et de l’esprit »³⁰⁶, Damasio écrit : « La perception des émotions est à la base de ce que les êtres humains appellent, depuis des millénaires, l’âme ou l’esprit » (Damasio, 1995).³⁰⁷

Ainsi, la musique interfère dans nos émotions et provoque dans notre cerveau une sorte de « chorégraphie de neurotransmetteurs », comme l’appelle Daniel Levitin. « La satisfaction et le plaisir liés à la musique découlent de l’augmentation de la dopamine dans le noyau accumbens, à laquelle participe le cervelet en régulant les émotions grâce à ses connexions avec le lobe frontal et le système limbique »³⁰⁸ Cet effet est fortement lié au plaisir éprouvé et corrélé à la sensation de « frisson musical ».³⁰⁹

Le musicologue Léonard Meyer a beaucoup travaillé autour du lien unissant les émotions à la syntaxe musicale. Selon lui, l’émotion se produit lorsqu’une tendance à répondre est provisoirement arrêtée, bloquée ou détournée. Meyer considérait notamment que les émotions en musique étaient provoquées par la façon dont les pièces musicales manipulent les attentes des auditeurs, en lien, comme nous l’avons souligné précédemment, avec les travaux de l’école de la Gestalt. Il considérait les attentes des auditeurs comme étant au centre de l’expérience musicale. Finalement, l’auditeur est amené à se soucier du quoi et du quand (Imberty, 1969³¹⁰; Bharucha, 1987³¹¹; Huron, 2006³¹²). Rappelons que Meyer écrivait à une époque où la recherche sur la cognition musicale était inexistante. Mais depuis de très nombreuses études théoriques et expérimentales se sont intéressées aux attentes musicales, comme celles de Narmour et d’Huron notamment. Le philosophe Schopenhauer « insistait longuement sur le fait qu’un certain type d’émotions spécifiquement musicales peut naître de la beauté formelle, de la dynamique des intensités, du jeu des tensions et des détentes, des attentes et des résolutions. »³¹³ Il insistait sur le fait « qu’une série de purs accords serait fastidieuse, fatigante et vide », que « la musique consiste toujours dans la perpétuelle succession d’accords qui nous troublent plus ou moins, c’est-à-dire qui excitent nos désirs, et d’accords qui nous apportent plus ou moins de calme et de contentement ».³¹⁴ De plus, Michel Imberty en prolongeant la pensée de Bachelard issue de La dialectique de la durée, affirme avec lui que « L’action musicale est discontinue ; c’est notre résonance sentimentale qui lui apporte la continuité ».³¹⁵

La perception de la continuité de la durée musicale ne se réduit pas aux seuls mécanismes cognitifs qui permettent au musicien d’organiser et de mémoriser l’œuvre lors de l’écoute ou de l’exécution : au-delà, il y a aussi une intuition initiale, une émotion personnelle qui vient donner à l’ensemble une unité, une continuité, un « mouvement », un sens, quelque chose qui n’est plus de l’ordre de la cognition abstraite […] ».³¹⁶

Un mot ou une note musicale apparaît rarement seul, mais dans un contexte précis : une phrase ou une mélodie. Le contexte donne des informations essentielles qui permettent à l’auditeur de développer des attentes perceptives sur les évènements sonores à venir. Lors de l’écoute, les connaissances musicales implicites de l’auditeur guident la perception musicale via le développement d’attentes musicales (Tillmann, 2008).³¹⁷ Si l’on compare avec le langage, les connaissances syntaxiques et sémantiques permettent également le développement d’attentes qui guident la compréhension. Cette attention particulière portée à l’écoute se retrouvera par la suite, et jusqu’à aujourd’hui, dans des nombreuses approches analytiques, comme celle d’Eric Clarke.³¹⁸ Dans Ways of Listening, il propose une approche écologique de l’écoute où la notion d’attente décrite par Meyer est également traitée. Pour Clarke, l’acte d’écoute est la clé de sa théorie de la signification musicale, contrairement à la sémiotique de Kofi Agawu³¹⁹ ou à l’herméneutique de Lawrence Kramer.³²⁰ Mais dans le même temps, cette théorie de la perception ne repose pas uniquement sur la hiérarchie de traitement ascendant soulignée par la plupart des théories sur la cognition musicale telles que Narmour³²¹ (1999) et Temperley³²² (2001). Comme l’explique Clarke, « la perception doit être comprise comme une relation entre des informations disponibles sur l’environnement et les capacités, les sensibilités et les intérêts d’un observateur. »³²³ Avec David Huron, soulignons le fait que la valence émotionnelle de la musique dépend de trois types de traits : les traits de la performance liés à l’identité et l’habileté de celui qui produit le message musical, les traits de l’écoute qui dépendent de l’identité individuelle et socioculturelle (et éventuellement de l’expertise musicale) du receveur et les traits contextuels inhérents à la situation d’écoute.³²⁴

Finalement, les attentes qui relèvent de la mémoire immédiate ou à court terme, sont celles qui ont le plus été étudiées par la psychologie de la musique. Un terme équivalent à celui d’attente, et celui d’anticipation. David Huron a d’ailleurs consacré en 2006 un ouvrage sur cette notion d’anticipation.³²⁵ Il propose que les émotions évoquées par les attentes prennent en compte cinq « Perception must be understood as a relationship between environmentally available information and the capacities, sensitivities, and interests of a perceiver. » systèmes distincts : l’Imagination, la Tension, la Prédiction, la Réaction et l’Appréciation (ITPRA). Nous détaillerons ci-après son modèle ITPRA en lien avec la texture après celui de Meyer.

Nous verrons que le point commun central entre les méthodes de Meyer et d’Huron réside dans le fait que l’expérience musicale s’appuie principalement sur la façon dont les attentes de l’auditeur sont satisfaites ou contrariées. Quant à Tan et collaborateurs³²⁶, ils ont mis en avant une différence notable entre ces deux méthodes : à savoir que celle de Meyer serait fondamentalement déterministe, tout comme celle de son disciple Narmour, alors que celle d’ Huron serait basée sur les régularités statistiques de la musique. En parallèle, dans la littérature, nous trouvons particulièrement saisissant le concept « d’horizon d’attente » des œuvres littéraires, à partir des attentes du lecteur, exposé par Jauss dans les années 1970.³²⁷ Pour cet historien allemand, la lecture d’une œuvre littéraire est conçue sur une existence nommée « horizon d’attente » composée de connaissances d’un lecteur potentiel et les présupposés de ce dernier sur la littérature. Cette notion, auparavant utilisée par d’autres comme Gadamer³²⁸ et Husserl³²⁹, joue un rôle essentiel dans la théorie de la réception de Jauss, car pour comprendre l’effet d’une œuvre, il est nécessaire de reconnaître l’horizon antécédent avec ses valeurs. En effet, une œuvre se situe en continuité ou en rupture par rapport à une tradition. « L’expérience des lecteurs renvoie à la perception d’une conformité ou d’un écart par rapport à cette tradition. »³³⁰

De même, étudier en détails les attentes musicales d’un auditeur, comme nous l’expliciterons chez Huron et Meyer, se révèle être une étude esthétique fondamentale par rapport à ce qui nous anime.

6.4. Le pouvoir émotionnel de la texture

Meyer avait tout à fait compris le pouvoir émotionnel de la musique, ce qui explique pourquoi nous la pratiquons, nous l’écoutons et nous l’aimons. Meyer souligne que « tout se passe en art comme dans la vie de tous les jours. »³³¹ En effet, la musique, par ses mouvements, ses vibrations, nous transporte, nous meut et nous émeut. « La musique reflète la forme fondamentale de l’expérience humaine » écrit Meyer.³³²

La texture occupe une place centrale dans son oeuvre car elle est au cœur du processus émotionnel musical. Selon l’auteur, la texture ne se résume pas à une catégorie de l’écriture, mais elle résulte de l’interaction entre le signal acoustique et la perception de l’auditeur. D’ailleurs, dans Emotion and Meaning in Music, Meyer lui consacre un chapitre entier : « La texture concerne l’opération du cerveau qui consiste à regrouper des stimuli musicaux concomitants en plusieurs figures simultanées, une figure et un accompagnement (fond), et ainsi de suite. »³³³ Selon lui, les changements de texture peuvent générer des tensions et des attentes perceptives chez l’auditeur notamment dans des situations telles que l’attente du retour de la texture initiale, une texture trop étirée dans les registres appelant à un rétrécissement ou un fond sans figure, ou encore plusieurs figures sans fond (composition polyphonique avec des parties bien distinctes), etc. Ainsi, « la texture donne lieu à des phénomènes d’émergence perceptive, le terme émergence étant pris dans son sens fort, sous la condition que l’image sonore émergente ne soit pas réductible aux entités fondamentales. »³³⁴ En d’autres termes, la perception de la texture résulte de l’interaction des différentes composantes de sorte que le résultat dépasse leur simple addition selon le principe bien connu de la Gestalt psychologie : « le tout est différent de la somme de ses parties ».³³⁵

Comme expliqué en début de ce chapitre sur les applications de la Gestalt en musique, Léonard B. Meyer nous a prouvé que la musique était un art du temps et qu’à chaque moment d’une œuvre, l’auditeur est placé en situation d’attente par rapport à ce qui va suivre. Il attend « que les formes soient aussi « bonnes » que possible, c’est-à-dire qu’elles satisfassent aux critères de régularité, de symétrie et de simplicité dont les études gestaltistes démontrent qu’ils contribuent à la satisfaction de l’esprit ».³³⁶ Quand un système tonal est établi, nous discernons de la récurrence, une forme de répétition distincte de la réitération qui implique toujours une attente dont la satisfaction est retardée, puis enfin résolue. La réitération est la répétition consécutive d’un terme sonore, qui même s’il est prolongé, est perçu comme un tout. L’attente d’un retour dépend de la compréhension du morceau. Ainsi, nous ne pouvons pas avoir d’attentes musicales si nous n’avons pas compris le cheminement du morceau. Que se passe t-il lors de l’écoute d’un morceau de musique contemporaine atonale ? Nous tenterons de répondre à cette question dans notre partie expérimentale notamment.

Dans son livre Sweet anticipation (2006)³³⁷, Huron décrit plusieurs mécanismes psychologiques liés aux attentes dans la vie quotidienne de l’individu et il illustre comment ces mécanismes fonctionnent. Tout comme Meyer, Huron construit une théorie générale des attentes et l’applique à la musique de concert et à des chansons. Beaucoup d’affects musicaux comme la surprise, le frisson, la tension, etc. sont liés au rapport qui se tisse entre la forme musicale et nos attentes qui dépendent notamment de nos connaissances. L’attente, dans ce sens, implique des représentations mentales, lesquelles sont constamment examinées et réactualisées par nos expériences musicales quotidiennes.

Huron commence par s’interroger en se demandant pourquoi la musique réussit si bien à susciter des émotions alors que ses capacités de représentation du monde semblent si limitées. Il reconnaît le travail fondateur de Meyer, réalisé cinquante ans auparavant, Emotion and Meaning in Music, dans lequel Meyer affirmait que le principal contenu émotionnel de la musique découlait de la manipulation des attentes du compositeur. Au demeurant, Huron propose que les émotions évoquées par les attentes prennent en compte cinq systèmes distincts: l’Imagination, la Tension, la Prédiction, la Réaction et l’Appréciation (ITPRA)³³⁸.

Figure 69: Modèle de la Théorie ITPRA de David Huron.³³⁹

Ces cinq systèmes de réponse peuvent être regroupés en deux périodes différentes : les réponses avant le résultat (les sentiments qui se manifestent avant un événement attendu / inattendu) incluent les réponses d’imagination et de tension. Les réponses post-résultat incluent les réponses de prédiction, de réaction et d’appréciation.

La première, la réponse de l’imagination, est quelque peu éloignée de l’événement et consiste à prédire ce qui va arriver et ce que ressentira l’auditeur, quand et après l’événement musical. Cette réponse peut motiver l’auditeur à prendre le contrôle de l’action, ce qui augmente la probabilité d’une issue positive. Par contre, la réponse en tension fait référence à la préparation mentale et physiologique des auditeurs lorsque l’événement prévu est imminent. La préparation d’un événement attendu implique généralement une préparation motrice et une préparation perceptive.

Une fois que l’événement s’est produit, les auditeurs reçoivent du plaisir ou du mécontentement de la précision de leur prédiction, qui est la réponse de la prédiction. Lorsque le stimulus est attendu, la réaction émotionnelle a une valence positive et quand le stimulus est inattendu, la réaction émotionnelle a une valence négative. Les auditeurs évaluent également le caractère agréable ou désagréable du résultat, ce qui entraîne une réaction. Ainsi, immédiatement après un événement négatif mais néanmoins prévu, l’auditeur peut ressentir un mélange de plaisir et de déplaisir. Enfin, la réaction d’évaluation découle de l’activation de la pensée consciente et implique une évaluation à un niveau plus élevé de l’événement et de ses conséquences.

L’ensemble de ce processus peut conduire à des réponses affectives spécifiques. Lorsque les attentes sont satisfaites, les auditeurs obtiennent un certain degré de plaisir, qui est renforcé si l’événement est positif. Néanmoins, il est important de souligner que les attentes non satisfaites ne sont pas nécessairement négatives. Si l’événement est jugé positif dans son ensemble, le résultat peut être un rire, une crainte ou des frissons.

Le livre se termine par un résumé précieux de la théorie ITPRA et une discussion des implications pour la composition, la performance, la musicologie, l’ethnomusicologie et l’esthétique musicale.

Chapitre 4 : L’enfant sourd, un modèle pour tester la perception de la texture

« Toute science touche à l’art. Tout art a son côté scientifique. Le pire savant est celui qui n’est pas artiste. Le pire artiste est celui qui n’est jamais savant ». Armand Trousseau.³⁴⁰

Au regard de notre présentation et approfondissement autour de la notion de texture, nous nous sommes longuement questionnés sur son utilisation et sa perception auprès d’une population d’enfants avec laquelle nous travaillons depuis une quinzaine d’années : les enfants sourds.

La déficience auditive est le déficit sensoriel le plus fréquent chez l’enfant : environ un cas de surdité congénitale pour 1000 naissances et la même proportion de surdités acquises. Depuis le décret du 23 avril 2012, le dépistage universel systématique néonatal se met progressivement en place en France.³⁴¹ Le diagnostic précoce, la prise en charge ainsi que l’implant cochléaire en cas de surdité bilatérale sévère à profonde constituent des atouts essentiels pour le développement harmonieux d’un enfant sourd.

L’apparition de la surdité peut revêtir des aspects cliniques très divers et peut survenir à tout âge de la vie. La variabilité de plusieurs facteurs comme l’âge d’apparition de la perte auditive (avant, pendant ou après la période d’acquisition du langage), mais également son siège (oreille externe, moyenne ou interne) ainsi que de son degré de sévérité va engendrer des conséquences perceptives, cognitives, neurologiques et langagières diverses. Le développement du langage chez l’enfant, loin d’être un processus linéaire, suit un ordre selon lequel chaque nouveau savoir s’appuie sur des formes ou des fonctions déjà exercées par l’enfant, dans lesquelles l’audition joue un rôle central (Chapman, 2000³⁴² ; Karmiloff-Smith & Karmiloff-Smith, 2012³⁴³). La première partie de ce chapitre sera consacrée à la présentation des critères de la surdité et de ses différents moyens de réhabilitation. Nous exposerons ensuite l’état des connaissances actuelles sur les conséquences cognitives, langagières, sociales et neurologiques de la surdité profonde congénitale. Pour finir, nous présenterons l’émergence des dimensions musicales chez l’enfant normo-entendant et sourd, et pourquoi la musique constitue un véritable outil de stimulation auditive pour ces enfants.

1. Présentation générale de la surdité et les différents moyens de réhabilitation

1.1. L’âge d’apparition de la surdité

La surdité est qualifiée de congénitale lorsqu’elle touche l’enfant dès sa naissance. La boucle audiophonatoire est nécessaire pour le développement du langage et de la parole de l’enfant. Son interruption a donc des conséquences différentes selon l’âge d’apparition de la surdité. Nous distinguons les pertes auditives pré-, péri- et post-linguale. La surdité est qualifiée de pré-linguale ou péri-natale, si elle survient avant l’âge de 2 ans, de péri-linguale ou péri-linguistique, si elle survient entre 2 et 4 ans, et de post-linguale ou post-linguistique, si elle survient après cette période. Il existe également des surdités évolutives responsables d’une régression de l’audition à plus ou moins long terme.

Figure 70 : Schéma récapitulatif d’après Lina-Granade et Truy (2005).³⁴⁴

Les auteurs soulignent l’importance de ces deux premières années de la vie, jugées particulièrement sensibles pour l’acquisition du langage parlé, au regard de la plasticité cérébrale et des capacités d’apprentissages fondamentales.

1.2. Le siège de l’atteinte auditive

De façon générale, les troubles de l’audition sont classés selon la région atteinte du système auditif. Nous distinguons trois types de surdité : les surdités de transmission, de perception et les surdités mixtes. Les surdités de transmission correspondent à une atteinte de l’oreille externe et/ou de l’oreille moyenne. Le degré de perte auditive maximal s’élève à 60 dB et sont en général moins invalidantes sur le plan du développement langagier notamment que les surdités de perception (dont la perte peut atteindre 120 dB). Les surdités de perception se traduisent par une atteinte uni ou bilatérale de l’oreille interne, des voies ou des centres nerveux auditifs. Une surdité de transmission et une surdité de perception peuvent se combiner sur la même oreille, constituant ainsi une surdité mixte. La surdité centrale semble beaucoup plus rare chez l’enfant car elle résulte d’un dommage ou d’une déficience au niveau du système nerveux central et peut se situer dans les connexions nerveuses du cerveau (surdité verbale, surdité corticale et agnosie auditive).

1.3. Le degré de surdité

Il n’existe pas une surdité mais des surdités, classées selon un nombre de critères fort divers (Mondain et al., 2005)³⁴⁵

Figure 71 : Arbre décisionnel pour la classification des surdités, issu de Mondain et collaborateurs (2005).

La Figure ci-dessus représente schématiquement ces critères dans une perspective de prise en charge pluridisciplinaire.

La classification des degrés de surdité et de leurs conséquences perceptives proposée par le Bureau International d’Audio-Phonologie (BIAP, 2008)³⁴⁶ est exposée dans le tableau ci-dessous.

Classification audiométrique des déficiences auditives
Audition normale	La perte tonale moyenne ne dépasse pas 20 dB.
Déficience auditive légère	La perte tonale moyenne est comprise entre 21 dB et 40 dB. La parole est perçue à voix normale. La plupart des bruits familiaux sont perçus.
Déficience auditive moyenne	Premier degré : la perte tonale moyenne est comprise entre 41 et 55 dB. Deuxième degré : la perte tonale moyenne est comprise entre 56 et 70 dB. La parole est perçue à voix élevée. Le sujet comprend mieux en regardant parler. Quelques bruits familiers sont encore perçus.
Déficience auditive sévère	Premier degré : la perte tonale moyenne est comprise entre 71 et 80 dB. Deuxième degré : la perte tonale moyenne est comprise entre 81 et 90 dB. La parole est perçue à voix forte près de l’oreille. Les bruits forts sont perçus.
Déficience auditive profonde	Premier degré : la perte tonale moyenne est comprise entre 91 et 100 dB. Deuxième degré : la perte tonale moyenne est comprise entre 101 et 110 dB. Troisième degré : la perte tonale moyenne est comprise entre 111 et 119 dB. Aucune perception de la parole. Seuls les bruits très puis-sants sont perçus.
Déficience auditive totale	La perte moyenne est de 120 dB et plus. Rien n’est perçu.

Tableau 1 : Classification audiométrique des déficiences auditives du Bureau International d’Audio-Phonologie.

Plus la déficience auditive est importante, plus la quantité et la qualité des informations sonores de l’environnement qui parviennent à l’enfant sourd sont restreintes ; ce qui entrave l’enfant dans son accès au langage oral. Bien évidemment, les conséquences sur le développement du langage seront différentes selon le degré de surdité. Cette classification résulte du calcul d’une perte moyenne sur les fréquences conversationnelles. Dans le schéma ci-après, le son est caractérisé par deux dimensions : la fréquence et l’intensité. Dans l’absolu, il en manque cependant deux autres : les dimensions de durée et de timbre.

Figure 72 : la courbe audiométrique de l'oreille humaine. Les précisions données ci-dessus peuvent se résumer sur un graphique représentant le champ auditif humain (vert). La zone conversationnelle (vert foncé) — Figure 72 : la courbe audiométrique de l’oreille humaine³⁴⁷
Les précisions données ci-dessus peuvent se résumer sur un graphique représentant le champ auditif humain (vert). La zone conversationnelle (vert foncé)

La fréquence basse (pour les sons graves) et élevée (pour les sons aigus) est exprimée en Hertz (Hz). Notre oreille est sensible à une gamme spécifique de fréquences (sons graves et aigus) et d’intensités (sons faibles et forts) définissant le champ auditif humain. L’oreille humaine entend des fréquences comprises entre 20 Hz (fréquence la plus grave) et 20 000 Hz (fréquence la plus aiguë). Elle capte des niveaux d’intensité acoustique compris entre 0 et 120 dB. Pour qu’un son pur de fréquence 1000 Hz soit perceptible par l’oreille humaine, il faut qu’il soit au-dessus de 0 dB. A cette même fréquence, 120 dB est le niveau d’intensité acoustique le plus fort qui puisse être supporté par notre oreille. Au-delà, l’oreille peut subir des lésions irréversibles au niveau de ses structures internes. La zone conversationnelle définit les sons utilisés pour la communication par la voix humaine. Lorsque cette zone est affectée, le handicap auditif apparaît vraiment.

1.4. Étiologie des surdités

Selon une expertise collective réalisée par l’Inserm (Institut National de la Santé et de la Recherche Médicale) en 2006, mais toujours d’actualité, il s’avère que les surdités de l’enfant peuvent être isolées (non syndromiques) ou syndromiques (c’est-à-dire associés à des anomalies d’autres organes).³⁴⁸ Il est à noter également que 90% des enfants sourds naissent de parents entendants (Albertini 2010³⁴⁹ ; Roberts 2018³⁵⁰). La synthèse faite par l’Inserm nous informe précisément sur l’étiologie des différentes surdités :

La prévalence de la surdité augmente avec l’âge. Certains types de surdité, en particulier les surdités génétiques, apparaissent durant l’enfance ou même à l’âge adulte. La répartition des surdités prélinguales dans les pays développés est aujourd’hui estimée à 10-15% de surdités syndromiques héréditaires, 60-65% de surdités isolées héréditaires et 20-25% de surdités d’autre origine (infections, médicaments, complication de la prématurité…).³⁵¹

Les différentes recherches menées dans ce domaine depuis une vingtaine d’années permettent petit à petit l’identification des gènes responsables sur l’origine des déficits auditifs. Le premier gène responsable de la surdité héréditaire congénitale a été identifié en 1995 par Christine Petit, pionnière dans ce domaine, à l’Institut Pasteur (la connexine 26).³⁵² Depuis de jour, une centaine de gènes ont été découvert. L’équipe de Sandrine Marlin³⁵³, médecin spécialiste en génétique de la surdité à l’Hôpital Necker-Enfants Malades – Institut Imagine, contribue énormément à faire avancer la recherche dans ce domaine. Les cahiers de l’Audition ont d’ailleurs dédié un numéro complet autour de ce sujet fondamental en 2013.³⁵⁴

1.5. Les adaptations prothétiques

Selon la recommandation du BIAP, « Chez le jeune enfant, la maturation des voies et des centres auditifs est subordonnée à une stimulation sonore précoce, adaptée et régulière. »³⁵⁵ Toute réhabilitation auditive repose sur un même principe actif : apporter de l’énergie acoustique aux tympans.³⁵⁶ D’où la nécessité d’adapter un appareillage dès le diagnostic posé sans délai. Pour cela, il existe différents moyens de réhabilitation auditive comme : la prothèse auditive conventionnelle et l’implant cochléaire. L’implant cochléaire du tronc cérébral et l’implant électromagnétique d’oreille moyenne sont beaucoup moins fréquents.³⁵⁷ Il est tout à fait primordial de comprendre que l’appareillage évolue au fur et à mesure des progrès de l’enfant. Comme le rappelle Eric Bizaguet, « il s’agit donc d’une démarche interactive dans un cadre pluridisciplinaire où les choix initiaux seront modifiés progressivement à la recherche de la solution la plus adaptée. »³⁵⁸

1.5.1. La prothèse auditive

Il s’agit d’un matériel électronique destiné à amplifier les sons et à améliorer le traitement du signal sonore à partir des capacités résiduelles de l’oreille interne. L’appareil auditif se compose de 3 éléments principaux : un microphone, un écouteur et un amplificateur. Le son est converti en signaux électriques à l’aide du microphone. Ceux-ci sont analysés et traités par le microprocesseur. Les signaux sont ensuite amplifiés et reconvertis en ondes sonores au moyen d’un haut-parleur puis transmis dans le conduit auditif.

Figure 73 : Fonctionnement d’une prothèse auditive conventionnelle.³⁵⁹

1.5.2. L’implant cochléaire

Depuis la fin du XX^ème siècle, Les implants cochléaires ont considérablement évolué. Les premières recherches ont débuté en France et aux Etats-Unis dans les années 1960 pour aboutir à l’essor de cette technologie en 1993.³⁶⁰ L’implant cochléaire pédiatrique s’adresse aux enfants présentant une surdité sévère à profonde bilatérale. Celui-ci a permis une avancée considérable dans le développement du langage oral de l’enfant sourd.³⁶¹ Il existe actuellement quatre fabricants d’implants cochléaires : Cochlear®, Med-El®, Advanced Bionics® et Neurelec®. Chacun de ces fabricants perfectionnent sans cesse leur technologie. Ce qui explique en partie l’orientation de notre recherche auprès d’enfants sourds porteurs d’implants : d’une part, les stratégies de codage de l’implant sont en perpétuelle évolution et demandent une collaboration pluridisciplinaire afin d’améliorer significativement la perception auditive des enfants ; d’autre part, c’est aussi un outil de plus en plus choisi par les familles, au vu des résultats sur la communication des enfants sourds notamment. Une enquête menée par le CISIC (Centre d’Information sur la Surdité et l’Implant Cochléaire) en 2012 en faisait déjà le constat : « 10 % des personnes ont été implantées avant 1996. A partir de 1999, la courbe s’accélère avec un petit ralentissement en 2006 et 2008, avant que les dispositifs d’implants cochléaires ne relèvent d’une prise en charge de la sécurité sociale à partir de 2009. »³⁶² Actuellement on estime à environ 130 000 le nombre de patients sourds bénéficiant d’un implant cochléaire dans le monde, dont environ 1/3 d’enfants.

Figure 74 : Courbe des sujets implantés en France depuis 1996 proposé par le CISIC.

1.5.2.1 Principe et fonctionnement

L’implant cochléaire est une prothèse auditive particulière qui nécessite un acte chirurgical (ANDEM, 1994³⁶³ ; Preisler, 2001³⁶⁴). C’est un dispositif électro-acoustique qui permet de restaurer partiellement la fonction cochléaire, dans le cadre de surdités de perception endocochléaires, profondes et bilatérales (cf. représentation schématique ci-dessous)³⁶⁵.

Le processus entier, de l’arrivée d’un son au traitement par le cerveau, est si rapide que l’utilisateur entend le son au moment où il se produit et ce, de manière continue. A l’inverse de la prothèse auditive, basé uniquement sur l’amplification des sons, l’implant permet de stimuler directement et électriquement le nerf cochléaire par des électrodes implantées chirurgicalement dans la rampe tympanique de la cochlée (jusqu’à 22 électrodes).

Figure 75 : Représentation schématique des différentes composantes d’un implant cochléaire. La partie externe est composée d’un processeur audio, qui enregistre les sons de l’environnement et d’une antenne. La partie interne est constituée d’un stimulateur et d’un porte-électrode de 8 à 22 contacts insérés dans la cochlée.

L’intérêt de cette technique est de remplacer l’organe de Corti défaillant et de restaurer la résolution spectrale ou tonotopie qui permet la discrimination fréquentielle (Govaerts et al., 2004)³⁶⁶, c’est-à-dire la capacité de différencier les sons selon leur fréquence. C’est une capacité essentielle pour la compréhension de la parole.

L’implant est préconisé pour des patients sourds qui ne retirent que peu de bénéfices des prothèses conventionnelles. Il est donc systématiquement précédé d’un essai prothétique. Ainsi, seules 22 électrodes vont remplacer les 3500 cellules ciliées internes absentes ou défaillantes. L’implant permet donc de rétablir une audition efficace mais la perception demeure toujours imprécise, la qualité et la précision des informations sonores s’en trouvent réduites. La gamme de stimulation fréquentielle est similaire entre les quatre constructeurs d’implants, à savoir de 100 à 8000 Hz.

Figure 76 : Implant cochléaire Nucleus CI-22 inséré dans la rampe tympanique. Adapté d’après (G. Clark, 2003)³⁶⁷

Dès lors, pour compléter les apports de l’implant, une prise en charge rééducative alliant l’éducation auditive à l’utilisation d’informations visuelles (lecture labiale, LPC, français signé…) sera nécessaire pour permettre un bon développement linguistique (Hage, Charlier, & Leybaert, 2006).³⁶⁸

1.5.2.2. Les différents types de stratégie de codage existant

Selon Catherine Hage et collaborateurs, les stratégies de codage de l’implant sont divisées en trois grandes catégories : les stratégies temporelles, les stratégies spectrales et les stratégies hybrides.³⁶⁹

Les stratégies temporelles ont pour but de privilégier le traitement de l’information temporelle du message acoustique (stratégie CIS Continuous Interleaved Sampling).³⁷⁰ Cette stratégie effectue un transcodage numérique afin de restituer fidèlement l’enveloppe temporelle dans chaque bande de fréquence. Les électrodes sont stimulées de façon séquentielle afin de réduire les interactions électriques entre les différents canaux. Actuellement, cette stratégie est utilisée chez Cochlear®, Med-El® et Advanced Bionics®. Par exemple, chez ce dernier constructeur, cette stratégie est nommée HiRes.

La stratégie la plus répandue chez Cochlear®, avec leur modèle d’implant Nucleus®, Multipeak (ou MPEAK) a apporté à la cochlée une information supplémentaire sur les hautes fréquences. Le processeur réalise une extraction des estimations des formants F0, F1, F2. Puis, il utilise 3 bandes de filtres pour transmettre des informations supplémentaires entre 2000 et 8000Hz. La fréquence de stimulation reste fixe. Cette stratégie de codage correspond à la stratégie spectrale.

Enfin, les stratégies hybrides plus récentes, correspondent à la combinaison de ces deux types de stratégies précedemment cités : la stratégie spectrale et temporelle. Les stratégies de codage de la parole traitent principalement la représentation la plus pertinente des différents composants fréquentiels de la parole (statégie SPEAK).³⁷¹

Pour une description plus détaillée sur ces questions, nous pouvons faire référence aux travaux de Wilson & Dorman (2008)³⁷² et également très récemment à cet article de Wilson (2019).³⁷³

A l’heure actuelle, les personnes porteurs d’implants cochléaires possèdent généralement plusieurs réglages, avec différentes stratégies de codage, leur permettant de s’adapter à différentes situations acoustiques de la vie quotidienne. Mais la question d’une stratégie de codage permettant à la fois la restitution des informations essentielles à la compréhension de la parole et celle d’autres informations acoustiques n’est pas encore résolue. Il s’agirait de savoir si cela serait plus pertinent d’améliorer la résolution spectrale (nombre d’électrodes disponibles) ou les stratégies de codages.

1.6. Les moyens de communication

Tout d’abord, il faut prendre en compte le fait que la majorité des familles entendantes ayant un bébé sourd, préfère communiquer en utilisant la langue orale, puisque c’est le mode le plus aisé pour les parents.³⁷⁴ Le plus souvent, cela s’avère insuffisant à plus ou moins long terme car l’enfant sourd a besoin d’un étayage supplémentaire afin d’accéder à toutes les subtilités de la langue. En fonction de l’âge de l’enfant, de son niveau de langage, de la fonctionnalité de son audition, de ses capacités d’apprentissage, du contexte familial dans lequel il évolue, différentes aides pourront lui être proposées. Ces aides devront être adaptées au plus près de son évolution.

1.6.1. Le motherese ou Mamanais : procédure naturelle

La première communication du tout petit reste une communication basée sur le regard, les mimiques et les gestes. Le bébé possède dès la naissance des capacités communicationnelles et une volonté d’interagir avec son entourage.³⁷⁵ Ces échanges l’amènent naturellement à explorer la sonorité de sa voix. Le motherese utilisé par les Anglo-Saxons, appelé en France le Mamanais, est une façon courante et instinctive de s’adresser à son petit, présent dans toutes les langues et cultures du monde.³⁷⁶ C’est un très beau moyen de communiquer également avec un enfant sourd. Pour cela, les adultes utilisent un registre de voix plus aigüe que d’habitude avec une gamme de contours d’intonation plutôt restreinte mais dont les modulations de hauteur sont particulièrement exagérées. Le débit est ralenti, l’articulation plus précise et le rythme beaucoup plus marqué. Les différentes pauses proposées permettent au bébé d’intervenir à son tour et de relancer le dialogue. Les répétitions sont nombreuses et le plus souvent pertinentes. Le motherese n’est en aucun cas « une simplification appauvrissante du langage, mais l’expression d’un style particulier, précieux support et renforçateur des éléments paraverbaux. »³⁷⁷ Comme le soulignent Michel Soulé et Boris Cyrulnik, « toutes ces caractéristiques sont parfaitement adaptées aux capacités perceptives et aux capacités d’attention des jeunes nourissons et leur facilitent la perception de la parole. »³⁷⁸ Cet étayage aura pour principale fonction de capter l’attention de l’enfant et de développer « l’attention conjointe ». Cette notion a été étudiée par le psychologue américain Jérome Bruner. « L’attention conjointe » est un élément fondamental de ce qu’il nomme les « formats ».³⁷⁹ Bruner les définit comme étant les « échanges habituels qui fournissent un cadre pour l’interprétation concrète de l’intention de communication entre mère et enfant ».³⁸⁰ C’est l’interaction majeure du développement social décrit par Mundy et Newell.³⁸¹ Pour clore ce chapitre, voici un très beau témoignage d’une maman d’enfant sourd qui illustre notre propos :

Les mots de la mère, du père forment une bulle autour de l’enfant, une enveloppe vibratoire qui l’atteint sur toute la surface de sa peau. Les éléments comme le souffle, la parole brève ou

chantante de la mère, les lignes mélodiques des voix de l’entourage, les onde graves et aigües qui viennent frapper la surface de sa peau vont devenir des repères organisateurs, indispensables à la mise en place des apprentissages ultérieurs.³⁸²

1.6.2. Comptines mimées et chansons gestuées

Nous reparlerons en détails de l’importance de la musique et des comptines tout particulièrement dans notre dernier chapitre dédié aux méthodes d’apprentissages musicaux (chapitre 6). Dans ce moment affectif privilégié, la comptine contribue à développer des compétences essentielles pour l’enfant sourd et sa famille. Le chant stimulerait le développement d’habiletés préalables à l’acquisition du langage, tel que le tour de rôle, l’utilisation de gestes et le maintien du contact visuel. D’après Daniel Stern, le rythme, la forme et l’intensité sont perçus par l’enfant quel que soit le mode sensoriel utilisé : visuel, tactil ou auditif.³⁸³ L’enfant développe et élabore une véritable construction intérieure, qui va lui permettre de développer des capacités d’anticipation grâce à la structure même de la comptine avec la présence d’un début, d’un milieu et d’une fin. De plus, une comptine ou chanson est basée sur une alternance couplet/refrain qui développeront également les mêmes types de compétences. Cela fait particulièrement écho avec Meyer et notre chapitre précédent.

1.6.3. La Langue Française Parlée Complétée (LPC)

C’est grâce à la syllabe que le bébé reconnaît sa langue maternelle. La Langue française Parlée Complétée (LPC) repose sur un code manuel visuel. Son but est de favoriser la compréhension de la parole, en associant à celle-ci des mouvements de mains (des clés). Ainsi, il s’agit de compléter la langue (française, par exemple) pour qu’elle soit perçue finement, malgré une défaillance de l’audition. Initialement, le Cued Speech ³⁸⁴ fut inventé par le physicien Orin Cornett en 1967 pour compléter les informations visuelles apportées par la lecture labiale. Afin d’éliminer les sosies labiaux, cet outil permet de lever toutes les ambiguïtés de la lecture labiale et rend visible toute la chaîne parlée. Certaines études mettent en évidence le fait que la majorité des enfants qui utilisent couramment la LPC sont des enfants qui perçoivent et développent plus facilement leur langage oral (Leybaert & LaSasso, 2010)³⁸⁵ et ce, d’autant plus facilement que le début d’exposition à la LPC a été précoce (Leybaert & Alegria, 2003)³⁸⁶. L’utilisation de la LPC présente des avantages qui vont au-delà de la perception de la parole. En spécifiant tous les contrastes phonologiques de la langue et en la présentant comme une succession de phonèmes, la LPC permet à l’enfant sourd de se construire des représentations phonologiques robustes et précises.

Figure 77 : Les 8 configurations des doigts telles que les voit l’enfant pour coder les consonnes.

Figure 78 : Les 5 positions de la main pour coder les voyelles avec la LPC.

1.6.4. La langue des Signes Française (L.S.F.)

Avant toute chose, il est important de préciser que contrairement à une croyance assez répandue, la langue des signes n’est pas universelle. Il existe une langue des signes française (LSF), une langue des signes américaine (ASL), une langue des signes britanniques (BSL), etc … La langue des signes française est officiellement inventée par l’abbé de l’Epée dans les années 1760. Aujourd’hui, la LSF est reconnue comme une langue à part entière depuis février 2005.³⁸⁷ De ce fait, elle possède un vocabulaire propre et des règles de grammaire. Comme une langue orale, la Langue des Signes est composée de signes arbitraires qui diffèrent d’un pays à l’autre.

Figure 79 : Le signe « Bonjour » extrait du Dictionnaire 1200 signes français-LSF de Monica Companys. — Figure 79 : Le signe « Bonjour » extrait du *Dictionnaire 1200 signes français-LSF* de Monica Companys.³⁸⁸

Interprétée par les mains, le visage et le corps dans son ensemble, la Langue des Signes (LSF) est une langue à part entière et constitue un des piliers de la culture sourde. Etant entièrement visuelle, elle met en valeur le non-verbal. Cette langue accorde aussi une place très importante à l’expression du visage pour exprimer sans ambiguïté les objets, les actions ou les sentiments.

La LSF possède un alphabet dactylologique et utilise la lecture sur les lèvres. Chaque lettre de l’alphabet latin que nous utilisons à l’écrit possède une retranscription signée. Il permet d’épeler les noms propres ou les mots n’existant pas encore en LSF (cf. Figure ci-dessous).

Elle possède une grammaire. Bien qu’il n’y ait pas de conjugaison, cette langue précise le moment où se déroule l’action. On situe l’action sur la ligne du temps par la position du corps, en particulier celle de l’épaule.

Figure 80 : Alphabet dactylologique de la Langue des Signes Française.

Comme toute langue, elle véhicule bien sûr une culture. Choisir de communiquer avec la LSF ne signifie pas pour autant un isolement du reste de la société. C’est choisir de la connaître pour s’ouvrir aux autres et mieux la comprendre. L’enfant aura donc le choix de « signer » afin d’échanger, de communiquer avec les autres.

Dans les années 80, le programme Baby Sign Language s’est développé aux Etats-Unis afin d’aider les familles entendantes à communiquer avec leur bébé, avant l’apparition des premiers mots. Linda Acredolo et Susan Goodwyn (1982), spécialistes en développement de l’enfant, sont partis de l’aptitude naturelle des bébés à utiliser des gestes simples pour des mots qu’ils ne savent pas encore dire. Elles sont arrivées à la conclusion que les bébés initiés à cette méthode par leurs parents apprenaient à parler plus tôt, faisaient moins de colères, réalisaient des gains précieux dans leur développement intellectuel, exprimaient leurs émotions plus efficacement et développaient des liens plus solides avec leurs parents. L’équivalent en France « Signe avec moi » a été mis au point par Nathanaëlle Bouhier-Charles en 2006.³⁸⁹ Cette méthode a été largement développée en France depuis peu, dans les lieux d’accueil de la petite enfance : crèches, jardin d’enfants, écoles maternelles. Elle rencontre un franc succès auprès des familles et des professionnels, car cette méthode donne la possibilité aux tout-petits d’exprimer clairement leurs besoins et permet aux parents de les comprendre. Tout ceci avant même l’acquisition de la langue orale.

Figure 81 : Extrait du signe « Encore ».

2. Les conséquences de la surdité profonde congénitale

Nous pouvons observer une grande variabilité dans le développement psychologique des enfants sourds. Celle-ci peut s’expliquer de par l’hétérogénéité existant au sein de la population, en termes de capacités et performances auditives, mais aussi selon des critères non auditifs tels que l’association éventuelle avec d’autres handicaps, l’étiologie de la déficience, le degré d’atteinte, l’âge de survenue ou encore le contexte familial et social (Guidetti & Tourrette, 2002³⁹⁰; Lina-Granade & Truy, 2005).³⁹¹

Tout au long du développement pré-linguistique, les productions vocales de l’enfant sourd et son comportement communicatif vont se différencier de celui de l’enfant normo-entendant. La conséquence de la surdité la plus invalidante est l’accès au langage oral.

2.1. Les troubles langagiers

2.1.1. L’impact de la surdité sur la communication précoce

Cette partie aborde les difficultés que rencontrent les familles d’enfants sourds pour mettre en place une communication précoce et favoriser l’apparition du langage chez leur enfant. Nous envisagerons cette partie en comparaison avec le développement de l’enfant entendant. Le bébé entre en communication de différentes façons avant d’entrer dans le langage : regard, mimique, intonations signifiantes. Nous verrons que la restriction des premières productions de l’enfant sourd entraîne une modification des interactions qu’il a avec son entourage sur les plans quantitatif et qualitatif. D’où l’installation de difficultés supplémentaires à celles directement liées à la déficience auditive, et qui ont des répercussions non négligeables dans le domaine de l’acquisition du langage.

2.1.1.1. Restriction des premières productions

Au niveau prosodique, quelle que soit l’importance de la perte auditive, tous les enfants au cours des premiers mois suivant la naissance, produisent des vocalisations en faisant varier la hauteur, l’intensité, le rythme, le timbre… Ainsi, dès les premiers mois de vie, on retrouve déjà les différents paramètres de la voix. Nous avons pu voir précédemment que l’environnement linguistique des jeunes enfants est composé, en grande partie, de formes particulières du langage appelées motherese et baby-talk dans la littérature anglaise (De Boysson-Bardies, 2005).³⁹² Cependant, chez l’enfant sourd, ces émissions sonores sont en général retardées et différentes, qualitativement et quantitativement. A partir de deux mois, nous observons une réduction de la dynamique vocale, des durées d’énoncés plus courtes, une courbe mélodique peu variée ainsi qu’un répertoire phonique stéréotypé (Vinter 2005).³⁹³ De même, des auteurs comme Bertoncini et De Boysson-Bardies (2000)³⁹⁴ ou Eilers et Ollers (1994)³⁹⁵ relèvent que les enfants sourds ne babillent pas comme les enfants entendants étant donné que le babillage est lié à la perception des sons d’une langue. Ainsi, les nourrissons sourds n’atteindraient jamais le stade de babillage canonique à l’âge attendu et leur parole présenterait des perturbations de rythme, de mélodie, d’intonation, de contrôle phonatoire et articulatoire. Toutefois, de nombreux facteurs viennent moduler ces caractéristiques, telles que l’appareillage précoce et les interactions avec l’environnement familial conduisant à l’observation de fortes différences entre enfants.

Le babillage canonique est acquis entre 5 et 10 mois chez l’enfant normo-entendant. L’enfant sourd vocalise lui aussi, quelle que soit l’importance de sa déficience auditive. Néanmoins, ses productions sont retardées et déviantes par rapport à celles des enfants entendants. Chez l’enfant sourd, le babillage canonique ne se manifeste qu’aux alentours de 15 mois chez l’enfant dont la perte auditive avoisine les 90 dB, vers 25 mois si la déficience est comprise entre 90 et 100 dB et au-delà de cette perte auditive, ce sera vers 30 mois seulement. Les travaux de Shirley Vinter montrent le lien entre le retard d’apparition du babillage canonique et le degré de surdité. Si au départ, les bébés sourds ont un fondamental comparable à celui des enfants entendants, la voix aura tendance à se dégrader au fil des ans, plutôt qu’à s’améliorer (Dumont, 1997).³⁹⁶ A l’âge de six mois, un enfant normo-entendant distingue deux sons éloignés d’un ton. Nous savons également qu’il est particulièrement sensible aux sons aigus. Pour le bébé sourd c’est l’inverse. En effet, la surdité atteint d’abord et avec un plus grand déficit les fréquences aiguës (Carré, 2008).³⁹⁷ De plus, Valérie Alis et Nicole Jubien (2009) nous explique que le « tapping est un mode exploratoire psychomoteur qui survient pendant la période de babillage : l’enfant explore le monde et les objets en tapant sur ou avec les jouets. Le frapper précède toujours le babillage canonique. Chez le bébé sourd profond, tapping et productions syllabées sont dissociés. »³⁹⁸

2.1.1.2. Modification des interactions parentales

L’avenir linguistique de l’enfant sourd, et ce quel que soit le type d’appareillage choisi, repose majoritairement sur la capacité de la famille à construire un cadre interactif avec leur enfant. Même si aujourd’hui l’importance de la communication précoce avec un tout jeune enfant sourd est bien intégrée dans les représentations des professionnels de la surdité, grâce à la contribution de l’implant cochléaire notamment, Catherine Hage soulève malgré tout le fait que les parents d’un bébé sourd « sont rarement conscients de l’importance des interactions précoces en tant que catalyseur du développement du langage. »³⁹⁹ Chez l’enfant sourd, la période pré-linguistique est compromise par différents facteurs. Il n’est pas rare en effet que les parents d’un bébé sourd s’arrêtent de lui parler, omettant du même coup de renforcer les comportements susceptibles de soutenir la communication avec leur enfant. D’autre part, et ce à la décharge des parents, nous avons vu que la pauvreté des émissions vocales des bébés sourds – productions de durée réduite, schémas mélodiques plats et stéréotypés – n’encourage pas ces derniers à les intégrer au sein des échanges interpersonnels ni à interpréter ces vocalisations en tant qu’actes de communication. Ainsi, l’absence de réponses vocales peut modifier les interactions qu’ont les parents avec leur enfant, soit en n’apportant pas assez de stimulations, soit en exerçant une pression trop forte. Or, nous connaissons l’importance de ces interactions dans le développement des productions vocales et de l’intonation.

Par conséquent, une guidance familiale associée à un appareillage précoce et à une éducation spécifique permet à l’enfant, même sourd profond, un développement des échanges et de la communication avec son entourage. En l’absence de toute remédiation, la privation sensorielle précoce va, par la suite, entrainer de nombreuses répercussions sur la voix et la prosodie de l’enfant sourd, celle-ci constituant « la matrice des futures compétences langagières, pragmatiques et linguistiques, c’est-à-dire des futures compétences à la fois conversationnelles et linguistiques (Vinter 2005).

Chez l’enfant sourd profond, bien que les structures neurologiques spécialisées dans le langage existent dès la naissance, celles-ci ne sont pas suffisamment alimentées par les informations auditives. L’input linguistique des enfants sourds est donc nécessairement visuel. Avec un enfant sourd, la communication repose essentiellement sur le regard. En situation duelle, à chaque fois que l’enfant détourne les yeux, il y a rupture de la communication. En situation d’observation conjointe d’un même objet avec l’adulte, l’enfant doit mettre en place des mécanismes d’attention divisée. Cette attention est répartie entre le message oral audiovisuel et l’objet de l’interaction. Les informations lui parviennent donc de façon séquentielle (regard de l’adulte / objet / regard de l’adulte / objet…) et non simultanée. Ce problème d’attention amène l’adulte à passer plus de temps à attirer l’attention de son bébé qu’à jouer avec lui. Les routines interactives chez l’enfant sourd restent le plus souvent centrées sur le « faire faire » quelque chose à l’adulte plutôt que le « faire savoir » (Deleau & Le Maner-Idrissi, 2005).⁴⁰⁰ Par conséquent, à partir de 18 mois, les habiletés proprement linguistiques des enfants sourds sont inférieures à celles des entendants du même âge (Lepot-Froment & Clerebaut, 1996).⁴⁰¹ À cet égard, la construction d’un « lien d’attachement sécurisant » constitue un prérequis nécessaire à l’utilisation la plus adaptée des divers moyens de communication, par les parents et les professionnels de la petite enfance. Il s’agit d’un processus complexe qui va se développer pendant tout le développement de l’enfant. Claudia Gold a mis en évidence cela dans son ouvrage de référence À l’écoute des émotions de l’enfant (2014).⁴⁰²

Au demeurant, les interactions comportementales servent de support aux interactions affectives. Le psychiatre américain, Daniel Stern (1989) parle d’« accordage affectif » entre le parent et l’enfant.⁴⁰³ Dans cette expérience partagée, le parent répond à un affect exprimé par le bébé par un affect équivalent : par exemple, un geste du parent répondra à une vocalise de l’enfant. Cet accordage au travers des interactions va aider l’enfant à organiser son vécu et ses sensations et à leur donner du sens. Edward Tronick⁴⁰⁴ partage le point de vue de Stern en affirmant que « cette expérience émotionnelle basale du bébé » se traduit par une entrée multimodale des différentes voies sensorielles, sous forme de boucle rétroactive partant des actions du bébé, différente de la seule boucle audio-phonatoire, nuancés par les signaux de contrôle de ce dernier.⁴⁰⁵

2.2. L’impact de la surdité sur le développement du langage

La conséquence la plus importante de la surdité profonde est l’accès au langage oral. Nous avons vu que l’accès au langage peut commencer après la mise en place d’un appareillage efficace, sous l’effet conjoint de la stimulation auditive et de la prise en charge spécifique de l’enfant sourd.

L’apprentissage de la langue s’apprendra surtout de manière explicite, contrairement à l’enfant normo-entendant qui est capable d’extraire les régularités structurelles de la langue de manière implicite : les mots, leur agencement, les usages et habitudes linguistiques. Nous nous intéresserons plus particulièrement aux enfants sourds porteurs d’implant cochléaire, car notre travail expérimental, présenté dans notre cinquième chapitre, s’est focalisé sur cette population.

Concernant l’accès au lexique de l’enfant sourd, les enfants implantés présentent un âge de développement lexical en réception inférieur à ceux des enfants entendants de même âge (Blamey et al., 2001).⁴⁰⁶ Des résultats ultérieurs soulignent que le retard accumulé ne désigne pas une famille de mots en particulier et correspond très sensiblement à la période de surdité. Ce qui permet d’établir un âge de développement analogue à la période d’audition fonctionnelle (Fagan & Pisoni, 2010).⁴⁰⁷ D’autre part, ce développement lexical est positivement corrélé à l’âge d’implantation, avec un net avantage pour les enfants implantés précocement (Hayes, Geers, Treiman, & Moog, 2009).⁴⁰⁸ Une implantation avant l’âge de deux ans serait comparable à celui des enfants entendants pour le vocabulaire en reception (Connor, Craig, Raudenbush, Heavner, & Zwolan, 2006).⁴⁰⁹ De manière plus spécifique, l’enfant sourd rencontre des difficultés pour certains champs lexicaux (mathématiques, mots abstraits, marqueurs temporels, mots fonctions) et pour la catégorisation (Rinaldi & Caselli, 2009).⁴¹⁰ Certains auteurs ont démontré une augmentation significative des capacités conversationnelles des enfants sourds implantés dès les six premiers mois post-implantation (Briec et al., 2012⁴¹¹ ; Le Maner-Idrissi et al. 2008, 2010).⁴¹² En effet, lorsqu’ils sont implantés précocement, ces enfants présentent rapidement un bon niveau d’autonomie dans l’initiation des échanges vocaux et gestuels. (Tait, De Raeve et al., 2007). Ils peuvent par exemple prendre leur tour de parole sans avoir forcément besoin de contact visuel avec autrui. L’implant cochléaire leur permet d’être plus actifs dans les interactions.

Comme le souligne Barbara Tillmann, la surdité engendre différents troubles d’origine centrale, souvent reliés à une difficulté de traitement temporel. De ce fait, les enfants sourds ont des difficultés à maîtriser les aspects langagiers reliés à ces aspects temporels, ce qui les empêchent de prédire et d’anticiper les évènements multisensoriels (Bedouin et al. 2016⁴¹³, 2018⁴¹⁴). Finalement, un déficit fondamental d’apprentissage séquentiel statistique chez les enfants sourds les conduiraient à traiter les phrases comme des suites de mots non reliés (Eisenberg, Martinez, Holowecky, & Pogorelsky, 2002).⁴¹⁵ Cela empêcherait l’apprentissage implicite de règles morphosyntaxiques et limiterait le recours aux stratégies impliquant la syntaxe pour mieux identifier des mots, y compris en lecture (Gallego, Martin-Aragoneses, Lopez-Higes, & Pison, 2016).⁴¹⁶

De plus, Lorenzi et collaborateurs (2006)⁴¹⁷ ont démontré que des sujets malentendants, et ce quelque soit leur âge, semblent peu capable de tirer profit des informations de structure temporelle fine pour identifier les signaux, alors qu’ils obtiennent de très bons résultats pour identifier des logatomes avec l’enveloppe seule. En fin de compte, « un déficit dans les capacités d’encodage et/ou d’utilisation des informations de structure fine semble être systématiquement associé à un déficit d’intelligibilité dans le bruit ».⁴¹⁸

2.3. Les conséquences sur la Cognition

2.3.1. Les facultés intellectuelles

Bien évidemment, la surdité en elle-même ne retentit pas sur l’intelligence d’un enfant. Néanmoins, les conséquences directes de la surdité (telles que les troubles ou retard de langage) et un manque de soutien de l’environnement de l’enfant peuvent rendre difficiles certaines acquisitions. En effet, l’insuffisance langagière que peut engendrer la surdité entraîne parfois un retard dans le développement cognitif, notamment dans les acquisitions intellectuelles liées à la perception du temps et de l’espace sur le plan du raisonnement et de l’abstraction.

Pour certains auteurs, une période de privation auditive chez des enfants sourds, bien que compensée par un implant cochléaire par exemple, aurait de réelles conséquences sur l’apprentissage implicite, et ce dans différentes modalités sensorielles (Conway & Christiansen, 2009)⁴¹⁹. Selon ces auteurs, c’est l’expérience sonore qui permet de construire les fondations servant à développer les habiletés cognitives temporelles et séquentielles dans toutes les modalités. La modalité auditive prime cependant en matière de traitement séquentiel. Ainsi, les enfants sourds implantés présenteraient un déficit du traitement séquentiel, impliqué dans l’apprentissage implicite, ayant pour conséquence des difficultés langagières persistantes malgré la compensation de l’appareil auditif. Ces difficultés se retrouvent notamment en grammaire, car l’extraction des régularités de la langue se fait moins efficacement que chez un enfant entendant.

2.3.2. La mémoire

La mémoire à court terme et la mémoire de travail sont essentielles dans le maintien et le traitement des informations. Elles sont un élément primordial entre l’input sensoriel et le stockage de l’information en mémoire à long terme (Baddeley, 1992).⁴²⁰ La mémoire joue un rôle majeur dans la perception et le traitement du langage. Étant donné que certains mots ne sont pas ou mal perçus, la mémorisation est forcément plus difficile. Ce qui peut entraîner une reconnaissance plus lente puisque l’enfant sourd a besoin de comparer le son entendu à ceux enregistrés dans sa mémoire auditive. Ainsi, le développement de la mémoire verbale sera affecté à plusieurs niveaux par la surdité prélinguale, car elle dépend en partie de l’expérience auditive de l’enfant.

Des études sur la mémoire de travail ont montré dans des tâches usuelles d’empan de chiffres que les enfants implantés cochléaires présentaient des capacités inférieures à celles d’enfants normo-entendants (Harris et al., 2011).⁴²¹ Ces résultats sont corrélées à la modalité linguistique dans laquelle les enfants évoluent, à leur score de vocabulaire en réception (Pisoni & Cleary, 2003⁴²². ; Pisoni et al., 2011).⁴²³ Dans ce cas, plus les scores de perception sont bas, plus la longueur de l’empan est faible. L’ensemble de ces études suggèrent que les fonctions cognitives impliquant la modalité-spécifique auditive, sont davantage impactées chez les enfants sourds implantés que chez les enfants normo-entendants.

2.3.3. Les adaptations du cerveau à la surdité

Il nous apparaît primordiale la question de la surdité et des difficultés qu’elle provoque selon les multiples connexions existantes dans le cerveau. D’une part, les mécanismes de synaptogenèse dépendants de l’expérience auditive ne sont pas utilisés dans le cas de la surdité profonde. Comme les synapses non appropriées ne sont pas éliminées, les connections essentielles ne peuvent pas se former et être redistribuer dans l’arborescence dendritique (Kral & Eggermont, 2007)⁴²⁴ du fait que les modes de réhabilitation deviennent moins efficaces si la période critique est dépassée.⁴²⁵ D’autre part, l’information délivrée par l’implant est cependant appauvrie. Les enfants sourds doivent donc développer des stratégies d’adaptation dans lesquelles les informations visuelles ont un rôle fondamentalement complémentaire. Comparativement aux personnes normo-entendantes, les enfants sourds utilisent la lecture labiale bien plus efficacement par exemple. Cette compensation inter-modalitaire, basée ici sur la vision, est appelée « vicariance sensorielle » et existe également chez les sujets privés d’un autre sens. Au niveau comportemental, « la vicariance sensorielle se manifeste par des capacités accrues dans les modalités épargnées et au niveau cérébral par une réorganisation fonctionnelle des régions cérébrales privées d’informations auditives »⁴²⁶, zones qui sont activées par la présentation de stimuli visuels (Finney Fine & Dobkins 2001)⁴²⁷ et même tactiles (Levänen Jousmäki & Hari, 1998).⁴²⁸ La ré-afférentation auditive est limitée en cas de surdité prolongée, ce qui va entraîner une réorganisation du cerveau de l’enfant sourd pré-lingual. De ce fait, les aires auditives ne peuvent pas récupérer leurs fonctions initiales car le réseau auditif va devoir traiter d’autres informations. Chez l’adulte sourd profond, une surdité précoce affecterait la taille des neurones du noyau cochléaire de moitié par rapport aux sujets entendants (Moore, Niparko, Miller & Linthicum, 1994)⁴²⁹. De plus, au niveau cortical, l’onde P1, marqueur de la maturité des voies auditives (myélination et croissance axonale) est très retardée chez les sujets implantés tardivement (Sharma, Dorman & Spahr, 2002a)⁴³⁰. Cette information implique un ralentissement de la conduction de l’information. Nous remarquons également que cette onde n’apparaît que dans l’hémisphère controlatéral à la stimulation, alors qu’une stimulation neuronale est censée stimuler bilatéralement les cortex auditifs (Gilley, Sharma & Dorman, 2008).⁴³¹ Il semblerait qu’une période de surdité précoce et prolongée pourrait engendrer un découplage des voies auditives. De plus, l’onde N1, autre marqueur de la maturité corticale, apparaît chez l’enfant entendant vers l’âge de 5 ans et se développe jusqu’à l’adolescence. Chez les enfants implantés tardivement ou tirant peu de bénéfices de leurs prothèses auditives (Eggermont & Ponton, 2003), cela n’apparaîtrait pas.⁴³² Cette absence s’expliquerait par un arrêt ou une altération de la maturation des couches corticales concernées, dont la maturation se traduit au niveau comportemental par l’habileté à traiter la parole dégradée ou la parole dans le bruit. Ainsi « les couches corticales profondes pourraient suivre une maturation autonome en l’absence d’input auditif, tandis que la maturation des couches plus superficielles est soumise à l’expérience auditive. »⁴³³ La plasticité des voies auditives centrales aurait tendance à diminuer avec la durée de la surdité. Ces mécanismes de neuroplasticité sont fondamentaux dans le cas de la surdité.

Chez l’enfant sourd congénital, la réhabilitation de l’audition, par le port de prothèses auditives et/ou d’implant cochléaire, est effectuée dès le diagnostic posé. Cette stratégie thérapeutique permet de faire fonctionner les différents relais de la transmission de l’information sonore et d’agir sur les mécanismes de plasticité cérébrale. Toutefois, le succès des aides prothétiques est fortement soumis à la période du développement auquel elles sont effectives (âge de correction auditive) et négativement corrélé à la durée de la surdité. La rééducation en orthophonie et en particulier l’éducation auditive sont indispensables. Une multitude d’arguments permet d’envisager la musique comme moyen privilégié de l’éducation auditive. Les effets de l’éducation musicale sont immenses. Tout d’abord, l’universalité et surtout l’ancienneté des pratiques musicales suggère leur ancrage biologique (Mithen, 2009)⁴³⁴ et son importance dans la cohésion sociale (Peretz, 2010).⁴³⁵ Grâce aux aptitudes très précoces du traitement des stimuli musicaux, la musique jouerait un rôle crucial dans la communication mère-enfant (Trehub, 2003)⁴³⁶ et influencerait le développement langagier. Les études menées chez les experts en perception auditive (musiciens) ont montré que le système auditif, comme les autres systèmes sensoriels d’ailleurs, est plastique et réagit à l’expérience sensorielle par des modifications à la fois neuroanatomiques (Schlaug, Jäncke, & Huang, 1995 (b)⁴³⁷; Schneider et al., 2002⁴³⁸) et neurofonctionnelles (Patel, 2008⁴³⁹.; Herholz et Zatorre, 2012⁴⁴⁰). Dans le cadre de notre étude, nous retenons que des effets spécifiques de la pratique musicale au niveau de compétences langagières accrues ont également été mis en évidence (Oechslin, Meyer & Jäncke, 2010⁴⁴¹; Wong, Skoe, Russo, Dees & Kraus, 2007⁴⁴²). Enfin, dès leur réhabilitation auditive réalisée, les enfants sourds semblent démontrer des comportements émotionnels face à la musique comparables à ceux des enfants entendants. Nous envisagerons dans le chapitre suivant les arguments en faveur de l’utilisation de la musique comme outil de stimulation auditive chez des enfants sourds profonds.

3. La musique : un outil de stimulation auditive pour un enfant sourd

L’enfant présente des compétences très précoces pour le traitement de toutes les informations sonores, comme la musique (Trainor & Heinmiller, 1998⁴⁴³ ; Trehub, 2003⁴⁴⁴), les voix (Decasper & Fifer, 1980), le langage, en particulier la langue à laquelle ils ont été exposés (De Boysson- Bardies, 2005 ; Mandel, Jusczyk, & Kemler-Nelson, 1994) qui vont d’une part se développer spécifiquement sous l’influence de l’expérience. D’autre part, le développement de ces différentes compétences s’influenceraient mutuellement. La première section de ce chapitre fait état du développement des compétences auditives, des modèles développementaux et des répercussions de la musique sur le développement linguistique et communicationnel dans la population tout venant. La façon dont l’expérience de la pratique musicale modifie structurellement et fonctionnellement les aires cérébrales ainsi que les effets de transfert seront présentés dans la deuxième section. Enfin, nous aborderons le comportement de l’enfant sourd face aux stimuli musicaux.⁴⁴⁵

3.1. Aspects développementaux du traitement auditif

Les sciences cognitives de la musique ont mis en évidence des compétences perceptives très précoces pour la perception et la cognition musicales (Trainor & Hannon, 2013⁴⁴⁶ ; Bigand, Tillmann, Peretz et al. 2015)⁴⁴⁷. Nous savons que la cochlée est fonctionnelle à la fin du 5ème mois de la vie fœtale et que les sons qui parviennent au fœtus sont traités et mémorisés. Par exemple, l’équipe de Winkler et collaborateurs ont montré que le fœtus pouvait mémoriser toute sa vie durant, la chanson « Ah, vous dirai-je maman » présentée de manière répétée durant le dernier trimestre de grossesse.⁴⁴⁸ L’expérience auditive prénatale explique la sensibilité particulière pour certains stimuli acoustiques comme en témoignent les études faites sur les nouveaux-nés : préférence des mélodies entendues in utero (Deliège & Sloboda, 1995⁴⁴⁹ ; Nakata & Trehub, 2004⁴⁵⁰) qui sont reconnues même un an après leur naissance sans ré-écoute. Ce qui suggère que le cerveau humain naît avec « un précâblage » pour la musique, pour reprendre le terme d’Isabelle Peretz.⁴⁵¹

3.1.1. Modèles du développement des compétences musicales

A la naissance, le bébé possède donc déjà un vécu musical. Nous avons vu précédemment que ces dispositions musicales vont être encouragées par l’entourage s’adressant spontanément à l’enfant dans un motherese ou mamanais qui implique l’accentuation des éléments rythmiques et prosodiques (Papousek, Papousek, & Haekel, 1987).⁴⁵² Il faut rappeler que le chant est un véritable instinct chez l’Homme. Les premières années de vie de l’enfant sont berçées de chants maternels. C’est un comportement universel. Même après l’annonce précoce du handicap de surdité, la majorité des mères entendantes chantent spontanément pour leur bébé que ce soit dans les moments du change, du bain ou encore pour l’endormissement. Le très bel ouvrage de l’orthophoniste Monique Delaroche, Au fil des regards et des caresses, encourage avec beaucoup de bienveillance et de délicatesse les parents du tout petit à accepter son handicap et propose de manière pragmatique un véritable livre de bord pour entrer en communication avec leur bébé.⁴⁵³

L’équipe de Sandra Trehub a mis en évidence le fait que les bébés savaient faire la différence entre le mamanais et le chant. Grâce à l’écoute d’une voix enregistrée, soit en motherese, soit en chantant, ils ont observé qu’avec le chant, les bébés pouvaient attendre deux fois plus longtemps le retour de l’adulte, avant de donner des signes de détresse.⁴⁵⁴ Ces chercheurs ont également montré que les chants maternels augmentent le taux de cortisol chez les nourissons dont le taux de référence est bas, et au contraire les diminuent, pour ceux dont le taux de référence est haut. Ce qui suggère que le chant aide les bébés à réguler leur état émotionnel. De plus, les travaux de Standley et collaborateurs ont démontré que chez les bébés prématurés, le chant pouvait aider à stabiliser les fonctions physiologiques telles que le rythme cardiaque et les niveaux de saturation en oxygène.⁴⁵⁵ Ces expériences musicales soulignent également l’importance des interactions entre le bébé et son entourage mettant en jeu une communication polysensorielle : l’ouïe, la vue, le toucher et le mouvement. Nous pensons tout particulièrement au travaux réalisés par l’équipe de Laurel Trainor au sujet des interactions en synchronie. Elle explique que les bébés, dès l’âge de 14 mois, lorsqu’ils agissent en synchronie avec un expérimentateur, cela les rend plus enclin à vouloir aider ce dernier (Trainor et Cirelli, 2015).⁴⁵⁶ Ainsi, « le mouvement synchrone rendu possible par la musique, joue un rôle important dans le développement social précoce, en aidant les bébés à établir des relations de confiance et d’amitié et à construire un réseau de sociabilité. »⁴⁵⁷

Dès les premiers jours de vie, le bébé a la capacité d’absorber toutes les musiques du monde. Peretz affirme que « les compétences précoces permettent d’extraire les propriétés quasi universelles de la musique comme : son petit nombre de hauteurs (de 5 à 7 notes) dans un morceau, ses petits intervalles inégaux entre les notes, son nombre limité de durées marquant des temps réguliers et pouvant se grouper. Ces caractéristiques propices à l’organisation hiérarchique, en accordant à certains sons un plus grand poids, sont renforcés par la répétition. »⁴⁵⁸

Par la suite, le développement musical va suivre plusieurs étapes jusqu’à l’adolescence, comme le suggère le modèle à cinq phases de Hargreaves & Galton (1992) qui s’inscrit dans la démarche piagétienne.⁴⁵⁹ La phase sensori-motrice (0-2 ans) se distingue par la capacité de l’enfant à reconnaître les contours mélodiques, les variations d’intensité et à répondre au chant sur le plan moteur. A 6 mois, l’enfant, sensibilisé à la structure de la phrase musicale, est alors capable de discriminer les violations des contours (Trehub, Bull, & Thorpe, 1984).⁴⁶⁰ Il développe également pendant cette période, des compétences temporelles essentielles lui permettant de se balancer et de se synchroniser en rythme. La phase suivante, dite figurale (2-5 ans) se caractérise par la capacité de l’enfant à discriminer différents intervalles (hauteur et contour), et par des expressions vocales fusionnant les chants spontanés et les chants de sa culture. Il se focalise plus sur le texte et les mots que sur la mélodie. Les chansons sont articulées et reconnaissables mais sans cohérence tonale. C’est entre 5 et 8 ans (phase schématique) que tous les aspects de la mélodie sont reproduits convenablement, le respect de la tonalité et l’acquisition de la pulsation apparaissent simultanément. A 6 ans, l’enfant se montre capable de reproduire fidèlement des structures mélodico-rythmiques par exemple. Cependant, il est à noter que les tempi lents sont plus difficiles à appréhender que les tempi rapides. Il aime tout particulièrement imiter l’adulte. A 8 ans, l’enfant a intégré les fonctions tonales comme la cadence parfaite et la demi-cadence (Deliège & Sloboda, 1995).⁴⁶¹ Il découvrira pendant cette période les diverses règles du système tonal. La phase de système de règles (8-15 ans) est caractérisée par la capacité à analyser les éléments musicaux. Elle correspond à l’apprentissage formel de la musique. Enfin, la phase professionnelle (à partir de 15 ans) se caractérise par la capacité de l’adolescent à créer des morceaux de musique et à utiliser la musique comme véritable outil de réflexion.

Nous ne détaillerons pas tous les modèles psychologiques du développement musical. Néanmoins il conviendra de citer les travaux de Sloboda (1985)⁴⁶², Swanwick et Tillmann (1986)⁴⁶³, Zenatti (1967⁴⁶⁴, 1990⁴⁶⁵) et Gordon (1988⁴⁶⁶, 2003⁴⁶⁷). De plus, Pierre Zurcher (2010)⁴⁶⁸ a proposé une autre approche du développement musical qui dépendrait du développement du langage, en quatre étapes.

3.2. Les effets de la musique sur le développement de l’enfant sourd

Les enfants sourds, après réhabilitation de leur fonction auditive, réussissent à développer rapidement des aptitudes perceptives musicales et démontrent en définitive, des patterns comportementaux identiques à ceux des enfants normo-entendants. Ils peuvent également reconnaitre et mémoriser des mélodies (Mitani et al., 2007⁴⁶⁹ ; Nakata, Trehub, Kanda, Shibasaki, & Schellenberg, 2005).⁴⁷⁰ Ces observations soulignent l’automaticité de la mise en place des processus de traitement de la musique dès que l’audition est fonctionnelle.

Indépendamment de la problématique de l’implant cochléaire, de nombreuses études ont mis en évidence le fait que les enfants sourds pouvaient profiter des bienfaits de la musique. Ils apparaissent à trois niveaux : au niveau du développement du langage oral, des capacités d’écoute et des habiletés sociales. Concernant le développement du langage oral, nous savons aujourd’hui qu’un entraînement musical entraîne des résultats positifs sur la parole de l’enfant. Il a été montré notamment que les contours prosodiques seraient plus naturels après un entraînement de discrimination rythmique (Darrow, 1985)⁴⁷¹ et de chant (Walczyk, 1993).⁴⁷² Par ailleurs, l’apprentissage de comptines et de chansons participe activement à l’augmentation et à l’enrichissement du stock lexical. Concernant les capacités d’écoute, des entraînements spécifiques, comme la discrimination de différents timbres et l’apprentissage de séquences rythmiques notamment, produiraient des effets positifs sur la capacité d’analyse du pitch, la capacité d’écoute dans le bruit, et la mémoire de travail impliquée dans le traitement séquentiel. Pour finir, faire de la musique, à travers le partage du chant et de la danse, permettrait l’amélioration des habiletés sociales et du comportement émotionnel. Du reste, ce lien entre musique et mouvement sera détaillée dans notre dernier chapitre à travers l’exposé des différentes méthodes actives musicales. L’étude de Laurel Trainor et collaborateurs, The primal role of the vestibular system in determining musical rhythm (2009)⁴⁷³, nous montre comment s’unissent le rythme et le mouvement dès le déplacement du liquide présent dans le système vestibulaire de nos oreilles, grâce aux vibrations. Ce lien contine à l’intérieur de notre cerveau, et cela même si nous ne bougeons pas. En effet, il a été démontré que le rythme active le cortex auditif mais aussi le cortex moteur, notamment les noyaux de la base responsables de

la libération de dopamine (réseau du plaisir et de la récompense).⁴⁷⁴ De plus, l’activité musicale contribuerait au développement de la confiance en soi (Hummel, 1971)⁴⁷⁵, de la confiance en l’autre également (Anshel & Kipper, 1988)⁴⁷⁶, de la responsabilité à l’égard du groupe (McDermott, 1971)⁴⁷⁷ et de la sociabilité (Cirelli et al., 2014).⁴⁷⁸

L’aptitude manifeste des enfants sourds dans les activités musicales et le plaisir qu’elles procurent, pourraient s’expliquer par une sollicitation cognitive moindre pour le traitement musical, par rapport au traitement linguistique plus coûteux cognitivement dans la mesure où il suppose une analyse sémantique. Par conséquent, cela expliquerait le fait qu’il serait plus facile pour l’enfant sourd, de percevoir une voix chantée qu’une voix parlée (Carré, 2008).⁴⁷⁹ Ainsi, l’entraînement musical prend alors tout son sens dans l’éducation auditive des enfants sourds. Il est empiriquement reconnu comme un outil privilégié dans l’éducation auditive. Les effets positifs sur le développement du langage oral sont illustrés notamment par de meilleurs capacités de traitement des différents paramètres acoustiques comme la durée, la fréquence, l’intensité, le timbre. En orthophonie, il existe diverses méthodes utilisant la musique. Elles méritent d’être mentionnées dans ce chapitre car elles contribuent à soutenir la communication de l’enfant sourd et à construire son langage : la méthode verbo-tonale, la Dynamique naturelle de la parole et la méthode Borel-Maisonny. Les mouvements de la main sont en étroite relation avec ceux de la bouche et de la langue. Ce sont des aires motrices voisines qui sont alors sollicitées. La motricité manuelle favoriserait la motricité bucco-faciale notamment.

3.2.1. La méthode Verbo-tonale (MVT)

Le graphisme phonétique, le rythme corporel et musical sont issus de la méthode verbo-tonale développée par le linguiste croate Petar Guberina dans les années cinquante. Les fondements de cette méthode sont partis de la constatation que la motricité générale pouvait influencer celle des organes phonatoires. Sa grande idée a été de solliciter le corps tout entier afin de stimuler et de favoriser une production vocale riche. Le corps est émetteur et récepteur de la communication. Ces activités sont présentées de façon ludique et plaisante pour l’enfant. La MVT part des potentialités de l’enfant et non de ses manques. Dans cette méthode, l’éducation auditive est mise au premier plan. On se préoccupe de ce que perçoit l’enfant, plutôt que des positionnements articulatoires dans la sphère buccale. La comptine est au centre de cette méthode. Cette méthode utilise des appareils spécifiques à amplificateurs et filtres : un vibrateur, un SUVAG et un plancher vibrant.⁴⁸⁰

3.2.2. La Dynamique naturelle de la parole (DNP)

Cette méthode conçue par M. Dunoyer de Ségonzac, s’inspire de la méthode verbo-tonale, de l’anthropologie du geste de Marcel Jousse et de la méthode Martenot, dont nous parlerons en détails dans notre sixième chapitre, alliant ainsi une dimension artistique aux éléments techniques et sensoriels. De façon ludique, cette méthode utilise des canaux visuel, tactile, kinesthésique et auditif pour développer la conscience phonologique.

3.2.3. La méthode Borel-Maisonny

Suzanne Borel-Maisonny, pionnière de l’orthophonie, a mis au point une méthode phonétique et gestuelle, ainsi qu’une méthode de lecture constituée de 37 gestes très utiles pour tous les enfants et en particulier pour les enfants sourds. Elle a travaillé entre autres avec Denise Sadek-Khalil, linguiste et orthophoniste et brillante élève de Gustave Guillaume (Sadek-Khalil, 1997).⁴⁸¹ La méthode est publiée initialement en 1949 puis en 1956 dans le Bulletin mensuel de la Société Alfred Binet. En 1960, elle trouve une forme aboutie dans la publication des ouvrages de référence Langage oral et écrit 1 et 2 (Borel-Maisonny, 1960)⁴⁸² et connaît un retentissement manifeste à la suite de sa collaboration avec Clotilde Sylvestre de Sacy. Cette dernière, fondatrice du Centre de Rééducation de dyslexie-dysorthographie décide d’adapter à l’enseignement traditionnel, la méthode de Borel-Maisonny. Le geste est en rapport avec la forme de la bouche lors de l’articulation ou bien avec la forme de la lettre. C’est une méthode multi sensorielle d’apprentissage de la lecture, qui propose une aide au déchiffrage. A chaque son correspond un geste symbolique. Il y a un geste par son et non par graphie.

Figure 82 : Gestes associés aux sons.⁴⁸³

Par exemple, pour le son [o] le même geste est associé à toutes les graphies de ce son : au, eau, os, ot, aut, aux, ault, etc.

Figure 83 : Extrait de Bien Lire et Aimer Lire.

Construite autour de trois axes, phonème, graphème et articulation, cette méthode permet à l’enfant sourd de mieux appréhender le décodage. Dans cette méthode, les consonnes sont en noire et les voyelles en rouge (cf. exemple ci-dessous).

Figure 84 : Extrait de Bien lire et aimer Lire, p. 23. — Figure 84 : Extrait de *Bien lire et aimer Lire,* p. 23.

Chapitre 5 : Approche empirique de la perception de la Texture chez l’enfant et l’adulte

1. Vers une classification psycho-musicologique pertinente de la Texture

1.1. Les propriétés émergentes : définitions

Au lendemain de la seconde guerre mondiale, les compositeurs se sont emparés de la texture, afin de s’éloigner de la complexité grandissante des systèmes proposés comme le sérialisme notamment, qui séparait de manière significative les compositeurs de leur public. Ainsi, utiliser la texture était susceptible d’être mieux perçue par les auditeurs. Comme le souligne Philippe Lalitte, « la texture apporte donc aux compositeurs une dimension supplémentaire qui tout en leur offrant la possibilité de sortir d’une pensée musicale trop paramétrique, les engage vers une écriture du virtuel. »⁴⁸⁴

Analyser la texture en musique contemporaine, à savoir analyser les différents types de tissage, de grain, de matière, de strates, revient à considérer la texture comme étant un tout plus ou moins homogène, constituée de la fusion d’éléments séparés. Comme nous l’avons souligné dans le troisième chapitre, « l’émergence » se présente d’abord comme un phénomène perceptif relevant du domaine de la psychoacoustique. Cette notion de « propriétés émergentes » a été élaborée grâce aux travaux de Bregman notamment. Jean François Augoyard (philosophe, urbaniste et musicologue) et Henry Torgue (sociologue, urbaniste et compositeur) en donnent une définition pertinente dans leur ouvrage, À l’écoute de l’environnement : répertoire des effets sonores :

Effet générique regroupant la totalité des occurrences sonores qui apparaissent nettement dans un contexte donné. Très souvent couplée avec un autre effet, l’émergence ne concerne pas seulement l’irruption d’un son fort dans un contexte de plus faible intensité ; elle caractérise aussi l’apparition de sons différents par leurs hauteurs, leurs timbres ou leurs rythmes. C’est plus l’affirmation d’un nouveau son qui marque la singularité de cet effet que ses modalités d’apparition, celles-ci relevant plutôt des effets avec lesquels il se conjugue.⁴⁸⁵

Cette définition explicite clairement la situation dans laquelle nous nous trouvons, car ce concept d’émergence est un phénomène psychoacoustique lié à la capacité de l’oreille à fusionner ou à discerner certains événements sonores selon le contexte dans lequel ils apparaissent. Ce qui nous renvoie directement à l’analyse de scènes auditives de Bregman. C’est pourquoi nous retiendrons cette conception de « l’émergence » car elle nous permettra d’appréhender au mieux des œuvres musicales contemporaines basées sur la notion de textures sonores avec des compositeurs comme Grisey, Lachenmann, Reynolds, Ligeti pour ce chapitre. Ce dernier affirmait d’ailleurs au sujet des capacités de la composition texturale « qu’une structure s’analyse en fonction de ses composantes ; une texture se décrit mieux à l’aide de caractéristiques globales et statistiques. »⁴⁸⁶

Pour cela, nous utiliserons les informations audio provenant d’enregistrements. Nous nous servirons du logiciel Sonic Visualiser⁴⁸⁷ afin de visualiser au mieux les différents types de textures de quatre pièces emblématiques du répertoire contemporain après 1945 : Partiels (1975) de Gérard Grisey, Mouvement (- vor der Erstarrung) d’Helmut Lachenmann (1983-1984), Symphony [Myths] de Roger Reynolds (1990) et le Concerto de chambre (Kammerkonzert) de György Ligeti (1969-1970). Nous étudierons comment ces compositeurs ont développé chacun à leur façon, une écriture texturale singulière. Sonic Visualiser nous permettra de croiser les informations contenues de la partition avec celles obtenues par l’analyse informatique du signal audio. C’est un logiciel gratuit, multi-plateformes et open source, qui offre la possibilité de visualiser et d’étudier la structure d’un signal audio en affichant une analyse visuelle de celui-ci sous forme de spectre(s). Ce logiciel a été développé par le Centre for Digital Music de l’Université Queen Mary à Londres. Il propose un large choix de sonagrammes (Spectrogram, Melodic Range Spectrogram, Peak Frequency Spectrogram, Adaptative Spectrogram, Constant-Q Spectrogram…) et d’autres types de visualisations (chromagramme, extraction de mélodie, coefficients d’énergie dans les bandes critiques, autocorrélation, etc.).

La description verbale de la texture complètera la description visuelle. Elle sera décrite ci-après en fonction de sa dimension verticale et horizontale.

1.1.1. Dimension verticale

Densité : Dans sa dimension verticale, nous parlerons de la densité d’une texture, opacité versus diaphane, trouble versus transparente par exemple, ce qui correspond au nombre de lignes, de sources ou d’évènements simultanés ainsi que d’autres paramètres tels la hauteur, les alliages de timbres, l’intensité et les modes de jeux utilisés (sons harmoniques, pressions de l’archet, pizzicatti…).
Étendue : La largeur fréquentielle (large vs étroite) correspond à la façon dont l’espace des hauteurs est utilisé ou la répartition d’évènements simultanés dans les différentes bandes de fréquences (homogène vs hétérogène).
Centre de gravité spectral : Cela correspond au rapport entre le registre et les timbres utilisés au sein de la texture (sombre vs lumineux).
Dissonances sensorielles : Nous nous focalisons sur les rapports d’intervalles et le timbre utilisé (mode de jeux bruités) et/ou le nombre de lignes (rugueux vs soyeux).
Enveloppe spectrale : Nous qualifions ici l’enveloppe spectrale de la texture avec des termes comme : doux, souple, détendue, chaleureuse vs acérée, métallique, dur, rigide, tendue, glacée, etc.
Fusion versus ségrégation des flux : L’interaction des indices de synchronisme des attaques, de comodulation des amplitudes (lors d’un crescendo par exemple) et des alliages de timbres sont de bons indicateurs de fusion de plusieurs sources en une seule entité perceptive (le groupement simultané dans l’ASA de Bregman). A l’inverse, en manipulant les indices de groupement séquentiel, nous avons la possibilité de rendre plus lisible une polyphonie complexe, de surligner une voix secondaire, de suivre le sujet d’une fugue (groupement sequentiel).

1.1.2. Dimensions horizontales

Les striations : Cela correspond à la nature des évènements au niveau temporel : évènements brefs versus longs par exemple, donnant tantôt une texture pulsée ou au contraire lisse.
Les régularités : Nous faisons référence ici à la fréquence d’apparition des évènements : périodique, fluide, liquescent ou au contraire apériodique, déchiqueté, fragmenté.
La vitesse du changement : Par rapport au déroulement temporel, la texture se présente plutôt mouvante ou au contraire statique (rapide vs lent).
La densité temporelle : Ce qui correspond au nombre d’évènements par seconde (aérée vs compacte) et la présence ou non de silences.
La fusion vs ségrégation des flux : C’est plus une aptitude à former différents flux auditifs qui correspondent à une ou plusieurs lignes au sein de la texture.

2. Analyse de Textures

2.1 Partiels (1975) de Gérard Grisey

2.1.1. Présentation

Cette œuvre emblématique de la musique spectrale a été composée en 1975 par Gérard Grisey (1946-1998) et créée le 4 mars 1976 à Paris par l’ensemble l’Itinéraire sous la direction de Boris de Vinogradov. Ce collectif musical a réuni des compositeurs comme Tristan Murail, Michaël Lévinas, Hugues Dufourt, et aussi un ensemble d’interprètes et surtout un instrumentarium électronique qui a servi de laboratoire de nouvelles technologies musicales. Partiels est écrit pour un ensemble de chambre de dix-huit musiciens, mettant particulièrement en valeur les bois. La partition peut être exécutée avec un seul corniste et un seul percussionniste moyennant quelques adaptations que Grisey précise dans la notice ci-dessous.

Figure 85: Extrait de la notice de la partition Partiels de Grisey, Ricordi, Milano 1976. — Figure 85: Extrait de la notice de la partition *Partiels* de Grisey, Ricordi, Milano 1976.

Notons la présence inhabituelle de l’accordéon, certainement explicable par le fait que le compositeur soit accordéoniste lui-même, mais aussi parce que c’est un instrument qui possède une étendue spectrale fort intéressante.

Partiels est extrait des Espaces acoustiques, cycle de six pièces pour diverses formations, écrit entre 1974 et 1985. Ce cycle est constitué d’un Prologue pour alto seul (1976), Périodes pour sept musiciens (1974), Partiels pour 18 musiciens (1975), Modulations pour 33 musiciens (1976-1978), Transitoires pour grand orchestre (1980-1981) et l’Epilogue pour quatre cors solo et orchestre (1985). Normalement, ces six pièces doivent être jouées à la suite, car elles ne sont pas simplement juxtaposées : elles forment un processus à grande échelle, constitué lui-même de processus qui recouvrent chaque pièce puis chaque section à l’intérieur même de ces pièces.

Selon Grisey, à propos de son cycle Espaces acoustiques (1974-1985), « les paramètres n’y sont qu’une grille de lecture et la réalité musicale réside au-delà, dans les seuils où s’opère une tentative de fusion. Liminal est l’adjectif que je donnerais volontiers à ce type d’écriture : plus volontiers en tout cas que celui de spectral, entendu souvent aujourd’hui et qui me semble trop limitatif »⁴⁸⁸. Partiels illustre parfaitement ce type d’écriture, car Grisey manipule savamment nos seuils perceptifs. En qualifiant son écriture de liminale (limen signifie seuil) Grisey nous explique « qu’elle s’applique à déployer les seuils où s’opèrent les interactions psycho-acoustiques entre les paramètres et à jouer de leurs ambiguïtés »⁴⁸⁹. En effet, Grisey distingue deux types de seuil : le premier est notre « capacité d’intégrer les composantes spectrales»⁴⁹⁰ et donc de percevoir un spectre synthétique et non un accord, le deuxième est d’ordre compositionnel : les instruments traditionnels résistent à la fusion, le spectre « forme une sorte de synthèse additive qui ne ressemble ni à un spectre instrumental ni à un accord orchestré ».⁴⁹¹

Jean-Marc Chouvel a proposé un modèle intéressant autour de la structuration du temps et des évènements sur Partiels de Grisey. Pour lui, la construction de diagrammes formels permet de se pencher sur les distances entre les événements, qui révèlent les liens entre les positions temporelles et mémorielles de chaque événement.

Figure 86: Diagramme matériau/temps réalisé par Jean-Marc Chouvel sur Partiels de Gérard Grisey. — Figure 86: Diagramme matériau/temps réalisé par Jean-Marc Chouvel sur *Partiels* de Gérard Grisey.

En abscisses le temps, exprimé approximativement en pages de la partition et en ordonnées les éléments de matériau sonore suivant la liste suivante :

1. trombone f> 2. contrebasse Arco Sul Ponte sf> sf>…. 3. “harmoniques” sons tenus <> 4. irrégularités de modes de jeu (vibrato… etc.) 5. glissando d’harmoniques 6. jeté 7. pulsations régulières – trémolo 8. sons grincés ASP 9. micro glissandi 10. polyphonie éclatée arythmique 11. tam-tam 12. trilles 13. figures (fusées) 14. ±13 fusées périodiques descendantes (avec oscillation sur les notes d’arrivée) 15. pizz 16. tutti > 17. multiphoniques 18. brosse sur grosse caisse 19. bruits divers d’instruments 20. geste de la cymbale.⁴⁹²

Pour Grisey, « Si les sons ont un corps vivant, le temps est à la fois leur espace et leur atmosphère. »⁴⁹³ A ce propos, Chouvel nous explique dans son ouvrage Analyse musicale, Sémiologie et cognition des formes temporelles, sa conception du temps :

La représentation de la temporalité s’effectue, pour la musique, depuis l’invention de la partition jusqu’à celle du sonagramme, sous la forme d’une trace qui reporte directement le temps sur un espace affine. D’autres représentations sont possibles, connues en physique sous le vocable d’« espace de phase ». Ce concept conduit dans le cas de la musique à une représentation particulièrement utile pour l’analyse mélodique, où positions (hauteurs, échelles…) et transitions (intervalles, modes…) deviennent immédiatement lisibles.⁴⁹⁴

L’œuvre procède par processus de transformation progressive modélisés sur le cycle de la respiration humaine (inspiration, expiration, repos). Grisey nous éclaire encore sur sa conception spectrale : « Nous venons de créer un être hybride pour notre perception, un son qui sans être encore un timbre, n’est déjà plus tout à fait un accord, sorte de mutant de la musique d’aujourd’hui, issu de croisements opérés entre les techniques instrumentales nouvelles et les synthèses additives réalisées par ordinateur. »⁴⁹⁵ Jérôme Baillet propose un tableau récapitulatif du processus compositionnel de Grisey.⁴⁹⁶ En se basant sur le rythme respiratoire, Grisey réussit à créer une alternance de tension et de détente. Les zones de repos correspondent à quelques mesures répétées ad libitum dans la partition. Ce sont les seuls moments où il n’y a pas de processus.

Figure 87: Cycle respiratoire dans Partiels.⁴⁹⁷

2.1.2. Description

La Section II entame un processus inverse à celui de la section précédente, car nous partons d’une texture bruitée pour aller vers une texture d’harmonie spectrale, de rythmes apériodiques (irréguliers) vers des rythmes périodiques (réguliers), d’une intensité fortissimo vers le piano, d’un passage de registre grave vers un registre aigu. A partir du chiffre 12, les sons vont s’engendrer les uns les autres et se superposer afin de créer des couches sonores en perpétuelle mobilité. Pour réaliser ces trames sonores, le compositeur fait apparaître les sons imperceptiblement jusqu’à un haut niveau d’intensité puis les fait disparaître comme ils sont venus. Ainsi, deux textures contrastées s’enchainent : l’une dans la Section II, l’autre dans le Repos II. La première est en perpétuelle évolution.

Au début de la Section II, dans sa dimension verticale, nous avons une texture rugueuse, qui correspondrait à notre texture que l’on qualifie de dense. Elle est sombre, dans les registres graves, avec une étendue plutôt étroite. La rugosité (ou dissonance sensorielle) est un des facteurs susceptibles de contribuer à la tension musicale. Dans sa dimension horizontale, la texture est granuleuse, striée avec parfois des pulses périodiques. Elle est mouvante avec un degré de changement de registres comme des vagues.

Figure 88: Extrait de *Partiels* de Grisey, début de la Section II au numéro 12.

Des effets de distorsion sont générés par l’utilisation d’anches doubles dans les embouchures des cuivres et par le grincement des cordes, effet rendu grâce à un jeu près du chevalet notamment. La prédominance des percussions renforce également cette inharmonicité avec le tam-tam très grave joué forte, avec son spectre large et inharmonique qui vient marquer le début de cette section tout comme la grosse caisse et le tom contrebasse joués avec sourdine.

De plus, les variations de volume et d’intensité utilisés comme les soufflets par exemple (chiffre 13), permettent l’apparition de sons infiniment bas en intensité (presque imperceptible) jusqu’ à un très haut niveau d’intensité (principe de fade in /fade out). Le but consiste à gommer le plus possible les attaques et les extinctions nettes, pour que nos oreilles puissent se concentrer sur les textures sonores. Grisey réussit à créer un tissu sonore ininterrompu grâce à l’écriture de ces soufflets dynamiques en superposant le début de l’un avec le sommet de l’autre.

Figure 89: Tissu sonore obtenu par cet agencement ingénieux des soufflets.

Cette texture granuleuse se déroule de manière relativement continue, car nous ne rencontrons pas de ruptures brusques. Petit à petit, elle va se modifier, se transformer progressivement pour arriver à la texture du repos. Grisey utilise dans Partiels une technique singulière, à savoir la technologie du modulateur en anneau (unique influence des techniques de studio sur son écriture) qui lui permet de renforcer le passage de l’harmonique à l’inharmonique. Pour cela, il simule le phénomène acoustique des sons résultants, procédé déjà utilisé par Edgard Varèse dans les années 1920. Les sons générateurs sont toujours superposés deux à deux. Ils suivent une triple évolution : ils montent progressivement du grave vers l’aigu, les intervalles qui les constituent, d’abord resserrés, s’élargissent et leurs fréquences évoluent de façon à ce qu’elles appartiennent de plus en plus au spectre harmonique du mi du trombone, que nous entendons au début de l’œuvre. Le son résultant est calculé en soustrayant les fréquences des sons générateurs.

Au chiffre 18, les sons générateurs sont joués par le trombone (do2, Fréquence = 131 Hz) et par le cor (fa# 2, Fréquence = 185 Hz). La différence entre les deux fréquences donne un son résultant à 54 Hz, soit un la 0 un peu plus bas. Les sons complémentaires sont également déduits des sons générateurs mais ils se situent dans le registre aigu et sont quasiment inaudibles. Ils forment une sorte de halo. Ces sons additionnels, Grisey les appelle « ombres du son ». A partir de ce moment, le calme s’installe peu à peu jusqu’au chiffre 21 où le vibraphone clôt cette section par un « tremolo imperceptible ».

Figure 90: Extrait de Partiels de Grisey, Section II, ch. 18. — Figure 90: Extrait de *Partiels* de Grisey, Section II, ch. 18.

Dans le Repos II, Grisey met en scène un tableau antinomique par rapport à ce que nous venons de voir précédemment. L’atmosphère y est paisible, éthérée.

Dans sa dimension verticale, dans le Repos II, la texture est au contraire de faible densité, transparente, située dans un registre aigu avec une étendue étroite. Le spectre harmonique est réduit à quelques notes.

Dans sa dimension horizontale, elle est lisse : le discours se polarise autour de la fréquence mi à différentes octaves. Les flûtes rythment ce passage par des fluctuations microtonales quasi périodiques, ce qui correspond à notre extrait de texture lisse dans notre première expérimentation. L’ensemble donne un côté plutôt statique. L’impression globale est celle d’une musique plutôt lancinante.

Figure 91: Extrait de Partiels de Grisey, au début du Repos II, chiffre 22. — Figure 91: Extrait de *Partiels* de Grisey, au début du Repos II, chiffre 22.

2.1.3. Analyse de Textures avec Sonic Visualiser

Sachant que la texture résulte de l’interaction de différentes composantes, nous avons essayé de rendre compte, dans la mesure du possible, de l’émergence perceptive induite par telle ou telle texture, dans un souci d’analyser les différents types de tissage, de grain, de matière sonore.

Pour cela, comme décrit dans l’introduction de ce chapitre, nous avons utilisé les informations audio provenant d’enregistrements. Afin de visualiser au mieux les différents types de textures, nous nous sommes donc servis du logiciel informatique spécialisé Sonic Visualiser.⁴⁹⁸ Le sonagramme nous permet de voir la structure interne du son, en particulier sa décomposition spectrale, car notre oreille n’est pas capable de l’entendre à cause de la trop grande rapidité des évènements. Pour pouvoir percevoir l’entrée des différents partiels du son, d’une durée d’une fraction de seconde, il faudrait pour cela ralentir exagérément le son. Jérôme Baillet souligne que l’idée fondatrice chez Grisey consiste justement à faire le lien entre le ralentissement du temps et l’introspection sonore : « Soit on entend un son dans une temporalité normale, et sa structure interne est inaudible, soit on veut entrer dans le son et on doit dilater le temps. » Pour le musicologue, « la continuité et la lenteur que cherche Grisey trouvent leur matériau sonore dans l’analyse spectrale. »⁴⁹⁹

Dans la Section II, chiffre 12, la texture rugueuse et bruitée est nettement visible sur le sonagramme (au milieu de la figure 92 ci-dessous) où nous observons une sorte de climax textural avec un roulement spectral (en orange sur le sonagramme) particulièrement intense. De même, le coefficient d’énergie dans les bandes critiques nous renseigne sur les différentes strates sonores composées par Grisey afin de nous faire part de la tension significative de son discours musical et textural. Divers effets de distorsion s’organisent dans l’ensemble instrumental (modes de jeux bruités) tout au long de cette section. Cette quête de la fusion est synonyme chez Grisey de recherche des ambiguïtés sonores, notamment au niveau de la perception. Sur ce point, Grisey a bénéficié des travaux de Risset et des psychoacousticiens, sur les illusions perceptives notamment : nous pensons aux soufflets dynamiques décrits en amont de cette analyse.

Jusqu’à 5’30 de cet extrait audio, l’enveloppe spectrale est particulièrement acérée, tendue avec beaucoup d’évènements sombres dans le grave (cf. panneau central et panneau inférieur).

Figure 92: de haut en bas : forme d’onde, sonagramme et roulement spectral, coefficient d’énergie dans les bandes critiques du chiffre 12 à 22, de la Section II au Repos II.

A partir du chiffre 17, le spectre s’élargit avec une largeur fréquentielle plus ample grâce aux notes des bois dans un registre plus étendu qu’au départ. Les différents évènements vont se déplacer dans l’espace pour aller peu à peu vers l’aigu, avec des valeurs longues (ch.19). Nous le voyons très nettement dans les bandes critiques avec une zone très sombre, marquant l’absence d’évènements bruités dans le grave (cf. zone encadrée ci-dessous).

Figure 93 : Coefficient d’énergie dans les bandes critiques.

Les lignes mélodiques sont plus nettes et s’étirent dans le temps, pour arriver au Repos II.

Cette progression est clairement visible sur l’ensemble du panneau de la figure 93 qui représente le coefficient d’énergie dans chaque bande critique.

De même, on peut observer sur la figure suivante le déploiement de cette texture lisse et méditative en contraste avec l’analyse texturale précédente. La forme d’onde est quasi plate, imperturbable (panneau supérieur). Nous pouvons presque visualiser chaque son joué par les instruments sur le sonagramme (panneau central). Le roulement spectral nous renseigne sur le registre aigu de ce repos. La nature lisse de la texture apparaît tout autant dans le panneau inférieur avec cette ligne orange continue.

Figure 94 : de haut en bas : forme d'onde, sonagramme et roulement spectral, coefficient d'énergie dans les bandes critiques au chiffre 22, Repos II. — Figure 94 : de haut en bas : forme d’onde, sonagramme et roulement spectral, coefficient d’énergie dans les bandes critiques au chiffre 22, Repos II.

Dans sa notice de présentation de Dérives, Grisey précisait ceci :

L’image que je désire laisser à ceux pour lesquels le son est insuffisant serait celle d’une mer progressivement agitée jusqu’à une formidable tempête, mais dont les vagues se solidifieraient peu à peu, ne laissant finalement entendre que les craquements isolés des icebergs se chevauchant… Jusqu’au silence, point ultime de cette dérive.⁵⁰⁰

2.2. Mouvement (- vor der Erstarrung) d’Helmut Lachenmann

2.2.1. Présentation

Commandé par l’Ensemble Intercontemporain et créé le 12 novembre 1984 au Théâtre du Rond-Point à Paris sous la direction de Peter Eötvös, Mouvement (- vor der Erstarrung) d’Helmut Lachenmann évoque les derniers mouvements réflexes qui agitent le corps avant de se figer dans la mort : les ultimes convulsions et la pseudo-activité du trépas. L’œuvre est écrite pour quinze instruments : deux flûtes, deux clarinettes, une clarinette basse, deux trompettes, trois stands de percussion (à gauche, à droite et au centre de la scène), deux altos, deux violoncelles et une contrebasse à 5 cordes.

Figure 95 : Disposition des instruments, partition éditée chez Breitkopf & Härtel.

Helmut Lachenmann développe la « musique concrète instrumentale », expression empruntée à la « musique concrète » de Pierre Schaeffer, et pense le son en fonction de l’énergie qui va le produire, en s’éloignant de ce qu’il nomme « le son philharmonique ». Le geste instrumental est au cœur de son processus compositionnel. De ce fait, le type de geste, sa force et sa qualité deviennent, en relation avec le timbre produit, un paramètre déterminant dans la construction de l’œuvre. Lachenmann propose une rupture radicale vis à vis des techniques de jeux instrumentales. Michel Imberty nous relate que « le geste musical ne peut avoir lieu que dans le temps, dans une durée que l’action du corps contribue à sculpter, il est donc de l’ordre du processus et de l’action qui est en train de s’accomplir ».⁵⁰¹ Cette notion de geste chez Lachenmann permet de créer une nouvelle dynamique musicale à travers une corporéité singulière. Dès lors, le compositeur a considérablement élargi la palette des interprètes en investissant le corps de l’instrument allant du son vibré jusqu’au bruit, en inventant une extraordinaire diversité de modes de jeux. Ce qui intéresse Lachenmann lorsqu’il écoute un violoncelle par exemple, c’est le mouvement de l’archet entre la corde. Dans une perception active, le musicien souhaite attirer l’attention de l’auditeur sur ce mouvement, en augmentant excessivement la pression de l’archet par exemple ou au contraire en le faisant passer sans bruit sur le chevalet. Les sons sont alors regroupés au sein de « familles » : sons pressés, soufflés, ponctuels, discontinus, tremblés…etc. Lachenmann nous invite à développer une écoute nouvelle : ce ne sont pas les objets musicaux utilisés en tant que tels qui sont admirables mais le regard que l’on pose sur eux et l’éclairage sous lequel ils apparaissent.

2.2.2. Description

Tout au long de Mouvement (- vor der Erstarrung), Lachenmann écrit que « sa composition ne vise pas à utiliser des sons, mais à l’épuiser dans toutes ses ressources ».⁵⁰² Le matériau est ensuite développé jusqu’à son épuisement. Cette pièce est divisée en trois sections, chacune centrée autour des notions de mouvement, de paralysie et de vide. Nous analyserons la première section jusqu’à la mesure 27.

Figure 96 : Extrait du début de la partition de *Mouvement (- vor der Erstarrung)* de Lachenmann, Breitkopf & Härtel.

Lachenmann décrit sa pièce avec des expressions telles que « archet-machine », « point d’orgue flottant », « champs tremblants » et « frénésie lancinante stop-and-go ». Toute cette première section révèle une vie intense faite de frottements, de grincements, d’effets de souffle, de bruits de grattements et de sons aérés… Le silence y joue également un rôle essentiel. Lachenmann maîtrise la courbure du temps et les anticipations des auditeurs, les surprenant avec ce souci d’enrichir à chaque fois leurs attentes. Par exemple, les trilles des mesures 5 et 7 préparent l’arrivée des courts triolets mesure 9. Dans cette première section, le compositeur utilise une texture aérée, épurée, « bruitiste », où dominent des figures rythmiques simples. Nous verrons avec l’analyse faite avec Sonic Visualiser comment se développe cette texture, soulignant la sensualité et la transcendance expressive de la musique de Lachenmann.

2.2.3. Analyse Texturale avec Sonic Visualiser

Figure 97 : Mouvement (- vor der Erstarrung) de Lachenmann, de la mesure 1 à 27, de haut en bas : forme d'onde, sonagramme et roulement spectral, coefficient d'énergie dans les bandes critiques. — Figure 97 : *Mouvement (- vor der Erstarrung)* de Lachenmann, de la mesure 1 à 27, de haut en bas : forme d’onde, sonagramme et roulement spectral, coefficient d’énergie dans les bandes critiques.

Dès les premières mesures, Lachenmann nous plonge dans une atmosphère singulière avec une texture aérée ponctuée de silences, des modes de jeux bruitées avec des nuances extrêmes, pour terminer sur une certaine densité, amenée par un crescendo textural. Nous pouvons observer dans le panneau inférieur, une texture très fragmentée avec des effets de spatialisation qui ne sont pas sans rappeler l’effet des pièces d’un puzzle. Les savants modes de jeux utilisés créent une certaine ambiguïté perceptive, une sorte d’illusion sonore.

Dans sa dimension verticale, la largeur fréquentielle est éclatée, morcelée. De ce fait, la répartition des évènements simultanés dans les différentes bandes de fréquences est très hétérogène. Le centre de gravité spectrale se caractérise par son côté sombre et mouvant. La richesse des modes de jeux bruités confère à cette texture une certaine légèreté malgré la fragmentation du discours musical. Nous pouvons remarquer de part la multitude d’évènements sonores exposés, une nette ségrégation des flux sonores dans ce début de première période. La texture fait intégralement partie du mouvement généré par le foisonnement du matériau musical.

Dans sa dimension horizontale, nous pouvons observer dans le panneau central et inférieur, la striation constante de la texture obtenue par les sons de respiration, de silences et d’archets. Cette fracture du son nous suggère de découvrir de nouvelles pratiques de perception.

La visualisation texturale de la musique nous renseigne sur la relation entre entendre et voir : dans le cas de la musique de Lachenmann, le chorégraphe Xavier Le Roy a justement produit des versions à la fois rituelles et soustractives d’œuvres telles que Salut für Caudwell (1977) et Mouvement. Une interprétation totalement « muette » de cette dernière œuvre dans laquelle Le Roy laisse les musiciens interpréter l’intégralité de la pièce sans instrument, tend toutefois à simplifier cette relation, que l’on pourrait décrire comme une tentative d’atteinte à l’audition en voyant et en voyant en écoutant. Cette dynamique entre le jeu, le son et la capacité de perception des auditeurs présente un certain caractère théâtral.

Figure 98 : Günther Lebbing et Tom Pauwels in *Mouvements für Lachenmann* de Xavier Le Roy, Tanzquartier Wien, 2005. Photo by Monika Rittershaus.⁵⁰³

2.3. Symphonie Myths de Roger Reynolds (1er mouvement : Futami ga Ura)

2.3.1. Présentation

Le compositeur et théoricien américain Roger Reynolds (né en 1934) se distingue par son intérêt particulier pour la recherche dans les domaines des technologies musicales et des sciences cognitives. Il a contribué notamment au développement des travaux sur le traitement numérique des sons et leur spatialisation sonore dans de nombreuses œuvres, comme Archipelago (1982-83) et The Angel of Death (1998-2001).⁵⁰⁴ Selon Reynolds, l’instrumentalisation du corps par lui-même « impose un certain nombre de contraintes et détermine en conséquence un champ spécifique des possibles ».⁵⁰⁵ En effet, l’audition a une triple fonction de perception sonore, d’orientation spatiale et de centre de l’équilibre. La spatialisation est importante dans l’articulation musicale, parce que, toujours selon le compositeur « l’espace est une dimension immanente de la musique »⁵⁰⁶. Dans la Symphony [Myths] pour orchestre, écrite pour le Suntory Hall à Tokyo en 1990, suite à une commande du compositeur Toru Takemitsu (1930-1996), Reynolds adopte déjà cette conception, une approche compositionnelle singulière : à partir d’une idée initiale généralement extramusicale (ce qu’il nomme « impetus »), il élabore des esquisses, schémas formels, des cartes de textures, etc., visibles dans ses nombreux documents comme dans ses carnets de composition notamment. Cette approche lui a permis de créer des structures de hauteur qui, lorsqu’elles sont associées à des contours mélodiques, à des profils de densité et de texture, etc., confèrent un caractère particulier au matériau thématique. Parfois, non pas une mais plusieurs rangées, issues de la même série de bases, donnaient naissance à un type de matériau musical spécifique que l’on retrouve justement dans cette Symphony [Myths].

2.3.2. Description

Comme expliquée dans sa partition, l’image centrale qui sous-tend cette composition créée en 1990, est une formation rocheuse au large de l’île japonaise de Honshu appelée Futami ga Ura, que Reynolds avait vu à travers la brume lors de sa première visite au Japon vingt-quatre ans plus tôt et qui était restée très vive dans sa mémoire.

Figure 99 : Futami ga Ura. — Figure 99 : *Futami ga Ura.*

Pareillement dans son livre Form and Method ⁵⁰⁷, dans ses premières esquisses du mouvement intitulé Futami ga Ura tiré de sa symphonie Myths, le compositeur a dessiné les deux roches connues sous le nom de Meoto Iwa ou « roches mariées » qui se détachent de la petite ville japonaise de Futami.

Figure 100 : Dessin d'esquisse de son œuvre.508 — Figure 100 : Dessin d’esquisse de son œuvre.⁵⁰⁸

Son dessin comprend la corde qui relie symboliquement les deux rochers et le commentaire suivant : « cette corde est considérée comme étant entrelacée ». De gauche à droite, le dessin se compose du rocher représentant Izanagi (la figure masculine du mythe de la création shinto), la corde qui serre les deux formations et le rocher représentant Izanami (la figure féminine dans le mythe). Reynolds a utilisé des crochets sous les traits du dessin pour indiquer un plan de composition qui allouerait trois minutes pour une section correspondant au rocher Izanagi, six minutes pour l’espace entre les deux rochers et deux minutes pour le rocher Izanami. Le plan en trois parties est essentiellement un plan qui prescrit la traduction des caractéristiques spatiales de cette image très spécifique dans la structure temporelle d’une œuvre musicale.

Reynolds a également préparé pour cette œuvre une carte des différentes textures utilisées dans Symphony [Myths].

Figure 101 : Plan de textures préparatoire à son œuvre

Avec ses schémas formels préconçus, Reynolds « organise le temps pour donner une cohérence entre le matériau et la forme. »⁵⁰⁹ Le compositeur partage l’idée que Samuel Beckett se faisait de la forme. Selon l’écrivain, la forme, pour être artistiquement pertinente, doit comprendre un certain degré de chaos. « Trouver une forme qui accommode le chaos, voilà la tâche d’un artiste d’aujourd’hui »⁵¹⁰, disait Beckett. Rejetant les formes préétablies ou fondées sur une simple périodicité, Reynolds a cherché de nouveaux modèles dans les théories du chaos. Il conçoit ses formes musicales à partir de proportions logarithmiques souvent apériodiques.

Figure 102 : extrait de la partition Symphony [Myths] de Roger Reynolds, éditions Peters. — Figure 102 : extrait de la partition *Symphony [Myths]* de Roger Reynolds, éditions *Peters.*

Lors d’une interview avec Stephen Soderberg, en ce début de siècle, Reynolds relatait ceci : Impulsion, est celui que j’avais utilisé à l’origine dans une série de conférences que j’avais donné à l’Institut Peabody, et l’idée était que, dans l’idéal, il devrait exister au début de l’ouvrage quelque chose qui serve de graine génétique à partir de laquelle le travail jaillit. Maintenant, j’ai décrit cela de différentes manières dans diverses publications et à diverses occasions, mais au fond, une impulsion, tirée du dictionnaire, propulse quelque chose, enflamme quelque chose, le met en mouvement. Et ce que je pense, c’est qu’une impulsion idéale devrait vous indiquer comment la chose devrait évoluer – ce que le processus de croissance ou d’évolution devrait être dans le projet. Mais il devrait en même temps fournir une norme ou une cohérence globale au sein de laquelle les choix sont façonnés et faits. En d’autres termes, une impulsion idéale oriente donc le développement de l’œuvre et contient son potentiel. […] Je vous donnerai l’exemple d’une impulsion idéale – se référant également à Takemitsu – Symphony [Myths]. ⁵¹¹

Voyons, dès à présent, comment la texture se dessine avec Sonic Visualiser, au début de son premier mouvement du début à la mesure 52, chiffre A.

2.3.3. Analyse avec Sonic Visualiser

Les premières mesures dessinent une texture lisse, avec une écriture contrapuntique que l’on discerne parfaitement sur le sonagramme avec le roulement spectral en orange (panneau central).

Cette texture se densifie peu à peu avec des motifs très courts qui émergent sur des valeurs longues comme une sorte de tapis (cf. le panneau inférieur nous renseignant sur le coefficient d’énergie dans les bandes critiques).

Figure 103 : Symphony [Myths], de la mesure 1 à 51. — Figure 103 : *Symphony [Myths]*, de la mesure 1 à 51.
De haut en bas : forme d’onde, sonagramme et roulement spectral, coefficient d’énergie dans les bandes critiques.

Dans sa dimension verticale, nous observons une étendue large, complexe avec beaucoup de micro évènements venant ponctuer le discours musical. En effet, beaucoup d’instruments jouent ensemble et les éléments sonores s’enchaînent les uns aux autres de façon plutôt rapide. Les dissonances sensorielles sont perçues comme étant rugueuses d’une part parce que le nombre de lignes musicales est multiple, d’autre part les rapports d’intervalles et les timbres utilisés confèrent un mode de jeu relativement bruité. L’enveloppe spectrale nous apparaît tendue, acérée.

Dans sa dimension horizontale, les couleurs sonores utilisées dans une musique empreinte d’un certain statisme font ressortir cette densité avec tous ces micro-changements qui transforment la matière sonore perpétuellement mouvante. Ce travail sur la matière sonore, les textures et le rapport au temps se retrouve dans la plupart des œuvres de Reynolds. Par conséquent, la texture dans ce premier mouvement y est tout particulièrement dense, serrée car toutes les familles d’instruments jouent petit à petit ensemble (p. 6 de la partition, par exemple) formant un tissage orchestral complexe. Cette œuvre empreint de spiritualité, de par son contexte, est certainement la plus personnelle de Reynolds.

2.4. Ligeti, Concerto de chambre (1969-1970), 3ème mouvement (Movimento preciso e meccanico)

2.4.1. Présentation

Composé entre 1969 et 1970, écrit pour un ensemble de treize musiciens, couvrant un large spectre de familles instrumentales et de registres (depuis la contrebasse jusqu’à la flûte piccolo), le Concerto de chambre (Kammerkonzert) a été créé le 1er octobre 1970 au festival de Berlin, par l’ensemble Die Reihe sous la direction de Friedrich Cerha. Chaque instrumentiste est traité de manière égale, en tant que virtuose concertant. Six instruments à vent, cinq instruments à cordes, quatre claviers joués par deux musiciens : soit une flûte (qui peut être remplacée par un piccolo), un hautbois (également cor anglais ou hautbois d’amour), une clarinette en si b, une clarinette basse, un cor, un trombone ténor, un piano et un célesta joués par le même interprète, un quatuor à cordes, une contrebasse, un clavecin et un orgue Hammond (ou harmonium) joués par le même exécutant. Ligeti le définissait ainsi : « Une combinaison d’intervalles clairement audible s’efface peu à peu, et à partir de ce brouillage, une combinaison d’intervalles se cristallise. » Pierre Michel souligne que « le concerto de chambre comporte une très grande variété de structures, il pourrait presque résumer à lui seul tous les éléments de langage de la musique de Ligeti à cette époque. »⁵¹² Le premier souci du compositeur semble d’ordre plastique : peaufiner la matière sonore, « ajuster les dynamiques, aucun instrument ne doit émerger », ne cesse de préciser la partition. Cette partition hypnotise l’auditeur, tel un dessin en trompe l’œil du Néerlandais Maurits Cornelis Escher (1898-1972) qui excelle dans l’art de la perspective paradoxale, que Ligeti admirait tant ! Escher est, d’une certaine manière, très proche du compositeur. En effet, si nous observons les gravures ci-dessous d’Escher qui illustrent notre propos, nous remarquons que ce dernier cherche à « tromper » l’observateur, comme le ferait Ligeti dans sa musique. Nous avons d’ailleurs expliqué ce phénomène d’illusions auditives dans le troisième chapitre. Escher utilisera par exemple l’escalier de Penrose⁵¹³ pour créer des scènes surréalistes où les lignes de fuite sont interchangeables.

Figure 104 : Maurits Cornelis Escher, Mouvement perpétuel ou Cascade,1961, Lithographie, 300 mm x 380 mm. — Figure 104 : Maurits Cornelis Escher, *Mouvement perpétuel* ou *Cascade,*1961, Lithographie, 300 mm x 380 mm.

Dans un entretien avec Pierre Michel, Ligeti exprime très clairement sa fascination pour l’artiste et à quel point il a influencé son écriture :

Un de ses dessins les plus typiques s’appelle Métamorphoses. Escher transforme progressivement un carré en animaux (lézards), puis cela devient géométrique ; des hexagones évoquent l’association à une ruche d’abeilles, puis les abeilles sortent en volant et se muent en papillons ou en poissons. L’idée est géniale. Quand j’ai vu cela, j’ai été touché car, dans Continuum, c’est exactement la même chose. J’ai, comme dans cette œuvre d’Escher, une image claire de départ : un intervalle qui est de plus en plus brouillé, puis un nouvel intervalle, brouillé à son tour, etc. Il y a des mondes fantastiques chez Escher, mais cela vaut la peine de les voir très lentement… par moments vous croyez que c’est convexe, à d’autres moments vous croyez que c’est concave, on ne sait plus trop. Cela relève des illusions d’optiques, ou plus simplement de l’ambiguïté de la représentation de l’espace tridimensionnel, perceptif, sur une surface à deux dimensions.⁵¹⁴

Figure 105 : M.C. Escher, Métamorphoses II, xylographie en noir, vert et brun, en vingt blocs, sur trois feuilles combinées 19,2 x 389,5 cm, novembre 1939-mars 1940. — Figure 105 : M.C. Escher, *Métamorphoses II*, xylographie en noir, vert et brun, en vingt blocs, sur trois feuilles combinées 19,2 x 389,5 cm, novembre 1939-mars 1940.

Le compositeur aime intimement utiliser ces effets d’illusion :

Je travaille souvent en me servant d’illusions acoustiques, très analogues aux illusions optiques, les fausses perspectives… Nous ne connaissons pas vraiment très bien les illusions acoustiques. Mais elles sont très analogues et on peut faire des choses très intéressantes dans ce domaine. Par exemple produire l’illusion d’une certaine succession rythmique qui n’est pas vraiment jouée…⁵¹⁵

Les quatre mouvements de l’œuvre tissent une large texture micro-polyphonique, où un ambitus de hauteurs s’élargit peu à peu, depuis le demi-ton jusqu’à la septième majeure. Nous nous intéresserons tout particulièrement à cette horlogerie implacable diaboliquement détraquée du troisième mouvement, Movimento preciso e meccanico, réminiscence de l’orchestre de métronomes désynchronisés du Poème symphonique (1962). Ligeti y façonne un véritable mécanisme de précision qui, comme souvent dans sa musique, s’auto-détruit.

2.4.2. Description

Ce troisième mouvement du Concerto de Chambre reflète une des obsessions récurrentes du compositeur, à savoir celle des objets mécaniques en général et des horloges plus particulièrement, que nous retrouvons également dans Continuum pour clavecin (1968). « La troisième partie est quasi mécanique, comme si un étrange appareil de précision à moitié détraqué se mettait en mouvement » précise Ligeti au sujet du Kammerkonzert.⁵¹⁶ Ainsi, cette « polyphonie saturée », technique d’écriture chère à Ligeti, se retrouve dans la plupart de ses œuvres. Dans Kammerkonzert, il utilise des procédés d’écriture rigoureux et empruntés à la musique « traditionnelle » avec l’emploi du canon (mais de manière non conventionnelle). D’après Ligeti, la technique du canon permet de structurer et de coordonner les éléments verticaux et horizontaux afin de construire les réseaux micro-polyphoniques :

Si je veux remplir un espace peu à peu, graduellement, pas avec un cluster, mais avec une sonorité assez épaisse, le canon à l’unisson est un moyen très approprié, car je peux avoir une succession de plusieurs sons, donc une ligne mélodique, et si je fais de cette succession un canon, il y a alors une deuxième ligne mélodique qui l’imite, puis une troisième, etc. […] Cela signifie que ce que j’ai comme succession va devenir simultanéité ; il y a alors unité entre simultanéité et succession.⁵¹⁷

Figure 106 : extrait de la partition de Ligeti, Concerto de Chambre, Movimento preciso e meccanico, p. 61, Edition Schott. — Figure 106 : extrait de la partition de Ligeti, *Concerto de Chambre, Movimento preciso e meccanico*, p. 61, Edition Schott.

Selon le musicologue Jean-Pierre Dambricourt, ce troisième mouvement se découperait en trois parties distinctes : du début à la lettre C, de C à la mesure 40, puis de la lettre H jusqu’à la fin.⁵¹⁸ Tout le début de cette première section s’articule autour d’une seule note (mi), où Ligeti propose une extension progressive de l’ambitus. Un cluster se forme peu à peu avec un ambitus do-fa# à la sixième mesure. À partir de la mesure 8, de longues tenues apparaissent discrètement chez les bois et à la contrebasse. Cette texture saisissante a la particularité d’allier des sons incisifs à des sons fondus : ainsi de la mesure 8 à 11, les pizzicatos des cordes se mêlent subtilement au fondu des tenues de bois, ponctuée par l’entrée imperceptible de la contrebasse. Cet alliage entre les timbres et les sensations révèle une organisation timbrique et texturale d’une grande finesse. Les trois familles instrumentales (vents, claviers et cordes) évoluent progressivement, avec les vents au départ, puis le piano et les cordes en pizzicato. Au niveau rythmique, cela s’articule de la même manière. Nous assistons à un épaississement de la matière sonore, grâce à la superposition progressive de ces couches sonores, formant des clusters harmoniques : une sorte de fondu enchainé de timbres entre les bois puis les cordes.

Figure 107 : Paul Klee, Chemin principal et chemins secondaires (Hauptwege-und Nebenwege) 1929, huile sur toile de 83 x 67 cm, conservé à Cologne, au Wallraf-Richartz und Ludwig Museum. — Figure 107 : Paul Klee, *Chemin principal et chemins secondaires (Hauptwege-und Nebenwege)* 1929, huile sur toile de 83 x 67 cm, conservé à Cologne, au *Wallraf-Richartz und Ludwig Museum*.⁵¹⁹

Le tableau de Paul Klee ci-dessus explore la vision texturale de Ligeti. Dambricourt souligne ceci à propos de ce tableau : « Ligeti déclare souvent trouver dans la peinture de Paul Klee un travail sur la perception des lignes, des plans et des couleurs comparables au sien. »

La seconde partie débute de la même manière que la précédente avec un focus sur une seule note, la bémol (mesure 12) répartie sur un ambitus de quatre octaves. Alors que nous assistions à une mécanique se grippant peu à peu dans la première section, cette seconde section évoque plus un « emballement délirant » selon les mots de Dambricourt. Mis à part la technique du canon, Ligeti aime utiliser tout particulièrement ici, le « total chromatique » afin de remplir son espace sonore. Á partir du la b de la mesure 12, un cluster se forme par canon chromatique, superposant au total 11 sons. Mesure 38, un nouveau cluster, joué au piano et au clavecin le remplacera.

La formation de ce cluster se fait selon la proposition du schéma ci-après de la musicologue Marie Delcambre-Monpoël. Il nous a semblé fort intéressant d’être mentionnée dans ce chapitre.

Figure 108 : De la lettre C à E, schéma de la formation progressive du cluster, proposé par la musicologue Marie Delcambre-Monpoël. Les chiffres indiqués correspondent aux mesures.⁵²⁰

Dès la mesure 32, les pizzicati vigoureux des cordes, sul ponticello, joués « à la Bartok » amorcent une séquence de mécanique imperturbable où se jouent des moments d’une rare complexité rythmique. Dambricourt parle de « polymétrie » plutôt que de polyrythmie, car cela supposerait une pulsation commune. En effet, c’est surtout un jeu subtil sur la perception des vitesses. Il précise : « Le temps s’écoule à une vitesse différente pour chaque « horloge » dont le fonctionnement, qui plus est, peut lui-même varier. »⁵²¹

Pour clore ce troisième mouvement, la troisième et dernière section intervient à la mesure 41, lettre H. La rupture est brutale : le triple pizzicati des cordes joués double piano avec des arpèges très rapides forment peu à peu une sorte de tapis texturé. Nous retrouvons cette polymétrie : les différents rythmes se figent sur un cluster qui n’évolue pas. L’effet obtenu correspond à une horloge détraquée. Les vitesses de chaque instrument sont différenciées dans des rapports qui n’autorisent plus la simultanéité des sons mais a contrario appèlent à de subtils décalages qui introduisent à leur tour la notion de déphasage. La fascination de Ligeti pour ces mécaniques détraquées vient de ses lectures et en particulier des livres de l’écrivain hongrois Gyula Krudy (1878-1933) : « J’ai repris dans ma musique, inconsciemment je pense deux choses de Krudy: un sentiment de non écoulement du temps et un sens de l’immobilité».⁵²² A la mesure 53, les treize instrumentistes jouent tous ensemble sur le total chromatique, réparti sur presque cinq octaves. La texture y est acérée, agressive, générée par des sons aigus stridents. A partir de la mesure 60, nous assistons à l’épuisement de ce monde avec des variations de timbres sur des rythmes irréguliers. Ligeti utilise pour cela des trilles et un cluster se glissant d’un timbre à l’autre (si à mi b).

2.4.3. Analyse avec Sonic Visualiser

Ligeti articule les différentes voix simultanément de façon systématique : ce qui techniquement permet de faire évoluer la notion de polyphonie vers la notion de texture. Notre choix d’analyser la texture avec Sonic Visualiser nous permettra de discerner les « masses, nuages sonores, cluster, trames, tissus, micropolyphonie, mécanique imperturbable, polyrythmie, illusion, statisme, limites »⁵²³, autant de termes que nous associons le plus souvent à la musique du compositeur.

Dans une conférence sur le Kammerkonzert de Ligeti en 1978, Pierre Boulez décrit les textures ainsi : « comme quand on écrit sur du papier mouillé on a, tout à coup, non seulement la ligne, mais vous avez la ligne qui se répand et l’encre qui imbibe le papier. Mais seulement vous avez toujours la ligne ».⁵²⁴

Figure 109 : Kammerkonzert de Ligeti, première partie : du début à la lettre C. — Figure 109 : *Kammerkonzert* de Ligeti, première partie : du début à la lettre C.

Dans cette première partie, dans sa dimension horizontale, nous observons dans le panneau inférieur (coefficient d’énergie dans les bandes critiques), une ligne orangée traversante correspondant à la note mi. Ligeti s’appuie sur cette note afin de construire peu à peu une sorte de climax orchestral pour arriver à une texture incisive, où se dégage une certaine tension dramatique. La texture est mouvante, avec des accents et des timbres inattendus. La matière sonore se densifie progressivement, ponctuée d’évènements brefs, pour revenir à un calme apparent mais pas véritable (visible sur l’ensemble du document ci-dessus). Ce repos momentané n’est pas sans rappeler ceux de Grisey avec une texture composée de longues tenues, nous permettant d’avoir le sentiment d’une sincère détente. Dans sa dimension verticale, nous pouvons parler d’une texture singulière alliant des sons incisifs à des sons fondus. La largeur fréquentielle est hétérogène avec un mode de jeux bruités. L’écriture contrapuntique confère à cette texture une certaine rugosité, de par le nombre de lignes utilisées. Son enveloppe spectrale est froide, tendue. Ligeti manipule des indices de groupement séquentiel afin de souligner la complexité de sa polyphonie.

Figure 110 : *Kammerkonzert* de Ligeti, deuxième partie : de la lettre C à la mesure 40 inclus.

Au sein de cette deuxième partie, nous pouvons immédiatement remarquer la densité de cette nouvelle texture sur le sonagramme (panneau central), s’apparentant à un « continuum granuleux ».⁵²⁵ Un ostinato rythmique implacable se déploie avec des superpositions de vitesses différentes (polytempi). Ligeti écrit des notes répétées évoluant de manière chromatique à partir du la b en employant la technique du canon. Nous pourrions faire le rapprochement avec les musiques traditionnelles d’Afrique centrale, ce que l’ethnomusicologue Simah Arom nomme « ostinato à variations ».⁵²⁶ Le matériau rythmique est souvent en conflit avec la pulsation :

Dans des musiques cycliques fondées sur la répétition et la variation, il est important afin d’éviter la monotonie, que soit maintenue une tension permanente. Or, c’est précisément par le biais de la polysémie des structures rythmiques, obtenue grâce à l’ambiguïté qui leur est inhérente, que cette tension ne cesse qu’avec la musique elle-même.⁵²⁷

En somme, l’écriture texturale de Ligeti se rapproche du contrepoint tel qu’il est pratiqué dans les musiques africaines.

Dans sa dimension verticale, nous pouvons observer un net changement de texture avec un élargissement spectral conférant un caractère plus dense et opaque. La largeur fréquentielle est plutôt homogène dans cette deuxième partie. Son enveloppe spectrale est de plus en plus tendue, acérée voire agressive. Vers la fin de cette deuxième partie, nous avons la sensation d’une fusion fugitive des différents flux auditifs grâce notamment à la comodulation des amplitudes et du synchronisme des attaques.

Dans sa dimension horizontale, nous voyons clairement se dessiner dans le panneau central notamment, un nombre élevé de striations jouées à un tempo très rapide. Le caractère pulsé de cette texture va évoluer vers un climax timbral et polyrythmique intense. Cette « polymétrie » dont parle Dambricourt, met en avant cette mécanique imperturbable en perpétuel mouvement. La densité temporelle est fort compacte avec un jeu subtil de flux auditifs très variés.

Figure 111 : Kammerkonzert de Ligeti, troisième partie : de la mesure 41 à la fin du troisième mouvement. — Figure 111 : *Kammerkonzert* de Ligeti, troisième partie : de la mesure 41 à la fin du troisième mouvement.

Dans cette ultime partie, Ligeti rompt brutalement avec la texture précédente, en réduisant significativement sa largeur fréquentielle avec un centre de gravité spectral beaucoup plus grave, visible sur l’ensemble du document ci-dessous. Un sentiment de douceur émerge un instant grâce à la réduction des dissonances sensorielles d’une part et du subtil alliage de timbres d’autre part. La nuance double piano maximise cet effet. Dans sa dimension horizontale, sur ce même moment, la faible densité des évènements engendre un certain statisme.

Puis le « mécanisme de l’horloge » se détraque franchement avec le déplacement du spectre vers l’aigu et des dissonances sensorielles beaucoup plus marquées, conférant à cette texture un caractère rugueux et glacé à la fois. Ligeti articule les différents flux auditifs de manière simultanée, tout en faisant varier subtilement les vitesses de chaque instrument. Les différents décalages obtenus introduisent cette notion de « déphasage », chère au compositeur. Nous retrouvons tout particulièrement ce procédé d’écriture dans Continuum pour clavecin (1968). Cette polyphonie saturée met en valeur cette texture grâce à l’ambitus et le registre utilisé.

3. Expérimentation n°1 : Représentation cognitive des textures chez l’enfant sourd

3.1. Méthode

3.1.1. Participants

3.1.1.1. Le groupe expérimental

Cette étude a été menée auprès de 50 enfants dont 26 enfants sourds implantés, scolarisés au CEOP (Centre Expérimental Orthophonique et Pédagogique) à Paris, et auprès de 24 enfants normaux-entendants scolarisés à Chambœuf en Côte d’Or. Les enfants sont âgés de 6 à 12 ans répartis en deux groupes distincts.

Le groupe expérimental est composé de 26 enfants sourds dont 13 garçons et 13 filles. Tous présentent une surdité congénitale profonde, sauf un, ayant une surdité moyenne limite sévère. Les enfants sont répartis en primaire du CP au CM2. 14 enfants portent un implant cochléaire et une prothèse controlatérale, 12 sont bi-implantés. 18 enfants ont été implantés avant l’âge de 2 ans (implantation pré-linguale). Ils ont tous bénéficié d’une éducation auditive dès leur plus jeune âge dispensée par des orthophonistes. Les enfants de ce groupe ont suivi au moins un an des séances de musique hebdomadaire avec un professeur spécialisée pour enfants sourds et musicienne, pour les plus jeunes, et 5 ans pour les plus âgés.

Le projet de cet établissement est bilingue : apprentissage de la langue des signes française (L.S.F.) et développement de la langue orale française accompagnée du langage parlé complété (L.P.C.).

3.1.1.2. Le groupe contrôle

Ce groupe est composé de 22 enfants normo-entendants (11 garçons et 11 filles), âgés de 6 à 12 ans, scolarisés en primaire du CP au CM2, tout comme le groupe expérimental. A la discrétion des professeurs des écoles et en accord avec les programmes de l’éducation nationale, les enfants

pouvaient bénéficier d’un temps musical de 45mn à 1h30 par semaine.

3.1.2. Matériel

L’expérience a été réalisée sur un ordinateur portable muni de haut parleurs de très bonne qualité au sein des deux établissements différents : au CEOP ainsi qu’à l’école élémentaire de Chambœuf. Les fichiers audio sont de qualité 44 100 Hz, 16 bit, extraits de CD commercialisés. Le programme est réalisé avec Max MSP tournant avec Max Runtime.⁵²⁸

3.1.2.1. Matériel musical

Nous avons utilisé 24 extraits de musique contemporaine en sélectionnant 6 extraits pour chaque texture : la texture aérée, dense, lisse et pulsée. Voici la liste des œuvres utilisées pour différencier les différents types de textures : 24 extraits (20 sec. ± 1).

– Concernant les extraits ayant des textures aérées :

Péter Eötvös (1944 – en vie), compositeur et chef d’orchestre hongrois, Chinese Opera pour ensemble (1986), extrait au début du morceau.
Morton Feldman (1926-1987), compositeur américain, Piano and orchestra (1975) extrait à 1’17 minute.
Helmut Lachenmann (1935- en vie), compositeur allemand, Mouvement (- vor der Erstarrung) pour ensemble (1984) extrait du début du morceau.
Helmut Lachenmann (1935- en vie), compositeur allemand, Schwankungen am Rand pour cuivres et cordes (1975) extrait à 1’05 minute.
Karlheinz Stockhausen (1928-2007), compositeur allemand, Gruppen for three orchestras (1955) extrait à 8’38 minutes.
Tōru Takemitsu (1930-1996), compositeur japonais, Tree lines (1988) extrait du début du morceau.

– Concernant les extraits ayant des textures lisses :

Péter Eötvös (1944 – en vie), compositeur et chef d’orchestre Hongrois, Chinese Opera pour ensemble (1986), extrait à 4’33.
Gerard Grisey (1946-1998), compositeur français, Partiels pour dix-huit musiciens (1975) extrait à 6’05 minutes.
Georg Friedrich Haas (1953- en vie), compositeur autrichien, Wer, wenn ich schriee, hörte mich, pour percussions et ensemble (1999), extrait à 1’08 minute.
György Ligeti (1923-2006), compositeur hongrois naturalisé autrichien, Lontano pour grand orchestre (1967) extrait à 19 seconde.
Tristan Murail (1947-en vie), compositeur français, Le lac pour grand ensemble (2001) extrait à 5’06 minutes.
Roger Reynolds (1934- en vie), compositeur Américain, Symphony [Myths] pour orchestre (1990) extrait à 2’55 minutes.

– Concernant les extraits ayant des textures denses :

Hugues Dufourt (1943-en vie), compositeur français, Le Déluge d’après Poussin pour orchestre (2001) extrait à 28’45 minutes.
Pascal Dusapin (1955- en vie) compositeur français, Extenso solo n° 2 pour orchestre (1994) extrait à 4’55 minutes.
Tristan Murail (1947-en vie), compositeur français, Le lac pour grand ensemble (2001) extrait à 18’36 minutes.
Roger Reynolds, (1934- en vie), compositeur américain, Symphony [Myths] pour orchestre (1990) extrait à 20 seconde.
Giacinto Scelsi (1905-1988), compositeur italien, Konx-Om-Pax pour grand orchestre, choeur et orgue (1969) extrait à 3’38 minutes.
Iannis Xenakis (1922-2001), compositeur grec, Tracées pour 94 musiciens (1987) extrait à 30 secondes.

– Concernant les extraits ayant des textures pulsées :

Pierre Boulez (1925-2016), compositeur français, Éclat/Multiples pour orchestre (1970) extrait au début du morceau.
Pierre Boulez (1925-2016), compositeur français, Répons pour six solistes, ensemble de chambre, sons électroniques et électronique en direct (1982) extrait au début du morceau.
Pierre Boulez (1925-2016), compositeur français, Rituel in memoriam Bruno Maderna pour orchestre en huit groupes (1974-1975) extrait à 3’02 minutes.
Peter Eötvös (1944 – en vie), compositeur et chef d’orchestre hongrois, Chinese Opera pour ensemble (1986) extrait à 58 secondes.
Georg Friedrich Haas (1953- en vie), compositeur autrichien, Wer, wenn ich schriee, hörte mich, pour percussions et ensemble (1999), extrait à 7’31 minutes.
György Ligeti (1923-2006) compositeur hongrois naturalisé autrichien, Kammerkonzert pour treize instrumentistes (1970) extrait à 1’24 minute.

Tableau 2 : Abréviations : P (pulsé), A (aéré), D (dense), L (lisse) et le nom de fichier : La qualité de texture, le nom du compositeur, le nom abrégé de l’œuvre avec éventuellement le numéro de mouvement et un chiffre indiquant la position de l’extrait - en secondes - dans le fichier original. Ex.P_Boulez_Rituel_182.wav — Tableau 2 : Abréviations : P (pulsé), A (aéré), D (dense), L (lisse) et le nom de fichier : La qualité de texture, le nom du compositeur, le nom abrégé de l’œuvre avec éventuellement le numéro de mouvement et un chiffre indiquant la position de l’extrait – en secondes – dans le fichier original. Ex.P_Boulez_Rituel_182.wav

Nous avons sélectionné ces quatre types de textures en nous interrogeant sur l’effet qu’elles pourraient produire et si ces effets pourraient conditionnés un classement pertinent.

La texture aérée nous plonge dans un espace intemporel dicté par des sons de façon aléatoire. La présence des silences est caractéristique de cette texture. Celle-ci est très fragmentée avec des effets de spatialisation, le plus souvent avec un mode de jeux bruités et des rythmes apériodiques.

C’est pourquoi la texture que nous qualifions de « lisse » suggère une atmosphère paisible et éthérée, avec un spectre harmonique plutôt réduit, avec peu d’éléments rythmiques, sur des longues tenues renvoyant à un certain immobilisme. Nous n’avons pas réellement de contrastes ou de changements bruts entre les sons.

La texture dense se caractérise par un tissu orchestral complexe où toutes les familles d’instruments sont représentées. Les dissonances sensorielles pourront être perçues comme étant rugueuses d’une part parce que le nombre de lignes musicales est multiple, d’autre part car les rapports d’intervalles et les timbres utilisés confèrent un mode de jeu plutôt bruité. L’enveloppe spectrale sera le plus souvent tendue, acérée.

Quant à la texture pulsée, des éléments rythmiques périodiques la caractérisent, avec un ambitus large. Les sons se superposent, s’ajoutent. Il émerge des lignes mélodiques bien spécifiques conférant à une ambiance chaotique.

3.1.3. Procédure

La capture d’écran ci-dessous correspond à l’image du logiciel Max MSP à son ouverture avant que le sujet commence l’expérience.

Figure 112 : Capture d'écran d'une passation finalisée avec un enfant avec l'explication donnée oralement accompagnée ou pas de LPC (Langage Parlé Complété) ou proposée en Langue des Signes Française (L.S.F.). — Figure 112 : Capture d’écran d’une passation finalisée avec un enfant avec l’explication donnée oralement accompagnée ou pas de LPC (Langage Parlé Complété) ou proposée en Langue des Signes Française (L.S.F.).

A droite, nous pouvons voir les consignes qui ont été données à nos sujets, consignes que nous lisions avec eux en leur donnant des explications complémentaires si besoin. Ainsi, nous pouvons voir 24 pastilles entourées d’un rond rouge orangé réparties en bordure du carré jaune. Ce carré jaune est divisé en quatre parties égales. Les pastilles sont toutes numérotées de 1 à 24. Chaque pastille correspond à un extrait de musique contemporaine d’environ 20 secondes (cf matériel musical en amont). Il est important de préciser qu’à chaque ouverture du logiciel, les extraits musicaux sont associés de manière aléatoire aux différentes pastilles, de façon à ce que la pastille n°1, par exemple, ne correspond pas toujours au même extrait, etc. Ceci afin de pouvoir écarter un biais d’ordre entre les extraits musicaux et le numéro des pastilles.

Chaque sujet devait cliquer sur la pastille de son choix pour démarrer l’expérimentation : l’extrait correspondant, présenté de manière aléatoire pour chaque sujet, pouvait être arrêté au bout de 10 secondes d’écoute. Les sujets pouvaient réécouter plusieurs fois les extraits à tout moment quand ils en ressentaient le besoin, afin de réaliser la tâche demandée le mieux possible et d’être sûr de leur classement. Au fur et à mesure de leur écoute, les participants devaient déplacer les pastilles afin de former des groupes. Ils pouvaient faire un nombre de groupes à leur convenance, et chaque groupe pouvait contenir autant d’extraits qu’ils le souhaitaient. Les résultats d’un sujet à l’autre se sont avérés être relativement différents en terme de groupement notamment.

Figure 113 : Exemples de classements réalisés par deux enfants sourds implantés du groupe expérimental.

Figure 114 : Exemples de classements réalisés par deux enfants normo-entendants du groupe contrôle.

Nous avons rencontré des classements divers : le nombre de groupes pouvant varier entre 2 et 9 selon les sujets. Bien que le plus grand nombre ait réalisé 4 groupes distincts.

Après avoir finalisé l’expérimentation, nous demandions aux sujets d’exprimer leurs ressentis. Concernant les enfants sourds, la plupart ont eu besoin de commenter leurs actions et d’exprimer leurs émotions spontanément : « Cette musique me fait penser aux méchants dans Star Wars » (Aydane, 8 ans) ou encore « J’imagine être en haut de cette colline où tout est calme et paisible » (Anaïs, 12 ans). La plupart des enfants sourds ont eu besoin d’associer à leur écoute une information visuelle ou une émotion. La question est de savoir si c’est la musique contemporaine qui suscite ce type de lien ou bien plus précisément la texture. Nous verrons dans nos résultats et dans notre discussion si nous aurons des éléments de réponses à cette question. Nous avons pu collecter un grand nombre de réponses selon les sujets : 49 chez les enfants et 30 chez les adultes. Nous détaillerons dans un second temps cette dernière population.

Nous avons émis l’hypothèse que la musique contemporaine serait plus porteuse de sens et d’émotions pour les enfants sourds que la musique « tonale ».

3.2. Résultats

3.2.1. Le groupe expérimental

Figure 115 : MDS des enfants sourds implantés (cooccurrence)

Pour analyser les résultats, nous avons utilisé la méthode de Multidimensional scaling (MDS) afin de pouvoir visualiser les similarités dans les données. Deux méthodes de MDS ont été utilisées : la première se base sur un algorithme qui calcule les distances entre les pastilles et la deuxième se base sur une matrice de cooccurrence relevée manuellement. Il nous est apparu nécessaire de vérifier l’efficience de l’algorithme avec cette seconde analyse.

La MDS est une méthode couramment employée dans les études sur les émotions notamment. Nous pensons à l’étude d’Emmanuel Bigand et collaborateurs, Multidimensional scaling of emotional responses to music : the effects of musical expertise and of the duration of the excerpts (2005).⁵²⁹

Pour commencer, nous constatons un classement remarquable chez ces enfants que ce soit avec la MDS à partir de données relevées à la main (fig. 115) et la MDS réalisée à partir de l’algorithme de calcul des distances (fig. 116). Les différentes textures entendues sont très bien discriminées et classées. Que ce soit dans la MDS relevée à la main ou celle réalisée à partir de l’algorithme de calcul des distances, les textures denses sont bien opposées aux textures aérées sur l’axe 2. Les textures lisses sont opposées aux pulsées sur l’axe 1. Dans la MDS relevée à la main seul un extrait est isolé (L15 Wer de Haas) et dans celle produite à partir de l’algorithme, nous remarquons que seul D10 (Reynolds Myths) est isolé. Cette différence provient de la façon de calculer les MDS, c’est un artefact des méthodes.

Sur la MDS (figure 115), les textures lisses sont les mieux regroupées, à part l’extrait L15 (Wer de Haas) qui est éloignée de toutes les textures représentées. Concernant les textures aérées, les extraits A1-A3-A4-A5 sont parfaitement classés (Chinese Opera d’Eotvös, les Lachenmann et Gruppen de Stockhausen). Piano and orchestra de Feldman (A2) apparaît légèrement plus distant des autres, tout comme Tree Lines de Takemitsu (A6), mais dans un degré moindre. Les textures denses sont fort bien regroupées également. Cependant, l’extrait D8 se détache très légèrement des autres : Extenso de Dusapin. Quant aux textures pulsées, très bien groupées, Repons de Boulez semble se rapprocher des extraits denses.

Si nous comparons ces mêmes réponses avec la MDS ci-dessous (calcul mathématique des distances entre chaque pastille), nous pouvons remarquer 4 groupes distincts également. Néanmoins, avec cette MDS, dans les textures denses, l’extrait D10, Myths de Reynolds se détache significativement du groupe.

Figure 116 : MDS des enfants sourds implantés (à partir d’un algorithme de calcul des distances entre chaque pastille).

Au vu de tous ces résultats, nous pouvons affirmer que les enfants sourds implantés sont tout à fait capables de différencier des textures à partir de musiques contemporaines.

Nous avons proposé cette expérimentation auprès d’enfants normo-entendants qui constituent notre groupe contrôle. Nous supposons que ces derniers seront encore plus performants pour classer ces textures.

3.2.2. Le groupe contrôle

Figure 117 : MDS des enfants normo-entendants (cooccurrence).

La MDS (fig. 117) nous montre une classification étonnamment beaucoup moins nette que celle des enfants sourds IC.

Nous pouvons remarquer que les extraits ayant une texture lisse sont les mieux classés tout comme chez les enfants sourds, avec Wer de Haas (L15) qui se retrouve également isolé. Ici, il est classé entre des textures denses et pulsées. Les impulsions apériodiques et le registre grave propre à cet extrait semblent avoir déstabiliser les enfants. Les textures pulsées sont quant à elles éclatées, tantôt au milieu des aérées, tantôt proches des denses. Rituels de Boulez (P21) cohabite près du Concerto de chambre de Ligeti (P24) tout près des textures aérées. Repons de Boulez (P20) est au carrefour de deux textures aérées (A2, Piano and orchestra de Feldman et A3, Mouvement de Lachenmann) et d’une texture dense (D8, Extenso de Dusapin).

Le groupement des textures denses est plus cohérent, même si l’extrait P23 est classé parmi elles (Wer de Haas pulsée).

Pour essayer de comprendre la confusion entre les textures que l’on a pu constater chez les enfants normo-entendants, nous avons réécouté attentivement les stimuli. Il s’avère que sur l’axe horizontale, les enfants ont regroupé à gauche des extraits avec des attaques rapides (beaucoup de sons de percussions) et à droite des extraits avec sons aigus ayant des attaques lentes. Sur l’axe vertical, il semble que les enfants aient fait leur regroupement sur la base de la brillance du timbre et sur la dissonance. Les extraits les plus en haut ont tendance à avoir un timbre plus clair et contenant moins de dissonances, alors que ceux placés en bas, sont plus sombres et plus dissonants.

Tous ces résultats chez les enfants nous conduisent à nous intéresser aux résultats chez les adultes NE musiciens vs non musiciens.

3.2.3. Participants adultes

Cette expérimentation a été menée par une étudiante en musicologie dans le cadre de son mémoire de master 1.⁵³⁰ Chloé Beyrand a utilisé notre corpus musical, afin de les corréler aux émotions.

Pour cette expérience, elle a sélectionné 30 sujets : 15 musiciens et 15 non musiciens, le nombre de femmes et d’hommes étant sensiblement le même et tous ses sujets ont entre 20 et 40 ans. Nous entendons par « musicien », un sujet ayant effectué au moins 6 années de pratique et de formation musicale encadrées par des professionnels (conservatoire, école de musique). Concernant nos sujets non musiciens, ils devaient ne jamais avoir reçu de formation musicale par un professionnel ni être un musicien autodidacte.

3.2.3.1. Résultats

Figure 118 : MDS des adultes normo-entendants musiciens (à partir d'un algorithme de calcul des distances entre chaque pastille). — Figure 118 : MDS des adultes normo-entendants musiciens (à partir d’un algorithme de calcul des distances entre chaque pastille).

Figure 119 : MDS des adultes normo-entendants non-musiciens (à partir d'un algorithme de calcul des distances entre chaque pastille). — Figure 119 : MDS des adultes normo-entendants non-musiciens (à partir d’un algorithme de calcul des distances entre chaque pastille).

Chez les musiciens, nous pouvons constater un bon classement des différentes textures, un classement cohérent (cf. groupements de couleurs).

Chez les non-musiciens, les résultats sont moins bons. Ils classent bien les textures pulsées et denses alors que le classement des textures aérées et lisses n’est pas réussi. Nous pouvons rapprocher ces résultats avec ceux des enfants normo-entendants.

Nous remarquons que ce sont les extraits correspondants à la texture dense qui ont été correctement perçus par les deux groupes de participants. De même, mais de façon moindre, la texture pulsée a plutôt bien été reconnue par les deux groupes, par contre, aucun des deux groupes n’ont intégré l’extrait P23 (Wer wenn ich schriee de Friedrich Haas) dans une texture significative pour eux, ce qui pourrait expliquer son isolement. La texture aérée n’a pas toujours été bien perçue, certains extraits sont assez dispersés, surtout chez les non musiciens. De la même manière, la texture lisse n’a pas toujours été bien perçue, surtout les extrait L16 (Lontano de György Ligeti) et L17 (Le lac de Tristan Murail) qui ont plutôt été regroupés avec les extraits correspondants à la texture aérée.

Au vu de l’ensemble de ces résultats, nous avons entrepris une autre expérimentation avec les enfants où il s’agissait de classer des extraits musicaux en fonction de leur contenu émotionnel : la gaieté, la colère, la sérénité et la tristesse.

Notre principale hypothèse serait de voir si les enfants normo-entendants seraient meilleurs dans cette tâche, puisque nous avons utilisés des musiques tonales cette fois-ci. Est-ce que les enfants sourds implantés seront tout aussi performants également ? Sachant que la perception de la hauteur est plutôt déficitaire, même avec un implant cochléaire.

4. Expérimentation n°2 : Représentation émotionnelle des textures chez l’enfant sourd implanté

4.1. Méthode

4.1.1. Participants

Cette étude a été menée auprès de 58 enfants dont 27 enfants sourds implantés, scolarisés au CEOP à Paris, et auprès de 8 enfants normo-entendants scolarisés à Chambœuf et de 23 enfants normo-entendants à l’école élémentaire de Gevrey en Côte d’Or. Les enfants sont âgés de 5 à 12 ans répartis en deux groupes distincts.

4.1.1.1. Le groupe expérimental

Le groupe expérimental est composé de 27 enfants sourds dont 14 garçons et 13 filles âgés de 5 à 12 ans. 17 enfants ont participé à l’expérimentation précédente. Tous présentent une surdité congénitale profonde. Les enfants sont répartis en primaire du CP au CM2. 12 enfants portent un implant cochléaire et une prothèse controlatérale, 15 sont bi-implantés. 20 enfants ont été implantés avant l’âge de 2 ans (implantation pré-linguale). Ils ont tous bénéficié d’une éducation auditive dès leur plus jeune âge dispensée par des orthophonistes. Les conditions restent identiques à la première expérimentation : les enfants ont donc suivi au moins un an des séances de musique hebdomadaire avec un professeur spécialisée pour enfants sourds et musicienne, pour les plus jeunes, et 5 ans pour les plus âgés. Pour rappel, le projet de cet établissement est bilingue.

4.1.1.2. Le groupe contrôle

Ce groupe est composé de 31 enfants Normaux-entendants (16 garçons et 15 filles), âgés de 6 à 12 ans, scolarisés en primaire du CP au CM2, mais cette fois-ci dans deux écoles différentes. A la discrétion des professeurs des écoles et en accord avec les programmes de l’éducation nationale, les enfants pouvaient bénéficier d’un temps musical de 45mn à 1h30 par semaine.

4.1.2. Matériel

L’expérience a été réalisée sur un ordinateur portable muni de haut parleurs de très bonne qualité au sein des deux établissements différents : au CEOP ainsi que dans les écoles élémentaires de Chambœuf et Gevrey. Les fichiers audio sont de qualité 44 100 Hz, 16 bit, extraits de CD commercialisés. Le programme est réalisé avec Max MSP tournant avec Max Runtime.

4.1.2.1. Matériel musical

Nous avons utilisé 24 extraits de musique classique instrumentale avec les mêmes textures que l’expérimentation précédente, à savoir des textures denses, pulsées, aérées et lisses, corrélées cette fois-ci à quatre émotions fondamentales : la colère, la gaieté, la peur et la sérénité. La durée de chaque extrait est d’environ 15 à 20 s, recouvrant la période de la Renaissance au début du XX^ème.

TEXTURE DENSE :

La colère :

Ludwig van Beethoven, Symphonie n° 6, « Pastorale », 4e mouvement, Wiener Philharmoniker dirigé par Simon Rattle.
Modeste Moussorgski, Les tableaux d’une exposition, Gnomus, orchestre de la Suisse Romande dirigé par Ernest Ansermet.
Richard Strauss, Tod und Verklärung, SWR Stuttgart Radio Symphony Orchestra dirigé par Sergiu Celibidache.

La gaieté :

Maurice Ravel, Rapsodie espagnole, Berliner Philharmoniker dirigé par Pierre Boulez.

Hector Berlioz, Symphonie Fantastique, 2e mouvement « un bal », le Sinfonieorchester des Bayerischen Rundfunks dirigé par Mariss Jansons.
Ludwig van Beethoven, Symphonie n°4, 4e mouvement, Wiener Philharmoniker dirigé par Simon Rattle.

TEXTURE PULSÉE:

La colère :

Franz Liszt, Totentaz, Nelson Freire au piano, Dresdener philharmoniker dirigé par Nelson Freire.
Igor Stravinski, le Sacre du Printemps, Premier tableau : L’Adoration de la terre : Jeux des cités rivales, The Cleveland Orchestra dirigé par Pierre Boulez.
Sergueï Prokofiev, Suite Scythe, City of Birmingham Symphony Orchestra dirigé par Simon Rattle.

La gaieté :

Jean-Sébastien Bach, Concerto Brandebourgeois n°5, 1er mouvement Allegro, dirigé par Gustav Leonhardt.
Rodrigo Martinez, Villancio Foli, Hesperion XX dirigé par Jordi Savall.

Ludwig van Beethoven, Octuor à vents en mib majeur op.103, Quintette de l’orchestre Philharmonique de Berlin.

TEXTURE AÉRÉE :

La sérénité :

Wolfgang Amadeus Mozart, Quintette pour piano et vents k.452, Largo, Brian Pollard (basson), George Pieterson (clarinette), Vicente Zarzo (cor), Han de Vries (hautbois), Radu Lupu (piano).
Franz Liszt, Concerto pour piano n°1, 2e mouvement Quasi Adagio, Martha Argerich (piano), London Symphony Orchestra, dirigé par Claudio Abbado.
Robert Schumann, Kreisleriana, op.16, Wilhelm Kempff (piano).

La tristesse :

Béla Bartók, Musique pour cordes percussions et célesta, 3e mouvement, Chicago Symphony Orchestra dirigé par James Levine.
François Couperin, Pièces de viole avec la basse chiffrée (1728), Suite n°1, Mikko Perkola (viole de gambe), Aapo Häkkinen (harpe), Prélude.
Wolfgang Amadeus Mozart, Concerto pour piano et orchestre n°23 en La Majeur K. 488, Adagio, Clara Haskil (piano), Wiener Symphoniker dirigé par Paul Sacher.

TEXTURE LISSE :

La sérénité :

Alexandre Borodine, Dans les steppes de l’Asie centrale, USSR Symphony Orchestra dirigé par Sveltanov,
Claude Debussy, Prélude à l’après-midi d’un faune, South West German Sinfonieorchester vf Baden-Baden und Freiburg dirigé par Sylvain Cambreling,.
Richard Wagner, Parsifal, Acte 3 final, Berliner Philharmoniker dirigé par Herbert von Karajan.

La tristesse :

Gustav Malher, Symphonie n°5, Adagietto, Berliner Philharminiker dirigé par Herbert von Karajan.
Richard Wagner, Tristan et Isolde, Prélude, Wiener Philharmoniker dirigé par Georg Solti.
John Dowland, Go Crystal Tears, Concerto di Viole, Andreas Scholl (Contre ténor), Julian Behr (Luth).

La difficulté pour créer ce corpus musical a résidé dans le fait de réussir à corréler nos 4 textures avec chacune des émotions choisies : un extrait musical ayant une texture lisse corrélée à la

tristesse semble assez évident à faire correspondre, tandis que de trouver un extrait musical avec cette même texture pour exprimer la colère nous a véritablement posé problème. Après plusieurs tentatives infructueuses nous avons pris la décision de partir plutôt des émotions en associant des textures évidentes qui émaneraient naturellement du caractère émotionnel des pièces sélectionnées.

Ainsi, la colère suggère plutôt des extraits musicaux avec une texture dense ou pulsée tout comme la gaieté, deux émotions ayant une dynamique positive ; tandis que la sérénité et la tristesse, ayant une dynamique négative, seront plutôt corrélées avec des textures lisses et aérées.

Pour pallier à cette contrainte, nous avons essayé dans la mesure du possible de varier les ensembles instrumentaux au sein de chaque émotion et texture : par exemple, la sérénité avec une texture aérée sera tout autant représentée par un grand orchestre chez Liszt, un quintette pour piano et vents chez Mozart et un instrument seul (le piano) chez Schumann.

Nous espérons que nos résultats ne seront pas trop influencés par ces contraintes.

Voici un tableau récapitulatif des extraits musicaux choisis pour cette expérimentation :


1	AS	Liszt : Concerto pour piano n° 1, 2^e mouvement Quasi adagio, Martha Argerich, piano, London Symphony Orchestra, dir. C. Abbado (à 0’36),
2	AS	Mozart : Quintette pour piano et vents K. 452, 1^er mouvement, Largo, Brian Pollard (basson), George Pieterson (clarinette), Vicente Zarzo (cor), Han de Vries (hautbois), Radu Lupu (piano), (à 0.00)
3	AS	Schumann : Kreisleriana op. 16, n° 6, Wilhelm Kempff
4	AT	Bartók : Musique pour cordes, percussion et célesta, 3^e mouvement, Chicago Symphony Orchestra, James Levine
5	AT	Couperin : Pièces de violes avec la basse chiffrée (1728), Suite n° 1, Prélude, Mikko Perkola (viola da gamba), Aapo Häkkinen (harpsichord),
6	AT	Mozart : Concerto pour piano et orchestre n°23, adagio, Clara Haskil (piano), Paul Sacher (dir.),Wiener Symphoniker
7	DC	Beethoven : Symphonie n° 6, 4^e mouvement, Simon Rattle (dir.), Wiener Philharmoniker
8	DC	Moussorgski : Tableaux d’une exposition, Gnomus, Orchestre de la

		Suisse Romande, (dir.) Ernest Ansermet (à 3’15)
9	DC	Strauss : Mort et transfiguration (à 7’), Sergiu Celibidache (dir.) SWR Stuttgart Radio Symphony Orchestra
10	DG	Beethoven : Symphonie n° 4, 4e mouvement, Wiener Philharmoniker, dir. Rattle
11	DG	Berlioz : Symphonie fantastique, 2e mouvement Un bal, Symphonieorchester des Bayerischen Rundfunks, dir. Mariss Jansons (à 5’)
12	DG	Ravel : Rapsodie espagnole, Berliner Philharmoniker, dir. Boulez (à 5’20)
13	LS	Borodine : Dans les steppes de l’Asie centrale, USRR Symphony Orchestra, E. Svetlanov (début)
14	LS	Debussy : Prélude à l’après-midi d’un faune, SWR Sinfonieorchester Baden-Baden und Freiburg, dir. S. Cambreling (début)
15	LS	Wagner : Parsifal, Acte 3 final, Berliner Philharmoniker, dir Karajan
16	LT	Dowland : Go Crystal Tears, Concerto di Viole, Julian Behr (Luth), Andreas Scholl contreténor (début)
17	LT	Mahler : Symphonie n° 5, adagietto, Berliner Philharmoniker, dir. Karajan (à 2’32)
18	LT	Wagner : Tristan et Ysolde, Prélude, Wiener Philharmoniker, dir. G. Solti (début)
19	PC	Liszt : Totentanz, Nelson Freire, piano, Dresdener philharmoniker (début)
20	PC	Prokofiev : Suite Scythe, City of Birmingham Symphony Orchestra, dir. S. Rattle
21	PC	Stravinski : Le sacre du printemps, Jeux des cités rivales, The Cleveland Orchestra, dir. P. Boulez
22	PG	Bach : Concerto brandebourgeois n° 5, 1^er mouvement allegro, dir. G. Leonhardt, (début)
23	PG	Beethoven : Octuor à vents en mib majeur op. 103, Quintette de l’orchestre Philharmonique de Berlin,
24	PG	Rodrigo Martinez : Villancio Foli, Hesperion XX, dir. J. Savall

Tableau 3 : Liste des œuvres,
A = aéré, D = dense, L = lisse, P = pulsé, S = serein, T = triste, G = gai, C = colérique.

4.1.3. Procédure

Nous avons présenté à l’ensemble des enfants cette nouvelle expérimentation de la même manière que l’expérimentation précédente : une lecture de la tâche à réaliser (ce que vous pouvez lire à droite de la capture d’écran ci-dessous) avec explication complémentaire si nécessaire. La procédure étant identique à l’expérimentation précédente, il ne nous apparaît pas nécessaire de la détailler à nouveau ici. Par contre, il est important de souligner qu’à la différence de la première expérimentation, l’écran de démarrage n’est pas divisé en quatre parties.

Figure 120 : Capture d’écran d’une passation finalisée avec un enfant avec l’explication donnée oralement accompagnée ou pas de LPC (Langage Parlé Complété) ou proposée en Langue des Signes Française (L.S.F.).

Ainsi, les sujets devaient classer les 24 extraits musicaux entendus en fonction des émotions qu’ils véhiculaient.

4.2. Résultats

4.2.1. Le groupe expérimental

De prime abord, nous pouvons observer que les enfants IC obtiennent des résultats moins pertinents que pour le classement des textures. Cependant l’énergie, la dynamique, sont clairement identifiée car ils séparent d’un côté, les gais et les colériques, et de l’autre les tristes et les sereins à partir d’extraits de musique tonale, sauf pour le 21 PC (Le Jeu des Cités Rivales dans Le Sacre du Printemps de Stravinski) dont nous reparlerons après.

Figure 121 : MDS des enfants IC (à partir d’un algorithme de calcul des distances entre chaque pastille). L’axe 1 correspond à la dynamique/énergie positive (rythme, percussion, intensité forte et timbre clair) et l’axe 2 correspond à la valence positive (tempo vif, très rythmé, dynamique forte).

Par rapport au classement des émotions, ils séparent significativement les sereins et les tristes mis à part le 5 AT (Couperin) et le 13 LS (Borodine) qui sont très proches sur la MDS, alors que les gais et les colériques sont bien moins distingués. Ce qui est tout à fait remarquable sachant que pour le plus grand nombre, ce sont très souvent les extraits gais et colériques qui sont les mieux reconnus.

Sur l’axe horizontal (axe 1), Totentanz de Liszt (19 PC) a la dynamique la plus forte pour cette population, tandis que la Suite n°1 de Couperin (5 AT), la dynamique la plus faible. La perception de la texture semble être regroupée en deux grands groupes : d’une part les textures denses et pulsées et d’autre part les textures lisses et aérées, renvoyant aux limites de notre élaboration pour ce corpus.

Comme expliqué dans le matériel musical choisi, lorsque nous avons créé et choisi les extraits musicaux qui composent cette expérimentation, nous nous sommes retrouvés face à la difficulté de faire corréler nos quatre types de textures (dense, pulsée, aérée et lisse) à chacune des émotions sélectionnées (la sérénité, la gaieté, la colère et la tristesse). Trouver un extrait musical colérique ayant une texture lisse nous a plongé dans l’embarras de même qu’un extrait musical serein avec une texture pulsée. Au lieu de partir des textures pour construire notre matériel musical émotionnel, nous sommes plutôt parti des émotions engendrées par la musique pour faire correspondre nos textures. C’est pourquoi nous retrouvons dans ces résultats, la colère et la gaieté regroupées avec des textures denses et pulsées, la sérénité et la tristesse avec des textures lisses et aérées. Malgré les limites de ce matériel, ces résultats suggèrent chez ces enfants, une sensibilité particulière pour percevoir la texture et s’en servir afin de séparer en deux groupes distincts des extraits musicaux ayant des dynamiques opposées. Nous remarquons que deux pièces musicales sont isolées : la 11 DG (Le Bal de la Symphonie

Fantastique de Berlioz) et la 8 DC (Moussorgski : Tableaux d’une exposition, Gnomus). Le Bal, relié à la gaieté, est ici classé avec les colériques. Cela pourrait s’expliquer de par le caractère entrainant et endiablé de cette pièce qui pourrait prêter à confusion. Le crescendo crée une certaine tension dramatique également. Concernant la pièce de Moussorgski, le tempo est plutôt modéré avec une progression orchestrale en tension croissante conférant un caractère sombre, inquiétant et mystérieux. Tous les éléments semblent réunis pour susciter chez l’auditeur un sentiment de colère sourde mélangée à de la peur. Pourtant, cet extrait a été classé comme gaie. Le plus surprenant reste le classement du 21 PC (Le Jeu des Cités Rivales dans Le Sacre du Printemps de Stravinski), classé parmi les tristes. Comme cette pièce a la valence la plus négative, nous aurions un début d’explication par rapport à cette incongruité.

Par rapport à la valence (axe 2, vertical), le morceau ayant la valence la plus négative est un extrait du Sacre du Printemps de Stravinski (21 PC) alors que Kreisleriana de Schumann (3 AS) est le morceau classé avec la valence la plus positive.

Après une écoute approfondie des extraits tristes vs sereins, il nous est apparu intéressant d’étudier si les enfants sourds pourraient percevoir le mode, pour mieux expliquer leur classement. Cette réflexion a abouti à une vérification systématique des modes de tous les extraits proposés :

Mode Majeur	Mode mineur	Autres
1AS, 2AS, 3AS, 4AT, 8DC, 10DG,	5AT, 6AT, 7DC, 9DC, 16LT, 17LT,	14LS (chromatique), 18LT, 19PC
11DG, 12DG, 13LS, 15LS, 20PC,	21PC
22PG, 23PG, 24PG

De prime abord, nous pouvons remarquer que le classement des extraits tristes réalisé par cette population, en se focalisant sur le mode, est plutôt cohérent : 16LT, 6AT, 5AT (mode mineur), 18LT (ambigu) et 4AT (majeur). Nous tiendrons compte du 21PC (mode mineur) classé avec les extraits tristes. De plus, concernant les extraits sereins, leur classement est meilleur encore : 13LS, 15LS, 14LS (ambigu), 1AS, 2AS et 3AS (5 sur 6 en mode majeur).

Au vu de ces observations, nous avons utilisé pour mettre en évidence cela, la méthode de Bravais Pearson. Le coefficient de corrélation linéaire Bravais Pearson exprime l’intensité et le sens (positif ou négatif) de la relation linéaire entre deux variables quantitatives : on parle d’analyse de corrélation dans la littérature. Cet indice statistique assume des valeurs se situant dans l’intervalle qui va de – 1 à +1. « Une valeur égale à – 1 ou à +1 indique l’existence d’une relation linéaire parfaite (fonctionnelle) entre ces deux variables. L’intensité de la relation linéaire sera donc d’autant plus forte si la valeur du coefficient est proche de +1 ou de – 1, et d’autant plus faible si elle est proche de 0 ».⁵³¹

Le coefficient de corrélation de Bravais Pearson se calcule à partir de la formule suivante :

Dans notre étude, le coefficient de corrélation linéaire Bravais Pearson est égal à – 0,67 sur la dimension 2, ce qui est significatif à 0,001. Alors que nous obtenons le coefficient + 0,29 sur la dimension 1, ce qui n’est pas significatif. Cela met en valeur le fait que les enfants sourds entendent significativement le mode.

4.2.2. Le groupe contrôle

Figure 122 : MDS des enfants normo-entendants : l'axe 1 correspond ici à la valence et l'axe 2 à l'énergie. — Figure 122 : MDS des enfants normo-entendants : l’axe 1 correspond ici à la valence et l’axe 2 à l’énergie.

Les pièces orchestrales sont majoritairement classées avec une dynamique positive (forte) et les pièces avec solistes, ou en duo, ou de musique de chambre sont toutes classées en dynamique négative (faible). L’extrait Dans les steppes de l’Asie centrale de Borodine (13LS) présente une particularité, car il n’est pas représentatif d’une œuvre orchestrale puisque nous avons fait entendre juste le début, avec une longue pédale aux violons et le thème principal joué à la clarinette. C’est pourquoi, nous l’avons classé à deux endroits différents : d’une part, en solo/duo (correspondant à la réalité de notre extrait) et d’autre part, dans les œuvres orchestrales. Pareillement, le début du Prélude à l’après-midi d’un faune de Debussy présente les mêmes particularités : thème exposé aux flûtes. Nous avons classé ces deux œuvres dans la rubrique Solo/Duo pour signifier ce qui est entendu par l’auditeur, et leurs présences sont légitimes dans la rubrique orchestrale car ce sont bien évidemment deux œuvres écrites pour orchestre (entre parenthèses).

	Solo/Duo	Chambre	Orchestre
		4AT, 23PG, 24PG, 22PG	9DC, 19PC, 21PC, 8DC,
			7DC, 20PC, 12DG,
			10DG, 11DG
Dynamique –	16LT, 5AT, 6AT, 13LS,	2AS	(13LS), (14LS), 15LS,
	3AS, 14LS		1AS, 17LT, 18LT,

Nous remarquons une claire différenciation sur l’axe 1 de la MDS entre d’une part Colère/Gai et d’autre part Serein/Triste, ainsi que sur l’axe 2 entre Gai et Colérique. Par contre, la différence entre serein et triste semble confus, même si nous pouvons noter un meilleur regroupement des extraits tristes versus sereins. Quelques pièces musicales sont isolées : la 4AT (Musique pour cordes percussions et célesta de Bartók) est classée avec les colériques, certainement explicable du fait que ce soit un morceau classé parmi les plus tristes avec le 18 LT (le début du Prélude de Tristan et Yseult de Wagner) et ayant la dynamique la plus forte de tous les extraits tristes. La 12DG (Rapsodie espagnole de Ravel) se retrouve proche des colériques probablement de par le caractère du début de la pièce.

Les enfants normo-entendants classent ici bien mieux les extraits musicaux selon les émotions. La valence positive, gai et colérique est très claire. Les tristes et les sereins sont plus confus, ils sont moins reconnus.

En comparaison avec les enfants sourds implantés, le coefficient de corrélation linéaire Bravais Pearson chez les enfants normo-entendants sur l’axe de la valence avec le mode n’est pas significatif – 0,14. Par contre, ils entendent le mode corrélé avec la valence – 0,45, significatif à 0,05. La valence est meilleure chez les normo-entendants car certainement reliée à la structure tonale également.

5. Discussion générale

Au vu des excellents résultats des enfants sourds implantés versus enfants normo-entendants pour classer des textures, nous nous sommes évertués d’essayer d’expliquer ces résultats pour mieux les comprendre. De plus, dans notre deuxième expérimentation autour des émotions, nous avons mis en évidence le fait que ces mêmes enfants sourds implantés se montraient moins performants dans cette tâche par rapport aux enfants normo-entendants. Malgré cela, ils sont tout de même capables de reconnaître le mode (majeur ou mineur) de ces pièces de manière significative.

Les MDS obtenues sur les enfants sourds implantés et normo-entendants montrent systématiquement des avantages des enfants implantés sur les normo-entendants pour la classification des textures. Ce qui est paradoxale à priori, c’est que l’on obtienne le même type de résultats avec les adultes. Cela suggère que bien qu’implantés ces enfants entendent bien les dimensions acoustiques pertinentes des textures. A ce stade, il nous apparaît primordial d’analyser au plus près certaines caractéristiques du son, grâce aux descripteurs audio. Ils vont nous permettre de mettre en évidence des caractéristiques spécifiques du signal audio. Ils ont été développés dans le domaine Music Information Retrieval/Research (MIR) sur la base de travaux sur le traitement de la parole et sur le timbre musical en psychoacoustique. Les descripteurs audio et leurs outils de visualisation sont de plus en plus utilisés en musicologie pour l’analyse de l’interprétation notamment⁵³², mais aussi pour celle des musiques électroacoustiques.⁵³³ En psychologie cognitive, ils sont également fort pertinents.⁵³⁴ Pour le musicologue Philippe Lalitte, « Ce sont des prédicteurs de la représentation psychologique sous-jacente à une dimension musicale (le timbre, la tonalité, la structure temporelle). »⁵³⁵ Les descripteurs audio commencent à être utilisé également dans le cas de musiques populaires enregistrées. Nous pouvons citer les travaux de Philippe Gonin autour de l’album Atom Heart Mother des Pink Floyd⁵³⁶ et de Philippe Lalitte⁵³⁷ avec une analyse de Heroes de David Bowie, afin de démontrer certaines réalités musicales. Il existe aujourd’hui un grand nombre de logiciel audio (CLAM ⁵³⁸, Marsyas⁵³⁹, Psysound 3 ⁵⁴⁰, Sonic Visualiser ⁵⁴¹, Eanalysis ⁵⁴²). Nous avions choisi Sonic Visualiser pour ce chapitre. Pour approfondir nos résultats obtenus dans notre première expérimentation, nous avons décidé d’utiliser également la MIR Toolbox.⁵⁴³ Les descripteurs audio sont fort nombreux, nous ne fournirons pas dans le cadre de ce travail une liste complète, ni une définition pour chacun d’eux. Pour cela, l’ouvrage d’Alexander Lerch, An Introduction to Audio Content Analysis nous semble pertinent et intéressant à consulter pour ces questions.⁵⁴⁴

Voici une liste non limitative proposée par Philippe Lalitte :

Figure 123 : Liste de certains descripteurs audio.⁵⁴⁵

En ce qui nous concerne, sur la figure 124 avec le cercle, nous avons choisi 16 descripteurs audio qui nous semblent les plus pertinents pour analyser la texture : le temps d’attaque du sonagramme (Attack Time), la pente d’attaque (Attack Slope), la fluctuation rythmique (Rhythm Fluctuation), le centroïde spectral (Spectral Centroïd), la brillance spectrale (Spectral Brightness), l’étalement spectral (largeur du spectre : Spectral Spread), la platitude spectrale (Spectral Flatness), le roulement spectral (Roll Off), l’irrégularité spectrale (Spectral Irregularity), le RMS (Root Mean Square : l’amplitude globale du son), la rugosité (Roughness), le ZCR (Zero Crossing Rate : le nombre de passage par seconde /descripteur du bruit dans le son), le flux spectral dans le temps (Spectral Flux), la clarté tonale (Key Clarity), l’HCDF (Harmonic Change Detection Function : la détection des changements de l’harmonie) et le Centroïde tonal (Chroma Centroïd : la fréquence qui ressort le plus).

Figure 124 : Analyse réalisée par les descripteurs audio choisis.

Voici un tableau récapitulatif fondé sur neuf catégories musicales proposé par Philippe Lalitte où nous retrouvons les descripteurs cités ci-dessus :

Tableau 4 : Classification des descripteurs audio.⁵⁴⁶

Les observations ci-dessous correspondent aux morceaux choisis dans notre première expérimentation où il s’agissait de classer les différentes textures. Nous avons fait une analyse factorielle discriminante qui permet de voir si nos variables ou nos descripteurs audio sont capables de catégoriser les observations (qui ressemblent à nos MDS).

Les variables en valeur positive qui expliquent le mieux le facteur 1 (axe horizontal) sont : l’irrégularité spectrale, le RMS (l’amplitude globale du son), la clarté tonale. En valeur négative, ce sera surtout la fluctuation rythmique qui ressort et dans une moindre mesure le HCDF (la détection des changements de l’harmonie).

Les variables en valeur positive qui expliquent le mieux le facteur 2 (axe vertical) sont : le flux spectral, la rugosité et dans une moindre mesure le RMS. En valeur négative, ce sera surtout la largeur du spectre et dans une moindre mesure le roulement spectral.

Ce qui suggère que les variables de timbre et d’intensité sont les plus significatives pour expliquer les regroupements des pièces dans l’analyse factorielle discriminante. On peut voir également que les pièces sont très bien regroupées en quatre groupes correspondant aux 4 textures choisies.

Figure 125 : Analyse factorielle discriminante avec le premier F1 (axe horizontal) F2 (axe vertical).

Sur l’axe 1, nous remarquons une opposition nette entre les textures denses et lisses d’une part et la texture aérée d’autre part. Cet écart se base sur les descripteurs audio d’intensité et de timbre et la fluctuation rythmique a permis de regrouper les textures aérées. Sur l’axe 2, nous observons une séparation claire entre la texture pulsée et les textures aérées et lisses. Ce sont surtout les descripteurs audio de timbre qui ont permis cette séparation. A titre d’exemple, les morceaux les plus représentatifs concernant la texture dense sont : Le lac de Murail (extrait n° 9), Konx Om Pax de Scelsi (extrait n° 11). Pour la texture lisse ce sera : Partiels de Grisey (extrait n° 14) et Le Lac de Murail (extrait n° 17). Concernant la texture aérée, Gruppen de Stockhausen (extrait n° 5), Chinese Opera d’Etvös (extrait n°1) et Schwankungen de Lachenmann (extrait n° 4) sont les plus pertinents. Pour la texture pulsée, Multiples de Boulez (extrait n° 19) et Le concerto de chambre de Ligeti (extrait n° 24) sont les plus représentatifs. Par rapport à ces descripteurs, il est tout à fait possible que les enfants sourds aient plus utilisé les descripteurs de timbre, d’intensité et de fluctuation rythmique qu’un descripteur comme la clarté tonale qui demande des capacités fines de discriminations de fréquences.

Tous ces résultats suggèrent que dans le signal audio, les enfants sourds implantés ont des éléments pertinents qui leur permettent d’effectuer cette classification de façon tout à fait exemplaire. Les extraits denses et aérés sont les mieux catégorisés avec un pourcentage d’explication de 60,37%.

En résumé, les catégories des descripteurs audio les plus significatives, dans cette tâche de classification de textures, sont : l’intensité, le timbre, la dissonance, l’harmonie et le timbre.

Concernant l’intensité, c’est le descripteur audio RMS (Root Mean Square : l’amplitude globale du son) qui ressort le plus nettement. Pour le timbre, le flux spectral dans le temps (Spectral Flux), l’irrégularité spectrale (Spectral Irregularity) et la propagation spectrale (Spectral spread) sont les plus représentés. Le descripteur audio le plus significatif pour la dissonance est la rugosité (Roughness), et pour l’harmonie, le HCDF (Harmonic Change Detection Function : la détection des changements de l’harmonie). Quant au rythme, la fluctuation rythmique (Rhythm Fluctuation) sera la plus significative.

Au sujet de notre expérimentation autour des émotions, nous avons voulu vérifier s’il pouvait exister des descripteurs audio significatifs afin de mieux comprendre les résultats obtenus. Pour ce faire, nous avons utilisé la MIR Toolbox, comme pour la première expérimentation.

De prime abord, nous avons essayé de trouver les descripteurs les plus pertinents afin d’expliquer les résultats de la bonne perception des modes (mineur/majeur) des enfants sourds implantés (groupe expérimental). L’analyse faite avec les descripteurs ci-dessous correspond aux morceaux choisis pour cette deuxième expérimentation.

Nous avons donc choisi 9 descripteurs audio qui pourraient mettre en évidence le mode des extraits choisis, ainsi que les descripteurs les plus significatifs en lien avec la première expérimentation (classification des textures) : le mode (Tonal mode), la clarté tonale (Tonal Key Clarity), le temps d’attaque (Rhythm Attack Time), le roulement spectral (Spectral Roll off), la brillance spectrale (Spectral Brightness), l’amplitude du son (Dynamics RMS), la détection des changements de l’harmonie tonale (Tonal HCDF), la rugosité (Spectral Roughness), le tempo (Rhythm Tempo).

Figure 126 : Analyse réalisée par les descripteurs audio de l’expérimentation n°2 (Texture/Émotion).

Ce qui est particulièrement intéressant, c’est de constater que les descripteurs audio reliés au mode (Tonal Mode et Key Clarity) sont principalement corrélés avec les extraits tristes et sereins. Ce sont précisément ces extraits qui nous ont permis de faire émerger la perception du mode chez les enfants de notre groupe expérimental (extraits n° 1AS, 2AS, 3AS, 6AT, 15LS, 16LT, 17LT, 18LT sur l’analyse factorielle ci-dessous). Les extraits 13LS et 14LS sont plutôt reliés au temps d’attaque et au roulement spectral.

Les extraits colériques et gais avec une dynamique positive sont logiquement corrélés avec des descripteurs d’intensité, de timbre et d’harmonie.

Dans un second temps, nous avons réalisé une nouvelle analyse factorielle discriminante où nous avons seulement gardé 4 descripteurs qui nous semblaient les plus pertinents pour cette étude. Les descripteurs utilisés correspondent au tempo, au mode, à la dynamique et à la rugosité des 24 extraits musicaux choisis.

Le mode ressort significativement dans cette analyse, tout comme la rugosité. Les observations ci-dessous correspondent aux morceaux choisis dans notre deuxième expérimentation où il s’agissait de classer des extraits musicaux en fonction des émotions.

Les variables en valeur positive qui expliquent le mieux le facteur 1 (axe horizontale) sont : la rugosité et la dynamique, et dans une moindre mesure le tempo. En valeur négative, ce sera principalement le mode. La principale variable en valeur positive qui explique le mieux le facteur 2 (axe verticale) correspond au mode.

Figure 127 : Analyse réalisée par les descripteurs audio choisis.

Ce qui suggère que les variables de mode, de dynamique et de rugosité sont les plus significatifs pour expliquer les regroupements des pièces dans l’analyse factorielle discriminante ci-après.

Figure 128 : Analyse factorielle discriminante de l’expérimentation n°2.

Nous pouvons déjà remarquer une nette séparation entre les extraits colériques et gais. En effet, les extraits correspondants à la colère présentent une dynamique forte et une rugosité marquée. Les enfants normo-entendants ont fort bien fait cette distinction, certainement grâce à la perception de ces variables. Jeux des cités rivales dans Le sacre du printemps de Stravinski (21PC) correspond à l’extrait le plus significatif. Pour la gaieté, Le bal dans la Symphonie Fantastique de Berlioz (11DG) ressort grâce au variable de mode.

Sur l’axe de facteur 1 (horizontale), nous discernons une opposition franche entre les extraits colériques et tristes d’une part, et colériques vs sereins d’autre part. Cet écart se base sur les descripteurs audio de rugosité et de dynamique. Les tristes et les sereins seraient mieux classés par les enfants sourds implantés grâce à leur perception du mode notamment, en lien direct avec nos résultats obtenus avec la méthode de Bravais Pearson. De plus, les extraits sereins et tristes semblent confus, comme ce que l’on a pu constater chez les enfants de notre groupe contrôle.

Sur l’axe de facteur 2 (vertical), la gaieté est opposée à la sérénité et à la tristesse de manière complexe. Le Concerto pour piano et orchestre de Mozart (6AT) correspond à l’extrait le plus significativement triste dans cette analyse. Le plus serein serait le Final de l’acte III de Parsifal de Wagner.

En conclusion, il apparaît que l’utilisation des descripteurs audio s’est avérée très précieuse, car ce type d’analyse nous a apporté des débuts de réponses au sein des deux expérimentations que nous avons mené auprès des enfants sourds et entendants.

Dans la première expérimentation, l’analyse des résultats a montré que dans le signal audio, les enfants sourds implantés étaient capables d’extraire des éléments significatifs leur permettant de classer des textures de façon tout à fait remarquable. Pour rappel, les extraits denses et aérés ont été les mieux catégorisés. Les catégories des descripteurs audio les plus significatives, dans cette tâche de classification de textures, se sont révélées correspondre à : l’intensité, le timbre, la dissonance, l’harmonie et le timbre. Pour les normo-entendants, enfants comme adultes, la tâche s’est révélée plus difficile. Il semblerait que les enfants aient réalisé leur regroupement en se servant principalement de la brillance du timbre et de la dissonance, grâce au flux spectral (Spectral Flux) dans le temps et à la rugosité (Roughness), notamment. Pour les adultes et les enfants, nous avons pu observer que les extraits correspondants à la texture dense ont été les mieux perçus par les deux groupes de participants. En revanche, les adultes musiciens ont eu de meilleurs résultats. Nous pouvons supposer qu’ils aient utilisé les mêmes catégories de descripteurs audio que les enfants sourds pour cette tâche.

Concernant la deuxième expérimentation autour des émotions, nous avons pu mettre en évidence que les enfants normo-entendants réussissaient un classement beaucoup plus cohérent des extraits musicaux selon les émotions. La valence positive, gai et colérique a émergé très clairement. En revanche, les extraits tristes et sereins ont été moins bien reconnus. Le coefficient de corrélation linéaire Bravais Pearson a mis en évidence qu’ils entendent le mode corrélé avec la valence – 0,45, significatif à 0,05. Alors que chez les enfants sourds, ce sont les extraits tristes et sereins qui sont remarquablement classés. Le coefficient de corrélation linéaire Bravais Pearson a mis en valeur le fait que les enfants sourds entendent significativement le mode.

La perception de la texture semble avoir un impact sur l’analyse auditive réalisée par les enfants sourds implantés. Ces résultats nous permettent de commencer à évaluer la cognition musicale de ces enfants et nous éclaire sur les processus musicaux mis en œuvre par ces derniers. Il nous apparaît important de compléter cette réflexion en s’intéressant aux différentes pédagogies qui seraient susceptibles de nous aider à enseigner la texture.

Chapitre 6 : Les outils d’apprentissages des méthodes actives musicales

Un apprentissage spécifique s’avère nécessaire pour développer les capacités musicales des enfants sourds et les sensibiliser à la musique et plus particulièrement à la texture. Dans cette optique, différentes méthodes empiriques ont été crées. Nous présentons dans ce chapitre les méthodes qui ont inspiré notre outil pédagogique musical. Le système tonal occidental, par ses lois organisationnelles, permet de diriger les attentes perceptives.⁵⁴⁷ Nous savons que les connaissances des régularités structurelles musicales s’acquièrent de façon implicite chez l’enfant normo-entendant et nous avons postulé qu’elles s’acquièrent de la même façon chez l’enfant sourd. Néanmoins, même si le processus d’acquisition des connaissances musicales pour un enfant sourd est le même qu’un enfant entendant, il aura plus de difficultés, notamment pour la perception des hauteurs.

Par contre, au regard des résultats exposés précédemment, la perception de la texture chez ces enfants suggère que l’utilisation du mouvement à travers le corps tout entier, leur apporte des informations suffisamment pertinentes pour mieux se l’approprier. C’est pourquoi, nous renforcerons cet apprentissage par des activités sensori-motrices, déjà significatives pour un enfant normo-entendant mais cruciales chez l’enfant sourd, mettant en jeu par l’action, les perceptions proprioceptives, auditives et kinesthésiques.

1. Méthodes d’apprentissage musical

Deux grands pédagogues, Francès (1958)⁵⁴⁸ et Zenatti (1994)⁵⁴⁹, issus du courant socio-constructiviste, ont étudié la psychologie du développement musical chez l’enfant. Francès démontre que l’environnement dans lequel baigne l’enfant le contraint à apprendre la langue et la musique qu’il entend quotidiennement. De même que l’enfant apprend par la voix de sa mère, les syllabes, les mots et les phrases, de même, il apprendra les éléments du langage musical telles les unités (cellules rythmiques, intervalles, échelles mélodiques), l’organisation linéaire (formes simples) et simultanée (accords et cadences) et enfin les phrases. Selon ces deux auteurs, l’apprentissage de chanson et le chant lui-même contribuent à créer ces habitudes perceptives et à ancrer des structures tonales internes chez l’enfant. Il faut donc d’abord percevoir le son pour le produire (l’écoute active), mais on n’a pas vraiment perçu un son de parole tant qu’on ne l’a pas produit soi-même.

« Zenatti reprenant les travaux de Piaget propose une genèse de l’intelligence musicale. Elle suggère une construction progressive en différents stades dans lesquels il y aurait une communication réciproque entre activités perceptives et sensori-motrices permettant ainsi de mettre en lien différents éléments musicaux comme l’intervalle, le système tonal, la structure mélodique et rythmique d’une œuvre. »⁵⁵⁰ Selon cette psychologue, un premier stade s’observerait lors de l’acquisition du sens de l’intervalle : l’enfant reconnaît une mélodie (chanson) et lorsqu’il devient capable de la chanter, c’est qu’il possède l’image mentale de cette chanson. Ainsi, le fait de chanter, comme l’affirme Zenatti engendre une image sonore et cette dernière contrôlera l’image motrice.⁵⁵¹ Elle parvient à résumer l’influence déterminante de l’éducation musicale sur le développement perceptif de l’enfant :

L’éducation musicale est susceptible d’exercer une action primordiale dans le développement musical de l’enfant, depuis les âges de la crèche et de l’école maternelle jusqu’à l’adolescence…des virtualités comportementales s’atrophient lorsqu’elles ne sont pas stimulées…L’enfant sélectionne les informations qui retiennent son attention. Cette attention sélective joue un rôle capital dans le développement cognitif. Savoir susciter l’intérêt est essentiel sur le plan pédagogique, afin de favoriser l’avènement d’une familiarité avec des structures musicales diverses, variant selon la date et le lieu de composition des œuvres. Il ne s’agit pas seulement d’élargir le domaine des connaissances mais, avec des bases cognitives de permettre une formation et une évolution des goûts musicaux, enrichissant ainsi la vie affective.⁵⁵²

Il convient également de rappeler l’ouvrage d’André Giordan, qui constitue une synthèse des différentes études pour fonder une théorie sur le cheminement de l’apprendre.⁵⁵³ L’adaptation au milieu y est énoncée, de manière à trouver des moyens plus efficaces pour répondre à la diversité des problèmes posés. Le rapport qui unit les éléments organisés aux éléments du milieu est une relation d’assimilation : l’organisme conserve le cycle d’organisation et coordonne les données du milieu de manière à les incorporer à ce cycle. C’est ce que Piaget appelle « mouvements circulaires primaires »⁵⁵⁴. Si l’une d’entre elles varie, le milieu est transformé : l’organisme s’adapte. Le cycle organisé se modifie : il devient un nouveau cycle d’éléments organisés qui pourra donner lieu à de nouvelles assimilations. Il s’agit alors d’une accommodation. François Delalande, se référant aux travaux de Piaget, énonce trois aspects fondamentaux de la pratique musicale⁵⁵⁵ :

Le jeu sensori-moteur, qui correspond au jeu d’exercice. Il a une fonction d’adaptation. Le toucher de l’instrument, le contrôle de la sonorité représente une fusion entre la sensation et la motricité.
Le jeu symbolique, qui mime le réel. L’organisation sonore peut correspondre à un mouvement rencontré dans le vécu, à une situation vécue ou encore à une émotion. Tout jeu renvoie symboliquement à une situation qui est de l’ordre des images ou des affects ; on convoque alors un système particulier de codes, propre à soi, en référence avec son vécu.
Le jeu de règles qui peut être perçu comme un plaisir dans l’application du système musical.

Delalande dédie tout un chapitre (III) de La musique est un jeu d’enfant (1984) à l’idée de la musique comme « art du geste », un art dans lequel l’expérience et l’expression de la gestuelle du corps déterminent la gestuelle des sons, de leur organisation, interprétation et perception. Il fait souvent référence à la théorie de Francès (1958), selon lequel nos gestes seraient l’expression de nos émotions et ils seraient inscrits dans la musique. Depuis déjà un demi-siècle, il a été bien démontré l’importance du mouvement dans le développement psychologique de l’enfant : que ce soit chez Henri Wallon et Jean Piaget⁵⁵⁶, un mouvement qui sert au jeune enfant (entre 1 et 2 ans, ce que Wallon appelle stade projectif)⁵⁵⁷ pour projeter à l’extérieur de soi ses représentations mentales. « D’une manière générale, le jeu instrumental réalise cette liaison sensori-motrice dans laquelle la musique est perçue à la fois comme geste et comme son. »⁵⁵⁸

Kémâl Afsin nous rappelle ces faits historiques importants :

Lorsqu’en 1888 Henri Marion prononçait son discours sur l’école active à la Sorbonne, il n’imaginait pas que, dans la première moitié du 20ème siècle, la quintessence de ses propos allait se propager et stimuler la réflexion de musiciens pédagogues tels que Jaques-Dalcroze en 1920, Orff en 1956, Willems en 1977, Martenot en 1967 et Kodály. À cette époque, les neurosciences et la neuropsychologie musicale n’avaient pas la portée qu’elles ont aujourd’hui. Ainsi, ces pédagogues nourrissaient leur réflexion de procédés purement empiriques pour élaborer les méthodes dites actives. L’école active trouvait donc son expression dans les méthodes dites actives. Chacun de ces pionniers de la pédagogie musicale proposait des démarches sensiblement différentes avec cependant les mêmes objectifs : maîtrise de l’écriture, de la lecture ainsi que de tous les éléments de la cognition musicale (rythmes, intervalles, mélodies, harmonies, formes).⁵⁵⁹

Quoique différentes à première vue, ces méthodes présentent des étapes d’apprentissage comparables. Elles préconisent une pratique globale et vivante en plaçant l’expérience au premier rang de la démarche d’apprentissage puisque les éléments musicaux sont expérimentés par le mouvement du corps. Aussi, elles prônent une progression pédagogique adaptée aux différents stades de développement psychologique et moteur de l’enfant pour ainsi assurer l’acquisition du langage musical. Par la suite, elles intègrent l’analyse et l’identification des composantes de la musique (rythme, mélodie, harmonie) après les avoir vécus corporellement puis vocalement. Enfin, elles permettent d’inculquer à l’enfant « l’audition intérieure » et « le chant intérieur », ces deux éléments constituant l’image sonore. Finalement, toutes ces approches sont reconnues pour exploiter le potentiel créatif, intellectuel, sensoriel et kinesthésique de la musique par l’entremise d’activités ludiques adaptées au développement de l’enfant (Anderson & Lawrence, 2007)⁵⁶⁰.

Partant de ces observations, nous trouvons tout à fait pertinent le principe d’association entre son et mouvement que proposent les méthodes actives. Loin d’être seulement un moyen de rendre ludiques les activités qui permettrait à l’enfant sourd de ne pas s’ennuyer, c’est d’un réel apprentissage de l’oreille et par l’oreille dont il s’agit : mettre en mouvement un geste, un son, qui puisse être senti comme pulsation, puis mis en musique pour garder « la cadence », aide à percevoir la régularité d’une action. C’est un travail sur la perception et donc une contribution au développement de l’oreille. C’est aussi ce qui se passe lorsqu’on essaie de jouer et de maintenir régulières des valeurs longues à un tempo lent : le corps a besoin d’effectuer une décomposition, en d’autres termes, de « remplir » par un geste, physique ou mental, l’espace entre chaque pulsation. Dans l’autre sens, marcher sur les appuis d’une pulsation, se mouvoir au rythme de ce qui est perçu, implique de pouvoir synchroniser son corps avec ce qu’on entend, donc de développer des capacités d’anticipation. C’est une manière de se servir de ce que perçoit l’oreille pour s’approprier physiquement la musique. Lors des différentes séances musicales que nous avons pu animer auprès des enfants sourds, nous avons pu constater les bénéfices de cette conception pédagogique de la musique. C’est un enseignement basé sur l’individu qui propose au lieu d’imposer, suggère au lieu de commander. Cela signifie, entre autres, que le rôle de la musique consiste à jeter un pont entre l’expérience et l’analyse, le corps et le cerveau, l’intuition et le savoir, l’expérience et la compréhension. La musique suscite le mouvement en invitant les enfants à réagir à ce qu’ils entendent. Elle inspire une qualité de mouvement selon ses nuances, ses rythmes, ses timbres, ses accents, ses phrases, ses harmonies, ses mélodies et ses silences. La musique impose ses vitesses, exige une adaptation à l’espace dont dispose l’enfant.

Le corps humain est un orchestre dans lequel divers instruments, muscles, nerfs, oreilles et yeux sont dirigés simultanément par deux chefs : l’âme et le cerveau. (Jacques-Dalcroze, 1948)⁵⁶¹

1.1. La méthode Orff

Le compositeur munichois Carl Orff (1895-1982) a eu une approche tout à fait singulière. D’une part, il a su utiliser le théâtre nouveau, inspiré du théâtre grec où se mêlent l’expression verbale, la prosodie, le rythme, le mouvement et la danse. D’autre part, en tant que pédagogue, il crée son Orff-Schulwerk (« travail scolaire Orff ») grâce à des collaborations étroites et fructueuses qu’il a mené pendant une vingtaine d’années au sein de son enseignement à l’Ecole de danse de Munich. La gymnaste et danseuse Dorothée Gunther (1896-1975), la musicienne et compositrice Gunild Keetman (1904-1990), la danseuse et chorégraphe Maja Lex (1906-1986) furent des pédagogues essentielles dans la création de cette optique nouvelle. L’approche pédagogique de Carl Orff s’inscrit dans le courant des recherches psychopédagogiques du début du siècle, avec Montessori, Decroly, Wallon puis Freinet, Piaget, etc., qui prônent une activité centrée sur le développement et la croissance de l’enfant et non sur son seul savoir. C’est donc l’enfant et sa personnalité qui sont au cœur des recherches pédagogiques de Carl Orff. Ce dernier considère que le contexte culturel est un élément important dans le développement des personnes et qu’il est indispensable d’en tenir compte et d’en exploiter les ressources. Par exemple, Orff s’intéresse et se sert énormément du folklore, appartenant au monde verbal et culturel. C’est une pédagogie musicale et corporelle basée sur l’évolution de l’enfant, comme une musique à vivre. Il prône cette éducation musicale qui permet de « découvrir et étendre son potentiel musical, gestuel et langagier ». Il a écrit de nombreuses musiques pour enfants en essayant de pénétrer l’essence des créations enfantines. « Partant du principe que l’enfant parcourt ontogénétiquement les mêmes étapes que l’humanité, il pense que la musique pour les enfants doit être au départ une musique élémentaire. »⁵⁶²

Carl Orff conçoit sa méthode en rapport avec le fonctionnement de l’individu dans la société : ce qui l’intéresse particulièrement c’est que chacun puisse participer à cette construction collective en même tant qu’il développe son potentiel. Cette démarche singulière s’adresse à tous sans exception, son but n’étant pas le résultat à atteindre, mais le processus d’apprentissage qui sous-tend la progression unique de chaque individu. A partir des années 1950, grâce à la création d’un Instrumentarium, des enfants handicapés ont pu accéder à cette méthode.

Orff emploie la notion « d’élémentarité » pour qualifier la musique qu’il utilise au sein de sa méthode. Comme cette musique n’utilise pas de schémas préétablis, chacun peut se l’approprier en fonction de ses possibilités personnelles.⁵⁶³ Ce dernier va utiliser ce qu’il nomme des « ressources de l’individu », qu’il va répertorier en quatre parties différentes : d’abord la voix, le langage (les cris et les onomatopées par exemple) et le chant dont il va se servir simplement, avec des mélodies élémentaires, des rythmes courts et facilement mémorisables. La répétition rythmique des syllabes d’une phrase amène à différencier les hauteurs du son. Au départ, Orff utilise deux sons (une tierce mineure descendante), puis peu à peu il arrive à une gamme pentatonique sur laquelle il travaille longtemps afin que l’enfant puisse développer le plus son imagination, en s’éloignant des modèles harmoniques de la musique non pentatonique. Il considère que cette gamme favorise l’improvisation des enfants car elle ne crée pas de dissonances. Une grande partie du travail est faite à partir de textes comme des comptines ou des poésies. Carl Orff les décortique rythmiquement puis introduit des éléments mélodiques pour arriver à faire des montages d’une extrême complexité.⁵⁶⁴

Bien évidemment, l’utilisation du corps tout entier, le schéma corporel, la danse folklorique, la percussion corporelle qu’il va privilégier en la qualifiant de premier instrument de la « musique élémentaire », sont tout à fait essentiels dans sa démarche pédagogique. Ensuite, le rythme va mettre en relation le mouvement, le langage et la musique. C’est aussi un élément primordial de sa musique « élémentaire ».

Enfin, l’Instrumentarium, qui malgré le fait que l’utilisation d’instruments ne soit pas essentielle dans sa démarche, permet d’élargir le champ d’expérimentation. Il se compose d’instruments mélodiques, carillons, xylophones, métallophones et de percussions variées de hauteur indéterminée, de plus petite taille que les instruments d’orchestre. C’est un instrumentarium fort riche, provenant de cultures du monde entier (africaine, sud-américaine, asiatique…). L’improvisation tient dans ce travail un rôle constant, soit que l’enfant réponde au meneur de jeu, soit qu’il prenne une place plus autonome dans un ensemble rythmique, improvise, ou même qu’il soit amené à diriger cet ensemble.

Le rythme demeure le principe fondamental de sa méthode. Chaque être humain possède en lui des instruments propres à scander le rythme : ses mains et ses pieds. Orff utilisera quatre niveaux corporels : les doigts, les mains, les cuisses et les pieds. En effet, les frappements peuvent s’effectuer selon diverses variantes sonores : frappés de mains, plante, talon ou pointe du pied ; claquement de doigts (médius glissant d’un geste rapide contre le pouce). Par exemple, le fait de frapper à mains plates sur les cuisses constitue une excellente préparation à la technique des timbales et des instruments à lames. Les principaux « jeux de rythmes » sont l’imitation, la mémorisation, le canon, le jeu des « questions-réponses ». Dans la pratique de ces exercices, le rythme n’est pas intellectualisé mais seulement ressenti et réalisé avec tout le corps (ou sur les instruments). Prenons l’exemple des vitamines rythmiques, aussi nommées percussions corporelles (Comeau, 1995)⁵⁶⁵. Elles stimulent énormément la mémoire auditive de l’enfant. Ces vitamines rythmiques peuvent servir d’amorce à plusieurs apprentissages, dont l’exploitation des comptines notamment.⁵⁶⁶

1.2. Chez Zoltán Kodály

Le compositeur hongrois, très reconnu pour son remarquable travail de recherche sur le folklore hongrois aux côtés de Bartók, a créé une méthode utilisant ces chansons populaires que tous les enfants connaissent depuis leur plus jeune âge. En Hongrie, la musique folklorique fait partie de la vie de chacun. Kodály soutenait que le chant populaire est la langue maternelle musicale naturelle de l’enfant et qu’il faut l’apprendre dès le plus jeune âge, comme on apprend à parler.

Tout d’abord, il serait intéressant d’examiner les sources et l’histoire de l’éducation musicale pour comprendre pleinement, comment les principes de Kodály furent établis. Puisque l’on considère la solmisation relative comme l’une des bases fondamentales de cette méthode, c’est donc l’œuvre du moine toscan Guido d’Arezzo (v. 990 – v. 1050) qu’il faut mentionner en premier lieu.

Il s’est servi des premières syllabes d’un hymne à Saint-Jean-Baptiste (la dernière note si est une contraction des deux initiales de Sancte Johannes) : UT queant laxis REsonare fibris MIra gestorum FAmili tuorum, SOLve polluti LAbii reatum, Sancte Iohannes.

Figure 130 : Manuscrit avec notation messine, Laon, X^ème siècle.

A chaque vers, le chant monte d’un ton. D’Arezzo eu donc l’idée de conserver la première syllabe du premier mot de chaque vers. En 1673, le ut devient do sous l’impulsion de Bononcini car plus facile à solfier. Concernant le si, même si Sancte Joannes la suggère déjà, cette note fera son apparition officielle à la fin du XVIème siècle, ajoutée à la gamme par le moine français Anselme de Flandres.

Même si cela ne paraît pas si naturel lorsque l’on ne connaît pas la chanson, il faut reconnaître que cette idée de mémorisation est astucieuse puisqu’elle permet de retrouver le nom et la hauteur de la note en se référant à une chanson connue. Le système de Guido d’Arezzo fut adoptée par les autres pays latins dans la seconde moitié du Moyen Age. Dans les pays germaniques et anglo-saxons, on lui préféra la notation par les lettres (A à G). La première notation est conservée par Kodály dans le premier apprentissage de la musique. Ainsi, lorsqu’il a mis au point sa pédagogie en Hongrie dans les années cinquante, la solmisation relative sera utilisée dans le but d’éduquer l’oreille des enfants à travers le chant. Ici, les différents degrés de l’échelle sont chantés avec les noms de syllabes correspondantes, quelle que soit leur hauteur absolue. Une gamme majeure sera ainsi toujours chantée do-ré-mi-fa-sol-la-si-do, quelle que soit la hauteur de sa tonique absolue. De cette façon, chaque note a sa fonction et est chantée en relation à une autre note. Les intervalles deviennent les formules que les enfants reproduisent sans problème. Pour faciliter l’intonation, Kodály utilise la phonomimie, une manière de visualiser les hauteurs de notes chantées en les assimilant à un geste de la main. Il fut sensibilisé pour la première fois à cette technique en visitant l’Angleterre, où un système à échelle mobile créé par John Curwen était utilisé dans tout le pays au sein des formations chorales. Kodály a trouvé que l’échelle mobile développait le sens modal des élèves et par là leur capacité à lire la musique. Par ailleurs, il pensait que l’échelle mobile devrait précéder l’écriture sur une portée, en développant une sorte de sténographie musicale utilisant des rythmes simplifiés.⁵⁶⁷

Les signes de la main sont utilisés en tant qu’aide visuelle lors du chant. Cette technique assigne à chaque degré de l’échelle un signe qui montre la fonction tonale du degré. Par exemple, do, mi et sol sont d’apparence stable, tandis que fa et ti pointent respectivement dans la direction de mi et de do. De la même manière, le signe de main ré suggère le mouvement vers do, et celui de la vers celui de sol. Kodály ajouta aux signes de main de Curwen un mouvement ascendant/descendant, ce qui permet aux enfants de voir la hauteur de la note. Les signes sont réalisés devant le corps, do étant au niveau de la taille et la au niveau de l’œil. La distance dans l’espace correspond à la taille de l’intervalle représenté.

Figure 131: Dans la méthode Kodály, la phonomimie est régulièrement utilisée pour faciliter l'intonation. — Figure 131: Dans la méthode Kodály, la *phonomimie* est régulièrement utilisée pour faciliter l’intonation.

À partir du moment où l’enfant acquiert l’écriture et la lecture, cet apprentissage peut alors être complété par l’étude du solfège traditionnel. La pédagogie de Kodály se fonde sur un principe fondamental : tout apprentissage musical doit être acquis par l’oreille en premier, et non par l’intellect. Le chant et le travail d’audition doivent toujours précéder la notation, sinon la lecture et l’écriture musicale sont réduites à des exercices cérébraux, non significatifs. Ainsi, dans la création de la méthode de Kodály, la première étape a été d’introduire de nombreuses mélodies enfantines et chants populaires afin de choisir un matériau sonore adapté aux enfants. En Hongrie, les mélodies enfantines sont construites principalement sur deux éléments : la tierce mineure descendante sol-mi et le motif sol-la-sol-mi (la étant la broderie supérieure du sol). Cette méthode s’adresse tout d’abord aux enfants entre trois et six/sept ans. Pour Kodály, le chant est à la base de tout enseignement musical, avant même l’étude du langage verbal et littéraire. Il était persuadé que l’esprit de l’enfant pouvait acquérir au mieux les fondamentaux musicaux par des méthodes amusantes, avec l’aide de mouvements du corps et des jeux de rythmes. Il était aussi convaincu que l’étude d’un instrument devait être précédée par l’apprentissage ludique du chant dans le but de distinguer l’assimilation naturelle, intérieure et physique de la musique, du mécanisme et de l’apprentissage liés à la technique propre de l’instrument. C’est pourquoi Kodály a incorporé des syllabes rythmiques similaires à celles créées au XIX^ème siècle par le théoricien français Émile-Joseph Chêvé. Dans ce système, on associe à chaque valeur de notes des syllabes spécifiques qui expriment littéralement leur durée. Par exemple, une noire est dite « ta », tandis que deux croches sont dites « ti-ti ». « Deux croches-noire » se dit donc « titi-ta ». Ces syllabes sont utilisées pour reconnaître, chanter, frapper ou lire des rythmes.⁵⁶⁸

La méthode Kodály inclut également l’utilisation de mouvements rythmiques. Technique inspirée par le professeur suisse Émile Jacques Dalcroze dont nous reparlerons dans ce chapitre, Kodály connaissait bien les techniques de ce dernier et partageait l’idée que le mouvement est un outil important pour intérioriser un rythme. Ainsi, la méthode Kodály utilise des mouvements rythmiques comme la marche, la course, la marche rapide, taper des mains. Ils peuvent être exécutés lors de l’écoute ou du chant. Le professeur peut être amené à inventer sur des exercices de chant des mouvements rythmiques appropriés pour accompagner des chansons.⁵⁶⁹

Pour résumer, nous pouvons énumérer en dix grands principes (établis par Kodály lui-même) son enseignement et ses idées générales :

– Le rôle de la musique dans l’éducation devrait être aussi important qu’il l’était dans la Grèce Antique, et doit être au centre du système scolaire, parmi les « fondamentaux », au même titre que les mathématiques ou les arts du langage. Elle ne doit pas être considérée comme accessoire ou superflue puisqu’elle favorise l’acquisition des autres disciplines précitées qui lui sont intimement liées.

L’analphabétisme musical est l’obstacle principal à l’accès à la culture musicale.

L’enseignement de la musique doit être radicalement amélioré dans les écoles de formation des maîtres.
Il faut systématiquement éviter de faire écouter aux enfants de la « mauvaise » musique.

L’école doit donner accès à la musique, dès le plus jeune âge, pour tous.

Le chant doit devenir une pratique quotidienne et être enseigné aux enfants.

Le chant choral en particulier doit être développé, comme toute pratique collective.

Une éducation musicale digne de ce nom doit commencer entre l’âge de trois et six ans. Pour reprendre la boutade de Kodály, cet apprentissage devrait idéalement commencer « neuf mois avant la naissance de la mère ».
Les expériences capitales de la vie d’un enfant en musique se déroulent entre l’âge de six et seize ans, soit durant la période capitale de la scolarité.
L’écoute des chefs-d’œuvre de la musique doit être encouragée et suivie sur le long terme.⁵⁷⁰

Pour terminer ce point sur la méthode du compositeur, nous souhaiterions terminer avec ses mots : « La musique est une nourriture spirituelle irremplaçable. Celui qui ne s’en nourrit pas souffrira d’anémie toute sa vie. Sans musique la vie spirituelle n’est pas complète : l’esprit humain possède des régions que seule elle peut illuminer. »⁵⁷¹

1.3. La méthode Willems

D’origine belge, Edgar Willems (1890-1978) s’est inspiré des travaux de Dalcroze pour développer une méthode qui tienne compte des recherches sur la psychologie enfantine. Pour lui, l’éducation musicale doit favoriser l’épanouissement de l’enfant, enrichir l’être humain tout en s’adaptant aux besoins (physiques, affectifs, mentaux) de chacun. Cet enseignement de la musique suit les tendances de l’éducation moderne mettant en valeur la motricité, l’affectivité et la sensorialité. Il s’agit de solliciter le plaisir de la découverte et de l’écoute mutuelle. Willems considère que la musique est un langage et que son apprentissage suit les mêmes lois psychiques que l’éducation au langage (activités sensorielles, mémoire, activités affectives, activités mentales, activités inventives et activités créatrices). En cela, il insiste sur l’importance de l’initiation musicale dès le plus jeune âge, en étroite collaboration avec les parents, comme l’utilisation de mouvements pour le développement de l’instinct rythmique (bercements, petits sauts sur les genoux, etc.) qui permet d’acquérir et d’ancrer les éléments essentiels de la musique à travers l’expérimentation et la participation active. Pour Willems, l’initiation musicale précoce est une étape essentielle avant l’apprentissage du solfège et d’un instrument. L’enfant doit s’imprégner progressivement de l’environnement sonore qui l’entoure. Les jeux de reconnaissance auditive grâce à l’utilisation d’objets sonores variés et attrayants (comme par exemple les appeaux) permettent d’éveiller l’écoute et l’intérêt de l’enfant. S’en suit un travail rythmique (mouvements corporels, vivre et ressentir le rythme, marches pour développer le sens du tempo) et mélodique. Enfin, le chant tient une place très importante en tant qu’activité regroupant les aspects mélodique, rythmique et harmonique.

Il s’agit d’une méthode globale pour tout ce qui concerne la vie, et une méthode analytique pour la prise de conscience, qui exclut tout procédé extramusical et emploie des moyens qui vont du concret vers l’abstrait, c’est-à-dire de l’instinct à la conscience et à l’automatisme.⁵⁷²

Dans le tome II de son ouvrage l’oreille musicale,⁵⁷³ Edgar Willems consacre un chapitre entier à définir la bonne oreille. Il y distingue 3 types de fonctions auditives :

La sensibilité auditive (réception),

L’affectivité auditive (implique une sensation et une réaction),

L’intelligence auditive (compréhension).

Largement influencé par la philosophie empiriste, Edgar Willems recommandera l’utilisation de l’audiomètre comme moyen pédagogique du développement auditif de ses élèves. « L’audiomètre est un genre d’harmonium à clavier chromatique qui comporte jusqu’à des cinquantièmes et des centièmes de ton » (Willems, 1968).⁵⁷⁴ Le test de Seashore créé en 1919, une batterie de tests destinée à mesurer le talent musical appelé Measures of musical talent ⁵⁷⁵, permettra d’évaluer les différentes aptitudes musicales. Beaucoup plus tard, Gordon (2003)⁵⁷⁶ et Sloboda (1988)⁵⁷⁷ soutiendront également la même idée, à savoir qu’un test d’aptitude musicale est un outil d’enseignement.

On a souvent posé la question : « l’oreille musicale peut-elle être éduquée ? » Nous répondrons affirmativement … La vue aussi peut être améliorée, car le peintre apprend à voir de mieux en mieux les couleurs et les formes, et l’on a même inventé des méthodes qui ont fait leurs preuves, par lesquelles on supplée au port de lunettes par des exercices quotidiens. Donc, si les facultés et les sens humains se développent, pourquoi en serait-il autrement pour l’audition ? Mais si tel est le cas, direz-vous, pourquoi ne s’en est-on pas occupé plus tôt ? Nous en trouvons la raison, en partie, dans la complexité de la nature de la musique ainsi que dans le fait que peu de musiciens sont psychologues et peu de psychologues, musiciens.⁵⁷⁸

Selon le pédagogue et musicien Jacques Chapuis, « la conception willemsienne ne part pas de la matière, ni des instruments, mais de principes de vie reliant la musique et l’être humain, exaltant en tout premier lieu ce qui nous est à tous donné par la nature, au départ, soit notamment le mouvement et la voix. »⁵⁷⁹

L’initiation musicale est avant tout basée sur l’instinct rythmique des enfants et sur les développements de leurs capacités auditives. Elle comporte différents éléments de travail dont les principaux sont :

Un matériel auditif varié (surtout sensorielle et affective) : voix, flûte à coulisse, flûte à clavier, piano, sirène, carillon, xylophone, etc.,
Des frappés pour développer l’instinct rythmique,

Des chansons soigneusement choisies afin de développer la sensibilité,

Un vocabulaire de termes musicaux avec des mots simples et concrets pour l’enfant : un son, un intervalle, un accord, une mélodie, une chanson, un rythme etc.,
La gamme diatonique de sept sons, envisagée comme un ensemble d’intervalles à partir d’un son initial, la tonique. Elle forme une suite régulière de degrés,
Trois séries de symboles pour les sons : do, ré, mi etc. pour les noms des notes ; les chiffres romains pour les degrés de la gamme (I, II, III, etc.) et les chiffres arabes pour les intervalles (1er, 2e, 3e, etc.). L’écriture des valeurs rythmiques reste inchangée,
Le battement de mesure pratiqué de façon naturelle et méthodique,
Des marches caractéristiques ou des mouvements naturels, destinés à sentir le rythme physiologique et tout particulièrement, le sens du tempo.

Willems et Chapuis divisent cette initiation musicale en trois degrés pédagogique : la découverte sensorielle et auditive, la prise de conscience et l’introduction au graphisme, et enfin le stade pré-solfégique et pré-instrumental. A tous les niveaux, cette initiation doit largement faire place à l’improvisation rythmique et mélodique. Le solfège fait naturellement suite à cette initiation, dont il constitue en fait la quatrième étape, aboutissant à la maîtrise de la lecture et de l’écriture, c’est à dire à l’abstraction des phénomènes concrets.

Kémâl Afsin met en relation de manière tout à fait singulière les pédagogies de Maria Montessori et Edgar Willems en soulignant qu’ils jouent tous les deux sur ces pôles essentiels que sont le sensoriel, le mental et l’affectif. Ces trois pôles ne sont pas travaillés de manière séparée. Au contraire, ils se superposent et s’interpénètrent.⁵⁸⁰

Enfin la pratique instrumentale s’inspire des mêmes principes fondamentaux, avec une préférence pour l’apprentissage du piano. Pour Willems, il faut éviter un enseignement trop exclusivement instrumental qui privilégie l’aspect visuel et technique en le dissociant de l’aspect auditif et instinctif.

1.4. La méthode Maurice Martenot (1898-1980)

D’abord pianiste et violoncelliste, puis chef d’orchestre, Maurice Martenot servit de 1914 à 1918 dans les unités de transmissions. Sa fascination pour le son naîtra de cette période, car les postes utilisés pour les transmissions radio se servaient de lampes triodes. La pureté du son qui en ressortait impressionna grandement le musicien. Grand passionné de sciences, il souhaita dès lors inclure l’électricité dans l’instrumentation musicale de son temps. En 1919, il commença alors à faire ses recherches sur son futur instrument. « Les Ondes Martenot », qui figure parmi les toutes premières inventions de la musique électro acoustique, fut présenté dès 1928, à l’Opéra de Paris. Il se compose d’un clavier à sept octaves et d’un ruban qui, provoquant des oscillations électriques, crée des sons dont la richesse, le coloris, sont amplifiés par des haut-parleurs. La vibration répond aux moindres gestes de l’interprète, qui, de la main gauche, commande également, par des boutons, les changements de timbre et d’intensité. La première ondiste fut Geneviève Martenot, qui durant plus de 40 ans, présentera fidèlement l’invention de son frère à travers le monde. Jeanne Loriod deviendra l’élève et l’interprète privilégiée de Maurice Martenot. Elle créera un certain nombre d’œuvres de compositeurs de l’époque, dont celles d’Olivier Messiaen. Elle fondera également un quatuor, puis un sextuor d’ondes Martenot qui portera son nom. Succédant à son maître, Jeanne Loriod enseignera la technique de son instrument au Conservatoire National de Paris, à partir de 1970, ainsi qu’à la Schola Cantorum.

JOLIAT François, « La genèse et le développement de l’éducation musicale à l’école : entre l’enseignement de l’art et l’éducation par l’art en Suisse romande », in M. Mellouki & A. Akkari (Ed.), La recherche au service de la formation des enseignants, Actes de la recherche, Vol. 7, 2009, p. 195-217. — Figure 132: Les Ondes Martenot.

Concernant les fondements de sa pédagogie, il apparaît primordiale de se replonger dans le contexte socio-culturel de l’époque. François Joliat nous relate qu’au lendemain de la première guerre mondiale, « l’école française va élaborer un nouveau programme d’étude qui abandonnera l’accent mis sur le patriotisme, au profit d’une vision éducative basée sur le respect des besoins de l’enfant. »⁵⁸¹ Maurice Chevais (1880-1943) saura parfaitement intégrer cette réflexion dans ses ouvrages, prônant une « pédagogie active » de l’éducation musicale⁵⁸². Il utilise un nombre considérable de sources dans des domaines aussi divers que la littérature (Rousseau), la sociologie (Durkheim), la psychologie (Binet, Claparède, Decroly, Wallon, Piaget) et la pédagogie (Montessori, Dewey). Se basant sur les aptitudes auditives de l’enfant, par la passation de tests qu’il aura lui-même élaborés, Chevais élaborera une véritable didactique de l’éducation musicale.⁵⁸³ Elle passera par des exercices de pose de voix dont les notes de la gamme feront référence au corps par la « phonomimie » (précédemment énoncée dans notre chapitre sur la méthode Kodály) ou des exercices basés sur l’expression digitale de valeurs rythmiques appelée « dactylorythmie ».⁵⁸⁴ Désormais, les leçons de chant ne « mettront plus l’accent sur l’exposition et la décomposition de notions théoriques suivies de chants d’illustration »⁵⁸⁵, mais « articuleront le besoin d’activité de l’enfant avec la musique comme art du temps et du mouvement ».⁵⁸⁶

Maurice Martenot s’est largement inspiré des écrits de Chevais et de Willems dans la conception de sa pédagogie. Il s’intéressa tout particulièrement au problème de l’éducation musicale. Il mit au point avec ses sœurs, Madeleine et Ginette Martenot, une méthode d’enseignement qui, durant de longues années, mettrait en question les théories établies. La méthode Martenot développera une approche « psychopédagogique » de l’apprentissage musical. En enseignant la musique, Maurice Martenot s’est aperçu que la plupart de ses élèves instrumentistes manquaient de liberté dans leur geste, généré par des tensions intérieures plus profondes. Dès lors, la nécessité d’accorder d’abord « l’instrument humain », avant d’enseigner la musique lui est apparu comme une évidence. Après avoir expérimenté sur lui-même cette méthode de relaxation pendant plus de cinquante années de recherche, Maurice Martenot a proposé son cheminement basé sur des méthodes occidentales.⁵⁸⁷

L’importance de cette recherche autour de la relaxation active définit l’orientation de son travail : il ambitionne de devenir « Éducateur par l’Art ». « L’esprit avant la lettre, le cœur avant l’intellect », telle est la maxime qui se trouve en couverture des Principes fondamentaux.⁵⁸⁸ Pour Maurice Martenot, l’essentiel est que la musique parte d’une « pensée musicale » :

Il n’y a pas de musicien s’il n’y a pas de pensée musicale. C’est donc d’abord par le développement de cette faculté que passe tout apprentissage de la musique. Cette pensée musicale, qu’on peut aussi appeler chant intérieur, se développe par la mémorisation de mélodies dès le plus jeune âge. Elle se développe aussi par l’improvisation et la transposition spontanée. Derrière la pensée musicale, il y a tout simplement la vie. Le but de l’éducateur par l’art est de libérer, épanouir, respecter la vie, tout en inculquant les techniques. Il a pour mission de développer l’éveil, le sens de l’humain, le potentiel psychique, la stabilité continue d’attention, l’imagination créatrice et la maîtrise de soi.⁵⁸⁹

Les principes fondamentaux de cette éducation musicale peuvent être appliqués au dessin et à la danse aussi bien qu’au solfège et au piano. Basés sur les « trois temps Montessori » inspiré par la méthode d’Edouard Séguin⁵⁹⁰, à savoir l’imitation, la reconnaissance et la reproduction⁵⁹¹, ces principes se situent à l’opposé des méthodes traditionnelles en ce qu’ils explicitent le processus du passage du sensoriel à l’acquisition des connaissances.

1.5. La méthode Émile Jacques-Dalcroze

La rythmicienne et professeure Louise Mathieu, responsable du Groupe international de recherche sur la rythmique Jaques-Dalcroze (GIRRJD), nous présente ce dernier dans l’article Un regard actuel sur la rythmique Jacques-Dalcroze : ⁵⁹²

Né en 1865, mort en 1950, Émile Jaques-Dalcroze fut un homme aux multiples talents. Pianiste, compositeur, metteur en scène, il est considéré comme l’un des grands pédagogues du XXème siècle. Ses idées ont marqué plusieurs disciples artistiques. Précurseur de la danse moderne, il a également exercé une influence considérable sur le jeu scénique et la mise en scène moderne. En 1892, Jaques-Dalcroze est nommé professeur au Conservatoire de musique de Genève. C’est à cette époque qu’il se rend compte de la nécessité de réformer les programmes d’études et les méthodes d’enseignement de la musique qu’il considère trop fragmentés et trop intellectuels, déconnectés des sensations et des émotions de l’étudiant. Il s’appliquera donc à mettre au point une approche de la pédagogie musicale qui se fonde sur l’engagement de la personne toute entière et vise le développement harmonieux de l’ensemble de ses facultés. De là naîtra, avec le XXème siècle, la Rythmique Jaques-Dalcroze.⁵⁹³

Cette belle introduction nous permet de présenter à notre tour cette pédagogie que nous utilisons majoritairement auprès des enfants sourds avec lesquels nous travaillons quotidiennement. Nous nous sommes servis abondamment du très bel ouvrage de Marie Brice, Pédagogie de tous les possibles…⁵⁹⁴ et de celui de Marie-Laure Bachmann, un ouvrage de référence, La Rythmique Jaques-Dalcroze, une éducation par la musique et pour la musique.⁵⁹⁵

Marie-Laure Bachmann, directrice de l’Institut Jaques-Dalcroze de Genève de 1990 à 2006, a beaucoup œuvré pour que cette pédagogie dalcrozienne ait un plus grand rayonnement dans les diverses écoles européennes. Actuellement, il n’existe que trop peu de rythmicienne sur notre territoire. Il faudrait une vraie volonté politique pour repenser la place de l’éducation musicale au sein des écoles. Mais c’est un large débat qui n’est pas le propos véritable de ce chapitre.

Nous avons été particulièrement sensible à cette affirmation de Dalcroze, « On n’ écoute pas la musique uniquement avec les oreilles, on l’entend résonner dans le corps tout entier, dans le cerveau et dans le cœur ».⁵⁹⁶

Figure 133 : Photo de Valérie Aeschimann, Institut Jacques-Dalcroze, Genève.

En mettant l’accent sur ses propres sensations, le corps prend le rôle d’« oreille portative » en ressentant et en écoutant dans son intégralité.⁵⁹⁷ C’est ce qui nous a particulièrement intéressé dans cette approche pour l’enseignement auprès des enfants sourds. Marie-Laure Bachmann met d’ailleurs en avant que Dalcroze avait tout à fait l’intuition de la portée de sa méthode auprès d’un public élargi tel que les personnes en situation de handicap :

La diversité des domaines auquels touche la rythmique, le nombre des aptitudes qu’elle est à même de développer, en font un instrument particulièrement souple et économique pour qui entreprend d’aider un être en difficulté à découvrir-ou à redécouvrir- ses possibilités latentes. Très tôt, les élèves de Jacques-Dalcroze ont vu le parti qu’il y avait à tirer de la Rythmique dans le champ alors presque inexploré de l’éducation ou de la rééducation des handicapés sensoriels, mentaux et moteurs.⁵⁹⁸

D’après le pédagogue, la rythmique part de l’individu tel qu’il est et souhaite développer ses potentiels car « l’éducation ne consiste pas à créer chez l’élève des facultés qu’il n’a pas, mais bien plutôt à le mettre en mesure de tirer le plus grand parti possible des facultés qu’il a. »⁵⁹⁹ En voici les principaux fondements :

« Développer le sentiment musical (dans le sens grec du mot) dans l’organisme tout entier,

Créer le sentiment de l’ordre et de l’équilibre après avoir éveillé tous les instincts moteurs,

Développer les facultés imaginatives. »⁶⁰⁰

Dalcroze insiste sur nos rythmes corporels. Ils sont composés de nos « battements de cœur », nous donnant inconsciemment l’idée de la mesure de par sa régularité. « L’acte respiratoire » nous renseigne sur la division du temps et enfin « la marche régulière » qui est un modèle parfait de mesure et de division du temps en parties égales. Sa méthode est un ensemble de principes pédagogiques basés sur « une éducation visant à ordonner les réactions nerveuses, à accorder muscles et nerfs, à harmoniser l’esprit et le corps »⁶⁰¹ Par ailleurs, Marja-Leena Juntunen et Leena Hyvönen, se sont penchées sur la réciprocité entre les découvertes empiriques de Jaques-Dalcroze et la phénoménologie de Merleau-Ponty. Car, tous les deux considèrent le corps et l’esprit indissociables l’un de l’autre.⁶⁰² Pour Merleau-Ponty, écrivent-elles, « humans come to know the world by ‘being- in-the-world’ through the body ».⁶⁰³ Ainsi, « chez Merleau-Ponty, tout comme c’est le cas dans la conception dalcrozienne de l’apprentissage musical, le corps est perçu comme l’attribut constitutif de la connaissance. »⁶⁰⁴ Louise Mathieu rappelle également que « Damasio considère que le savoir se construit dans et à travers le corps, dans et à travers les sensations que nous procure notre corps, ainsi que dans la prise de conscience que notre être les ressent. »⁶⁰⁵ Jaques-Dalcroze ne disait-il pas justement, de façon imagée : « Que votre corps devienne de la musique ».

Figure 134 : « Rythmiciennes en plein air », photo de Frédéric Boissonnas, 1909-1910.

Annie Beck, Suzanne Perrottet, Jeanne Allemand et Clara Brooke.

Les trois matières principales dans cette pédagogie sont : la Rythmique, le Solfège et l’Improvisation. Deux enseignantes dalcroziennes, avec qui nous avons eu l’occasion de collaborer⁶⁰⁶, Anne Gabrielle Peter-Chatoux et Claire Leleu rappellent les principes pédagogiques qu’elles utilisent :

« La relation entre le temps, l’espace et l’énergie,

Les réactions auditives, visuelles et tactiles (en imitation, conventionnelles, mixtes),

L’association ou la dissociation de mouvements,

L’incitation, l’inhibition (gestion de son influx nerveux),

L’automatisation (la répétition inconsciente),

La systématisation (la répétition consciente),

Les exercices de groupe (sociabilisation),

L’improvisation (la créativité). »⁶⁰⁷

Tous ces moyens sont utilisés au service de l’élève (bébé, enfant, adulte, sénior) afin de développer des outils nécessaires pour l’expression du musicien, du danseur ou du comédien. L’enseignement se fait principalement à l’aide du piano et de la voix, en s’appuyant sur les mouvements naturels du corps. Anne Gabrielle Peter-Chatoux précise que :

Pour une même notion on proposera plein d’approches différentes pour multiplier les chances qu’elle soit intégrée. Lorsque j’explique un triolet par exemple, on va d’abord faire entendre le triolet à travers des exemples musicaux. Ensuite on va le danser avec un foulard, on va le comparer avec un rythme qui ressemble beaucoup, mais qui est quand même différent, on va le chanter, taper sur un tambourin, faire écouter une chanson pour l’identifier… et après seulement on va dire à l’élève : ce que tu as fait, ressenti, marché, dansé, chanté, s’appelle un triolet et s’écrit de cette façon-là. De fait, lorsque l’enfant a intégré le triolet pratiquement sans se rendre compte, et qu’il prend son instrument, il le connait déjà.⁶⁰⁸

Cette rythmicienne et présidente de l’association « Dalcroze France » fait finalement la synthèse des différents exercices de « réactions » typiques de l’approche dalcrozienne, concernant l’apprentissage du triolet. Il s’agit de développer des réflexes, d’être réactif aux différents stimuli physiques proposés. Lorsqu’un enfant joue une cellule rythmique au djembé par exemple, le reste du groupe réagit avec tout son corps et développe ainsi une sensibilité particulière. Ceci dans le but de développer la capacité à discriminer des gradations (même légères) de durée, de temps, d’intensité et de phrasé. L’utilisation de cette combinaison entre le rythme et le mouvement permet une relation singulière à l’autre, nécessitant la conscience mentale et kinesthésique de soi. Toutes ces sensations physiques sont transmises au cerveau comme des émotions et une compréhension plus développée de l’expérience musicale.⁶⁰⁹

2. Le pouvoir de la musique : concevoir un outil d’apprentissage de la texture destiné aux enfants sourds

« La danse joue un rôle capital dans les relations humaines, elle est une école du comportement social, de l’harmonie du groupe. La danse est l’école de la générosité et de l’amour, du sens de la communauté et de l’unité humaine. Tout être humain porte en lui un danseur. » Rudolf Laban

Partant du plaisir des enfants sourds à faire de la musique ensemble, nous avons réfléchi à l’élaboration d’un outil pédagogique qui nous permettrait de faire le lien entre leur perception de la texture et de la matière sonore à travers le mouvement. La perception musicale est intimement liée à l’action et vice versa. Renforcer ce couplage perception-action est tout à fait primordiale dans les mécanismes de plasticité cérébrale. Nous savons que la synchronisation du mouvement avec un son est véritablement une compétence universelle spécifique à tous les êtres humains. L’intelligence du corps est au centre de nos préoccupations. Nous avons souligné que la musique représente une médiation privilégiée pour l’émergence de nombreuses habiletés cognitives, émotionnelles et motrices.

Quelques exemples pratiques de ce type d’éducation musicale permettront d’illustrer au mieux ce cadre théorique.

2.1. Présentation :

Les différents groupes d’enfants sourds (âgés de 3 à 12 ans) avec lesquels nous travaillons au

C.E.O.P (Centre Expérimental Orthophonique et Pédagogique), bénéficient d’une séance hebdomadaire de 30 mn à 1 heure (selon leurs âges). Ils sont idéalement par groupe de 4 à 8 personnes. Nous avons créé également depuis l’année dernière un groupe parents/bébé sourd (une heure hebdomadaire) afin de stimuler au plus tôt l’audition du tout petit. Cela nous permet également d’accompagner au mieux les parents dans l’acceptation du handicap et de répondre à leurs interrogations dans la mesure du possible. La présentation ci-dessous correspond aux groupes d’enfants plus grands.

Une séance commence toujours de la même manière : les enfants se déchaussent et s’assoient en formant un cercle. Cette disposition nous permet de tous nous voir et facilite la concentration de chacun. Nous délimitons ainsi notre espace de travail.

Il s’agit de mémoriser une suite de gestes corporels (non-signifiants) inventés par chaque enfant à tour de rôle. L’idée est que chacun puisse exprimer ce qu’il est, en partageant librement son émotion du moment, en utilisant la partie du corps de son choix. Par la répétition, les enfants entraînent leur mémoire et prennent conscience de la successivité. Après avoir mémorisé cette « phrase » mimo-gestuée, nous la travaillons dans sa globalité en rythme. Ici, tous les enfants jouent en même temps et prennent conscience de la simultanéité (deux notions par ailleurs essentielles en langage).

Une phase d’éveil corporel termine cette mise en condition : étirements, bâillements, tension et relâchement des différentes parties du corps, prise de conscience de l’acte respiratoire. Petit à petit va s’installer une certaine harmonie, car nous aurons partagé ensemble nos sensations en respectant la proposition de mouvement de chacun, ce qui va nous permettre de développer un lien précieux, un sentiment d’appartenance.

Figure 135 : Illustrations de la phase d’éveil corporel.

Les enfants sont alors disponibles, en éveil. Nous pouvons commencer des petits jeux d’écoute musical, comme le « jeu de Kim » par exemple, très apprécié des enfants.

Un enfant se cache derrière un paravent et choisit pour commencer, trois instruments de son choix, présents dans la salle de musique. Le reste du groupe attend au fond de la pièce. L’enfant (le leader) joue et fait écouter aux autres ces trois instruments dans un ordre connu de lui seul. Les autres doivent bien sûr écouter et découvrir l’ordre choisi par ce dernier. L’enfant qui a trouvé la bonne combinaison peut alors prendre la place du premier et ainsi de suite… Chez les plus jeunes, nous n’irons pas au-delà de cinq instruments. Pour les plus expérimentés, ils sont en mesure d’aller jusqu’à neuf.

Cet exercice exige l’identification, la mémorisation puis la reproduction fidèle de la successivité des instruments entendus. Le plaisir du geste occupe ici une place toute particulière, car l’enfant caché ose s’exprimer davantage et enrichit ses connaissances tant sur le plan corporel que musical. Ce jeu permet aussi une prise de conscience du lien entre ses perceptions et ses productions. « D’une manière générale, le jeu instrumental réalise cette liaison sensori-motrice dans laquelle la musique est perçue a la fois comme geste et comme son ».⁶¹⁰

2.2. Développer la conscience rythmique à travers le mouvement :

Grâce à des mouvements naturels comme la marche ou les déplacements dans une salle, la sensation musculaire va pouvoir s’exercer et s’associer au phénomène sonore grâce à la musique proposée par l’enseignant ou l’enfant. Le plus important est d’être dans l’action, de prendre conscience de son corps en mouvement et d’y être attentif. Ce qui va pouvoir créer des images audio-motrices pour constituer un répertoire de perception enrichissant la musicalité de l’enfant. Même si bouger en rythme peut sembler simple, cela fait appel à un réseau complexe de régions cérébrales. Nous avons vu que le rythme musical stimule également les régions cérébrales dédiées au cortex moteur (Kotz et al., 2011).⁶¹¹

De plus, grâce au nombreuses études scientifiques sur le sujet, nous connaissons aujourd’hui les bienfaits du mouvement et de la danse, dans les maladies neurodégénératives comme la maladie de Parkinson ou la maladie d’Alzheimer (Spaulding et al., 2012⁶¹²; Duncan et Earhart, 2014⁶¹³ ; Lazarou et al., 2017)⁶¹⁴. Dans ce qui nous préoccupe, il est tout à fait indispensable de proposer des exercices dansés de façon ludique et motivante pour l’enfant. Le point de vue de la danseuse Doris Humphrey nous semble intéressant d’être mentionné. Dans son ouvrage, The Art of making dances (1959)⁶¹⁵, elle écrit que « le mouvement sans motivation est impensable ». Juste le fait de produire des mouvements peut être une motivation en soi. Elle poursuit en affirmant « je vis, donc je bouge ». La pédagogie Dalcrozienne nous semble partir de ce même élan vital. Le point d’entrée de la corporéité passe par les sensations corporelles chez l’enfant et lui fournissent un outil indispensable pour éveiller son imagination.

Pour favoriser cela, voici quelques exemples d’exercices typiques de cette pédagogie :

Grâce à leurs déplacements, les notions de « poids » leur permettront de sentir et de prendre conscience de la métrique et de la mesure dans la musique,

A travers la tension et détente musculaire, le ressenti des nuances sera plus aisée,

L’orientation dans l’espace pourra aider les enfants à découvrir le phrasé,

L’utilisation de l’espace enrichira la conscience de l’espace sonore.

Nous utilisons du matériel comme des balles, des cerceaux, des bâtons colorés… tout ce que notre imagination peut nous dicter sans limites. Il faut prendre le temps d’expérimenter, d’essayer des choses et de se tromper. Il est essentiel d’encourager les enfants à proposer tel ou tel matériel. La fierté ressentie par l’enfant et surtout les possibilités dont il dispose de choisir par lui-même sont si précieuses.

Figure 137 : Travail autour de la mesure à 4 temps avec des bâtons colorés

Il est possible, dans un second temps, de proposer aux enfants d’associer une action à un instrument. Par exemple, sur la cymbale, les enfants tournent, sur le triangle, on se met sur la pointe des pieds, etc. L’idée étant de faire correspondre un mouvement à la qualité du timbre proposé. La mémoire kinesthésique aidera ici à reconnaître de manière ludique chaque instrument et leur succession dans le temps. L’enfant développe alors, ce que Piaget, rappelons-le, a mis en évidence : le principe « d’assimilation » et « d’accommodation ». Par exemple, si un enfant entend une cymbale, son impulsion première sera de tourner sur lui-même puisqu’il l’a travaillé ainsi. Et si le coup de cymbale est joué « fortissimo », il pourra accommoder en amplifiant son mouvement ou en tournant plus vite notamment. « Assimilation » et « accommodation » sont inséparables l’une de l’autre. Nous assistons à un perpétuel va et vient entre ces deux actions essentielles. Cette activité peut aider à mobiliser ces principes piagétiens.⁶¹⁶

Figure 138 : Travail de la conscience rythmique à l’aide de balles.

« Le but des études rythmiques est de régulariser les rythmes naturels du corps et, grâce à leur automatisation, de créer dans le cerveau des images rythmiques définitives. »⁶¹⁷

2.3. Improvisation et Création

2.3.1. Exploration instrumentale :

Nous jouons dans un premier temps avec des instruments de petite percussion (tambourins, claves…) avec pour objectif de :

Prendre conscience de notre corps en mouvement,

Entraîner la coordination entre les pieds et les mains,

Travailler les différents niveaux de dissociation : entre les pieds et les mains (motricité globale), entre les mains et les doigts (motricité fine),
Établir une autre forme de relation dans le groupe.

Dans un second temps, les enfants explorent librement les instruments qui sont mis à leur disposition tels que des triangles, maracas, tambourins, xylophones ou carillons, guiros, claves, des « tubes mélodiques », djembé, etc. au final, ce qui ressemble finalement à l’instrumentarium de Carl Orff, dont nous avons déjà parlé au cours de ce sixième chapitre (Cf. Figure 129). La découverte se fait sur plusieurs séances, les enfants sont amenés à manipuler tous les instruments, à explorer leur sonorité, leur matériau, leur texture, etc. Nous pouvons alors échanger sur les techniques ou les stratégies mises en place pour faire de la musique avec tel ou tel instrument. Un travail sur les techniques de jeu est réalisé avec les enfants. Ils apprennent alors à contrôler et à préciser leurs gestes pour jouer.

2.3.2. Improvisation dansée :

Nous pouvons proposer également aux enfants un ruban de gymnastique, qu’ils affectionnent tout particulièrement, pour travailler en profondeur une cellule rythmique, comme deux croches/noire par exemple. La consigne étant de dire « Suivez ce que vous entendez au piano et dessinez-le avec votre ruban. » Ainsi les élèves dessinent avec leur ruban ce qu’ils entendent. Nous enchaînons alors au piano, des phrases qui toutes comportent deux croches/noire, mais les enfants ne le savent évidemment pas. Cet exercice fait appel à une perception globale. Même si le but est d’apprendre cette cellule rythmique tout particulièrement, il importe de laisser le temps d’explorer la sensation corporelle des rythmes. On ne fait pas appel à l’analyse ici, mais plutôt au ressenti.

Les enfants n’ont même pas besoin de savoir ce qui se passe dans la musique, ils n’ont qu’à se laisser guider par ce qu’ils entendent. En revanche, nous exigeons une certaine précision de mouvement, afin de voir les rythmes se dessiner. Les mouvements du ruban et du corps doivent rendre visible la musique entendue.

2.3.3. Improvisation instrumentale :

En partant d’une musique appréciée de l’enfant, nous aimons bien proposer l’utilisation d’un ou plusieurs instruments afin de permettre à l’enfant de s’exprimer. En improvisant, les enfants explorent les caractéristiques de leur corps, ils reconnaissent et expriment leurs sentiments et développent une meilleure compréhension du monde environnant. Pierre Schaeffer, dans son célèbre Traité des objets musicaux,⁶¹⁸ « valorise les « sons » plutôt que les « notes », non pas leur origine ou leur signification, mais leur mouvement, leur texture, leur couleur. »⁶¹⁹ C’est en créant des espaces sonores que les enfants découvrent qu’ils peuvent « composer ». Ils n’ont pas forcément des modèles à suivre ou à reproduire. En ne se préoccupant pas forcément de la tonalité et de ses codes, ils ont directement accès au monde sonore selon leurs moyens et leur personnalité.

2.3.4. Création de partition comme des « Paysages sonores » :

Des musiciens tels que John Paynter⁶²⁰ ou R. Murray Schafer⁶²¹ , et plus tard François Delalande⁶²², Monique Frapat⁶²³ et Claire Renard ont totalement inspiré ma démarche autour de la création avec les enfants sourds.⁶²⁴ Cette dernière propose d’aborder le jeu musical par le geste comme « l’intermédiaire entre la pensée musicale et le son produit ».⁶²⁵ Par exemple, pour jouer avec la texture, nous pouvons proposer ce type d’improvisation où les enfants joueront d’un instrument les uns après les autres, ce qui va densifier la matière sonore ou au contraire la faire disparaître, jouant sur la densité du son. Le volume sonore va varier mais les enfants, eux, devront garder la même intensité sonore par exemple.

Ce qui est particulièrement intéressant dans ce type d’approche, c’est de proposer un enseignement musical fondé sur la créativité, l’expression libre, ainsi que sur un retour à l’élément fondamental de la musique : le son. En travaillant sur la matière sonore et la texture, il devient alors possible d’aborder l’interprétation, l’improvisation et la composition musicale. Les sons peuvent alors être assemblés comme pourraient l’être les couleurs d’une peinture abstraite. Nous avons d’ailleurs mené un projet entre le pictural et la création musicale avec un petit groupe d’élèves sourds signants de 10-12 ans au Ceop, en collaboration avec Philippe Séro-Guillaume, qui nous a ouvert les portes de son atelier. Il est interprète en langue des signes, docteur en traductologie, directeur de la Section Interprétation en Langue des Signes de l’Ecole Supérieure d’Interprètes et de Traducteurs (ESIT). Son ouvrage, Langues des Signes, Surdité et accès au langage (2008)⁶²⁶ est une référence, car ses recherches mettent en évidence les bases constructivistes psycho-mécaniques inhérentes à l’activité langagière qu’elle soit signée, parlée ou écrite. Il a proposé une analyse des différents mécanismes d’apprentissage de la langue.

Sur une proposition de ces enfants, il s’agissait d’illustrer musicalement le tableau ci-dessous. Les enfants ont aussi travaillé leur créativité et leur imagination en produisant un texte écrit de manière collective.

Figure 140 : *Composition, 2015* de Philippe Séro-Guillaume, Huile sur toile, 100 x 100 cm

Nous avons réalisé un premier graphique représentant les différents flux auditifs, une sorte d’architecture globale où chaque enfant s’intégrait dans la matière sonore. Le premier élément important pour eux a été d’exprimer l’intensité : ce que l’on distingue en bas à gauche de la photo. Nous avons désigné un instrument pour chacun et élaboré, selon nos émotions et nos sensibilités, le début d’une partition. Grâce à cette pratique collective, l’enfant se construit en tant que personne au sein du groupe et grâce au groupe. En effet, l’enfant sourd, tout en apprenant à respecter des règles, construit son savoir seul mais il a besoin des autres pour le structurer et le faire évoluer.

Chaque instrument entrait successivement constituant un immense crescendo orchestral en quelque sorte, arrivant à son climax pour redescendre peu à peu et terminer avec l’instrument initial : un tambour océan. Le contexte imaginé était de représenter une île bleu azur et ses habitants : divers animaux (baleine, dinosaure, girafe, éléphant, renard, etc.).

Figure 141 : Premier jet de notre travail.

Après avoir travaillé leurs parties séparément, ils ont pris un immense plaisir à jouer ensemble. Tous les enfants sont attirés spontanément par le jeu instrumental : plaisir de la découverte, plaisir du geste, plaisir de la production.

Finalement, après avoir joué les propositions des uns et des autres, nous nous sommes mis d’accord pour aboutir à la partition finale ci-dessous (fig. 142).

Dans cette perspective, le fait d’enseigner la musique comme phénomène sonore, permet d’accèder à une plus large compréhension de toutes les musiques, autant les musiques tonales que les musiques non tonales ou extra-occidentales. Les enfants sont donc invités à penser la musique sous forme de textures, avec des termes comme doux/rugueux, chaud/froid, léger/lourd, etc., le plus souvent corrélés avec des émotions comme la tristesse, la gaieté, la peur, etc.

Figure 142 : Partition collective de l’Ile Bleu Azur. — Figure 142 : Partition collective de *l’Ile Bleu Azur*.

Le rôle de l’enseignant consiste à stimuler l’écoute et la curiosité des enfants par la présence accrue d’exercices d’improvisation, d’expression, de travail corporel, afin de développer leur jugement esthétique. De cette manière, les enfants pourront apprendre d’eux-mêmes, en procédant par tatônnement tout en essayant de résoudre les divers problèmes rencontrés dans leur démarche artistique.

Figure 143 : Concert des enfants devant Philippe Sero-Guillaume au Ceop.

Finalement, notre démarche pourrait s’inscrire dans un processus de « recherche-création » défini par Gosselin notamment.⁶²⁷ Les travaux réalisés dans ce sens par Grazia Giacco et le GREAM (Groupe de recherches expérimentales sur l’acte musical) à Strasbourg nous intéresse tout particulièrement.⁶²⁸

2.4. Le rôle essentiel des comptines :

L’importance des comptines, pendant les premières années de l’enfance est fondamentale. Nous pouvons affirmer qu’elles soutiennent la communication préverbale de tout petit. Trevarthen et Malloch (2009) ont développé le concept de musicalité communicative afin de décrire la capacité du tout petit à communiquer avec les autres.⁶²⁹ Ces chercheurs ont montré que les bébés étaient capables très précocement de s’impliquer dans des échanges sociaux et d’avoir une influence sur eux. Nous avons également vu que le motherese participait à la construction de la communication mère-enfant. Lors de ces échanges, la communication est polysensorielle : le regard, les mouvements du corps et la voix sont corrélées. Déjà, l’implication du corps tout entier nous renseigne sur les émotions, au niveau de sa tonicité ou de son relâchement (tension/détente). La conception du danseur et chorégraphe Rudolph Laban développée dans les années 1950 pose les bases du rôle de l’expression corporelle.⁶³⁰ Il énonce quatre facteurs constitutifs du mouvement : le poids, le flux, l’espace et le temps. Il ajoute la notion essentielle de l’« effort » qui désigne « les impulsions intérieures dans lesquelles le mouvement prend son origine ».⁶³¹ Selon lui, ces éléments sont « les clefs permettant de comprendre ce qu’on pourrait appeler l’alphabet du langage du mouvement ».⁶³² Tous ces éléments sont déjà présents chez le nouveau-né. De plus, selon l’âge et le comportement de son enfant, la mère adaptera son chant. Anne Delavenne et collaborateurs (2013) ont mis en évidence cela en demandant aux mères de chanter la même chanson à deux moments différents : au 3 mois puis au 6 mois de leur enfant. Une analyse acoustique a permis de montrer que les mères avaient un chant beaucoup plus marqué au 6 mois de leur petit. Ce qui suggère que les mères devaient ajuster leur chant en fonction du développement de leur enfant de manière intuitive. Ces études sont corroborées par les recherches de Sandra E. Trehub : « Les nourrissons sont sensibles aux modèles de sons perçus par les adultes comme « musicaux », tels le contour d’une mélodie et les intervalles les plus bas d’une série harmonique comme la quinte juste ; ils peuvent aussi reconnaître des séquences de sons dans diverses transpositions et divers tempos. On connaît bien leur sensibilité à la mélodie sous forme de berceuse (Trehub & Trainor, 1998)⁶³³ ».

Les comptines s’inscrivent dans notre patrimoine culturel. La plupart sont très anciennes. La forme de la comptine est multiple, cependant nous pouvons dire qu’elle est souvent divisée en couplets séparés d’un refrain. Elle prépare l’enfant à recevoir les principales composantes du langage, à savoir le rythme et l’intonation. La comptine est un moyen simple pour réguler les émotions des bébés. Leur but est manifestement ludique, car elles sont source de plaisir partagé. L’aspect rythmé des comptines et leur répétition permet aux bébés de développer des capacités attentionnelles ainsi que des capacités d’anticipation, car la familiarité des chansons entendues va lui permettre de prédire la suite des évènements (Stern, 1989).⁶³⁴

Pour un bébé sourd, comme chez un bébé normo-entendant, les comptines vont éveiller son intérêt pour le monde sonore et donner du sens à son environnement. Après la mise en place d’un appareillage adapté le plus tôt possible, le bébé sourd pourra développer les mêmes types de compétences grâce à l’apport de la comptine notamment. Elle va l’accompagner tout au long de son développement psycho-affectif et favorisera son développement linguistique. Multimodale, la comptine fait intervenir l’audition, la vision et la motricité. Elle contribue à la structuration du temps, de l’énergie et de l’espace. C’est grâce à cela, que pourront se construire la langue et la pensée. La comptine permettra aussi d’établir des liens avec l’analyse des éléments pertinents de la voix et de la parole, le travail d’articulation et de conscience phonologique. Tous ces liens se feront harmonieusement grâce au soutien essentiel de sa famille.

Ainsi, de par les échanges relationnels ludiques et dynamiques entre le bébé sourd et son entourage, la comptine offrira au bébé la possibilité de combiner « des perceptions auditivo-verbales, des perceptions kinesthésiques, multisensorielles et somesthésiques. »⁶³⁵

Au niveau pédagogique, l’utilisation de la voix associée aux gestes permet d’aborder une réflexion intéressante menée par Grazia Giacco (2016) à propos du processus de création autour de la notion de geste visuel, sonore et tactile.⁶³⁶ Il s’agit ici de repenser la place de la voix, « La voix n’est pas uniquement une voix chantée : un lien profond l’unit au corps, une voix qui grâce à l’expression gestuelle, corporelle, peut être exploitée dans toutes ses possibilités paramétriques, sonores-quantitatives et qualitatives. »⁶³⁷ Par rapport à la surdité, cette problématique prend tout son sens. Le « Moi-Peau » développé par Didier Anzieu (1985)⁶³⁸ et rappelé par Grazia Giacco, constitue un concept psychanalytique majeur, replaçant le corps au centre de toutes les attentions. Il explique comment se construit le sentiment d’existence, d’identité du bébé, ce sentiment d’être « une personne unifiée » pour Anzieu. Ce dernier s’inspirera notamment des travaux de l’éthologue Lorenz sur « l’empreinte »⁶³⁹ ⁶⁴⁰ et des travaux du pédopsychiatre Winnicott à travers la notion de holding.⁶⁴¹ C’est pourquoi les gestes maternels, réalisés au moment des soins du tout petit mais aussi au moment des échanges vocaux-gestués des comptines, correspondent aux premiers messages d’une communication pré-verbale précoce essentielle.

Dès lors, la place du corps, central dans les méthodes actives musicales exposées tout au long de ce chapitre, devient un concept clef dans l’élaboration d’une pédagogie musicale auprès des enfants sourds.

2.5. Création d’un « Jardin des Sons »

Depuis quelques années, nous animons également deux ateliers musicaux hebdomadaires au CHU de Dijon à destination des enfants et des adultes sourds implantés. Ce qui a donné naissance à une réflexion autour de leur perception. Nous avons alors élaboré avec Frédéric Voisin, Emmanuel Bigand et Philippe Lalitte au LEAD (Laboratoire d’Étude des Apprentissages et du Développement) un projet de recherche nommé « Jardin des sons », en utilisant les mêmes textures présentes dans notre première expérimentation, afin de créer un espace sonore ludique où les enfants sourds se déplaceraient munis de capteurs sensoriels. Selon leurs déplacements, cela pourrait nous renseigner sur leurs préférences, ce qu’ils perçoivent le mieux etc…

Figure 144 : Salle d’interaction *Musique-Geste* LEAD.

Ce dispositif de sonification musicale du mouvement nous a permis d’amener les enfants sourds implantés à explorer le plus grand nombre de dimensions du son et de la musique avec une participation active de l’ensemble du corps et par la même occasion d’explorer leurs propres capacités auditives.

Figure 145 : Schéma général de l’interface musicale.

Neuf modules d’exploration sonore et musicale ont été conçus :

Audiométrie active : Les fils sonores, La pêche aux mots, La chasse au trésor.

Exploration du son musical : Jeu de la statue, Jeu avec deux dimensions sonores, Jeu avec plusieurs dimensions sonores.
Explorations polyphoniques : Mimer c’est jouer, Mix et remix, Danse avec les voix.

Figure 146 : Expérimentation des enfants sourds implantés au LEAD.

Ils ont été expérimenté par nos élèves à plusieurs reprises. Ces modules comportent tous des niveaux de difficultés progressifs, en relation direct avec leurs capacités psychomotrices.

Voici une présentation détaillée de l’avancement de ce projet en cours de finalisation.

2.5.1. Audiométrie active

Les fils sonores virtuels : Au moyen d’une baguette, l’enfant tire l’un après l’autre différents fils virtuels qui représentent des fréquences fixes dont l’intensité décroit lorsqu’il traverse la salle jusqu’à devenir inaudible. Dans une première phase, pour chaque fil (fréquence), l’enfant marque le sol de sa baguette lorsqu’il arrive au bout du fil, c’est à dire lorsqu’il ne l’entend plus. Dans une seconde phase, l’enfant doit retrouver chacun des bouts de fil en partant du silence cette fois-ci. Notre objectif principal étant de familiariser l’enfant avec la sonification de l’espace. Nous cherchons à évaluer le seuil de perception tonale de l’enfant.
La pêche aux mots : A l’aide d’une baguette, l’enfant recherche des puits virtuels d’où émergent des voix à peine audibles : plus la baguette est proche du sol, plus on entend les voix. A chacun des puits qu’il trouve, l’enfant en extrait tous les mots, en les répétant un à un : à chaque extraction, l’intensité des mots diminue de 4 dB. Lorsque le puit est vide, les mots étant devenus inaudibles, l’enfant recherche le puit suivant. L’objectif est d’évaluer leur seuil de perception et leur seuil d’intelligibilité vocale.

La chasse aux trésors : L’enfant effectue un jeu de piste dans la salle. Des coups de baguette déclenchent l’énonciation vocale de consignes qu’il doit suivre. L’enfant est amené à parcourir six « scènes auditives » typiques (par exemple : la rue, la cantine, la cours de récréation, la mer) associées à six zones différentes dans la salle. La hauteur de la baguette détermine le rapport signal bruit de la consigne vocale (voix/scène auditive).

2.5.2. Exploration du son musical

Le jeu de la Statue : L’enfant accompagne la musique en bougeant et en se déplaçant comme il veut. Lorsque la musique s’interrompt, l’enfant doit rester immobile. Lorsqu’elle reprend, l’enfant peut recommencer à bouger. A chaque reprise, l’intensité de la musique diminue de 4 à 6 dB. Dans une première phase, les arrêts sont automatisés, aléatoires ou structuraux (prédictibles). Dans une deuxième phase, c’est l’enfant qui décide de l’arrêt et du recommencement de la musique. L’objectif consiste à évaluer leurs seuils de perception avec des sons musicaux.
Jeu avec deux dimension sonores : Explorer les dimensions du son et de la musique par les mouvements du corps et les déplacements dans l’espace qui font varier deux dimensions musicales à fois, notamment le tempo de la musique et le registre des instruments. L’objectif est d’apprendre aux enfants à interagir avec la musique par le mouvement et la position dans l’espace.
Jeu des effets musicaux : Explorer différents effets musicaux par les mouvements plus précis des mains, outre les positions dans l’espace : tempo, registre, mais aussi intensité, consonances, dissonances, rugosité, réverbération… L’espace est exploité dans ses 3 dimensions.

Notre objectif consiste à aider l’enfant à se familiariser avec la diversité des dimensions et qualités musicales en apprenant à contrôler ses gestes.

2.5.3. Exploration polyphonique

Mimer c’est jouer : Lorsque l’enfant mime un instrument (violon, trombone, flûte traversière, batterie), il s’entend en jouer comme s’il avait déjà commencé à apprendre à en jouer… A différentes positions dans l’espace correspondent différents styles de musique. Il s’agit ici de familiariser l’enfant au contrôle du phrasé et à l’expressivité musicale par le geste.
Mix et Remix : L’enfant se tient debout au milieu de la salle. Des « fenêtres » invisibles que l’on peut ouvrir ou fermer plus ou moins, sont disposées ici et là autour de lui. Elles permettent d’entendre ou d’atténuer différentes parties qui constituent une musique polyphonique. L’idée est que les enfants se familiarisent avec les différentes parties d’une musique polyphonique.
Danse avec les voix : Avec l’ensemble de son corps, l’enfant active, avec plus ou moins d’intensité, les différentes parties polyphoniques associées aux différentes parties de son corps. La musique s’arrête lorsque l’enfant ne bouge plus et reprend lorsqu’il bouge. Il peut changer de style de musique en frappant dans ses mains. L’objectif principal est de permettre à l’enfant de développer la coordination et l’indépendance de différentes parties de son corps (membres, torse) en relation avec la musique entendue.

Figure 147 : Visualisation du mouvement d’un enfant sourd implanté.

Conclusion

Tout au long de ce travail de recherche, nous avons essayé de définir quelles réalités recouvraient la texture dans des domaines fort variés et plus particulièrement d’étudier ses implications en musique, d’un point de vue musicologique, cognitiviste et pédagogique.

Dans le premier chapitre, nous avons pu constater à quel point la texture est omniprésente autour de nous. Son aspect multimodal en fait un concept à la fois complexe et subtil que nous retrouverons également en musique. Elle contient des informations visuelles essentielles sur les objets de notre environnement. Elle nous permet de distinguer les aliments, les tissus, les surfaces d’une œuvre d’art. Cela fait de la texture une partie importante de l’apport sensoriel que nous recevons chaque jour.

Tout au long du second chapitre, nous avons démontré sa richesse conceptuelle en musicologie. Tantôt elle sera définie comme étant une « surface », « un grain », « une nappe »,⁶⁴² ce qui renvoie au caractère général du son, au sentiment extérieur de la musique, plutôt qu’à sa structure interne, tout comme chez Morgan qui la dépeint comme « une immense toile sonore ».⁶⁴³ Tantôt elle correspondra à une combinaison subtile de lignes musicales, avec les conceptions de Wallace Berry ou de Joel Lester notamment.⁶⁴⁴ Chez les compositeurs, nous retrouvons des textures s’apparentant à « la matière » comme chez Ligeti ou chez Feldman partageant le point de vue du musicologue Lewis Rowell.⁶⁴⁵

En psychologie cognitive, l’étude de la perception de la texture s’avère fondamentale pour mieux comprendre les principes de l’organisation auditive. Nous nous sommes appuyés dans le troisième chapitre sur le cadre de référence théorique proposé par Bregman : « l’analyse de scènes auditives ».⁶⁴⁶ Il a mis en évidence deux grandes classes de mécanismes : les mécanismes de ségrégation simultanée et les mécanismes de ségrégation séquentielle. Grâce à ses travaux et ceux de McAdams, dans une perspective analytique, nous avons apparenté le groupement simultané à la dimension verticale de la texture et le groupement séquentiel et segmental à la dimension horizontale. Dans la musique après 1945, et notamment dans les musiques qui accordent une importance majeure au timbre, à la texture et à l’espace, le groupement segmentationnel correspond à des qualités sonores émergentes telles que la densité (opacité vs transparence), l’étendue (large vs étroite), le centre de gravité tonal (léger vs lourd), la brillance (clair vs sombre), la dissonance sensorielle (rugueux vs soyeux) pour la dimension verticale. Alors que la striation (pulsé vs lisse), la régularité (fluide vs saccadé), la vitesse (rapide vs lent), la stabilité (mouvant vs statique) et la densité temporelle (aéré vs compact) illustrent plutôt la dimension horizontale. Nous avons d’ailleurs construit nos expérimentations (chapitre 5) à partir de cela. L’apport essentiel de Meyer nous a permis de comprendre les processus cognitifs et émotionnels de la musique. Il nous a guidé également dans l’élaboration de nos recherches expérimentales.

Afin de mieux comprendre la perception de nos élèves sourds implantés avec lesquels nous travaillons, nous avons présenté dans le quatrième chapitre, la surdité et ses conséquences dans le but de mieux cerner les enjeux de notre étude. Nous avons pu souligner l’apport essentiel de la musique dans leur éducation.

Dans notre cinquième chapitre, nous avons dans un premier temps présenté quatre analyses de la texture à l’aide du logiciel informatique Sonic Visualiser. Analyser la texture en musique contemporaine, à savoir analyser les différents types de tissage, de grain, de matière, de strates, revient à considérer la texture comme étant un tout plus ou moins homogène, constituée de la fusion d’éléments séparés. La description verbale de la texture a complété notre description visuelle. Nous l’avons décrite en fonction de sa dimension verticale et horizontale, en référence à l’ASA de Bregman.

Dans un second temps, nous avons présenté nos deux études comportementales menées auprès d’enfants sourds implantés, versus enfants normo-entendants. Dans la première, il s’agissait de classer des textures à partir d’extraits audio de musique contemporaine. Les résultats ont mis en évidence les capacités inouïes des enfants sourds implantés à percevoir significativement la texture malgré leur déficience. Nous pensions que les enfants normo-entendants seraient bien meilleurs dans cette tâche. Nous avons alors cherché à comprendre ces résultats en la proposant à des adultes musiciens et non-musiciens. Nous avons montré que les résultats des adultes musiciens se rapprochaient de ceux des enfants sourds, alors que ceux des adultes non-musiciens étaient plutôt semblables à ceux des enfants normo-entendants. Nous avons donc mené une seconde expérimentation avec les enfants où il s’agissait de classer des extraits musicaux en fonction de leur contenu émotionnel : la gaieté, la colère, la sérénité et la tristesse. Nous avons postulé tout comme pour la première, que les enfants normo-entendants seraient meilleurs dans cette tâche car nous avons utilisé cette fois-ci de la musique tonale. Malgré tout, les résultats ont montré que les enfants sourds performaient dans la reconnaissance d’émotions singulières, la sérénité et la tristesse, et ce grâce à leur perception du mode. Les enfants normo-entendants ont obtenus de meilleurs résultats cette fois-ci.

Nous sommes tout de même allés plus loin dans notre analyse en nous intéressant tout particulièrement aux excellents résultats des enfants sourds pour classer des textures ; car ces résultats mettaient en évidence que bien qu’implantés ces enfants percevaient très bien les dimensions acoustiques pertinentes des textures. A ce stade, l’utilisation de descripteurs audio s’est avérée primordiale afin d’analyser au plus près certaines caractéristiques du son. Il semblerait que les enfants sourds aient plus utilisé les descripteurs de timbre, d’intensité et de fluctuation rythmique pour réaliser cette tâche. Concernant la reconnaissance des émotions, nous attirons votre attention sur le fait que ce sont précisément les descripteurs audio reliés au mode (Tonal Mode et Key Clarity) qui sont principalement corrélés avec les extraits tristes et sereins. Ce qui permet de maximiser nos résultats. Par conséquent, il nous plaît à penser que l’utilisation de la texture pourrait contribuer à enrichir les pratiques pédagogiques actuelles chez les enfants et plus particulièrement chez les enfants sourds implantés. De plus, nous pourrions envisager de poursuivre nos recherches sur la perception de la texture, en étudiant plus finement ses liens avec les émotions, à partir d’extraits en musique contemporaine, avec une plus grande population d’enfants sourds implantés par exemple. Cela nous fournirait certainement de nouveaux éléments d’analyse, tant en musicologie qu’en psychologie cognitive.

Plus particulièrement en musicologie, il conviendrait d’harmoniser nos pratiques d’analyse de la texture afin d’avoir une compréhension plus fine de celle-ci. La partition seule ne suffit pas à rendre compte de son importance. Nous avons montré que la forme d’onde, le sonagramme et le coefficient d’énergie dans les bandes critiques notamment, pouvaient apporter de nouvelles perspectives pour l’étude de la texture en musique contemporaine.

La petite enfance nous semble la période idéale pour commencer à développer ces facultés sensorielles. Le cerveau de l’enfant, dès la naissance est extrêmement bien organisé. Il contient des connaissances innées et aussi des « algorithmes sophistiqués d’apprentissage ». Il est très important de ne pas sous-estimer les compétences de l’enfant. Selon Stanislas Dehaene, le métier d’enseignant suppose de respecter quatre principes fondamentaux sur la plasticité cérébrale et les apprentissages : l’attention, l’engagement actif, le retour sur erreurs et la consolidation.⁶⁴⁷ Ces principes sont compatibles avec une grande liberté pédagogique, car l’enseignant devient un véritable expérimentateur. Nous avons expliqué les différentes activités musicales que l’on peut faire avec des enfants sourds. Un enfant sourd, comme un enfant normo-entendant, est attiré par la musique : plaisir du geste, plaisir de la découverte, plaisir de la production. La musique joue un rôle fondamental dans nos vies car elle agit sur nos émotions, notre cognition et notre comportement. L’écoute musicale ne peut être passive, car nous apprenons toujours en agissant. La possibilité de percevoir les sons avec le corps tout entier est une faculté essentielle que nous devons développer avec ces enfants, dès leur plus jeune âge. Le corps est émetteur et récepteur de la communication. La musique dans ce cadre, devient un terrain d’expériences, de jeu et de créativité nécessaires à la construction du langage et à la découverte de soi. Selon Winnicott, « C’est en jouant, et seulement en jouant, que l’individu, enfant ou adulte, est capable d’être créatif et d’utiliser sa personne toute entière. C’est seulement en étant créatif que l’individu découvre le soi ».⁶⁴⁸ Comme le rappelle Grazia Giacco, « la didactique de la musique a développé désormais un intérêt pour ces pratiques pédagogiques où la spatialité du corps — spatialité physique et spatialité symbolique—acquiert toute sa valeur. »⁶⁴⁹

La création sonore avec des enfants sourds, grâce à l’enseignement de la texture à travers le mouvement, ouvre de nouvelles perspectives pour mieux comprendre leurs performances tant sur le plan auditif et moteur. Mais elle permet aussi l’émergence de sensibilités et de comportement singuliers.

Liste des figures

Figure 1 : Hommage à Edgar Varèse – 25.10.64, de Zao Wou-Ki, 2
Figure 2 : Description générale des quatre tissus fondamentaux, 10
Figure 3 : Granit, 11
Figure 4 : Basalte, 11
Figure 5 : Obsidienne, 12
Figure 6 : Pegmatite, 12
Figure 7 : Quartzite, 12
Figure 8 : Gneiss,13
Figure 9 : Schiste, 13
Figure 10 : Exemples de résultats de l’analyse quantitative de texture magnétique présentés sous la forme de figures de pôles directes. 15
Figure 11 : Exemples de différents types de textures alimentaires. 16
Figure 12 : Exemples de différents types de textures en cosmétique, 19
Figure 13 : Extraits de textures de la base de Brodatz, 21
Figure 14 : Berenice Abbott, Soap Bubbles, 1945-46, New York, 23
Figure 15 : Schéma général de la Textualité de Jean Michel Adam, 24
Figure 16 : Plan d’organisation de la texture, 25
Figure 17 : Sheila Hicks, The Silk Rainforest (fils de soie), 1975, silk, linen, and cotton, (243.8 x 685.8 x 7.6 cm), Smithsonian American Art Museum. 28
Figure 18: Mona Hatoum, Pom Pom City, 2002, Natural wool, (5,1 x 365,8 cm), 29
Figure 19: Vue d’exposition : Hella Jongerius, Entrelacs, une recherche tissée (2019), 30
Figure 20: Vue d’exposition : Hella Jongerius, Entrelacs, une recherche tissée (2019). 31
Figure 21 : Vincent Van Gogh, Nuit étoilée, 1889, huile sur toile, (73 X 92 cm), 33
Figure 22: Jackson Pollock dans son atelier, 35
Figure 23: William De Kooning, 1952, Woman II, huile et fusain sur toile, (149.9 x 109.3 cm), 36
Figure 24: Barnett Newman, Onement III (1949), huile sur toile, (182.5 x 84.9 cm), 37
Figure 25: Mark Rothko, Orange and Yellow (1956), huile sur toile, (231.1 x 180.3 cm), Albright-Knox Art, Buffalo (États-Unis). 38

Figure 26: Pierre Soulages, Peinture, 9 mars 2014, Acrylique sur toile, (57 × 81 cm), 39
Figure 27: Texture monophonique (mesures 1 à 4,) 42
Figure 28: Texture homophonique (mesures 5 à 10). 42
Figure 29: Texture polyphonique (mesures 11 à 20). 42
Figure 30: Texture monodique simple. 43
Figure 31: Texture monodique étendue, 43
Figure 32: Deux lignes indépendantes. 44
Figure 33: Exemple de texture homophonique, 44
Figure 34: Vassily Kandinsky, Akzent in Rosa (Accent en Rose), 1926, 47
Figure 35: James Abbott McNeil Whistler, Nocturne: Blue and Silver – Chelsea (1871), 48
Figure 36: Monument en pays fertile, Paul Klee, 1929, 51
Figure 37: Structures pour deux pianos, 52
Figure 38: Paul Cézanne, Le Lac bleu, 1896, Huile sur toile, 65×81 cm, 55
Figure 39: Vue intérieure de la chapelle (Thomas Struth for The New York Times). 58
Figure 40: disposition des panneaux dans la chapelle. 60
Figure 41 : Pithoprakta : description globale des transformations progressives. 62
Figure 42: Exemple de la Sound Box d’Allan Moore : Cliff Richard, Congratulations 68
Figure 43: Illustration de la loi de prégnance, 74
Figure 44: Illustration de la loi de continuité, 75
Figure 45: Illustration de la loi de proximité, 75
Figure 46: Illustration de la loi de similarité, 75
Figure 47: Illustration de la loi de destin commun. 76
Figure 48: Illustrations de la loi de clôture avec notamment le célèbre logo de l’ONG ayant pour but la protection de la nature WWF (World Wildlife Fund), 76
Figure 49 : Schémas des étapes de traitement qui interviennent dans la reconnaissance et l’identification. 80
Figure 50: Différents types de groupements et leurs effets perceptifs. 83
Figure 51: Extrait de l’analyse de Tenney et Polansky, p. 222. 89
Figure 52: Exemple de représentation de la structure de groupe avec le début du Scherzo de la Sonate de Beethoven opus 2, n°2, Extrait de Lerdahl and Jackendoff (1983), p. 15. 91
Figure 53: Exemple de représentation de la structure métrique avec le début de la Symphonie en sol mineur de Mozart. Extrait de Lerdahl and Jackendoff (1983), p. 23. 91
Figure 54: Représentation des structures de groupe et métrique de l’Ouverture du Menuet de la Symphonie n° 104 de Haydn. Extrait de Lerdahl and Jackendoff, p. 26. 92
Figure 55 : Exemple d’une réduction prolongationnelle de Là ci darem la mano de Don Giovanni de Mozart : les branchements à droite représentent les éléments de tension et ceux de gauche la détente, extrait de Lerdahl and Jackendoff, p. 200. 93
Figure 56: Analyse générative de la première phrase de l’Aria des Variations Goldberg de Bach. 93
Figure 57: Représentation schématique de la TGMT (d’après E. Bigand, 1994). 94
Figure 58 : Diagramme générale de la théorie de Lerdhal et Jackendoff. 95
Figure 59: Pianos 1 & 2, altos et violoncelles (chiffre 9), extrait de Philippe Lalitte, 100
Figure 60: Évaluation des distances des strates sonores de la pièce A Day in the Life des Beatles, 107
Figure 61: Illustration de l’effet de continuité, 108
Figure 62 : Sonagramme d’une gamme de Shepard (échelle des fréquences linéaires). 112
Figure 63 : L’escalier de Penrose (Deutsch, 2010). 112
Figure 64 : Jean-Claude Risset dans un laboratoire de la compagnie Bell en train de suivre une composition pour trompette d’Henry Purcell interprété par un ordinateur. Crédit : Hulton Deutsch. 113
Figure 65: Turenas (1972) : pièce pour bande quatre pistes réalisée sur ordinateur, 114
Figure 66: Spectrogramme et transcription d’un extrait du Miserere Dietro l’Altare enregistré par Bernard Lortat-Jacob (1996/1998) à Castelsardo. 116
Figure 67: photo de Bernard Lortat-Jacob. 117
Figure 68: Modèle du Circumplex de Plutchik en trois dimensions (en haut à gauche), 122
Figure 69: Modèle de la Théorie ITPRA de David Huron. 130
Figure 70 : Schéma récapitulatif d’après Lina-Granade et Truy (2005). 134
Figure 71 : Arbre décisionnel pour la classification des surdités, issu de Mondain et collaborateurs (2005) 135
Figure 72 : la courbe audiométrique de l’oreille humaine, 137
Figure 73 : Fonctionnement d’une prothèse auditive conventionnelle, 140
Figure 74 : Courbe des sujets implantés en France depuis 1996 proposé par le CISIC 141
Figure 75 : Représentation schématique des différentes composantes d’un implant cochléaire, 142
Figure 76 : Implant cochléaire Nucleus CI-22 inséré dans la rampe tympanique, 143
Figure 77 : Les 8 configurations des doigts telles que les voit l’enfant pour coder les consonnes, 148
Figure 78 : Les 5 positions de la main pour coder les voyelles avec la LPC 148

Figure 79 : Le signe « Bonjour » extrait du Dictionnaire 1200 signes français-LSF de Monica Companys. 149
Figure 80 : Alphabet dactylologique de la Langue des Signes Française. 150
Figure 81 : Extrait du signe « Encore ». 151
Figure 82 : Gestes associés aux sons. 172
Figure 83 : Extrait de Bien Lire et Aimer Lire, 173
Figure 84 : Extrait de Bien lire et aimer Lire, p. 23 173
Figure 85: Extrait de la notice de la partition Partiels de Grisey, Ricordi, Milano 1976, 178
Figure 86: Diagramme matériau/temps réalisé par Jean-Marc Chouvel sur Partiels de Gérard Grisey, 180
Figure 87: Cycle respiratoire dans Partiels. 182
Figure 88: Extrait de Partiels de Grisey, début de la Section II au numéro 12. 183
Figure 89: Tissu sonore obtenu par cet agencement ingénieux des soufflets. 184
Figure 90: Extrait de Partiels de Grisey, Section II, ch. 18. 185
Figure 91: Extrait de Partiels de Grisey, au début du Repos II, chiffre 22. 186
Figure 92: de haut en bas : forme d’onde, sonagramme et roulement spectral, coefficient d’énergie dans les bandes critiques du chiffre 12 à 22, de la Section II au Repos II , 188
Figure 93 : Coefficient d’énergie dans les bandes critiques. 188
Figure 94 : de haut en bas : forme d’onde, sonagramme et roulement spectral, coefficient d’énergie dans les bandes critiques au chiffre 22, Repos II, 189
Figure 95 : Disposition des instruments, partition éditée chez Breitkopf & Härtel. 190
Figure 96 : Extrait du début de la partition de Mouvement (- vor der Erstarrung) de Lachenmann, Breitkopf & Härtel. 192
Figure 97 : Mouvement (- vor der Erstarrung) de Lachenmann, de la mesure 1 à 27, 193
Figure 98 : Günther Lebbing et Tom Pauwels in Mouvements für Lachenmann de Xavier LeRoy, Tanzquartier Wien, 2005. Photo by Monika Rittershaus. 195
Figure 99 : Futami ga Ura, 196
Figure 100 : Dessin d’esquisse de son œuvre 197
Figure 101 : Plan de textures préparatoire à son œuvre 198
Figure 102 : extrait de la partition Symphony [Myths] de Roger Reynolds, éditions Peters. 199
Figure 103 : Symphony [Myths], de la mesure 1 à 51. 201
Figure 104 : Maurits Cornelis Escher, Mouvement perpétuel ou Cascade,1961, 203
Figure 105 : M.C. Escher, Métamorphoses II, xylographie en noir, vert et brun, en vingt blocs, sur trois feuilles combinées 19,2 x 389,5 cm, novembre 1939-mars 1940. 204

Figure 106 : extrait de la partition de Ligeti, Concerto de Chambre, Movimento preciso e meccanico, 206
Figure 107 : Paul Klee, Chemin principal et chemins secondaires (Hauptwege-und Nebenwege) 1929, 207
Figure 108 : De la lettre C à E, schéma de la formation progressive du cluster, proposé par la musicologue Marie Delcambre-Monpoël. Les chiffres indiqués correspondent aux mesures. 208
Figure 109 : Kammerkonzert de Ligeti, première partie : du début à la lettre C 210
Figure 110 : Kammerkonzert de Ligeti, deuxième partie : de la lettre C à la mesure 40 inclus.
. 211
Figure 111 : Kammerkonzert de Ligeti, troisième partie : de la mesure 41 à la fin du troisième mouvement. 213
Figure 112 : Capture d’écran d’une passation finalisée avec un enfant avec l’explication donnée oralement accompagnée ou pas de LPC (Langage Parlé Complété) ou proposée en Langue des Signes Française (L.S.F.). 219
Figure 113 : Exemples de classements réalisés par deux enfants sourds implantés du groupe expérimental. 220
Figure 114 : Exemples de classements réalisés par deux enfants normo-entendants du groupe contrôle. 221
Figure 115 : MDS des enfants sourds implantés (cooccurrence) 222
Figure 116 : MDS des enfants sourds implantés (à partir d’un algorithme de calcul des distances entre chaque pastille). 224
Figure 117 : MDS des enfants normo-entendants (cooccurrence). 225
Figure 118 : MDS des adultes normo-entendants musiciens (à partir d’un algorithme de calcul des distances entre chaque pastille). 227
Figure 119 : MDS des adultes normo-entendants non-musiciens (à partir d’un algorithme de calcul des distances entre chaque pastille). 227
Figure 120 : Capture d’écran d’une passation finalisée avec un enfant avec l’explication donnée oralement accompagnée ou pas de LPC (Langage Parlé Complété) ou proposée en Langue des Signes Française (L.S.F.). 235
Figure 121 : MDS des enfants IC (à partir d’un algorithme de calcul des distances entre chaque pastille). 236
Figure 122 : MDS des enfants normo-entendants : l’axe 1 correspond ici à la valence et l’axe 2 à l’énergie 239
Figure 123 : Liste de certains descripteurs audio. 243
Figure 124 : Analyse réalisée par les descripteurs audio choisis. 244
Figure 125 : Analyse factorielle discriminante avec le premier F1 (axe horizontale) F2 (axe vertical). 245

Figure 126 : Analyse réalisée par les descripteurs audio de l’expérimentation n°2 (Texture/Émotion). 247
Figure 127 : Analyse réalisée par les descripteurs audio choisis. 248
Figure 128 : Analyse factorielle discriminante de l’expérimentation n°2. 249
Figure 129 : Instrumentarium Orff. 259
Figure 130 : Manuscrit avec notation messine, Laon, Xème siècle 261
Figure 131: Dans la méthode Kodály, la phonomimie est régulièrement utilisée pour faciliter l’intonation. 263
Figure 132: Les Ondes Martenot. 270
Figure 133 : Photo de Valérie Aeschimann, Institut Jacques-Dalcroze, Genève 274
Figure 134 : « Rythmiciennes en plein air », photo de Frédéric Boissonnas, 1909-1910. 276
Figure 135 : Illustrations de la phase d’éveil corporel. 280
Figure 136: « Jeu de Kim ». 281
Figure 137 : Travail autour de la mesure à 4 temps avec des bâtons colorés 283
Figure 138 : Travail de la conscience rythmique à l’aide de balles. 284
Figure 139 : Utilisation du ruban 286
Figure 140 : Composition, 2015 de Philippe Séro-Guillaume, 288
Figure 141 : Premier jet de notre travail 289
Figure 142 : Partition collective de l’Ile Bleu Azur 290
Figure 143 : Concert des enfants devant Philippe Sero-Guillaume au Ceop. 290
Figure 144 : Salle d’interaction Musique-Geste LEAD 294
Figure 145 : Schéma général de l’interface musicale. 295
Figure 146 : Expérimentation des enfants sourds implantés au LEAD. 295
Figure 147 : Visualisation du mouvement d’un enfant sourd implanté. 298

Liste des tableaux

Tableau 1 : Classification audiométrique des déficiences auditives du Bureau International d’Audio- Phonologie, p.136
Tableau 2 : Abréviations : P (pulsé), A (aéré), D (dense), L (lisse) et le nom de fichier, p.218
Tableau 3 : Liste des œuvres, p.234
Tableau 4 : Classification des descripteurs audio, p.244

Annexes

J’invite les membres du jury à se connecter au lien Dropbox ci-dessous, s’ils souhaitent consulter les extraits de partitions de Partiels de Grisey, de Mouvement (- vor der Erstarrung) de Lachenmann, du 3ème mouvement du Concerto de chambre de Ligeti ainsi que du début de la Symphonie Myths de Reynolds (où il manque la page 4 et 5), en lien avec nos analyses texturales (chapitre 5).

L’ensemble des extraits correspondants à nos deux expérimentations sont également disponibles sur cette même Dropbox :

1_Représentation_cognitive_des_textures : 24 extraits

2_ Représentation_emotionnelle_des_textures : 24 extraits.

https://www.dropbox.com/sh/l7ipwj36fncmido/AAAkS8g1e3PJNjwkngpcfIBUa?dl=0

Bibliographie

A :

ADAM Jean Michel, « Une alternative au « tout narratif » : les gradients de narrativité », Recherche en Communication, Vol. 7, 1997, p. 11-36.

AFSIN Kémâl, « Psychopédagogie de l’écoute musicale », Orphée Apprenti, Atelier du GRIAM, Octobre 2010, p. 42-59.

AFSIN Kémâl, Psychopédagogie de l’écoute musicale, Bruxelles, De Boeck Université, 2009. AGAWU Kofi, Playing with Signs: A Semiotic Interpretation of Classic Music, Princeton, Princeton University Press. 1991.

AGOSTI-GHERBAN Cristina, L’éveil musical, une pédagogie évolutive, Paris, L’Harmattan, 2000. ALBÈRA Philippe, À propos de « Die glückliche Hand », in Schoenberg-Kandinsky. Correspondance, écrits : Revue Contrechamps n° 2, Genève, Éditions Contrechamps, 1984, p. 156-166.

ALBERTINI John A., « Deafness and Hearing Loss », The Corsini Encyclopedia of Psychology, Ed. I. B. Weiner and W. E. Craighead. 4th ed, Vol. 2, Hoboken: John Wiley & Sons, 2010, p. 461-62.

ALIS Valérie et JUBIEN Nicole, « Quelques particularités de l’accès au langage chez l’enfant sourd, » in Implant cochléaire pédiatrique et rééducation orthophoniste, Médecine-Sciences, Flammarion, Paris, 2009, p. 14.

ANDEM, L’implant cochléaire chez l’enfant sourd pré-lingual, Paris, ANDEM-Service des Études, 1994.

ANDERSON M. William. & LAWRENCE E. Joy, Integrating music into the elementary classroom, (7e éd.), Belmont, Thomson Higher Education, 2007.

ANSHEL Anat & KIPPER David A., « The influence of group singing on trust and cooperation »,

Journal of Music Therapy, Vol. 25, n° 3, 1988, p. 145-155.

ANZIEU Didier, Le Moi-peau, Paris, Dunod, 1985.

AROM Simha, « Les musiques traditionnelles d’Afrique centrale », Contrechamps, janvier 1988, n°10, p. 177-195.

ASHTON Dore, About Mark Rothko, Oxford University Press, 1983 (réed. 1996 et 2003).

ATTIA Dhouha, « Segmentation d’images par combinaison adaptative couleur-texture et classification de pixels : Applications à la caractérisation de l’environnement de réception de signaux GNSS », Thèse de Doctorat, Université de Technologie de Belfort-Montbeliard, 2013.

AUGOYARD Jean-François et TORGUE Henry, A l’écoute de l’environnement : répertoire des effets sonores, Marseille, Editions Parenthèses, 1995.

B :

BACHELARD Gaston, La Dialectique de la durée (1950), Paris, PUF, 1980.

BACHMANN Marie-Laure, La Rythmique Jaques-Dalcroze, une éducation par la musique et pour la musique, À la Baconnière, Neuchâtel, 1984.

BADDELEY Alan, « Working Memory », Science, Vol. 255, n°5044, 1992, p. 556-559. BAGOT Jean Didier, Information, sensation et perception, Paris, Armand Colin. 1999.

BAILLET Jérome, « Partiels de Gérard Grisey », in L’éducation musicale, supplément aux n° 473/474, septembre-octobre 2000, p. 47-56.

BALAS Daniel et PHILIP Patrick, Cours d’Histologie générale [en ligne], Université de Nice Sophia-Antipolis, http://www.db-gersite.com/HISTOLOGIE/HISTGENE/index.html

BARKÓCZI Llona & PLÉH Csaba, Etude de l’effet psychologique de la méthode d’éducation musicale de Kodály, Kecskemét, Institut de pédagogie musicale Zoltán Kodály, 1982.

BARTHEL-CALVET Anne-Sylvie « De la dispersion à la fusion sonore : écriture et perception des textures xenakiennes », Analyse Musicale, Vol. 38, Paris, 2001, p. 86-96.

BAUDIN Thierry, CHATEIGNER Daniel, ESLING Claude, LUTTEROTTI Luca et MORALES Magali, « Analyse des textures cristallographiques et des microstructures », Reflets de la physique, La Cristallographie, Sciences et Techniques, n° 44-45, 2015, p. 80-85.

BEDOUIN Nathalie, BESOMBES Anne-Marie, ESCANDE Eliette, DUMONT Annie & TILLMANN Barbara, « Déficits morphosyntaxiques chez des enfants sourds implantés : hypothèses et pistes de remédiation par le rythme musical », Rééducation orthophonique, n°268, 2016, p. 261-288.

BEDOUIN Nathalie, BESOMBES Anne-Marie, ESCANDE Eliette, DUMONT Annie, LALITTE Philippe & TILLMANN Barbara, « Boosting syntax training with temporally regular musical primes in children with cochlear implants », Annals of Physical and Rehabilitation Medicine, Vol. 61, n°6, 2018, p. 365-371.

BENWARD Bruce & SAKER Marilyn, Music: In Theory and Practice, Vol. I. Seventh Edition, McGraw-Hill, New York, 2003.

BERNARDES Gilberto, « David Huron, Voice Leading: The Science Behind a Musical Art », Portuguese Journal of Musicology, Vol. 4, n°1, 2017, p. 219-226.

BERRY Wallace, Structural Functions in Music (1976), 2de édition, Dover, Mineola, 1987.

BERTONCINI Josiane et DE BOYSSON-BARDIES Bénédicte. « Chapitre 4. La perception et la production de la parole avant deux ans », Michèle Kail éd., L’acquisition du langage. Vol. I. Le language en émergence. De la naissance à trois ans, Presses Universitaires de France, 2000, p. 95-136.

BEYAERT Anne, « De la texture à la matière », Protée, Vol. 36, n°2, 2008, p. 101-110. BEYAERT Anne, « Texture, couleur, lumière et autres arrangements de la perception », Protée, Vol .3, n°3, 2003, p. 81–90.

BEYAERT Anne, « Modernité et synesthésies », dans VISIBLE, n°1, La diversité sensible, PULIM, 2006, p. 25-36.

BEYRAND Chloé, « Comment sont véhiculées les émotions dans la texture de la musique contemporaine ? », Mémoire de Master 1 sous la direction de Philippe Lalitte, 2016.

BHARUCHA Jamshed, « Music cognition and perceptual facilitation: A connectionist framework », Music Perception, n°5, 1987, p. 1-30.

BIGAND Emmanuel, « The influence of implicit harmony, rhythm and musical training on the abstraction of tension-relaxation schemas in tonal music phrases », Contempory Music Review, Vol. 9, 1993, p. 123-137.

BIGAND Emmanuel, « Traveling through Lerdahl’s Tonal Pitch Space Theory: A psychological perspective », Musicae Scientae, Vol. 7, n°1, 2003, p. 121-155.

BIGAND Emmanuel, « Contribution de la musique aux recherches sur la cognition auditive humaine », in S. McAdams et E. Bigand (éd.), Penser les sons : La psychologie auditive de l’audition, Paris, PUF, 1994.

BIGAND Emmanuel, « L’émotion dans le langage musical », in Parole et Musique : Aux origines du dialogue humain, sous la direction de Stanislas Dehaene et Christine Petit, Odile Jacob, 2009, p. 343-357.

BIGAND Emmanuel, FILIPIC Suzanne & LALITTE Philippe, « The time course of emotional responses to music », Annals of the New York Academy of Sciences, 1060, 2005, p. 429-437.

BIGAND Emmanuel, Les bienfaits de la musique sur le cerveau, Paris, Belin, coll. « Cerveau et bien-être », 2018.

BIGAND Emmanuel, « Musiciens et non-musiciens perçoivent-ils la musique différemment ? » in Le Cerveau Musicien, Paris, De Boeck University, 2006.

BIGAND Emmanuel, PARNCUTT Richard, LERDHAL Fred, « Perception of musical tension in short chord sequences: the influence of harmonic function, sensory dissonance, horizontal motion, and musical training », Perception and Psychophysics, Vol. 58, n°1, 1996, p. 125-141.

BIGAND Emmanuel, TILLMANN Barbara, PERETZ Isabelle, ZATORRE Robert J., LOPEZ Luisa & MAJNO Maria, « The Neurosciences and Music – V, Cognitive stimulation and Rehabilitation », Annals of the New York Academy of Sciences, Vol. 1337, New York, 2015.

BIGAND Emmanuel, VIEILLARD Sandrine, MADURELL François, MAROZEAU Jeremy, DACQUET Alice, « Multidimensional scaling of emotional responses to music: the effects of musical expertise and of the duration of the excerpts », Cognition and Emotion, Vol. 19, n°8, 2005, p. 1113-1139.

BIOTEAU Alain, « Spatialisation et écriture de l’espace, des pionniers à Emmanuel Nunes », dans Nicolas Donin et Laurent Feneyrou (dir.), Théories de la composition musicale au XXe siècle, Lyon, Symétrie, 2013, vol. 2, p. 1337-1366.

BISSELL Arthur Dart, The Role of Expectation in Music: A Study In The Psychology Of Music, New Haven, 1921.

BIZAGUET Éric, « L’appareillage de l’enfant sourd », Revues générales : Audition, Réalités pédiatriques, n°175, Décembre 2012, p. 17-22.

BLAMEY Peter J., SARANT Julia Z., PAATSCH Louise E., BARRY Johanna G., BOW Catherine P., WALES Roger J., et al., « Relationships Among Speech Perception, Production, Language, Hearing Loss, and Age in Children with Impaired Hearing », Journal of Speech Language Hear Research, Vol. 44, n°2, 2001, p. 264-285.

BLOOD Anne J. & ZATORRE Robert J., « Intensely pleasurable responses to music correlate with activity in brain regions implicated in reward and emotion », Proceedings of the National Academy of Sciences of the United States of America, Vol. 98, n°20, 2001, p. 11818-11823.

BOBÉE Emmanuelle, « La partition sonore et musicale de « Dunkerque » (C. Nolan, 2017). « Une expérience sensorielle inédite », Revue musicale OICRM, Vol. 5, n°2, 2018, p. 125–148.

BONNET Claude, « La perception visuelle des formes », in C. Bonnet, R. Ghiglione, J.F. Richard (éd), Traité de psychologie cognitive Vol.1, Paris, Dunod, p. 1-82, 1989.

BOREL-MAISONNY Suzanne, Langage oral et écrit. Tome 1 : Pédagogie des notions de base. Étude expérimentale et applications pratiques. Tome 2 : Épreuves sensorielles et tests de langage. Appréciation de l’état du langage, Neuchâtel, Paris, Delachaux & Niestlé, 1960.

BORT Françoise, DUPONT Valérie, Texte, texture, textile, Variations sur le tissage dans la musique, les arts plastiques et la littérature, Éditions universitaires de Dijon, 2013.

BOSSEUR Jean-Yves, « Texture et matériau dans la pensée musicale contemporaine », Analyse Musicale n°38, Paris, février 2001, p. 129-139.

BOUHIER-CHARLES Nathanaëlle, Signe avec moi : la langue gestuelle des sourds à la portée de tous les bébés, Editions Monica Companys, 2006.

BOULEZ Pierre, « Le Temps Musical », 1978-02-17-1978-02-23, Conférence du 17/02/1978 autour du Kammerkonzert de Ligeti, Centre Georges Pompidou, Paris. https://medias.ircam.fr/embed/media/xfdefef_kammerkonzert-gyorgy-ligeti

BOULEZ Pierre, Le pays fertile : Paul Klee, texte préparé et présenté par Paule Thévenin, Paris, Gallimard, 1989.

BOULEZ Pierre, Penser la musique aujourd’hui, Paris, Denoël Gonthier, 1963. BOULEZ Pierre, Point de repère III. Leçon de musique, Paris, Christian Bourgois. 1995. BOULEZ Pierre, Point de repère, I, Imaginer, Paris, Christian Bourgeois, 1995.

BRACKETT David, Interpreting Popular Music, Berkeley, University of California Press, 2000.

BREGMAN Albert S. et MCADAMS Stephen, « Hearing Musical Streams », Computer Music Journal, Vol. 3, n° 4, 1979, p. 26-43.

BREGMAN Albert S. et PINKER Steven, « Auditory Streaming and the Building of Timbre », Canadian Journal of Psychology, Vol. 32, 1978, p. 19-31.

BREGMAN Alfred S. & CAMPBELL Jeffrey, « Primary auditory stream segregation and perception of order in rapid sequences of tones », Journal of Experimental Psychology, Vol. 89, n°2, 1971, p. 244-249.

BREGMAN Alfred S., « L’analyse des scènes auditives : l’audition dans des environnements complexes », in McADAMS Stephen et BIGAND Emmanuel, éd., Penser les sons, psychologie cognitive de l’audition, Paris, Presses universitaires de France, 1994, p. 11-39.

BREGMAN Alfred S., Auditory scene analysis: The perceptual organization of sound, MIT Press/Bradford Books, Cambridge, Mass, 1990.

BRESLIN James E. B, Mark Rothko: a biography, Chicago, University of Chicago Press, 1993.

BRICE Marie, Pédagogie de tous les possibles… La Rythmique Jacques-Dalcroze, Genève, Editions Papillon, 2012.

BRIEC Julie, LE MANER-IDRISSI Gaïd, DARDIER Virginie, ROUXEL Géraldine, TAN-BESCOND Géraldine & GODEY Benoit, « Échanges conversationnels avec un partenaire familier : étude comparative entre enfants sourds, implantés cohléaires depuis 2 ans et enfants entendants. », L’Année psychologique, Vol. 112, n°1, 2012, p. 17-48.

BRODATZ Phil, Texture: a photographic album for artists and designers, New York, Dover Publications, 1966.

BRUNER Jérome S., Le développement de l’enfant, savoir faire, savoir dire (Trad. M. Deleau), Paris, P.U.F., 1983.

BUREL Gilles, « Réseaux de neurones en traitement-Des Modèles théoriques aux Applications Industrielles », Thèse d’état, Université de Bretagne occidentale, 1991.

BURGGRAEVE Adolphe, Anatomie de texture ou Histologie, appliquée à la physiologie et à la pathologie, Gand, Annoot-Braekman, 1845.

C :

CAMBOUROPOULOS Emilios et TSOUGRAS Costas, « Auditory Streams in Ligeti’s Continuum: A Theoretical and Perceptual Approach », Journal of Interdisciplinary Music Studies, Vol. 3, n° 1-2, printemps-automne 2009, p. 119-137.

CANNAM Chris, LANDONE Christian and SANDLER Mark, « Sonic Visualiser: An Open Source Application for Viewing, Analysing, and Annotating Music Audio Files », in Proceedings of the ACM Multimedia 2010 International Conference, 2010.

CARRÉ Alain, Musique et surdité, Ed. Fuzeau, 2008.

CASTELLENGO Michèle, LORTAT-JACOB Bernard, LEOTHAUD Gilles, « Un paradoxe de perception de la hauteur : la « quintina » des chanteurs sardes », ISMA (International Symposium on Musical Acoustics), Perugia (Italie), 2001.

CELESTE Bernadette DELALANDE François, DUMAURIER Elisabeth, L’enfant, du sonore au musical, Paris, Buchet/Chastel-INA, coll. Bibliothèque de Recherche Musicale, 1982.

CHAPMAN Robin S., « Children’s Language Learning: An Interactionist Perspective », Journal of Child Psychology and Psychiatry and allied disciplines, Vol. 41, n°1, 2000, p. 33-54.

CHAPUIS Jacques, « De l’Initiation musicale au Solfège vivant », Panorama Pédagogique de l’Education Musicale Willems, 1, p. 1-8, 1980.

CHEMILLIER Marc, « György Ligeti et la logique des textures », Analyse musicale n°38, 2001, p. 75-85.

CHERRY Edward Colin & TAYLOR, W. K., « Some experiments on the recognition of speech, with one and two ears », Journal of the Acoustic Society of America, Vol. 26, 1953, p. 554-559.

CHEVAIS Maurice, Education musicale de l’enfance (Vol. 1), Paris, Leduc, 1937. CHEVAIS Maurice, L’art d’enseigner (Vol. 2), Paris, Leduc, 1943.

CHOUVEL Jean-Marc, « Extrême présence du phénomène : parcours de la forme dans l’oeuvre de Gérard Grisey », in Le temps de l’écoute. Gérard Grisey ou la beauté des ombres sonores, textes réunis par Danielle Cohen Levinas, L’Harmattan/L’Itinéraire, Paris, 2004 p. 71-86.

CHOUVEL Jean-Marc, Analyse musicale, Sémiologie et cognition des formes temporelles, Paris, CNRS / L’harmattan, 2006.

CHOWNING John, « The simulation of moving sound sources », Journal of the Audio Engineering Society, Vol. 19, n. 1, 1971, p. 2-6, republié dans Computer Music Journal, Vol. 1, n°3, 1977, p. 48-52.

CHOWNING John, La Spatialisation des musiques électroacoustiques, Publications de l’université de Saint-Etienne, Saint-Etienne, 2012.

Chris CANNAM, Christian LANDONE, and Mark SANDLER, « Sonic Visualiser: An Open Source Application for Viewing, Analysing, and Annotating Music Audio Files », in Proceedings of the ACM Multimedia 2010 International Conference, 2010.

CIRELLI Laura K., EINARSON Kate & TRAINOR Laurel J., « Interpersonal synchrony increases prosocial behavior in infants », Developmental Science, Vol. 17, n°6, 2014, p. 1003-1011.

CIVILLE Gael Vance & DUS Clar A., « Evaluating tactile properties of skincare products: a descriptive analysis technique », Cosmetics and Toiletries 106, 1991, p. 83-88.

CLARK Graeme, « Cochlear implants in children: safety as well as speech and language », Int J Pediatr Otorhinolaryngol, Vol. 67, Suppl 1, p. 7-20, 2003.

CLARKE Eric F. et KRUMHANSL Carol L., « Perceiving Musical rime », Music Perception, Vol. 7, 1990, p. 213-253.

CLARKE Erick, Ways of Listening: An ecological approach to the perception of musical meaning, Oxford, NY, Oxford University Press, 2005.

COENE Martine & SCHAUWERS Karen & GILLIS Steven & ROORYCK Johan & GOVAERTS Paul. « Genetic predisposition and sensory experience in language development: Evidence from cochlear-implanted children », Language and cognitive Processes, Psychology Press, Vol. 26, n°8, 2011, p. 1083-1101.

COMEAU Gilles, Comparaison de trois approches d’éducation musicale, Jaques-Dalcroze, Orff ou Kodály ?, Vanier, CFORP, 1995.

CONNOR Carol M., CRAIG Holly K., RAUDENBUSH Stephen W., HEAVNER Krista & ZWOLAN Teresa A., « The Age at Which Young Deaf Children Receive Cochlear Implants and Their Vocabulary and Speech-Production Growth: Is There an Added Value for Early Implantation? », Ear Hearing, Vol. 27, n°6, 2006, p. 628-644.

CONWAY Christopher M. & CHRISTIANSEN Morten H., « Seeing and Hearing in Space and Time : Effects of modality and presentation rate on implicit statistical learning », European Journal of Cognitive Psychology, Vol. 21, n°4, 2009, p. 561-580.

CORBEIL Mariève, TREHUB Sandra E. et PERETZ Isabelle, « Singing delays the onset of infant distress », Infancy, Vol. 21, p. 373-391.

CORNETT Orin R., « Cued Speech », American Annals of the Deaf, Vol.112, p. 3-13, 1967.

D :

DAMASIO Antonio R., L’Erreur de Descartes. La raison des émotions, Paris, Odile Jacob, 1995. DAMBRICOURT Jean-Pierre, « György Ligeti et le Kammerkonzert pour treize instruments », Éducation musicale n° 462-463, Septembre-Octobre 1999, p. 40-52.

D’ANGIOLINI Giuliano, Jesu, un chant de confrérie en Sardaigne, Éditions Delatour France, Sampzon, 2009.

DANIEL Christine et ROUDOT Alain-Claude, « La terminologie de la texture des aliments », Érudit, Méta, Vol. 52, n°2, juin 2007, p. 342-351.

DARROW Alice-Ann, « Music for the Deaf », Music Educators Journal, Vol. 71, 1985, p. 33-35. DARWIN Charles, The Expression of the Emotions in Man and Animals, London, John Murray, 1872.

DAUMAN René, CARBONNIERE Bernadette, SORIANO Véronique, BERGER-LAUTISSIER

Sylvie, BOUYÉ Jany, DEBRUGE Éric, CORIAT Géraldine et BÉBÉAR Jean-Pierre, « Implants cochléaires chez l’adulte et l’enfant », Encycl Méd Chir (Elsevier, Paris), Oto-rhino-laryngologie, 20-185- D-10, 1998, p. 7.

DE BOYSSON-BARDIES Bénédicte, Comment la parole vient aux enfants, Paris, Odile Jacob poche, 2005.

DEBUSSY Claude, Monsieur Croche et autres écrits, Paris, Gallimard, 1971.

DEHAENE Stanislas et PETIT Christine, Parole et musique : Aux origines du dialogue humain, Paris, Odile Jacob, 2009.

DEHAENE Stanislas, Apprendre ! Le talent du cerveau, le défi des machines, Paris, Odile Jacob, 2018.

DELALANDE François, La musique est un jeu d’enfant, Paris, Buchet/Chastel, coll. Bibliothèque de Recherche musicale, 1984.

DELAPLACE Joseph, György Ligeti. Un essai d’analyse et d’esthétique musicales, Rennes, Presses universitaires de Rennes, 2007.

DELAPLACE Joseph, « Rothko Chapel de Morton Feldman : approches analytiques d’une « procession immobile » », Déméter, Centre d’étude des arts contemporains, Université Lille 3, 2015. http://demeter.revue.univ-lille3.fr/lodel9/index.php?id=430

DELAROCHE Monique, Au fil des regards et des caresses…, Ortho-éditions, 2012.

DELCAMBRE-MONPOËL Marie, « György Ligeti, Kammerkonzert », Musurgia, Vol. VI, n° 3-4, 1999. p. 57-79.

DELEAU Michel & LE MANER-IDRISSI Gaid, « Le développement des habiletés pragmatiques chez les enfants sourds », in L’acquisition du Langage Chez l’Enfant Sourd, Marseille, Solal, 2005.

DELIEGE Célestin, Cinquante ans de modernité musicale : De Darmstadt àl’IRCAM, contribution historiographique à une musicologie critique, Bruxelles, Editions Mardaga, 2003.

DELIEGE Célestin, Invention musicale et idéologie 2, Mutations historiques et lectures critiques de la modernité, Bruxelles, Editions Mardaga, 2007.

DELIEGE Irène et SLOBODA John, Naissance et développement du sens musical, Paris, PUF, 1995.

DELIEGE Irène, « Grouping conditions in listening to music: An approach to Lerdahl & Jackendoff’s grouping preference rules », Music Perception, n° 4, 1987, p. 325-359.

DEMANGE Michel, Les Textures des roches cristallines, Aspects microscopiques, Presse des Mines, coll. Sciences de la Terre et de l’environnement, 2011.

DERRIDA Jacques, La dissémination, Paris, Seuil, 1972. DERRIDA Jacques, Marges de la philosophie, Paris, Minuit, 1972.

DESAUNAY Melodie, FLEURIOT Pierre, DEBRUILLE Louis, GARNIER Stéphane, GARABEDIAN Erea Noël, LOUNDON Nathalie, MARLIN Sandrine, DENOYELLE Françoise, TRAN BA HUY Patrice, De WAELE Catherine, GILBERT Gaëtan & LORENZI Christian, « Rôle des informations d’enveloppe temporelle et de structure temporelle fine dans l’intelligibilité de la parole chez les sujets entendants et malentendants », Les Cahiers de l’Audition, Vol. 20, n°3, 2007, p. 46-50.

DESROCHES Monique, STÉVANCE Sophie et LACASSE Serge, Quand La Musique Prend Corps, Presses De L’Université De Montréal, 2014.

DÉSY PROULX Monique, Pourquoi la musique ? Son importance dans la vie des enfants, Montréal, Éditions du CHU Sainte-Justine, 2014.

DEUTSCH Diana, « An auditory illusion », Nature, n° 251, 1974, p. 307-309.

DEUTSCH Diana, « Grouping mechanisms in music », In D. Deutsch (Ed.). The Psychology of Music, 1982, p. 99-134, New York: Academic Press. « The processing of pitch combinations », In D. Deutsch (Ed.). The Psychology of Music, p. 271-316.

DEUTSCH Diana, « The Paradox of Pitch Circularity », Acoustics Today, Vol. 6, n° 3, Juillet 2010, p. 8-14.

DEUTSCH Diana, Psychologie de la musique, Paris, PUF, 1994.

DEUTSCH Diana, « La perception des structures musicales », In Psychologie de la musique, sous la direction d’Arlette Zenatti, Paris, Presses Universitaires de France, 1994, p. 115-144. Dictionnaire 1200 signes français-LSF, Editions Monica Companys, 2000.

DIVENYI Pierre L. and OLIVER Susan K., « Resolution of Steady State Sounds in Simulated Auditory Space », The Journal of the Acoustical Society of America, Vol. 85, n°5, 1989, p. 2042-52.

Dossier « Génétique et Surdité », Collège National d’Audioprothèse, Vol. 26, n°1, 2013, p. 6-20. Dossier de presse « Sheila Hicks au festival d’Automne », propos recueillis par Clément Dirié, juin 2016.

DOUGLAS Chelsea, NOBLE Jason et MCADAMS Stephen, « Auditory Scene Analysis and the Perception of Sound Mass in Ligeti’s Continuum », Music Perception, Vol. 33, n° 3, 2015, p. 287-305.

DOWLING JAY Walter, « La structuration mélodique : perception et chant » (P.-E. Dauzat, trad.), in

A. Zenatti (Ed.), Psychologie de la musique, Paris, PUF, 1994, p. 145-176.

DUBUFFET Jean, L’Homme du commun à l’ouvrage, Paris, Gallimard, 1973.

DUBUISSON Pauline, « Influence de la phase grasse et des polymères naturels sur les paramètres physico-chimiques en lien avec la perception tactile de l’émulsion », Thèse de doctorat, Université du Havre, 2017.

DUMONT Annie, Implantations cochléaires : guide pratique d’évaluation et de rééducation, Isbergues, Ortho Edition, 1997.

DUNCAN Ryan P., EARHART Gammon M., « Are the effects of community-based dance on Parkinson disease severity, balance, and functional mobility reduced with time? A 2-year prospective pilot study », Journal of alternative and complementary medicine, Vol. 20, n°10, p. 757-763.

DUNSBY Jonathan, « Considerations of Textures », Oxford University Press, Music & Letters, Vol. 70, N° 1, 1989, p. 46-57.

DUTILLEUX Henri, Constellations : entretiens / Henri Dutilleux, Martine Cadieux, avant-propos de Jean Roy, Paris, M. de Maule, 2007.

DUTILLEUX Henri, Le Nouvel Observateur, rubrique « Le Musée égoïste », octobre 1984, reproduit dans la note de programme du concert de l’Orchestre de Paris, 1er et 2 juillet 1995, Cité de la Musique.

DUTOIT-CARLIER Claire-Lise, Emile Jaques-Dalcroze, créateur de la rythmique, A la Baconnière, Neuchâtel, 1965.

DYSON George, « The Texture of Modern Music », Oxford University Press, Music & Letters, Vol. 4, n° 2, 1923, p. 107-118.

E :

EEROLA Tuomas, « The dynamics of musical expectancy: Cross-cultural and statistical approaches to melodic expectations », Jyväskylä studies in humanities, 2003.

EGGERMONT Jos J. & PONTON Curtis W., « Auditory-evoked Potentials Studies of Cortical Maturation in Normal Hearing and Implanted Children: Correlations in Changes in Structure and Speech Perception », Acta Otorhinolaryngology, Vol.123, n°2, 2003, p. 249-252.◻

EHRENFELS Chritian von, « Über Gestaltqualitäten ». Vierteljahresschrift für wissenschaftliche Philosophie, 14, 1890-1922, p. 249-292.

EILERS et OLLERS, « Infant vocalizations and the early diagnosis of severe hearing impairment », J. Pediatr., Vol. 124, n°2, 1994, p 199-203.

EIMERT Herbert, « Debussys Jeux », Die Reihe, n°5, 1959, p. 7-8.

EISENBERG Laurie, MARTINEZ Amy, HOLOWECKY Suzanne, POGORELSKY Stephanie, « Recognition of lexically controlled words and sentences by children with normal hearing and children with cochlear implants », Ear Hear, Vol. 23, n°5, p. 450-62.

EKMAN Paul, « Biological and Cultural Contribution to Body and Facial Movements in the Expression of the Emotions », p.73-101, in A.O. Rorty (dir.), Explaining Emotions, Los Angeles, University of California Press, 1980.

ERICKSON Robert, Sound Structure in Music, Berkeley, University of California Press, 1975. Expertise Collective, Déficits auditifs : Recherches émergentes et applications chez l’enfant, Inserm, 2006.

F :

FAGAN Mary K. & PISONI David B., « Hearing Experience and Receptive Vocabulary Development in Deaf Children With Cochlear Implants », Journal of Deaf Studies and Deaf Education, Vol. 15, n°2, 2010, p. 149-161.

FELDMAN Morton, Écrits et paroles, précédés d’une monographie de Jean-Yves Bosseur, Paris, L’Harmattan, 1998.

FENEYROU Laurent, « Debussy au miroir des écrits de Boulez », Delatour France, Goldman, Nicolas, Nattiez. La Pensée de Pierre Boulez à travers ses écrits, 2010, p. 161-176.

FERNANDEZ-MALOIGNE Christine, MACAIRE Ludovic, ROBERT-INACIO Frédérique, « Imagerie numérique, avancées et perspectives pour la couleur », in Couleur Numérique, Acquisition, Perception, Codage et rendu, Paris, Lavoisier, 2012, p. 227-234.

FERNANDO Nathalie, EGERMANN Hauke, CHUEN Lorraine, KIMBEMBÉ Bienvenu et MCADAMS Stephen, « Musique et émotion : Quand deux disciplines travaillent ensemble à mieux comprendre le comportement musical humain », Anthropologie et Sociétés, 2014, Vol. 38, n°1, p. 167–191.

FERON François-Xavier, « L’art du Trompe-l’oreille rythmique », Intermédialités : histoire et théorie des arts, des lettres et des techniques, n° 16, Rythmer/Rhythmize, 2010, p. 145- 165.

FERON François-Xavier, « Propositions pour une typologie des phénomènes sonores insolites », Hybrid. Revue des arts et médiations humaines, Labex Arts H2H/Presses Universitaires de Vincennes, 2015.

FIJALKOW Claire, « Du plaisir et de la méthode avant toute chose… » in C. Fijalkow (Ed.), Maurice Chevais (1880-1943) : un grand pédagogue de la musique, Paris, L’Harmattan, 2005, p. 69-92.

FINNEY Eva M., FINE Ione & DOBKINS Karen R., « Visual Stimuli activate auditory cortex in the deaf », Nature Neurosciences, Vol. 4, n°12, 2001, p. 1171-1173.

FINNEY John, « John Paynter, music education and the creativity of coincidence », British Journal of Music Education, Vol. 28, n°1, 2011, p. 11-26.

FONTANILLE Jacques, Sémiotique du visible. Des mondes de lumière, Paris, P.U.F., 1995. FRAISSE Paul, Psychologie du temps, Paris, Presses Universitaires de France, 1957.

FRANCÈS Robert, La Perception du Rythme, Paris, Vrin, 1958. Francis WOLFF, Pourquoi la musique ?, Paris, Fayard, 2015.

FRANGNE Pierre-Henry, LACOMBE Hervé, MASSIN Marianne, PICARD Timothée. « Musique et émotion : problèmes et enjeux », in Pierre-Henry Frangne, Hervé Lacombe, Marianne Massin et Timothée Picard, La valeur de l’émotion musicale, Presses universitaires de Rennes, p. 9-36, 2017.

FRAPAT Monique, L’invention musicale en maternelle, Centre régional de documentation pédagogique de Versailles, 1990.

G :

GADAMER Hans-Georg, Wahrheit und Methode (W.M), Tübingen, J.C.B. Mohr, 1960, 2. Auflage, 1965, trad. française partielle Vérité et Méthode, Paris, éd. Du Seuil, 1976.

GAGALOWICZ André, « Vers un modèle de textures », Thèse d’état, Université Pierre et Marie Curie, 1983.

GALLEGO Carlos, MARTIN-ARAGONESES Teresa, LOPEZ-HIGES Ramón & PISON Guzmán, « Semantic and syntactic reading comprehension strategies used by deaf children with early and late cochlear implantation. », Research in developmental disabilities, Vol. 49-50, 2016, p. 153-170.

GAPENNE Olivier et ROVIRA Katia, « Psychologie et cognition sans langage. Actualité d’une figure historique », Intellectica, 1999/1, n° 28, p. 229-250.

GARRIGUES Juliette, ATMOSPHÈRES (G. Ligeti), Encyclopædia Universalis [en ligne], consulté le 18 février 2018. URL : http://www.universalis.fr/encyclopedie/atmospheres/

GIACCO Grazia et LORANT Sonia, « Pour une didactique de la création artistique : Axes, projets, bilan (2014-2016) », Le Ragioni di Erasmus–Revue en ligne de l’Université de Roma 3, Roma TrE-Press, 2017, p. 153-168.

GIACCO Grazia, « Geste et voix, entre corps et souffle : pour une didactique de la création artistique », Revue Recherche en éducation musicale, n° 33, Juillet 2016, p. 63-89.

GILLEY Phillip M., SHARMA Anu & DORMAN Michael F., « Cortical reorganization in children with cochlear implants », Brain Research, Vol.1239, n°6, 2008, p. 56-65.

GIORDAN, André, Apprendre ! Paris, Belin, coll. Débats, 1998.

GOLD Claudia M., À l’écoute des émotions de l’enfant, Paris, Albin Michel, 2014. GONIN Philippe, Pink Floyd, Atom Heart Mother, Scérén/CNDP, Paris, 2011.

GOODCHILD Meghan et MCADAMS Stephen, « Perceptual Processes in Orchestration », in The Oxford Handbook of Timbre, Oxford University Press, 2018.

GORDON Edwin E., A music learning theory for newborn and young children, Chicago, G.I.A. Publications, 3e édition, 2003.

GORDON Edwin E., Learning sequences in music skill, content and patterns, Chicago, G.I.A. Publications, 1988.

GOSSELIN Pierre & LE COGUIEC Éric, La recherche création : Pour une compréhension de la recherche en pratique artistique, Québec, Presses de l’Université du Québec, 2006.

GOVAERTS Paul J., DAEMERS Kristin, SCHAUWERS Karen, De BEUKELAER Carina, YPERMAN Marjan, De CEULAER Geer., et al., « Implantation précoce et/ou bilatérale. » Rééducation orthophonique, n°217, 2004, p. 31-47.

GRAHAM Daniel J., MENG Ming, « Artistic representations: clues to efficient coding in human vision », Visual Neuroscience, Vol. 28, n°4, 2011, p. 371-379.

GREENBERG Clement, Modernist Painting, Washington, D.C., in Forum Lectures (Voice of America), 1960

GRIMAULT Nicolas, BACON Sid P., MICHEYL Christophe, « Auditory stream segregation on the basis of amplitude-modulation rate », Journal of the Acoustical Society of America, Vol. 111, 2002, p. 1340-1348.

GRISEY Gérard, « La musique, le devenir des sons », in Écrits ou l’invention de la musique spectrale, Paris, Editions MF, 2008.

GRISEY Gérard, « Structuration des timbres dans la musique instrumentale », in Jean-Baptiste Barrière (éd.), Le timbre métaphore pour la composition, Christian Bourgois Editeur/Ircam, Paris, 1991.

GROUPE μ, Traité du signe visuel. Pour une rhétorique de l’image, Paris, Le Seuil, 1992.

GUIDETTI Michel & TOURRETTE Catherine, Handicaps et développement psychologique de l’enfant, Paris, Armand Colin, 2002.

GUILLAUME Paul, La psychologie de la forme, Paris, Flammarion, 1937.

GUTHLEBEN Denis, « La cristallographie, de Platon à nos jours… ». CNRS Le Journal, n°256, février 2014, p. 66.

H :

HAGE Catherine, « Co-construire le langage : le défi des interactions précoces avec le très jeune enfant sourd », A.N.A.E. Approche Neuropsychologique des Apprentissages chez l’Enfant, Vol. 27, Tome 5, n°138, 2015, p. 427-434.

HAGE Catherine, CHARLIER Brigitte & LEYBAERT Jacqueline, Compétences cognitives, linguistiques et sociales de l’enfant sourd. Pistes d’évaluations, Bruxelles, Mardaga, 2006.

HANSLICK Eduard, Du beau dans la musique, Leipzig, 1854, trad. fr. Ch. Bannelier, Paris, Bourgois, 1986.

HARALICK Robert M., « Statistical and structural approaches to texture », Proceedings of the IEEE, Vol. 67, n°5, 1979, p. 787-804.

HARDELIN Jean-Pierre, DENOYELLE Françoise, LEVILLIERS Jacqueline, SIMMLER Marie-Christine & PETIT Christine, « Les surdités héréditaires : génétique moléculaire », Med Sci (Paris), Vol. 20, n°3, 2004, p. 311–316.

HARGREAVES David J. and GALTON Maurice J., « Aesthetic learning; psychological theory and educational practice », in B. Reimer and R.A. Smith (Eds.) National Society for the Study of Education Yearbook on the Arts in Education (Ed.), p. 124-50, 1992.

HARRIS Michael S., PISONI David B., KRONENBERGER William G., GAO Sujuan, CAFFREY Helena M., & MIYAMOTO Richard T., « Developmental trajectories of forward and backward digit spans in deaf children with cochlear implants », Cochlear implants international, Vol. 12 (Suppl. 1), 2011, p. 84-88.

HAYES Heather, GEERS Ann E., TREIMAN Rebecca & MOOG Jean S., « Receptive Vocabulary Development in Deaf Children with Cochlear Implants: Achievement in an Intensive Auditory-Oral Educational Setting », Ear Hearing, Vol. 30, n°1, 2009, p. 128-135.

HELMHOLTZ Hermann von (1877), On the sensations of tone (English translation A.J. Ellis, 1954), New York, Dover ; traduction française, Théorie physiologique de la musique, fondée sur l’étude des sensations auditives. Trad. par Georges GUEROULT et Auguste Desiré Bernard WOLFF, Paris, Masson et fils, 1868.

HERHOLZ Sibylle C. & ZATORRE Robert J., « Musical training as a framework for brain plasticity: behavior, function, and structure », Neuron, Vol. 76, 2012, p. 486-502.

HUMMEL Cora J. M. « The Value of Music in Teaching Deaf Students », Volta Review, Vol. 73, 1971, p. 224-249.

HUMPHREY Doris, Construire la danse [The Art of making dances, 1959], Paris, L’Harmattan, 1998, p. 126.

HURON David, « On the Role of Embellishment Tones in the Perceptual Segregation of Concurrent Musical Parts », Empirical Musicology Review, Vol. 2, n°4, 2007, p. 123-39.

HURON David, « Perceptual and cognitive applications in music information retrieval », In International Symposium on Music Information Retrieval, 2000.

HURON David, « The ramp archetype and the maintenance of auditory attention », Music Perception, Vol. 10, n°1, 1992, p. 83-92.

HURON David, «Voice Denumerability in Polyphonic Music of Homogeneous Timbres », Music Perception, Vol. 6, n° 4, 1989, p. 361-382.

HURON David, HELLMUTH MARGULIS Elizabeth, « Musical Expectancy and Thrills », in P.N. Juslin et J.A. Sloboda (éd.), Handbook of Music and Emotion: Theory, Research, Applications, Oxford-Toronto, Oxford University Press, 2010, p. 586.

HURON David, Sweet Anticipation: Music and The Psychology of Expectation, Cambridge: MIT Press, 2006.

HURON David, Voice leading, The Science behind a Musical Art, Cambridge, MIT Press, 2016. HUSSERL Edmund, Méditations cartésiennes, Paris, Vrin, 1953.

I :

IMBERTY Michel, « Introduction : Du geste temporel au sens » in Temps geste et musicalité, sous la direction de Michel Imberty et Maya Gratier, Paris, L’Harmattan, 2007.

IMBERTY Michel, La musique creuse le temps… De Wagner à Boulez : Musique, psychologie, psychanalyse, Paris, L’Harmattan, 2005.

IMBERTY Michel, L’aquisition de structures tonales chez l’enfant, Paris, Klincksieck, 1969. ISHAGHPOUR Youssef, Rothko, une absence d’image : lumière de la couleur, Tours, Éditions Léo Scheer, 2003.

J :

JACQUES-DALCROZE Émile, Le rythme, la musique et l’éducation, éd. Foetisch, Lausanne, 1965 (original 1920).

JACQUES-DALCROZE Émile, « La technique corporelle de la rythmique », Le Rythme, 1926, n°17, p. 2-3.

JACQUES-DALCROZE Emile, Notes bariolées, Genève, édition Jeheber, 1948.

JAUSS Hans Robert, Pour une esthétique de la réception, Paris, éditions Gallimard, 1978.

Jérôme BAILLET, « Gérard Grisey : Partiels », L’éducation musicale, « baccalauréat 2001 », supplément au n° 473/474, septembre-octobre 2000.

JOHNSON Steven, « Rothko Chapel and Rothko’s Chapel », Perspectives of New Music, Vol. 32, n° 2, 1994, p. 11.

JOLIAT François, « La genèse et le développement de l’éducation musicale à l’école : entre l’enseignement de l’art et l’éducation par l’art en Suisse romande », in M. Mellouki & A. Akkari (Ed.), La recherche au service de la formation des enseignants, Actes de la recherche, Vol. 7, 2009, p. 195-217.

JONES Mari Riess & YEE William, « L’attention aux évènements auditifs : le rôle de l’organisation temporelle », in Penser les sons, p. 74-121.

JOUBERT Muriel, « Le Kammerkonzert pour treize instrumentistes de Ligeti : une écriture d’une grande rigueur », In Musurgia, Pratique et Analyse Musicale, Vol. 8, n°1, 2001, p. 57-79.

JUNOD Philippe, Contrepoints. Dialogues entre musique et peinture, Genève, Contrechamps, 2006.

JUNTUNEN Marja-Leena. « Embodiment in musical knowing: how body movement facilitates learning within Dalcroze Eurhythmics », British Journal of Music Education, Vol. 21, n°2, July 2004, p. 199-214.

JUSLIN Patrik N. et SLOBODA John A., « Introduction. Aims, Organization, and Terminology », in

P.N. Juslin et J.A. Sloboda (dir.), Handbook of Music and Emotion. Theory, Research, Applications. New York, Oxford University Press, 2010, p. 3-12.

K :

KALINOWSKI Isabelle, « Hans-Robert Jauss et l’esthétique de la réception », Revue germanique internationale, Vol. 8, 1997, p. 151-172.

KANDINSKY Vassily, Du spirituel dans l’art et dans la peinture en particulier, éd. établie et présentée par Philippe Sers, Paris, Denoël, Gallimard, « Folio Essais », trad. de l’allemand par Nicole Debrand, trad. du russe par Bernadette Du Crest, 1989.

KARMILOFF-SMITH Kyra & KARMILOFF-SMITH Annette, Comment les enfants entrent dans le langage, Paris, Retz, 2012.

KIRSCHNER Sebastian et TOMASELLO Michael, « Joint drumming: Social context facilitates synchronization in preschool children », Journal of Experimental Child Psychology, Vol. 102, p. 299-314.

KNOWLTON Kenneth C., « A computer technique for producing animated movies », in Proceeding, April 21-23, Washington, D.C., 1964, p. 67-87.

KODÁLY Zoltán, Music should belong to everyone, IKS: Budapest, 2002.

KODÁLY Zoltán, The selected writings of Zoltán Kodály, Halapy, Lili (trad.), Macnicol, Fred (trad.), Boosey & Hawkes, 1974.

KOFFKA Kurt, Principles of Gestalt psychology, New York, Harcourt Brace, 1935.

KÖHLER Wolfgang, Die physischen Gestalten in Ruhe und im stationären Zustand. Erlangen: Verlag der Philosophischen Akademie, 1920.

KOKORAS Panayiotis, « Auditory Fusion and Holophonic Musical Texture », in Xenakis’s Pithoprakta, Athènes, 2014.

KOTZ Sonja A. E. & SCHWARTZE Michael, « Differential Input of the Supplementary Motor Area to a Dedicated Temporal Processing Network: Functional and Clinical Implications », Frontiers in Integrative Neuroscience, Vol. 5, 2011, p. 86.

KRAL Andrej & EGGERMONT Jos J., « What’s to lose and what’s to learn: Development under auditory deprivation, cochlear implants and limits of cortical plasticity », Brain Research Reviews, Vol.56, 2007, p. 259-269.

KRAMER Lawrence, « Subjectivity Rampant! Music, Hermeneutics, and History », in The Cultural Study of Music. A critical introduction, ed. by Martin Clayton, Trevor Herbert and Richard Middleton, New York: Routledge, 2003, p. 124-35.

KRUMHANSL Carol L., « Effects of musical context on similarity and expectancy », Systematische Musikwissenschaft, Vol. 3, n°2, 1995, p. 211-250.

KUBIK Suzana, « Vivre, ressentir, comprendre : l’enseignement musical selon la rythmique Dalcroze », Dossier Éducation musicale dans le monde, publié en ligne le 17 février 2017, France Musique. https://www.francemusique.fr/savoirs-pratiques/vivre-ressentir-comprendre-l-enseignement-musical-selon-la-methode-dalcroze-32139

KURTH Ernst, Musikpsychologie, Berlin, Max Hesse, 1931, 2e éd. 1947.

KURTH Ernst, Selected Writings (sous la dir. de I. Bent), Cambridge, Cambridge University Press, 2006.

L :

La surdité de l’enfant – guide pratique à l’usage des parents, édition INPES/Fondation de France, 2005.

LABAN Rudolph, La maîtrise du mouvement, Arles, Acte Sud, 1994.

LACASSE Serge, « “Listen to My Voice”: The Evocative Power of Vocal Staging in Recorded Rock Music and Other Forms of Vocal Expression », Thèse de doctorat, Université de Liverpool, 2000.

LACASSE Serge, « Composition, performance, phonographie : Un malentendu ontologique en analyse musicale? » in Groove : Enquête sur les phénomènes musicaux contemporains, sous la direction de Serge Lacasse et Patrick Roy, Québec, Presses de l’Université Laval, 2006, p. 65-78.

LACHENMANN Helmut, cité par Clyttus Gottwald, in Musik-Konzept n°61/62, numéro consacré à « Helmut Lachenmann », sous la dir. de H.-K. Metzger, Münich, oct. 88.

LALITTE Philippe, « Le spectre d’une voix, analyse de L’esprit des dunes de Tristan Murail. » In Szendy P. (Eds.), Tristan Murail, Paris, L’Harmattan/Ircam-Centre Georges Pompidou, 2002, p. 59-102.

LALITTE Philippe, « Outils informatiques et méthodes pour l’analyse des musiques actuelles », Focus sur le rock en France, Éditions Delatour France, Sampzon, 2014, p. 191-213.

LALITTE Philippe, « Temporalité et texture dans « Eight Lines » de Steve Reich : de la perception locale à la forme expérientielle. » Musicologies nouvelles, Éditions Musicales Lugdivine 2017,

Les temps de la musique (thèmes Agrégation 2018) 4, p. 66-76.

LALITTE Philippe, « Texture et émergence perceptive en musique contemporaine », in Texte, texture, textile. Variations sur le tissage dans la musique, les arts plastiques et la littérature, EUD, 2013, p. 121-133.

LALITTE Philippe, « The Unique Aesthetic Character of the Music of Roger Reynolds », in Stephen McAdams et Marc Battier (éds.), Creation and perception of a contemporary musical work: The Angel of Death by Roger Reynolds, Paris, IRCAM-Centre Georges Pompidou (DVD, ± 28 pages), 2005.

LALITTE Philippe, « Vers une analyse texturale fondée sur les principes de l’analyse de scène auditive », in Analyse et perception, Actes des Journées d’analyse musicales, 2016. Dijon, Editions Universitaires de Dijon.

LALITTE Philippe, Analyser l’interprétation de la musique du XXe siècle, Hermann, Paris, 2015. LALITTE Philippe, BIGAND Emmanuel, KANTOR-MARTYRUSKA Joanna et DELBÉ Charles, «

On listening to atonal variants of two Piano Sonatas by Beethoven », Music Perception, Vol. 26, n°3, 2009, p. 223-234.

LALITTE Philippe, « Contribution de l’analyse de scène auditive à l’analyse de la performance », IXe congrès européen d’Analyse musicale (CEAM – Euromac 9) / 9th European Music Analysis Conference, Juin 2017, Strasbourg, France.

LALITTE Philippe, « Implications compositionnelles et perceptives des échelles temporelles locales et globales », in Le rythme, Actes des 2es Rencontres inter artistiques, mars 2005, série « Conférences et séminaires », Paris, Observatoire Musical Français, Université de Paris-Sorbonne, 2006, p. 23-34.

LAMBERT Nelle et LOTSTRA Françoise, « L’attachement. De Konrad Lorenz à Larry Young : de l’éthologie à la neurobiologie », Cahiers critiques de thérapie familiale et de pratiques de réseaux, Vol. 35, n°2, 2005, p. 83-97.

LARTILLOT Olivier et TOIVIAINEN Petri, « A Matlab Toolbox for Musical Feature Extraction From Audio », in International Conference on Digital Audio Effects, Bordeaux, 2007.

LAURENT Stéphane et ROY Thomas, « Le Bilan d’efficacité prothétique : interprétation et utilisation pour les réglages », Les Cahiers de l’Audition n°6, 2012, p. 24-28.

LAVIGNE Emma et HORVATH Anne, Dossier de Presse Musicircus, œuvres phares du Centre Pompidou/Musée National d’Art Moderne, 20/04/16-17/07/17.

LAZAROU Loulietta, PARASTATIDIS Themis, TSOLAKI Anthoula, GKIOKA Mara, « International Ballroom Dancing Against Neurodegeneration: A Randomized Controlled Trial in Greek Community-Dwelling Elders With Mild Cognitive impairment », American Journal of Alzheimer’s Disease & Other Dementias, Vol. 32, n°8, p. 489-499.

LE CALVEZ Viviane, « La méthode verbo-tonale à l’heure de l’implant cochléaire », Connaissances Surdités, n°28, 2009, p. 13-17.

LE GOUIC Jean-Claude, « Sheila Hicks, Cheminements en sensualités textiles », Textile art revue, mars 2018.

LE MANER-IDRISSI Gaïd, PAJON Cécile, GAVORNIKOVA-BALIGAND Zdenka, DELEAU Michel, TAN-BESCOND Géraldine & GODEY Benoit, « Implant cochléaire et développement des échanges conversationnels », Revue canadienne des sciences du comportement, Vol. 40, n°2, 2008, p. 120-127.

LEDERBERG Amy & EVERHART Victoria S., « Conversations Between Deaf Children and Their Hearing Mothers: Pragmatic and Dialogic Characteristics », Journal of deaf studies and deaf education, Vol. 5, 2000, p. 303-322.

LELEU Claire et PETER-CHATOUX Anne Gabrielle, « La méthode Jacques-Dalcroze aujourd’hui », Revue de l’APEMU, 2017, p. 51-53.

LELEU Jean-Louis, La construction de l’idée musicale : Essais sur Webern, Debussy et Boulez, éditions Contrechamps, 2015.

LENEL Nadjmah, « Les communications alternatives », In M. Mondain et V. Brun (Eds.), Les surdités de l’enfant, Issy-les-Moulineaux, Masson, 2009, p. 20-27.

LEPOT-FROMENT Christiane & CLEREBAUT Nadine, L’enfant Sourd. Chapitre 2 : « Les interactions prélinguistiques entre l’enfant et ses parents », Bruxelles, De Boeck, 1996, p. 59-82.

LERCH Alexander, An Introduction to Audio Content Analysis, New York, John Wiley, 2012. LERDAHL Fred, JACKENDOFF Ray, A Generative Theory of Tonal Music, Cambridge, MIT Press, 1983.

LESTER Joel, Analytic Approaches to Twentieth-Century Music, New York et Londres, W. W. Norton, 1989.

LEVÄNEN Sari, JOUSMÄKI Veikko & HARI Riitta, « Vibration-induced auditory-cortex activation in a congenitally deaf adult », Current Biology, Vol. 8, n°15, 1998, p. 869-872.

LEVIN Judikael et BOSSIS Bruno, « Les descripteurs audio au service de l’analyse comparée des canaux stéréophoniques dans les musiques populaires », https://jim2019.sciencesconf.org/data/pages/LevinBossis.pdf

LEVITIN Daniel, De la note au cerveau, Paris, Editions Héloïse d’Ormesson, 2010.

LEYBAERT Jacqueline & ALEGRIA Jésus, « The role of cued speech in language development of deaf children. » In M. Marschark & P. E. Spencer (Eds.), Handbook of deaf studies, language, and education, New York, Oxford University Press, 2003, p. 261-274.

LEYBAERT Jacqueline & LASASSO Carol, « Cued speech for enhancing speech perception and first language development of children with cochlear implants », Trends in Amplification, Vol. 14, n°2, 2010, p. 96–112.

LIGETI György, « Concerto de Chambre », in Passages du XXème siècle, première partie, janvier-juillet 1977, Ed. IRCAM et Métiers graphiques, 1977, p. 101.

LIGETI György, « Pierre Boulez : Structure and Automatism in Structure la » in Die Reihe n° 4, 1958, trad. fr. « Décision et automatisme dans la Structure Ia de Pierre Boulez », in Neuf essai sur la musique, Genève, Editions Contrechamps, 2001, p. 89-126.

LIGETI György, « Evolution de la forme musicale », Die Reihe, n°7, Universal Edition (Vienne, 1960), repris dans Neuf essais sur la musique, Editions Contrechamps (Genève, 2001), p. 140.

LIGETI György, György Ligeti in Conversation with Peter Varnai, Josef Hausler, Claude Samuel and himself, London, Eulenburg, 1983.

LIGNY Chantal, SIMON Patricia, MATAGNE Laurence & SCHEPERS Franz, « Implantation cochléaire bilatérale », A.N.A.E. Approche Neuropsychologique des Apprentissages chez l’Enfant, Vol. 27, Tome 5, n°138, 2015, p. 403-413.

LINA-GRANADE Geneviève & TRUY Éric, « Conduite à tenir devant une surdité de l’enfant », EMC-Oto-rhino-laryngologie, Vol. 2, n° 3, 2005, p. 290-300.

LORENZ Konrad, Evolution et modification du comportement, Paris, éd. Payot & Rivages, 2007. LORENZI Christian, GILBERT Gaëtan, CARN Héloïse, GARNIER Stéphane et MOORE Brian C.

J., « Speech perception problems of the hearing impaired reflect inability to use temporal fine structure », Proceedings of the National Academy of Sciences, Dec 2006, Vol. 103, n°49, p.18866-18869.

LORTAT-JACOB Bernard, Chants de Passion, au cœur d’une confrérie de Sardaigne, Paris, Cerf, 1998.

M :

MALT Mikhail, « Une proposition pour l’analyse des musiques électroacoustiques de Xenakis à partir de l’utilisation de descripteurs audio », in Iannis Xenakis – The Electroacoustic Music / La Musique électroacoustique, sous la direction de Makis Solomos, L’Harmattan, Paris, 2015, p. 159-198.

MAMASSIAN Pascal et LE CORRE François, « Des illusions dans tous les sens », L’Essentiel Cerveau et Psycho n° 12, novembre 2012-janvier 2013.

MANFREDI Louise R., SAAL Hannes P., BROWN Kyler J., ZIELINSKI Mark C., DAMMANN III John F., POLASHOCK Vicky S. and BENSMAIA Sliman J., « Natural scenes in tactile texture », Journal Neurophysiology, Vol. 111, 2014, p. 1792-1802.

MARGULIS Elizabeth Hellmuth, « A model of melodic expectation », Music Perception: An Interdisciplinary Journal, Vol. 22, n°4, 2005, p. 663-714.

MARLIN Sandrine, GARABÉDIAN Éréa Noël, ROGER Gilles, MOATTI Lucien, MATHA Nicole, LEWIN Patricia, et al. « Connexin 26 gene mutations in congenitally deaf children: pitfalls for genetic counseling », Arch. Otolaryngol. head Neck Surg, 2001, Vol. 127, n°8, p. 927-33.

MARQUET Françoise, Zao Wou-Ki, Autoportrait, Paris, éditions Fayard, 1988.

MARTENOT Maurice & SAÏTO Christine, La relaxation active ou kinésophie : le corps, expression de l’être, Paris, Le Courrier du Livre, 2004.

MARTENOT Maurice, Principes fondamentaux de la formation musicale et leur application, Paris, Magnard, 1996.

MATHEWS Max, « The digital computer as a musical instrument. », Science, New Series, Vol. 142, N° 3592, 1963, p. 553-557.

MATHIEU Louise, « Un regard actuel sur la rythmique Jacques-Dalcroze », Recherche en éducation musicale, n°28, décembre 2010, p. 17-27.

MAURIAL Sandrine, « États de couleur entre pigment-matière et pixel-lumière », Traitement du signal, Vol. 21, numéro spécial « L’image numérique couleur », 2004, p. 373-384.

MCADAMS Stephen & BIGAND Emmanuel, Penser les sons, Psychologie cognitive de la musique, Paris, Presses Universitaires de France, 1994.

MCADAMS Stephen, « La reconnaissance de sources et d’événements sonores », in S. McAdams et

E. Bigand (éd.), Penser les sons : La psychologie auditive de l’audition, Paris, PUF, 1994, p. 157-213.

MCADAMS Stephen, Perception et cognition de la musique, Paris, Vrin, 2015.

MCADAMS Steve, « Spectral fusion and the creation of auditory images », in Manfred Clynes (ed.)

Music, Mind, and Brain, 1982, p. 279-298.

MCDERMOTT E. F. « Music and Rhythm – From Movement and Lipreading and Speech », Volta Review, Vol. 73, 1971, p. 229-232.

MÉLÈSE Pierre, Samuel Beckett, Paris, Pierre Seghers, 1966.

MERLEAU-PONTY Maurice, La structure du comportement, Paris, PUF, 1942.

MESSENGER Thomas, « Texture and Form in the Masses of Fayrfax », Journal of the American Musicological Society, Vol. 24, n° 2, 1971, p. 282-286.

MEYER Leonard B, Emotion and Meaning in Music, 1956, The University of Chicago Press, trad. fr., Emotion et Signification en Musique, Arles, Actes Sud, 2011.

MIALARET Jean-Pierre, « Maurice Chevais et la didactique de la musique à l’école », In C. Fijalkow (Ed.), Maurice Chevais (1880-1943) : un grand pédagogue de la musique, Paris, L’Harmattan, 1995, p. 93-106.

MICHEL Pierre, « György Ligeti : Kammerkonzert pour 13 instrumentistes (1969-70) », Analyse musicale, n°34, 1999, p. 31-51.

MICHEL Pierre, György Ligeti, Paris, Minerve, deuxième édition revue et complétée, 1995. MIDDLETON Richard, « Play it Again Sam: Some Notes on the Productivity of Repetition in Popular

Music », Popular Music, Vol. 3, 1983, p. 235-270.

MIDDLETON Richard, « L’étude des musiques populaires », in Musique une encyclopédie pour le XXIe siècle, Vol. 2, Savoirs musicaux, sous la direction de Jean-Jacques Nattiez, Paris, Actes Sud/Cité de la musique, 2004, p. 771.

MILLER George A. et LICKLIDER Joseph C. R., « The intelligibility of interrupted speech », Journal of the Acoustical Society of America, n° 22, 1950, p. 167-173.

MITANI Chisato, NAKATA Takayuki, TREHUB Sandra, KANDA Yukihito, KUMAGAMI Hidetaka, TABASAKI Kenji, et al., « Music recognition, music listening, and word recognition by deaf children with cochlear implants », Ear Hearing, Vol. 28(Supplement), 2007, p. 29-33.

MITHEN Steven J., « The music instinct: the evolutionary basis of musicality », Annals of the New York Academy of Science, Vol.1169, 2009, p. 3-12.

MONDAIN Michel, BLANCHET Catherine & VENAIL Frederic & VIEU Adrienne, « Classification et traitement des surdités de l’enfant », Emc – Oto-rhino-laryngologie, Vol. 2, 2005, p. 301-319.

MONTESSORI Maria, L’enfant, Paris, Desclée de Brouwer, 1936, 12e éd., tr. G.J.J. Bernard.

MONTEVERDI Claudio, Préface aux Madrigaux guerriers et amoureux, huitième livre des madrigaux, in Correspondances, préfaces, épîtres dédicatoires, trad. A. Russo, Sprimont, Mardaga, 2001.

MOORE Allan F. et DOCKWRAY Ruth, « Configuring the Sound-Box 1965-1972 », Popular Music, Vol. 29, n° 2, 2010, p. 181-197.

MOORE Allan F., Rock: The Primary Text: Developing a Musicology of Rock, Aldershot, Ashgate, 2004.

MOORE Jean K., NIPARKO John K., MILLER George A. & LINTHICUM Fred H., « Effect of Profound Hearing Loss on A Central Auditory Nucleus », American Journal of Otology, Vol. 15, n°5, 1994, p. 588-595.

MORGAN Robert. P., Twentieth-Century Music: a history of musical style in modern Europe and America, New York: Norton, 1991.

MOULENDA Joseph Igor, « Par-delà le sens, l’écriture et le texte. Jacques Derrida », Controverses, Revue spécialisée de philosophie, ENS, Libreville, Editions Oudjat, 2016.

MOUSSARD Aline, ROCHETTE Françoise & BIGANG Emmanuel, « La musique comme outil de stimulation cognitive », L’Année psychologique, Vol. 112, n°3, 2012, p. 499-542.

MOYLAN William, The Art of Record Production: The Creative Resources of Music Production and Audio, 1ère édition, New York: Van Nostrand Reinhold, 1992.

MOYLAN William, Understanding and Crafting the Mix: The Art of Recording, 2e édition, Cambridge (Mass.), MIT Press, 2002.

MUNDY Peter & NEWELL Lisa, « Attention, joint attention, and social cognition », Current directions in Psychological Science, Vol. 16, 2007, p. 269-274.

N :

NAKATA Takayuki & TREHUB Sandra E., « Infants’ Responsiveness to Maternal Speech and Singing », Infant Behavior and Development, Vol. 27, 2004, p. 455-464.

NAKATA Takayuki, TREHUB Sandra, MITANI Chisato, KANDA Yukihito, SHIBASAKI Atsuko & SCHENLLENBERG E. Glenn, « Music recognition by Japanese children with cochlear implants », Journal of Physiological Anthropol. Applied Human Sciences, Vol. 24, n°1, 2005, p. 29-32.

NARMOUR Eugene, « Hierarchical expectation and musical style », In D. Deutsch (ed), The Psychology of Music, 2nd Edition. San Diego: Academic Press, 1999, p. 442-472.

NARMOUR Eugene, The analysis and cognition of basic melodic structures: the implication-realisation model, Chicago, University of Chicago Press, 1992.

NATTIEZ Jean-Jacques, « Varèse’s Density 21.5: A study in semiological analysis », Music Analysis, n° 1, 1982, p. 243-340.

O :

OECHSLIN Mathias S., MEYER Martin & JÄNCKE Lutz, « Absolute Pitch – Functional Evidence of Speech-Relevant Auditory Acuity », Cerebral cortex, Vol. 20, n°2, 2010, p. 447-455.

ORFF Carl et KEETMAN, Guild, Musik fur Kinder, B. Schott’s Söhne, Mainz, vol. 1, 1950, vol. 2, 1952, vol. 3, 1953, vol. 4, 1954, vol. 5, 1954.

ORSENNA Erik, Voyage Aux Pays du Coton : Petit Précis de la Mondialisation, Paris, Fayard, 2006. P

PANKSEPP Jaak, « The Emotional Sources of Chills Induced by Music », Music Perception, Vol. 13, n°2, 1995, p. 171-207.

PANKSEPP Jaak, Affective Neuroscience, New York, Oxford University Press, 1998.

PAPOUSEK Mechthild, PAPOUSEK Hanuš & HAEKEL Monika, « Didactic adjustments in fathers’ and mothers’ speech to their three-month-old infants », Journal of Psycholonguistic Research, Vol. 16, n°5, 1987, p. 491-516.

PAQUIER Mathieu, « Traitement du bruit et de la parole par le système auditif chez l’entendant et le déficient auditif », Les Cahiers de l’Audition, Vol. 26, 2013, p. 17-22.

PATEL Aniruddh D., Music, Language and the Brain, New York, Oxford University Press, 2008.

PEARCE Marcus T. & WIGGINS Geraint A., « Expectation in melody: The influence of context and learning », Music Perception: An Interdisciplinary Journal, Vol. 23, n°5, 2006, p. 377-405.

PENROSE Lionel S. et PENROSE Roger, « Impossible Objects: A Special Type of Illusion », British Journal of Psychology, Vol. 49, n° 1, 1958, p. 31–33.

PERETZ Isabelle, « Towards a Neurobiology of Musical Emotions », in P. J. J. Sloboda (Ed.), Handbook of Music and Emotion: Theory, research, applications, Oxford, Oxford University Press, 2010, p. 99-126.

PERETZ Isabelle, Apprendre la Musique, Nouvelles des Neurosciences, Odile Jacob, 2018. PERETZ Isabelle, « A quoi sert la musique ? », Le temps stratégique, mars-avril 2000, n°92. PERRAUDEAU Sandrine, « Un Atelier Musical avec les enfants sourds », Connaissances Surdités, Décembre 2012, n°42, p. 23-25.

PIAGET Jean, La formation du symbole chez l’enfant, Neuchâtel, Delachaux et Niestlé, 1945.

PIAGET Jean, Naissance de l’intelligence chez l’enfant, Paris, Delachaux et Niestlé, Actualité pédagogiques et psychologiques, 1977.

PIENCIKOWSKI Robert, « Note de programme pour Structures pour deux pianos », premier livre [archive], sur le site de l’IRCAM.

PINEAU Marion & TILLMANN Barbara, Percevoir la musique : une activité cognitive, Paris, L’Harmattan, 2001.

PINTO Serge et SATO Marc, Traité de Neuro-linguistique : du cerveau au langage, De Boeck, 2016.

PISONI David B. & CLEARY Miranda, « Measures of Working Memory Span and Verbal Rehearsal Speed in Deaf Children after Cochlear Implantation », Ear Hearing, Vol. 24, n°1, 2003, p. 106-120.

PISONI David B., KRONENBERGER William G., ROMAN Adrienne & GEERS Ann E., « Measures of digit span and verbal rehearsal speed in deaf children after more than 10 years of cochlear implantation », Ear and Hearing, Vol.32, 2011, p. 60–74.

PISTON Walter, Orchestration, London, Victor Gollancz, 1955.

PLUTCHIK Robert, Emotion a Psycho Evolutionary Synthesis, Harper, New York, 1980.

PREISLER Gunilla, Les implants cochléaires chez les enfants sourds, Strasbourg, Edition du conseil de l’Europe, 2001.

PRESSNITZER Daniel, SUIED Clara and SHAMMA Shihab A., « Auditory Scene Analysis: the sweet music ambiguity », Frontiers in Human Neuroscience, Vol. 5, n° 158, 2011, p. 1-10.

R :

RASTIER François, Le silence de Saussure ou l’ontologie refusée, éd. Bouquet, 2003. Recommandation BIAP 06/8 : « L’appareillage de l’enfant déficient auditif. »

REICH Steve, « Music as a gradual process », in Writings on music 1965-2000, New-York, Oxford University Press, 2002, p. 34-36.

REICH Steve, Différentes phases, Paris, Cité de la musique-Philharmonie de Paris, 2016. REICH Steve, Écrits et entretiens sur la musique, Christian Bourgeois éditeur, Paris, 1981.

RENARD Christian et AZÉMA Bernard, Précis d’Audioprothèse, Production, phonétique acoustique et perception de la parole, Elsevier Masson, « Chapitre 5 – Données fréquentielles et temporelles de la perception de la parole », 2005, p. 291.

RENARD Claire, Le geste musical, Van de Velde, 1982.

REYNOLDS Roger, Form and Method: Composing Music, The Rothschild Essays, Edited by Stephen McAdams, New York, Routledge, 2002.

REYNOLDS Roger, « Manuscript Sketch of Symphony [Myths] by Roger Reynolds », Internet http://lcweb2.loc.gov/diglib/ihas/loc.natlib.ihas.200029047.

RIBIERE-RAVERLAT Jacquotte, L’Éducation musicale en Hongrie, 2e éd., A. Leduc, Paris, 1977. RIBIERE-RAVERLAT Jacquotte, Développer les capacités d’écoute à l’école, Ecoute musicale, écoute des langues, Paris, PUF, 1997.

RICHARD JOHNSON C., MESSIER Paul, SETHARES William A., KLEIN Andrew G., BROWN Christopher A., HOANG DO Anh, KLAUSMEYER Philip A., ABRY Patrice, JAFFARD Stéphane, WENDT Herwig, ROUX Stéphane, PUSTELNIK Nelly, VAN NOORD Nanne, VAN DER MAATEN Laurens, POSTMA Eric, CODDINGTON James, DAFFNER Lee Ann,

MURATA Hanako, WILHELM Henry, WOOD Sally et MESSIER Mark, « Pursuing automated classification of historic photographic papers from raking light image », Journal of the American Institute for Conservation, Vol. 53, n°3, 2014, p. 159-170.

RIEDELSHEIMER Thomas, Touch The Sound : un voyage sonore avec Evelyn Glennie, un documentaire germano-britannique réalisé en 2004.

RINALDI Pasquale, CASELLI Cristina, « Lexical and Grammatical Abilities in Deaf Italian Preschoolers: The Role of Duration of Formal Language Experience », The Journal of Deaf Studies and Deaf Education, Vol. 14, Issue 1, Winter 2009, p. 63–75.

RISSET Jean-Claude, « Pitch and Rhythm Paradoxes: Comments on Auditory Paradox Based on Fractal Waveform », The Journal of the Acoustical Society of America, Vol. 79, 1986, p. 186-189.

RISSET Jean-Claude, « Composer le son : expériences avec l’ordinateur, 1964-1989 », Contrechamps, n° 11, 1990, p. 107-126.

RISSET Jean-Claude, « Ouvrir l’espace sonore : Max Mathews, John Chowning, Holophon, » Journée d’informatique musicale, 2011.

ROBERTS Megan Y., « Parent-Implemented Communication Treatment for Infants and Toddlers With Hearing Loss: A Randomized Pilot Trial », Journal of Speech Language and Hearing Research, Vol. 62, n°1, 2018, p. 143-152.

ROCHETTE Françoise, « Entraînement Auditif et Musical Chez l’Enfant Sourd Profond : Effets sur la Perception Auditive et Effets de Transferts », Thèse d’état, Université de Bourgogne, 2012.

ROSEN Charles, Arnold Schœnberg, Chicago, The University Press of Chicago, 1975; trad. fr.: Shoenberg, Paris, Minuit, 1979, p. 52.

ROSENBERG Harold, « Les peintres d’action américains » (1952), in Charles Harrison et Paul Wood (ed.), Art en théorie 1900-1990, Hazan, 1997 pour la traduction française, p. 644.

ROSENBLUM Ouriel, « Du bébé à l’empathie : Une approche des interactions affectives », in A. Braconnier & J. Sipos (Dir), Le Bébé et les interactions précoces, Paris, PUF, 1998, p. 167-194.

ROSS Alex, The Rest is Noise : A l’écoute du XXe siècle, la modernité en musique, Arles, Acte Sud, 2010.

ROWELL Lewis, Thinking About Music: An Introduction to the Philosophy of Music, The University of Massachusetts, Amherst, 1983.

S :

SABBE Herman, « Gyorgy ligeti, illusions et allusions », J. New Music Res., Vol. 8, 1979, p. 11–34. SADEK-KHALIL Denise, L’enfant sourd et la construction de la langue, Montreuil, Ed. Du Papyrus, 1997.

SADIE Stanley and TYRELL John, The New Grove Dictionnary of Music and Musicians, Vol XVIII, Oxford University Press, 1980.

SAFATLE Vladimir, « Morton Feldman comme critique de l’idéologie : expression et politique dans Rothko Chapel », in Kogler, S. et Olive, J-P. (dir), Expression et geste musical, Éditions L’Harmattan, Paris, 2013.

SAINT-MARTIN Fernande, Sémiologie du langage visuel, Sillery, Presses de l’Université du Québec, 1987.

SARROUILHE Denis, FAVOT Laure, Histologie UE2, Ed. Ellypses « Entrainement intensif », 2018. SAUSSURE Ferdinand de, Écrits de Linguistique générale, Texte établi et édité par S. Bouquet et R.Engler, Paris, Gallimard, 2002.

SCHAEFFER Pierre, Traité des objets musicaux, Paris, Seuil, 1966.

SCHELLENBERG E. Glenn, « Expectancy in melody: Tests of the implication-realization model », Cognition, Vol. 58, 1996, p. 75-125.

SCHELLENBERG E. Glenn, « Simplifying the implication-realization model of melodic expectancy », Music Perception: An Interdisciplinary Journal, Vol. 14, n°3, 1997, p. 295-318.

SCHELLENBERG E. Glenn, ADACHI Mayumi, PURDY Kelly T. & McKINNON Margaret C., « Expectancy in Melody: Tests of Children and Adults », Journal of Experimental Psychology: General, Vol. 131, 2002, p. 511-537.

SCHENKER Heinrich, L’Écriture Libre (1935), Seconde édition revue et adaptée par Oswald Jonas. Trad. De l’allemand par N. Meeùs. Titre Original : Der freie Satz (Neue musikalische Theorien und Phantasien, vol. 3). Liège, Mardaga, 1993.

SCHER Joël, « Rhéologie, texture et texturation des produits alimentaires », Journal Techniques de l’ingénieur Opérations unitaires du génie industriel alimentaire, 2006.

SCHLAUG Gottfried, JÄNCKE Lutz & HUANG Yanxiong, « In vivo evidence of structural brain asymetry in musicians », Science, Vol. 3, n°267, 1995b, p. 699-701.

SCHMID Stefan, « Textures of geological materials: computer model predictions versus empirical interpretations based on rock deformation experiments and field studies », in Textures of Geological Materials (Hans Joachim BUNGE et al.eds), DGM Verlag, p. 279-301.

SCHNEIDER Peter, SCHERG Michael, DOSCH H. Günter, SPECHT Hans J., GUTSCHALK Alexander, & RUPP André, « Morphology of Heschl’s gyrus reflects enhanced activation in the auditory cortex of musicians », Nature Neurosciences, Vol. 5, n°7, 2002, p. 688-694.

SCHOPENHAUER Arthur, Le monde comme volonté et comme représentation, trad. A. Burdeau, Paris, PUF, 1966.

SCHROEDTER Stephanie, « Staging Listening: Corporeal Dimensions of New Music in Choreographies by Xavier Le Roy », Critical Stages, The IATC journal, December 2017, n°16.

SCHWARTZ Naomi Oshinsky, « Adaptation of the sensory texture profile method to skin care products », Journal of Texture Studies 6, 1975, p. 33-42.

SEASHORE Carl E., The Psychology of musical talent, New York, Silver Burdett, 1919. SÉGUIN Édouard, Traitement moral, hygiène et éducation des idiots, Paris, J. B. Balliere, 1846.

SÉRO-GUILLAUME Philippe, Langues des Signes, Surdité et accès au langage, Neuilly-Plaisance, Éd. Du Papyrus, 2008.

SHAFER Raymond Murray, Le paysage sonore, le monde comme musique (The Tuning of the World, 1977), Marseille, éditions Wild Project, 2010.

SHARMA Anu, DORMAN Michael F. & SPAHR Anthony J., « A sensitive period for the development of the central auditory system in children with cochlear implants; implications for age of implantation », Ear Hearing, Vol.23, n°6, 2002a, p. 532-539.

SHENFIELD Tali, TREHUB Sandra & NAKATA Takayuki, « Maternal singing modulates infant arousal », Psychology of Music, Vol. 31, n°4, 2003, p. 365-375.

SHEPARD Roger N., « Circularity in judgments of relative pitch », J. Acoust. Soc. Am. Vol. 36, 1964, p. 2345–2353.

SILK Joseph, Une brève histoire de l’univers, Paris. Odile Jacob, 2003.

SIMARD France, CHEVALIER Nicole et DESPINS Jean-Paul, « Performance musicale : le chant préalable à l’apprentissage instrumental », http://www.jfrem.uottawa.ca/texte_jfrem2009_simard_france.pdf.

SLOBODA John A., L’esprit musicien : la psychologie cognitive de la musique, Paris, Mardaga, 1985. SLOBODA John Anthony, « Cognition and real music: the psychology of music comes of age », Psychologica Belgica, Vol. 26, 1986, p. 199-219.

SMITH-BRINDLE Reginald, Serial Composition, Oxford University Press, 1966.

SODERBERG Stephen, An interview with Roger Reynolds, Beginnings, Library of congress, The Roger Reynolds Collection, 2000.

SOLOMOS Makis, « Pour une filiation Xenakis-Grisey? », in Makis Solomos (éd.), Iannis Xenakis, Gérard Grisey, La métaphore lumineuse, L’Harmattan, 2003, p. 149-167.

SOLOMOS Makis, De la musique au son. L’émergence du son dans la musique des XXe et XXIe siècles, Rennes, Presses Universitaires de Rennes, 2013.

SOULÉ Michel et CYRULNIK Boris, L’intelligence avant la parole : nouvelles approches originales du bébé, Paris, ESF, 1998.

SPAULDING Sandy J., BARBER Brittany, COLBY Morgan, CORMACK Bronwyn, MICK Tanya & JENKINS Mary E., « Cueing and Gait Improvement Among People With Parkinson’s Disease: A Meta-Analysis », Archives of Physical Medicine and Rehabilitation, Vol. 94, 2012, p. 562-570.

STANDLEY Jayne M., CASSIDY Jane, GRANT Roy, CEVASCO Andrea, SZUCH Catherine, NGUYEN Judy, WALWORTH Darcy, PROCELLI Danielle, JARRED Jennifer, ADAMS Kristen, « The effect of music reinforcement for non-nutritive sucking on nipple feeding of premature infants », Pediatric nursing, May-June 2010, Vol. 36, p. 136-145.

STARR Lawrence, « Melody-Accompaniment Textures in the Music of Bartók, as Seen in His Mikrokosmos », University of California Press, The Journal of Musicology, Vol. 4, n° 1, 1985-1986, p. 91-104.

STERN Daniel N., Le monde interpersonnel du nourisson, PUF le fil rouge, 2003.

STRIZICH Robert, « Texture in post-World War II music », Ex Tempore: A journal of compositional and theoretical research in music, vol. 5, n°2, 1991, p. 1-28.

SWANWICK Keith et TILLMANN June, « The sequence of musical development: A study of children’s composition. », British journal of music education, Vol.3, 1986, p. 305-339.

SYLVESTRE DE SACY Clotilde, COMTE Chantal et CAVALIER Luna, Bien lire et aimer lire : méthode phonétique et gestuelle créée par Suzanne Borel-Maisonny, Bien Lire, 2018.

SZCZESNIAK Alina Surmacka, « Classification of textural characteristics », Journal of Food Science, Vol. 28, n°4, 1963, p. 385- 389.

SZCZESNIAK Alina Surmacka, « Sensory texture profiling – historical and scientific perspectives »,

Food Technology, Vol. 52, n°8, 1998, p. 54-57.

SZŐNYI Erzsébet, Quelques aspects de la méthode de Zoltan Kodály : application de ses principes à l’éducation musicale, Ed. Corvina, 1976.

T :

TAGG Philip, « Kojak: 50 Seconds of Television Music – Towards the Analysis of Affect », in Popular Music, Götenborg: Skrifter från Musikvetenskapliga institutionen, 1979.

TAN Siu-Lan, PFORDRESHER Peter, HARRE Rom, « The Question of Meaning in Music », in Psychology of Music: From Sound to Significance. New York, Psychology Press, 2010, p. 245–259.

TEMPERLEY David, The Cognition of Basic Musical Structures, Cambridge MA: MIT Press, 2001. TENNEY James et POLANSKY Larry, «Temporal gestalt perception in music», Journal of Music Theory, XXIV, n° 2, 1980, p. 205-241.

TILLMANN Barbara & POULIN-CHARRONNAT Bénédicte, « Etudier les attentes musicales de l’auditeur non- musicien : le paradigme d’amorçage musical », Intellectica, n°48-49, 2008, p. 27-35.

TILLMANN Barbara, « La musique au secours du langage. De l’étude des corrélats neuronaux vers des perspectives de réhabilitation », in PLATEL Hervé et THOMAS-ANTÉRION Catherine, Neuropsychologie et art, Paris, De Boeck-Solal, coll. « Neuropsychologie », 2014, p. 177-198.

TOMITA Fumiaki, SHIRAI Yoshiaki, TSUJI Saburo, « Description of textures by structural analysis », IEEE PAMI, Vol. 4, n° 2, 1982.

TRAINOR Laurel J. & HANNON Erin E., « Musical development », in D. Deutsch (dir.), The Psychology of Music, Academic Press, 3e éd., p. 423-497.

TRAINOR Laurel J. & HEINMILLER Becky M., « The development of evaluative responses to music: Infants prefer to listen to consonant over dissonance », Infant Behavior & Development, Vol. 21,1998, p. 77-88.

TRAINOR Laurel J., « The origins of music in auditory scene analysis and the roles of evolution and culture in musical creation », Phil. Trans. R. Soc. B, 2016, n° 370.

TRAINOR Laurel J., « La musique chez les tout-petits » in Revue Internationale d’Éducation « Dossier Musique et Éducation », Sèvres n°75, septembre 2017, p. 65-74.

TRAINOR Laurel J., GAO Xiaoqing, LEI Jing-Jiang, LEHTOVAARA Karen, HARRIS Laurence R., « The primal role of the vestibular system in determining musical rhythm », Cortex, Vol. 45, n°1, 2009, p. 35-43.

TRAINOR Lauren J. & CIRELLI Laura, « Rhythm and interpersonal synchrony in early social development », Annals of the New York Academy of Sciences, Vol. 1337, 2015, p. 45-52.

TREHUB Sandra & TRAINOR Laurel, « Singing to infants: Lullabies and play songs. » Advances in Infancy Research. Vol. 12, 1998, p. 43-77.

TREHUB Sandra E., BULL Dale & THORPE Leigh A., « Infants’ perception of melodies: the role of melodic contour », Child Development, Vol. 55, n°3, 1984, p. 821-830.

TREHUB Sandra, « The developmental origins of musicality », Nature Neurosciences, Vol. 6, n°7, 2003, p. 669-673.

TREVARTHEN Colwyn et MALLOCK Stephen, « Musicality: Communicating the vitality and interests of life », Communicative musicality: Exploring the basis of human companionship, New York, Oxford University Press, 2009, p. 1-11.

TRONICK Edward, « Multilevel meaning making and dyadic expansion of consciousness theory: The emotional and the polymorphic polysemic flow of meaning », in D.Fosha, D.J. Siegel, M. Solomon (éd.) The healing power of emotion: Affective neuroscience, development, and clinical practice, New York, Norton; 2008, p. 86–110.

TROUSSEAU Armand, « Extrait de son discours de rentrée de la Faculté de Médecine de Paris », prononcé le 2 novembre 1842.

TRUY Éric & LINA-GRANADE Geneviève, « Implantation cochléaire de l’enfant : Technologie, bilan médical et sélection des candidats, réhabilitation », Archives de Pédiatrie, Vol. 10, n°6, 2003, p. 554-564.

TRUY Éric, « Méthodes instrumentales de réhabilitation de l’audition : intérêts et limites. » In M. Mondain, V. Brun, Les surdités de l’enfant. Entretiens de rééducation et réadaptation fonctionnelle, Issy-les-Moulineaux, Elsevier Masson, 2009, p. 11-19.

V :

VALLIER Dora, « La rencontre Schoenberg-Kandinsky : Musique ⇆ Peinture », in Schoenberg-Kandinsky. Correspondance, écrits : Revue Contrechamps n° 2, Genève, Éditions Contrechamps, 1984, p. 143-153.

VICKERS Zata & BOURNE Malcom C., « A psychoacoustical theory of crispness », Journal of Food Science, 1976, n°41, p. 1158-1164.

VIEILLARD Sandrine, PERETZ Isabelle, GOSSELIN Nathalie, KHALFA Stéphanie, GAGNON Lise & BOUCHARD Bernard, « Happy, sad, scary and peaceful musical excerpts for research on emotions », Cognition and Emotion, Vol. 22, n°4, 2008, p. 720-752.

VINTER Shirley, « L’acquisition du langage oral par l’enfant sourd », In Solal (Ed.), Précis d’audiologie et de déglutition, Marseille,2005, p. 271-292.

W :

WALCZYK Eugenia Bulawa, « Music instruction and the hearing impaired », Music Educators Journal, Vol. 80, n°1, 1993, p. 42-44.

WALLON Henri, Importance du mouvement dans le développement psychologique de l’enfant, Enfance, réédit. in Enfance, 1959, 3-4, p. 235-239.

WARREN Richard M. et WARREN Roslyn P., « Auditory Illusions and Confusions », Scientific American, vol. CCXXIII, n° 6, décembre 1970, p. 30-36.

WERTHEIMER Max, « Experimentelle Studien über das Sehen von Bewegung », Zeitschrift für Psychologie, 61, 1912, p. 161-265.

WESSEL David L. et RISSET Jean-Claude, « Les illusions auditives », in Claude Malric (dir.), Musique et ordinateur [Encyclopaedia Universalis, Encyclopaedia Universalis, 1979, p. 161-171.], Les Ulis, Centre expérimental du spectacle, 1983, p. 93-105.

WILLEMS Edgar, L’éducation musicale nouvelle (2e éd.), Fribourg, Pro Musica, 1968.

WILLEMS Edgar, L’oreille musicale 2, la culture auditive, les intervalles et les accords, Genève, Ed. Pro Musica, 1940.

WILSON Blake S. & DORMAN Mickael F., « Cochlear Implants: Current designs and future possibilities », Journal of Rehabilitation Research and Development, Vol. 45, n°5, 2008, p. 695-730.

WILSON Blake S., « The Remarkable Cochlear Implant and Possibilities for the Next Large Step Forward », Acoustical Society of America, Acoustics Today, Vol. 15, n°1, 2019, p. 53-61.

WILSON Blake S., FINLEY Charles C., LAWSON Dewey T., WOLFORD Robert D., ZERBI

Mariangeli. « Design and evaluation of a continuous interleaved sampling (CIS) processing strategy for multichannel cochlear implants. » Journal of Rehabilitation Research and Development, Vol. 30, n°1, 1993, p. 110-116.

WILSON Peter Niklas, « Interkulturelle Fantasien: György Ligetis Klavieretüden Nr. 7 und 8 »,

Melos 51, 1992, p. 63–84.

WINKLER István, HÁDEN Gábor P., LADINIG Olivia, SZILLER István, and HONING Henkjan, « Newborn infants detect the beat in music », Proceedings of the National Academy of Sciences, Feb. 2009, Vol. 106, n°7, p. 2468-2471.

WINNICOTT Donald Woods, « La théorie de la relation parents-nourisson », in De la pédiatrie à la psychanalyse, Paris, Payot, 1969, p. 61.

WINNICOTT Donald Woods, Jeu et réalité, Paris, NRF Gallimard, 1975.

WONG Patrick C. M., SKOE Erika, RUSSO Nicole M., DEES Tasha & KRAUS Nina, « Musical experience shapes human brainstem encoding of linguistic pitch patterns », Nature Neurosciences, Vol.10, 2007, p. 420-422.

WOSZCZYK Wieslaw, BREGMAN Albert S., « Creating mixtures: The application of auditory scene analysis (ASA) to audio recording », Audio anecdotes 2, AK Peters, 2005.

WRIGHT James K. et BREGMAN Alfred S., « Auditory stream segregation and the control of dissonance in polyphonic music », Contemporary Music Review, Vol. 2, n°1, 1987, p 63-92.

WUYTACK Jos, Musica Viva. Pour une éducation musicale active. Volume 1 : Sonnez…battez, Paris, Alphonse Leduc, 1970.

WUYTACK Jos, Musica Viva. Pour une éducation musicale active. Volume 2 : Expression rythmique, Paris, Alphonse Leduc 1970.

X :

XENAKIS Iannis, « Provlimata ellinikis mousikis synthesis (Problèmes de composition musicale grecque) », Epitheorisi technis n°9, Athènes, 1955, p. 185-189. Traduction française dans Présences de / Presences of Iannis Xenakis, éd. par Makis SOLOMOS, Paris, Cdmc, 2001, p. 12.

Y :

YOST William A., Fundamentals of Hearing: An Introduction, 5e éd., San Diego, Brill Academic Press, 2006.

Z :

ZAGORSKI-THOMAS Simon, « The Musicology of Record Production », Twentieth-Century Music, Vol. 4, n°2, Boston: Cambridge, 2007, p. 189-207.

ZAK III Albin, I Don’t Sound Like Nobody, Remaking Music in 1950s America, University of Michigan Press, 2010.

ZAK III Albin, The poetics of rock, California UP, 2001.

ZATORRE Robert J. & SALIMPOOR Valorie N., « From perception to pleasure: Music and its neural substrates », Proceedings of the National Academy of Sciences of the United States of America, Vol. 110 (suppl. 2), 2013, p. 10430-10437.

ZENATTI Arlette, « Aspects du développement musical de l’enfant dans l’histoire de la psychologie au XXe siècle », Les Sciences de l’éducation, Vol.3, n°4, p. 21-38.

ZENATTI Arlette, Perception et intelligence musicales chez l’enfan, Université Paris X-Nanterre, Paris, 1967.

ZENATTI Arlette, Psychologie de la musique, Paris, Presses universitaires de France, 1994.

ZENATTI Arlette. « Aspects du développement musical de l’enfant dans l’Histoire de la psychologie au XXe siècle », in Education musicale et psychologie de la musique, Revue internationale Les sciences de l’éducation pour l’ère nouvelle n°6, CERSE, Université de Caen, 1990, p. 35-36.

ZURCHER Pierre, Le développement musical de l’enfant : les quatre temps de la musique, Paris, L’Harmattan, 2010.

Sites internet Consultés

http://affairesjuridiques.aphp.fr/textes/arrete-du-23-avril-2012-relatif-a-lorganisation-du-depistage-de-la-surdite-permanente-neonatale/, consulté le 15 juillet 2019.

http://clam-project.org, consulté le 16 juillet 2019.

http://logiciels.pierrecouprie.fr, consulté le 2 juin 2019.

http://marsyas.info, consulté le 12 juillet 2019.

http://psysound.wikidot.com, consulté le 12 juillet 2019.

http://www.biap.org/biapfrancais.html, consulté le 11 mai 2014. http://www.biap.org/en/component/content/article/66-recommendations/ct-6–hearing-aid/12-biap-recommendation-nd-068–prosthetic-fitting-procedure-for-hearing-impaired-child, consulté le 11 mai 2014.

http://www.sonicvisualiser.org, consulté le 12 avril 2019. https://www.cisic.fr/CISIC/media/doccisic/synthese_questionnaire_cisic2012.pdf, consulté le 2 février 2014.

https://www.diplomatie.gouv.fr/IMG/pdf/la_surdite_de_l_enfant_-_guide_pratique-inpes_cle01de4c.pdf, consulté le 16 juillet 2019.

https://www.franceculture.fr/emissions/une-vie-une-oeuvre/mark-rothko-1903-1970, consulté le 24/04/18.

https://www.irdp.ch/institut/coefficient-bravais-pearson-2041.html, consulté le 15 juin 2019. https://www.legifrance.gouv.fr/affichCodeArticle.do?idArticle=LEGIARTI000006524761&cidTexte=LEGITEXT000006071191&dateTexte=20050212, consulté le 5 janvier 2018.

https://www.ted.com/talks/evelyn_glennie_shows_how_to_listen, consulté le 10 mai 2014 et le 25 août 2019.

https://cycling74.com/downloads/#.VzxxgPmLSM8, consulté le 15 mai 2017.

http://www.musiquecontemporaine.fr/doc/index.php/spatialisation, consulté le 10 août 2019.

http://www.db-gersite.com/HISTOLOGIE/HISTGENE/index.html, consulté le 10 juillet 2019. https://medias.ircam.fr/embed/media/xfdefef_kammerkonzert-gyorgy-ligeti, consulté le 2 février 2018.

http://demeter.revue.univ-lille3.fr/lodel9/index.php?id=430, consulté le 12 décembre 2017.

http://www.universalis.fr/encyclopedie/atmospheres/, consulté le 18 février 2018

La texture en musique : sa contribution pour la composition, l’apprentissage de la musique et ses effets sur la perception musicale et la cognition des enfants sourds implantés.

Au cours de la deuxième moitié du XXe siècle, l’émergence de la notion de texture a ouvert de nouvelles perspectives en matière de composition et d’appréhension de la musique. Il apparaît aujourd’hui évident que cette notion est devenu un outil précieux et incontournable pour analyser la musique en dépassant les éléments classiques tels que la note, l’intervalle, le rythme, la mélodie, etc… La première partie sera consacrée à définir précisément cette notion, à analyser son usage dans le répertoire contemporain et à initier une réflexion sur son statut en musicologie. La deuxième partie abordera la question de la perception auditive chez les enfants sourds en s’appuyant sur des études comportementales. L’évaluation des habiletés perceptives des enfants sourds dans le domaine de la musique souffrant actuellement d’un manque d’outil, nous étudierons comment l’utilisation de la texture peut contribuer à enrichir nos pratiques pédagogiques actuelles chez les enfants, plus particulièrement chez les enfants sourds implantés.

The texture in music : its contribution for composition, learning of music and its effects on music perception and cognition of deaf children with cochlear implants.

In the second half of the 20th century, the emergence of the notion of texture created new perspectives in the field of composition and music understanding. Today, it is clear that this notion became a valuable and major tool to analyse music by exceeding classic elements such as note, interval, rhythm, melody, and so on. The first part will be dedicated to define exactly this notion, and to analyze its use in the contemporary repertory and to introduce some thougths on its status in musicology. The second part will approach the question of deaf children hearing perception based on behavioral studies. The evaluation of the perceptual skills of deaf children in the field of music suffering at present from a lack of tool, we shall study how the use of the texture can contribute to improve our current educational practices for chlidren, more particularly among deaf children with cochlear implant.

Mots clés : texture-perception musicale-surdité-composition-apprentissage-cognition.

Remerciements

Ce travail n’aurait pas pu voir le jour sans le soutien d’un grand nombre de personnes que je tiens à remercier ici.

Tout d’abord, un grand merci à toute l’équipe du CEOP, aux parents et aux enfants sourds et tout spécialement à Martial Franzoni qui m’a permis de vivre cette belle aventure et qui m’a accordé sa confiance. Un merci tout particulier pour la team de choc des Céopiennes qui ne m’a pas lâché, malgré les moments de doutes : Anne-Sophie, Élise, Julie, Sophie, Delphine, Sandra, Anne-Laure et Marta.

Merci à toute l’équipe du LEAD, que je côtoie de près ou de loin depuis… quelques années maintenant ! Tout spécialement Marion, Laura, Helle, Laure-Hélène, Stéphane. J’exprime également ma gratitude à tous les enfants dijonnais et à leur famille pour leur participation.

J’aimerais aussi remercier les institutions qui ont contribué à ce travail, le CHU de Dijon et le Pr. Alexis Borzog Grayeli ainsi que la société Advanced Bionics : un immense merci pour le soutien de Florian Sadreux et de Jean-Baptiste Delande.

Merci aux membres du jury qui ont accepté de consacrer du temps à lire et à commenter ce travail, et en particulier Barbara Tillmann et Grazia Giacco pour avoir accepté d’être les rapporteurs de cette thèse.

Toute ma gratitude va à mes deux directeurs. Philippe, je te remercie de m’avoir fait confiance, d’avoir accepté la direction de ma thèse et d’avoir su me guider depuis le début pour me mener jusqu’ici avec un engagement admirable. Merci, Emmanuel, pour ta grande expérience, ta bienveillance, tes remarques avisées et ta générosité qui m’ont permis de mener à bien ce beau projet. Mille mercis à tous les deux pour votre soutien scientifique et humain inconditionnel.

Un immense merci revient à mes amis chers pour leur constance, leur bienveillance et leur bonne humeur : Valentine, Anne-So, Émilie, Bruno, Christiane, Anne, Delphine et Élise. Un merci spécial aussi à Alban pour ton soutien essentiel de ces deux derniers mois !

Pour terminer, je n’aurai jamais réussi tout cela sans le soutien indéfectible de ma famille. Je remercie chaleureusement mon mari, Benoit, qui par son amour et sa patience a supporté pendant plus de six ans, mes contraintes journalières et mes absences liées à ma recherche, tout en sachant m’encourager durant les moments difficiles. Un immense merci à mes filles adorées, Juliette et Louise pour leur soutien et leur encouragement magnifiques.

Notes

LIGETI György, « Wandlungen der musikalischen Form », in Die Reihe n°7, Vienne, Universal Edition, 1960. Trad. Fr. : Neuf essais sur la musique, éditions Contrechamps, 2010. ↩︎
WILSON Peter Niklas, « Interkulturelle Fantasien: György Ligetis Klavieretüden Nr. 7 und 8 », Melos 51, 1992, p. 63–84. ↩︎
LESTER Joel, Analytic Approaches to Twentieth-Century Music, New York et Londres, W. W. Norton, 1989. ↩︎
Portail de la musique contemporaine, Spatialisation, http://www.musiquecontemporaine.fr/doc/index.php/spatialisation, consulté le 10 août 2019. ↩︎
MARQUET Françoise, Zao Wou-Ki, Autoportrait, Paris, éditions Fayard, 1988. ↩︎
DUFOURT Hugues, Musique, Pouvoir, Écriture, Paris, Christian Bourgois éditeur, coll. Musique/Passé/Présent, 1991, p. 302. ↩︎
MEYER Leonard B, Emotion and Meaning in Music, 1956, The University of Chicago Press, trad. française, Emotion et Signification en Musique, Arles, Actes Sud, 2011. ↩︎
LALITTE Philippe, « Texture et émergence perceptive en musique contemporaine », Texte, texture, textile. Variations sur le tissage dans la musique, les arts plastiques et la littérature, EUD, 2013, p. 125. ↩︎
BREGMAN Alfred S., Auditory scene analysis: The perceptual organization of sound, MIT Press/Bradford Books, Cambridge, Mass, 1990. ↩︎
KIRSCHNER Sebastian et TOMASELLO Michael, « Joint drumming: Social context facilitates synchronization in preschool children », Journal of Experimental Child Psychology, Vol. 102, p. 299-314. ↩︎
HERHOLZ Sibylle C. & ZATORRE Robert J., « Musical training as a framework for brain plasticity: behavior, function, and structure », Neuron, Vol. 76, 2012, p. 486-502. ↩︎
TILLMANN Barbara, « La musique au secours du langage. De l’étude des corrélats neuronaux vers des perspectives de réhabilitation », in PLATEL Hervé et THOMAS-ANTÉRION Catherine, Neuropsychologie et art, Paris, De Boeck-Solal, coll. « Neuropsychologie », 2014, p. 177-198. ↩︎
BIGAND Emmanuel, Les bienfaits de la musique sur le cerveau, Belin, coll. « Cerveau et bien-être », 2018. ↩︎
JACQUES-DALCROZE Emile, Notes bariolées, Genève, Edition Jeheber, 1948. ↩︎
https://www.ted.com/talks/evelyn_glennie_shows_how_to_listen, consulté le 10 mai 2014 et le 25 août 2019. ↩︎
RIEDELSHEIMER Thomas, Touch The Sound : un voyage sonore avec Evelyn Glennie, un documentaire germano-britannique réalisé en 2004. ↩︎
DÉSY PROULX Monique, Pourquoi la musique ? Son importance dans la vie des enfants, Montréal, Éditions du CHU Sainte-Justine, 2014, p. 19. ↩︎
GRAHAM Daniel J., MENG Ming, « Artistic representations: clues to efficient coding in human vision », Visual Neuroscience, Vol. 28, n°4, 2011, p. 371-379. ↩︎
MANFREDI Louise R., SAAL Hannes P., BROWN Kyler J., ZIELINSKI Mark C., DAMMANN III John F., POLASHOCK Vicky S. and BENSMAIA Sliman J., « Natural scenes in tactile texture », Journal Neurophysiology, Vol. 111, 2014, p. 1792-1802. ↩︎
SILK Joseph, Une brève histoire de l’univers. Paris. Odile Jacob, 2003, p. 226. ↩︎
BURGGRAEVE Adolphe, Anatomie de texture ou Histologie, appliquée à la physiologie et à la pathologie. Gand, Annoot-Braekman, 1845, p. 12. ↩︎
SARROUILHE Denis, FAVOT Laure, Histologie UE2, Ed. Ellypses « Entrainement intensif », 2018, p. 6. ↩︎
BALAS Daniel et PHILIP Patrick, Cours d’Histologie générale [en ligne], Université de Nice Sophia-Antipolis, http://www.db-gersite.com/HISTOLOGIE/HISTGENE/index.html ↩︎
DEMANGE Michel, Les Textures des roches cristallines, Aspects microscopiques. Presse des Mines, coll. Sciences de la Terre et de l’environnement, 2011, p. 9-39. ↩︎
SCHMID Stefan, « Textures of geological materials: computer model predictions versus empirical interpretations based on rock deformation experiments and field studies », in Textures of Geological Materials (Hans Joachim BUNGE et al.eds), DGM Verlag, p. 279-301. ↩︎
GUTHLEBEN Denis, « La cristallographie, de Platon à nos jours… ». CNRS Le Journal, n°256, février 2014, p. 66. ↩︎
BAUDIN Thierry, CHATEIGNER Daniel, ESLING Claude, LUTTEROTTI Luca et MORALES Magali, « Analyse des textures cristallographiques et des microstructures », Reflets de la physique, La Cristallographie, Sciences et Techniques, n° 44-45, 2015, p. 80-85. ↩︎
Ibid., p. 84. ↩︎
SZCZESNIAK Alina Surmacka, « Classification of textural characteristics », Journal of Food Science, Vol. 28, n°4, 1963, p. 385- 389. ↩︎
SZCZESNIAK Alina Surmacka, « Sensory texture profiling – historical and scientific perspectives », Food Technology, Vol. 52, n°8, 1998, p. 54-57. ↩︎
DANIEL Christine et ROUDOT Alain-Claude, « La terminologie de la texture des aliments », Érudit, Méta, Vol. 52, n°2, juin 2007, p. 343. ↩︎
VICKERS Zata & BOURNE Malcom C., « A psychoacoustical theory of crispness », Journal of Food Science, 1976, n°41, p. 1158-1164 ↩︎
BAGOT Jean Didier, Information, sensation et perception, Paris, Armand Colin. 1999. ↩︎
SCHER Joël, Rhéologie, texture et texturation des produits alimentaires, Journal Techniques de l’ingénieur Opérations unitaires du génie industriel alimentaire, 2006. ↩︎
SCHWARTZ Naomi Oshinsky, « Adaptation of the sensory texture profile method to skin care products », Journal of Texture Studies 6, 1975, p. 33-42. ↩︎
CIVILLE Gael Vance & DUS Clar A., « Evaluating tactile properties of skincare products: a descriptive analysis technique », Cosmetics and Toiletries 106, 1991, p. 83-88. ↩︎
DUBUISSON Pauline, « Influence de la phase grasse et des polymères naturels sur les paramètres physico-chimiques en lien avec la perception tactile de l’émulsion », Thèse de doctorat, Université du Havre, 2017. ↩︎
ATTIA Dhouha, « Segmentation d’images par combinaison adaptative couleur-texture et classification de pixels : Applications à la caractérisation de l’environnement de réception de signaux GNSS », Thèse de Doctorat, Université de Technologie de Belfort-Montbeliard, 2013. ↩︎
HARALICK Robert M., « Statistical and structural approaches to texture », Proceedings of the IEEE, Vol. 67, n°5, 1979, p. 787-804. ↩︎
TOMITA Fumiaki, SHIRAI Yoshiaki, TSUJI Saburo, « Description of textures bytructural analysis », IEEE PAMI, Vol. 4, n° 2, 1982. ↩︎
GAGALOWICZ André, « Vers un modèle de textures », Thèse d’état, Université Pierre et Marie Curie, 1983. ↩︎
BUREL Gilles, « Réseaux de neurones en traitement-Des Modèles théoriques aux Applications Industrielles », Thèse d’état, Université de Bretagne occidentale, 1991. ↩︎
BRODATZ Phil, Texture: a photographic album for artists and designers, New York, Dover Publications, 1966. ↩︎
FERNANDEZ-MALOIGNE Christine, MACAIRE Ludovic, ROBERT-INACIO Frédérique, Imagerie numérique, avancées et perspectives pour la couleur, Paris, Lavoisier, 2012, p. 227-234. ↩︎
FONTANILLE Jacques, Sémiotique du visible. Des mondes de lumière, Paris, P.U.F., 1995. ↩︎
BEYAERT Anne, « Texture, couleur, lumière et autres arrangements de la perception ». Protée, Vol .3, n°3, 2003, p. 81–90. ↩︎
RICHARD JOHNSON C., MESSIER Paul, SETHARES William A., KLEIN Andrew G., BROWN Christopher A., HOANG DO Anh, KLAUSMEYER Philip A., ABRY Patrice, JAFFARD Stéphane, WENDT Herwig, ROUX Stéphane, PUSTELNIK Nelly, VAN NOORD Nanne, VAN DER MAATEN Laurens, POSTMA Eric, CODDINGTON James, DAFFNER Lee Ann, MURATA Hanako, WILHELM Henry, WOOD Sally et MESSIER Mark, « Pursuing automated classification of historic photographic papers from raking light image ». Journal of the American Institute for Conservation, Vol. 53, n°3, 2014, p. 159-170. ↩︎
Ibid., p. 16. ↩︎
SAUSSURE Ferdinand de, Écrits de Linguistique générale, Texte établi et édité par S. Bouquet et R. Engler, Paris, Gallimard, 2002. ↩︎
RASTIER François, Le silence de Saussure ou l’ontologie refusée, éd. Bouquet, 2003, p. 24. ↩︎
ADAM Jean Michel, « Une alternative au « tout narratif » : les gradients de narrativité », Recherche en Communication, Vol. 7, 1997, p. 15. ↩︎
Ibid., p. 17 ↩︎
DERRIDA Jacques, La dissémination, Paris, Seuil, 1972, p. 263. ↩︎
MOULENDA Joseph Igor, « Par-delà le sens, l’écriture et le texte. Jacques Derrida », Controverses, Revue spécialisée de philosophie, ENS, Libreville, Editions Oudjat, 2016. ↩︎
DERRIDA Jacques, Marges de la philosophie, Paris, Minuit, 1972, p. 191. ↩︎
Ibid., MOULENDA J.I., p. 13. ↩︎
BORT Françoise, DUPONT Valérie, Texte, texture, textile, Variations sur le tissage dans la musique, les arts plastiques et la littérature, Editions universitaires de Dijon, 2013, extrait de la présentation de l’éditeur. ↩︎
Ibid., p. 14. ↩︎
LE GOUIC Jean-Claude, « Sheila Hicks, Cheminements en sensualités textiles », Textile art revue, mars 2018. ↩︎
ORSENNA Erik, Voyage Aux Pays du Coton : Petit Précis de la Mondialisation, Paris, Fayard, 2006, p. 17. ↩︎
Dossier de presse : « Sheila Hicks au festival d’Automne », propos recueillis par Clément Dirié, juin 2016. ↩︎
KANDINSKY Vassily, Du spirituel dans l’art dans la peinture en particulier, trad. Française de P. Volboudt, Paris, Denoël-Gonthier, 1969 (1954), p. 96 ; Ecrits complets, La synthèse des arts, édition établie par P. Sers, Paris, Denoël-Gonthier, 1975, p. 206. Nous nous référons également à l’article écrit par Anne Beyaert-Geslin, « Modernité et synesthésies », dans VISIBLE, n°1, La diversité sensible, PULIM, 2006, p. 25-36. ↩︎
MAURIAL Sandrine, « États de couleur entre pigment-matière et pixel-lumière », Traitement du signal, Vol. 21, numéro spécial L’image numérique couleur, 2004, p. 373-384. ↩︎
DUTILLEUX Henri, Le Nouvel Observateur, rubrique « Le Musée égoïste », octobre 1984, reproduit dans la note de programme du concert de l’Orchestre de Paris, 1er et 2 juillet 1995, Cité de la Musique. ↩︎
DUTILLEUX Henri, Constellations : entretiens / Henri Dutilleux, Martine Cadieu, avant-propos de Jean Roy. Paris,
M. de Maule, 2007. ↩︎
BEYAERT Anne, « Texture, couleur, lumière et autres arrangements de la perception. » Protée, Vol. 31, n°3, 2003, p. 81–90. ↩︎
SAINT-MARTIN Fernande, Sémiologie du langage visuel, Sillery, Presses de l’Université du Québec, 1987, p. 68. ↩︎
Groupe μ, Traité du signe visuel. Pour une rhétorique de l’image, Paris, Le Seuil, 1992, p. 70. ↩︎
ROSENBERG Harold, « Les peintres d’action américains » (1952), in Charles Harrison et Paul Wood (ed.), Art en théorie 1900-1990, Hazan, 1997 pour la traduction française, p. 644. ↩︎
GREENBERG Clement, Modernist Painting, Washington, D.C., in Forum Lectures (Voice of America), 1960 ↩︎
BEYAERT Anne, « De la texture à la matière », Protée, Vol. 36, n°2, 2008, p. 104. ↩︎
Ibid., p. 103. ↩︎
Ibid., p. 101. ↩︎
DUBUFFET Jean, L’Homme du commun à l’ouvrage, Paris, Gallimard, 1973, p. 25. ↩︎
MESSENGER Thomas, « Texture and Form in the Masses of Fayrfax », Journal of the American Musicological Society, Vol. 24, n° 2, 1971, p. 282-286. « Fayrfax mess composed during the first twenty years of the sixteenth century, show a remarkably sophisticated treatment of texture /colour units which is of vital importance to a true understanding of their four-movement structure. » ↩︎
SADIE Stanley and TYRELL John, The New Grove Dictionnary of Music and Musicians, Vol XVIII, Oxford University Press, 1980, p.709. ↩︎
BENWARD Bruce & SAKER Marilyn, Music: In Theory and Practice, Vol. I. Seventh Edition, McGraw-Hill, New York, 2003, p.131. « In music, texture is the way the melodic, rhythmic and harmonic materials are combined in a composition ». ↩︎
Op. cit., p. 31. ↩︎
Benward & Saker, op. cit., p. 147. ↩︎
Op. cit., p. 148 ↩︎
LESTER Joel, Analytic Approaches to Twentieth-Century Music, op. cit., p. 89. ↩︎
DYSON George, « The Texture of Modern Music », Oxford University Press, Music & Letters, Vol. 4, n° 2, 1923, p. 107-118. ↩︎
STARR Lawrence, « Melody-Accompaniment Textures in the Music of Bartók, as Seen in His Mikrokosmos », University of California Press, The Journal of Musicology, Vol. 4, n° 1, 1985-1986, p. 91-104. ↩︎
PISTON Walter, Orchestration, London, Victor Gollancz, 1955. ↩︎
BERRY Wallace, Structural Functions in Music (1976), 2de édition, Dover, Mineola, 1987, p. 184. ↩︎
BOSSEUR Jean-Yves, « Texture et matériau dans la pensée musicale contemporaine », Analyse Musicale n°38, Paris, février 2001. ↩︎
BERRY, Op. cit., p. 192. ↩︎
ROSEN Charles, Arnold Schœnberg, Chicago, The University Press of Chicago, 1975; trad. fr.: Shoenberg, Paris, Minuit, 1979, p. 52. ↩︎
KANDINSKY Vassily, Du spirituel dans l’art et dans la peinture en particulier, éd. établie et présentée par Philippe Sers, Paris, Denoël, Gallimard, « Folio Essais », trad. de l’allemand par Nicole Debrand, trad. du russe par Bernadette Du Crest, 1989, p. 110. ↩︎
LAVIGNE Emma et HORVATH Anne, Dossier de Presse Musicircus, œuvres phares du Centre Pompidou/Musée National d’Art Moderne, 20/04/16-17/07/17, p. 4. ↩︎
Ibid., p. 6. ↩︎
JUNOD Philippe, Contrepoints. Dialogues entre musique et peinture, Genève, Contrechamps, 2006, p. 66-106. ↩︎
VALLIER Dora, « La rencontre Schoenberg-Kandinsky : Musique ⇆ Peinture », in Schoenberg-Kandinsky. Correspondance, écrits : Revue Contrechamps n° 2, Genève : Éditions Contrechamps, 1984, p. 143-153. ↩︎
ALBÈRA Philippe, À propos de « Die glückliche Hand », in Schoenberg-Kandinsky, Correspondance, écrits : Revue Contrechamps, n° 2, Genève : Éditions Contrechamps, 1984, p. 156-166. ↩︎
Note de programme publiée par Denis Herlin et citée par Jean-Michel Nectoux dans Harmonie en bleu et or : Debussy, la musique et les arts, Paris, Fayard, 2005. ↩︎
DEBUSSY Claude, Monsieur Croche et autres écrits, Paris, Gallimard, ([1971]1987), p. 325. ↩︎
BOULEZ Pierre, Point de repère, I, Imaginer, Paris : Christian Bourgeois, 1995, p. 77. ↩︎
BOULEZ Pierre, Point de repère III. Leçon de musique. Paris : Christian Bourgois. 1995, p. 265. ↩︎
FENEYROU Laurent, Debussy au miroir des écrits de Boulez. Delatour France, Goldman, Nicolas, Nattiez. La Pensée de Pierre Boulez à travers ses écrits, 2010, p. 161-176. ↩︎
EIMERT Herbert, « Debussys Jeux », Die Reihe, n°5, 1959, p. 7-8. ↩︎
BOULEZ Pierre, Le pays fertile : Paul Klee, texte préparé et présenté par Paule Thévenin, Paris, Gallimard, 1989. ↩︎
PIENCIKOWSKI Robert, Note de programme pour Structures pour deux pianos, premier livre [archive], sur le site de l’IRCAM. ↩︎
LIGETI György, « Pierre Boulez : Structure and Automatism in Structure la » in Die Reihe n° 4, 1958, trad. fr. « Décision et automatisme dans la Structure Ia de Pierre Boulez », in Neuf essai sur la musique, Genève, Editions Contrechamps, 2001, p. 89-126. ↩︎
BOULEZ Pierre, Penser la musique aujourd’hui, Denoël Gonthier, Paris, 1963. ↩︎
Le pays fertile, op.cit., p. 75. ↩︎
LALITTE Philippe, « Texture et émergence perceptive en musique contemporaine », op. cit. p. 121-133. ↩︎
LIGETI György, « Décision et automatisme dans la Structure Ia de Pierre Boulez », op. cit., p. 125. ↩︎
MICHEL Pierre, « György Ligeti : Kammerkonzert pour 13 instrumentistes (1969-70) », Analyse musicale, n°34, 1999, p. 31-51. ↩︎
GARRIGUES Juliette, ATMOSPHÈRES (G. Ligeti), Encyclopædia Universalis [en ligne], consulté le 18 février 2018. URL : http://www.universalis.fr/encyclopedie/atmospheres/ ↩︎
MICHEL Pierre, György Ligeti, Paris, Minerve, deuxième édition revue et complétée, 1995, p. 72. ↩︎
CHEMILLIER Marc, « György Ligeti et la logique des textures », Analyse musicale n°38, 2001, p. 75-85. ↩︎
DELIEGE Célestin, Cinquante ans de modernité musicale : De Darmstadt àl’IRCAM, contribution historiographique à une musicologie critique, Bruxelles, Editions Mardaga, 2003, p. 145. ↩︎
FELDMAN Morton, Écrits et paroles, précédés d’une monographie de Jean-Yves Bosseur, Paris, L’Harmattan, 1998, p. 210. ↩︎
Op. cit., p. 65. ↩︎
SAFATLE Vladimir, « Morton Feldman comme critique de l’idéologie : expression et politique dans Rothko Chapel », in Kogler, S. et Olive, J-P. (dir), Expression et geste musical, Éditions L’Harmattan, Paris, 2013. ↩︎
ISHAGHPOUR Youssef, Rothko, une absence d’image : lumière de la couleur. Tours : Éditions Léo Scheer, 2003, p. 10-11. ↩︎
https://www.franceculture.fr/emissions/une-vie-une-oeuvre/mark-rothko-1903-1970, consulté le 24/04/18. ↩︎
DELAPLACE Joseph, « Rothko Chapel de Morton Feldman : approches analytiques d’une « procession immobile » », Déméter, Centre d’étude des arts contemporains, Université Lille 3, 2015. : http://demeter.revue.univ-lille3.fr/lodel9/index.php?id=430 ↩︎
ASHTON Dore, About Mark Rothko, Oxford University Press, 1983 (réed. 1996 et 2003), p. 170. ↩︎
JOHNSON Steven, « Rothko Chapel and Rothko’s Chapel », Perspectives of New Music, Vol. 32, n^o. 2, 1994, p. 11. ↩︎
BRESLIN James E. B, Mark Rothko: a biography, Chicago: University of Chicago Press, 1993, p. 480. ↩︎
Op. cit., p. 11. ↩︎
FELDMAN Morton, op. cit., p. 81. ↩︎
Ibid., p. 81. ↩︎
ROSS Alex, The Rest is Noise : A l’écoute du XXe siècle, la modernité en musique, Acte Sud, 2010, p. 673. ↩︎
Ibid., p. 649 ↩︎
KOKORAS Panayiotis, Auditory Fusion and Holophonic Musical Texture in Xenakis’s Pithoprakta. Athènes, 2014. ↩︎
BREGMAN Albert S., Auditory scene analysis, op. cit. ↩︎
MCADAMS Steve, « Spectral fusion and the creation of auditory images », in Manfred Clynes (ed.) Music, Mind, and Brain, 1982, p. 279-298. ↩︎
SOLOMOS Makis, « Pour une filiation Xenakis-Grisey? », Makis Solomos, in Makis Solomos (éd.), Iannis Xenakis, Gérard Grisey. La métaphore lumineuse, L’Harmattan, 2003, p. 167. ↩︎
XENAKIS Iannis, « Provlimata ellinikis mousikis synthesis (Problèmes de composition musicale grecque) », Epitheorisi technis n°9, Athènes, 1955, p. 185-189. Traduction française dans Présences de / Presences of Iannis Xenakis, éd. par Makis SOLOMOS, Paris, Cdmc, 2001, p. 12. ↩︎
SOLOMOS Makis, De la musique au son. L’émergence du son dans la musique des XX^e et XXI^e siècles, Rennes, Presses Universitaires de Rennes, 2013, p. 354. ↩︎
BARTHEL-CALVET Anne-Sylvie « De la dispersion à la fusion sonore : écriture et perception des textures xenakiennes », Analyse Musicale, Vol. 38, Paris, 2001, p. 86-96. ↩︎
MORGAN Robert. P., Twentieth-Century Music: a history of musical style in modern Europe and America, New York: Norton, 1991. ↩︎
SMITH-BRINDLE Reginald, Serial Composition, Oxford University Press, 1966, p. 136 ↩︎
DUNSBY Jonathan, « Considerations of Textures », Oxford University Press, Music & Letters, Vol. 70, N° 1 (Feb., 1989), p. 51. « Lewis Rowell writes about the distinction between focus and interplay, between economy and saturation, between the thin and the dense, between the smooth and the rough, in which can be discerned the etymology of the musical term ‘texture’ in the physical term. » ↩︎
ROWELL Lewis, Thinking About Music: An Introduction to the Philosophy of Music, The University of Massachusetts (Amherst, 1983), p. 158. « By texture we mean the weave of the music, whether we conceive/perceive it as an aesthetic surface or as the warp (pitch, the vertical axis simultaneity) and woof (time, the horizontal axis, sequence) of the musical fabric. » ↩︎
ERICKSON Robert, Sound Structure in Music, Berkeley, University of California Press, 1975, p. 139.
« Texture always denotes some overall quality, the feel of surfaces, the weave of fabrics, the look of things. Words from visual and tactile sense modalities are often appropriated for descriptions of sounds and their combination: sharp, rough, dull, smooth, biting, bright, brilliant, brittle, coarse, thick, thin, dry, diaphanous, airy, finespun, flaccid, fluid, gauzy, glittery, grainy, harsh, hazy, heavy, icy, inchoate, jagged, limpid, liquescent, lush, mild, murky, pliant, relaxed, rippling… » ↩︎
STRIZICH Robert, « Texture in post-World War II music », Ex Tempore: A journal of compositional and theoretical research in music, vol. 5, n. 2, 1991, p. 1-28. « In my opinion, our traditional concepts, definitions and terms are inadequate for the discussion and analysis of new textures in post-World War II music. Indeed, much music written since 1945 is quite beyond the grasp of standard analytical terminology, chiefly because so many of these works make exclusive use of textures and textural procedures that depart significantly from conventional practices. » ↩︎
BRACKETT David, Interpreting Popular Music (Berkeley: University of California Press, 2000). John R. Covach et Graeme M. Boone, Understanding Rock: Essays in Musical Analysis (New York: Oxford University Press, 1997). ↩︎
TAGG Philip, Kojak: 50 Seconds of Television Music – Towards the Analysis of Affect in Popular Music. Götenborg: Skrifter från Musikvetenskapliga institutionen, 1979. ↩︎
MIDDLETON Richard, « Play it Again Sam: Some Notes on the Productivity of Repetition in Popular Music », Popular Music, Vol. 3, 1983, p. 235-270. ↩︎
LACASSE Serge, « Listen to My Voice »: The Evocative Power of Vocal Staging in Recorded Rock Music and Other Forms of Vocal Expression. Thèse de doctorat, Université de Liverpool, 2000. ↩︎
MIDDLETON Richard, « L’étude des musiques populaires », in Musiques, Vol. 2, Savoirs musicaux sous la direction de Jean-Jacques Nattiez, Paris, Actes Sud/Cité de la musique, 2004, p. 771. ↩︎
ZAK III Albin, I Don’t Sound Like Nobody, Remaking Music in 1950s America, University of Michigan Press, 2010. ↩︎
ZAK III Albin, The poetics of rock; California UP, 2001. ↩︎
ZAGORSKI-THOMAS Simon, « The Musicology of Record Production », Twentieth-Century Music Vol. 4, n°2, Boston: Cambridge, 2007, p. 193. Traduction personnelle : « Changes in technology can impact on the character of recorded sound in a number of ways. For instance, a series of incremental changes in a particular type of product may generate a wider palette of sonic options, one example being the development of microphone technology or dynamic compressors over many years ». ↩︎
MOORE Allan F. et DOCKWRAY Ruth, « Configuring the Sound-Box 1965-1972 », Popular Music, Vol. 29, n° 2, 2010, p. 181-197. ↩︎
LEVIN Judikael et BOSSIS Bruno, « Les descripteurs audio au service de l’analyse comparée des canaux stéréophoniques dans les musiques populaires », https://jim2019.sciencesconf.org/data/pages/LevinBossis.pdf ↩︎
MOORE Allan F., Rock: The Primary Text: Developing a Musicology of Rock, Aldershot, Ashgate, 2004, p. 34-35. ↩︎
MOORE Allan F. et DOCKWRAY Ruth, « Configuring the Sound-Box 1965-1972 », op.cit., p. 189. ↩︎
MOYLAN William, The Art of Record Production: The Creative Resources of Music Production and Audio, 1ère édition (New York: Van Nostrand Reinhold, 1992). ↩︎
LACASSE Serge, « Composition, performance, phonographie : Un malentendu ontologique en analyse musicale ? » dans Groove : Enquête sur les phénomènes musicaux contemporains, sous la direction de Serge Lacasse et Patrick Roy, Québec : Presses de l’Université Laval, 2006, p. 65-78. ↩︎
BERRY Wallace, Structural Functions in Music, op.cit. (1976). ↩︎
MCADAMS Stephen & BIGAND Emmanuel, Penser les sons, Psychologie cognitive de la musique, Presses Universitaires de France, 1994 ↩︎
BREGMAN Alfred S., Auditory scene analysis: The perceptual organization of sound, MIT Press/Bradford Books, Cambridge, Mass, 1990. ↩︎
MCADAMS Stephen, Perception et cognition de la musique. Paris, Vrin, 2015 ↩︎
JONES Mari Riess & YEE William, « L’attention aux évènements auditifs : le rôle de l’organisation temporelle », in Penser les sons, op. cit., p. 84. ↩︎
BIGAND Emmanuel, « The influence of implicit harmony, rhythm and musical training on the abstraction of tension-relaxation schemas in tonal music phrases », Contempory Music Review, Vol. 9, 1993, p. 123-137. ↩︎
BIGAND Emmanuel, Musiciens et non-musiciens perçoivent-ils la musique différemment ? Le Cerveau Musicien, Paris : De Boeck University, 2006. ↩︎
BIGAND Emmanuel, L’émotion dans le langage musical, in Parole et Musique : Aux origines du dialogue humain sous la direction de Stanislas Dehaene et Christine Petit, Odile Jacob, 2009, p. 343-357. ↩︎
BIGAND Emmanuel, PARNCUTT Richard, LERDHAL Fred, « Perception of musical tension in short chord sequences: the influence of harmonic function, sensory dissonance, horizontal motion, and musical training », Perception and Psychophysics, Vol. 58, n°1, 1996, p. 125-141. ↩︎
WERTHEIMER Max, « Experimentelle Studien über das Sehen von Bewegung », Zeitschrift für Psychologie, 61, 1912, p. 161-265. ↩︎
KOFFKA Kurt, Principles of Gestalt psychology, New York: Harcourt Brace, 1935. ↩︎
KÖHLER Wolfgang, Die physischen Gestalten in Ruhe und im stationären Zustand, Erlangen: Verlag der Philosophischen Akademie, 1920. ↩︎
EHRENFELS Chritian von, « Über Gestaltqualitäten ». Vierteljahresschrift für wissenschaftliche Philosophie, 14, 1890-1922, p. 249-292. ↩︎
GUILLAUME Paul, La psychologie de la forme, Paris, Flammarion, 1937. ↩︎
MERLEAU-PONTY Maurice, La structure du comportement. Paris, PUF, 1942, p. 143. ↩︎
GAPENNE Olivier et ROVIRA Katia, « Psychologie et cognition sans langage. Actualité d’une figure historique », Intellectica, 1999/1, n° 28, p. 229-250 ↩︎
BONNET Claude, « La perception visuelle des formes », in C. Bonnet, R. Ghiglione, J.F. Richard (éd), Traité de psychologie cognitive, Vol. 1, Perception, Action, Langage. Paris, Dunod, 2002, p. 67. ↩︎
BREGMAN, Auditory scene analysis: The perceptual organization of sound, op. cit., 1990. ↩︎
TRAINOR Laurel J., « The origins of music in auditory scene analysis and the roles of evolution and culture in musical creation », Phil. Trans. R. Soc. B, 2016, n° 370. ↩︎
CHERRY Edward Colin & TAYLOR, W. K., « Some experiments on the recognition of speech, with one and two ears», Journal of the Acoustic Society of America, Vol. 26, 1953, p. 554-559. ↩︎
HELMHOLTZ Hermann von (1877), On the sensations of tone (English translation A.J. Ellis, 1954), New York, Dover ; traduction française, Théorie physiologique de la musique, fondée sur l’étude des sensations auditives. Trad. par Georges GUEROULT et Auguste Desiré Bernard WOLFF, Paris, Masson et fils, 1868. ↩︎
DEUTSCH Diana, Psychologie de la musique, PUF, 1994, p. 117. ↩︎
WRIGHT James K. et BREGMAN Alfred S., « Auditory stream segregation and the control of dissonance in polyphonic music », Contemporary Music Review, Vol. 2, n°1, 1987, p 63-92. ↩︎
MCADAMS Stephen, Perception et cognition de la musique. Paris, Vrin, 2015, p. 29. ↩︎
BREGMAN Alfred S., Auditory scene analysis: The perceptual organization of sound, op. cit. ↩︎
BREGMAN Alfred S., « L’analyse des scènes auditives : l’audition dans des environnements complexes », McADAMS Stephen et BIGAND Emmanuel, éd., Penser les sons, psychologie cognitive de l’audition, Paris, Presses universitaires de France, 1994, p. 12. ↩︎
MCADAMS Stephen, « La reconnaissance de sources et d’événements sonores », in S. McAdams et E. Bigand (éd.), Penser les sons : La psychologie auditive de l’audition, Paris, PUF, 1994, p. 157-213. ↩︎
LALITTE Philippe, Contribution de l’analyse de scène auditive à l’analyse de la performance. IXe congrès européen d’Analyse musicale (CEAM – Euromac 9) / 9th European Music Analysis Conference, Juin 2017, Strasbourg, France. ↩︎
PAQUIER Mathieu, « Traitement du bruit et de la parole par le système auditif chez l’entendant et le déficient auditif », Les Cahiers de l’Audition, Vol. 26, 2013, p. 19. ↩︎
RENARD Christian et AZÉMA Bernard, Précis d’Audioprothèse, Production, phonétique acoustique et perception de la parole, Elsevier Masson, Chapitre 5 – Données fréquentielles et temporelles de la perception de la parole, 2005, p. 291. ↩︎
Op. cit., LALITTE Philippe, « Contribution de l’analyse de scène auditive à l’analyse de la performance. » ↩︎
GRIMAULT Nicolas, BACON Sid P., MICHEYL Christophe, «Auditory stream segregation on the basis of amplitude-modulation rate », Journal of the Acoustical Society of America, Vol. 111, 2002, p. 1340-1348. ↩︎
BREGMAN Alfred S. & CAMPBELL Jeffrey, « Primary auditory stream segregation and perception of order in rapid sequences of tones », Journal of Experimental Psychology, Vol. 89, n°2, 1971, p. 244-249. ↩︎
MCADAMS Stephen, Perception et cognition de la musique, op. cit. ↩︎
GOODCHILD Meghan et MCADAMS Stephen, « Perceptual Processes in Orchestration », in The Oxford Handbook of Timbre, Oxford University Press, 2018. ↩︎
Op. cit., MCADAMS Stephen, p. 46. ↩︎
BREGMAN Albert S. et PINKER Steven, « Auditory Streaming and the Building of Timbre », Canadian Journal of Psychology, vol. 32, 1978, p. 19-31. ↩︎
Op. cit., WRIGHT James K. et BREGMAN Alfred S., p. 68. ↩︎
Op. cit., MEYER Leonard B, Emotion and Meaning in Music, 1956. ↩︎
Ibid., p. 55. ↩︎
KURTH Ernst, Musikpsychologie. Berlin, Max Hesse, 1931, 2e éd. 1947. ↩︎
LELEU Jean-Louis, La construction de l’idée musicale : Essais sur Webern, Debussy et Boulez, éditions Contrechamps, 2015, p. 101-111. ↩︎
KURTH Ernst, Selected Writings (sous la dir. de I. Bent), Cambridge, Cambridge University Press, 2006. ↩︎
Ibid., p. 91. ↩︎
BACHELARD Gaston, La dialectique de la durée, Paris, PUF, 1950, p. 116. ↩︎
MEYER Leonard B., 1956, op. cit., p. 222-234. ↩︎
Ibid., p. 223. ↩︎
TENNEY James et POLANSKY Larry, «Temporal gestalt perception in music», Journal of Music Theory, XXIV, n° 2, 1980, p. 205-241. ↩︎
NATTIEZ Jean-Jacques, « Varèse’s Density 21.5: A study in semiological analysis », Music Analysis, n° 1, 1982, p. 243-340. ↩︎
Ibid., TENNEY and POLANSKY, p. 208: « The perceptual formation of TGs at any hierarchical level is determined by a number of factors of cohesion and segregation, the most important of which are proximity and similarity. » ↩︎
DEUTSCH Diana, « Grouping mechanisms in music », in D. Deutsch (Ed.). The Psychology of Music, 1982, p. 99-134, New York, Academic Press. The processing of pitch combinations, in D. Deutsch (Ed.). The Psychology of Music, p. 271-316. ↩︎
DELIEGE Célestin, Invention musicale et idéologie 2, Mutations historiques et lectures critiques de la modernité, Bruxelles, Editions Mardaga, 2007, p. 124. ↩︎
LERDAHL Fred, JACKENDOFF Ray, A Generative Theory of Tonal Music. Cambridge, MIT Press, 1983, p. 37-68. ↩︎
SCHENKER Heinrich, L’Écriture Libre (1935), Seconde édition revue et adaptée par Oswald Jonas. Trad. De l’allemand par N. Meeùs. Titre Original : Der freie Satz (Neue musikalische Theorien und Phantasien, vol. 3). Liège, Mardaga, 1993. ↩︎
BIGAND Emmanuel, « Contribution de la musique aux recherches sur la cognition auditive humaine », in S. McAdams et E. Bigand (éd.), Penser les sons : La psychologie auditive de l’audition, Paris, PUF, 1994, p. 267. ↩︎
BIGAND Emmanuel, « Traveling through Lerdahl’s Tonal Pitch Space Theory: A psychological perspective », Musicae Scientae, Vol. 7, n°1, 2003, p. 121-155. ↩︎
DELIEGE Irène, « Grouping conditions in listening to music: An approach to Lerdahl & Jackendoff’s grouping preference rules », Music Perception, n° 4, 1987, p. 325-359. ↩︎
CLARKE Eric F. et KRUMHANSL Carol L., « Perceiving Musical rime », Music Perception, Vol. 7, 1990, p. 213-253. ↩︎
SLOBODA John Anthony, « Cognition and real music: the psychology of music comes of age », Psychologica Belgica, Vol. 26, 1986, p. 199-219. ↩︎
Op. cit., p. 10. ↩︎
NARMOUR Eugene, The analysis and cognition of basic melodic structures: the implication-realisation model, Chicago, University of Chicago Press, 1992, p. 431. ↩︎
KRUMHANSL Carol L., « Effects of musical context on similarity and expectancy », Systematische Musikwissenschaft, Vol. 3, n°2, 1995, p. 211-250. ↩︎
SCHELLENBERG E. Glenn, « Expectancy in melody: Tests of the implication-realization model », Cognition, Vol. 58, 1996, p. 75-125. ↩︎
SCHELLENBERG E. Glenn, « Simplifying the implication-realization model of melodic expectancy », Music Perception: An Interdisciplinary Journal, Vol. 14, n°3, 1997, p. 295-318. ↩︎
SCHELLENBERG E. Glenn, ADACHI Mayumi, PURDY Kelly T. & McKINNON Margaret C., « Expectancy in Melody: Tests of Children and Adults », Journal of Experimental Psychology: General, Vol. 131, 2002, p. 511-537. ↩︎
MARGULIS Elizabeth Hellmuth, « A model of melodic expectation », Music Perception: An Interdisciplinary Journal, Vol. 22, n°4, 2005, p. 663-714. ↩︎
PEARCE Marcus T. & WIGGINS Geraint A., « Expectation in melody: The influence of context and learning », Music Perception: An Interdisciplinary Journal, Vol. 23, n°5, 2006, p. 377-405. ↩︎
BREGMAN Alfred S., Auditory scene analysis: The perceptual organization of sound, op. cit. p. 457. ↩︎
HURON David, « Voice Denumerability in Polyphonic Music of Homogeneous Timbres », Music Perception, Vol. 6, n° 4, 1989, p. 361-382. ↩︎
HURON David, Voice leading, The Science behind a Musical Art, Cambridge, MIT Press, 2016. ↩︎
REICH Steve, « Music as a gradual process », in Writings on music 1965-2000. New-York, Oxford University Press, 2002, p. 34-36. ↩︎
REICH Steve, Différentes phases, Paris, Cité de la musique-Philharmonie de Paris, 2016, p. 39. ↩︎
Op. cit., REICH Steve, Music as a gradual process. ↩︎
LALITTE Philippe, « Temporalité et texture dans « Eight Lines » de Steve Reich : de la perception locale à la forme expérientielle. » Musicologies nouvelles, Éditions Musicales Lugdivine 2017, Les temps de la musique (thèmes Agrégation 2018) 4, p. 66-76. ↩︎
Ibid., LALITTE Philippe. ↩︎
Op. cit., BREGMAN Alfred S, 1990. ↩︎
Op. cit., LALITTE Philippe. ↩︎
Diana DEUTSCH. « La perception des structures musicales ». In Psychologie de la musique, sous la direction d’Arlette Zenatti. Paris, Presses Universitaires de France, 1994, p. 118. ↩︎
Op. cit., LALITTE Philippe, p. 68. ↩︎
FRAISSE Paul, Psychologie du temps, Paris, Presses Universitaires de France, 1957. ↩︎
REICH Steve, Écrits et entretiens sur la musique, Christian Bourgeois éditeur, Paris, 1981, p. 129-130. ↩︎
HURON David, 2016, op. cit., p. 263. ↩︎
HURON David, « On the Role of Embellishment Tones in the Perceptual Segregation of Concurrent Musical Parts », Empirical Musicology Review, Vol. 2, n°4, 2007, p. 123-39. ↩︎
DIVENYI Pierre L. and OLIVER Susan K., « Resolution of Steady State Sounds in Simulated Auditory Space », The Journal of the Acoustical Society of America, Vol. 85, n°5, 1989, p. 2042-52. ↩︎
BERNARDES Gilberto, « David Huron, Voice Leading: The Science Behind a Musical Art », Portuguese Journal of Musicology, Vol. 4, n°1, 2017, p. 219-226. ↩︎
LALITTE Philippe, « Le spectre d’une voix, analyse de L’esprit des dunes de Tristan Murail. » In Szendy P. (Eds.), Tristan Murail, Paris, L’Harmattan/Ircam-Centre Georges Pompidou, 2002, p. 59-102. ↩︎
Ibid., p. 70. ↩︎
WOSZCZYK Wieslaw, BREGMAN Albert S., « Creating mixtures: The application of auditory scene analysis (ASA) to audio recording », Audio anecdotes, AK Peters, 2005. ↩︎
Ibid., p. 15. « the sequential grouping of sounds is affected by their timbres; this means that the ear will be more easily able to follow the same instrument or voice over time, if it has a unique timbre. There are two ways in which timbre might affect perception: (a) by providing features that the listener can track voluntarily over time; and (b) by influencing the automatic, bottom-up grouping of the sounds in a sequence. It is by no means certain that every feature that permits voluntary tracking is also a basis for automatic sequential grouping. » (traduction personnelle) ↩︎
Ibid., p. 17. ↩︎
BREGMAN Albert S. et MCADAMS Stephen, « Hearing Musical Streams », Computer Music Journal, Vol. 3, n° 4, 1979, p. 26-43. ↩︎
MOYLAN William, Understanding and Crafting the Mix: The Art of Recording, 2^e édition, Cambridge (Mass.), MIT Press, 2002. ↩︎
MOYLAN William, The Art of Record Production: The Creative Resources of Music Production and Audio, 1ère édition New York: Van Nostrand Reinhold, 1992. ↩︎
YOST William A., Fundamentals of Hearing: An Introduction, 5e éd., San Diego, Brill Academic Press, 2006. ↩︎
MAMASSIAN Pascal et LE CORRE François, « Des illusions dans tous les sens », L’Essentiel Cerveau et Psycho n° 12, novembre 2012-janvier 2013. ↩︎
MILLER George A. et LICKLIDER Joseph C. R., « The intelligibility of interrupted speech », Journal of the Acoustical Society of America, n° 22, 1950, p. 167-173. ↩︎
WARREN Richard M. et WARREN Roslyn P., « Auditory Illusions and Confusions », Scientific American, vol. CCXXIII, n° 6, décembre 1970, p. 30-36. ↩︎
MATHEWS Max, « The digital computer as a musical instrument. », Science, New Series, Vol. 142, No. 3592 (1963), p. 553-557. ↩︎
FERON François-Xavier, « Propositions pour une typologie des phénomènes sonores insolites. » Hybrid. Revue des arts et médiations humaines, Labex Arts H2H/Presses Universitaires de Vincennes, 2015, Réalités de l’illusion. ↩︎
RISSET Jean-Claude, « Composer le son : expériences avec l’ordinateur, 1964-1989 », Contrechamps n° 11, « Musiques électroniques », 1990, p. 112. ↩︎
DELAPLACE Joseph, György Ligeti. Un essai d’analyse et d’esthétique musicales, Rennes, Presses universitaires de Rennes, 2007, p. 131. ↩︎
MICHEL Pierre, György Ligeti, compositeur d’aujourd’hui, Paris, Minerve, 1985, p. 60-61. ↩︎
FERON François-Xavier, « L’art du Trompe-l’oreille rythmique », Intermédialités : histoire et théorie des arts, des lettres et des techniques, n° 16, Rythmer/Rhythmize, 2010, p. 145- 165. ↩︎
↩︎
CAMBOUROPOULOS Emilios et TSOUGRAS Costas, « Auditory Streams in Ligeti’s Continuum: A Theoretical and Perceptual Approach », Journal of Interdisciplinary Music Studies, vol. 3, n° 1-2, printemps-automne 2009, p. 119-137. ²⁵⁸ DOUGLAS Chelsea, NOBLE Jason et MCADAMS Stephen, « Auditory Scene Analysis and the Perception of Sound Mass in Ligeti’s Continuum », Music Perception, vol. 33, n° 3, 2015, p. 287-305. ↩︎
DOUGLAS Chelsea, NOBLE Jason et MCADAMS Stephen, « Auditory Scene Analysis and the Perception of Sound Mass in Ligeti’s Continuum », Music Perception, vol. 33, n° 3, 2015, p. 287-305. ↩︎
PRESSNITZER Daniel, SUIED Clara and SHAMMA Shihab A., « Auditory Scene Analysis: the sweet music ambiguity », Frontiers in Human Neuroscience, Vol. 5, n° 158, 2011, p. 1-10. ↩︎
SABBE Herman, « Gyorgy ligeti, illusions et allusions », J. New Music Res. Vol. 8, 1979, p. 11–34. « Yes, it is true, I often work with acoustical illusions, very analogous to optical illusions, false perspectives, etc. We are not very familiar with acoustical illusions. But they are very analogous and one can make very interesting things in this domain. » (traduction personnelle) ↩︎
CHOWNING John, « The simulation of moving sound sources », Journal of the Audio Engineering Society, vol. 19,
n. 1, 1971, p. 2-6. ↩︎
SHEPARD Roger N., « Circularity in judgments of relative pitch », J. Acoust. Soc. Am. Vol. 36, 1964, p. 2345–2353. ↩︎
KNOWLTON Kenneth C., « A computer technique for producing animated movies », Washington, D.C., April 21-23, 1964, p. 67-87. ↩︎
DEHAENE Stanislas et PETIT Christine, Parole et musique : Aux origines du dialogue humain. Odile Jacob, 2009, p. 324. ↩︎
PENROSE Lionel S. et PENROSE Roger, « Impossible Objects: A Special Type of Illusion », British Journal of Psychology, Vol. 49, n° 1, 1958, p. 31–33. ↩︎
Op. cit., FÉRON François-Xavier, « L’Art du « trompe-l’oreille » rythmique », p. 159. ↩︎
BOBÉE Emmanuelle, « La partition sonore et musicale de « Dunkerque » (C. Nolan, 2017). « Une expérience sensorielle inédite », Revue musicale OICRM, Vol. 5, n°2, 2018, p. 125–148. ↩︎
DEUTSCH Diana, « The Paradox of Pitch Circularity », Acoustics Today, Vol. 6, n° 3, Juillet 2010, p. 8. ↩︎
RISSET Jean-Claude, « Pitch and Rhythm Paradoxes: Comments on Auditory Paradox Based on Fractal Waveform », Journal of the Acoustical Society of America, Vol. 80, n° 3, 1986, p. 961-962. ↩︎
RISSET Jean-Claude, « Ouvrir l’espace sonore : Max Mathews, John Chowning, Holophon, » Journée d’informatique musicale, 2011. ↩︎
CHOWNING John, «The Simulation of Moving Sound Sources », Journal of the Audio Engineering Society, Vol. 19, p. 2-6, 1971, republié dans Computer Music Journal, vol. 1, n°3, 1977, p. 48-52. ↩︎
CHOWNING John, La Spatialisation des musiques électroacoustiques, Publications de l’université de Saint-Etienne, Saint-Etienne : 2012, p. 19-21. ↩︎
DEUTSCH Diana, «An auditory illusion », Nature, n° 251, 1974, p. 307-309. ↩︎
WESSEL David L. et RISSET Jean-Claude, « Les illusions auditives », in Claude Malric (dir.), Musique et ordinateur [Encyclopaedia Universalis, Encyclopaedia Universalis, 1979, p. 161- 171.], Les Ulis, Centre expérimental du spectacle, 1983, p. 93-105. ↩︎
D’ANGIOLINI Giuliano, Jesu, un chant de confrérie en Sardaigne, Éditions Delatour France, Sampzon, 2009. ↩︎
MCADAMS Stephen, Perception et cognition de la musique, op. cit., p. 22. ↩︎
LORTAT-JACOB Bernard, Chants de Passion, au cœur d’une confrérie de Sardaigne, Paris, Cerf, 1998, p. 342. ↩︎
CASTELLENGO Michèle, LORTAT-JACOB Bernard, LEOTHAUD Gilles, « Un paradoxe de perception de la hauteur : la « quintina » des chanteurs sardes », ISMA (International Symposium on Musical Acoustics), Perugia (Italie), 2001. ↩︎
MONTEVERDI Claudio, « Préface aux Madrigaux guerriers et amoureux, huitième livre des madrigaux », in Correspondances, préfaces, épîtres dédicatoires, trad. A. Russo, Sprimont, Mardaga, 2001, p. 269. ↩︎
Francis WOLFF, Pourquoi la musique ? Paris, Fayard, 2015. ↩︎
Ibid., p. 95. ↩︎
Ibid., p. 130. ↩︎
HANSLICK Eduard, Du beau dans la musique, Leipzig, 1854, trad. fr. Ch. Bannelier, Paris, Bourgois, 1986, p. 135. ↩︎
EEROLA Tuomas, «The dynamics of musical expectancy: Cross-cultural and statistical approaches to melodic expectations », Jyväskylä studies in humanities, 2003. ↩︎
WOLFF Francis, op. cit., p. 127. ↩︎
BISSELL Arthur Dart, The Role of Expectation in Music, A Study In The Psychology Of Music, New Haven, 1921, p.9. « Music possesses one point of great advantage over all the other arts – with the possible exception of dancing – in this matter of expectation in its unique position as regards repetition. The other arts allow of repetition (dancing particularly), but music calls for it, demands it; it enters into music as an integral factor ». ↩︎
HURON David, HELLMUTH MARGULIS Elizabeth, « Musical Expectancy and Thrills », in P.N. Juslin et J.A. Sloboda (éd.), Handbook of Music and Emotion: Theory, Research, Applications, Oxford-Toronto, Oxford University Press, 2010, p. 586. ↩︎
HURON David, Sweet Anticipation: Music and The Psychology of Expectation. Cambridge: MIT Press, 2006. ↩︎
MEYER Leonard B., Emotion and Meaning in Music, op. cit. ↩︎
VIEILLARD Sandrine, PERETZ Isabelle, GOSSELIN Nathalie, KHALFA Stéphanie, GAGNON Lise & BOUCHARD Bernard, « Happy, sad, scary and peaceful musical excerpts for research on emotions », Cognition and Emotion, Vol. 22, n°4, 2008, p. 720-752. ↩︎
BIGAND Emmanuel, FILIPIC Suzanne & LALITTE Philippe, « The time course of emotional responses to music », Annals of the New York Academy of Sciences, 1060, 2005, p. 429-437. ↩︎
JUSLIN Patrik N. et SLOBODA John A., « Introduction. Aims, Organization, and Terminology », in P.N. Juslin et J.A. Sloboda (dir.), Handbook of Music and Emotion. Theory, Research, Applications. New York, Oxford University Press, 2010, p. 3-12. ↩︎
DARWIN Charles, The Expression of the Emotions in Man and Animals, London, John Murray, 1872. ↩︎
EKMAN Paul, « Biological and Cultural Contribution to Body and Facial Movements in the Expression of the Emotions », p.73-101, in A.O. Rorty (dir.), Explaining Emotions. Los Angeles, University of California Press, 1980. ↩︎
PLUTCHIK Robert, Emotion a Psycho Evolutionary Synthesis, Harper, New York, 1980. ↩︎
FERNANDO Nathalie, EGERMANN Hauke, CHUEN Lorraine, KIMBEMBÉ Bienvenu et MCADAMS Stephen, « Musique et émotion : Quand deux disciplines travaillent ensemble à mieux comprendre le comportement musical humain », Anthropologie et Sociétés, 2014, Vol. 38, n°1, p. 167–191. ↩︎
PANKSEPP Jaak, « The Emotional Sources of Chills Induced by Music », Music Perception, 1995, Vol. 13, n°2, p. 171-207. ↩︎
PANKSEPP Jaak, Affective Neuroscience, New York, Oxford University Press, 1998. ↩︎
PERETZ Isabelle, « Towards a Neurobiology of Musical Emotions », p. 99-126, in P.N. Juslin et J.A. Sloboda (dir.), Handbook of Music and Emotion. Theory, Research, Applications. New York, Oxford University Press, 2010. ↩︎
BIGAND Emmanuel, « L’émotion dans le langage musical », in Parole et Musique : Aux origines du dialogue humain sous la direction de Stanislas Dehaene et Christine Petit, Odile Jacob, 2009, p. 346. ↩︎
SHENFIELD Tali, TREHUB Sandra & NAKATA Takayuki, « Maternal singing modulates infant arousal », Psychology of Music, Vol. 31, n°4, 2003, p. 365-375. ↩︎
HURON David, « Perceptual and cognitive applications in music information retrieval », In International Symposium on Music Information Retrieval, 2000. ↩︎
Op.cit., PERETZ Isabelle, « Towards a Neurobiology of Musical Emotions » ↩︎
PERETZ Isabelle, Le temps stratégique, mars-avril 2000, n°92. ↩︎
MATHIEU Louise, « Un regard actuel sur la rythmique Jacques-Dalcroze », Recherche en éducation musicale, N°28, Décembre 2010, p. 24. ↩︎
DAMASIO Antonio, L’Erreur de Descartes. La raison des émotions. Paris, Odile Jacob, 1995. ↩︎
LEVITIN Daniel, De la note au cerveau, Paris, Editions Héloïse d’Ormesson, 2010, p. 239. ↩︎
BLOOD Anne J. & ZATORRE Robert J., « Intensely pleasurable responses to music correlate with activity in brain regions implicated in reward and emotion », Proceedings of the National Academy of Sciences of the United States of America, Vol.98, n°20, 2001, p. 11818-11823. ↩︎
IMBERTY Michel, L’aquisition de structures tonales chez l’enfant, Paris, Klincksieck, 1969. ↩︎
BHARUCHA Jamshed, « Music cognition and perceptual facilitation: A connectionist framework », Music Perception, n°5, 1987, p. 1-30. ↩︎
HURON David, Sweet anticipation, Massachusetts, M.I.T. Press, 2006. ↩︎
FRANGNE Pierre-Henry, LACOMBE Hervé, MASSIN Marianne, PICARD Timothée. « Musique et émotion : problèmes et enjeux ». Pierre-Henry Frangne, Hervé Lacombe, Marianne Massin et Timothée Picard. La valeur de l’émotion musicale, Presses universitaires de Rennes, 2017, p. 9-36. ↩︎
SCHOPENHAUER Arthur, Le monde comme volonté et comme représentation, trad. A. Burdeau, Paris, PUF, 1966, livre III, § 39 : « De la métaphysique de la musique », p. 1198. ↩︎
BACHELARD Gaston, La Dialectique de la durée (1950), Paris, PUF, 1980, p. 116. ↩︎
IMBERTY Michel, « Introduction : Du geste temporel au sens » in Temps geste et musicalité, sous la direction de Michel Imberty et Maya Gratier, Paris, L’Harmattan, 2007, p. 9. ↩︎
TILLMANN Barbara & POULIN-CHARRONNAT Bénédicte, « Etudier les attentes musicales de l’auditeur non-musicien : le paradigme d’amorçage musical », Intellectica, n°48-49, 2008, p. 27-35. ↩︎
CLARKE Eric, Ways of Listening: An ecological approach to the perception of musical meaning. Oxford, NY: Oxford University Press, 2005. ↩︎
AGAWU Kofi, Playing with Signs: A Semiotic Interpretation of Classic Music, Princeton, Princeton University Press. 1991. ↩︎
KRAMER Lawrence, « Subjectivity Rampant! Music, Hermeneutics, and History », in The Cultural Study of Music. A critical introduction, ed. by Martin Clayton, Trevor Herbert and Richard Middleton, New York: Routledge, 2003, p. 124-35. ↩︎
NARMOUR Eugene, « Hierarchical expectation and musical style », In: D. Deutsch (ed), The Psychology of Music, 2nd Edition. San Diego: Academic Press, 1999, p. 442-472. ↩︎
TEMPERLEY David, The Cognition of Basic Musical Structures. Cambridge MA: MIT Press, 2001. ↩︎
CLARKE Erick, Ways of Listening: An ecological approach to the perception of musical meaning, op. cit., p. 91. ↩︎
HURON David, « The ramp archetype and the maintenance of auditory attention », Music Perception, Vol. 10, n°1, 1992, p. 83-92. ↩︎
HURON David, Sweet Anticipation: Music and The Psychology of Expectation, op. cit. ↩︎
TAN Siu-Lan, PFORDRESHER Peter, HARRE Rom, « The Question of Meaning in Music », In Psychology of Music: From Sound to Significance. New York : Psychology Press, 2010, p. 245–259. ↩︎
JAUSS Hans Robert, Pour une esthétique de la réception, Paris, éditions Gallimard, 1978. ↩︎
GADAMER Hans-Georg, Wahrheit und Methode (W.M), Tübingen, J.C.B. Mohr, 1960, 2. Auflage, 1965, trad. française partielle Vérité et Méthode, Paris, éd. Du Seuil, 1976. ↩︎
HUSSERL Edmund, Méditations cartésiennes, Paris, Vrin, 1953. ↩︎
KALINOWSKI Isabelle, « Hans-Robert Jauss et l’esthétique de la réception », Revue germanique internationale, Vol. 8, 1997, p. 151-172. ↩︎
MEYER Leonard B., Emotion and Meaning in Music, 1956, op. cit. p. 77. ↩︎
Ibid., p. 232. ↩︎
Ibid., p. 222. ↩︎
LALITTE Philippe, « Vers une analyse texturale fondée sur les principes de l’analyse de scène auditive », In Analyse et perception, Actes des Journées d’analyse musicales, 2016. Dijon, Editions Universitaires de Dijon. ↩︎
KOFFKA Kurt, Principles of Gestalt psychology. New York, Harcourt Brace, 1935, p. 176. ↩︎
MEYER op. cit., p. 24. ↩︎
HURON, Sweet Anticipation: Music and The Psychology of Expectation, op. cit. ↩︎
En anglais: Imagination, Tension, Prediction, Reaction, Appraisal. ↩︎
HURON David et HELLMUTH MARGULIS Elizabeth, Musical Expectancy and Thrills, op. cit., p. 588. ↩︎
TROUSSEAU Armand, Extrait de son discours de rentrée de la Faculté de Médecine de Paris, prononcé le 2 novembre 1842. ↩︎
http://affairesjuridiques.aphp.fr/textes/arrete-du-23-avril-2012-relatif-a-lorganisation-du-depistage-de-la-surdite-permanente-neonatale/, consulté le 15 juillet 2019. ↩︎
CHAPMAN Robin S., « Children’s Language Learning: An Interactionist Perspective ». Journal of Child Psychology and Psychiatry and allied disciplines, Vol. 41, n°1, 2000, p. 33-54. ↩︎
KARMILOFF-SMITH Kyra & KARMILOFF-SMITH Annette, Comment les enfants entrent dans le langage. Paris : Retz, 2012. ↩︎
LINA-GRANADE Geneviève & TRUY Éric, « Conduite à tenir devant une surdité de l’enfant ». EMC-Oto-rhino-laryngologie, Vol. 2, n° 3, 2005, p. 290-300. ↩︎
MONDAIN Michel & BLANCHET Catherine & VENAIL Frederic & VIEU Adrienne, « Classification et traitement des surdités de l’enfant. » Emc – Oto-rhino-laryngologie, Vol. 2, 2005, p. 301-319. ↩︎
http://www.biap.org/biapfrancais.htm ↩︎
GUIDETTI Michel & TOURRETTE Catherine. (2002). Handicaps et développement psychologique de l’enfant. Paris, Armand Colin. ↩︎
Expertise Collective, Déficits auditifs : Recherches émergentes et applications chez l’enfant, Inserm, 2006. ↩︎
ALBERTINI John A., « Deafness and Hearing Loss ». The Corsini Encyclopedia of Psychology. Ed. I. B. Weiner and W. E. Craighead. 4th ed. Vol. 2. Hoboken: John Wiley & Sons, 2010, p. 461-62. ↩︎
ROBERTS Megan Y., « Parent-Implemented Communication Treatment for Infants and Toddlers With Hearing Loss: A Randomized Pilot Trial », Journal of Speech Language and Hearing Research, Vol. 62, n°1, 2018, p. 143-152. ↩︎
Op. cit., Inserm, p. 105. ↩︎
HARDELIN Jean-Pierre, DENOYELLE Françoise, LEVILLIERS Jacqueline, SIMMLER Marie-Christine & PETIT Christine, « Les surdités héréditaires : génétique moléculaire », Med Sci (Paris), Vol. 20, n°3, 2004, p. 311–316. ↩︎
MARLIN Sandrine, GARABÉDIAN Éréa Noël, ROGER Gilles, MOATTI Lucien, MATHA Nicole, LEWIN Patricia, et al. « Connexin 26 gene mutations in congenitally deaf children: pitfalls for genetic counseling », Arch. Otolaryngol. head Neck Surg, 2001, Vol. 127, n°8, p. 927-33. ↩︎
« Dossier Génétique et Surdité », Collège National d’Audioprothèse, Vol. 26, n°1, 2013, p. 6-20. ↩︎
Recommandation BIAP 06/8 : « L’appareillage de l’enfant déficient auditif. » http://www.biap.org/en/component/content/article/66-recommendations/ct-6–hearing-aid/12-biap-recommendation-nd-068–prosthetic-fitting-procedure-for-hearing-impaired-child ↩︎
LAURENT Stéphane et ROY Thomas, « Le Bilan d’efficacité prothétique : interprétation et utilisation pour les réglages », Les Cahiers de l’Audition n°6, 2012, p. 24. ↩︎
TRUY Éric, « Méthodes instrumentales de réhabilitation de l’audition : intérêts et limites. » In M. Mondain, V. Brun, Les surdités de l’enfant. Entretiens de rééducation et réadaptation fonctionnelle. Issy-les-Moulineaux : Elsevier Masson, 2009, p. 11-19. ↩︎
BIZAGUET Éric, « L’appareillage de l’enfant sourd », Revues générales : Audition, Réalités pédiatriques, n°175, Décembre 2012, p. 18. ↩︎
La surdité de l’enfant – guide pratique à l’usage des parents, édition INPES/Fondation de France, 2005, p. 69. https://www.diplomatie.gouv.fr/IMG/pdf/la_surdite_de_l_enfant_-_guide_pratique-inpes_cle01de4c.pdf ↩︎
LIGNY Chantal, SIMON Patricia, MATAGNE Laurence & SCHEPERS Franz, « Implantation cochléaire bilatérale ». A.N.A.E. Approche Neuropsychologique des Apprentissages chez l’Enfant, Vol. 27, Tome 5, n°138, 2015, p. 403-413. ↩︎
COENE Martine & SCHAUWERS Karen & GILLIS Steven & ROORYCK Johan & GOVAERTS Paul. « Genetic predisposition and sensory experience in language development: Evidence from cochlear-implanted children. » Language and cognitive Processes. Psychology Press, Vol. 26, n°8, 2011, p. 1083-1101. ↩︎
https://www.cisic.fr/CISIC/media/doccisic/synthese_questionnaire_cisic2012.pdf ↩︎
ANDEM, L’implant cochléaire chez l’enfant sourd pré-lingual, Paris, ANDEM-Service des Études, 1994. ↩︎
PREISLER Gunilla, Les implants cochléaires chez les enfants sourds. Strasbourg, Edition du conseil de l’Europe, 2001. ↩︎
TRUY Éric & LINA-GRANADE Geneviève, « Implantation cochléaire de l’enfant : Technologie, bilan médical et sélection des candidats, réhabilitation. » Archives de Pédiatrie, Vol. 10, n°6, 2003, p. 554-564. ↩︎
GOVAERTS Paul J., DAEMERS Kristin, SCHAUWERS Karen, De BEUKELAER Carina, YPERMAN Marjan, De CEULAER Geer., et al., « Implantation précoce et/ou bilatérale. » Rééducation orthophonique, n°217, 2004, p. 31-47. ↩︎
CLARK Graeme, « Cochlear implants in children: safety as well as speech and language », Int J Pediatr Otorhinolaryngol, Vol. 67 Suppl 1, p. 7-20, 2003. ↩︎
HAGE Catherine, CHARLIER Brigitte & LEYBAERT Jacqueline. Compétences cognitives, linguistiques et sociales de l’enfant sourd. Pistes d’évaluations. Bruxelles : Mardaga, 2006. ↩︎
HAGE Catherine et al., 2006, « Chapitre 11 : L’enfant porteur d’implant cochléaire : Intervention chirurgicale, suivi et évaluation », op. cit., p. 247-266. ↩︎
WILSON Blake S., FINLEY Charles C., LAWSON Dewey T., WOLFORD Robert D., ZERBI Mariangeli. « Design and evaluation of a continuous interleaved sampling (CIS) processing strategy for multichannel cochlear implants. » Journal of Rehabilitation Research and Development, Vol. 30, n°1, 1993, p. 110-116. ↩︎
DAUMAN René, CARBONNIERE Bernadette, SORIANO Véronique, BERGER-LAUTISSIER Sylvie, BOUYÉ Jany, DEBRUGE Éric, CORIAT Géraldine et BÉBÉAR Jean-Pierre, « Implants cochléaires chez l’adulte et l’enfant. » Encycl Méd Chir (Elsevier, Paris), Oto-rhino-laryngologie, 20-185- D-10, 1998, p. 7. ↩︎
WILSON Blake S. & DORMAN Mickael F., « Cochlear Implants: Current designs and future possibilities », Journal of Rehabilitation Research and Development, Vol. 45, n°5, 2008, p. 695-730. ↩︎
WILSON Blake S., « The Remarkable Cochlear Implant and Possibilities for the Next Large Step Forward », Acoustical Society of America, Acoustics Today, Vol. 15, n°1, 2019, p. 53-61. ↩︎
LENEL Nadjmah, « Les communications alternatives », In M. Mondain et V. Brun (Eds.), Les surdités de l’enfant. Issy-les-Moulineaux, Masson, 2009, p. 20-27. ↩︎
LEDERBERG Amy & EVERHART Victoria S., « Conversations Between Deaf Children and Their Hearing Mothers : Pragmatic and Dialogic Characteristics. » Journal of deaf studies and deaf education. Vol. 5, 2000, p. 303-322. ↩︎
DE BOYSSON-BARDIES Bénédicte. Comment la parole vient aux enfants. Paris : Odile Jacob poche, 2005. ↩︎
DELAROCHE Monique, Au fil des regards et des caresses…, Ortho-éditions, 2012, p. 27. ↩︎
SOULÉ Michel et CYRULNIK Boris, L’intelligence avant la parole : nouvelles approches originales du bébé, Paris, ESF, 1998, p. 22. ↩︎
BRUNER Jérome S., Le développement de l’enfant, savoir faire, savoir dire (Trad. M. Deleau), Paris, P.U.F., 1983. ↩︎
Ibid., p. 171. ↩︎
MUNDY Peter & NEWELL Lisa, « Attention, joint attention, and social cognition », Current directions in Psychological Science, Vol. 16, 2007, p. 269-274. ↩︎
DELAROCHE Monique, Au fil des regards et des caresses…, op. cit., p. 19. ↩︎
STERN Daniel N., Le monde interpersonnel du nourisson, PUF le fil rouge, 2003. ↩︎
CORNETT Orin R., « Cued Speech », American Annals of the Deaf, Vol.112, p. 3-13, 1967. ↩︎
LEYBAERT Jacqueline & LaSasso Carol, « Cued speech for enhancing speech perception and first language development of children with cochlear implants. » Trends in Amplification, Vol. 14, n°2, 2010, p. 96–112. ↩︎
LEYBAERT Jacqueline & ALEGRIA Jésus, « The role of cued speech in language development of deaf children. » In M. Marschark & P. E. Spencer (Eds.), Handbook of deaf studies, language, and education. New York: Oxford University Press, 2003, p. 261-274. ↩︎
Article L312-9-1 du Code de L’éducation. https://www.legifrance.gouv.fr/affichCodeArticle.do?idArticle=LEGIARTI000006524761&cidTexte=LEGITEXT00000 6071191&dateTexte=20050212 ↩︎
Dictionnaire 1200 signes français-LSF, Editions Monica Companys, 2000. ↩︎
BOUHIER-CHARLES Nathanaëlle, Signe avec moi : la langue gestuelle des sourds à la portée de tous les bébés, Editions Monica Companys, 2006. ↩︎
Op. Cit., Handicaps et développement psychologique de l’enfant, 2002. ↩︎
Op. Cit., Conduite à tenir devant une surdité de l’enfant, 2005. ↩︎
DE BOYSSON-BARDIES Bénédicte. Comment la parole vient aux enfants. Paris : Odile Jacob poche, 2005. ↩︎
VINTER Shirley, L’acquisition du langage oral par l’enfant sourd. In Solal (Ed.), Précis d’audiologie et de déglutition, Marseille,2005, p. 271-292 ↩︎
BERTONCINI Josiane et DE BOYSSON-BARDIES Bénédicte. « Chapitre 4. La perception et la production de la parole avant deux ans », Michèle Kail éd., L’acquisition du langage. Vol. I. Le language en émergence. De la naissance à trois ans. Presses Universitaires de France, 2000, p. 95-136. ↩︎
EILERS et OLLERS, « Infant vocalizations and the early diagnosis of severe hearing impairment. » J. Pediatr. Vol.124, n°2, 1994, p 199-203. ↩︎
DUMONT Annie, Implantations cochléaires : guide pratique d’évaluation et de rééducation, Isbergues, Ortho Edition, 1997. ↩︎
CARRÉ Alain, Musique et Surdité, Paris, Fuzeau, 2008. ↩︎
ALIS Valérie et JUBIEN Nicole, « Quelques particularités de l’accès au langage chez l’enfant sourd, » in Implant cochléaire pédiatrique et rééducation orthophoniste, Médecine-Sciences, Flammarion, Paris, 2009, p. 14. ↩︎
HAGE Catherine, « Co-construire le langage : le défi des interactions précoces avec le très jeune enfant sourd », A.N.A.E. Approche Neuropsychologique des Apprentissages chez l’Enfant, Vol.27, Tome 5, n°138, 2015, p. 427-434. ↩︎
DELEAU Michel & LE MANER-IDRISSI Gaid, « Le développement des habiletés pragmatiques chez les enfants sourds ». In L’acquisition du Langage Chez l’Enfant Sourd, Marseille, Solal, 2005. ↩︎
LEPOT-FROMENT Christiane & CLEREBAUT Nadine, L’enfant Sourd. Chapitre 2 : « Les interactions prélinguistiques entre l’enfant et ses parents », Bruxelles, De Boeck, 1996, p. 59-82. ↩︎
GOLD Claudia M., À l’écoute des émotions de l’enfant, Paris, Albin Michel, 2014. ↩︎
STERN Daniel, Le monde interpersonnel du nourrisson, Paris, PUF, 1989. ↩︎
TRONICK Edward, « Multilevel meaning making and dyadic expansion of consciousness theory: The emotional and the polymorphic polysemic flow of meaning », in D. Fosha, D.J. Siegel, M. Solomon (éd.) The healing power of emotion: Affective neuroscience, development, and clinical practice, New York, Norton; 2008, p. 86–110. ↩︎
ROSENBLUM Ouriel, « Du bébé à l’empathie : Une approche des interactions affectives », in A. Braconnier & J. Sipos (Dir), Le Bébé et les interactions précoces, Paris, PUF, 1998, p. 167-194. ↩︎
BLAMEY Peter J., SARANT Julia Z., PAATSCH Louise E., BARRY Johanna G., BOW Catherine P., WALES Roger J., et al., « Relationships Among Speech Perception, Production, Language, Hearing Loss, and Age in Children with Impaired Hearing », Journal of Speech Language Hear Research, Vol. 44, n°2, 2001, p. 264-285. ↩︎
FAGAN Mary K. & PISONI David B., « Hearing Experience and Receptive Vocabulary Development in Deaf Children with Cochlear Implants », Journal of Deaf Studies and Deaf Education, Vol.15, n°2, 2010, p. 149-161. ↩︎
HAYES Heather, GEERS Ann E., TREIMAN Rebecca & MOOG Jean S., « Receptive Vocabulary Development in Deaf Children with Cochlear Implants: Achievement in an Intensive Auditory-Oral Educational Setting », Ear Hearing, Vol.30, n°1, 2009, p. 128-135. ↩︎
CONNOR Carol M., CRAIG Holly K., RAUDENBUSH Stephen W., HEAVNER Krista & ZWOLAN Teresa A., « The Age at Which Young Deaf Children Receive Cochlear Implants and Their Vocabulary and Speech-Production Growth: Is There an Added Value for Early Implantation? », Ear Hearing, Vol.27, n°6, 2006, p. 628-644. ↩︎
RINALDI Pasquale, CASELLI Cristina, « Lexical and Grammatical Abilities in Deaf Italian Preschoolers: The Role of Duration of Formal Language Experience », The Journal of Deaf Studies and Deaf Education, Volume 14, Issue 1, Winter 2009, p. 63–75. ↩︎
BRIEC Julie, LE MANER-IDRISSI Gaïd, DARDIER Virginie, ROUXEL Géraldine, TAN-BESCOND Géraldine & GODEY Benoit, « Échanges conversationnels avec un partenaire familier : étude comparative entre enfants sourds, implantés cohléaires depuis 2 ans et enfants entendants. », L’Année psychologique, Vol. 112, n°1, 2012, p. 17-48. ↩︎
LE MANER-IDRISSI Gaïd, PAJON Cécile, GAVORNIKOVA-BALIGAND Zdenka, DELEAU Michel, TAN-BESCOND Géraldine & GODEY Benoit, « Implant cochléaire et développement des échanges conversationnels », Revue canadienne des sciences du comportement, Vol. 40, n°2, 2008, p. 120-127. ↩︎
BEDOUIN Nathalie, BESOMBES Anne-Marie, ESCANDE Eliette, DUMONT Annie & TILLMANN Barbara, « Déficits morphosyntaxiques chez des enfants sourds implantés : hypothèses et pistes de remédiation par le rythme musical », Rééducation orthophonique, n°268, 2016, p. 261-288. ↩︎
BEDOUIN Nathalie, BESOMBES Anne-Marie, ESCANDE Eliette, DUMONT Annie, LALITTE Philippe & TILLMANN Barbara, « Boosting syntax training with temporally regular musical primes in children with cochlear implants », Annals of Physical and Rehabilitation Medicine, Vol.61, n°6, 2018, p. 365-371. ↩︎
EISENBERG Laurie, MARTINEZ Amy, HOLOWECKY Suzanne, POGORELSKY Stephanie, « Recognition of lexically controlled words and sentences by children with normal hearing and children with cochlear implants », Ear Hear, Vol. 23, n°5, p. 450-62. ↩︎
GALLEGO Carlos, MARTIN-ARAGONESES Teresa, LOPEZ-HIGES Ramón & PISON Guzmán, « Semantic and syntactic reading comprehension strategies used by deaf children with early and late cochlear implantation. », Research in developmental disabilities, Vol. 49-50, 2016, p. 153-170. ↩︎
LORENZI Christian, GILBERT Gaëtan, CARN Héloïse, GARNIER Stéphane et MOORE Brian C. J., « Speech perception problems of the hearing impaired reflect inability to use temporal fine structure », Proceedings of the National Academy of Sciences, Dec 2006, Vol. 103, n°49, p.18866-18869. ↩︎
DESAUNAY Melodie, FLEURIOT Pierre, DEBRUILLE Louis, GARNIER Stéphane, GARABEDIAN Erea Noël, LOUNDON Nathalie, MARLIN Sandrine, DENOYELLE Françoise, TRAN BA HUY Patrice, De WAELE Catherine, GILBERT Gaëtan & LORENZI Christian, « Rôle des informations d’enveloppe temporelle et de structure temporelle fine dans l’intelligibilité de la parole chez les sujets entendants et malentendants », Les Cahiers de l’Audition, Vol. 20, n°3, 2007, p. 46-50. ↩︎
CONWAY Christopher M. & CHRISTIANSEN Morten H., « Seeing and Hearing in Space and Time : Effects of modality and presentation rate on implicit statistical learning », European Journal of Cognitive Psychology, Vol.21, n°4, 2009, p. 561-580. ↩︎
BADDELEY Alan, « Working Memory », Science, Vol.255, n°5044, 1992, p. 556-559. ↩︎
HARRIS Michael S., PISONI David B., KRONENBERGER William G., GAO Sujuan, CAFFREY Helena M., & MIYAMOTO Richard T., « Developmental trajectories of forward and backward digit spans in deaf children with cochlear implants », Cochlear implants international, Vol.12 (Suppl. 1), 2011, p. 84-88. ↩︎
PISONI David B. & CLEARY Miranda, « Measures of Working Memory Span and Verbal Rehearsal Speed in Deaf Children after Cochlear Implantation », Ear Hearing, Vol.24, n°1, 2003, p. 106-120. ↩︎
PISONI David B., KRONENBERGER William G., ROMAN Adrienne & GEERS Ann E., « Measures of digit span and verbal rehearsal speed in deaf children after more than 10 years of cochlear implantation », Ear and Hearing, Vol.32, 2011, p. 60–74. ↩︎
KRAL Andrej & EGGERMONT Jos J., « What’s to lose and what’s to learn: Development under auditory deprivation, cochlear implants and limits of cortical plasticity. » Brain Research Reviews, Vol.56, 2007, p. 259-269. ↩︎
ROCHETTE Françoise, « Entraînement Auditif et Musical Chez l’Enfant Sourd Profond : Effets sur la Perception Auditive et Effets de Transferts », Thèse d’état, Université de Bourgogne, 2012. ↩︎
PINTO Serge et SATO Marc, Traité de Neuro-linguistique : du cerveau au langage, De Boeck, 2016, p. 259. ↩︎
FINNEY Eva M., FINE Ione & DOBKINS Karen R., « Visual Stimuli activate auditory cortex in the deaf », Nature Neurosciences, Vol.4, n°12, 2001, p. 1171-1173. ↩︎
LEVÄNEN Sari, JOUSMÄKI Veikko & HARI Riitta, « Vibration-induced auditory-cortex activation in a congenitally deaf adult », Current Biology, Vol.8, n°15, 1998, p. 869-872. ↩︎
MOORE Jean K., NIPARKO John K., MILLER George A. & LINTHICUM Fred H., « Effect of Profound Hearing Loss on A Central Auditory Nucleus », American Journal of Otology, Vol.15, n°5,1994, p. 588-595. ↩︎
SHARMA Anu, DORMAN Michael F. & SPAHR Anthony J., « A sensitive period for the development of the central auditory system in children with cochlear implants, implications for age of implantation », Ear Hearing, Vol.23, n°6, 2002a, p. 532-539. ↩︎
GILLEY Phillip M., SHARMA Anu & DORMAN Michael F., Cortical reorganization in children with cochlear implants, Brain Research, Vol.1239, n°6, 2008, p. 56-65. ↩︎
EGGERMONT Jos J. & PONTON Curtis W., « Auditory-evoked Potentials Studies of Cortical Maturation in Normal Hearing and Implanted Children: Correlations in Changes in Structure and Speech Perception ». Acta Otorhinolaryngology, Vol.123, n°2, 2003, p. 249-252. ↩︎
ROCHETTE Françoise, op. cit., p. 33. ↩︎
MITHEN Steven J., The music instinct: the evolutionary basis of musicality, Annals of the New York Academy of Science, Vol.1169, 2009, p. 3-12. ↩︎
PERETZ Isabelle, « Towards a Neurobiology of Musical Emotions », In P. J. J. Sloboda (Ed.), Handbook of Music and Emotion: Theory, research, applications, Oxford, Oxford University Press, 2010. ↩︎
TREHUB Sandra, « The developmental origins of musicality », Nature Neurosciences, Vol. 6, n°7, 2003, p. 669-673. ↩︎
SCHLAUG Gottfried, JÄNCKE Lutz & HUANG Yanxiong, « In vivo evidence of structural brain asymetry in musicians. » Science, Vol. 3, n°267, 1995b, p. 699-701. ↩︎
SCHNEIDER Peter, SCHERG Michael, DOSCH H. Günter, SPECHT Hans J., GUTSCHALK Alexander, & RUPP André, « Morphology of Heschl’s gyrus reflects enhanced activation in the auditory cortex of musicians. » Nature Neurosciences, Vol. 5, n°7, 2002, p. 688-694. ↩︎
PATEL Aniruddh D., Music, Language and the Brain. New York, Oxford University Press, 2008. ↩︎
HERHOLZ Sibylle C. & ZATORRE Robert J., « Musical training as a framework for brain plasticity: behavior, function, and structure », op. cit. ↩︎
OECHSLIN Mathias S., MEYER Martin & JÄNCKE Lutz, « Absolute Pitch – Functional Evidence of Speech-Relevant Auditory Acuity », Cerebral cortex, Vol. 20, n°2, 2010, p. 447-455. ↩︎
WONG Patrick C. M., SKOE Erika, RUSSO Nicole M., DEES Tasha & KRAUS Nina, « Musical experience shapes human brainstem encoding of linguistic pitch patterns ». Nature Neurosciences, Vol.10, 2007, p. 420-422. ↩︎
TRAINOR Laurel J. & HEINMILLER Becky M., « The development of evaluative responses to music : Infants prefer to listen to consonant over dissonance. » Infant Behavior & Development, Vol. 21,1998, p. 77-88. ↩︎
Op. Cit., TREHUB Sandra, The developmental origins of musicality. ↩︎
MOUSSARD Aline, ROCHETTE Françoise & BIGANG Emmanuel, « La musique comme outil de stimulation cognitive ». L’Année psychologique, vol. 112, n°3, 2012, p. 499-542. ↩︎
TRAINOR Laurel J. & HANNON Erin E., « Musical development », in D. Deutsch (dir.), The Psychology of Music, Academic Press, 3^e éd., p. 423-497. ↩︎
BIGAND Emmanuel, TILLMANN Barbara, PERETZ Isabelle, ZATORRE Robert J., LOPEZ Luisa & MAJNO Maria, « The neurosciences and music V: cognitive stimulation and rehabilitation », Annals of the New York Academy of sciences, n° 1337, 2015, p. 1-271. ↩︎
WINKLER István, HÁDEN Gábor P., LADINIG Olivia, SZILLER István, and HONING Henkjan, « Newborn infants detect the beat in music », Proceedings of the National Academy of Sciences, Feb 2009, Vol. 106, n°7, p. 2468-2471. ↩︎
DELIEGE Irène et SLOBODA John, Naissance et développement du sens musical, PUF, 1995. ↩︎
NAKATA Takayuki & TREHUB Sandra E., « Infants’ Responsiveness to Maternal Speech and Singing. » Infant Behavior and Development, Vol. 27, 2004, p. 455-464. ↩︎
PERETZ Isabelle, Apprendre la Musique, Nouvelles des Neurosciences, Odile Jacob, 2018, p. 19. ↩︎
PAPOUSEK Mechthild, PAPOUSEK Hanuš & HAEKEL Monika, « Didactic adjustments in fathers’ and mothers’ speech to their three-month-old infants », Journal of Psycholonguistic Research, Vol. 16, n°5, 1987, p. 491-516. ↩︎
Op. cit., DELAROCHE Monique, Au fil des regards et des caresses… ↩︎
CORBEIL Mariève, TREHUB Sandra E. et PERETZ Isabelle, « Singing delays the onset of infant distress », Infancy, Vol. 21, p. 373-391. ↩︎
STANDLEY Jayne M., CASSIDY Jane, GRANT Roy, CEVASCO Andrea, SZUCH Catherine, NGUYEN Judy, WALWORTH Darcy, PROCELLI Danielle, JARRED Jennifer, ADAMS Kristen, « The effect of music reinforcement for non-nutritive sucking on nipple feeding of premature infants », Pediatric nursing, May-June 2010, Vol. 36, p. 136-145. ↩︎
TRAINOR Lauren J. & CIRELLI Laura, « Rhythm and interpersonal synchrony in early social development », Annals of the New York Academy of Sciences, Vol. 1337, 2015, p. 45-52. ↩︎
TRAINOR Laurel J., « La musique chez les tout-petits » in Revue Internationale d’Éducation « Dossier Musique et Éducation », Sèvres n°75, septembre 2017, p. 73. ↩︎
PERETZ Isabelle, Apprendre la Musique, op.cit., p. 20. ↩︎
HARGREAVES David J. and GALTON Maurice J., « Aesthetic learning; psychological theory and educational practice. » In B. Reimer and R.A. Smith (Eds.) National Society for the Study of Education Yearbook on the Arts in Education (Ed.), p. 124-50, 1992. ↩︎
TREHUB Sandra E., BULL Dale & THORPE Leigh A., « Infants’ perception of melodies: the role of melodic contour », Child Development, Vol. 55, n°3, 1984, p. 821-830. ↩︎
Deliège et Sloboda, Naissance et développement du sens musical, op.cit. ↩︎
SLOBODA John A., L’esprit musicien : la psychologie cognitive de la musique, Paris, Mardaga. 1985. ↩︎
SWANWICK Keith et TILLMANN June, « The sequence of musical development: A study of children’s composition. », British journal of music education, Vol.3, 1986, p. 305-339. ↩︎
ZENATTI Arlette, Perception et intelligence musicales chez l’enfant. Université Paris X-Nanterre, Paris, 1967. ↩︎
ZENATTI Arlette, « Aspects du développement musical de l’enfant dans l’histoire de la psychologie au XXe siècle ». Les Sciences de l’éducation, Vol. 3, n°4, p. 21-38. ↩︎
GORDON Edwin E., Learning sequences in music skill, content and patterns. Chicago, G.I.A. Publications, 1988. ↩︎
GORDON Edwin E., A music learning theory for newborn and young children. Chicago, G.I.A. Publications, 3^e édition, 2003. ↩︎
ZURCHER Pierre, Le développement musical de l’enfant : les quatre temps de la musique, Paris, L’Harmattan, 2010. ↩︎
MITANI Chisato, NAKATA Takayuki, TREHUB Sandra, KANDA Yukihito, KUMAGAMI Hidetaka, TABASAKI Kenji, et al., « Music recognition, music listening, and word recognition by deaf children with cochlear implants. » Ear Hearing, Vol. 28(Supplement), 2007, p. 29-33. ↩︎
NAKATA Takayuki, TREHUB Sandra, MITANI Chisato, KANDA Yukihito, SHIBASAKI Atsuko & SCHENLLENBERG E. Glenn, « Music recognition by Japanese children with cochlear implants. » Journal of Physiological Anthropol. Applied Human Sciences, Vol. 24, n°1, 2005, p. 29-32. ↩︎
DARROW Alice-Ann, « Music for the Deaf », Music Educators Journal, Vol. 71, 1985, p. 33-35. ↩︎
WALCZYK Eugenia Bulawa, « Music instruction and the hearing impaired », Music Educators Journal, Vol. 80, n°1, 1993, p. 42-44. ↩︎
TRAINOR Laurel J., GAO Xiaoqing, LEI Jing-Jiang, LEHTOVAARA Karen, HARRIS Laurence R., « The primal role of the vestibular system in determining musical rhythm », Cortex, Vol. 45, n°1, 2009, p. 35-43. ↩︎
ZATORRE Robert J. & SALIMPOOR Valorie N., « From perception to pleasure: Music and its neural substrates », Proceedings of the National Academy of Sciences of the United States of America, Vol. 110 (suppl. 2), 2013, p. 10430-10437. ↩︎
HUMMEL Cora J. M. « The Value of Music in Teaching Deaf Students », Volta Review, Vol. 73, 1971, p. 224-249. ↩︎
ANSHEL Anat & KIPPER David A., « The influence of group singing on trust and coopération », Journal of Music Therapy, Vol. 25, n° 3, 1988, p. 145-155. ↩︎
MCDERMOTT E. F. « Music and Rhythm – From Movement and Lipreading and Speech », Volta Review, Vol. 73, 1971, p. 229-232. ↩︎
CIRELLI Laura K., EINARSON Kate & TRAINOR Laurel J., « Interpersonal synchrony increases prosocial behavior in infants », Developmental Science, Vol. 17, n°6, 2014, p. 1003-1011. ↩︎
CARRÉ Alain, Musique et surdité, Ed. Fuzeau, 2008. ↩︎
LE CALVEZ Viviane, « La méthode verbo-tonale à l’heure de l’implant cochléaire », Connaissances Surdités, n°28, 2009, p. 13-17. ↩︎
SADEK-KHALIL Denise, L’enfant sourd et la construction de la langue, Montreuil, Ed. Du Papyrus, 1997. ↩︎
BOREL-MAISONNY Suzanne, Langage oral et écrit. Tome 1 : Pédagogie des notions de base. Étude expérimentale et applications pratiques. Tome 2 : Épreuves sensorielles et tests de langage. Appréciation de l’état du langage, Neuchâtel, Paris, Delachaux & Niestlé, 1960. ↩︎
SYLVESTRE DE SACY Clotilde, COMTE Chantal et CAVALIER Luna, Bien lire et aimer lire : méthode phonétique et gestuelle créée par Suzanne Borel-Maisonny. Bien Lire, 2018. ↩︎
Philippe LALITTE, « Texture et émergence perceptive en musique contemporaine », in Texte, texture, textile. Variations sur le tissage dans la musique, les arts plastiques et la littérature, EUD, 2013, p. 121-133. ↩︎
AUGOYARD Jean-François et TORGUE Henry, A l’écoute de l’environnement : répertoire des effets sonores, Marseille, Editions Parenthèses, 1995, p. 55. ↩︎
LIGETI György, « Evolution de la forme musicale », Die Reihe, n°7, Universal Edition (Vienne, 1960), repris dans Neuf essais sur la musique, Editions Contrechamps (Genève, 2001), p. 140. ↩︎
CANNAM Chris, LANDONE Christian and SANDLER Mark, « Sonic Visualiser: An Open Source Application for Viewing, Analysing, and Annotating Music Audio Files », in Proceedings of the ACM Multimedia 2010 International Conference, 2010. ↩︎
GRISEY Gérard, « Structuration des timbres dans la musique instrumentale », in Jean-Baptiste Barrière (éd.), Le timbre métaphore pour la composition, Christian Bourgois Editeur/Ircam, Paris, 1991, p. 377. ↩︎
GRISEY Gérard, « La musique, le devenir des sons », in Écrits ou l’invention de la musique spectrale, Editions MF, Paris, 2008, p. 16. ↩︎
Ibid, p. 100. ↩︎
Ibid, p. 101 ↩︎
CHOUVEL Jean-Marc, « Extrême présence du phénomène : parcours de la forme dans l’oeuvre de Gérard Grisey », in Le temps de l’écoute. Gérard Grisey ou la beauté des ombres sonores, textes réunis par Danielle Cohen Levinas, L’Harmattan/L’Itinéraire, Paris, 2004 p. 71-86. ↩︎
Ibid., p. 41. ↩︎
CHOUVEL Jean-Marc, Analyse musicale, Sémiologie et cognition des formes temporelles, Paris, CNRS / L’harmattan, 2006, p. 137. ↩︎
GRISEY Gérard, La musique, le devenir des sons, op. cit., p. 50-51. ↩︎
BAILLET Jérome, « Partiels de Gérard Grisey », in L’éducation musicale, supplément aux n° 473/474, septembre-octobre 2000, p. 47-56. ↩︎
BAILLET, op. cit., p. 49. ↩︎
Chris CANNAM, Christian LANDONE, and Mark SANDLER, « Sonic Visualiser: An Open Source Application for Viewing, Analysing, and Annotating Music Audio Files », in Proceedings of the ACM Multimedia 2010 International Conference, 2010. ↩︎
Jérôme BAILLET, « Gérard Grisey : Partiels », L’éducation musicale, « baccalauréat 2001 », supplément au n° 473/474, septembre-octobre 2000. ↩︎
Notice de présentation de Dérives (1973-1974) de Gérard Grisey. Cette œuvre est écrite pour petit ensemble et grand orchestre. ↩︎
IMBERTY Michel, La musique creuse le temps… De Wagner à Boulez : Musique, psychologie, psychanalyse, Paris, L’Harmattan, 2005, p. 90. ↩︎
LACHENMANN Helmut, cité par Clytus Gottwald, in Musik-Konzept n°61/62, numéro consacré à « Helmut Lachenmann », sous la dir. de H.-K. Metzger, Münich, oct. 88, p.4. ↩︎
SCHROEDTER Stephanie, « Staging Listening: Corporeal Dimensions of New Music in Choreographies by Xavier Le Roy », Critical Stages, The IATC journal, December 2017, n°16. ↩︎
LALITTE Philippe, « The Unique Aesthetic Character of the Music of Roger Reynolds », in Stephen McAdams et Marc Battier (éds.), Creation and perception of a contemporary musical work: The Angel of Death by Roger Reynolds, Paris, IRCAM-Centre Georges Pompidou (DVD, ± 28 pages), 2005. ↩︎
BIOTEAU Alain, « Spatialisation et écriture de l’espace, des pionniers à Emmanuel Nunes », dans Nicolas Donin et Laurent Feneyrou (dir.), Théories de la composition musicale au XXe siècle, Lyon, Symétrie, 2013, vol. 2, p. 1345. ↩︎
Ibid., p. 1337. ↩︎
REYNOLDS Roger, Form and Method: Composing Music, The Rothschild Essays, Edited by Stephen McAdams, New York, Routledge, 2002. ↩︎
REYNOLDS Roger, Manuscript Sketch of Symphony [Myths] by Roger Reynolds. Internet http://lcweb2.loc.gov/diglib/ihas/loc.natlib.ihas.200029047. ↩︎
LALITTE Philippe, « Implications compositionnelles et perceptives des échelles temporelles locales et globales », in Le rythme, Actes des 2es Rencontres inter artistiques, mars 2005, série « Conférences et séminaires », Paris, Observatoire Musical Français, Université de Paris- Sorbonne, 2006, p. 23-34. ↩︎
MÉLÈSE Pierre, Samuel Beckett, Paris, Pierre Seghers, 1966, p. 138. ↩︎
SODERBERG Stephen, An interview with Roger Reynolds, Beginnings, Library of congress, The Roger Reynolds Collection, 2000. « « impetus, » is one that I used originally in a series of lectures I gave at the Peabody Institute, and the idea was that, ideally, there should be something at the beginning of the work which serves as a genetic seed out of which the work springs. Now I described this in various ways in various publications and on various occasions, but basically an impetus, obviously, from the dictionary, propels something, ignites something, sets something in motion. And what I feel is that an ideal impetus should indicate to you how the thing should evolve – what the process of growth or evolution should be in the project. But it should at the same time provide a global normative or consistency within which choices are shaped and made. So in other words, an ideal impetus both drives the development of the work and contains its potential. […] I’ll give you an example of an impetus in an ideal way- also referring back to Takemitsu – Symphony [Myths]. » ↩︎
MICHEL Pierre, György Ligeti, Paris, Minerve (2ème édition), 1995, p. 93. ↩︎
PENROSE Lionel S. et PENROSE Roger, « Impossible Objects: A Special Type of Illusion », British Journal of Psychology, vol. 49, n^°1, 1958, p. 31–33 ↩︎
Gyor̈gy Ligeti, in Pierre MICHEL, Ibid., p. 193. ↩︎
Ibid., p. 142. ↩︎
LIGETI György, « Concerto de Chambre », in Passages du XXème siècle, première partie, janvier-juillet 1977, Ed. IRCAM et Métiers graphiques, 1977, p. 101. ↩︎
Ibid., p. 151. ↩︎
DAMBRICOURT Jean-Pierre, « György Ligeti et le Kammerkonzert pour treize instruments », Éducation musicale 462-463, Septembre-Octobre 1999, p. 40-52. ↩︎
Ibid., p. 47. ↩︎
DELCAMBRE-MONPOËL Marie, « György Ligeti, Kammerkonzert », Musurgia, vol. VI, n° 3-4, 1999. p. 112. ↩︎
Op.cit. p. 48. ↩︎
MICHEL Pierre, György Ligeti, op.cit., p. 144. ↩︎
DELCAMBRE-MONPOËL Marie, « György Ligeti, Kammerkonzert », op. cit., p. 109. ↩︎
BOULEZ Pierre, « Le Temps Musical », 1978-02-17-1978-02-23, Conférence du 17/02/1978 autour du Kammerkonzert de Ligeti, Centre Georges Pompidou, Paris. https://medias.ircam.fr/embed/media/xfdefef_kammerkonzert-gyorgy-ligeti ↩︎
JOUBERT Muriel, « Le Kammerkonzert pour treize instrumentistes de Ligeti : une écriture d’une grande rigueur. In Musurgia », Pratique et Analyse Musicale, Vol. 8, n°1, 2001, p. 61. ↩︎
AROM Simha, « Les musiques traditionnelles d’Afrique centrale », Contrechamps, janvier 1988, n°10, p. 180. ↩︎
Ibid., p. 194. ↩︎
Site internet du marchand du logiciel : https://cycling74.com/downloads/#.VzxxgPmLSM8, consulté le 15 mai 2017. ↩︎
BIGAND Emmanuel, VIEILLARD Sandrine, MADURELL François, MAROZEAU Jeremy, DACQUET Alice, « Multidimensional scaling of emotional responses to music: the effects of musical expertise and of the duration of the excerpts », Cognition and Emotion, Vol. 19, n°8, 2005, p. 1113-1139. ↩︎
BEYRAND Chloé, « Comment sont véhiculées les émotions dans la texture de la musique contemporaine? », Mémoire de Master 1 sous la direction de Philippe Lalitte, 2016. ↩︎
https://www.irdp.ch/institut/coefficient-bravais-pearson-2041.html ↩︎
LALITTE Philippe, Analyser l’interprétation de la musique du XXe siècle, Hermann, Paris, 2015. ↩︎
MALT Mikhail, « Une proposition pour l’analyse des musiques électroacoustiques de Xenakis à partir de l’utilisation de descripteurs audio », dans Iannis Xenakis – The Electroacoustic Music / La Musique électroacoustique, sous la direction de Makis Solomos, L’Harmattan, Paris, 2015, p. 159-198. ↩︎
LALITTE Philippe, BIGAND Emmanuel, KANTOR-MARTYRUSKA Joanna et DELBÉ Charles, « On listening to atonal variants of two Piano Sonatas by Beethoven », Music Perception, Vol. 26, n°3, 2009, p. 223-234. ↩︎
LALITTE Philippe, op.cit. p. 149. ↩︎
GONIN Philippe, Pink Floyd, Atom Heart Mother, Scérén/CNDP, Paris, 2011. ↩︎
LALITTE Philippe, « Outils informatiques et méthodes pour l’analyse des musiques actuelles », Focus sur le rock en France, Éditions Delatour France, Sampzon, 2014, p. 191-213. ↩︎
http://clam-project.org ↩︎
http://marsyas.info ↩︎
http://psysound.wikidot.com ↩︎
http://www.sonicvisualiser.org ↩︎
http://logiciels.pierrecouprie.fr. ↩︎
LARTILLOT Olivier et TOIVIAINEN Petri, « A Matlab Toolbox for Musical Feature Extraction From Audio », in International Conference on Digital Audio Effects, Bordeaux, 2007. ↩︎
LERCH Alexander, An Introduction to Audio Content Analysis, New York, John Wiley, 2012. ↩︎
LALITTE Philippe, op. cit., p. 201. ↩︎
LALITTE Philippe (2015), op.cit., p. 152. ↩︎
PINEAU Marion & TILLMANN Barbara, Percevoir la musique : une activité cognitive, Paris, L’Harmattan, 2001. ↩︎
FRANCÈS Robert, La Perception du Rythme. Paris : Vrin, 1958. ↩︎
ZENATTI Arlette, Psychologie de la musique, Paris, France : Presses universitaires de France, 1994. ↩︎
SIMARD France, CHEVALIER Nicole et DESPINS Jean-Paul, Performance musicale : le chant préalable à l’apprentissage instrumental. http://www.jfrem.uottawa.ca/texte_jfrem2009_simard_france.pdf ↩︎
DOWLING, JAY. Walter, La structuration mélodique : perception et chant. (P.-E. Dauzat, trad.). In A. Zenatti (Ed.), Psychologie de la musique, Paris : PUF, 1994, p. 145-176. ↩︎
ZENATTI Arlette. « Aspects du développement musical de l’enfant dans l’Histoire de la psychologie au XXe siècle », in Education musicale et psychologie de la musique, Revue internationale Les sciences de l’éducation pour l’ère nouvelle n°6, CERSE, Université de Caen, 1990, p. 35-36, cité par RIBIERE-RAVERLAT Jacquotte. ↩︎
GIORDAN, André, Apprendre ! Paris, Belin, coll. Débats, 1998. ↩︎
PIAGET Jean, Naissance de l’intelligence chez l’enfant, Paris, Delachaux et Niestlé, Actualité pédagogiques et psychologiques, 1977. ↩︎
DELALANDE François, La musique est un jeu d’enfant, Paris, Buchet/Chastel, coll. Bibliothèque de Recherche musicale, 1984. ↩︎
PIAGET Jean, La formation du symbole chez l’enfant, Neuchâtel, Delachaux et Niestlé, 1945. ↩︎
WALLON Henri, « Importance du mouvement dans le développement psychologique de l’enfant », Enfance, réédit. in Enfance, 1959, 3-4, p. 235-239. ↩︎
CELESTE Bernadette, DELALANDE François, DUMAURIER Elisabeth, L’enfant, du sonore au musical, Paris, Buchet/Chastel-INA, coll. Bibliothèque de Recherche Musicale, 1982, p 165. ↩︎
AFSIN Kémâl, « Psychopédagogie de l’écoute musicale ». Orphée Apprenti, Atelier du GRIAM, Octobre 2010, p. 42. ↩︎
ANDERSON M. William. & LAWRENCE E. Joy, Integrating music into the elementary classroom (7e éd.), Belmont, Thomson Higher Education, 2007. ↩︎
JACQUES-DALCROZE Emile, Notes bariolées. Genève, Edition Jeheber, 1948. ↩︎
AGOSTI-GHERBAN Cristina, L’éveil musical, une pédagogie évolutive, Paris, L’Harmattan, 2000, p.18. ↩︎
WUYTACK Jos, Musica Viva. Pour une éducation musicale active. Volume 1 : Sonnez…battez. Paris, Alphonse Leduc, 1970. ↩︎
WUYTACK Jos, Musica Viva. Pour une éducation musicale active. Volume 2 : Expression rythmique. Paris, Alphonse Leduc 1970. ↩︎
COMEAU Gilles, Comparaison de trois approches d’éducation musicale, Jaques-Dalcroze, Orff ou Kodály ?, Vanier: CFORP, 1995. ↩︎
ORFF Carl et KEETMAN Guild, Musik fur Kinder, B. Schott’s Söhne, Mainz, vol. 1, 1950, 164 p., vol. 2, 1952, 127 p., vol. 3, 1953, 128 p., vol. 4, 1954, 158 p., vol. 5, 1954, 152 p. ↩︎
SZŐNYI Erzsébet, Quelques aspects de la méthode de Zoltan Kodály : application de ses principes à l’éducation musicale, Ed. Corvina, 1976. ↩︎
RIBIERE-RAVERLAT Jacquotte, L’Éducation musicale en Hongrie, 2e éd., A. Leduc, Paris, 1977 ; Chant-Musique, adaptation française de la méthode Kodály, Paris, Leduc, 1975-1980, 5 volumes ; Un chemin pédagogique en passant par les chansons, 500 chansons folkloriques de langue française choisies et classées progressivement pour servir de base à une adaptation française de la méthode Kodály, Paris, Leduc, 1974-1981, 4 volumes ; Développer les capacités d’écoute à l’école, Ecoute musicale, écoute des langues, PUF, 1997. ↩︎
BARKÓCZI Llona. & PLÉH Csaba, Etude de l’effet psychologique de la méthode d’éducation musicale de Kodály. Kecskemét : Institut de pédagogie musicale Zoltán Kodály, 1982. ↩︎
KODÁLY Zoltán, The selected writings of Zoltán Kodály, Halapy, Lili (trad.), Macnicol, Fred (trad.), Boosey & Hawkes, 1974. ↩︎
KODÁLY Zoltán, Music should belong to everyone. IKS: Budapest, 2002, p. 50. ↩︎
AGOSTI-GHERBAN Cristina, op. cit., p 16. ↩︎
WILLEMS Edgar, L’oreille musicale 2, la culture auditive, les intervalles et les accords, Ed. Pro Musica: Genève, 1940. ↩︎
WILLEMS Edgar, L’éducation musicale nouvelle (2^e éd.), Fribourg, Pro Musica, 1968, p. 24. ↩︎
SEASHORE Carl E., The Psychology of musical talent, New York, Silver Burdett, 1919. ↩︎
GORDON Edwin, Learning sequences in music: A music learning theory, Chicago, GIA Publications, 2003. ↩︎
SLOBODA John A., L’esprit musicien : la psychologie cognitive de la musique, op.cit. ↩︎
WILLEMS, L’éducation musicale nouvelle, op. cit., p. 20-21. ↩︎
CHAPUIS Jacques, De l’Initiation musicale au Solfège vivant, Panorama Pédagogique de l’Education Musicale Willems, 1, p. 1-8, 1980. ↩︎
AFSIN Kémâl, Psychopédagogie de l’écoute musicale, Bruxelles, De Boeck Université, 2009. ↩︎
JOLIAT François, « La genèse et le développement de l’éducation musicale à l’école : entre l’enseignement de l’art et l’éducation par l’art en Suisse romande », in M. Mellouki & A. Akkari (Ed.), La recherche au service de la formation des enseignants, Actes de la recherche, Vol. 7, 2009, p. 195-217. ↩︎
CHEVAIS Maurice, Education musicale de l’enfance (Vol. 1), Paris, Leduc, 1937. ↩︎
CHEVAIS Maurice, L’art d’enseigner (Vol. 2), Paris, Leduc, 1943. ↩︎
FIJALKOW Claire, « Du plaisir et de la méthode avant toute chose… » in C. Fijalkow (Ed.), Maurice Chevais (1880-1943) : un grand pédagogue de la musique, Paris, L’Harmattan, 2005, p. 69-92. ↩︎
MIALARET Jean-Pierre, « Maurice Chevais et la didactique de la musique à l’école », In C. Fijalkow (Ed.), Maurice Chevais (1880-1943) : un grand pédagogue de la musique, Paris, L’Harmattan, 1995, p. 93-106. ↩︎
CHEVAIS, 1943, op. cit., p. 96. ↩︎
MARTENOT Maurice & SAÏTO Christine, La relaxation active ou kinésophie : le corps, expression de l’être, Paris, Le Courrier du Livre, 2004. ↩︎
MARTENOT Maurice, Principes fondamentaux de la formation musicale et leur application, Paris, Magnard, 1996. ↩︎
MARTENOT M. op.cit., p.19. ↩︎
SÉGUIN Édouard, Traitement moral, hygiène et éducation des idiots, Paris, J. B. Balliere, 1846. ↩︎
MONTESSORI Maria, L’enfant, Paris, Desclée de Brouwer, 1936, 12^e éd., tr. G.J.J. Bernard. ↩︎
MATHIEU Louise, « Un regard actuel sur la rythmique Jacques-Dalcroze », Recherche en éducation musicale, N°28, Décembre 2010, p. 17. ↩︎
JACQUES-DALCROZE Émile, Le rythme, la musique et l’éducation. éd. Foetisch, Lausanne, 1965 (original 1920). ↩︎
BRICE Marie, Pédagogie de tous les possibles… La Rythmique Jacques-Dalcroze, Editions Papillon, Genève, 2012. ↩︎
BACHMANN Marie-Laure, La Rythmique Jaques-Dalcroze, une éducation par la musique et pour la musique. A la Baconnière, Neuchâtel, 1984. ↩︎
JACQUES-DALCROZE Émile, Notes bariolées, Jeheber, Genève, 1948. ↩︎
DUTOIT-CARLIER Claire-Lise. Emile Jaques-Dalcroze, créateur de la rythmique. A la Baconnière, Neuchâtel, 1965, p. 391. ↩︎
Op. Cit., BACHMANN Marie-Laure, p. 91. ↩︎
Op. Cit., BRICE Marie, p. 27. ↩︎
JACQUES-DALCROZE Émile, « La technique corporelle de la rythmique », Le Rythme, 1926, n°17, p. 2-3. ↩︎
JACQUES-DALCROZE Émile (1919), « Avant-propos », in JACQUES-DALCROZE, 1965, p. 5-8. ↩︎
JUNTUNEN Marja-Leena. « Embodiment in musical knowing: how body movement facilitates learning within Dalcroze Eurhythmics. » British Journal of Music Education. Vol.21, n°2, July 2004, p. 199-214. ↩︎
Ibid., p. 200. ↩︎
Op. Cit., Louise MATHIEU, p. 23. ↩︎
DAMASIO Antonio R. L’Erreur de Descartes. La raison des émotions. Paris : Odile Jacob, 1995. ↩︎
Lors d’une journée « Musique, Langage et Surdité » organisée par Daniele Schön (Institut de Neuroscience des Systèmes, Marseille) en Novembre 2016, nous avons été invités, Emmanuel Bigand et moi, afin de communiquer sur notre travail. C’est aussi à Marseille que nous avons pu participer pour la première fois à un atelier sur la méthode Dalcroze animé par Anne Gabrielle Peter-Chatoux. Nous avons par la suite suivi cette initiation au Conservatoire de Vincennes. ↩︎
LELEU Claire et PETER-CHATOUX Anne Gabrielle, « La méthode Jacques-Dalcroze aujourd’hui », Revue de l’APEMU, 2017, p. 51-53 ↩︎
KUBIK Suzana, « Vivre, ressentir, comprendre : l’enseignement musical selon la rythmique Dalcroze », Dossier Éducation musicale dans le monde, publié en ligne le 17 février 2017, France Musique. https://www.francemusique.fr/savoirs-pratiques/vivre-ressentir-comprendre-l-enseignement-musical-selon-la-methode-dalcroze-32139 ↩︎
PERRAUDEAU Sandrine, « Un Atelier Musical avec les enfants sourds », Connaissances Surdités, décembre 2012, n°42, p. 24. ↩︎
CELESTE Bernadette, DELALANDE François, DUMAURIER Elisabeth, L’enfant, du sonore au musical, Paris, Buchet/Chastel-INA, coll. Bibliothèque de Recherche Musicale, 1982, p. 165. ↩︎
KOTZ Sonja A. E. & SCHWARTZE Michael, « Differential Input of the Supplementary Motor Area to a Dedicated Temporal Processing Network: Functional and Clinical Implications », Frontiers in Integrative Neuroscience, Vol. 5, 2011, p. 86. ↩︎
SPAULDING Sandy J., BARBER Brittany, COLBY Morgan, CORMACK Bronwyn, MICK Tanya & JENKINS Mary E., « Cueing and Gait Improvement Among People with Parkinson’s Disease: A Meta-Analysis », Archives of Physical Medicine and Rehabilitation, Vol. 94, 2012, p. 562-570. ↩︎
DUNCAN Ryan P., EARHART Gammon M., « Are the effects of community-based dance on Parkinson disease severity, balance, and functional mobility reduced with time? A 2-year prospective pilot study », Journal of alternative and complementary medicine, Vol. 20, n°10, p. 757-763. ↩︎
LAZAROU Loulietta, PARASTATIDIS Themis, TSOLAKI Anthoula, GKIOKA Mara, « International Ballroom Dancing Against Neurodegeneration: A Randomized Controlled Trial in Greek Community-Dwelling Elders With Mild Cognitive impairment », American Journal of Alzheimer’s Disease & Other Dementias, Vol. 32, n°8, p. 489-499. ↩︎
HUMPHREY Doris, Construire la danse [The Art of making dances, 1959], Paris, L’Harmattan, 1998, p. 126. ↩︎
PIAGET Jean, Naissance de l’intelligence chez l’enfant, op. cit. ↩︎
JAQUES-DALCROZE Emile. « La rythmique et la plastique animée », Le rythme, la musique et l’éducation, 1965, p. 137. ↩︎
SCHAEFFER Pierre, Traité des objets musicaux, Paris, Seuil, 1966. ↩︎
PROULX Monique Désy, Pourquoi la musique ? Son importance dans la vie des enfants, op. cit., p. 219. ↩︎
FINNEY John, « John Paynter, music education and the creativity of coincidence », British Journal of Music Education, Vol. 28, n°1, 2011, p. 11-26. ↩︎
SHAFER Raymond Murray, Le paysage sonore, le monde comme musique (The Tuning of the World, 1977), Marseille, éditions Wild Project, 2010. ↩︎
DELALANDE François, La musique est un jeu d’enfant, op. cit. ↩︎
FRAPAT Monique, L’invention musicale en maternelle, Centre régional de documentation pédagogique de Versailles, 1990. ↩︎
DESROCHES Monique, STÉVANCE Sophie et LACASSE Serge, Quand La Musique Prend Corps. Presses De L’Université De Montréal, 2014. ↩︎
RENARD Claire, Le geste musical, Van de Velde, 1982. ↩︎
SÉRO-GUILLAUME Philippe, Langues des Signes, Surdité et accès au langage, Neuilly-Plaisance, Éd. Du Papyrus, 2008. ↩︎
GOSSELIN Pierre & LE COGUIEC Éric, La recherche création : Pour une compréhension de la recherche en pratique artistique, Québec, Presses de l’Université du Québec, 2006. ↩︎
GIACCO Grazia et LORANT Sonia, « Pour une didactique de la création artistique : Axes, projets, bilan (2014-2016) », Le Ragioni di Erasmus-Revue en ligne de l’Université de Roma 3, Roma TrE-Press, 2017, p. 153-168. ↩︎
TREVARTHEN Colwyn et MALLOCK Stephen, « Musicality: Communicating the vitality and interests of life », Communicative musicality: Exploring the basis of human companionship, New York, Oxford University Press, 2009, p. 1-11. ↩︎
LABAN Rudolph, La maîtrise du mouvement, Arles, Acte Sud, 1994. ↩︎
Ibid., p. 49 ↩︎
Ibid., p. 152. ↩︎
TREHUB Sandra & TRAINOR Laurel, « Singing to infants: Lullabies and play songs », Advances in Infancy Research. Vol. 12, 1998, p. 43-77. ↩︎
STERN Daniel, Le monde interpersonnel du nourrisson, op. cit. ↩︎
DELAROCHE Monique, op. cit., p. 31. ↩︎
GIACCO Grazia, « Geste et voix, entre corps et souffle : pour une didactique de la création artistique », Revue Recherche en éducation musicale, n° 33, Juillet 2016, p. 63-89. ↩︎
Ibid., p. 72. ↩︎
ANZIEU Didier, Le Moi-peau, Paris, Dunod, 1985. ↩︎
LORENZ Konrad, Evolution et modification du comportement, éd. Payot&Rivages, 2007. ↩︎
LAMBERT Nelle et LOTSTRA Françoise, « L’attachement. De Konrad Lorenz à Larry Young : de l’éthologie à la neurobiologie », Cahiers critiques de thérapie familiale et de pratiques de réseaux, Vol. 35, n°2, 2005, p. 83-97. ↩︎
WINNICOTT Donald Woods, « La théorie de la relation parents-nourisson », in De la pédiatrie à la psychanalyse, Paris, Payot, 1969, p. 61. ↩︎
SMITH-BRINDLE Reginald, Serial Composition, op.cit. ↩︎
MORGAN Robert. P., Twentieth-Century Music: a history of musical style in modern Europe and America, op.cit. ↩︎
LESTER Joel, Analytic Approaches to Twentieth-Century Music, op. cit. ↩︎
ROWELL Lewis, Thinking About Music: An Introduction to the Philosophy of Music, op.cit. ↩︎
BREGMAN Alfred S., Auditory scene analysis: The perceptual organization of sound, op. cit. ↩︎
DEHAENE Stanislas, Apprendre ! Le talent du cerveau, le défi des machines, Odile Jacob, 2018. ↩︎
WINNICOTT, Jeu et réalité, NRF Gallimard, Paris, 1975, p. 76. ↩︎
GIACCO Grazia, op. cit., p. 76. ↩︎

mai 29, 2026

Le gospel
1. Introduction

De l’église au studio

FACECAM KLAUS (1)

* morceau iconique du Gospel choisi par Klaus
* script Klaus

2. Contexte historique

a) Emergence

Dans le contexte esclavagiste du Sud profond des États-Unis, où les Africains déportés ont été contraints de reconstruire leur identité, les chants dits « spirituals » émergent comme une réponse culturelle unique. Dépossédés de leurs repères sociaux, les esclaves réinventent des liens communautaires à travers la prière, la spiritualité et la musique. Ces chants de travail ou work songs apparaissent dans les champs de coton au XVIIIᵉ siècle, puis migrent dans les Églises afro-américaines pour devenir les Negro Spirituals.

Contrairement à une perception répandue, ces compositions ne représentent pas une simple continuation de traditions musicales africaines, mais plutôt une assimilation et une réinterprétation sophistiquée de la liturgie protestante anglo-saxonne, composée de rites, cérémonies, prières et chants s’inspirant de l’Ancien Testament (la Bible). Cette transformation s’opère à travers le prisme de l’expérience afro-américaine, donnant naissance à une forme d’expression singulière.

Le gospel (Godspell, évangile) est lui une forme de musique chrétienne qui s’est développée à partir des spirituals, mais traite plutôt du Nouveau Testament, des Évangiles. On y célèbre, dans les églises Baptistes et Pentecôtistes, majoritairement Jesus Christ, même si à l’occasion, on peut évoquer Mary et tous les saints et apôtres (sauf Juda bien sûr !).Le gospel prend véritablement son essor à la fin des années 20, en parallèle du blues. Cette évolution coïncide avec l’urbanisation croissante de la communauté afro-américaine, engendrant des modifications substantielles dans la pratique musicale religieuse.

b) Gospel et Spirituals

Le Spirituals

Le Spirituals est un genre musical sacré développé par les esclaves afro-américains à partir de la liturgie européenne, caractérisé par des structures d’appel-réponse entre un chant soliste et un cœur, des mélodies pentatoniques, et des textes souvent codés faisant référence à la libération tant spirituelle que physique

Thèmes

Toujours liés à l’Ancien Testament, chantent la douleur, l’espoir (par opposition au blues) et la quête de liberté des esclaves

Caractéristiques
- Chants a cappella ou avec un accompagnement minimal (piano ou orgue)
- Transmission orale, souvent improvisés
- Mélodies simples avec des répétitions
Exemples

« Go Down Moses », « Swing Low, Sweet Chariot »

Le Gospel

Le Gospel est un genre musical chrétien apparu plus tardivement (fin XIXe – début XXe siècle) dans le contexte des églises afro-américaines du sud, incorporant des influences du blues, du jazz et plus tard du R&B, avec un accompagnement instrumental plus élaboré et une expressivité vocale caractéristique

Thèmes

Toujours basés sur le Nouveau Testament, célébrant la foi et la délivrance et l’espoir aussi

Caractéristiques
- Incorporation d’instruments modernes (orgue, piano), accompagnés d’un chœur de fidèles
- Arrangements musicaux plus complexes, avec interaction dynamique entre solistes et chœurs (de fidèles)
- Développement d’une dramaturgie musicale élaborée, intégrant un chant puissant, émotionnel, avec des improvisations vocales
- Intégration d’éléments stylistiques du blues et du jazz
Exemples

« Oh Happy Day » et « Amazing Grace », à l’origine une mélodie catholique irlandaise, devenue un pilier des messes afro-américaines

Oh Happy Day (Edwin Hawkins)

Ecoutez
« Oh Happy Day »

« Oh Happy Day» est sans aucun doute plus grand hit de tous les temps, en matière de gospel, a été produit en 1969 par Edwin Hawkins (1943-2018) et son groupe vocal The Edwin Hawkins Singers (chanteuse soliste : Dorothy Combs Morrison), lui qui avait fondé le Northern California State Youth Choir de l’église Church of God In Christ en 1967. Hit gospel certes, mais qui a eu un impact dans toutes les couches de la société, et pas seulement en Amérique du Nord. Le premier succès du genre fut l’omniprésent « When the Saints Go Marching In », un negro spiritual datant des années 20, qui était écouté et joué partout dans le monde.

Lyrics

Oh happy day (Oh happy day)
Oh happy day (Oh happy day)
When Jesus washed (When Jesus washed)
Oh when he washed (When Jesus washed)
When Jesus washed (When Jesus washed)
He washed my sins away (Oh happy day)
Oh happy day (Oh happy day)
Oh happy day (Oh happy day)
Oh happy day (Oh happy day)
Oh when he washed (When Jesus washed)
When Jesus washed (When Jesus washed)
Oh, when he washed (When Jesus washed)
He washed my sins away (Oh happy day)
Oh happy day (Oh happy day)
He taught me how to watch, fight and pray
(Fight and pray)
(And he’ll rejoice every day)
(Every day)
(Every day)
Oh happy day (Oh happy day)
Oh happy day (Oh happy day)
When Jesus washed (When Jesus washed)
Oh when he washed (When Jesus washed)
When Jesus washed (When Jesus washed)
He washed my sins away (Oh happy day)
Oh happy day (Oh happy day)
He taught me how to watch, fight and pray
Fight and pray!
And he’ll rejoice every day
Every day
Every day
Oh happy day (Oh happy day)
Oh happy day (Oh happy day)
Oh happy day (Oh happy day)
Oh happy day (Oh happy day)

When I get to heaven (Oh happy day)
I’m gon’ talk right down, yeah (Oh happy day)
Ask my lord Jesus, all right (Oh happy day)
For my starry ground, oh yeah (Oh happy day)
I ain’t been to heaven (Oh happy day)
That’s what I’ve been told (Oh happy day)
That the streets up there, all right (Oh happy day)
That they’re paved with gold (Oh happy day)
Yeah if you go there (Oh happy day)
Yeah, before I do, yeah (Oh happy day)
Just tell my friends I’m there (Oh happy day)
Then I’m coming too, yeah (Oh happy day)
Oh, oh it was a happy day (Oh happy day)
Oh, it was a happy day, all right (Oh happy day)
Yes a happy day (Oh happy day)
Oh, a happy day (Oh happy day)
Happy day (Oh happy day)
Oh happy day (Oh happy day)
When Jesus washed (When Jesus washed)
Oh when he washed (When Jesus washed)
When Jesus washed (When Jesus washed)
He washed my sins away (Oh happy day)
Oh happy day (Oh happy day)
Oh happy day (Oh happy day)
Oh, good god (Oh happy day)
Oh, Jesus (Oh happy day)
Mmh, yeah (Oh happy day)

Amazing Grace (Elvis Presley)

Ecoutez
Version Elvis Presley

Ecoutez
Version Aretha Franklin

« Amazing Grace » trouve son origine dans l’expérience personnelle de John Newton (1725-1807), ancien capitaine de navire négrier converti au christianisme après avoir survécu à une violente tempête en 1748. C’est en 1772, alors qu’il officiait comme pasteur anglican à Olney en Angleterre, que Newton compose les paroles de ce qui est devenu l’un des hymnes les plus célèbres au monde. L’hymne parut initialement dans le recueil « Olney Hymns » publié en 1779. Les paroles de l’hymne reflètent un thème de rédemption et de grâce divine, des éléments centraux dans la foi chrétienne. Le premier couplet, « Amazing grace! How sweet the sound, that saved a wretch like me! » est souvent interprété comme une expression de gratitude pour la délivrance du péché et des souffrances mondaines. Les communautés afro-américaines ont adopté « Amazing Grace » comme un hymne emblématique de leur expérience de libération et de résilience. Pendant le mouvement des droits civiques et la contestation de la guerre du Vietnam, « Amazing Grace » a pris une dimension politique. Mahalia Jackson, une figure emblématique du gospel, utilisait cet hymne pour galvaniser les marcheurs des droits civiques.

Lyrics

Amazing grace! how sweet the sound,
That saved a wretch; like me!
I once was lost, but now am found,
Was blind, but now I see.

’Twas grace that taught my heart to fear,
And grace my fears relieved;
How precious did that grace appear
The hour I first believed!

The Lord hath promised good to me,
His word my hope secures;
He will my shield and portion be
As long as life endures.

When we’ve been there ten thousand years,
Bright shining as the sun,
We’ve no less days to sing God’s praise
Than when we first begun.

Autres exemples

Go down Moses (Louis Armstrong)

Ecoutez
« Go down Moses »

Lyrics

Go down Moses
Way down in Egypt land
Tell old Pharaoh
To let my people go!
Oh when Israel was in Egypt land
Let my people go!
Oppressed so hard, they could not stand
Let my people go!
So the Lord said, go down (go down) Moses (Moses)
Way (way) down (down) in Egypt land
Tell all Pharaoes
To let my people go (let my people go)
So Moses went to Egypt land
Let my people go!
He made old Pharaoh understand
Let my people go!
Yes the Lord said, go down (go down) Moses (Moses)
Way (way) down (down) in Egypt land
Tell old Pharaoh
To let my people go (let my people go)
Thus spoke the Lord, bold Moses said
Let my people go!
If not I’ll smite, your firstborn dead
Let my people go!
God the Lord said, go down (go down) Moses (Moses)
Way (way) down (down) in Egypt land
Tell old Pharaoh
To let my people go!
Way down in Egypt land
Tell old Pharaoh
To let my people go

Swing Low, Sweet Chariot

Ecoutez
Version Sam Cooke

Ecoutez
Version Fisk Jubilee Singers

Lyrics

Swing low, sweet chariot
Coming for to carry me home
Swing low, sweet chariot
Coming for to carry he home x 2
I looked over Jordan and what did I see
Coming for to carry he home
A band of angels coming after me
Coming for to carry me home
Swing low, sweet chariot
Coming for to carry me home
Swing low, sweet chariot
Coming for to carry me home
If you get there before I do
Coming for to carry me home
Tell all my friends I’m coming too
Coming for to carry me home
Swing low, sweet chariot
Coming for to carry me home
Swing low, sweet chariot
Coming for to carry me home

3. Définition

(FACECAM KLAUS 2)

a) Essence et marqueurs musicaux

Dès le début, les colons blancs ont ainsi converti les esclaves afro-américains de force, à la religion chrétienne, en leur imposant d’aller à l’église et en leur apprenant la liturgie (la Bible), en anglais bien sûr, eux qui ne parlent pas encore bien la langue de leurs maîtres. Ils vont ainsi rapidement participer activement aux offices, leur riche culture du chant et de la musique leur permettant de s’y adapter facilement.

Les chants religieux, les cantiques (les hymnes), sont alors repris en chœur par ces esclaves, qui vont finir par les prendre en main au XIXᵉ siècle, les remanier en leur insufflant un caractère plus africain, avec là aussi prédominance d’une pulsation où l’on valorise les syncopes (after beat) sur les temps 2 et 4 plutôt que sur les temps forts sur les temps 1 et le 3. On va y trouver également la recherche de la transe mystique par la répétition des motifs en boucle et le rythme très marqué (danse). Quand la pulsation du blues et du jazz est le plus souvent ternaire, le gospel va, lui, « retourner » à la pulsation binaire, plus vivante, plus sautillante. On est dans la joie et l’espérance, on saute et l’on danse plutôt que l’on traîne des pieds dans le désespoir et l’affliction. On y roule (rock) et on y balance (roll) déjà avec entrain, en faisant du bruit (rattle), certes, mais du holy noise.

Les premiers chants collectifs sont nés dans les plantations, où le travail est particulièrement pénible, cette expression musicale étant un moyen de communication premier entre des déracinés ne parlant pas la même langue (ils sont de provenances diverses), en tout cas dans un premier temps.

Des églises vont être réservées aux noirs et de nombreuses congrégations religieuses, des paroisses (communities), vont s’assembler et célébrer des messes chaque fin de semaine (« Sunday I Go To Church, I Kneel Down And Pray »). Lorsque le pasteur prononce son sermon, les fidèles répondent en tapant dans leurs mains (ou dans un tambourin, un tambour de Basque amené en Amérique par les Espagnols), et s’expriment non pas d’une voix douce et rentrée, mais fortement et avec énergie, de manière à bien remplir l’église de leurs voix, dans le but de faire vibrer les âmes (soul) des participants. Le chœur est bien sûr accompagné par l’orgue (church organ), le piano ou plus rarement l’harmonium, instrument exclusif qui se doit de trôner dans chaque église ou temple aux États-Unis.

4. Quand le Gospel sort de l’église

a) Le crossover

Le terme « crossover » dans le contexte du gospel désigne le phénomène par lequel des chansons ou des artistes, initialement confinés à la sphère religieuse, transposent les textes séculiers du gospel pour le sortir des églises et entrer dans les charts grand public et toucher des auditeurs de divers horizons. Ce mouvement a non seulement transformé la carrière de ces artistes, mais a également donné naissance à des labels et des studios emblématiques qui ont façonné l’industrie musicale, dont notamment Motown Records et Stax Records. Un exemple emblématique de ce phénomène est la chanson « Hallelujah I love Her so » de Ray Charles, qui a connu un immense succès commercial en 1957, dans laquelle Ray Charles chante l’amour d’une femme et non plus de Jesus.

Ray Charles : « Hallelujah I Love Her so » :

Sam Cooke : « A Change is Gonna Come » :

En inventant chacun une forme de soul qui leur est propre, ces artistes « crossover », quittant des groupes vocaux de Gospel pour faire carrière en solo, sont amenés à inventer une nouvelle forme de musique : le gospel profane, séculier, laïc, qui a tendance à rejoindre la forme évoluée du blues qu’est le Rhythm & Blues.

Dans un premier temps, ces paroissiens sortent de l’église pour aller donner des concerts de Gospel puis franchissent le pas en entrant dans le show business (par la petite porte : ils sont noirs), en développant une musique très semblable au Gospel mais aux paroles tout autres. On y célèbre la belle petite du coin plutôt que Jésus sur sa croix, l’amour physique (et même la grivoiserie) plutôt que la ferveur religieuse et le confinement dans le culte. Ces artistes s’adressent alors au grand public, le public pop, majoritairement blanc, auquel ils peuvent vendre leur production, quand ils ne peuvent pas vraiment le faire en restant dans le domaine du Gospel pur et dur.

Ces artistes ont contribué dans un premier temps à populariser le gospel en dehors des églises, en se produisant dans des salles de concert et en enregistrant des disques, donnant naissance à la soul.

b) Atlantic Records : creuset du Rhythm & Blues

(FACECAM KLAUS 3)

Rhythm and blues

L’expression « Race Records » a été inventée dans les années 1920 par Ralph S. Peer, alors qu’il travaillait pour Okeh Records. Ce terme désignait les disques de 78 tours commercialisés spécifiquement pour les Afro-Américains, et incluait des genres musicaux tels que le blues, le jazz, et le gospel.

À cette époque, les enregistrements de musique étaient principalement destinés à un public blanc, mais le succès de certains artistes afro-américains a démontré le potentiel commercial de la musique afro-américaine. Cela a conduit plusieurs maisons de disques à créer des lignes de « Race Records » pour répondre à cette demande croissante. En renommant cette catégorie en « Rhythm & Blues Records » en 1949, Jerry Wexler consacre un genre musical en l’affranchissant des considérations communautaires.

Jerry Wexler (1917 – 2008), né Gerald Wexler, était un journaliste musical pour le magazine Billboard, devenu producteur de musique, et une figure majeure de la musique populaire américaine des années 1950 aux années 1980. Il est célèbre pour avoir signé et/ou produit de nombreux artistes emblématiques tels que Ray Charles, Aretha Franklin, Led Zeppelin, et Bob Dylan. En 1953, il est devenu associé chez Atlantic Records, où il a joué un rôle crucial dans le développement de la maison de disques en une force majeure de l’industrie musicale.

Au cours des années 1960, Wexler a travaillé avec des artistes comme Wilson Pickett et Aretha Franklin, produisant des albums acclamés tels que « Dusty in Memphis » de Dusty Springfield.

En 1987, il est intronisé au Rock and Roll Hall of Fame, reconnaissance de son immense contribution à la musique.

Atlantic Records

Atlantic Records a été fondé en 1947 par Ahmet Ertegun et Herb Abramson à New York. Dès ses débuts, le label s’est concentré sur le jazz moderne, mais il a rapidement élargi son répertoire pour inclure le rhythm and blues, le gospel et la soul.

L’une des contributions majeures d’Atlantic Records a été de populariser le gospel et la soul en signant des artistes influents comme Ray Charles, qui a fusionné le gospel avec le rhythm and blues pour créer un son unique. Des chansons comme « What’d I Say » et « I Got a Woman » ont repoussé les frontières sociales et ont établi la réputation de Ray Charles comme une légende de la musique.

Atlantic Records a également joué un rôle crucial dans la carrière d’Aretha Franklin, souvent surnommée la « Reine de la Soul ». Sous la direction de Jerry Wexler, Aretha Franklin a enregistré des succès emblématiques tels que « Respect » et « Chain of Fools », qui ont solidifié sa place dans l’histoire de la musique soul.

Le label a contribué à briser les barrières raciales dans l’industrie musicale en mettant en avant des artistes afro-américains et en favorisant l’intégration musicale.

c) Le Doo-wop

Certains chanteurs (auteurs-compositeurs) exécutent le crossover et pénètrent résolument dans le show business (les variétés) et même le rock naissant dans les années 50.

C’est alors que des groupes vocaux vont créer un genre nouveau, le doo-wop, puis diverses formes de soul music (la musique de l’âme), chacun apportant sa pierre au nouvel édifice.

Une émanation du gospel

Dans les années 1930 va fleurir une première génération de groupes vocaux – essentiellement des quatuors et, a cappella, qui manifestement sortent de l’église (noire) et qui vont être les précurseurs d’un nouveau genre apparaissant au début des années 50 : le doo-wop. Le terme « doo-wop » est une onomatopée évoquant les sons émis par le groupe pour soutenir le soliste. Dérivé des negro spirituals, c’est une une variante du rhythm and blues et du rock and roll, populaire durant les années 1950 et 1960. Ce style est généralement interprété par de petits ensembles vocaux comprenant un soliste ténor qui chante la mélodie, tandis que trois ou quatre autres chanteurs produisent des harmonies en arrière-plan. Les harmonies vocales dans le doo-wop se font écho ou se succèdent sous le chant principal. Les voix de second ténor et de baryton se mélangent, le ténor aigu se superpose au chant principal, et la basse résonne en dessous.

Les origines du doo-wop remontent aux enregistrements des Mills Brothers et des Ink Spots dans les années 1930 et 1940. Les Mills Brothers ont mis sur le devant de la scène une technique vocale étonnante consistant à imiter les instruments d’orchestre comme les vents, la contrebasse (le tuba) ou la batterie, tandis que les Ink Spots ont établi la prédominance du ténor et de la basse. L’influence de ces derniers est perceptible dans les premiers enregistrements de rhythm and blues des Ravens dans les années 1940, ou dans les reprises de certains de leurs tubes, telles que « My Prayer » par les Platters en 1956, véritable hit mondial porté par un chanteur lead merveilleux , le ténor Tony Williams, qui prêche comme à l’église et « If I Didn’t Care » par les Moments en 1970.

Le groupe vedette masculin de la Motown des années 1960 et 1970, les Temptations, a également adopté une couleur vocale inspirée de ce style doo-wop classique.

Il existe également une école de doo-wop féminin, représentée par des groupes tels que les Chantels, les Shirelles, ainsi que Patti LaBelle et les Bluebelles.

The Mills Brothers

Les Mills Brothers
Crédits : Domaine Public, William Morris Agency (management)/Photo by Maurice Seymour, New York.

The Mills Brothers, pionniers du jazz vocal et de la pop traditionnelle, ont marqué l’histoire de la musique avec leur son unique et leurs harmonies impeccables. Originaires de Piqua, Ohio, les frères John Jr., Herbert, Harry et Donald Mills commencent à chanter ensemble dès leur plus jeune âge, influencés par leur père, John Sr., qui dirige un quartet de barbershop.

Leur carrière décolle en 1931 lorsqu’ils signent un contrat avec CBS Radio, devenant ainsi les premiers artistes noirs à avoir leur propre émission nationale. Leur premier grand succès, « Tiger Rag », les propulse sur le devant de la scène musicale.

Parmi leurs nombreux succès, on compte « Paper Doll », « Glow Worm » et « You Always Hurt the One You Love », qui deviennent des classiques intemporels. Leur influence s’étend au-delà du jazz, touchant la pop et le R&B, et inspirant des générations d’artistes. Les Mills Brothers continuent à se produire et à enregistrer jusqu’aux années 1980, laissant un héritage musical riche et influent. Ils sont intronisés au Vocal Group Hall of Fame en 1998, en reconnaissance de leur contribution exceptionnelle à la musique.

Mills Brothers : « Tiger Rag »

The Platters : « Only You », « My Prayer »

The Coasters

The Coasters
Crédits : Domain Public, TGC-Topps Gum Cards-photo from ATCO Records

Produit par le duo d’auteurs-compositeurs phare du rock and roll, Jerry Lieber et Mike Stoller (des blancs), the Coasters (groupe vocal noir) ont marqué les années 1950 en introduisant un élément absent dans le Gospel (et dans le rock) : l’humour. Leur premier succès, « Down in Mexico », sort en 1956 et pose les bases de leur style unique, mêlant des histoires drôles à des harmonies vocales « Barbershop ». Mais c’est avec des titres comme « Searchin’ », « Young Blood » et « Yakety Yak » que les Coasters atteignent la consécration, devenant des incontournables des charts américains. Leur musique, souvent accompagnée du saxophone de King Curtis, déborde d’une énergie contagieuse. Les Coasters se démarquent également par leur capacité à traverser les genres, influençant aussi bien le doo-wop que le rock ‘n’ roll.

The Coasters : « Along Came Jones », « Charlie Brown », « Yakety Yak »

Barbershop & Close Harmony

(FACECAM KLAUS 4)

Le barbershop est un style de musique vocale a cappella qui se caractérise par des harmonies riches et complexes, appelées « close harmonies ». Le concept de close harmony (littéralement harmonie serrée) désigne un style d’arrangement vocal où les notes chantées par les différentes voix sont très proches les unes des autres en termes de hauteur. Ce type d’harmonie crée une texture sonore riche et dense, souvent utilisée dans les groupes vocaux de jazz, de barbershop et de pop. Le close harmony est particulièrement présent dans les quatuors de barbershop, où les voix sont arrangées de manière à rester très proches les unes des autres, souvent dans une seule octave. Ce style demande une grande précision et une excellente coordination entre les chanteurs, car les notes étant très proches, toute déviation peut être facilement perçue. C’est cette complexité et cette beauté harmonique qui rendent le close harmony si captivant et apprécié des amateurs de musique vocale. Cette tradition trouve ses origines dans les États-Unis à la fin du 19ᵉ siècle, souvent associée aux quatuors masculins qui se produisaient dans les salons de coiffure (d’où le nom « barbershop »).

Historiquement, les salons de coiffure étaient des lieux de rassemblement communautaire, particulièrement dans les communautés afro-américaines du Sud des États-Unis à la fin du 19e et au début du 20ᵉ siècle. Les hommes se réunissaient dans ces salons non seulement pour se faire couper les cheveux, mais aussi pour socialiser, échanger des nouvelles et se divertir. La musique y jouait un rôle central, et les quatuors de barbershop y trouvaient un public captif et enthousiaste. Les performances de barbershop se caractérisent le plus souvent par l’utilisation de quatre voix masculines (pouvant aller jusqu’à six) : le ou les ténor(s) dont un falsetto éventuellement, le lead (ou voix principale), le baryton et éventuellement baryton martin, et la basse. Le ténor chante les notes les plus aiguës, souvent en harmonie avec le lead, qui porte la mélodie. Le baryton ajoute des notes intermédiaires, tandis que la basse fournit les notes les plus graves, créant ainsi une texture harmonique riche et équilibrée. Le répertoire du barbershop inclut souvent des chansons populaires, des ballades et des morceaux de jazz, interprétés avec une précision vocale et une grande expressivité. Ce style musical est également connu pour ses « tags », des finales de chansons prolongées et harmonisées de manière élaborée.

The Four Freshmen :

https://www.youtube.com/@BarbershopHarmony

The Charades : Le doo-wop dans sa variante multicolore, avec une haute-contre en filigrane et des harmonies vocales très Barber Shop (close harmony).

The Charades : « Please Be My Love Tonight »

5. Playlist

a) Les grands groupes de gospel

The Soul Stirrers

Les Soul Stirrers, formés en 1926 à Trinity, Texas, sont reconnus comme l’un des groupes de gospel les plus influents de leur époque. Fondé par Silas Roy Crain, le groupe a rapidement évolué pour inclure des membres tels que Rebert H. Harris, Thomas L. Brewster, Edward Allen Rundless, Jr., et O.W. Thomas. Leur style, mêlant harmonies vocales sophistiquées et improvisations poignantes, a redéfini les standards du gospel.

Dans les années 1930, les Soul Stirrers ont commencé à se faire un nom en enregistrant des chansons pour la Library of Congress sous la direction d’Alan Lomax. Leur popularité a continué de croître, et ils ont signé un contrat avec Specialty Records en 1943, enregistrant des titres mémorables comme « By and By » et « In That Awful Hour ».

L’arrivée de Sam Cooke en 1950 a marqué un tournant décisif pour le groupe. Cooke, avec sa voix suave et émotive, a apporté une nouvelle dimension aux Soul Stirrers. Des chansons comme « Jesus Gave Me Water » et « Touch the Hem of His Garment » sont devenues des classiques instantanés. Cooke a quitté le groupe en 1956 pour poursuivre une carrière solo dans la Soul, mais son passage a laissé une empreinte indélébile.

Après le départ de Cooke, Johnnie Taylor a pris la relève en tant que chanteur principal. Sous sa direction, le groupe a continué à produire des succès et à influencer la scène musicale gospel et soul.

The Drifters

The Drifters (à la dérive) est, avec The Soul Stirrers, l’autre grand groupe vocal Gospel ayant effectué le crossover. Véritables légendes du rhythm and blues et du doo-wop, ils ont marqué les années 1950 et 1960 avec une série de succès inoubliables, malgré de nombreux changements de membres. Plusieurs chanteurs lead sont sortis des Drifters à terme pour faire eux aussi carrière en solo, dans la soul, en particulier les renversants Clyde McPhatter et Ben E. King. Formé en 1953 à New York par Clyde McPhatter après son départ des Dominoes, le premier groupe se fait connaître avec des titres comme « Money Honey » et « Honey Love », qui dominent les charts R&B. Après le départ de McPhatter en 1955, le manager George Treadwell remplace l’ensemble du groupe par les Five Crowns, menés par Ben E. King. Cette nouvelle formation connaît un succès retentissant avec des hits comme « There Goes My Baby », « Save the Last Dance for Me » et « Under the Boardwalk ».

Leur collaboration avec des auteurs-compositeurs de renom comme Carole King, Gerry Goffin, et Doc Pomus contribue à leur succès durable.

The Drifters : « Unchained Melody », « Save The Last Dance For Me », « Under The Boardwalk », « On Broadway » :

Clyde McPhatter and the Drifters: « What Ya’ Gonna Do»

(Benjamin Earl Nelson) Ben E. King : « Stand By Me »

The Golden Gate Quartet

Le Golden Gate Quartet, formé en 1934 à Norfolk, Virginie, est une véritable institution du gospel. À l’origine connu sous le nom de Golden Gate Jubilee Singers, le groupe a été fondé par quatre étudiants : Willie Johnson, William Langford, Henry Owens et Orlandus Wilson. Quartet vocal, chantant généralement a cappella un Gospel authentique, le Golden Gate Quartet va étrangement faire une longue carrière en France, où le groupe s’est installé à la fin des années 50.

Dès 1935, le Golden Gate Quartet commence à se produire dans des églises et à la radio locale, la station WIS à Columbia, Caroline du Sud. Leur popularité croit rapidement et en 1937, ils signent un contrat avec Bluebird Records, enregistrant 14 chansons en deux heures lors de leur première session ! En 1941, ils sont invités à chanter lors de la troisième investiture du président Franklin D. Roosevelt, à l’initiative de la Première Dame Eleanor Roosevelt. Leur influence s’étend à l’international avec leur première tournée européenne en 1955, souvent à guichets fermés. Le groupe a également joué un rôle important en tant qu’ambassadeurs culturels, effectuant des tournées dans 28 pays sous les auspices du Département d’État des États-Unis entre 1958 et 1960.

The Golden Gate Quartet :

« Golden Gate Quartet Gospel Train »

« Joshua Fit The Battle Of Jericho »

« Didn’t it Rain »

The Staples Singers

Créé en 1948 et drivé par « Pops » Staple, auteur-compositeur, chanteur et guitariste, ce groupe vocal familial comprenait ses enfants Cleotha, Pervis, Yvonne et la charismatique Mavis Staples. Leur carrière débute dans les églises de Chicago avec un gospel pur et dur avant de réaliser eux aussi le cross-over, à partir du milieu des années 60 avec une soul très revendicatrice, voire même insurgée, que l’on pourrait tout à fait chanter à l’église. Les Staple Singers ont ainsi marqué l’histoire de la musique avec leur fusion unique de genres et leur engagement social. Ils commencent alors à intégrer des éléments de soul et de R&B dans leur musique, produisant des classiques comme « Respect Yourself », « I’ll Take You There » et « If You’re Ready (Come Go with Me) ». Leur musique, imprégnée de thèmes de justice sociale et de droits civiques, devient la bande-son de nombreux mouvements de l’époque. En 1972, « I’ll Take You There » atteint le sommet des charts, consolidant leur statut de légendes de la musique.

Les Staple Singers continuent à se produire et à enregistrer jusqu’aux années 1990, et leur influence perdure aujourd’hui, portée par la voix puissante et l’engagement indéfectible de Mavis Staples.

The Staple Singers :

« Swing Low Sweet Chariot – aka Let Me Ride »

« Respect Yourself »

« I’ll Take You There »

b) Du Gospel à la soul

Ray Charles Robinson « Ray Charles » (1930 – 2004)

Ray Charles, né Ray Charles Robinson en 1930 à Albany, en Géorgie, est une légende de la musique américaine, souvent surnommé « The Genius ». Aveugle dès l’enfance, probablement à cause d’un glaucome, c’est sans doute le premier à jaillir de l’église (en même temps qu’il sort du blues traditionnel) en effectuant le fameux crossover.

Il va mêler le blues et le gospel au jazz, dans le genre dont il est l’un des créateurs dès la fin des années 40 : la soul. Mais sa soul (que l’on appelle également R&B selon la formule de son producteur d’alors Jerry Wexler), au son nouveau, retourne parfois drastiquement à ses origines avec des morceaux manifestement Gospel, sur lesquels il chante l’amour et la passion amoureuse plutôt que l’adoration du Christ. Attitude qui fera scandale dans la communauté Gospel.

Il signe avec Atlantic Records en 1952, où il a révolutionné la musique avec des titres comme « I Got a Woman » et « What’d I Say ». Son style unique et sa voix rauque ont rapidement fait de lui une icône. En 1960, il enregistre « Georgia on My Mind », qui est devenu l’un de ses plus grands succès et un hymne intemporel.

Il a vendu plusieurs dizaines de millions d’albums, et a été récompensé de douze Grammy Awards, parmi les très nombreuses récompenses et distinctions qu’il reçoit au cours de sa carrière. C’est un des premiers à entrer au Rock’n’Roll Hall of Fame en 1986.

(Raymond Charles Robinson) Ray Charles

« Hallelujah I Love Her So »

« At Newport » : The Right Time »

« Drown In My Own Tears »

Sam Cooke (1931 – 1964)

Sam Cooke, de son vrai nom Samuel Cook, a ajouté un « e » à la fin de son nom lorsqu’il a commencé sa carrière pour s’émanciper de sa connotation historiquement reliée à l’histoire de l’esclavage. De nombreux Afro-Américains, au sortir de l’esclavage, n’avaient qu’un prénom, et furent affublés, au moment des premiers recensements, de patronymes décrivant leurs caractéristiques physiques, leurs métiers, quand ce n’était pas ceux des anciens présidents, ou ceux de leurs maîtres.

Grand rival de Ray Charles, qui deviendra plus célèbre que lui à l’époque, Sam Cooke passe d’abord par la case Gospel, au sein du groupe vocal The Soul Stirrers (en 1951), avec lequel il va déjà, avant de le quitter en 1957, se détacher de l’église. « A Change is Gonna Come », dont Bob Dylan dit qu’il aurait aimé le composer, est la première tentative, à l’époque de la lutte pour les droits civiques en ce milieu des années 60, de « revendiquer » pour le peuple noir. Une chanson politique, en quelque sorte, mais produite en douceur avec force violons. Magnifique et pathétique (« Je suis né au bord de la rivière, dans une petite tente, et depuis, comme la rivière, je n’ai jamais cessé de courir … »).

Sam Cooke est assassiné en 1964, dans de mystérieuses circonstances, il n’a que 33 ans et est au faîte de sa gloire.

(Samuel Cook) Sam Cooke & The Soul Stirrers :

« Jesus Gave Me Water »

« A Change Is Gonna Come »

Wilson Pickett (1941 – 2006)

Le n°2 dans la course au succès de la soul/rhythm and blues, lui aussi dans le Memphis Sound : le hurleur, mais néanmoins magnifique chanteur, à l’instar de James Brown, Wilson Pickett a souvent prêché comme à l’église. Même si on n’aurait pu que difficilement lui attribuer le titre de révérend.

Surnommé « The Wicked Pickett », il est une figure emblématique de la soul des années 1960. Né en 1941 à Prattville, Alabama, il grandit à Detroit où il est influencé par le gospel et les stars du rock and roll comme Little Richard. Pickett commence sa carrière musicale avec le groupe gospel The Violinaires avant de rejoindre les Falcons en 1959, où il se fait remarquer avec « I Found a Love ». Sa carrière solo décolle véritablement avec le hit « In the Midnight Hour » en 1965, coécrit avec Steve Cropper de Booker T. and the MG’s. Ce titre devient un classique instantané et propulse Pickett au rang de star.

Wilson Pickett : « Something You Got »

Percy Sledge : « When A Man Loves A Woman »

Al Green (1946 – )

Al Green
Crédits : Mike Douglas Show, Public domain, via Wikimedia Commons

Formidable auteur-compositeur-interprète, Al Green, surnommé « The Reverend », prend la relève chez Stax à la disparition d’Otis Redding. Né Albert Leornes Greene en 1946 à Forrest City, Arkansas, il grandit dans une famille nombreuse et commence à chanter dès son plus jeune âge.

Sa carrière décolle véritablement lorsqu’il rencontre le producteur Willie Mitchell en 1968, qui l’aide à signer chez Hi Records. Il change le son et la forme du R&B de Memphis et réinvente la soul avec panache et un énorme succès, jusqu’au moment où il décide de retourner à l’église dans les années 70, après avoir survécu à une agression violente. Cet événement le pousse en effet à se consacrer davantage à sa foi, devenant pasteur et intégrant des éléments de gospel dans sa musique. Malgré cette transition qui l’éloigne quelques années du show business, il fait son come-back dans les années 80 avec quelques grands hits, mêlant habilement soul et gospel.

(Albert Leornes Greene) Al Green :

« L.O.V.E. »

« Take Me To The River »

« Lay It Down »

Aretha Franklin (1942 – 2018)

Aretha Franklin
Crédits : Atlantic Records(Life time: Published before 1978 without a copyright notice), Public domain, via Wikimedia Commons

La fille du Révérend Franklin, qui faisait sans doute déjà du Gospel dans le ventre de sa mère, va faire le crossover elle aussi, à l’instigation de son fameux producteur chez Atlantic : Jerry Wexler. C’est ce dernier qui aura l’idée géniale d’emmener Aretha enregistrer à Memphis dans les studios Stax (avec les musiciens du cru) mais aussi à Muscle Schoals, dans le studio Fame (avec les musiciens locaux là aussi : les Swampers). C’est lui aussi qui a l’idée en 1971 d’envoyer Aretha jouer dans le temple des hippies, à San Francisco, le Fillmore West, accompagné par l’orchestre The Kingpins de King Curtis (avec Bernard Purdie à la batterie, Jerry Jemmott à la basse, Billy Preston à l’orgue, Cornell Dupree à la guitare…). Apercevant Ray Charles au premier rang elle le fait monter sur scène pour réinterpréter son hit « Spirit in The Dark » avec lui (Ray Charles improvise alors totalement sur un morceau qu’il ne connaît pas !).

En 1972, un film sur et avec la « Queen of soul » est réalisé par Sydney Pollack. Film qui ne sortira jamais sur les écrans mais dont les enregistrements sonores ont fait l’objet d’une édition phonographique en double album. Aretha y retourne à l’église (une petite église baptiste d’une banlieue de Los Angeles, à Watts), avec le révérend James Cleveland et le Southern California Community Choir). Elle y interprète des grands classiques du Gospel avec une ferveur renouvelée. Une véritable merveille. C’est l’album live de Gospel le plus vendu de tous les temps.

(Aretha Louise Franklin) Aretha Franklin

« Aretha Live At The Fillmore West » : « Spirit In The Dark-reprise »

« Amazing Grace »

« Mary Don’t You Weep »

« Old Landmark »

Solomon Burke 1940 – 2010)

Solomon Burke
Crédits : Atlantic Records, Public domain, via Wikimedia Commons

Solomon Burke, né James Solomon McDonald en 1940 à Philadelphie, a su marier gospel, blues, jazz et country pour créer un son unique. Surnommé The King of Rock‘n’Soul, the Bishop of Soul ou encore The Muhammad Ali of Soul, lui qui a franchi le pas du crossover dans les années 50 retourne en 1964 à ses premières amours : le prêche enflammé. Dès son plus jeune âge, il prêche et anime en effet une émission de radio gospel. En 1961, il connaît son premier succès national avec « Just Out of Reach ». Suivent des titres emblématiques comme « Cry to Me », « If You Need Me » et « Everybody Needs Somebody to Love », qui deviennent des classiques du genre.

(James Solomon Vincent McDonald Burke) Solomon Burke « Everybody Needs Somebody To Love »

c) La reine du Gospel

Mahalia Jackson

Surnommée la « Reine du Gospel », fille de révérend, Mahalia Jackson fait partie de ces artistes qui ont joué un rôle crucial dans la diffusion du gospel au-delà des frontières religieuses. Cette femme noire – femme et noire : deux caractères rédhibitoires à l’époque, va devenir la première grande prêtresse du Gospel, dès ses enregistrements de 1946.

Le 28 août 1963, Mahalia Jackson est présente dans la foule de manifestants rassemblés devant le Lincoln Memorial de Washington pour recevoir le discours de Martin Luther King (« I Have A Dream »). C’est elle qui lui aurait donné l’idée d’improviser la fin de son discours en lui criant : « Parle-leur de ton rêve, Martin ! ». Elle chante par ailleurs à la Maison-Blanche lors de l’intronisation du président John F. Kennedy, ce qui inspirera la grande Aretha Franklin, qui viendra chanter à son tour en 2009 pour l’intronisation d’un président, noir cette fois, Barack Obama. Elle y portera un costume semblable à celui que portait Mahalia Jackson en 1961.

Mahalia Jackson :

« In The Upper Room »

« Didn’t Rain »

« Nobody Knows The Trouble I’ve Seen »

6. Héritage

a) Une influence qui perdure

Le Gospel s’institutionnalise et se renouvelle

(FACECAM KLAUS 5)

Né en Amérique du Nord au début du siècle dernier, dans un contexte anglophone marqué par la lutte contre l’esclavage, le Gospel s’est depuis répandu dans d’autres aires culturelles et linguistiques. C’est ainsi que l’on a vu naître, à partir des années 60, un Gospel francophone, porté par les protestantismes des Caraïbes, de l’Afrique de l’Ouest, du Québec et de l’Europe de l’Ouest. Un genre florissant aujourd’hui encore : on peut en effet assister en fin de semaine à des messes Gospel dans toutes les banlieues de Paris, offices qui rassemblent parfois un nombre impressionnant de fidèles (et d’officiants).

De l’autre côté de l’Atlantique, aux États-Unis, le Gospel n’a jamais vraiment fait son entrée à Broadway, dans ces théâtres new-yorkais où l’on a joué des plays (comédies musicales) par milliers depuis le début du siècle dernier. Le caractère sacré du genre faisant sans doute reculer les artistes et producteurs éventuels. Pourtant, un spectacle Gospel a bien été monté en 1983, avec force vedettes (noires) au chant, en présence d’un récitant fameux : l’acteur Morgan Freeman. Le show (une adaptation de la tragédie de Sophocle « Œdipe à Colone ») a été filmé et enregistré, heureusement. Les acteurs y chantent et les chanteurs y jouent la tragédie dans un Gospel resplendissant.

b) Playlist

Kirk Franklin (1970 -)

Le (encore) jeune Kirk Franklin s’est forgé un empire (en tout cas une église et une société de production) en quelques années seulement. Il compose, produit, arrange et prêche avec une vigueur et une conviction particulièrement communicatives. Il dirige son orchestre et surtout son chœur (The Family) avec un grand savoir-faire, ce qui l’amène à passer allégrement du Gospel traditionnel à un Gospel très « urbain » proche du R&B (new gospel), très soul, mais qui peut toujours être donné lors de messes auxquelles assistent parfois des dizaines de milliers de « fidèles ». Et cela de par le monde ! Surnommé « The Reigning King of Urban Gospel ».

(Kirk Dewayne Franklin) Kirk Franklin « The Fight Of My Life » album :

« Declaration (This Is It) »

« He Will Supply »

Kirk Franklin « The Rebirth Of Kirk Franklin » album :

« Hosanna »

Incroyable mix de Gospel et de jazz (arrangements vocaux très sophistiqués « à la big band »), le groupe vocal Take Six pratique le genre, le plus souvent a cappella, à la perfection, en tout cas dans son merveilleux premier disque, où l’on ne trouve rien à jeter, et continue à tourner aujourd’hui.

Take Six « Do Be Do Wop Bop » album :

« Spread Love »

« Mary »

Formé en 1980 sur le campus d’Oakwood College à Huntsville, Alabama, Take 6 est un sextet vocal qui a redéfini les frontières du gospel et du jazz. Fondé par Claude McKnight, le groupe a rapidement intégré des membres talentueux comme Mark Kibble, Mervyn Warren, Alvin Chea, Cedric Dent et David Thomas.

Leur premier album éponyme, sorti en 1988, a immédiatement rencontré un succès critique et commercial, remportant plusieurs Grammy Awards. Take 6 a collaboré avec des légendes de la musique telles que Quincy Jones, Stevie Wonder et Whitney Houston, consolidant leur statut de pionniers de l’a cappella moderne.

Frank MacComb (1970 -)

Héritier du légendaire auteur-compositeur-interprète et pianiste Donny Hathaway (pourtant méconnu), Frank McComb est un authentique chanteur de Gospel, quand il ne déploie pas sa très funky soul à la Stevie Wonder.

Véritable virtuose de la soul et du jazz né en 1970 à Cleveland, Ohio, il commence à jouer du piano dès son plus jeune âge, influencé par le gospel et les légendes du jazz.

Sa carrière décolle dans les années 1990 lorsqu’il rejoint le groupe Buckshot LeFonque de Branford Marsalis, avec lequel il enregistre deux albums acclamés. McComb se distingue par sa capacité à fusionner des éléments de soul, de jazz et de R&B, créant un son unique et intemporel.

En 2004, il sort son premier album indépendant, « Straight From The Vault », et a collaboré depuis avec des artistes de renom tels que Prince, Chaka Khan et Will Smith, tout en continuant à produire et à enregistrer sa propre musique. Frank McComb est également un pédagogue passionné, transmettant son art au Frank McComb Independent Artist Institute, un programme de master class destiné aux artistes indépendants. Son influence et son talent continuent de résonner, faisant de lui une figure incontournable de la scène musicale contemporaine.

Frank McComb « Love Stories » album :

« His Eye Is On The Sparrow »

c) Le Gospel en image

Gospel At Colonus :

« Live Where You Can »

« Fair Colonus »

Film réalisé par Kirk Browning, 1985

On retrouve les Blind Boys of Alabama, ces vieux routiers du gospel en compagnie des Soul Stirrers dans « Gospel At Colonus ». Les survivants du groupe d’origine (The Five Blind Boys Of Alabama) sont produits par Peter Gabriel dans son label Realworld. Production et qualité sonore assurés.

The Blind Boys Of Alabama « Spirit Of The Century » :

« The Last Time »

Al Green : « Gospel According To Al Green »

Le révérend Al Green fait son retour à l’église, en crossover inverse en quelque sorte, après avoir effectué une rédemption consécutive à des événements révélateurs, à ses yeux, de sa déchéance spirituelle. Lui qui avait fait un énorme succès dans la soul au début des années 70 a failli mourir plusieurs fois, notamment en tombant de scène, et a vu sa petite amie se suicider devant lui…

Film de Robert Mugge, 1984. L’histoire d’une star de la soul qui abandonne sa carrière de chanteur pour devenir un gospel minister.

Voir film
de Robert Mugge, 1984

La preuve que ce l’on dit de lui un peu plus haut n’est pas une « vue de l’esprit » :

Kirk Franklin « The Rebirth Of Kirk Franklin Live »

Film largement primé, ce biopic interprété par un Jamie Fox hallucinant (il chante lui même !), raconte en détail (mais à la manière hollywoodienne) trente ans de la vie du Genius, l’inventeur de la soul.

Ray

Film de Taylor Hackford, 2005. Biopic sur un mythe.

Voir film
de Taylor Hackford, 2005

The Blues Brothers, Film de John Landis, 1980.

The Blues Brothers, premier du nom : le fameux film de John Landis, avec les frères Blues John Belushi et Dan Aycroyd, où l’on peut voir notamment le gratin des survivants de la soul, du blues et du rhythm and blues, parmi lesquels Aretha Franklin (scène d’anthologie dans son restaurant : « Think ! »)

Ray Charles (en patron de pawn shop)

ou James Brown chantant « The Old Landmark » (en révérend endiablé dans l’église de la révélation pour les Blues Brothers : « Can you see the light ? », « What light ? » « The Band, Jake ! The Band ! »)

7. Conclusion

a) À retenir

Le gospel est bien plus qu’un genre musical religieux : c’est la matrice de toute la musique populaire américaine du XXe siècle.

Né dans les plantations sous forme de work songs et de negro spirituals, il s’épanouit dans les églises baptistes et pentecôtistes afro-américaines avant de franchir leurs murs pour conquérir le grand public. Ce mouvement de crossover, incarné par des pionniers comme Ray Charles, Sam Cooke ou Aretha Franklin, donne naissance à la soul, au rhythm and blues, puis irrigue le rock and roll et la pop.

Le doo-wop, les harmonies barbershop, les grands labels comme Atlantic Records : autant d’étapes et d’institutions qui témoignent de la façon dont une musique de foi, portée par des voix afro-américaines, a transformé l’industrie musicale mondiale tout entière, et continue de le faire, de Kirk Franklin à Take Six.

Le gospel reste aujourd’hui vivant et en constante évolution, loin d’être une simple pièce de musée : il résonne chaque dimanche dans les banlieues de Paris comme dans les méga-églises américaines, preuve que la frontière entre le sacré et le profane n’a jamais vraiment cessé de se négocier, note après note.
mai 25, 2026
Entretien avec Patricia Loubière, directrice artistique de Mozaïk Danse
Patricia Loubière coordonne Mozaïk Danse depuis sa fondation en 1999 à Montpellier. Chorégraphe et danseuse hip-hop / contemporain interprète au sein de nombreuses compagnies pendant plus de 12 ans, professeure de danse diplômée d’État en modern jazz, formatrice spécialisée dans l’enseignement de la danse pour des publics en situation de handicap, elle a construit au fil de vingt-cinq ans une pratique singulière, à la croisée de la création artistique exigeante et de l’accessibilité culturelle.

Pour commencer cet échange, pourriez-vous nous retracer votre parcours et ce qui a forgé votre sensibilité à la question de l’accessibilité dans les pratiques artistiques ?

C’est effectivement quelque chose qui s’est construit de façon très organique. J’ai commencé la danse contemporaine et le modern jazz à 12 ans, dans un milieu rural où l’accès aux pratiques artistiques était loin d’être évident à cette époque. Très tôt, j’ai ressenti une gêne face au fait que la danse n’était pas accessible à tous, socialement, culturellement, géographiquement, financièrement. Ce sentiment s’est approfondi quand je me suis tournée vers la danse hip-hop, que j’aimais pour son énergie, ses valeurs et aussi parce qu’elle parlait à tous les corps, sans aucune condition.

Parallèlement, j’ai grandi avec un enfant sourd, placé dans notre famille d’accueil alors que j’avais trois ans, nous avons grandi ensemble. Nous communiquions spontanément, sans que la différence soit jamais vécue comme un obstacle. Je pense que cette expérience précoce d’une communication non verbale naturelle, et la conviction qu’elle m’a donnée que la différence nous enrichit, ont profondément orienté mon rapport au corps et au mouvement.

Y a-t-il eu un moment précis où votre approche de la chorégraphie a basculé vers ce que l’on appelle aujourd’hui la danse inclusive ?

Et en réalité, dès 2000, quand je me suis installée à Montpellier, à mon retour de Paris, j’ai contacté le centre d’éducation spécialisé pour les déficients auditifs de Montpellier : j’ai immédiatement proposé des ateliers de danse à des enfants et adolescents sourds. La danse et la langue des signes sont toutes deux des façons non verbales de communiquer, il me paraissait évident de développer des projets chorégraphiques avec ces publics. Il en est sorti un premier spectacle, Signes en 2024, avec une comédienne sourde et des danseurs entendants. Mais je ne posais pas le mot « handicap » sur ce public , ni n’utilisai le terme danse adaptée/inclusive qui n’existait pas à cette époque, mais aussi car la langue des signes est une langue à part entière, et donc je ne percevais absolument pas ce public comme « handicapé » juste parce qu’ils ont une langue différente…

C’est un peu plus tard vers 2006 où en tant que danseuse interprète, un chorégraphe, à la Maison de la danse de Lyon, nous a fait travailler sur la contrainte physique ou sensorielle (par exemple : danser avec une jambe raide, les mains attachées, sans la vue, etc…) Ce qui m’a frappée, c’est la puissance d’adaptation du corps face à la limitation imposée. La contrainte, loin d’appauvrir le mouvement, devenait source d’inspiration et de créativité. C’est à partir de là que quelque chose s’est vraiment cristallisé pour moi sur le plan artistique en étant convaincue que la danse était accessible à tous et je suis donc partie me former notamment auprès de pionniers en danse inclusive en Angleterre et en Belgique, et tout s’est ensuite enchaîné naturellement.

Vous accordez une grande importance au choix des mots. Quelle distinction faites-vous entre « danse adaptée/inclusive », « inclusion » et « inclusivité » ?

Elle a une portée à la fois pédagogique, éthique et politique. La danse adaptée désigne des ateliers conçus spécifiquement pour des personnes en situation de handicap, avec une pédagogie pensée pour garantir un cadre et un enseignement sécures pour ces publics. La danse inclusive, c’est la danse adaptée en mixité, réunissant au sein d’une même pratique (en ateliers ou sur scène) des danseurs avec et sans handicap .

Ce qu’on espère, c’est qu’un jour ces termes deviennent superflus, et qu’il n’y aura plus besoin de nommer adapté/inclusive… Mais pour l’instant, ils remplissent une fonction concrète : ils permettent aux personnes concernées de savoir qu’elles seront accueillies dans un cours adapté et sécure, , et ils conditionnent également la légitimité à demander des financements car l’accessibilité culturelle a un cout a un coût réel, en termes de moyens techniques, logistiques, humains, compétences.. : formation des professionnels de la danse, formation des équipes d’accueil, des bénévoles, accessibilité des lieux, accessibilité des œuvres (surtitrage, audiodescription, acces pmr, interprete lsf, gilets vibrants…)

L’accessibilité culturelle demande de penser différemment la conception de projets artistiques, en prenant en compte ce besoin d’accessibilité dès le tout début de la conception du projet à tous les niveaux.

Il est aussi important d’impliquer des personnes en situation de handicap au cœur du processus, car il est primordial de ne pas penser et ne pas faire « à la place de », mais « avec » afin de valider les différentes étapes C’est un changement de paradigme profond où l’environnement doit s’adapter aux besoins spécifiques de ces publics et non l’inverse

On oublie souvent que l’accessibilité est aussi une question de logistique lourde et de moyens financiers. Comment gérez-vous cet aspect ?

L’accessibilité a un coût réel qui doit être considéré dès le début d’un projet. Par exemple, pour garantir la sécurité et la qualité pédagogique, nous devons limiter drastiquement le nombre d’élèves par atelier (loin des 20 ou 25 personnes d’un cours classique).

L’accessibilité, c’est aussi :
- Le volet financier : Nous pratiquons des tarifs spécifiques (tarifs réduits ou parfois gratuité selon les projets et partenaires) en fonction des possibilités de chacun car une personne vivant seulement avec l’AAH (allocation adulte handicap) ne peut souvent pas se permettre de financer un cours de danse
- La logistique, salle accessible, lieux accessibles, transport : Nous choisissons des lieux accessibles et formons des bénévoles à l’accueil de ces publics qui ont des besoins spécifiques
- Les ressources humaines, techniques: Faire appel à des professionnels de danse diplômés d’État et formés au handicap, interprètes en Langue des signes française, audiodescriptrices, casques et micro pour l’audiodescription, logiciel de surtitrage et régisseur spécifique, gilets vibrants, personnels d’accueil ou bénévoles formés à l’accueil de publics spécifiques,…
Comment orchestrez-vous la rencontre artistique entre des profils si différents (sourds, handicap moteur, pros, amateurs) ?

Fil Rouge réunissait des danseurs amateurs et professionnels, des personnes sourdes et malentendantes, des danseurs en situation de handicap moteur, et un danseur à la fois malentendant et malvoyant. La première exigence était méthodologique : ne jamais faire à la place des personnes concernées, mais construire avec elles.

Concrètement, cela a supposé plusieurs phases : d’abord sensibiliser les danseurs sans handicap, puis travailler en groupes parallèles, puis croiser progressivement les deux groupes à condition que chacun l’ait choisi librement. La confiance ne se décrète pas, elle se construit étape après étape, et brûler l’une d’elles, c’est compromettre l’ensemble du projet. La notion de temporalité est très importante dans ce type de projet, il est important d’observer, de communiquer, d’être attentif aux besoins, envies, d’être adaptable en permanence, et surtout de prendre le temps et ne jamais forcer quelque chose.

Pourquoi ce choix ?

Parce qu’on s’est rendu compte que les spectacles en salle drainent essentiellement un public déjà convaincu, déjà sensibilisé à ces questions. Or ce n’est pas là que se jouent les représentations dominantes. Ce qui nous intéresse, c’est le tout-public, celui qui passe par là par hasard et se retrouve nez à nez avec des danseurs. L’espace public, lieu du vivre ensemble, est un terrain de transformation des regards bien plus puissant qu’une salle de théâtre pour toucher de nouveaux publics .

À mon avis, le principal frein à l’inclusion dans les arts n’est pas technique ni même financier au fond, il est dans les représentations liées au handicap. Tant que celui -ci sera pensé essentiellement comme une limitation, les décisions qui en découlent, pédagogiques, institutionnelles, artistiques, seront limitantes. Ce que nous essayons de faire, c’est partir des possibles d’une personne, quelle que soit sa singularité corporelle.

Selon vous, quels sont les obstacles les plus tenaces à la professionnalisation de ces artistes ?

Le premier frein reste les représentations mentales. Si l’on regarde le handicap avec pitié ou comme une limite, on ne mettra jamais les moyens nécessaires.

Un autre obstacle majeur en plus de l’accès à la pratique amateur, c’est qu’il n’existe pas à ma connaissance en France de formation professionnelle pour devenir danseur professionnel pour un artiste en situation de handicap. De plus, l’accès et le maintien du statut d’intermittent du spectacle requiert 507 heures de travail sur 12 mois, un seuil déjà exigeant pour n’importe quel interprète, mais qui réellement quasi inaccessible pour beaucoup de danseurs en situation de handicap, dont la fatigabilité, les douleurs chroniques, les risques de blessures ..ne permettent pas ce rythme, outre le fait que seulement quelques compagnies de danse offre des postes pour des artistes chorégraphiques ayant un handicap. On les expose littéralement à des situations de rupture. Ce n’est pas une question de volonté individuelle, c’est une question de droit, de politique et de conception du travail artistique.

Quel message souhaiteriez-vous adresser aux conservatoires ou aux jeunes enseignants qui souhaitent s’engager dans cette voie ?

Que cela parte tout d’abord d’une envie sincère, d’interroger ses propres représentations du handicap et sur ce qu’est un corps dansant… Sur le plan pratique : il est essentiel de se former à la pédagogie de la danse adaptée pour ces différents publics, connaitre ces différents publics, et leurs besoins spécifiques et adaptations nécessaires… Il est primordial aussi de se mettre en réseau avec les structures médico-sociales et associations représentant et œuvrant avec des personnes en situation de handicap, et de travailler en concertation et encore une fois, co-construire ensemble et non pas « à la place ». Également se rapprocher des structures culturelles travaillant déjà (ou non) avec ces publics, tisser un fort maillage de partenaires et ressources. Ne pas sous-estimer la préparation logistique et humaine, prendre en compte la temporalité et définir en amont les étapes indispensables de chaque projet.

Ces projets ont quelque chose d’irremplaçable, ils ramènent de l’authenticité dans nos pratiques artistiques et interrogent profondément nos normes esthétiques, et même au-delà, notre humanité. Ce n’est pas un bénéfice secondaire. C’est au cœur de ce que la danse peut faire. Ces projets artistiques sont porteurs d’une richesse et diversité incroyables , plus qu’urgentes et nécessaires dans nos sociétés !

www.mozaikdanses.fr
mai 20, 2026

L’influence de la vidéo sur la perception d’un défaut sonore temporaire : cas du visionnage d’un concert de musique classique

Conservatoire National Supérieur de Musique et de Danse de Paris : Formation Supérieure aux Métiers du Son

Mémoire de Fin d’Études, présenté par : Benjamin RIBOLET

Sous la Direction de : Corsin VOGEL , Session : juin 2009

Introduction

L’étude de la perception est domaine dans lequel de nombreuses recherches ont été effectuées et sont encore effectuées de nos jours. Alors que notre connaissance du fonctionnement physiologique de nos modalités sensorielles devient de plus en plus précise, de nombreuses théories existent encore sur la manière dont sont traitées les informations. En effet, il ne suffit pas de savoir comment nos sens fonctionnent, car la perception intègre une très grande part de psychologie.

Ce mémoire a pour objectif d’étudier une situation particulière de la perception. Dans notre métier d’ingénieur du son – directeur artistique, nous rencontrons cette situation très souvent : il s’agit de la perception auditive que nous avons d’un document audiovisuel. Plus précisément, il s’agit d’étudier l’influence que peut avoir la vidéo sur notre perception du son et des défauts sonores pouvant apparaître dans la bande son.

Pour cela, il convient en premier lieu d’étudier les différentes théories existantes de la perception ainsi que leur histoire. Nous verrons que toutes ont apporté de précieux éléments pour tenter d’expliquer les mécanismes psychologiques mis en œuvre.

Nous verrons également que l’attention joue un rôle très important en ce qui concerne notre perception du monde extérieur et notre apprentissage, et nous apporterons quelques éléments en ce qui concerne l’étude de la perception multimodale, appelée aussi perception multisensorielle. Nous laisserons volontairement de côté l’étude physiologique des sens, en nous appuyant sur les nombreuses publications qu’il existe à ce sujet.

Dans un second temps, nous tenterons d’élaborer un protocole expérimental qui nous permettra d’étudier la situation que nous venons de décrire, en partant de l’hypothèse suivante : « La perception des défauts sonores est atténuée ou devient nulle lorsque l’on ajoute une information visuelle synchrone : la vidéo. » L’étude des théories de la perception et de l’attention nous aidera à concevoir avec moins de difficulté notre expérience, qui contient de nombreux paramètres qui s’influencent les uns les autres.

Enfin, dans un troisième temps, nous étudierons les résultats et émettrons d’autres hypothèses qui nous permettrons de les expliquer.

Partie I : La perception

Introduction

La perception au sens large du terme a été l’objet de nombreuses études depuis de nombreuses années. Beaucoup de personnes ont en effet envie de savoir comment elles perçoivent le monde complexe qui nous entoure, quels sont les mécanismes qui nous permettent d’appréhender la réalité et d’évoluer dans notre environnement.

Mais il convient de mieux comprendre ce qu’est exactement la perception avant de se lancer dans l’étude de celle-ci. En effet, percevoir est une activité très complexe, même si elle paraît inconsciente et surtout triviale. Elle est la source de tous nos autres comportements comme apprendre, parler, mémoriser ou communiquer.

La perception est le premier degré vers la connaissance, et elle sert d’introduction à tout ce qui en fait le sujet. (Locke, 1690)

Ces considérations sur la perception conduiront les philosophes, puis les psychologues, à élaborer de nombreuses théories à propos de la perception.

Mais Locke s’intéresse également à l’attention. En effet, il constate que lorsque l’esprit contemple fortement un objet, ou lorsqu’il réfléchit à des idées qui se présentent à lui, il ne s’aperçoit plus de l’impression causée par les sons environnants. On voit ici que l’attention est partie prenante dans le phénomène de perception, et également dans le phénomène de mémorisation, que l’on ne traitera pas ici.

Nous nous intéresserons donc à l’histoire des théories de la perception, puis de l’attention, avant de reconsidérer l’étude de la perception dans sa version multisensorielle en lien avec le sujet de ce mémoire.

I – Les Théories de la Perception

1. Approche Psychophysique

La psychophysique peut être considérée comme l’une des premières disciplines visant à étudier la perception, et plus précisément les relations entre les stimuli, objets objectivables et décrits par les sciences de la nature, et les sensations que ceux-ci suscitent chez l’individu.

Cette branche de la psychologie expérimentale trouve son origine dans la publication du livre Elemente der Psychophysik en 1860 par G. T. Fechner, qui a ainsi abordé le problème fondamental de la mesure en psychologie, et a développé des méthodes pour étudier objectivement des éléments subjectifs de perception.

La psychophysique repose principalement sur l’étude des seuils. Fechner distingue alors deux types de seuils :

seuil absolu, qui correspond à la plus petite quantité d’énergie nécessaire à produire une sensation. On passe alors d’une absence de sensation à une sensation ressentie.
seuil différentiel, qui correspond à la quantité d’énergie juste nécessaire pour produire une différence de sensation, une impression nouvelle.

Partant de cela, Fechner a mis au point trois méthodes de mesure des seuils.

1.1 Méthode des limites

Elle consiste à augmenter ou à faire décroître progressivement l’intensité d’un stimulus, et à effectuer le relevé des réponses ou des absences de réponse du sujet. On détermine les seuils de perception selon que l’expérimentateur utilise des séries de stimuli croissantes ou décroissantes, puisque l’on cesse de percevoir plus tard que l’on ne commence (BINET, 1894). Le seuil absolu est alors obtenu en faisant la moyenne de ces deux seuils.

1.2 Méthode des stimuli constants

Cette méthode consiste, à la différence de la méthode des limites, à présenter au sujet une série de stimuli d’intensité aléatoire. Le seuil est alors détecté en demandant au sujet s’il a perçu ou non le stimulus.

1.3 Méthode de l’ajustement

Ici, le sujet doit lui-même ajuster l’intensité d’un stimulus, de manière à ce que celui- ci devienne tout juste perceptible, puis tout juste imperceptible. La moyenne de ces deux intensités peut être alors considérée comme le seuil de détection du sujet pour ce stimulus donné.

À partir de ces méthodes, et en prenant pour référence les travaux de Weber, qui sera le premier à montrer que les accroissements égaux d’excitation sont proportionnels aux accroissements égaux de sensation, Fechner établira la loi aujourd’hui nommée « loi de Weber-Fechner », selon laquelle « la sensation varie selon le logarithme de l’excitation ».

L’amplitude de la sensation (Y) n’est pas proportionnelle à la valeur absolue de l’excitation (B), mais plutôt au logarithme de l’amplitude de l’excitation, quand cette dernière est exprimée en termes de valeur de seuil (b), c’est-à-dire que l’amplitude considérée comme l’unité à laquelle la sensation commence et disparaît. En résumé elle est proportionnelle au logarithme de la valeur de l’excitation fondamentale. (Fechner, 1860)

Les premiers expérimentalistes ont utilisé également les méthodes de l’introspection, qui consiste à tenter de décrire ses propres états mentaux.

Toutes ces méthodes susciteront de vives réactions et conduiront notamment à l’apparition du Behaviorisme.

2. Le Behaviorisme

C’est John Watson qui en 1913 initie le mouvement behavioriste, avec la parution de l’article « La Psychologie telle qu’un behavioriste la voit », dans la revue Psychological Review.

Le terme behaviorisme provient du mot anglais behavior, qu’on traduit par comportement. Ainsi, par rupture, voire par opposition avec le mouvement mentaliste et introspectif, Watson crée une science du comportement qui vise à étudier précisément des éléments observables objectifs, en rejetant les états de l’âme, de l’esprit et de la conscience.

La psychologie, telle que la conçoit le behavioriste, est une branche parfaitement objective des sciences de la nature. Elle a pour objectif théorique la prédiction et le contrôle du comportement. Le behavioriste, dans sa recherche sur le comportement, n’admet pas de ligne de démarcation entre l’homme et l’animal. (Watson, 1913)

Les éléments observables objectifs étudiés seront donc principalement les entrées, que constituent les stimuli appliqués à l’individu, et les sorties, ou réponses de celui-ci. Par extension, les sorties correspondront donc aux réactions, soit au comportement de l’individu. On considère ainsi l’être humain comme une boîte noire, dans le sens où ce qui se passe à l’intérieur de cette dernière est par nature inobservable.

On arrivera très vite alors à la conclusion première que le stimulus suscite une réponse, et ainsi naîtra le concept de stimulus-réponse, si cher aux behavioristes. Ceux-ci lanceront alors une large campagne d’études pour tenter de découvrir les relations entre stimuli et réponses.

Un des champs d’applications les plus importants a été celui de découvrir quels stimuli provoquent des réponses de façon innée, et lesquels provoquent des réponses apprises, conditionnées. L’apprentissage apparaît alors comme une modification du comportement face à un stimulus.

Thorndike¹, Pavlov² et Skinner³ poursuivent l’œuvre de Watson et élaborent certaines théories de l’apprentissage, en tenant compte des sentiments des individus. Ils mettent alors en évidence l’importance de la récompense et de la motivation dans l’apprentissage.

Pour les behavioristes, la perception reste donc un élément inobservable en tant que tel. En revanche, leurs travaux sur les stimuli (qui doivent être perçus) et les comportements résultant des stimuli, et donc de la perception, ont permis d’élaborer certaines théories concernant l’apprentissage, et donc les comportements conditionnés par l’environnement.

Nous allons voir que ces théories ont pu susciter elles aussi de vives réactions, notamment dans les pays germaniques.

3. Le Gestaltisme

Appelée également psychologie ou théorie de la forme, Goethe lui-même en émettra quelques idées fondatrices.

Ce mouvement apparaît en Allemagne, à peu près à la même période que le mouvement behavioriste, à propos duquel un certain nombre de critiques seront faites.

En effet, le gestaltisme s’intéresse tout particulièrement à la « boîte noire » que le behaviorisme avait laissée de côté. Ainsi, on cherchera à savoir de quelle manière l’individu organise les éléments perçus, l’environnement dans lequel il évolue, et non comment ce dernier influence le comportement. Les affects, les états mentaux, prennent alors une importance considérable dans cette étude. C’est d’ailleurs pour cette raison que ce courant sera considéré plus tard comme précurseur du cognitivisme dont nous parlerons un peu plus tard.

La Gestalttheorie établit que la perception est fortement influencée par le contexte, ainsi que par la configuration des éléments perçus. Une partie découlant souvent d’une totalité, cela implique qu’on ne peut nécessairement pas comprendre cette partie en dehors de son contexte, et de ses liens avec la totalité, d’où la loi fondamentale du courant gestaltiste : le tout est différent de la somme des parties qui le constituent.

De même, une partie dans un tout est autre chose que cette même partie isolée ou incluse dans un autre tout. Nous voyons ici que la notion de contexte est ici prépondérante.

En plus de ces constatations, le gestaltisme repose sur quelques affirmations fondamentales. En effet, dans un premier temps, il affirme qu’il existe une distinction de la forme sur le fond au sein de toute expérience perceptive. L’image du vase de Rubin nous donne un exemple tout à fait particulier de ce principe, puisqu’en général, la forme distinguée sera bien celle du vase blanc sur un fond noir, alors que nous pouvons également y voir deux visages se faisant face, sur un fond blanc. Cette distinction figure / fond nous permet donc à tout moment de hiérarchiser notre perception de notre milieu. Ainsi sommes-nous capables, selon les principes gestaltistes, de distinguer une ligne mélodique au milieu d’un brouhaha.

Exemples de vases de Rubin. Une représentation graphique classique

Exemples de vases de Rubin. Une photographie d'un vase avec son ombre. — Exemples de vases de Rubin. Une photographie d’un vase avec son ombre.

A gauche, une représentation graphique classique ; à droite, une photographie d’un vase avec son ombre.

Les Lois de la Forme

Selon la Gestalttheorie, la distinction figure / fond est permise grâce à plusieurs mécanismes, pour nous permettre de trier les informations et de regrouper les éléments. Ces mécanismes sont expliqués dans les lois suivantes (Wertheimer, 1923) :

La loi de proximité : tendance à associer des éléments proches, et à séparer les éléments éloignés.
La loi de similitude : regroupement des éléments semblables et dissociation des éléments différents.
La loi de clôture : tendance à percevoir une forme complète plus facilement lorsqu’elle est parfaitement délimitée
La loi de bonne continuité : capacité à regrouper, à relier de façon naturelle des éléments discontinus. Dans le cas d’une forme visuelle, c’est la capacité à interpréter un trait coupé comme ne l’étant pas.
La loi de destin commun : regroupement d’éléments ayant la même trajectoire. Ces éléments sont alors regroupés au sein de la même forme.
La loi de l’expérience : reconnaît la part jouée par l’apprentissage dans la perception de regroupements. L’expérience permet ainsi de structurer des éléments sans que celle-ci soit influencée par les lois précédentes.
La loi de la bonne forme : capacité à organiser naturellement des éléments en une forme plutôt qu’une autre. Cette forme est en général de nature simple, géométrique et stable.

Pour Wertheimer, ces lois constituent donc les premiers principes de la perception, et ce, sans recourir à l’expérience personnelle. Ces principes seraient donc innés. C’est le courant constructiviste qui étudiera plus précisément les mécanismes de l’apprentissage.

4. L’approche constructiviste

Initié par Jean Piaget, ce mouvement est en partie l’origine des courants de la psychologie cognitive. En effet, on conçoit ici la perception comme étant le résultat d’une construction cognitive de la part de l’individu. Les perceptions sont elles-mêmes élaborées à partir de l’expérience personnelle, à partir d’indices issus de l’observation active du stimulus.

Au début du constructivisme, Piaget s’oppose à la théorie de la Gestalt, car il ne reconnaît pas le caractère inné de la perception, ainsi que les invariances de l’organisation perceptive, énoncées dans toutes les lois de la forme. Cependant, il adhère à la théorie de la totalité dans la figure, à la différence près que pour lui, cette notion dépend encore une fois de l’activité cognitive de l’individu et non de la configuration dans laquelle se présentent le ou les stimuli.

Piaget insiste ainsi sur les notions d’assimilation et d’accommodation. L’assimilation est justement ce qui nous permet de nous forger de nouvelles connaissances, d’intégrer de nouvelles données sur le monde qui nous entoure, à partir de nos différentes expériences perceptives. L’accommodation fait que notre perception est évolutive. En effet, en fonction de nos différentes perceptions, nous allons pouvoir adapter notre comportement et nos activités cognitives aux situations nouvelles. Le constructivisme est ainsi souvent assimilé à une théorie de l’apprentissage, que ce soit dans un cadre scolaire ou par exemple dans le cadre de la perception auditive qui nous intéresse plus particulièrement.

L’acquisition d’une information se traduit par une « perturbation » qui va entraîner chez l’individu un « déséquilibre » du champ cognitif et exiger un travail de synthèse pour assimiler, intégrer, critiquer, admettre, ajouter cette nouvelle dans un champ cognitif alors enrichi. (Jean Piaget, 1940)

5. New Look Perceptif

Cette théorie peut s’inscrire dans la continuité du mouvement constructiviste de Jean Piaget. Élaborée par Jerome Bruner, son origine tient dans une célèbre expérience de 1947 dans laquelle le psychologue découvre que les enfants surestiment la taille de pièces de monnaie par rapport à des disques en carton de la même surface. Par cette expérience, Bruner met le doigt sur l’importance des attentes, des motivations et de la préparation des individus dans la perception.

Pour Bruner, la perception est donc un processus qui consiste à tester des hypothèses à propos du stimulus perçu. Ainsi le sujet attribue une première signification sur la nature de l’objet observé, et qui sera confirmée ou non par des informations complémentaires reçues ultérieurement. Le sujet est alors pleinement acteur de sa perception.

Cependant, il est important de souligner le fait que le sujet formule ses hypothèses à partir de quelques indices, quelques échantillons sur le stimulus, et en aucun cas à partir d’une analyse complète de celui-ci. Ce sont ces premiers indices qui permettent de classifier le stimulus dans une catégorie. En voici un exemple :

Cette chose est ronde, sa surface n’est pas lisse, c’est de couleur orangée, de telle et telle dimension, c’est donc une orange. (Bruner, 1957)

A partir des hypothèses formulées sur certaines caractéristiques de l’objet, nous pouvons faire une première hypothèse sur la nature de celui-ci. Il s’agit d’un passage du particulier au général, des indices à la catégorie, contrairement à la théorie Gestaltiste qui part du général, la forme, pour aller vers le particulier.

De plus, nous voyons ici un premier indice d’une orientation catégorielle et prédictive de la perception, c’est-à-dire qu’à partir des hypothèses, le sujet place directement le stimulus dans une catégorie. À partir de cela, il peut prédire plus précisément ce qu’il pourra percevoir ultérieurement, en se forgeant une idée plus précise du contexte. Le sujet est ainsi dans un état constant de préparation et d’attente.

6. Approche cognitive

6.1. Psychologie cognitive

Comme nous avons pu le voir avec Piajet ou Bruner, la psychologie cognitive consiste à étudier les processus mentaux mis en œuvre lors de la perception, qu’ils soient conscients ou inconscients. Ces processus sont en général le lien entre les entrées sensorielles et les réactions de l’individu. La psychologie cognitive étudie également et plus généralement la manière dont les personnes pensent, mémorisent, apprennent… Elle trouve des liens de parenté à d’autres disciplines comme les neurosciences, la philosophie et la linguistique, qui font elles aussi partie des sciences cognitives.

C’est le psychologue Ulric Neisser qui utilisera le premier le terme de « psychologie cognitive ». Considéré aujourd’hui comme le père de celle-ci, il la définira comme se référant « à tous les processus par lesquels l’input sensoriel est transformé, réduit, élaboré, stocké, rappelé et utilisé ». (Neisser, 1967)

Avec la psychologie cognitive émergent deux concepts très importants du traitement de l’information perceptive : les concepts de processus descendants ou ascendants. On parle encore de processus « bottom-up » (ou « Data-driven) ou « top-down » (ou Theory- driven).

Les processus ascendants sont basés sur l’information seule. Ils représentent un traitement de l’information du bas niveau, qui correspond aux caractéristiques du stimulus perçu, vers le haut niveau, l’intégration et le traitement cognitif. Ces processus interviennent typiquement lors de la première présentation d’un stimulus à un sujet. Celui- ci acquiert de nouvelles informations à partir de ce qu’il perçoit seulement. De plus, ces processus bottom-up dépendent en général peu des hypothèses ou des attentes du sujet. Les représentations formées à partir de ces processus constituent la base de l’identification perceptive.

Les processus descendants sont basés sur l’intégration d’informations préalablement acquises à propos d’un stimulus. Ces processus font en général suite aux processus ascendants. En effet, lors d’une deuxième présentation d’un même élément à un sujet, celui-ci se sert des informations préalablement acquises pour effectuer des hypothèses. Ces processus contrôlent l’information sensorielle à partir de l’expérience et des connaissances, et constituent donc des processus de haut niveau cognitif faisant suite à l’identification perceptive. Ils jouent un rôle essentiel dans les situations où les stimuli peuvent être ambigus ou tout juste perceptibles.

Cette distinction entre les deux types de processus a pour origine le constat selon lequel un stimulus perçu ne l’est pas de la même manière la première fois que les fois suivantes. Nous appréhendons d’abord l’élément présenté, puis nous pouvons nous resservir des informations recueillies lors d’expériences ultérieures.

Les processus top-down sont souvent à l’origine d’un état d’attente ou de préparation lors de la perception. La théorie de l’état central directeur⁴ traite ainsi de l’influence des caractéristiques du sujet percevant. En effet, en présence de ces éléments, on observe généralement un abaissement des seuils de perception. Ces éléments peuvent être de six natures différentes :

besoins corporels (alimentation, sommeil, sexualité…). Certaines expériences montrent ainsi qu’il existe un abaissement des seuils perceptifs pour des mots portant sur l’alimentation chez des sujets ayant jeûné 24h.
récompense / punition. On constate un abaissement des seuils perceptifs et des réponses plus rapides lors d’expériences mettant en jeu une récompense.
valeurs caractéristiques du sujet.
valeur monétaire d’un objet
personnalité du sujet
valeur sémantique des mots (par exemple des mots tabous)

En plus du phénomène de l’état central directeur, nous pouvons voir également apparaître un effet de mémoire lors de la présentation répétitive d’un stimulus, ce qui peut également être à l’origine d’un abaissement du seuil de perception pour ce stimulus.

6.2. Cognition auditive

Les recherches sur la cognition auditive ont au début concerné principalement un cas particulier de l’audition et de notre ouverture sur le monde : le langage parlé. Cependant, il existe de nos jours de nombreux documents concernant la psychologie cognitive de la perception des sons non verbaux, domaine qui s’élargit notamment avec des études sur la perception de la musique (voir les travaux mis en œuvre à l’IRCAM, notamment par Stephen McAdams, et au LAM par Michelle Castellingo…)

La cognition auditive, comme pour les autres modalités sensorielles, fait toujours intervenir une étape d’interprétation de l’information sensorielle. En effet, le contenu sensoriel des stimuli n’est pas suffisant pour se forger grâce à eux seuls une idée sur notre environnement. C’est ainsi que lorsque nous percevons, nous élaborons naturellement une représentation mentale à partir de notre expérience.

L’être humain cherche donc à attribuer une signification à l’ensemble de la structure sonore.

6.2.1 Un modèle de perception auditive

Le modèle de Peretz, basé sur les modèles de perception visuelle, décrit le processus de la reconnaissance auditive en deux étapes. Nous pouvons d’ailleurs remarquer que la plupart des théories perceptives se sont appuyées et s’appuient encore sur les théories de la vision.

Dans un premier temps, l’événement sonore est analysé, de manière à dégager les propriétés de ce son complexe. Ceci conduit alors à la perception de l’événement, à la discrimination de celui-ci.

Dans un second temps, les propriétés du son dégagées à la première étape sont mises en relation avec les représentations mentales stockées en mémoire. Les schémas ou expériences antérieures en rapport avec elles sont alors activés.

Modèle de Peretz (Bertrand & Garnier, 2005)

6.2.2 La perception de la musique

Avant de pouvoir apprécier la musique, il paraît naturel de pouvoir la reconnaître en tant que telle, c’est-à-dire, de pouvoir catégoriser l’événement sonore perçu comme un air musical. Le phénomène de reconnaissance de la musique repose sur une série de mécanismes complexes.

De plus, même si la musique peut susciter en nous, et dès notre plus jeune âge, un panel d’émotions tout à fait impressionnant, et qu’il n’est pas nécessaire d’en être un spécialiste pour l’apprécier, la perception de la musique repose pour une grande partie sur l’apprentissage. Cet apprentissage peut être de nature différentes. Il peut être initié par des spécialistes qui vont permettre également d’acquérir un savoir technique (cas de l’apprentissage en école de musique). Il peut également être le résultat d’un phénomène d’habituation, d’appréhension autonome (cas des autodidactes).

En étudiant le cas de personnes souffrant de troubles de la cognition musicale, la neuropsychologue Isabelle Peretz met en évidence l’existence d’une zone spécifique du traitement de la musique dans notre cerveau qu’elle appelle le Système de Reconnaissance Musicale (PERETZ, 1993). Selon elle, le modèle de perception de la musique est analogue à celui des sons non verbaux. La différence réside dans la présence de nombreux modules de détection (hauteur, organisation temporelle…), dont les sorties seront mises en relation entre elles, et aussi avec la mémoire.

Système de Reconnaissance Musicale selon Peretz (Peretz, 2003)

7. La Psychologie écologique

Le concept de psychologie écologique est initié par James Jerome Gibson. Il expose sa théorie selon laquelle la perception ne peut être expliquée que dans des conditions naturelles de perception, dans la relation de l’animal avec son environnement, dans The Ecological Approach to Visual Perception en 1979.

Gibson propose ainsi le couplage perception-action, et soutient que ces deux composantes sont inséparables. Le psychologue avance qu’il n’existe pas de représentation intermédiaire entre la perception et le comportement. Ce que nous percevons dépend de nos actions, et nos actions, de nos perceptions.

Ainsi, on peut dire que le mouvement est presque le seul moyen dont nous disposons pour interagir avec notre environnement, le cerveau ayant alors pour fonction de déterminer nos actions futures. Il appartient donc de laisser les sujets libres de leurs mouvements et de leurs actions dans l’étude de la perception.

Gibson introduit également le concept d’ »affordances ». En effet, il existe dans l’environnement un nombre d’éléments qui offrent une possibilité d’interaction avec l’individu. La notion d’affordance désigne alors les possibilités d’interaction du sujet avec son environnement.

Les affordances de l’environnement sont ce qu’il offre à l’animal, ce qu’il lui fournit, que ce soit bon ou mauvais. (Gibson, 1979)

II – Psychologie de l’attention

1. Qu’est-ce que l’attention?

Mobilisée dans toutes les activités cognitives, l’attention peut être considérée comme la capacité à se concentrer, à capter certaines informations parmi d’autres. Elle améliore grandement l’efficacité des individus dans leurs activités quotidiennes et intellectuelles.

Elle permet d’effectuer une grande variété d’opérations sensorielles comme la sélection de l’information, la focalisation intentionnelle, la mobilisation des ressources attentionnelles dans la concentration et l’effort, la résistance à la distraction, le contrôle de l’activité, etc.

On peut distinguer trois fonctions de l’attention. L’attention sélective permet justement de sélectionner l’information pertinente pour une tâche à accomplir ou pour approfondir la connaissance de cette information. L’attention partagée nous permet de suivre plusieurs actions ou plusieurs informations en parallèle. Enfin, l’attention soutenue ou prolongée nous permet de rester concentré sur une source d’information pendant une longue durée.

L’attention fait naturellement apparaître la notion de cible, ainsi que la notion de distracteur. Ainsi, l’élément distracteur est celui qui va venir perturber notre attention, alors que l’élément cible est celui sur lequel nous allons devoir nous concentrer.

L’attention est la prise de possession par l’esprit, sous une forme claire et vive, d’un objet ou d’une suite de pensées parmi plusieurs qui semblent possibles […] Elle implique le retrait de certains objets afin de traiter plus efficacement les autres. (James, 1890)

2. Mécanismes de l’attention

2.1. L’attention sélective

Pour traiter une information, il est nécessaire de se focaliser sur celle-ci, ce qui suppose de la sélectionner parmi un ensemble d’informations disponibles. A l’extrême, il peut être possible d’éliminer totalement les stimuli non pertinents. Parmi les différentes théories de l’attention sélective existantes, toutes postulent que nous ne pouvons laisser rentrer dans le système cognitif qu’une quantité limitée d’informations. La différence réside dans le moment où survient la sélection des informations.

2.1.1 La théorie du filtre de Broadbent

En 1958, Donald Broadbent effectue une expérience d’écoute dichotique. Dans cette expérience, on diffuse au moyen d’un casque des informations différentes dans chacune des deux oreilles. On demande ensuite au sujet de répéter au fur et à mesure le message qui arrive dans une de ses deux oreilles (cible), tout en ignorant le message arrivant à l’autre oreille (distracteur). Les résultats de cette expérience sont alors restés au cœur de la recherche sur l’attention, que sa théorie soit critiquée, ou même réfutée.

En effet, Broadbent postule l’idée selon laquelle l’information est traitée par le système cognitif en suivant trois étapes.

Dans un premier temps, le stimulus est capté par les sens, et les registres sensoriels encodent l’information sans aucune transformation, et les stockent dans la mémoire à court terme.

Dans un second temps, un filtre sélectif est appliqué sur les stimuli. Ce filtre repose sur des caractéristiques prédéterminées de l’information.

Enfin, l’information passe par une sorte de détecteur pour déterminer par exemple la signification du message, avant d’utiliser les informations, ou de les transmettre à la mémoire à long terme. Broadbent avance par ailleurs que les informations stockées en mémoire à court terme disparaissent si elles ne sont pas utilisées.

2.1.2 La théorie de l’atténuation de Treisman

Anne Treisman propose un nouveau modèle en 1960, à partir de celui de Broadbent. La différence majeure réside dans le fait que là où Broadbent proposait une sélection des informations, Treisman propose un mécanisme d’atténuation.

En d’autres termes, là où Broadbent pense que les stimuli qui ne font pas l’objet d’une focalisation attentionnelle ne passent même pas à travers le « filtre », Treisman propose l’idée que les stimuli-cibles font l’objet d’un traitement plus approfondi que les autres. On n’a plus un filtre « tout-ou-rien », mais bien un filtre atténuateur des informations, grâce auquel certains éléments distracteurs peuvent être traités, mais dans une qualité dégradée.

2.1.3 Le modèle de sélection tardive de Deutsch et Deutsch

Proposée en 1963, cette théorie suggère que toutes les informations passent par le système cognitif. La sélection ne se ferait alors qu’au moment où l’information passe en mémoire à court-terme, afin d’être traitée plus en profondeur. Il n’y aurait alors sélection qu’après une étape d’analyse sémantique de l’information, c’est-à-dire qu’elle est choisie en fonction de son sens et de son importance, et non en fonction de ses propriétés physiques.

2.1.4 La théorie de filtre mouvant de Norman

Norman réintroduit en 1968 le concept de capacité limitée à l’intérieur du modèle de Deustch & Deutsch. Ainsi, Norman soutient qu’on ne traite réellement qu’une faible quantité d’informations, puisqu’une majorité aura pu être rejetée au fur et à mesure des étapes du traitement. Ainsi, un message paraissant très pertinent pourra en réalité se révéler petit à petit sans intérêt.

2.2. L’attention partagée

L’attention partagée nous permet de percevoir l’ensemble d’une scène ou d’appréhender plusieurs informations fournies par plusieurs événements. Il n’y a pas ici de réelle focalisation, mais notre attention va nous permettre d’assimiler un ensemble d’événements ou d’éléments essentiels d’une scène. Ces événements pourront ou non être liés entre eux.

Cependant, la perception simultanée de plusieurs informations implique qu’il est plus difficile de restituer avec précision un seul de ces événements. En effet, plusieurs aspects sont tout simplement ignorés pour permettre ce traitement simultané.

On peut remarquer que nous sommes en difficulté lorsque les tâches à effectuer sont similaires, qu’elles sont difficiles, ou si ces deux tâches nécessitent une attention consciente. Au contraire, nos actions sont facilitées lorsque les tâches à effectuer sont différentes, peu complexes, si l’une des deux tâches ne nécessite pas d’attention consciente et/ou si elles sont répétées.

2.2.1 Le modèle de Kahneman

En s’inspirant des modèles proposés par les économistes, Daniel Kahneman propose en 1973 la notion de « ressource » attentionnelle. Ce concept repose sur l’idée que nous disposons d’un stock de ressources limité, et qu’il possible de mener de front plusieurs activités sous réserve que la demande totale en ressources attentionnelles n’excède pas le stock disponible. Kahneman fait également l’hypothèse qu’il existe un mécanisme de gestion qui décide de l’assignation de l’effort à une activité plutôt qu’à une autre. Ainsi, la quantité de ressources disponibles à un instant « t » provient de différents facteurs, tels que le degré d’éveil, les dispositions permanentes, les intentions du moment, les exigences de la tâche…

2.2.2 Modèle des ressources attentionnelles multiples de Wickens

Wickens propose en 1984 une théorie approfondie, qui fait intervenir des stocks de ressources distincts, ceci à partir de constatations qui montrent qu’il est possible de réaliser simultanément deux activités sans interférence.

Il adopte alors une métrique tridimensionnelle. La première dimension, correspondant au stade de traitement, oppose les processus à l’entrée du système (traitement perceptif, encodage) à ceux qui à la sortie sous-tendent la réponse. La deuxième dimension, correspondant au type de traitement, oppose les processus verbaux situés dans l’hémisphère gauche du cerveau, aux processus spatiaux situés dans l’hémisphère droit. Enfin la troisième dimension correspond au canal d’entrée de l’information, et se base sur l’hypothèse que les informations sont moins perturbées lorsqu’elles proviennent de deux modalités différentes.

2.3 L’attention « de longue durée »

Peut-on maintenir durablement son attention focalisée? L’attention fluctue-t-elle d’un instant à l’autre? Un nombre de scientifiques se sont penchés sur ces questions. En effet, les réponses que l’on peut donner à ces dernières ont des implications nombreuses en matière de théorie de l’apprentissage par exemple, ou des sciences de l’éducation.

On peut distinguer deux types d’attention de longue durée. La vigilance, dans un premier temps, est considérée comme un état physiologique. L’attention soutenue, elle, s’apparente plutôt à un contrôle conscient de l’activité.

2.3.1 La vigilance

Elle est définie en 1923 comme un « état de haut niveau d’efficience du système nerveux central » par Head (Head, 1923). Elle permet notamment de résister à l’endormissement. Il appartient de préciser qu’aucun niveau de vigilance ne préjuge de la qualité d’une réponse comportementale. Le niveau de vigilance peut être mesuré de deux façons différentes, soit par un électroencéphalogramme, soit par l’exécution d’une tâche, qui consiste généralement en une tâche de surveillance, telle que l’a définie Macworth (longue et monotone, et présentant peu de cibles à détecter).

La performance à une tâche n’est pas linéaire avec le niveau de vigilance. En effet, s’il paraît intuitif qu’en état d’hypovigilance ou même de veille diffuse, la performance est détériorée, il en va de même pour un état d’hyperexcitation (niveau de vigilance surélevé), qui favorise ainsi l’augmentation des erreurs, et qui traduit donc un mauvais contrôle attentionnel.

Loi de Yerkes et Dodson ou loi de l'optimum — Loi de Yerkes et Dodson ou loi de l’optimum

2.3.2 L’attention soutenue

L’attention soutenue correspond à la capacité de maintenir une performance sur une longue période qui dépend du maintien de la vigilance, de la capacité de détection du stimulus et de la résistance à la distraction, donc du contrôle mental. Il s’agit donc d’un mécanisme d’attention sélective ou partagée, mais sur une longue période.

On observe que la capacité à focaliser son attention de manière durable progresse significativement en fonction de l’âge, et avec le développement de stratégies.

Kahneman introduit en 1973 la notion d’effort attentionnel qui allie deux paramètres : d’une part, la composante intensive reflétant l’effort investi, et d’autre part, la composante sélective, que l’on peut relier au degré de focalisation. Ainsi, l’efficacité du comportement serait modulée par l’effort investi, qui n’est autre que la régulation, par le sujet, de son propre niveau d’activation en fonction des exigences de la situation.

2.4 Processus automatiques ou conscients

On a tous remarqué combien il était nécessaire de se concentrer pour effectuer une tâche nouvelle, comme par exemple composer un numéro de téléphone que l’on ne connaît pas. Au contraire, il est très facile de suivre assidûment une conversation tout en composant un numéro de téléphone connu, dont on a l’habitude.

Ainsi, Shiffrin et Schneider distinguent en 1977 deux types de processus attentionnels : les processus dits contrôlés, qui opèrent en série et avec une certaine lenteur. Ce sont des processus coûteux mais souples ; et les processus automatiques rapides, qui opèrent en parallèle. Ces mécanismes sont plus économiques, mais plus rigides, généralement involontaires. De plus, ce ne sont en général pas des mécanismes conscients.

2.5 Attention endogène et attention exogène

L’orientation de l’attention peut-être déclenchée de plusieurs manières. En effet, elle peut aussi bien être causée par un élément extérieur soudain, qu’être le résultat de la volonté de l’individu de se concentrer sur un sujet précis.

Un événement soudain peut attirer notre attention soudainement. En effet, cet événement inattendu produit chez le sujet une réaction d’orientation de son attention, qui aura pour conséquence un arrêt immédiat de l’activité en cours. Cette orientation exogène est en général rapide (50 à 150 ms). Elle peut-être d’une durée très brève si le signal ne contient aucune information intéressante.

L’attention endogène correspond à une orientation volontaire de l’attention vers un endroit ou un stimulus précis. Elle trouve son origine dans une attitude et une décision du sujet. Plus lente à se déployer (350 à 500 ms), l’attention endogène prend généralement le relais de l’orientation exogène afin d’appréhender plus précisément l’événement qui vient d’être perçu.

III – Multimodalité

L’étude des phénomènes perceptifs au cours de l’histoire a souvent privilégié un seul de nos cinq sens. De nombreuses théories ont été élaborées par rapport à la vision, moins par rapport à l’ouïe et au toucher, mais elles sont presque inexistantes à propos du goût et de l’odorat. Ces théories nous ont apporté de nombreuses réponses et l’étude de ces sens nous ont permis de connaître le fonctionnement de nos organes sensoriels.

Cependant, il apparaît aujourd’hui que l’étude de la perception, si l’on souhaite approfondir nos connaissances de celle-ci, nécessite quelques ajustements. En effet, il peut sembler paradoxal d’étudier une seule modalité sensorielle étant donné que tous nos comportements suggèrent l’intégration de plusieurs informations provenant de tous les systèmes sensoriels. De plus, dans le domaine qui nous intéresse, c’est-à-dire l’audiovisuel, la multimodalité est le principe central de la perception.

1. Les origines

Les questions sur la multimodalité commencent dès le XVIIᵉ siècle, avec l’étude de la relation toucher-vision et la question de Molyneux. Cette question, plutôt d’ordre philosophique, apparaît dans la correspondance du 7 juillet 1688 entre William Molyneux et John Locke :

« Supposez un aveugle de naissance qui soit présentement homme fait, auquel on ait appris à distinguer par l’attouchement un cube et un globe du même métal, et à peu près la même grosseur, en sorte que lorsqu’il touche l’un ou l’autre, il puisse dire quel est le cube, et quel est le globe. Supposez que, le cube et le globe étant posés sur une table, cet aveugle vienne à jouir de la vue : on demande si, en les voyant sans les toucher, il pourrait les discerner, et dire quel est le globe et quel est le cube. » (William Molyneux, correspondance du 7 juillet 1688)

Les deux correspondants répondent par la négative à cette question, avançant que même si l’aveugle sait comment le globe et le cube affectent son sens du toucher, il ne peut pas savoir comment ceux-ci affectent son sens de la vue.

Ce problème suscite ensuite un important débat qui implique notamment Georges Berkeley, Gottfried Wilhem von Leibniz, Voltaire, Diderot, et nombre d’autres grands penseurs de l’époque. Cette question est celle qui a suscité le plus de réflexions chez les philosophes de la perception dans l’histoire de la philosophie.

Depuis lors, quelques études ont été menées en parallèle des études monomodales et ont pris un essor considérable ces dernières années.

2. Associations acquises ou innées

Comme nous venons de le voir, la perception multisensorielle a supposé au départ une séparation de chacun de nos cinq sens. En effet, alors qu’il est possible d’associer nos perceptions lorsque nous jouissons de tous nos sens simultanément, ceci paraît difficile dans le cas du problème de Molyneux une fois que l’aveugle recouvre la vue. Pour arriver à cette conclusion, les penseurs partent de la constatation que ces associations entre modalités se mettent en place par apprentissage.

En 1960, Senden réalise les premières expérimentations à propos de ce fameux problème en effectuant une opération de la cataracte sur des aveugles de naissance dans le but de leur restaurer la vue. Il s’avère que les conclusions de Molyneux et de Locke sont exactes.

Cette hypothèse de la séparation initiale des modalités sensorielles a été d’ailleurs consolidée notamment par les théories de Jean Piaget vers 1935. Dans ses théories de l’apprentissage, il postule que dans les premières semaines de notre vie, nos espaces perceptifs (visuels, tactiles, auditifs, etc) sont séparés, et que les modalités vont petit à petit « s’assimiler », se coordonner.

A l’inverse, Gibson émet la théorie selon laquelle les modalités sensorielles partagent quelque chose en commun dès le début de la vie (Gibson, 1966). De plus, il invente le concept de perception « amodale », où la relation entre les modalités sensorielles ne dépend pas d’elles mais de l’information véhiculée par chacune des modalités. Delorme et Flückiger citent dans leur ouvrage « Perception et Réalité » l’exemple du feu, qui est à la source de sensations auditives, olfactives, tactiles (chaleur). Le fait que toutes ces sensations véhiculent simultanément la même information « feu » suffit à associer nos perceptions selon Gibson. La perception est dite « amodale » (Delorme & Flückiger, 2003).

3. Les recherches actuelles

La psychologie cognitive présente des points de vue très divers. En effet, il n’existe pas d’explication unique des relations entre les modalités sensorielles. Il semble ainsi exister une grande variété d’interactions. C’est ainsi que l’on peut voir apparaître aujourd’hui un grand nombre de publications aux champs d’applications plus restreints, qui ne cherchent pas à établir une théorie générale de la perception multisensorielle, mais plutôt à expliquer comment celle-ci fonctionne dans une situation donnée.

Les travaux concernant la relation audition-vision découlent en partie des expériences de Harry McGurk et John MacDonald, dont ils publient les résultats dans l’article « Hearing Lips and Seeing Voices » dans la revue Nature en 1976.

Ils démontrent ainsi l’existence d’une interférence entre l’audition et la vision lors de la perception de la parole. On a d’ailleurs les premières suggestions d’une perception

multimodale de la parole. Pour montrer cet effet, on présente habituellement une vidéo montrant une personne prononçant le phonème /ga/, alors que la bande sonore synchronisée diffuse le phonème /ba/. On a alors généralement l’impression de percevoir un phonème différent des deux autres, ici /da/. De plus, McGurck et MacDonald montrent que cet effet dure même lorsque l’on connaît le « truc ».

Aujourd’hui, certains laboratoires comme le Laboratoire d’Acoustique Musicale à Paris, la NASA ou encore le CIRMMT et le Multimodal Interaction Laboratory à l’université McGill au Canada, s’intéressent de près aux perceptions multisensorielles. Ces recherches s’intéressent aussi bien à la réalité virtuelle, qu’à l’architecture ou bien la perception de concerts musicaux.

On peut noter par exemple l’importance du visuel sur la perception de la distance apparente d’un sujet. Plus précisément, Santhie Nathanail met en évidence dans sa thèse « Influence des informations visuelles sur la perception auditive : conséquences sur la caractérisation de la qualité acoustique des salles » l’influence de la distance visuelle de la scène sur la perception de la distance auditive dans une salle. En effet, les mêmes éléments sonores sont perçus plus proches sous des conditions visuelles proches, et plus lointains sous des conditions visuelles lointaines.

Certaines études portent également sur le rapport entre la multimodalité et l’émotion dans la perception, et spécifiquement dans le cadre de concerts musicaux. Dan Levitin en fait d’ailleurs le sujet d’expériences très intéressantes dont il publie les résultats en 2007. Il démontre ainsi que les réactions des sujets sont beaucoup plus importantes lorsqu’ils reçoivent un stimulus à la fois visuel et sonore.

En ce qui concerne l’influence d’une ou plusieurs modalités sur une modalité donnée, il apparaît que l’on ne peut pas hiérarchiser nos différentes modalités sensorielles. En effet, nous avons vu que la vision pouvait altérer notre perception du son, mais l’inverse est également possible. On peut alors émettre l’hypothèse que la modalité dominante dépend de la tâche à effectuer et de son contexte (Calvert, 2004).

Conclusion

Les théories de la perception ont beaucoup évolué au fil de l’histoire, en partant d’hypothèses et de théories très générales, pour laisser finalement toute la place à l’individu et aux différences interindividuelles. Il existe certes des schémas applicables à tous, mais il reste impossible de prévoir comment chacun perçoit, puisque la perception reste un événement très personnel.

Malgré les nombreuses réfutations et affrontements entre les différents courants de pensée, il est à mon sens important de noter que chaque théorie permet d’avancer et prend tout son sens. On peut paradoxalement remarquer que les théories générales se sont mises en place à partir de cas particuliers, alors que, de nos jours, le champ d’application est plus vaste, puisqu’il dépend de chacun.

Bien entendu, bon nombre d’études sont encore en cours, et les théories actuelles ne peuvent pas apporter toutes les réponses aux questions, mais on peut tout de même avoir un certain éclairage.

La connaissance de toutes ces théories sur la perception, sur l’attention et sur la perception multimodale vont nous permettre de comprendre un peu mieux les processus mis en œuvre dans le sujet qui nous intéresse, c’est-à-dire, la perception d’un événement audiovisuel musical. Ces théories vont nous permettre d’élaborer notre expérience perceptive, en tenant compte des phénomènes cognitifs, en prenant garde aux effets indésirables, comme les attentes par exemple, et avec un souci de sa validité écologique.

De plus, nous allons pouvoir ensuite formuler des hypothèses sur les mécanismes de la perception, précisément dans cette situation d’écoute dans un contexte multimodal.

Partie II : L’expérience

1. Contexte

Il s’agit d’étudier une situation commune dans notre métier d’ingénieur du son : le montage son à l’image. Nous allons nous intéresser plus précisément au montage d’un concert ou d’un opéra filmé, avec plusieurs prises, dans le but d’une diffusion ultérieure à la télévision avec la réalisation d’un DVD, et peut-être à la radio, avec la réalisation d’un CD audio. Nous sommes donc dans le domaine de la musique dite « classique ».

Dans cette situation de production, plusieurs étapes seront nécessaires :

– Élaboration du système de captation (caméras, microphones…), enregistrement de plusieurs représentations ou au minimum de la répétition générale et du concert.
– Montage de l’image et montage du son. Ces deux opérations seront effectuées en général par deux équipes techniques différentes, chacune ayant son domaine de spécialisation.
– Visionnage et validation des montages.
– Mixage du son, mastering.
– Création du DVD, du CD, envoi du P.A.D. (prêt à diffuser) à la télévision, et du son à la radio.

Nous allons ici nous préoccuper de l’étape de montage de la bande sonore, en relation avec l’image. Un phénomène assez complexe, déjà identifié par la plupart des personnes familières de cette tâche, peut se produire : lorsqu’un point de montage (passage d’une prise à une autre) est difficilement réalisable, et que, malgré les tentatives de correction, celui-ci reste encore audible, il n’est cependant pas rare qu’il « disparaisse » en ajoutant la vidéo. Darcy Proper, qui a longtemps effectué ce genre de travail chez Sony, et qui aujourd’hui fait du mastering chez Galaxy Studio en Belgique, l’a elle-même évoqué lors de la126ᵉ convention de l’AES à Munich. Nous pouvons d’ailleurs faire l’hypothèse qu’un tel phénomène se reproduit pour tout défaut présent sur la bande sonore, tel que des clics numériques, des bruits parasites, ou que du moins, ces défauts sont moins bien perçus lorsque la bande sonore est diffusée conjointement avec la vidéo.

Mais le montage présente également d’autres questions. En effet, en superposant l’enregistrement vidéo d’une représentation et l’enregistrement sonore d’une autre, pour corriger par exemple la justesse d’une ou plusieurs notes, nous pouvons être confrontés à des problèmes de cohérence entre des intentions perçues, le geste musical, et la perception du son. Ces problèmes sont beaucoup plus difficiles à résoudre. C’est le problème de ce qu’on appelle par exemple le « playback ».

Un troisième problème pouvant être rencontré est celui de la synchronisation. En effet, un montage pourra être rendu totalement impossible lorsque, par exemple, les musiciens n’ont pas joué ni chanté au même tempo entre les différentes prises. Si l’on vient à mélanger le son d’une prise avec l’image d’une autre, les deux composantes son et image vont en effet se décaler temporellement, ce qui pourra conduire de la part du spectateur à un sentiment de malaise lorsque le décalage est trop faible pour identifier clairement le problème, puis à un sentiment de totale incompréhension du discours pour un décalage important.

Le caractère multimodal de cette tâche la rend donc plus complexe et plus difficile à réaliser d’un point de vue tout d’abord simplement logistique, mais surtout d’un point de vue perceptif. C’est pourquoi nous allons essayer d’analyser cette tâche d’un point de vue psychologique en questionnant des auditeurs, pour essayer de comprendre les processus mis en œuvre.

2. Approche méthodologique

Une telle étude semble tout d’abord difficilement réalisable, puisqu’elle fait appel principalement à des mesures du subjectif. Il va donc falloir établir un protocole expérimental qui nous permettra d’identifier les processus mis en œuvre et de les rapporter ensuite à des mesures physiques. Les sciences humaines, et plus précisément la psychologie cognitive, nous seront ainsi requises dans cette démarche, et nous allons nous appuyer sur les théories de la perception détaillées en première partie.

A partir des trois types de problèmes pouvant être rencontrés dans cette étape de montage, nous nous focaliserons sur deux catégories :

Les problèmes dits « de congruence », qui font référence à des problèmes de cohérence entre deux éléments : un élément de référence, constitué par la vidéo, et un élément que nous pourrons faire varier ponctuellement, la bande sonore. Cette dernière étant la plupart du temps travaillée sans cet élément de référence, des problèmes de congruence peuvent apparaître. C’est le cas des problèmes d’intention ou de dynamique gestuelle, mais également de nos problèmes de point de montage ou de clic. Lors de la phase d’écoute, l’élément de référence agit alors comme un distracteur par rapport à la bande son. Il en résultera alors soit une atténuation du problème sonore, soit une amplification.

Les problèmes temporels : ce sont principalement les problèmes de synchronisation. En travaillant sans l’image, le monteur son peut involontairement décaler une note lors d’un montage, et changer faiblement le rythme de la musique. Cette variation, imperceptible lors d’une diffusion uniquement sonore, pourra être flagrante avec l’ajout de l’image qui était au départ synchrone lors de l’enregistrement. Ici, nous n’avons plus cette notion de cible et de distracteur, les deux éléments interagissent. Au moment du visionnage, la question de savoir si c’est le son qui a été désynchronisé, ou bien la vidéo, peut se poser.

Nous allons nous limiter ici aux problèmes de congruence, que nous pouvons également subdiviser en deux sous-catégories :

Les problèmes d’ordre perceptif : ils sont généralement dus à un problème « technique » comme des parasites sur le signal audio, ou à un élément indésirable présent dans la salle où la prise de son a été effectuée. On a affaire à un événement plutôt unimodal, où l’image va venir modifier la perception du son.

Les problèmes d’ordre sémiotique : ceux-ci font appel à des processus cognitifs plus complexes, notamment aux processus « top-down » dont nous avons parlé en première partie. La perception de ce type de défaut fait appel à un niveau supérieur de traitement. Le sujet doit ici mettre en relation ce qu’il voit et ce qu’il entend, pour ensuite déterminer si les deux éléments sont en cohérence l’un avec l’autre, tandis que pour les problèmes d’ordre perceptif, cette mise en relation n’est pas nécessaire ; nous sommes dans ce cas dans une configuration dite « bottom-up ».

3. L’expérience

3.1 But de l’expérience

A partir des phénomènes observés, nous allons essayer d’observer l’influence de l’image dynamique sur la perception d’un défaut présent sur la bande sonore. Il s’agira de détecter les seuils de perception des défauts avec ou sans vidéo, puis de voir si ceux-ci sont différents, pour ensuite tenter de mettre en évidence les mécanismes mis en œuvre. Deux hypothèses s’offrent à nous : s’agit-il « simplement » de problèmes d’attention, de sélectivité de l’attention? Ou s’agit-il d’un phénomène de masquage entre l’image et le son?

En d’autres termes, il s’agit de déterminer de quelle manière le défaut sonore est rendu imperceptible, ou devient perceptible.

3.2 Matériel utilisé

Nous allons présenter aux sujets des extraits d’un concert de musique classique, qui a fait l’objet d’un enregistrement audio-visuel, dans des conditions réelles de production, et dans lequel un montage vidéo a été effectué. Ce concert a eu lieu au Conservatoire National Supérieur de Musique et de Danse de Paris le 2 avril 2008 dans la salle d’orgue du Conservatoire, pour la création mondiale avec viole d’amour, du deuxième quatuor à cordes de Leoš Janáček, Lettres intimes, par Sylvie Gazeau, Sébastien Richaud, Pierre- Henri Xuereb et Jérôme Perno.

Cet enregistrement ayant eu pour finalité la création d’un DVD, il m’a été demandé d’assurer la direction artistique (musicale) ainsi que le montage son du concert, en relation avec les musiciens. Un schéma du dispositif de captation est disponible en annexe.

Le montage audio terminé, l’enregistrement a par ailleurs fait l’objet d’une diffusion sur France-Musique, dans le cadre de l’émission « Miniatures » consacrant une semaine à la viole d’amour et aux instruments rares, du 5 janvier au 9 janvier 2009.

Nous avons ensuite sélectionné un extrait d’une durée de deux minutes et quarante- cinq secondes environ, dans le but de replacer le sujet dans une situation d’écoute proche d’une expérience ordinaire. Puis nous avons inséré quelques défauts les plus fréquemment rencontrés lors de l’étape de montage : points de montage difficiles, un défaut technique du signal, des problèmes de niveaux sonores. Ces défauts sont distribués séquentiellement, à des intervalles de temps différents pour éviter les effets de régularité, et pour donc éviter que les sujets s’attendent à percevoir un défaut à un instant donné.

3.3 Dispositif utilisé pour le test

Nous avons disposé de la régie de la salle interdisciplinaire (ex-Maurice Fleuret) du CNSMDP. Celle-ci est équipée du logiciel Pyramix, qui permet via un synchroniseur virtuel de diffuser de l’image et du son de façon synchrone, tout en effectuant des modifications au niveau de notre session de travail.

Nous avions donc d’un côté la vidéo, sous la forme d’un fichier extrait d’un DVD- vidéo, et de l’autre le son enregistré grâce à notre dispositif de captation. Ce son avait par ailleurs déjà fait l’objet d’un montage, comme indiqué dans la section précédente.

Les enceintes de cette régie sont des enceintes Skiff du constructeur Cabasse⁵.

3.4 Protocole de test

Nous nous attachons à détecter les seuils de détection des défauts sonores, avec ou sans image. Il s’agira donc de faire varier la « qualité » de ces défauts, de « pas du tout perceptible » à « très nettement perceptible », et de relever les réponses ou non-réponses des sujets, dans une situation avec image, puis sans image.

Après une expérience préliminaire qui a surtout pour but de familiariser le sujet avec le contexte de l’expérience, nous procédons donc au visionnage d’un extrait de 2’45 », présenté à cinq reprises. À chaque écoute, la « qualité » des défauts se voit dégradée⁶.

Nous avons successivement :

un crossfade dont le temps s’allonge de quelques millisecondes à plus de deux secondes au fur et à mesure des extraits,
un deuxième fade dont le temps se raccourcit jusqu’à être quasiment égal à zéro,
un clic numérique dont le niveau augmente par pas de trois décibels,
un troisième fade qui s’allonge jusqu’à une valeur moyenne,
une baisse de volume qui s’amplifie sur une note de violoncelle,
une désynchronisation,
une baisse de volume au niveau des trois accords de fin.

Après ces cinq écoutes, nous revenons à un extrait précédent pour vérifier l’effet de mémoire et si besoin ajuster la valeur de seuil détectée pour chacun des défauts. Nous avons donc rediffusé généralement l’extrait 2 ou 1, après cela, nous procédons à la diffusion du son seul de ce même extrait pour tenter de quantifier l’influence de l’image sur la perception du son. En d’autres termes, nous essayons par ce moyen de voir si l’on détecte mieux certains défauts en ôtant la vidéo lors de la diffusion.

Schéma du déroulement de la première partie de l'expérience — Schéma du déroulement de la première partie de l’expérience

Enfin, nous procédons à la dernière phase de l’expérience. Ici, nous nous attardons sur de plus courts extraits, là où les sujets n’ont pas détecté les défauts. La méthode utilisée est alors de diffuser successivement le même extrait de quelques secondes avec l’image, puis sans l’image.

Une telle expérience s’avère beaucoup plus difficile à monter qu’il n’y paraît. En effet, la mise en place de celle-ci dépend entièrement de la propre perception de la personne qui l’élabore. Ainsi il convient de faire particulièrement attention à ce que les défauts inclus puissent être à un moment donné suffisamment perceptibles pour chacun, ce qui est difficilement évaluable à l’avance.

3.5 Type de population testé

Nous avons choisi une population d’ingénieurs du son et directeurs artistiques, qui par leur métier sont experts du type de produit que représentent le DVD ou le CD audio. Ce sont eux qui abaisseront les seuils et qui détermineront ainsi la qualité minimum à atteindre.

Experts au niveau du son en tant que matériau sonore, les ingénieurs du son sont directement impliqués dans l’étape de post-production qui nous intéresse. En étant directeurs artistiques, ils ont l’avantage de pouvoir être également des musiciens de bon niveau et d’être par conséquent des experts musicaux de confiance. Ils sont les premiers à intervenir sur le montage et constituent donc un « filtre perceptif », en abaissant les seuils de détection. Nous faisons en effet l’hypothèse que les personnes non formées et non familières de ce type de travail ont des seuils de détection plus élevés, et que leur tolérance aux défauts sonores est plus forte.

3.6 Validité écologique et conditions de test

Nous nous attachons à ce que les extraits présentés et le contexte de l’expérience soient écologiquement valides, c’est-à-dire proches d’une situation naturelle, pour que les sujets répondent de façon comparable à la réalité. Ainsi, nous pourrons transposer les résultats obtenus en laboratoire à des situations réelles.

Dans un premier temps, le type de matériau choisi (concert filmé) présente une validité écologique. En effet, ayant déjà fait l’objet d’une exploitation réelle en vue de la production d’un DVD ou d’un CD audio, il est assez aisé de se replacer dans un tel contexte pour un ingénieur du son comme pour un musicien, puisqu’ils interviennent tous deux en amont de la diffusion du produit.

Dans un second temps, nous apporterons une attention toute particulière à la longueur du ou des extraits choisis. En effet, la tâche à accomplir n’est pas du tout la même selon que l’on demande à un technicien un « contrôle qualité » ou un travail de montage. En effet, ce dernier nécessite d’écouter et de réécouter souvent de courts extraits, en modifiant certaines propriétés. De plus, une grande concentration, une grande attention est demandée, mais sur de brefs passages, ce qui renforce l’effet de mémoire.

Le « contrôle qualité », qui lui demande l’écoute de longs extraits, se rapproche d’une situation d’écoute domestique, à la différence qu’il nécessite une forte mobilisation de notre attention soutenue, et que l’écoute se déroule dans une régie audiovisuelle professionnelle.

Nous plaçons ainsi les sujets dans un contexte de « contrôle qualité ». C’est pourquoi nous avons sélectionné des extraits plutôt longs, que nous diffusons dans une régie de taille modeste, reproduisant le plus fidèlement possible des conditions naturelles de travail. La régie est équipée d’un écran de 19 pouces, ainsi que d’une paire d’enceintes Cabasse.

3.7 Choix de la consigne

Nous avons choisi de donner une consigne ouverte. En effet, en effectuant l’expérience sur une population d’ingénieurs du son, nous pouvons nous attendre à ce qu’ils ne jugent que le son du produit audiovisuel qui leur est présenté. Cependant, il nous a paru également intéressant de pouvoir leur laisser la liberté de nous indiquer les incongruences perçues entre la vidéo et le son, c’est-à-dire de nous dire à quel moment et en quoi la vidéo pouvait être en incohérence avec le son. Pour indiquer à quel moment le sujet perçoit un défaut, il lui suffit d’appuyer sur une touche de son clavier AZERTY pour placer un marqueur au curseur, pendant la diffusion de l’extrait.

Le point sur lequel nous avons particulièrement insisté lors de la phase de test a été de ne pas fermer les yeux pendant le visionnage de la vidéo. En effet, notre travail étant basé sur la relation du visuel avec l’audition, le fait de fermer les yeux revient à écouter la bande sonore seule, chose qui est effectuée uniquement à la fin du test pour comparer avec les résultats obtenus lors du visionnage « complet » (son et image).

Partie III : Résultats et discussion

1. Introduction

Douze sujets ont pu nous prêter quarante-cinq minutes de leur temps pour se soumettre aux tests de perception décrits dans la partie précédente. Ce sont tous des musiciens-ingénieurs du son experts dans le type de produit que nous présentons.

Évidemment, la faible quantité de sujets ne nous permettra pas de tirer des conclusions générales. Nous nous efforcerons cependant de dégager quelques indices concernant les seuils de perception dans une telle situation d’écoute et de travail.

Nous tenterons également de trouver un mode de représentation pertinent des résultats obtenus pour les différentes parties de l’expérience, et de classifier les types de problèmes en fonction des réponses obtenues.

2. Résultats généraux

Nous pouvons remarquer dans un premier temps que les résultats obtenus ne sont pas ceux que l’on attendait. En effet, alors que de nombreuses personnes confirment notre hypothèse de l’atténuation ou même la disparition des défauts sonores avec l’ajout de l’image, ce phénomène a été ici difficilement quantifiable, et même difficilement démontrable.

Il apparaît ainsi que la plupart des personnes testées ne perçoivent pas les points de montage, que ce soit avec ou sans vidéo. Il en va de même pour les variations de volume sonore. Nous essaierons d’en dégager les raisons ultérieurement.

Nous pouvons toutefois mettre en évidence quelques indices, quelques données qui ne peuvent évidemment pas s’appliquer à la majorité des personnes, mais qui pourraient être approfondies dans le cadre d’une thèse par exemple.

Moyenne des seuils de perception des défauts sur la séquence longue.

L’absence d’histogramme signifie qu’aucune ou trop peu de personnes ont pu percevoir le défaut, même à son intensité maximale.

Nombre de personnes ayant perçu les défauts.

Les histogrammes précédents nous montrent respectivement les seuils de perception moyens des défauts sur la séquence vidéo longue, ainsi que le nombre de personnes ayant perçu chaque défaut, avec image sur la séquence longue, avec image sur les séquences courtes et longues, puis avec et sans image sur toutes les séquences. Cette troisième indication nous montre si le défaut est globalement perçu ou non, et donc si les réponses sont pertinentes ou non pour ce test.

Nous voyons donc clairement qu’avec l’image, les crossfades ne sont pas perçus. On considère ainsi que la réponse de l’unique personne ayant repéré le premier défaut et ce dès la première séquence constitue une exception dans les résultats de ce test.

Nous pouvons dans un second temps considérer que les résultats concernant la perception du clic numérique constituent un élément pertinent. Nous étudierons le phénomène et analyserons plus précisément ces résultats dans un paragraphe ultérieur.

Dans un troisième temps nous pouvons observer des résultats analogues dans le domaine du volume sonore. Il est donc a priori possible de regrouper ces deux défauts en une même famille, d’autant plus que le même type de défaut est appliqué.

Enfin, nous pourrons parler brièvement de la désynchronisation. Nous pouvons remarquer une absence de données sur le deuxième diagramme pour ce défaut. Ceci est volontaire. En effet, pour des problèmes de temps, nous n’avons pas re-testé ce défaut sur une séquence courte et pour finir, le nombre total de personnes ayant perçu ce défaut est le même dans tous les cas (avec ou bien avec + sans vidéo), puisque ce défaut ne peut pas être perçu en l’absence de l’une des deux informations. C’est un défaut purement multimodal, comme nous l’indiquions en deuxième partie.

3. Résultats détaillés

3.1 Perception des points de montage

Nous avons vu grâce aux diagrammes précédents qu’en général, les sujets n’ont pas perçu les points de montage dans la séquence longue de presque trois minutes. C’est pourquoi nous ne pouvons pas évaluer le seuil de perception de ces points de montage.

De plus, ces mêmes points de montage ont été assez peu repérés lors d’une présentation de plus courtes séquences alors même que les attentes des sujets étaient motivées par la consigne. En effet, ceux-ci étaient sûrs de la présence d’un défaut dans ces passages d’une dizaine de secondes.

En revanche, il se trouve que quelques sujets ont tout de même perçu le défaut lorsqu’on les prive de l’image. Ils sont ainsi trois de plus à avoir perçu le point numéro un (Fade Long), deux de plus pour le point numéro deux (Fade Court), et un pour le troisième point (Fade Moyen).

Ainsi, nous ne pouvons pas clairement mesurer les seuils de perception de ce défaut, mais les résultats nous indiquent que la capacité de perception de ces points de montage est accrue lorsque l’on prive les sujets de la vidéo. En d’autres termes, nous avons ici un indice qui nous permettrait de confirmer notre hypothèse de l’atténuation de la perception lorsque celle-ci est partagée entre les deux modalités audition et vision.

3.2 Perception du « Clic »

Nous pouvons voir ici que la totalité des sujets a perçu cet artefact. Nous pouvons ainsi établir une moyenne des seuils de perception avec vidéo pour ce test sur la séquence longue. Le clic numérique est perçu à partir du troisième visionnage de la séquence, ce qui correspond à un niveau de dégradation supérieur.

Nous pouvons remarquer pour certains sujets l’apparition d’un phénomène d’hystérésis. En effet, comme nous l’avons précisé dans notre première partie, nous cessons de percevoir plus tard que nous ne commençons (Binet, 1894).

Exemple de résultat pour le défaut "clic" avec apparition d'un phénomène d'hystérésis. (Sujet B) — Exemple de résultat pour le défaut « clic » avec apparition d’un phénomène d’hystérésis. (Sujet B)

Le sujet a un seuil croissant au quatrième extrait, mais en redescendant, il perçoit le défaut jusqu’au deuxième.

En observant les résultats complets pour ce défaut, nous remarquons également une légère influence de la vision sur l’audition, puisque deux sujets ont une meilleure perception du clic lorsque l’on enlève l’image. Nous ne pouvons là encore pas généraliser, mais ceci peut constituer une piste à creuser en effectuant d’autres expérimentations uniquement sur ce défaut.

Résultats complets (11 sujets) pour le défaut "clic". — Résultats complets (11 sujets) pour le défaut « clic ».

Nous voyons que pour deux sujets le seuil de perception est inférieur lorsque seul le son de la séquence est diffusé (cf. flèches sur le graphique).

Nous pouvons également ajouter qu’un sujet n’a jamais perçu le clic lors du visionnage de la séquence longue, et que lors de la diffusion d’une séquence plus courte, le défaut est perçu uniquement lorsque l’image est absente.

Nous avons donc trois sujets (soit 25 %) dont les performances sont améliorées lorsqu’ils ont la possibilité de ne prêter attention qu’à la bande sonore.

3.3 Perception des variations de volume

Nous pouvons remarquer que les personnes ayant participé à l’expérience sont en moyenne plus sensibles aux variations de volume sonore, comme les phénomènes de « pompage », par exemple, qu’aux points de montage.

En outre, il est important de remarquer que la moitié des sujets perçoit ce défaut uniquement lorsque l’image est absente, ce qui constitue là encore un indice qui nous permettrait de confirmer notre hypothèse de départ pour cette expérience, si le nombre de sujets était suffisant.

Résultats pour le défaut "volume fin", Sujet A. — Résultats pour le défaut « volume fin », Sujet A.

Résultats pour le défaut "volume fin", Sujet J. — Résultats pour le défaut « volume fin », Sujet J.

Les deux courbes précédentes nous indiquent encore une fois que pour trois sujets, le seuil de perception de ces variations de volume est inférieur lorsque l’image est absente, ce qui rejoint notre remarque précédente quant au nombre important de sujets (8 sujets) ayant perçu le défaut uniquement lorsque l’image est absente.

Nous pouvons donc noter encore une fois que l’image semble avoir une certaine influence sur les seuils de perception des défauts sonores lors du visionnage d’une séquence audiovisuelle.

3.4 Perception de la désynchronisation

Bien que ce ne soit pas le point central du sujet, il nous a semblé intéressant d’inclure ce défaut dans la séquence, puisque celui-ci est apparu pendant la production du DVD. En effet, après avoir effectué le montage son, et après avoir ajouté la vidéo, nous avons eu besoin de visionner le montage une petite dizaine de fois avant de repérer cette désynchronisation qui intervient sur un seul des instrumentistes.

Il s’agit d’un passage musical dans lequel le second violon joue en pizzicati, et le premier violon, arco. Il s’est alors produit la chose suivante : nous avons corrigé ce passage en insérant dans la bande sonore un extrait de la répétition générale. Nous avons pu alors parfaitement recaler les pizzicati du second violon, mais nous avons remarqué seulement après quelques visionnages que les deux violons n’avaient pas joué avec le même synchronisme entre la générale et le concert.

La séquence choisie nous montre les deux violonistes. A ce moment, pour le second violon, le son est parfaitement synchrone avec l’image. Cependant, il apparaît que le premier violon ne l’est pas du tout.

Le phénomène a été repéré par la moitié de nos sujets et ceci aux alentours de la troisième diffusion, ce qui confirme notre propre expérience du phénomène.

De plus, nous mettons en évidence une hystérésis importante. Lorsque le défaut a été repéré une première fois, les sujets l’identifient à chaque fois ensuite.

Dans la mesure où ce défaut ne faisait pas partie de nos intérêts premiers, nous n’avons pas effectué d’expériences concernant la mesure des seuils pour la désynchronisation. Il serait néanmoins très intéressant de pouvoir déterminer à partir de quel moment le défaut devient déstabilisant.

Exemple de phénomène d'hystérésis pour la désynchronisation, sujet A. — Exemple de phénomène d’hystérésis pour la désynchronisation, sujet A.

Exemple de phénomène d'hystérésis pour la désynchronisation, sujet J. — Exemple de phénomène d’hystérésis pour la désynchronisation, sujet J.

4. Interprétation des résultats et discussion

Nous allons émettre ici quelques hypothèses pouvant éclaircir les résultats obtenus. Il s’agira d’explorer quelques pistes qui nous permettent de comprendre comment fonctionne notre perception dans une telle situation multimodale. Nous essaierons en outre de dégager quelques pistes interprétatives sur le rôle que jouent les mécanismes cognitifs et les mécanismes de l’attention.

4.1 Différents niveaux de perception

Dans la situation précise que nous avons décrite, nous pouvons repérer plusieurs niveaux de perception. La connaissance de ceux-ci pourra nous donner quelques informations à propos des procédés attentionnels mis en œuvre.

Au même niveau, nous avons la perception auditive combinée avec la perception visuelle lorsque l’image nous est présentée avec le son. Il s’agit ici du niveau le plus basique de la perception, avant que ces éléments ne fassent sens.

Ce que nous avons vu concernant la cognition prend ensuite toute son importance. En effet, à un niveau supérieur, les informations provenant des deux modalités audition et vision sont alors mises en relation. Une certaine signification est attribuée au message. C’est à ce moment-là que nous pouvons appréhender cette situation de concert retransmis par l’intermédiaire d’un écran et de haut-parleurs.

Deux types de perception différents agissent ensuite en parallèle : nous avons d’un côté notre perception de la musique, du concert à proprement parler, et de l’autre côté notre perception « technique », selon la consigne qui nous a été indiquée. Ici, il s’agissait donc de détecter d’éventuels problèmes au niveau du son ou même de l’image.

4.1.1 Perception musicale dans cette situation

Notre perception musicale nous permet d’apprécier la relation des instruments entre eux, l’harmonie, la mélodie, etc. Elle nous permet également de ressentir un certain nombre d’émotions en fonction de la sensibilité de chacun. De plus, comme nous l’avons vu dans le troisième chapitre de notre première partie (III – Multimodalité), nous savons que les stimuli à la fois visuels et sonores ont pour effet une augmentation de nos réactions et de nos émotions (Levitin D., 2007).

Le montage vidéo peut influencer également la perception. Selon les plans choisis par le réalisateur, notre attention peut être dirigée vers une partie seulement des instrumentistes. En mettant en relation notre perception visuelle avec notre perception

auditive de la musique, nous pouvons alors percevoir plus distinctement telle ou telle partie de la partition.

4.1.2 Perception « technique » dans cette situation

Pendant qu’une partie de notre système cognitif nous permet de percevoir la musique et d’en ressentir des émotions, une autre nous permet, selon la consigne demandée, d’évaluer la qualité d’un produit. Il s’agit donc de repérer des éléments souvent brefs, peu perceptibles, que nous avons appris à reconnaître et à qualifier, grâce à nos connaissances spécifiques et notre savoir-faire d’ingénieur du son. Ainsi, là où une personne inexpérimentée pourra soit ne rien percevoir, soit ressentir un malaise sans pouvoir l’exprimer, les ingénieurs du son ont la capacité de pouvoir qualifier, interpréter, et exprimer ce qu’ils ont perçu grâce au langage.

Il s’agit donc d’essayer de faire abstraction des messages musicaux pour se concentrer sur le signal lui-même. Cependant, il n’est pas rare que les défauts possibles aient un certain rapport avec la musique. Les points de montage en sont typiquement l’exemple.

Ici, le seul élément qui n’ait aucun rapport avec la musique et qui relève de l’évaluation de la qualité purement technique du signal est le « clic ». Notre système perceptif l’analyse donc comme un élément étranger. C’est d’ailleurs l’élément le plus facilement détecté dans notre expérience.

4.2 Détection des défauts en rapport avec la musique – première interprétation

À partir de quels critères pouvons-nous juger de la mauvaise qualité d’un point de montage ? Il s’agit essentiellement de repérer les discontinuités. En effet, le point de montage parfait est celui qui ne s’entend pas, en d’autres termes, ce passage d’une prise à une autre s’effectue le plus naturellement possible, comme si ces deux éléments faisaient partie d’un même tout.

Dans notre situation, les discontinuités relèvent essentiellement d’une écoute plutôt technique (problème de raccord entre les timbres des instruments, différence d’image sonore…), puisque le son et l’image sont sensés être synchrones tout au long de la séquence.

Cependant, l’image du concert, dans laquelle nous pouvons percevoir une unité de lieu et de temps, nous apparaît continue. Et même dans le cas de plusieurs prises, le fait de voir le même décor, les mêmes costumes, les mêmes éléments nous font accepter sans aucun problème la continuité de la situation. C’est l’illusion qui est créée au cinéma, même si chacun a pu appréhender ce phénomène en voyant des films dès son plus jeune âge.

Nous effectuons alors une première hypothèse concernant la non-perception de ces points de montage avec la vidéo : le synchronisme entre le son et la vidéo fait que l’on

considère ces deux éléments comme un tout. De plus, l’image étant supposée continue, il n’y a donc aucune raison pour que le son ne le soit pas pour notre système cognitif.

Cette hypothèse part donc du principe que la non-perception des défauts lorsque l’image est présente, relève de mécanismes cognitifs, et plus précisément de processus top- down et bottom-up.

4.3 Hypothèse d’un masquage attentionnel

Notre deuxième hypothèse concernant l’explication de la non-perception, ou du moins la moins bonne perception des défauts sonores lorsque nous ajoutons une information visuelle, repose sur les mécanismes attentionnels mis en œuvre.

En effet, comme nous l’avons sous-entendu précédemment, pour détecter les défauts sonores, il faut prêter attention à la bande sonore. Or, notre attention est ici perturbée par l’image, qui joue alors le rôle de distracteur.

Un élément supplémentaire vient s’ajouter à cela. Il s’agit, comme nous l’avons décrit, de la signification du message, et donc de la perception musicale que nous avons de l’extrait. Nos émotions et nos attentes musicales jouent elles aussi un rôle de distracteur. Pourtant, elles font partie intégrante de la perception de ce concert retransmis.

Nous avons donc un distracteur perceptif, constitué par l’image, et un distracteur que l’on peut qualifier de « cognitif », qui résulte de notre perception et de notre ressenti de la musique.

Notre attention est donc partagée entre deux modalités, certes, mais surtout entre trois voire quatre éléments (son, image, musique, émotions). Il n’est donc pas chose aisée de détecter des défauts dans ces conditions. De plus, la situation principale fait appel à notre attention soutenue, ce qui rend encore plus difficile la tâche de détection.

Nous pouvons donc faire l’hypothèse que la non-perception des défauts sonores résulte d’un masquage attentionnel provoqué par l’ajout de l’image qui renforce alors nos émotions et notre perception de la musique.

Mais alors, comment expliquer le fait que les points de montage ne sont pas perçus même lorsque l’on ôte l’image?

Nous pouvons avancer un élément de réponse en remettant en cause notre expérience. En effet, comme nous l’avons indiqué précédemment, celle-ci dépend fortement de la propre perception de l’expérimentateur. Il est donc possible qu’en ayant travaillé beaucoup sur ce montage, nous avons mémorisé chaque caractéristique des points de montage, et que nous avons été trop optimistes sur les seuils. Mais si ce n’était pas le cas ? Nous avons tous au moins une fois fait l’expérience d’écouter un montage en fermant les yeux et en se détachant de notre travail. Par miracle, les points montages que l’on pouvait trouver perfectibles ne s’entendent plus. Que se passe-t-il alors ?

4.4 Attention soutenue et attentes

Là encore, nous pouvons faire l’hypothèse que la non-perception des défauts dans une même modalité relève des mécanismes de l’attention.

En effet, comme nous l’avons précédemment indiqué, l’écoute d’une longue séquence dans un but de « contrôle qualité » mobilise notre attention soutenue, ce qui rend la tâche de détection plus difficile. Fondamentalement, il reste possible que des défauts soient présents, mais ce n’est pas certain. De plus, nous n’avons aucun moyen de savoir ni de prévoir à quels moments peuvent survenir ces défauts.

Nous ajouterons également que dans certains cas, nous pouvons percevoir un point de montage par exemple là où il n’y en a pas. Ceci peut arriver lorsque nous percevons un bruit « parasite » qui nous fait donc penser à un tel défaut.

Une personne qui écoute un montage pour la première fois ne connaît jamais le plan de montage. À aucun moment celle-ci ne sait quand plusieurs prises s’enchaînent l’une à l’autre. Les attentes du sujet sont donc modifiées dans ce cas. En effet, n’ayant pas repéré à l’avance où peuvent se situer les points « critiques », le sujet n’a pas d’attente concernant ces points, contrairement à quelqu’un qui a travaillé des heures sur le montage. La perception n’est donc à aucun moment influencée par des indices extérieurs.

Il en résulte que sur un long extrait sonore, les défauts du type « mauvais point de montage » sont difficiles à détecter pour quelqu’un qui n’a pas travaillé sur le projet auparavant, et qui donc n’a pas mémorisé le plan de montage ainsi que les points critiques.

On peut cependant remarquer que lorsque nous présentons la session de montage aux sujets, et que ceux-ci visualisent les points de montage, la perception de ces derniers devient absolument flagrante. Les effets d’attente sont rétablis, puisque l’on voit le curseur défiler et s’approcher des points. De plus, la visualisation de la session de travail nous replace dans un contexte d’écoute technique, avec l’environnement adéquat. Il est donc plus aisé de se détacher de la musique et de concentrer uniquement sur ce qui nous intéresse.

4.5 Notes sur le problème du « playback »

Au cours de productions sur lesquelles j’ai pu travailler au studio EtLaNuit à Montreuil, j’ai été chargé d’effectuer le montage musical d’un moyen-métrage de la réalisatrice sénégalaise Dyana Gaye. Il s’agit précisément d’une comédie musicale.

Il m’a donc été donné de travailler sur le problème du playback. Après avoir enregistré la musique, les comédiens ont dû tourner les scènes en playback. Après le montage image, il m’a fallu recaler plus précisément les voix en fonction de l’image.

Ce travail m’a donc permis de réfléchir sur le problème du playback, et de l’intention musicale, qui peut différer entre le son et l’image. La difficulté du problème réside alors dans le fait de faire correspondre les deux composantes.

Dans un premier temps, j’ai pu m’apercevoir que les tolérances temporelles qui sont communément admises au niveau du synchronisme son-image se retrouvent fortement réduites lorsque cela concerne un contenu musical. En effet, lorsque la musique rentre en jeu, et que de plus elle devient l’acteur principal du film, nous avons besoin d’être en parfaite synchronie.

Dans un second temps, j’ai pu également travailler au niveau des intentions des chanteurs. Il n’a pas été rare de voir que par exemple les ouvertures de bouche sur les voyelles diffèrent entre image et son (par exemple, un /a/ qui apparaît plus « ouvert » à l’image qu’au son). Ceci contribue fortement à un playback « qui se voit », à un effet inverse de celui recherché qui est d’amplifier la perception de la musique.

Conclusion

Au cours de ce travail, nous avons pu comprendre les mécanismes de la perception d’un point de vue psychologique et cognitif. En effet, bien qu’ayant une bonne connaissance du fonctionnement physiologique de nos mécanismes sensoriels, cette connaissance ne peut pas à elle seule expliquer tous les procédés de la perception.

Nous avons étudié notamment un cas de perception multisensorielle dans une situation courante de notre métier d’ingénieur du son – directeur artistique, et nous avons vu que les informations transmises sont très nombreuses, et qu’il était difficile d’élaborer un protocole expérimental, du fait que tous les éléments sont imbriqués et s’influencent les uns les autres. Il a fallu en outre prévenir les effets cognitifs pouvant influencer les résultats, tels que les effets de mémoire ou d’attente.

Nous avons cependant pu vérifier grâce à quelques sujets qu’il semble bien exister une influence de l’image sur la perception du son et des défauts sonores. Encore une fois, il ne s’agit pas ici de généraliser mais de trouver quelques indices pouvant confirmer notre hypothèse de départ. Il en ressort ainsi qu’il semble que les seuils de détection des défauts sonores soient plus élevés lorsque l’image est diffusée avec le son.

En outre, nous avons pu remarquer que la perception des mauvais points de montage dans notre expérience est presque nulle, même lorsque nous diffusons que le son. Il semble donc que leur détection devient très difficile sur de longues périodes, et lorsque les effets d’attente sont inhibés.

Nous avons enfin pu faire plusieurs hypothèses pouvant expliquer l’influence de l’image sur le son, et du contenu sur le son : une première hypothèse qui relève du traitement cognitif de l’information, où nous avons donc un masquage du défaut par l’information et les émotions que celle-ci suscite ; et une seconde hypothèse qui relève plus simplement d’un masquage attentionnel, dans la continuité des travaux qui ont été effectués sur l’attention au cours de l’Histoire.

Il serait intéressant de pouvoir creuser ces deux hypothèses en réduisant encore notre champ d’action. L’étude de tels phénomènes peut cependant poser de nombreuses difficultés et demande l’élaboration de protocoles expérimentaux très maîtrisés et sophistiqués pour savoir si l’une ou l’autre de nos hypothèses est valide ou non.

Remerciements

Je tiens à remercier en premier lieu Corsin Vogel, qui a assuré la direction de mon mémoire, et qui a su parfaitement m’aiguiller et me rassurer dans les moments de doute.

Je remercie également chaleureusement Danièle Dubois, du laboratoire Langages, Cognitions, Pratiques, Ergonomie, qui a assuré la co-direction de mon mémoire, et Caroline Cance du Laboratoire d’Acoustique Musicale, pour leur regard critique et leur aide ô combien précieuse.

Merci également à Hugues Genevois, du Laboratoire d’Acoustique Musicale, qui m’a conseillé lors de l’élaboration de mon sujet.

Un grand merci à toute l’équipe pédagogique de la FSMS, Daniel Zalay, Georges Bloch, Catherine Barbe et Philippe Lafargue (une pensée particulière pour Didier Salles), ainsi que Catherine de Boishéraud et toute l’équipe du Centre Audiovisuel.

Je tiens à remercier ma famille, mes amis, toutes les personnes qui ont été à mes côtés au cours de ces quatre années.

A ces personnes qui m’ont soutenu pendant les moments difficiles, je ne vous remercierai jamais assez.

J’aimerais remercier toutes les personnes qui se sont prêtées au jeu de l’expérience, et sans qui il m’aurait été impossible de mener ce travail à son terme.

Bibliographie

BERTRAND, A., GARNIER, P.-H. Psychologie Cognitive. Levallois-Perret : Studyrama, 2005.

BINET, A. Introduction à la psychologie expérimentale. Paris : L’Harmattan, 2006 (1894).

BROADBENT, D. Perception and Communication. London: Pergamon Press, 1958.

BRUNER, J.S. On perceptual readiness. Psychol Rev., 1957, n°64, 123-152.

CALVER, G., SPENCE, C., STEIN, B. E. The hand book of multisensory processes. Cambridge : MIT Press, 2004.

CAMUS, J.-F. La psychologie cognitive de l’attention. Paris : Armand Colin ed., 1996.

DELORME, A., FLÜCKIGER, M. Perception et Réalité : une introduction à la psychologie des perceptions. Bruxelles : DeBoeck Université, 2003.

DUMAURIER, E. Psychologie expérimentale de la perception. Paris : PUF, Le Psychologue, 1992.
FECHNER, G.T. Elemente der Psychophysik. Leipzig : Breitskopf and Härtel, 1860.
GODEFROID, J. Psychologie : science humaine et science cognitive. Bruxelles : De Boeck Université, 2001.

GIBSON, J.-J. The Senses Considered as Perceptual Systems. Boston: Houghton Mifflin, 1966.
GUASTAVINO, C. (2003).Etude sémantique et acoustique de la perception des basses fréquences dans l’environnement sonore urbain. (Thèse de doctorat – LAM, Paris VI).

HEAD, H. The conception of nervous and mental energy : II. Vigilance : A physiological state of the nervous system. British Journal of Psychology. 1923, n°14, p. 126-147.

JAMES, W. Attention. The Principles of Psychology, 1890, Vol 1, Chap. 11, p. 403-404.

KAHNEMAN, D. Attention and Effort. Englewood Cliffs, NJ : Prenticehall, 1973.

LEMAIRE, P. Abrégé de psychologie cognitive. Bruxelles : De Boeck, 2006.
LEVITIN, D., CHAPADOS C. Cross-modal interactions in the experience of muscial performances : Physiological correlates. Cognition. 2007, n°108. p. 638-651.
LOCKE, J. Essai sur l’entendement humain. Paris : Vrin, 2001 (1690).
MCADAMS, S., BIGAND E. Penser les sons, psychologie cognitive de l’audition. Paris : PUF, Psychologie et Sciences de la Pensée, 1994.

MCGURCK, H., MACDONALD, J. Hearing Lips and Seeing Voices. Nature. 1976, n° 264, p. 746-748.

MOLYNEUX, W. Correspondance, 1688.

NATHANAIL, C. (1999). Influence des informations visuelles sur la perception auditive : conséquences sur la caractérisation de la qualité acoustique des salles. (Thèse de doctorat – LAM, Paris).

NEISSER, U. Cognitive psychology. New York : Appleton-Century-Crofts, 1967.

PERETZ, I. Les agnosies auditives: une analyse fonctionnelle. in MCADAMS, S., BIGAND E. Penser les sons, psychologie cognitive de l’audition. Paris : PUF, Psychologie et Sciences de la Pensée, p. 215-248, 1994.

PERETZ, I. Modularity of Music Processing. Nature Neurosciences. 2003, vol 6, p. 688-691.
PIAGET, J. Le développement mental de l’enfant. dans Six Etudes de Psychologie. 1940, folio essais, n°71, p.11-101.
PINEAU, M., TILLMANN, B. Percevoir la Musique : Une Activité Cognitive. coll. Sciences de l’Education Musicale. Paris : L’Harmathan, 2001.

PROPER, D. Mastering for Multichannel. Workshop, AES 126th Convention, Munich, 2009.

QUINLAN, P., DYSON, B. Cognitive Psychology. Harlow/New York, Pearson/Prentice Hall, 2008.

ROULIN, J.-L. Psychologie Cognitive. Rosny : Bréal, coll. Grand amphi Psychologie, 2006.

ROY, S., NATTIEZ, J.-J.L’analyse des musiques électroacoustiques : Modèles et propositions. Paris : L’Harmattan, 2004.

TREISMAN, A. Contextual cues in selective listening. Quarterly Journal of Experimental Psychology. 1960, n°12, p.242-248.

VIOLLON, S. (2000) Influence des informations visuelles sur la caractérisation de la qualité acoustique de l’environnement urbain. (Thèse de doctorat – LAM, Paris VI).

VOGEL, C. (1999) Etude sémiotique et acoustique de l’identification des signaux sonores d’avertissement en contexte urbain. (Thèse de doctorat – LAM, Paris VI).
WATSON, J.Psychology as the Behaviorist Views it. Psychological Review. 1913, n°20, p.158- 177.
WEIL-BARAIS, A. L’homme cognitif. Paris : PUF, coll. Premier Cycle, 1993.
WERTHEIMER, M. Untersuchungen zur Lehre der Gestalt, II. Psychologische Forschung 1923, n°4, p. 301-350.
WICKENS, C. D. Processing resources in attention. In R. Parasuraman & D. R. Davies (Eds.),Varieties of attention. 1984, Orlando, Fl : Academic, p. 63-102.

Bibliographie complémentaire

ALLPORT, G. Becoming : basic considerations for a psychology of personality. New Haven : Yale University Press, 1955.

BAILBLE, C. (1998). L’image frontale, le son spatial. in Beau, F., Dubois, P., Leblanc, G.

Cinema et dernières technologies. Paris : De Boeck & Larcier, 1998.

BAILBLE, C. (2003). Le réel, le sonore et l’imaginaire auditif. Dossiers de l’Audiovisuel. 2003, n°109.

PAVLOV, I. P.Conditioned reflexes. London : Routledge and Kegan Paul, 1927.

POIRIER, A., BOUKOBZA, J.-F., XUEREB, P.-H., STRANSKA, L., SRNKA, M. Leos Janacek,

Lettres intimes, quatuor à cordes n°2. Fascicule, programme de concert, CNSMDP, Paris, 2008.

SKINNER, B. F. Science and human behavior. New York: Macmillan, 1953.

THORNDIKE, E. Educational Psychology : The Psychology of Learning. New York : Teachers College Press, 1913.

Annexes

Annexe A.

Dispositif de captation du concert ayant servi de support à l’expérience

Nous disposions pour cette captation d’une équipe vidéo avec 3 caméras, et d’une équipe son. Le principe même du concert filmé nous a quelque peu imposé le système de prise de son et son emplacement, de façon à ce que celui-ci ne se voie pas.

Le quatuor à cordes a donc été enregistré au moyen d’un couple suspendu de microphones Schoeps mk4V. Une réverbération artificielle a ensuite été ajoutée en post- production à l’aide du logiciel Altiverb.

Salle d’Orgue, Conservatoire National Supérieur de Musique et de Danse de Paris

Caractéristiques techniques des microphones utilisés (source : www.schoeps.de)

Capsules microphoniques MK 4V + amplificateurs microphoniques CMC 6, CCM 4V U, CCM 4V L

Bande passante :	40 Hz – 20 kHz
Sensibilité :	13 mV/Pa
Niveau de bruit de fond acoustique équivalent :	pondéré A: 14 dB-A
	CCIR: 24 dB
Niveau de signal/bruit (pondéré A) :	80 dB-A
Pression acoustique maximum (0,5% THD*) :	132 dB

*distorsion harmonique totale

Amplificateurs microphoniques CMC 5, 6 :

Type d’amplificateur	Alimentation	Intensité de courant	Impédance	Seuil de fréquence basse(-3 dB)
CMC 6U: commutation automatique	12 V fantôme	8 mA	25 Ohms	20 Hz
	48 V fantôme	4 mA	35 Ohms	20 Hz
CMC 5U:	48 V fantôme	4 mA	35 Ohms	30 Hz
Tension maximale de sortie:	1 V (pour 1 kHz et 1 kOhms de résistance de charge)
Résistance de charge conseillée:	600 Ohms (au valeurs inférieures, réduction notable du niveau de modulation)
Longueur:	116 mm (y compris 3mm de filetage pour la capsule)
Diamètre:	20 mm
Poids:	65 à 68 g (en fonction du type)
Surface:	gris anti-reflet (g) ou nickel (ni)

Annexe B.

Détail des valeurs de défauts ajoutés

Fade Long	Fade Court	Clic	Fade Moyen	Volume Violoncelle	Volume Fin
251,2 ms	501 ms	-42dB	211 ms	-2,5 dB	0 dB
398,1 ms	170,9 ms	-36 dB	265,7 ms	-3,8 dB	-3 dB
857,5 ms	107,8 ms	-30 dB	309,8 ms	-5,2 dB	-6 dB
1,6 s	92,4 ms	-24 dB	390 ms	-7,8 dB	-9 dB
2,9 s	34,1 ms	-18 dB	530 ms	-10,3 dB	-12 dB

Explication des défauts :

« Fade Long » : point de montage dont la longueur augmente au fur et à mesure des 5 écoutes, pour arriver au dédoublement de la source.

« Fade Court » : point de montage dont la longueur diminue au fur et à mesure des 5 écoutes, pour arriver pratiquement à une rupture sonore.

« Clic » : clic numérique rajouté et mélangé à la bande son suivant les valeurs ci-dessus.

« Fade Moyen » : point de montage dont la longueur augmente au fur et à mesure des 5 écoutes. Les différences de temps sont plus faibles que pour le « Fade Long »

« Volume violoncelle » : Variation de volume à un instant t de la séquance, qui ne comporte qu’une note de violoncelle, ainsi que la réverbération de l’accord précédent.

« Volume fin » : effet de pompage sur l’attaque des trois accords de fin. Une courbe de volume est appliquée de manière analogue sur les trois accords, en suivant les valeurs ci- dessus.

Annexe C.

Photographie de la régie ayant servi à l’expérience

Régie de l'espace interdisciplinaire (ex - Salle Maurice Fleuret) Conservatoire Nationale Supérieur de Musique et de Danse de Paris — Régie de l’espace interdisciplinaire (ex – Salle Maurice Fleuret) Conservatoire Nationale Supérieur de Musique et de Danse de Paris

Caractéristiques techniques des enceintes (source : www.cabasse.com)

Annexe D.

Copie du questionnaire ayant servi à l’expérience

Notes

voir THORNDIKE, E. Educational Psychology : The Psychology of Learning. New York : Teachers College Press,
1913. ↩︎
voir PAVLOV, I. P. Conditioned reflexes. London : Routledge and Kegan Paul, 1927. ↩︎
voir SKINNER, B. F. Science and human behavior. New York: Macmillan, 1953. ↩︎
voir ALLPORT, G. Becoming : basic considerations for a psychology of personality. New Haven : Yale University Press, 1955. ↩︎
Caractéristiques à l’annexe C. ↩︎
Valeurs complètes à l’annexe B. ↩︎

mai 20, 2026

La prise de son d’orchestre en Europe
Conservatoire National Supérieur de Musique et de Danse de Paris

Étude technique et esthétique

Par : Elsa Desjardins
Directeur de mémoire : Thomas Dappelo
Mai 2014

Formation Supérieure aux Métiers du Son

Résumé

Ce mémoire est l’aboutissement d’un travail de recherche mené dans le cadre du diplôme de la Formation Supérieure aux Métiers du Son du Conservatoire National Supérieur de Musique et de Danse de Paris. Les questions abordées sont celles de l’existence et de l’évolution de différentes écoles et traditions de prise de son d’orchestre depuis les débuts de la stéréophonie.

Des ingénieurs du son français, allemands et anglais ont été interrogés sur différents thèmes autour de la prise de son d’orchestre : les écoles esthétiques et techniques, les labels, leurs propres habitudes techniques et goûts esthétiques… Parallèlement à cette enquête, des écoutes analytiques d’enregistrements ont été menées afin de relier les différents aspects étudiés à des exemples sonores.

Après cela, un certain nombre de pistes de discussions différentes a pu être exploré et des réflexions ont été menées sur la notion d’esthétique de label et l’avenir de cette notion, la distinction entre les esthétiques de radio et de disques, le lien entre certaines habitudes de prise de son et les lieux d’enregistrement…

Remarques

Les citations en langue étrangère sont présentées en français, avec leur version originale en bas de page. Les traductions des citations, du questionnaire et des réponses aux questionnaires ont été réalisées par mes soins.

Les références bibliographiques sont présentées entre crochets, numérotées par ordre d’apparition. La bibliographie est consultable p.71.

Les extraits sonores proposés dans le CD joint sont référencés de la manière suivante : Piste n° 1

Les photos non créditées ont été réalisées lors de mes différents stages professionnels.

Introduction

Lors de mes études, j’ai entendu à plusieurs reprises l’évocation d’un son allemand qui s’opposerait à un son français, de l’identité sonore de certains labels, ou radios, etc. J’ai aussi pu observer, lors de productions à l’étranger et lors de discussions avec des étudiants Erasmus, que les microphones et techniques utilisés à l’étranger n’étaient pas toujours les mêmes qu’en France. Ceci m’a amenée à me poser la question de l’existence de différentes écoles ou traditions de prise de son. Mon expérience personnelle n’étant pas suffisante pour répondre à cette question, j’ai choisi d’étudier plus précisément cette thématique dans ce projet de recherche.

Que sont devenues les esthétiques et techniques des grands labels du début de la stéréophonie ? Existe-t-il aujourd’hui des écoles de prise de son ? Comment se caractérisent-elles ?

Pour ce faire, je me suis concentrée plus particulièrement sur la prise de son d’orchestre symphonique, car c’est une formation qui a fait l’objet d’un grand nombre d’enregistrements, et qui permet de soulever un grand nombre de questions techniques (système principal, appoints, techniques de mixage, etc.) et esthétiques (référence au concert, importance de la salle, …). Cette recherche porte uniquement sur le cas de l’orchestre symphonique ‘type’ tel qu’il sera défini dans le chapitre 1.1.1, et exclut par exemple le répertoire baroque ou contemporain.

D’autre part, je me suis limitée à la prise de son à deux canaux, pour deux raisons : premièrement, la grande majorité des enregistrements actuels sont encore réalisés en stéréo, et les prises de son multicanales représentent encore une part très minoritaire du marché. D’autre part, une des problématiques était de voir ce qu’était devenue la notion d’esthétique de label aujourd’hui, en comparaison avec les labels historiques des années 1960 à 1980. Afin de pouvoir comparer cela, il était important de se situer dans ce même cadre de l’enregistrement stéréophonique.

Enfin, j’ai aussi exclu le cas des enregistrements avec vidéo, pour les mêmes raisons que précédemment, mais aussi parce qu’il s’agissait de se concentrer sur une esthétique audio, et que la question du son pour la vidéo aurait impliqué de s’intéresser aussi à l’esthétique vidéo et aux liens entretenus par l’image et le son. De la même manière, la musique de film étant très liée au support visuel qu’elle accompagne, elle ne sera pas prise en compte dans ce mémoire, si ce n’est comme source d’influence.

Cette recherche s’articule autour de plusieurs éléments :
- Une recherche documentaire portant principalement sur trois aspects de la prise de son d’orchestre. L’orchestre en lui-même tout d’abord, et le questionnement de la notion d’identité sonore d’un orchestre et des paramètres pouvant influer sur cette identité sonore. Ensuite, le lieu d’enregistrement, dont la qualité représente un pré-requis indispensable à une bonne prise de son, et qui peut apporter sa propre personnalité à l’enregistrement. Enfin, quelques labels historiques européens ont été étudiés, afin de voir ce qui faisait leurs caractéristiques techniques et esthétiques, ainsi que leur évolution depuis les débuts de la stéréophonie.
- D’autre part, la rédaction d’un questionnaire destinés à des ingénieurs du son Français, Allemands, et Britanniques, permettant de rassembler des informations sur l’état actuel de la production de musique symphonique, les différentes techniques utilisées et esthétiques recherchées.
- Et enfin, l’écoute personnelle d’un grand nombre d’enregistrements anciens et actuels (depuis les années 1960), afin de mettre en relation les différents éléments évoqués dans la recherche documentaire et dans les interviews, et de vérifier ou infirmer par l’écoute les différentes problématiques soulevées.
Les différentes étapes de cette recherche nous permettront d’analyser l’émergence d’écoles nationales de prise de son, d’esthétiques propres à des radios ou labels, et de discuter de l’évolution de ces notions.

1. Revue de littérature

1.1. L’orchestre symphonique

Afin d’étudier les caractéristiques esthétiques et techniques de la prise de son d’orchestre, il est important d’analyser tout d’abord plus précisément l’objet sonore que représente l’orchestre. Après un bref rappel historique sur les origines de l’orchestre symphonique et son développement jusqu’à un effectif-type, nous verrons dans quelle mesure certains orchestres ont pu développer une couleur sonore qui leur est propre, comme c’est le cas pour un instrumentiste seul.

1.1.1. Un instrument à part entière

L’orchestre peut être défini comme une réunion d’instrumentistes de différentes familles selon une organisation-type qui s’est développée au fil de l’histoire. Cependant, l’orchestre est plus qu’une addition de solistes. On peut donc considérer l’orchestre sous un autre angle : celui d’un instrument à part entière. En effet, le niveau instrumental de chaque membre de l’orchestre est important, mais l’habitude qu’ils ont de jouer ensemble, leur écoute, les caractéristiques communes de son qu’ils développent le sont tout autant.

One can start from two different premises : that an orchestra is a corporation of instrumental musicians ; and that an orchestra is a corporate musical instrument. The distinction is, in effect, that of the orchestra as an institution and as a sounding body.¹ [1]

Orchestre : n.m. Au sens le plus général, et particulièrement dans la musique occidentale, réunion d’instruments fonctionnant comme « masse », comme ensemble, et non comme addition de solistes, ce qui est le cas dans les formations « de chambre ». [2]

L’histoire de l’orchestre débute au XVIIème siècle, pendant lequel les instrumentistes se regroupent par famille d’instruments pour former des consorts. Pour des événements particuliers ou des œuvres particulières, il arrive qu’on regroupe ces différents consorts pour former ce qui correspondrait à l’ancêtre de l’orchestre.

L’évolution de l’orchestre est liée à l’histoire de l’opéra. Au milieu du XVIIᵉ siècle, chaque maison d’opéra possède un ensemble de cordes et un continuo. À la fin du XVIIᵉ siècle, on commence à utiliser le terme ‘orchestre’ en France et en Italie pour parler de ces ensembles, et quelque temps après, ce terme est repris en Allemagne et en Angleterre. Les compositeurs commencent à écrire pour des formations orchestrales « types ». Lully établit par exemple un modèle d’orchestre dont il se sert pour tous ses opéras (cordes, deux hautbois, deux bassons, avec ajout si nécessaire d’autres bois ou de cuivres). Ce modèle est ensuite transmis par ses élèves et admirateurs, et devient un modèle pour les compositeurs de la période classique. Beaucoup de symphonies de Mozart et Haydn utilisent cette même formation, avec l’addition de deux cors. [1]

Durant le XIXᵉ siècle, l’orchestre symphonique type se développe. Cette formation est la base de tous les orchestres actuels :
- Section de cordes (par exemple 16 violons I, 14 violons II, 12 altos, 10 violoncelles, 8 contrebasses)
- Bois (flûte, hautbois, clarinette, basson) souvent par 2 et éventuellement flûte en sol, piccolo, cor anglais, clarinette basse, contrebasson,…
- Section de cuivres : 2 ou 4 cors, trompettes, trombones, éventuellement tuba
- Timbales, percussions
- À ces sections peuvent s’ajouter harpe, piano, célesta,… selon les besoins des œuvres.
Durant le XXᵉ siècle, les principales évolutions que l’on a pu observer concernant la composition des orchestres consistent surtout en l’ajout d’un grand nombre de percussions, et une importance parfois plus grande donnée aux cuivres. Quelques nouveaux instruments ont aussi fait leur apparition dans l’orchestre : guitare acoustique (Symphonie n°7 de Mahler, 1905), saxophone (Boléro de Ravel, 1928), ou encore guitare électrique (Allelujah II de Berio, 1958)…

1.1.2. L’identité sonore des orchestres

Du fait de l’existence d’une formation orchestrale « type », avec un effectif semblable pour tous les orchestres, on peut considérer l’orchestre comme un instrument à part entière. Les musiciens d’orchestre restant en général pendant un temps important de leur carrière dans un même orchestre, chaque orchestre a la possibilité de développer des caractéristiques sonores qui lui sont propres, tout comme ce serait le cas d’un instrumentiste seul. On attribue ainsi à certains orchestres célèbres une sonorité particulière, qui fait leur identité et leur renommée, exactement de la même manière qu’on attribue une identité sonore à un instrumentiste soliste. Lors de la prise de son, il est donc possible de considérer l’orchestre comme entité sonore, et non pas seulement comme une multitude d’instruments.

Quelques orchestres célèbres

On trouve dans The Orchestra – A very short introduction [3] une description de l’identité sonore de quelques orchestres célèbres (pour chaque orchestre, l’auteur propose un exemple sonore) :

Amsterdam Royal Concertgebouw Orchestra
Le son chaud, intime, de la salle elle-même, permettant aux musiciens de ne pas forcer. Jeu délicat et nuancé des cordes, parfois qualifié de doux ou velouté. Longue association aux symphonies de Bruckner et Mahler. Percussions sophistiquées.²

Exemple sonore (Piste n° 2) : Mahler, Symphonie n°3 en ré mineur, mvt I (Kräftig, Entschieden), dir. Bernard Haitink (Philips 1966).

Berliner Philharmoniker
Interprétations voluptueuses et extrêmement raffinées, typiquement attribuées à l’instruction de Herbert von Karajan de faire commencer le vibrato de la main gauche avant que l’archet ne touche la corde. Cuivres sonores et gutturaux.³

Exemple sonore (Piste n° 3) : Sibelius, Symphonie n°5, mvt III (Allegro Molto), dir. Herbert von Karajan (Deutsche Grammophon, 1965)

Chicago Symphony Orchestra
Les « cuivres de Chicago » : une grandeur et une perfection technique attribuées tour à tour au chef d’orchestre Fritz Reiner, au trompettiste principal, Adolph Herseth, et au tubiste principal, Arnold Jacobs.⁴

Exemple sonore (Piste n° 4) : Richard Strauss, Also Sprach Zarathustra, dir. Georg Solti (Decca 1975)

Cleveland Orchestra
Perfection technique, soin minutieux des contrastes dynamiques, contrepoint orchestral étudié, souvent qualifié de transparent, et sonorité fine européenne.⁵

Exemple sonore (Piste n° 5) : Dvořák, Danse slave en si Majeur, op 72 n°1, dir. George Szell (Columbia 1965)

London Symphony Orchestra
Interprétations vives et extraverties, solistes célèbres dans les rangs (James Galway, flûte ; Gervase de Peyer, clarinette ; Barry Tuckwell, cor). Bonne faculté d’adaptation à ses nombreux et éminents chefs d’orchestre invités. Musiques de film.⁶

Exemple sonore (Piste n° 6) : Elgar, The Dream of Gerontius, fin de la 1ère partie, Proficiscere, anima Christina/ Go forth, in the name of Angels and Archangels, dir. Colin Davis (LSO Live, 2006)

Philadelphia Orchestra
Phrasé des cordes homogène (« le son de Philadelphie », « ces fabuleux philadelphiens »). On dit souvent que c’est une réponse à l’acoustique sèche de l’ancienne résidence de l’orchestre, l’Académie de Musique de Philadelphie ; accomplie en partie par des superpositions subtiles de changements d’archets.⁷

Exemple sonore (Piste n° 7) : Tchaikovsky, Symphone n°5 en mi mineur, op 64, mvt III (Valse), dir. Riccardo Muti (EMI 1992)

Wiener Philharmoniker
Instruments n’existants qu’à Vienne. Le hautbois viennois et les cuivres à palettes sont de petit calibre et offrent un timbre délicat et précis. Les instruments à cordes appartiennent à l’orchestre, et non aux musiciens, et sont donc transmis de génération en génération. La pureté et la traditition continue de ce son ont longtemps été également attribuées à la pureté raciale et de genre des musiciens hommes, blancs et européens.⁸

Exemple sonore (Piste n° 8) : Beethoven, Symphonie n°7 en la Majeur, op 72, mvt III (Presto), dir. Carlos Kleiber (Deutsche Grammophon 1976)

Nous voyons dans les exemples ci-dessus que différents paramètres sont évoqués pour expliquer le son d’un orchestre (le chef, la salle, les instruments, le répertoire, …). Certains de ces critères sont présentés ici plus en détail. La question de la salle, qui a à la fois une influence sur le son de l’orchestre, mais aussi directement sur la prise de son, est étudiée dans le chapitre 1.2.1.

Paramètres à l’origine de la sonorité d’un orchestre

Il existe de nombreux critères qui peuvent donner une sonorité particulière à un orchestre. En voici quelques exemples.

La disposition

En premier lieu, il est important de noter les différentes dispositions d’orchestres existantes, et que chaque chef d’orchestre choisit en fonction de ses habitudes, des traditions de l’orchestre, de la salle, du répertoire… Les dispositions les plus fréquentes pour les cordes sont présentées dans la figure 1.1.

Figure 1.1 – Quelques dispositions d’orchestre

La disposition européenne a été la norme durant tout le XIXᵉ siècle. C’est Leopold Stokowski qui invente à Philadelphie en 1920 la disposition « américaine ». Christian Merlin explique que cette invention est due à l’essor de l’enregistrement, qui à l’époque s’accommodait mieux d’une nette séparation des registres. Cette disposition s’est ensuite importée en Europe (London Symphony Orchestra, Royal Concertgebouw Orchestra, Orchestre national de la Radiodiffusion Française, …). La variante allemande s’est alors développée parallèlement dans les orchestres allemands. La disposition européenne, qui était encore utilisée dans certains orchestres, et demandée par exemple par des chefs comme Otto Klemperer, quel que soit l’orchestre avec lequel il travaillait, est revenue au goût du jour dans les années 1980, à cause, entre autres raisons, de l’essor des orchestres sur instruments d’époque.

Une autre disposition existante, beaucoup moins répandue, est celle du Wiener Philharmoniker, appelée disposition « viennoise », avec les contrebasses derrière les vents. C’est un exemple de disposition imposée en grande partie par la configuration de la salle (Große Musikvereinsaal, Vienne). Pour cette raison, cette disposition est aussi adoptée par beaucoup d’orchestres étrangers lorsqu’ils jouent dans cette salle, ce qui qui réclame un certain temps d’adaptation. [4]

La disposition des bois est fixe, sauf dans un autre cas particulier : le Royal Concertgebouw Orchestra, où les clarinettes et les bassons sont inversés. De la même manière, la disposition des autres instruments de l’orchestre peut varier : les cors sont par exemple disposés à jardin ou à court, en ligne ou en carré, etc.

Les orchestres sur instruments anciens peuvent aussi avoir des dispositions plus flexibles. En particulier, les effectifs de cordes peuvent être plus réduits que dans un orchestre symphonique « standard », ce qui peut modifier la disposition.

La disposition de l’orchestre peut avoir une grande influence sur la prise de son. Par exemple, la disposition « européenne » accentue les effets de stéréophonie des réponses entre violons 1 et violons 2. Cette disposition pose cependant des problèmes pour la prise de son, en raison de la directivité des instruments. En effet, les violons 2 sont alors tournés vers l’intérieur de l’orchestre et non pas vers le public.

Le choix d’une certaine disposition peut aussi permettre de favoriser une plus grande intelligibilité, par un placement judicieux des sources permettant un meilleur démasquage spectral. Cette question du démasquage spectral est une problématique qui n’est pas uniquement liée à l’enregistrement, et qui se pose déjà dans le cas d’un concert.

Lors d’une prise de son live, c’est le chef d’orchestre qui prend la décision de la disposition. Mais lors d’un enregistrement non public, l’ingénieur du son et le directeur artistique peuvent discuter de la disposition avec le chef avant la séance s’ils le souhaitent.

Paramètres instrumentaux

Certains éléments instrumentaux peuvent entrer en jeu dans la sonorité d’un orchestre. En effet, l’utilisation de certains types d’instruments peut être spécifique à un pays ou à un orchestre particulier.

Tout d’abord, on peut citer l’exemple du basson. Selon les orchestres, on retrouve des bassons français ou des Fagotts allemands. La facture de ces deux instruments a divergé au début du XIXᵉ siècle et les deux types de bassons se sont développés parallèlement. Le Fagott a un son plus rond, plus proche du son de la clarinette, alors que le basson français a un son plus brillant, ce qui le rend plus apprécié pour le jeu soliste. Aujourd’hui, le Fagott a remplacé le basson français dans un certain nombre de pays, et on le retrouve en Allemagne, en Angleterre, en Autriche, et en Italie. En France, certains orchestres (Orchestre National de France, Orchestre du Capitole de Toulouse, Orchestre National Bordeaux-Aquitaine, …) continuent de préférer le basson français, alors que d’autres (Orchestre de Paris, Orchestre de l’Opéra de Lyon, …) utilisent maintenant le Fagott. Il arrive aussi, comme à l’Orchestre Philharmonique de Radio France, que le pupitre de bassons soit partagé par des bassons français et des fagotts allemands.

Certaines œuvres ont été écrites spécifiquement pour l’un ou l’autre de ces instruments (le solo de basson du Sacre du Printemps par exemple est écrit pour basson français, car Stravinsky recherchait ce timbre particulier).

On peut aussi citer le cor viennois, plus proche du cor naturel, et qui est utilisé quasi-exclusivement à l’Orchestre Philharmonique de Vienne. Cet orchestre utilise aussi un hautbois particulier, le hautbois viennois.

Enfin, on peut évoquer la technique d’archet des contrebasses, avec des musiciens français, anglais et italiens qui tiennent l’archet avec la main au-dessus de la hausse (comme un archet de violoncelle), alors que les musiciens allemands et autrichiens le tiennent par-dessous (comme un archet de viole de gambe). L’archet allemand offrirait une sonorité plus riche, mais une moins grande souplesse de jeu et de phrasé. A l’échelle d’un pupitre de contrebasses dans l’orchestre, le son peut donc être notablement différent.

D’autres habitudes spécifiques à certains orchestres peuvent expliquer le développement d’une sonorité propre. Par exemple, la possession par l’orchestre de tous les instruments à cordes de l’Orchestre Philharmonique de Vienne permet d’avoir des instruments homogènes et de supprimer une source d’individualisation du son des musiciens.

Enfin, si le renouveau apporté par les formations jouant sur instruments d’époque a d’abord concerné la musique baroque, la musique jouée par ces orchestres s’est aujourd’hui élargie au répertoire classique et à une partie du répertoire romantique. Les orchestres sur instruments anciens proposent donc une interprétation qui peut différer énormément de celle d’un orchestre symphonique « standard », en particulier en termes de sonorité (cordes en boyaux, flûtes en bois,…). Par exemple, le Freiburger Barockorchester compte dans sa discographie, outre des œuvres baroques, des œuvres de Mozart, Haydn ou Mendelssohn, ou bien encore un disque de Schumann en cours de post-production.

L’esthétique choisie pour enregistrer ce type d’orchestres, sur instruments anciens, peut être assez proche de ce qui se fait en musique baroque, avec beaucoup de précision et une grande proximité.

Ecoute proposée (Piste n° 1) : Ludwig van Beethoven, Symphonie N°1 – Emmanuel Krivine – La Chambre Philharmonique – Interprétation sur instruments d’époque – Naïve 2011

Les écoles instrumentales

À tous ces éléments instrumentaux s’ajoutent les traditions de jeu instrumental dans chaque pays. À ce propos, Philippe Muller, professeur de violoncelle au Conservatoire National Supérieur de Musique de Paris, estime qu’on retrouve des caractéristiques propres à chaque pays dans le jeu des instruments à cordes.

Je pense en effet qu’il existe un rapport entre la façon de phraser et la manière de parler ; la façon de rythmer la musique est en partie liée à la manière dont on rythme le langage. Par exemple, une pièce de musique ne sera pas jouée immédiatement de la même façon par un interprète russe, italien ou allemand… La scansion est plus forte en italien, la profondeur des graves ressortira davantage chez un Allemand, et un Français aura tendance à faire ressortir le côté brillant de la phrase. Je pense qu’il existe un lien entre la sonorité, le phrasé, et la langue qu’on parle. [5]

Si l’école française de violoncelle (fondée par Maurice Maréchal) a par exemple été une référence à une certaine période, et que certains violoncellistes actuels ont repris le flambeau de cette école française, il faut tout de même noter que la notion d’école instrumentale a eu tendance à s’estomper depuis une cinquantaine d’années. [6]

L’identité d’un orchestre et sa couleur particulière a aussi pu être renforcée par l’existence de familles de musiciens, et de lignées professeur-élèves, qui assurent une continuité technique et esthétique dans le jeu instrumental et donc la sonorité d’un orchestre. Aujourd’hui encore, beaucoup d’orchestres célèbres s’investissent par le biais d’Académies d’orchestre dans la formation de jeunes musiciens, qui intègreront peut-être plus tard l’orchestre (par exemple Académies de l’Orchestre Philharmonique de Berlin ou de l’orchestre du Concertgebouw d’Amsterdam).

Le répertoire

Chaque orchestre développe sa propre tradition de répertoire, en fonction de son chef permanent et directeur musical, de la culture du pays… Ceci implique une évolution du son en rapport avec ce répertoire. (Profondeur du son de la musique allemande, fusion des timbres dans les orchestrations de Ravel, …). C’est le cas dans les exemples précédemment cités du Royal Concertgebouw Orchestra d’Amsterdam, qui a une longue tradition d’interprétation des symphonies de Mahler et Bruckner. C’est aussi celui du London Symphony Orchestra, pour lequel l’enregistrement fréquent de musiques de film a développé une grande flexibilité et faculté d’adaptation, mais aussi un son « extraverti », spectaculaire.

D’autre part, il ne faut pas oublier que la plupart des orchestres sont en résidence dans une salle particulière, et leur jeu et leur sonorité s’adapte donc progressivement à cette salle dans laquelle ils donnent la majorité de leurs concerts et organisent la plupart de leurs répétitions.

Enfin, un autre critère extrêmement important à prendre en compte est le chef d’orchestre lui-même. En effet, un même orchestre peut sonner très différemment selon le chef qui le dirige, selon les choix d’interprétation de ce chef, ses gestes, …

Conséquences sur la prise de son

Mais quelle différence pour l’ingénieur du son ? Prenons l’exemple des orchestres français, qui ont la réputation d’avoir un son plus brillant que les orchestres allemands.

Ceci est dû à la fois à l’utilisation d’instruments particuliers (par exemple le basson français ou le Fagott, l’archet des contrebasses, …) mais aussi à des traditions instrumentales, comme l’explique Philippe Muller pour le jeu des instruments à cordes. D’autre part, l’orchestre allemand aura probablement une plus longue tradition de jeu des œuvres de Brahms, Mahler, Wagner, et l’orchestre français la tradition du répertoire de Debussy par exemple, qui nécessite un autre type de sonorité.

Toutes ces caractéristiques s’additionnent et peuvent donc donner une sonorité particulière à l’orchestre français ou allemand. Ainsi, la sonorité globale de l’orchestre allemand sera plus ronde, là où l’orchestre français aura un son plus clair et brillant. L’ingénieur du son confronté à l’enregistrement d’un de ces orchestres pourra donc ressentir le besoin de choisir des microphones qui « compensent » ces caractéristiques orchestrales ou bien au contraire choisir de les accentuer. Par exemple, ceci pourra entraîner l’utilisation de micros avec une préaccentuation dans l’aigu pour gagner en définition et en « accroche » sur l’orchestre allemand, ou de micros non préaccentués pour gagner en rondeur de son sur des orchestres français, et ne pas accentuer démesurément l’aspect brillant. L’ingénieur du son pourra aussi choisir de mettre en valeur ces caractéristiques en les accentuant, et en faisant donc un choix microphonique totalement différent.

Uniformisation

Nous avons vu les paramètres qui font qu’un orchestre peut développer sa propre identité sonore. Il faut cependant nuancer cette notion, qui est de nos jours moins pertinente.

Avec l’arrivée et la large diffusion de l’enregistrement, et la meilleure mobilité des musiciens, on assiste à une certaine uniformisation du son des orchestres. C’est ce qu’expliquent les musicologues Tim Carter et Erik Levi :

L’arrivée de la radiodiffusion et de l’enregistrement a servi à fixer un son d’orchestre standard et idéalisé. Une conséquence inévitable de ces développements est que beaucoup d’orchestres ont perdu les éléments distinctifs de timbres qui restaient uniques à certains pays avant la Première Guerre Mondiale.⁹ [1]

De plus en plus d’étudiants profitent de la mobilité favorisée par le programme Erasmus et autres échanges étudiants. Ainsi, ils passent une partie de leurs études au contact de la culture d’un pays étranger, auprès de professeurs de différentes nationalités, … De la même manière, les professeurs n’enseignent pas toujours dans leur pays d’origine. Tout cela mène à un affaiblissement des écoles nationales instrumentales présentées par P. Muller.

D’autre part, les orchestres effectuent des tournées internationales, et les enregistrements circulent dans toute l’Europe, par la distribution des disques dans tous les pays, mais aussi de manière très importante par le biais d’internet (plateformes de téléchargement, streaming, …). On peut aussi citer l’Union Européenne de la Radio-Télévision, qui permet depuis les années 1950 aux différentes radios d’échanger des programmes, et donc de les diffuser à une plus grande échelle.

Tous ces éléments ont favorisé une uniformisation du son des orchestres durant la seconde moitié du XXᵉ siècle. Jon Tolanski [1] explique ainsi qu’il y a eu durant les dernières décennies une tendance à l’uniformisation du son des orchestres, en direction du son riche, sophistiqué et homogène d’orchestres allemands célèbres comme l’Orchestre Philharmonique de Berlin. Les cuivres des orchestres russes jouent désormais avec moins de vibrato, voire plus du tout, et moins de staccato. Le son des bois s’est aussi uniformisé. Le son rustique de clarinette qu’on entendait dans les orchestres d’Europe de l’Est, mais aussi dans les orchestres français, a laissé place à un son plus rond.

Les sons caractéristiques des orchestres ayant en partie disparu, on peut se demander s’il en est de même pour des écoles de prise de son qui seraient liées au son des orchestres fréquemment enregistrés.

1.2. La prise de son d’orchestre

1.2.1. Les lieux d’enregistrement

Nous avons vu dans le chapitre précédent que certains orchestres ont développé un son spécifique qui correspond à des caractéristiques de la salle dans laquelle ils sont en résidence. C’était ainsi le cas du Concertgebouw Orchestra, pour lequel la salle du Concertgebouw permet aux musiciens de ne pas forcer. C’est aussi le cas de l’orchestre de Philadelphie, qui a développé un son de cordes en réponse à la salle dans laquelle il était en résidence. D’autre part, nous avons vu que la salle peut avoir une influence directe sur la disposition de l’orchestre (comme c’est le cas pour la salle du Musikverein de Vienne), et donc sur le son de l’orchestre.

D’autre part, l’orchestre est l’objet de l’enregistrement, mais la salle est tout aussi importante pour la prise de son. De la même manière qu’un photographe doit s’adapter à la lumière du lieu dans lequel il photographie, un ingénieur du son doit s’adapter à la salle dans laquelle il travaille, et qui aura un impact sur le son (coloration spectrale, intelligibilité, longueur et couleur de la réverbération, …).

E. Kemper [7] explique, en se basant sur une série de tests d’écoutes réalisés lors de son mémoire de fin d’études à la Musikhochschule de Detmold que pour un même ingénieur du son, la note donnée à l’enregistrement par les participants au test d’écoute est liée à la salle et à sa qualité. Ainsi, elle donne l’exemple de la Kammermusiksaal de la Philharmonie de Berlin, ainsi que de la Festspielhaus de Baden-Baden qui correspondent à des enregistrements respectivement bien notés ou mal notés pour un même ingénieur du son. Pour cette raison, une salle adaptée au répertoire et à la dimension de l’orchestre est un prérequis très important pour la qualité d’un enregistrement.

Certaines salles permettent de moduler l’acoustique (volumes couplés, rideaux, ou autre) mais il est impossible de s’abstraire totalement de l’acoustique du lieu. De plus, ces modifications acoustiques sont parfois peu efficaces ou compliquées à mettre en place, et ne sont donc pas toujours très utilisées. Il est donc important de comprendre quels sont les différents types de salle utilisés pour la prise de son d’orchestre, de connaître leurs caractéristiques, pour comprendre pourquoi et comment l’ingénieur du son cherche à retransmettre l’acoustique du lieu d’enregistrement, ou au contraire à améliorer par certaines techniques (réverbération artificielle, …) l’acoustique d’un lieu moins adapté. Une caractéristique importante, quel que soit le type de salle, est sa dimension. En effet, un enregistrement dans une salle trop grande ne posera généralement pas trop de problèmes, en revanche une salle trop petite pourra créer de véritables difficultés de prise de son (premières réflexions trop proches, coloration de la salle, …).

Les salles de concert

L’enregistrement d’orchestre symphonique requiert une salle d’un grand volume. Pour cette raison, les salles de concert, dont la taille, l’acoustique et la configuration sont prévues pour accueillir des orchestres, sont souvent utilisées pour l’enregistrement.

D’autre part, aujourd’hui de plus en plus de disques sont enregistrés en « live » ou en « faux-live » pour des raisons parfois musicales (préserver l’énergie du direct, archivage de concerts,…) mais aussi très souvent pour des raisons économiques (enregistrement de la répétition générale, d’un ou plusieurs concerts, et de quelques corrections si nécessaire). Dans ces cas-là, le lieu d’enregistrement est donc imposé puisqu’il s’agit du lieu dans lequel le concert est programmé.

Architectures

On trouve en Europe un certain nombre de salles de concert, construites sur différents modèles architecturaux, en fonction des traditions de chaque pays, de l’année de construction, de modes… Ces traditions architecturales sont liées aux traditions musicales de chaque pays.

Les salles en forme de fer à cheval

En Italie, le fort développement de l’opéra a mené à la construction de nombreux théâtres à l’italienne (en forme de fer à cheval) dans toutes les grandes villes. On peut par exemple citer la Scala de Milan, construite en 1778, … C’est un type d’architecture qu’on retrouve fréquemment dans les salles d’opéras en Europe, mais aussi dans certaines salles qui sont aujourd’hui utilisées principalement pour des concerts (le Théâtre des Champs Elysées à Paris par exemple).

Ces salles étant initialement destinées au théâtre ou à l’opéra, elles sont généralement caractérisées par un temps de réverbération beaucoup plus court que dans une salle de concert. Le Théâtre des Champs Elysées avait par exemple jusqu’en 2005 (date où certaines modifications acoustiques ont été faites afin, entre autres, d’augmenter ce temps de réverbération) un temps de réverbération de 1,35 sec à 1000 Hz. En comparaison, la grande salle du Musikverein à Vienne et la salle du Concertgebouw d’Amsterdam, qui sont deux salles en « boîte à chaussures » avec une jauge comparable à celle du TCE (1900 places environ pour le TCE, 1700 pour le Musikverein, 2000 pour le Concergebouw), ont un temps de réverbération de 2,0 sec à 1000 Hz [8, 9, 10].

Les salles en « boîte à chaussures »

Les salles en forme de « boîte à chaussures » se sont développées à partir des modèles des salles de bal, mais aussi des églises. Beaucoup d’œuvres classiques ont été composées pour des salles de bal (les premières symphonies de Haydn pour les châteaux du Prince Esterhazy, les premières symphonies de Beethoven pour le palais Razumofsky).

Tout comme les salles de bal, les premières salles de concert rectangulaires sont généralement hautes de plafond, avec beaucoup de décorations. Ces décorations permettent de « casser » les réflexions des murs parallèles. Elles possèdent aussi généralement des balcons latéraux et/ou arrière.

Parmi les salles de ce type, on peut citer le Concertgebouw à Amsterdam ou le Musikverein à Vienne.

Figure 1.2 – Royal Concertgebouw Amsterdam, exemple de salle rectangulaire, ou en forme de « boîte à chaussures » – Crédits photo : Hans Samsom

Les salles récentes

Parmi les différentes solutions architecturales proposées pour répondre à de nouvelles contraintes, le concept de salle en vignobles a été développé par l’architecte de la Philharmonie de Berlin pour répondre à la contrainte d’avoir l’orchestre au milieu de la salle. L’orchestre placé au centre de la salle est donc assez éloigné des murs, ce qui réduit les réflexions précoces. Pour compenser cela, l’architecte a construit des « terrasses » pour placer les sièges. Ces terrasses forment des obstacles acoustiques, qui permettent de recréer des réflexions précoces.

Figure 1.3 – La Philharmonie de Berlin, une salle construite d’après le modèle « en vignobles »

D’autres architectes ont choisi de reprendre le concept de la « boîte à chaussures ». Ils ont parfois dû trouver des solutions architecturales pour conserver les caractéristiques de ces salles (riches ornementations qui cassent les réflexions des murs parallèles) tout en gardant un style plus épuré. C’est le cas par exemple de la salle du Congress and Culture Center à Lucerne, en Suisse. Cette salle est aussi un modèle de salle avec acoustique variable. L’architecte Jean Nouvel y a construit des espaces dont l’acoustique peut être couplée avec l’acoustique de la salle, afin d’en augmenter la réverbération. On passe ainsi d’un temps de réverbération de 1,7 sec (à 1000 Hz) sans couplage acoustique à un temps de réverbération de 2,1 sec (à 1000 Hz) quand tous les espaces sont couplés. Cette possibilité de moduler l’acoustique de la salle peut être un outil supplémentaire pour l’ingénieur du son lors de la séance d’enregistrement. Cependant, selon la mécanique utilisée pour la construction, le changement peut être difficile ou long à mettre en œuvre, et l’ingénieur du son perd cette possibilité. Dans le cas d’un concert, ce n’est encore une fois pas à l’ingénieur du son que revient ce choix.

Quelques salles célèbres

Suite à une étude réalisée en 1962 auprès de chefs d’orchestre célèbres (dont Herbert von Karajan, Bruno Walter, …) et de critiques musicaux, Leo Beranek [10] a proposé un classement des salles de concert (parmi 76 salles) en fonction de leur acoustique. Fergus R. Fricke a réalisé une étude similaire en 1992, y ajoutant certaines salles réalisées ou rénovées depuis la première étude. Les salles sont classées sur une échelle allant de A+ (Supérieure) à C (passable).

Les deux études donnent des résultats assez similaires. De manière unanime, trois salles forment la catégorie A+ : le Symphony Hall de Boston, la Großer Musikvereinsaal de Vienne, et le Concertgebouw d’Amsterdam. Ces salles sont considérées par tous les interviewés comme les meilleures au monde.

Les salles européennes dans la catégorie A (Excellent) sont le Stadt-Casino de Bâle (Suisse), le Konzerthaus de Berlin (Allemagne), le St David’s Hall de Cardiff (Pays de Galles), et la Großer Tonhallesaal de Zurich (Suisse). A ces salles viennent s’ajouter dans l’étude de Fricke : la Philharmonie de Berlin (Allemagne), la Herkulessaal de Munich (Allemagne), et De Doelen de Rotterdam (Pays-Bas).

Un grand nombre de productions de disques se déroulent dans ces salles réputées. D’autre part, une très grande majorité des concerts qui se jouent dans ces salles sont aussi enregistrés. Au Musikverein de Vienne par exemple, la radio autrichienne (Österreichischer Rundfunk) possède une régie et enregistre non seulement tous les concerts du Radio-Symphonieorchester Wien, mais aussi une grande partie des concerts du Wiener Philharmoniker Orchester, du Wiener Symphoniker, ou d’autres orchestres nationaux ou étrangers (sauf quand ceux-ci sont enregistrés par une équipe différente pour un label particulier ou par une équipe accompagnant l’orchestre).

Et en France ?

Nous avons vu que parmi les salles de concert les plus réputées (selon l’étude de Beranek), aucune ne se trouve en France. Ceci est confirmé par un grand nombre d’ingénieurs du son, qui estiment qu’il n’y a en France pas (ou très peu) de bonne salle pour enregistrer un orchestre symphonique. Ainsi, le Théâtre des Champs Elysées, la Salle Pleyel, et d’autres salles parisiennes sont fréquemment critiquées pour leur acoustique. Quelques salles plus récentes sont cependant reconnues pour leur excellente acoustique, comme l’Arsenal de Metz (construit en 1989) ou l’Auditorium de Dijon (1998). Ces salles servent régulièrement pour des enregistrements, mais la majorité des productions se déroule tout de même à Paris. En effet, un grand nombre de disques est aujourd’hui réalisé grâce à des captations de concerts. La vie musicale française étant de plus beaucoup plus centralisée qu’en Allemagne, une grande partie des concerts a lieu à Paris, et beaucoup d’enregistrements sont donc réalisés dans ces salles.

La Philharmonie de Paris est actuellement en cours de construction. Cette salle est construite sur le modèle des vignobles, suivant l’exemple de la Philharmonie de Berlin dont l’acoustique est reconnue. S’il s’avère que l’acoustique de cette salle est réussie, cela pourrait permettre aux ingénieurs du son français d’avoir un lieu adapté à la prise de son d’orchestre, avec une bonne acoustique, et se situant à Paris.

Figure 1.4 – La grande salle de l’Arsenal de Metz. – Crédits photos : [11]

Figure 1.4 – L’Auditorium de Dijon – Crédits photos :[12]

Figure 1.5 – La Philharmonie de Paris, actuellement en cours de construction (image de synthèse pour le concours architectural) – Crédits photo : [13]

Un autre critère important : l’équipement de la salle de concert

En dehors de l’aspect acoustique des salles de concert, un autre critère peut avoir une influence sur les choix techniques de l’ingénieur du son : l’équipement de la salle en matière d’enregistrement. En effet, certaines salles possèdent un système de microphones suspendus en permanence au-dessus de la scène. Ces systèmes sont généralement utilisés par toutes les équipes qui sont amenées à travailler dans la salle en question, pour des raisons de discrétion visuelle lors des concerts.

Ceci peut avoir une incidence sur deux types de choix techniques. Tout d’abord, le positionnement des microphones est dépendant de l’endroit où sont suspendus les câbles. Il est donc probable que les différents ingénieurs du son travaillant dans une salle ainsi équipée utilisent les mêmes positionnements pour les microphones d’appoint sur un orchestre.

D’autre part, l’utilisation de ces systèmes est liée à l’utilisation de câbles actifs (et de microphones à petite membrane). Ceci restreint donc les choix à des microphones compatibles avec des câbles actifs (on utilise principalement la série Colette de Schoeps ou la série KM100 de Neumann). De plus, la salle étant équipée généralement dans une seule de ces marques, le choix microphonique en est d’autant plus limité. Par exemple, la Philharmonie de Cologne ou la salle du Musikverein de Vienne sont équipées de câbles actifs Schoeps, fonctionnant avec la série Colette, et il est donc uniquement possible d’utiliser les microphones de cette série. A la Philharmonie de Berlin en revanche, ce sont des câbles actifs Neumann qui sont utilisés.

En France, les grandes salles qui servent le plus souvent pour des enregistrements ne sont pas équipées d’un tel système, mais il est prévu d’en installer un à la Philharmonie de Paris, actuellement en construction.

Les studios d’enregistrement

Certains studios d’enregistrement sont prévus pour accueillir des orchestres symphoniques. C’est le cas des studios Abbey Road, par exemple, qui ont été fondés par EMI, et qui ont accueilli (et accueillent toujours) un grand nombre d’enregistrements symphoniques. En Allemagne, on peut citer le studio Teldex (anciennement studio Teldec, fondé par Telefunken et Decca, et racheté par les ingénieurs du son de Teldec à la fermeture du label), qui accueille régulièrement des productions symphoniques.

Certaines salles ont aussi été utilisées comme studio d’enregistrement de manière régulière, alors qu’elles n’étaient pas conçues pour cela. Ainsi, EMI, Decca et RCA ont utilisé le Kingsway Hall entre 1926 et 1984 pour beaucoup d’enregistrements, jusqu’à la destruction de la salle. Cette salle avait été construite par l’Eglise Méthodiste, et était donc initialement destinée à des célébrations religieuses. La Jesus-Christus-Kirche, à Berlin, a aussi été utilisée comme studio d’enregistrement, en particulier par Deutsche Grammophon. De nos jours, cette église est encore réservée très fréquemment pour la réalisation d’enregistrements de disques. A Paris, la salle Wagram, qui était une salle de bal, a elle aussi été le lieu de nombreux enregistrements, en particulier pour le label EMI.

Figure 1.6 – Studio Teldex – séance avec le Freiburger Barockorchester – Mai 2014

Les studios de radio

Si certains labels ont utilisé des studios d’enregistrement pour réaliser une partie de leurs disques, beaucoup de radios ont aussi utilisé leurs propres locaux, qui servent de lieux de répétition pour les orchestres attachés à ces radios, mais aussi de studios d’enregistrement. Ainsi, la Maison de la Radio (Radio France) comporte plusieurs studios dédiés à la musique, dont un auditorium, le studio 104, aussi appelé Salle Olivier Messiaen, ou le studio 103, où ont été réalisés certains enregistrements des orchestres de Radio France. Ces studios ont des jauges plus faibles que celles du Musikverein ou du Concertgebouw par exemple (930 places environ pour le studio 104, 40 places pour le studio 103). Le volume est aussi plus faible que celui de ces salles de concert, mais le studio 104 a tout de même un volume comparable par exemple à la Großer Tonhallesaal de Zurich (environ 12000 m3 pour les deux), qui est classée en catégorie A dans l’étude de Beranek. Cependant, on peut noter une différence importante entre le studio 104 et la Tonhallesaal : le temps de réverbération. En effet, le temps de réverbération de la Tonhallesaal est de 2,05 sec à 1000 Hz, et se situe donc dans la même catégorie que le Musikverein et le Concertgebouw, alors que le studio 104 n’a que 1,7 sec de temps de réverbération à 1000 Hz.

La Maison de la Radio, actuellement en travaux, va ouvrir son nouvel Auditorium à la fin de l’année 2014. Il comptera 1400 places et suivra le concept de salle « en vignobles » développé par Hans Sharoun pour la Philharmonie de Berlin. Cet auditorium a pour objectif de devenir un lieu de référence pour les concerts de musique classique à Paris, et pas seulement un studio d’enregistrement. Ses caractéristiques seront donc probablement à mi-chemin entre celles d’une salle de concert et celles d’un studio d’enregistrement, afin de pouvoir répondre à ces deux usages.

Un tableau donnant les caractéristiques de quelques salles européennes utilisées pour la prise de son d’orchestre est consultable en Annexe D.

Nous avons vu comment le son d’un orchestre peut modifier les choix microphoniques de l’ingénieur du son. Il en est de même avec l’acoustique des salles. En effet, l’ingénieur du son peut choisir d’accentuer ou au contraire de compenser certaines caractéristiques acoustiques d’une salle. Ainsi, le choix d’un microphone avec une couleur particulière ou l’utilisation d’égalisation se fait automatiquement en interaction avec la couleur de la salle. De plus, il pourra choisir d’utiliser plus ou moins la réverbération de la salle de concert (mais il ne pourra jamais s’en abstraire totalement), en dosant le niveau de champ direct/champ réverbéré par le placement des microphones ou par l’utilisation de micros d’ambiance. Toutes ces possibilités relèvent de choix techniques faits par l’ingénieur du son, qui a donc une large influence sur l’esthétique d’un enregistrement.

1.2.2. Les esthétiques

Nous avons étudié la notion d’orchestre comme entité sonore, ainsi que les caractéristiques de différents types de lieux d’enregistrement (salle de concert, studio d’enregistrement, studio de radio). Ces deux éléments, ainsi que l’œuvre enregistrée, sont des données sur lesquelles l’ingénieur du son n’a aucune (ou très peu) marge de manœuvre. Il faut donc maintenant se pencher plus précisément sur le rôle de l’ingénieur du son, et les différentes esthétiques que celui-ci peut développer pour les mêmes données de base (orchestre, chef, salle, répertoire).

Elisabeth Kemper [7] explique que l’ingénieur du son est le paramètre qui a la plus grande influence sur le résultat sonore. En tout état de cause, l’influence de l’ingénieur du son sur le son est plus grande que celle de la salle d’enregistrement, du chef d’orchestre et de l’orchestre.¹⁰ Pour cette raison, la compréhension des différentes esthétiques sonores défendues par les ingénieurs du son est primordiale, car de cette esthétique dépendra une grande partie du son final.

La notion de fidélité

La notion de réalisme et de fidélité est un concept extrêmement répandu dans le domaine de l’enregistrement de musique classique. Ainsi, de nombreux ingénieurs du son se rejoignent pour dire que l’idéal reste d’avoir la plus grande fidélité par rapport à la situation d’enregistrement [14].

La musique classique existait bien avant l’arrivée de l’enregistrement, contrairement à d’autres styles musicaux. Par conséquent, l’expérience du concert reste la référence pour beaucoup d’auditeurs et de musiciens. Dans son ouvrage retraçant l’histoire de l’enregistrement classique, Colin Symes rappelle lui aussi l’attachement du monde de la musique classique au concert :

Dans les cercles de musique classique, […] ils n’ont jamais abandonné l’idée que le concert était l’articulation ultime de la musique et que le phonographe devait s’y référer. Les modes de représentation de la musique classique sur disque qui ont abandonné cette référence au concert ont eu tendance, à de rares exceptions près, à être marginalisés.¹¹ [15]

Denis Mercier [16] explique quant à lui que pour être réussie, une prise de son doit laisser passer les « vraies » couleurs de l’orchestre (c’est-à-dire l’orchestre tel qu’on l’entend au concert).

Ainsi, il est souvent admis par les auditeurs, les musiciens et certains ingénieurs du son que l’équilibre dans la salle est l’équilibre à retransmettre absolument. Certains ingénieurs du son estiment encore qu’il suffirait de positionner les micros comme si l’on était assis à la meilleure place de la salle pour obtenir un excellent enregistrement, solution qui était préconisée au début de l’enregistrement stéréophonique. C’est la notion de « best seat in the hall », qui a longtemps été très répandue dans le domaine de l’enregistrement classique.

Subjectivité

Nous avons vu que l’idéal recherché par beaucoup est la fidélité.

En réalité, un deuxième discours existe aussi. Cette deuxième esthétique serait celle de l’idéalisme [15]. Il consiste à s’abstraire de la réalité de la salle d’enregistrement pour recréer une réalité idéalisée par l’ingénieur du son (et les musiciens). Cette création de l’ingénieur du son peut alors être « réaliste » sans être fidèle, mais aussi apporter un point de vue (d’audition !) et une expérience différents sur l’œuvre, le concert, de la même manière que l’interprétation musicale. De cette façon, l’ingénieur du son peut alors être considéré comme un artiste qui « interprète » sa prise de son.

Là où les producteurs puristes parlent d’équilibrer différentes sources sonores pour créer une impression fidèle de la scène sonore d’origine, les producteurs créatifs parlent de mixer des sources sonores sans se soucier de la fidélité.¹²

D’autre part, Symes évoque la notion de « best seat in the hall » défendue par certains auteurs. Ainsi, il remarque que la notion de meilleure place et de meilleure salle est aussi une notion subjective. En effet, le choix de cette « meilleure place » ou encore le choix des microphones qu’on y place sont déjà des choix subjectifs de l’ingénieur du son.

Il est intéressant de comparer cette « non-objectivité » de l’ingénieur du son à celle du photographe. Le photographe doit lui aussi effectuer des choix concernant l’appareil photo, la focale, l’angle de prise de vue, etc. Ainsi, même un photo-reporter, dont on pourrait attendre, en raison de son rôle de journaliste et de rapporteur de l’information, qu’il soit le plus objectif possible, ne peut s’abstraire de ce type de choix.

De plus, Symes fait remarquer que même une salle qui est unanimement reconnue comme excellente pour ses qualités acoustiques peut ne pas être idéale pour certains enregistrements. Il prend pour exemple le Concertgebouw d’Amsterdam, qui est considéré comme une des meilleures salles de concert au monde (cf. chapitre 1.2.1) et dans laquelle tous les sièges ont pourtant été retirés pour certains enregistrements, afin d’avoir une acoustique plus adaptée. Ce cas précis montre bien que la « meilleure place de la meilleure salle » n’est pas toujours l’option choisie par les ingénieurs du son, même lorsqu’ils ont cette « meilleure salle » à disposition.

Il est important de rappeler aussi que la stéréophonie n’est qu’une illusion [1]. La multitude de réflexions acoustiques que l’on retrouve dans une salle est réduite à deux enceintes, ce qui limite automatiquement l’enveloppement, les possibilités de démasquage spatial, etc. Les différentes installations multicanales permettent de compenser en partie ces problèmes, mais jamais totalement, puisqu’il s’agit toujours de sources ponctuelles, en comparaison avec l’infinité des directions d’audition dans la salle.

Le rôle de la vision

Un autre élément très important dans la perception d’un concert est l’utilisation de la vue. La vision a une grande influence sur notre perception de ce que nous entendons. Ainsi, pour un concerto dans lequel le soliste serait par moments couvert par l’orchestre, ce qui est le cas lorsqu’on écoute le concert en salle, le fait de voir le musicien permet à l’auditeur de ne pas perdre le contact avec celui-ci. Si un enregistrement présente ce même équilibre, l’auditeur « perd » auditivement le soliste, et n’a plus la vision pour compenser cela.

D’autre part, Denis Mercier explique que la vision a aussi un impact émotif :

En même temps qu’il ressent les moments de tension et de détente dans la musique, il les voit dans les gestes de l’interprète et les lit sur leur visage. [16]

Lors d’une captation audiovisuelle, le spectateur retrouve une partie de cette faculté, avec cependant une différence importante : c’est le réalisateur qui choisit ce que voit à chaque instant le spectateur, et la vision du spectateur est donc très différente de la situation de concert. Pour cette raison, la captation audiovisuelle implique des problématiques différentes de celle de la captation uniquement audio, que nous ne traiterons pas dans le cadre de ce mémoire.

1.2.3. Quelques labels historiques européens

Aux débuts de la stéréophonie, de nombreuses expérimentations de systèmes microphoniques ont été menées. L’orchestre symphonique, par sa taille et sa richesse de timbres, était un terrain privilégié pour ces expérimentations. Ainsi, certains labels ont développé leurs propres techniques microphoniques, et leur propre esthétique pour la prise de son d’orchestre, grâce à un travail de recherche spécifique, mais aussi en raison de l’existence de personnalités fortes (ingénieurs du son, directeurs artistiques, artistes). C’est le cas entre autres de quatre labels européens : Decca, Deutsche Grammophon, EMI et Philips.

Les majors de l’époque, EMI, Decca, RCA, CBS (American Columbia), Philips et Deutsche Grammophon se distinguaient en effet par des identités fortes, aisément repérables par le mélomane audiophile. Tout concourait à cela : la personnalité souvent forte du directeur artistique, celle de l’ingénieur du son, la fabrication du disque proprement dite, gravure, pressage, qualité de la résine, le tout au bénéfice d’un esprit maison avec des recettes propres. [17]

Günther Breest explique comment les moyens techniques et humains de ces labels étaient séparés, ce qui a permis à chacun de développer une esthétique propre :

Après l’intégration de Decca au sein de Polygram, les départements techniques étaient strictement séparés durant des années et il était impossible à une équipe de Deutsche Grammophon d’utiliser les équipements de Decca, même lorsqu’un enregistrement était prévu à Londres. [17]

Toutefois, il faut noter que toutes les équipes expérimentaient différents systèmes, y compris des techniques observées chez d’autres labels, et la discographie de chacun de ces labels comporte bien évidemment des exceptions vis-à-vis des techniques décrites ci-dessous.

Decca

Decca est un label anglais, qui est né en 1937, du rachat de Crystalate Records et ses studios à West Hamptstead.

Roy Wallace intègre Decca en 1953 pour développer un système avec tête artificielle qu’il utilise déjà depuis plusieurs années. Il abandonne la tête artificielle et utilise trois micros Neumann M49 avec une base espacée de 60cm, et le microphone central avancé de 20cm par rapport à cette base. Le tout est positionné autour d’une plaque qui sert d’obstacle acoustique. Il s’agit du premier Decca Tree. En effet, le terme de Decca Tree regroupe non pas une mais bien une multitude de configurations, expérimentées au fil de son développement, avec différents microphones, différents espacements, avec ou sans obstacle. Après une version avec 3 microphones Neumann M50 (toujours avec une plaque) arrive le premier Decca Tree sans plaque acoustique, mais avec des microphones directionnels (Neumann KM56). Plus tard, Kenneth E. Wilkinson prend le relais de Roy Wallace et ajoute deux ailes (« outriggers ») afin de produire une image sonore grand écran [18]. C’est seulement au début des années 1960 que ces expérimentations aboutissent au Decca Tree le plus célèbre, constitué de trois microphones Neumann M50 pour le triangle principal, et de deux autres M50 pour les ailes, tel qu’on peut le voir dans l’image 1.7 (droite).

Figure 1.7 – Deux configurations de Decca Tree – A gauche : configuration avec obstacle acoustique. A droite : 5 microphones M50 (dont deux ailes) – Crédits photos : [19]

Kenneth E. Wilkinson est alors chargé de former tous les ingénieurs du son travaillant pour le label à la technique Decca.

D’autre part, les microphones de cet arbre Decca étaient fixés de façon permanente, et le placement recommandé était à un peu plus de trois mètres au-dessus du pupitre du chef. Ceci permettait d’assurer une constance dans la prise de son. Les ingénieurs du son avaient la liberté d’égaliser le signal, mais pas de faire varier l’espacement entre les microphones, ni de changer les capsules [18]. On remarque donc une volonté assumée de la part du label d’avoir une certaine cohérence esthétique et technique entre les différents enregistrements d’orchestre.

Aujourd’hui, beaucoup d’ingénieurs du son utilisent l’arbre Decca, avec différentes configurations et différents microphones. On ne peut donc pas donner de mesures d’un système unique. Cependant, on considère en général que la base doit mesurer entre 1m50 et 2m20, et que le microphone central est placé entre 80cm et 1m20 en avant de la base [20]. De plus, on utilise principalement des microphones omnidirectionnels (souvent un peu directifs dans les hautes fréquences, comme le M50), même s’il arrive que des ingénieurs du son utilisent des microphones plus directifs, pour des raisons acoustiques.

Le système Decca Tree permet d’avoir une base plus large pour le système qu’un couple AB, car le micro central stabilise l’image, et enlève le « trou au centre » qui se forme lorsqu’on écarte les microphones de la base AB. Il permet aussi une meilleure compatibilité monophonique que le système AB, contrainte particulièrement importante aux débuts de la stéréophonie.

Aujourd’hui, le Decca Tree est particulièrement apprécié par les ingénieurs du son qui travaillent en multicanal, car les trois micros se répartissent naturellement sur les trois enceintes avant du système 5.1. Cependant, ce choix de mixage n’est pas non plus unique. Certains ingénieurs du son choisissent de ne pas placer le microphone central dans le canal central, mais de le mixer comme source fantôme en utilisant les enceintes gauche et droite. Par sa bonne compatibilité avec les systèmes multicanaux, mais aussi car il permet de créer une image plus large et plus spectaculaire, le Decca Tree est aussi plébiscité pour l’enregistrement de musique de film.

Deux salles se partagent un très grand nombre d’enregistrements Decca, en particulier dans les années 1950 et 1960. Il s’agit de la Sofiensaal, à Vienne, et du Kingsway Hall, à Londres.

D’autre part, il est intéressant de noter que, contrairement à d’autres labels, et à ce qui se fait fréquemment de nos jours, peu d’enregistrements Decca ont été réalisés en live. On peut tout de même citer le disque Live from Lincoln Center, avec Pavarotti, Horne et Sutherland, avec le New York City Opera Orchestra dirigé par Richard Bonynge.

Ecoutes proposées :

Felix Mendelssohn, Symphonie N°4 – Claudio Abbado – London Symphony Orchestra – Decca 1968 (Piste n° 12)

Ludwig van Beethoven, Symphonie N°1 – Georg Solti – Chicago Symphony Orchestra – Decca 1975 (Piste n° 19)

Hector Berlioz, Harold en Italie – Zubin Mehta – Israël Philharmonic Orchestra – Decca 1975 (Piste n° 21)

Franz Schubert, Symphonie N°9 – Georg Solti – Wiener Philharmoniker – Decca 1981

Figure 1.8 – Session d’enregistrement Decca du Ring de Wagner, avec l’Orchestre Philharmonique de Vienne dirigé par Georg Solti, dans la Sofiensaal – Crédits photo : Decca

Philips

Philips est un label hollandais, fondé en 1950, et dont la filiale dédiée uniquement à la musique classique, Philips Classics, est née dans les années 1980. Les ingénieurs du son de Philips ont basé leur technique sur l’utilisation d’un système AB omni très large, et très décorrélé. L’ingénieur du son utilise conjointement à ce système un très grand nombre de microphones d’appoints, et reconstitue à partir de ces appoints la cohésion de l’image.

Parmi les personnalités de la firme Philips, on peut entre autres citer Volker Straus, qui a travaillé pendant très longtemps pour le label, et qui a inventé un nouveau système pour les microphones d’appoint, le Straus-Paket : il combinait un KM84 (cardioïde) et un KM83 (omni) coïncidents, branchés avec un câble adaptateur en série (pour entrer dans la console sur un seul préampli) et obtenait ainsi une directivité cardioïde large (ou infra-cardioïde), contrairement aux autres labels qui utilisaient des microphones d’appoints cardioïdes. Cette technique a donné naissance à des microphones infra-cardioïdes (Schoeps MK21, Neumann KM143…).

La technique Philips est donc caractérisée à la fois par le nombre de microphones d’appoints utilisés et par la directivité infra-cardioïde d’une partie de ces appoints, directivité qui crée une couleur différente de celle des microphones cardioïdes utilisés par les autres firmes.

Figure 1.9 – Session d’enregistrement Philips – Crédits photo : [21]

Ecoutes proposées :

Felix Mendelssohn, Symphonie N°4 – Wolfgang Sawallisch – New Philhamonia Orchestra – Philips 1967 (Piste n° 13)

Hector Berlioz, Symphonie Fantastique – Sir Colin Davis – Royal Concertgebouw Orchestra – 1974

EMI

EMI, label anglais issu de la firme Deutsche Grammophon à la fin de la première Guerre Mondiale, comptait parmi ses ingénieurs Alan Blumlein, un pionnier de la stéréophonie. C’est lui qui a inventé et développé le système « Stereosonic » (aussi appelé Blumlein), constitué de deux microphones coïncidents bidirectionnels, positionnés avec un angle de 90 degrés. Cette technique a été reprise par les successeurs d’Alan Blumlein qui travaillaient pour EMI, et est devenu le principal système utilisé par la firme.

Le choix de ce type de système basé sur le principe de la stéréophonie d’intensité, tout comme le système XY choisi par Deutsche Grammophon, est donc différent de celui fait par Decca ou par Philips, d’un système qui fait intervenir la stéréophonie de temps.

Ecoutes proposées :

Franz Schubert, Symphonie N°9 – Herbert von Karajan – Berliner Philharmoniker – 1978 EMI

Deutsche Grammophon

Deutsche Grammophon est un label allemand, basé à Hanovre, et fondé en 1898 par les frères Emil et Joseph Berliner.

L’histoire sonore de Deutsche Grammophon est extrêmement liée au chef d’orchestre Herbert van Karajan et son ingénieur du son Günther Hermanns. Günther Hermanns explique que jusqu’à la fin des années 1950, le son « Karajan-DG » ne se distingue pas encore de EMI ou Decca. C’est à partir des années 1960 que Günther Hermanns et Herbert von Karajan vont réellement développer au fil des nombreux enregistrements effectués ensemble l’esthétique qui deviendra la signature du label.

En particulier, Herbert von Karajan voulait tirer tout le profit des innovations technologiques de son époque. Günther Hermanns a donc développé une technique multimicrophonique, et Herbert von Karajan intervenait directement dans les choix de mixage en modifiant l’équilibre de l’orchestre grâce aux microphones d’appoint.

La technique de Deutsche Grammophon résidait généralement dans l’emploi d’un système coïncident XY comme système principal et de nombreux appoints pour préciser les instruments.

Fig. 1.10 – Utilisation d’un syst`eme XY lors d’un enregistrement Deutsche Grammophon Crédits photo : [17]

Pour de nombreux enregistrements, Deutsche Grammophon utilisait les studios Emil Berliner ou l’église Jesus-Christus de Berlin. Beaucoup d’enregistrements ont aussi été réalisés dans des salles comme le Musikverein de Vienne, la Philharmonie de Berlin, …

L’esthétique Deutsche Grammophon développée par Karajan et Hermanns est celle d’un beau son, d’un mélange équilibré sans aspérité ni agressivité [17]. En comparaison, Günther Breest explique que Decca a toujours été plus audacieux. Günther Hermanns précise aussi que l’esthétique Deutsche Grammophon n’était pas toujours fidèle à la réalité des concerts :

Ce style si caractéristique, que d’aucuns qualifiaient de « sans conflit », comme au-delà de l’humain, détermine toutefois un style apollinien qui ne correspond pas toujours à la vérité des concerts, plus engagés, plus fiévreux, plus violents, parfois presque à l’excès… Autant d’éléments qui nous poussent à évoquer la spécificité du son Deutsche Grammophon dans ces années de gloire.

Figure 1.11 – Enregistrement Deutsche Grammophon à la Jesus-Christus-Kirche, Dahlem, Berlin – Crédits photo : [17]

Ecoutes proposées :

Felix Mendelssohn, Symphonie N°4 – Herbert von Karajan – Berliner Philharmoniker – Deutsche Grammophon 1973 (Piste n° 11)

Ludwig van Beethoven, Symphonie N°1 – Herbert von Karajan – Berliner Philharmoniker – Deutsche Grammophon 1974 (Piste n° 18)

Hector Berlioz, Harold en Italie – Lorin Maazel – Berliner Philharmoniker – Deutsche Grammophon 1985 (Piste n° 20)

2. Méthodologie

2.1. Objectifs

Nous avons vu en première partie que l’orchestre peut être considéré comme un instrument et développer sa propre identité sonore, et les implications que peuvent avoir différentes couleurs d’orchestre sur la prise de son. De la même manière, nous avons étudié les caractéristiques des différents lieux d’enregistrement, et l’impact que peut avoir l’acoustique du lieu sur les choix de prise de son.

Après avoir analysé les caractéristiques de quelques labels européens célèbres pendant l’âge d’or de l’enregistrement stéréophonique des années 1960 à 1980, on peut se demander comment la notion d’esthétique de labels a évolué, comment les différentes techniques de prise de son développées par chacun de ces labels ont été adoptées ou rejetées par les ingénieurs du son actuels, quelles techniques sont aujourd’hui utilisées pour la prise de son d’orchestre et quelles esthétiques sont recherchées par les ingénieurs du son. En effet, il n’existe pas de document répondant à ces problématiques, qui permette de mieux comprendre l’évolution des pratiques et regroupant des données sur les pratiques dans plusieurs pays européens.

Afin de répondre à ces questions, il est nécessaire de réaliser un état des lieux des pratiques actuelles dans le domaine de la prise de son d’orchestre. Cet état des lieux peut être réalisé de deux différentes manières : assister à un grand nombre d’enregistrements dans un grand nombre de salles différentes avec un grand nombre d’ingénieurs du son, ou interroger directement les ingénieurs du son sur leurs habitudes. La première méthode est compliquée à mettre en place pour des raisons pratiques, et la recherche a donc été axée sur des interviews d’ingénieurs du son. Ces interviews ont été complétées par l’observation de plusieurs productions (disque ou radio) lors de différents stages, en France et en Allemagne. Enfin, afin de lier les différentes problématiques étudiées à des exemples sonores, des écoutes critiques d’enregistrements ont été menées parallèlement à ce travail de regroupement d’informations.

2.2. Questionnaire

2.2.1. Participants

La recherche s’est portée plus précisément sur des ingénieurs du son de trois pays : France, Allemagne et Grande-Bretagne. La réduction du nombre de pays permettait d’obtenir une étude plus approfondie sur les habitudes de travail de prise de son dans chacun de ces pays.

Le questionnaire a été envoyé par e-mail à 41 ingénieurs du son (19 Français, 15 Allemands, et 7 Anglais). Les sujets ont été choisis afin d’obtenir un échantillon d’ingénieurs du son expérimentés travaillant dans chacun de ces pays, ayant une pratique régulière de la prise de son d’orchestre. Il a donc été envoyé à des personnes travaillant en radio, d’autres en studio, et d’autres en freelance, issus de formations différentes (y compris des ingénieurs du son n’ayant pas reçu de formation institutionnelle).

23 participants ont renvoyé le questionnaire avec leurs réponses, entre le mois de février et le mois d’avril. Une autre personne a prévenu qu’elle ne souhaitait pas répondre, car ne travaillant pas suffisamment dans le domaine de l’enregistrement d’orchestre symphonique, elle ne s’estimait pas pertinente pour ce sujet. Enfin, trois autres personnes ont souhaité répondre à l’oral. Seulement deux de ces trois entretiens ont pu être menés. Cela permet donc de totaliser 25 réponses, dont 12 en France, 10 en Allemagne, et 3 en Grande-Bretagne. La liste des participants au questionnaire est disponible en Annexe A.

Le nombre de réponses obtenues ne permet pas de généraliser les résultats de manière statistique. Cependant, les ingénieurs du son interviewés sont des professionnels reconnus dans le milieu et travaillant sur un nombre important de productions. Observer les pratiques de ces ingénieurs ne donne donc pas seulement des informations ponctuelles sur quelques cas particuliers, mais offre au contraire une très bonne vision de l’état actuel des techniques et esthétiques de prise de son dans ces pays.

Dans le chapitre suivant, les citations des participants seront codées par une lettre et un chiffre, correspondant au pays et au numéro de participant. Par exemple, (F4=French4) pour le 4ème participant français, (G2=German2) pour le 2ème participant allemand, ou (E1=English1) pour le 1er participant anglais.

2.2.2. Élaboration du questionnaire

L’objectif du questionnaire était de recueillir des informations sur les habitudes de travail et les choix esthétiques des ingénieurs du son. Leur évolution esthétique, leur expérience professionnelle au sein de différentes firmes, ainsi que leur avis sur l’existence d’écoles de prise de son ont aussi été étudiés dans ce questionnaire.

Le questionnaire a été construit en quatre parties :
- une partie permettant de recueillir des informations sur la formation des participants, les choix esthétiques et techniques qui en sont issus, etc.
- une partie pour interroger leur esthétique pour la prise de son d’orchestre, leur expérience au sein de différentes firmes, radios, etc.
- une partie interrogeant plus précisément leurs habitudes pratiques de prise de son et de mixage. Cette question a été réduite au cas particulier d’une symphonie de Beethoven, pour obtenir des résultats plus concrets et avoir des résultats correspondants tous au même style musical.
- enfin, une partie rassemblant quelques questions complémentaires, plus générales.
Certaines questions ont été inspirées du questionnaire réalisé par Elisabeth Kemper dans son mémoire de fin d’études de l’Erich-Tienhaus-Institut der Hochschule für Musik Detmold [7].

Le questionnaire a ensuite été traduit en anglais et en allemand, afin que les ingénieurs du son puissent y répondre dans la langue qu’ils souhaitent, et ainsi ne pas avoir de limitation due à la langue dans les réponses.

La version française est disponible en annexe B.

2.3. Écoutes d’enregistrements

Afin d’illustrer par des exemples sonores les différentes notions étudiées tout au long de ce travail de recherche, j’ai mené parallèlement à ces interviews un travail d’écoute critique de nombreux enregistrements.

Dans le but de faciliter le travail comparatif, l’étude a d’abord été centrée sur des enregistrements de symphonies de Beethoven. Ces symphonies ont été choisies car elles font partie des œuvres les plus enregistrées, par un grand nombre d’orchestres, de chefs, de labels… Par la suite, la comparaison a été étendue à d’autres œuvres du XIXᵉ siècle (symphonies de Schubert, œuvres symphoniques de Berlioz, symphonies de Mahler…). En effet, malgré le fait que beaucoup d’ingénieurs du son indiquent adapter leur esthétique à l’œuvre enregistrée, j’ai pu constater que dans cette période, les différences constatées entre les différents labels sont semblables quelle que soit l’œuvre concernée. L’élargissement à plusieurs compositeurs a ainsi permis d’augmenter la base de données d’écoutes.

Les enregistrements ont été analysés en complétant deux grilles d’écoute. La première est une grille permettant de rassembler les données liées à l’enregistrement : œuvre, orchestre, chef d’orchestre, salle, date d’enregistrement, ingénieur du son, directeur artistique, et remarques diverses (enregistrement live, …). Il n’a cependant pas toujours été possible d’obtenir toutes ces informations. En effet, certains livrets de disque ne précisent pas le lieu d’enregistrement, ou bien l’ingénieur du son et le directeur artistique.

La deuxième est une grille d’écoute critique, composée de critères tels que largeur, profondeur, relief, localisation, acoustique, équilibre spectral, balance, intelligibilité… Les critères complets sont disponibles en Annexe C.

À l’issue de ces écoutes, j’ai pu, en croisant les données de ces deux grilles, déterminer des caractéristiques propres à certains critères (labels par exemple), et ainsi sélectionner les extraits qui sont proposés pour illustrer certains aspects de mon travail de recherche (à l’exception des exemples sonores du chapitre 1.1.2, qui sont issus de [3])

Pour des raisons pratiques d’accès aux archives, la comparaison d’enregistrements s’est portée principalement sur des enregistrements discographiques et assez peu sur des enregistrements radiophoniques. Ceci limite donc les possibilités de tirer d’après ces écoutes des conclusions concernant les enregistrements radiophoniques.

3. Résultats du questionnaire

3.1. Les différentes esthétiques

3.1.1. La question du réalisme et du naturel

Nous avons vu dans le chapitre 1.2.2 que l’idéal visé par certains ingénieurs du son est la fidélité.

Seuls deux des ingénieurs interviewés recherchent la fidélité, et l’un d’eux cite même le concept de best seat in the hall. (E1)

En revanche, 8 ingénieurs revendiquent un goût pour les prises de son « naturelles » ou bien encore cohérentes, rationnelles, ce qui n’implique pas forcément pour eux la notion de réalisme :

Goût pour une image naturelle mais pas forcément fidèle. (F1)

Cela doit rester naturel¹³ (G3)

Mon goût en matière de prise de son est de reproduire une prestation qui sonne naturelle.¹⁴ (E1)

[J’aime les images] plutôt « spectaculaires », tant que ça reste naturel¹⁵ (G9)

Mon goût pour la mesure et le rationnel… (F5)

[Je cherche un] placement cohérent pour la musique classique (F3)

Pendant des années, j’ai cru qu’il fallait reproduire la réalité. J’ai essayé de le faire, c’est quasiment impossible. Il faut faire quelque chose qui s’éloigne de la réalité mais qui soit cohérent. (F11)

D’autre part, certains évoquent la notion de réalisme, mais pour la rejeter :

Le réalisme de la largeur d’orchestre n’a pas de sens à mes yeux car l’expérience qu’on en a depuis une salle n’est jamais la même. (F3)

Le confort d’écoute est plus important que le réalisme. (F8)

Je ne crois pas en l’idée d’essayer de capturer la « meilleure place de la salle », qui est un argument (erroné et fallacieux) que l’on entend souvent.¹⁶ (E2)

Le réalisme est ennuyeux. (G10)

Enfin, plusieurs ingénieurs du son évoquent la différence de vécu entre l’écoute d’un concert et l’écoute d’un disque, et plus particulièrement la problématique de la vision.

Dans un environnement de concert, l’œil guide l’oreille.¹⁷ (E2)

L’image sonore est une image. Elle doit montrer ce que l’auditeur CROIT avoir entendu (en réalité, il a entendu, plus vu, plus vécu, plus ???).¹⁸ (G8)

3.1.2. S’éloigner de la réalité du concert

Plusieurs ingénieurs du son ont des approches esthétiques qui tendent à s’éloigner de la réalité vécue par le spectateur d’un concert. Cette approche est souvent associée à un souhait d’image sonore spectaculaire.

J’aime les enregistrements directs, pleins d’effets, et spectaculaires, qui ne sont pas trop réverbérés, sans cependant perdre le son chaud et ouvert…¹⁹ (G3)

[J’aime l’] Extra-largeur dans une certaine mesure. […] [Je privilégie] le timbre par rapport au réalisme de l’image. (F7)

Le travail de l’ingénieur est de créer l’illusion de la réalité. Le son enregistré doit impliquer et exciter l’auditeur, qui n’a pas l’expérience de l’environnement de concert.²⁰ (E2)

[Placements, largeurs, etc :] à mon sens tout est permis. (F8)

J’ai une tendance pour le réalisme spectaculaire, qui se traduit par la volonté de mettre l’auditeur à la place du chef d’orchestre et non pas forcément dans la salle de concert. Ce choix esthétique nécessite par conséquent une image large, voire extra-large. […] J’ai également tendance à exagérer les plans en profondeur. (F10)

3.1.3. Influences

Il a été demandé aux ingénieurs du son quelles étaient leurs influences et on retrouve trois influences principales : la formation, les expériences professionnelles (stages et assistanat), et enfin la pratique instrumentale et l’écoute de disques et de concerts.

Formation

Quelques ingénieurs du son n’ont pas suivi de formation institutionnelle et ont appris leur travail directement par la pratique. Cependant, un grand nombre d’ingénieurs estiment que leur formation a eu une influence sur leur esthétique ou sur leurs habitudes, influence dont l’importance varie selon les personnes :

Le Conservatoire a forcément formé mon écoute et mes premiers réflexes de choix de microphonie. (F2)

Il y a deux grandes sources à mes critères esthétiques, dans deux cours pendant les études. Dans un cours, nous avons écouté de la musique de tous genres sur une très bonne installation, […] comparé les esthétiques d’enregistrement de différents orchestres dans différentes salles, appris à nous concentrer uniquement sur les basses, sur la perception de la salle, sur la profondeur, sur la résolution des aigus, etc. Le second est un cours d’acoustique. Durant le cours, nous avons enregistré de la musique pour guitare, la même pièce avec le même musicien et le même micro, dans 10 studios d’enregistrement de taille différente, et comparé ces enregistrements. […] Ce travail influence encore aujourd’hui mon travail dans les productions musicales.²¹ (G2)

Oui, Detmold est la source [de mes critères esthétiques].²² (G7)

Le plus intéressant reste les idées de Christian Briguet au CNR [Conservatoire National de Région] de Boulogne Billancourt. (F6)

Les études m’ont donné des suggestions pour développer un style personnel dans l’esthétique sonore.²³ (G6)

Ma formation m’a évidemment donné les bases intellectuelles et théoriques pour pouvoir travailler mais ne m’a pas réellement donné d’esthétique. […] J’ai donc pu rapidement développer mes propres critères en prise de son et direction artistique, critères souvent opposés à l’enseignement reçu, d’ailleurs. (F3)

Les esthétiques sonores défendues à Detmold n’étaient pas les miennes. (F4)

Stages et assistanat

Si la formation est une des sources esthétiques pour un certain nombre d’ingénieurs du son, ils indiquent tous que les stages qu’ils ont effectués ou les années d’assistanat ont eu une grande influence sur eux. Ainsi, la plupart d’entre eux cite quelques professionnels dont le travail les a particulièrement marqués.

D’autre part, plusieurs d’entre eux évoquent une formation interne à certaines firmes dans lesquelles ils ont travaillé. Ainsi, l’ingénieur (E1) explique avoir été formé par les membres plus âgés de Decca. Il explique que les techniques Decca étaient transmises de génération en génération, et qu’un jeune ingénieur était immergé dans le Decca Sound, par du travail de mastering, de montage, et de fabrication de vinyles, avant de pouvoir faire lui-même ses propres enregistrements pour la firme.

L’ingénieur (F9) explique quant à lui qu’il n’a pas suivi de formation institutionnelle et qu’il a été formé par assistanat. Au début de sa carrière, il avait régulièrement des discussions et des bilans de qualité avec les ingénieurs qui l’avaient formé, ce qui lui a permis d’établir pendant cette période les fondements de ses choix esthétiques.

D’autres ingénieurs du son indiquent eux aussi avoir été formés par une entreprise particulière, pour laquelle ils travaillent toujours : la WDR, Radio Classique, Radio France, Naïve, Abbey Road Studios, EMI, Teldec/Teldex…

Pratique musicale, écoute de concerts et de disques

La plupart des ingénieurs du son interrogés estiment que leur pratique musicale influence grandement leur esthétique. Ils font ainsi état de la pratique d’un instrument, mais aussi de la musique d’ensemble, que ce soit en musique classique (formation de chambre, en orchestre, ou en chœur) ou dans d’autres styles musicaux.

D’autre part, plusieurs ingénieurs du son indiquent que la visite fréquente de concerts, depuis leur plus jeune âge, influence énormément leur esthétique sonore.

Enfin, l’écoute de disques est aussi une influence importante. Ainsi, si la plupart d’entre eux se dit influencée par la tradition d’enregistrement de la musique symphonique, d’autres évoquent aussi leur goût pour d’autres styles de musiques (pop, rock, jazz, musiques électroniques, musique de film, …). L’ingénieur (F11) explique aussi que l’écoute de nombreux disques en particulier au début de sa carrière lui a permis de développer sa propre esthétique. L’écoute d’un très grand nombre d’enregistrements de labels différents lui a permis de se faire sa propre idée de la prise de son d’orchestre et il explique qu’il a par exemple très vite été marqué par certaines écoles de son, notamment l’école anglaise.

L’ingénieur (F5) explique quant à lui que sa culture des musiques dites actuelles lui a donné un goût particulier pour les spectres larges et les ambiances très définies.

3.1.4. Évolution esthétique

Nous avons vu quelles sont les sources esthétiques des ingénieurs interviewés. Cependant, il est important de se demander aussi comment cette esthétique a évolué au fil des années, avec l’expérience et après de nombreux enregistrements.

À la question de savoir si les ingénieurs du son cherchent à s’inscrire dans une continuité esthétique, et si leur esthétique a évolué au fil des années, la plupart d’entre eux estiment qu’il y a bien une évolution.

3 ingénieurs du son indiquent ne pas chercher à s’inscrire dans une continuité esthétique, et que leur esthétique dépend principalement du projet.

19 ingénieurs observent une évolution dans leur esthétique. Parmi ces ingénieurs, deux estiment cependant qu’en réalité, ce n’est pas leur esthétique qui a évolué, mais les moyens d’y parvenir.

Certains d’entre eux précisent qu’ils analysent cette évolution a posteriori, mais qu’elle a été très lente et qu’ils ne s’en sont pas rendu compte au fur et à mesure de leur carrière. Un seul ingénieur estime que son esthétique n’a pas évolué.

Certains participants donnent des pistes pour expliquer leur évolution. Deux d’entre eux estiment que leur esthétique a évolué en suivant certaines évolutions techniques. Ainsi l’un deux explique qu’il a de nouvelles attentes, créées par de nouveaux moyens (F5). Le second indique que l’expérimentation de nouvelles techniques de prise de son et de mixage sur des projets innovants fait évoluer son approche des projets plus conventionnels (F10).

Deux autres participants expliquent que leur évolution esthétique est due à une meilleure compréhension de la partition (G5) et (F9). Beaucoup évoquent des rencontres avec d’autres professionnels ou des musiciens, et surtout les années de pratique et d’expérience professionnelle.

Enfin, quelques participants donnent plus de détails sur leur évolution esthétique :

J’ai évolué en essayant de concilier l’espace et le relief avec la précision et le timbre. (F1)

J’ai beaucoup enregistré de la musique ancienne ces dernières années, ce qui m’a amenée à développer une esthétique de plus grande proximité, avec une très grande définition, très liée à la précision qu’on entend sur un continuo, par exemple. (F2)

Avec le métier, je sais de plus en plus ce que je recherche et j’y arrive mieux. Par contre, je pense qu’au début je faisais des prises de son plus proches que maintenant, et que j’ai appris à maîtriser la prise de son lointaine avec le temps. (F4)

Dans les années 80, les enregistrements d’orchestre étaient très globaux et neutres. Aujourd’hui, je cherche un son […] structuré et clair, avec le plus possible une grande acoustique. Aujourd’hui, mes microphones d’appoint sont plus proches des instruments, mais sont retardés et le système principal est plus fort dans le mix.²⁴ (G8)

Je suis plus sensible à l’architecture musicale et la structure instrumentale, c’est-à-dire avec une partition plus évidente à l’écoute sans perdre les autres critères d’esthétique sonore. (F9)

J’ai évolué de quelque chose d’assez proche à quelque chose de plus global, jusqu’à l’excès, puis je suis revenu un peu plus proche. (F11)

3.1.5. Critères objectifs/critères subjectifs

Certains ingénieurs du son interrogés évoquent la distinction entre des critères objectifs et des critères subjectifs d’analyse sonore.

D’autre part, plusieurs participants estiment que le fait de respecter la partition réduit la part de choix et de subjectivité de l’ingénieur du son. En effet, ils expliquent que la balance doit respecter la partition et que le style musical détermine l’esthétique sonore.

Je pense que le fait de respecter la logique musicale amène une certaine objectivation des choix techniques et esthétiques et réduit la part de goût personnel dans le travail. (F3)

Je fais la différence entre critères objectifs et subjectifs. Les erreurs sonores objectives (par ex. erreurs de balance, de localisation ou de panoramiques), je ne les admets pas.²⁵ (G8)

Pour le professionnel, le goût se traduit par une gestion de la qualité. Pour l’orchestre comme pour les autres formations instrumentales, la qualité sonore est constituée d’une composante objective plutôt technique, basée sur des critères clairement définis, voire mesurables, inclus dans les connaissances du métier et aussi sur les références de l’environnement de l’enregistrement (le répertoire, le genre, l’objectif du produit audiovisuel, le support…). Il y a une autre composante, subjective celle-là, plus personnelle, influencée par nos « états d’âme », nos maitres à penser de la prise de son, les phénomènes de mode esthétique et notre cadre culturel en mutation. […] Notre tâche sera de réduire au mieux cette partie aléatoire pour une bonne analyse. (F9)

3.1.6. Classement des critères d’analyse sonore

Il a été demandé aux participants de classer les critères suivants, selon l’ordre d’importance selon eux : respect de l’image sonore (largeur, profondeur, localisation, …), espace (réverbération,…), homogénéité, définition, timbre, équilibre spectral, balance, dynamique, naturel, recherche de spectaculaire, autres critères (à préciser)

La majorité d’entre eux a trouvé qu’il était assez difficile de répondre à cette question, estimant que tous ces critères étaient importants. Cependant, 15 participants ont tout de même répondu et rangé ces critères par ordre d’importance. Certains n’ont cité que quelques critères (au minimum 3) et d’autres les ont tous rangés. Pour prendre en compte ces deux types de résultats, deux analyses ont été faites. La première consiste à dénombrer le nombre de fois où chaque critère figure parmi les trois premiers de la liste. La seconde a consisté à pondérer chaque critère par son numéro d’ordre, sur une échelle de 1 à 10 (10 points pour le premier critère, 9 pour le second, etc). Les résultats de chacune de ces analyses sont présentés pour la totalité des participants, puis par pays (Allemagne et France). Les résultats ont été normalisés pour être comparables pour chaque pays malgré le nombre différent d’ingénieurs français et allemands.

Les Figures 3.1 et 3.2 permettent d’analyser les critères considérés comme étant les plus importants dans le cas d’une prise de son d’orchestre symphonique. La figure 3.2 donne des résultats plus homogènes entre les critères, puisqu’elle prend aussi en compte ceux qui ne sont pas cités comme les plus importants. Cependant, on remarque certaines constantes sur ces deux graphiques. Ainsi, on peut affirmer que les 5 critères jugés les plus importants sont le timbre, l’image, l’acoustique, l’homogénéité, et la balance. En revanche, la recherche de spectaculaire par exemple n’est pas un critère prioritaire.

Fig. 3.1 – Critères cités parmi les trois les plus importants

Fig. 3.2 – Critères avec pondération selon l’ordre

Les figures 3.3 et 3.4 montrent que quelque soit le pays étudié, on retrouve ces 5 mêmes critères comme étant les plus importants. Cependant, il est intéressant de noter quelques différences entre les critères cités par les ingénieurs du son français et allemands. Ainsi, on remarque que même si l’importance de certains critères est jugée de la même manière (image, acoustique, balance), les ingénieurs du son français semblent accorder plus d’importance à la question du timbre et de l’équilibre spectral, et les ingénieurs allemands plus d’importance à la recherche de « naturel ».

Fig. 3.3 – Critères cités parmi les trois les plus importants, par pays

Fig. 3.4 – Critères avec pondération selon l’ordre, par pays

3.2. Les différentes techniques

3.2.1. Systèmes principaux

La quasi-totalité des ingénieurs du son interrogés utilisent un système principal en Decca tree ou en couple AB avec des micros omnidirectionnels. La plupart d’entre eux complète ce système principal par des ailes, ou « outriggers ».

3 d’entre eux utilisent principalement un Decca tree. (G1, G5 et G8)

10 utilisent principalement un couple AB (F1, F2, F3, F5, F7, F10, F11, F12, G6, G7). L’ingénieur (G10) utilise quant à lui une combinaison de ces deux types de systèmes. Ainsi il explique que le Decca tree et le couple AB qu’il utilise sont chacun inutilisables seuls (car il place le decca tree trop près pour fonctionner en autonomie et le AB trop loin) et que c’est par la combinaison de ces deux systèmes qu’il construit la base de sa balance.

Enfin, quatre ingénieurs (E1, F8, G4 et G9) utilisent un nombre variable de micros pour leur système principal, le système étant en particulier choisi en fonction de la salle. Ainsi, E1 explique avoir deux systèmes de prise de son : l’un avec un decca tree lorsqu’il travaille dans des salles ayant une bonne acoustique, et l’autre avec un couple AB lorsqu’il travaille dans des salles ayant une moins bonne acoustique. (G4) explique pour sa part installer systématiquement un triangle Decca, mais dont il n’utilise le centre que pour le mixage en surround.

Seul l’ingénieur du son (E2) indique utiliser un système principal coïncident, avec des microphones hyper-cardioïdes, complété par des ailes.

3.2.2. Appoints

Les ingénieurs du son interrogés utilisent tous des appoints pour préciser certains instruments. Certains ont des configurations assez minimalistes (couple principal + couple de fond de scène + quelques appoints si nécessaires pour (F5) par exemple), d’autres des configurations plus chargées (deux appoints par groupe de cordes, appoints sur les bois, les cuivres, les timbales, etc). Il semblerait que cela ne dépende ni du pays dont vient l’ingénieur du son, ni du média pour lequel il travaille. En revanche, plusieurs personnes précisent que c’est le système principal qui fait la plus grande partie du son, et ce plus encore lorsqu’ils se trouvent dans une bonne salle.

10 ingénieurs ont précisé la directivité qu’ils utilisent de préférence pour leurs microphones d’appoint. Il est tout de même intéressant de noter que, indépendamment du type de média pour lequel ils travaillent, des tendances peuvent se retrouver selon le pays. Ainsi, si l’on s’intéresse aux appoints cordes, les ingénieurs du son allemands ayant répondu (G4 et G5) indiquent préférer travailler avec des appoints cardioïdes. En revanche, parmi les 6 ingénieurs du son français ayant indiqué le type de directivité privilégiée, quatre indiquent utiliser des microphones infracardioïdes (F2, F7, F11, F12), et deux ingénieurs français indiquent même privilégier les appoints omnidirectionnels.

3.2.3. Mixage

Alignement temporel des appoints avec le système principal (Delays)

En ce qui concerne l’utilisation de delays, on note trois catégories de personnes : ceux qui les utilisent systématiquement (9 ingénieurs), ceux qui ne les utilisent presque jamais (3 ingénieurs), et ceux qui décident au cas par cas de les mettre sur certains micros et pas sur d’autres (8 ingénieurs).

Plusieurs ingénieurs du son font remarquer l’usage assez récent du delay, et expliquent qu’ils n’ont pas appris la prise de son d’orchestre en utilisant des delays. Ils expliquent qu’il y avait d’ailleurs un certain avantage, qui consistait à régler le problème dès l’enregistrement, et non pas au mixage : il y avait des problèmes de phase, mais on apprenait à placer les micros (F11) ou encore : La phase n’est jamais un problème dont je m’occupe – si ça ne sonne pas bien, je déplace le micro.²⁶ (E2)

Un autre ingénieur du son explique qu’en Allemagne, en ce qui concerne l’utilisation de delays, il y a longtemps eu deux traditions différentes dans les écoles de Tonmeister de Detmold et Berlin. Ainsi, les étudiants de Detmold étaient formés à une technique utilisant beaucoup de delays, alors que ceux de Berlin n’y étaient pas du tout formés.

De plus, lors de l’utilisation de delays, il y a de nouveau deux catégories de personnes qui se distinguent : ceux utilisant des delays exacts qu’ils ont mesurés, et ceux utilisant des delays estimés.

Enfin, certains ingénieurs expliquent que selon eux, l’utilisation de delays, bien que parfois utile, peut avoir pour conséquence d’aplatir le mix et de le rendre ennuyeux. (F11, E3)

Réverbération

Tous les ingénieurs du son participants utilisent de la réverbération artificielle, que ce soit pour allonger la réverbération naturelle, pour créer une réverbération dans le cas d’une salle peu réverbérante, pour intégrer des appoints, etc.

Les ingénieurs (F2), (F4), (F5) et (F11) précisent qu’ils utilisent une réverbération à convolution sous la forme de plug-in (pour la plupart, il s’agit d’une Altiverb). Les ingénieurs (E1), (G4), (G6) et (F8) indiquent eux utiliser des réverbérations artificielles sous forme de hardware (Lexicon 480, 960, TC Electronic, Bricasti M7 ou encore EMT240). Trois autres (F12, G10 et E3) indiquent se servir à la fois des plug-in et du matériel hardware (l’un d’eux explique que pour du mix direct pour la radio, il utilise du hardware, mais pour la post-production, un plug-in).

À première vue, il semblerait que les Français interrogés aient plus tendance à se servir de réverbération sous forme de plug-in que les Allemands ou anglais. Cependant, l’explication est probablement différente : les ingénieurs déclarant utiliser des plug-ins sont tous des ingénieurs du son qui travaillent de manière indépendante, surtout pour le disque. En revanche, les ingénieurs se servant de réverbération hardware sont quasiment tous employés par une structure (studio ou radio). Il semble donc logique que les structures (qui ont des locaux dédiés et des moyens plus grands que des ingénieurs indépendants) aient la possibilité d’investir dans du matériel hardware. A contrario, les ingénieurs du son indépendants, qui ont besoin d’être plus mobiles, sont amenés à travailler à domicile et ont des budgets plus limités, choisissent de travailler avec des plug-ins.

Autres outils

En ce qui concerne le suivi des appoints, il y a unanimité sur le fait que le mixage de base doit fonctionner pour une grande part de l’œuvre sans faire de suivi. Cependant, alors que certains ingénieurs ne font aucun suivi, afin de respecter l’équilibre choisi par le chef, une grande partie s’autorise tout de même des suivis sur certains appoints, lors des interventions solistes en particulier.

En ce qui concerne l’utilisation d’égalisation et de compression, on trouve toute la gamme d’utilisation, de l’approche consistant à ne les utiliser que sur certains appoints particuliers, dans des cas particuliers, à l’approche consistant à utiliser systématiquement des filtres (outil utilisé assez fréquemment par beaucoup d’ingénieurs du son) et des égalisations sur tous les appoints et éventuellement le couple, ainsi que de la compression dès que jugée nécessaire.

3.3. Les « écoles » de prise de son

Les ingénieurs du son ont été invités à répondre directement à la problématique de ce mémoire, c’est-à-dire à donner leur avis sur l’existence d’écoles de prise de son de nos jours et à les caractériser.

9 ingénieurs du son estiment qu’il existe aujourd’hui différentes écoles de prise de son, et 7 pensent que ces écoles n’existent pas de nos jours. Pour ceux qui penchent en faveur de l’existence d’écoles, plusieurs types de caractérisation sont donnés :

Je pense qu’il y a différentes écoles – probablement en grande partie polarisées autour de l’opposition entre techniques multi-microphoniques et techniques minimalistes.²⁷ (E2)

Je pense qu’il y a des écoles de prises de son qui sont caractérisées par le choix des micros et leurs placements. (F7)

L’ingénieur (G10) explique qu’il y a différentes traditions de prise de son liées à des formations et/ou labels particuliers. Ainsi, il précise que les formations de Detmold et de Berlin ont des traditions différentes (par exemple pour l’utilisation des delays ou d’autres outils).

Il met aussi en lumière des réseaux particuliers qui existent entre certains studios et ces formations : ainsi, il existe un lien fort entre le studio Emil Berliner (ancien studio de Deutsche Grammophon) et l’Erich-Tienhaus-Institut de Detmold, et un lien semblable entre le studio Teldex et l’Université de Berlin. Les ingénieurs travaillant au studio Emil Berliner sont en grande partie issus de la formation de Detmold, et certains d’entre eux sont aujourd’hui enseignants dans cette formation. De même, tous les ingénieurs travaillant au studio Teldex sont issus de la formation berlinoise, et certains y enseignent.

Cependant, (G10) précise que de nos jours, les formations sont plus nombreuses et diversifiées, ce qui a tendance à faire disparaître ce type de lien formation-entreprise.

3.3.1. Esthétiques propres à un pays

Effectivement en Allemagne par ex., je trouve que d’une façon générale l’esthétique est d’enregistrer la source sonore de plus loin. (F4)

Les ingénieurs russes ont la réputation d’un son très précis et vibrant.²⁸ (E1)

3.3.2. Habitudes propres à un secteur professionnel

Une radio ne travaille pas de la même manière que pour le disque (F11)

Je dirais que l’esthétique entendue sur les captations radio est plus synthétique, fidèle à un rendu réaliste, par opposition à celle du disque, plus analytique, en proximité. (F2)

Et il y a certainement un ‘style’ particulier pour les ingénieurs radio – principalement caractérisé par une configuration de microphones omnidirectionnels. […] Je pense que les ingénieurs de radio recherchent probablement plus un son ‘naturel’ de concert.²⁹ (E2)

Aujourd’hui, comme on fait appel en permanence à des freelances, il ne peut y avoir d’esthétique de son que dans des structures types radios publiques (F3)

Il y a une différence selon le mode de diffusion radio/production-CD, même quand on utilise les mêmes micros. Une production CD ne peut pas sonner comme un enregistrement radio. C’est en particulier dû aux contraintes de temps, et à l’absence de post-production sur une diffusion radio directe. (G10)

3.3.3. Mélange de plusieurs de ces critères

Des écoles peut-être pas, mais des usages, des habitudes qui diffèrent selon le parc de matériel disponible, le secteur professionnel (musique, captation, cinéma, radio…) et selon les pays (AKG en Angleterre, Sennheiser en Allemagne…). (F8)

Les ingénieurs de radio (particulièrement en Allemagne) semblent faire un mixage plus lointain et moins défini.³⁰ (E2)

Enfin, beaucoup d’ingénieurs du son évoquent les différentes esthétiques que l’on retrouve à l’intérieur d’un même secteur, c’est-à-dire les esthétiques propres à certains labels, certains studios ou certaines radios, que ce soit pour confirmer cette notion, ou bien pour rejeter l’existence de ces esthétiques :

3.3.4. Labels

Les labels historiques dont nous avons parlé dans le chapitre 1.2.3 (Decca, EMI, Philips, Deutsche Grammophon) sont cités par plusieurs ingénieurs du son :

EMI aimait les enregistrements avec un système principal coïncident, car Alan Blumlein était un de leurs ingénieurs.³¹ (G1)

Decca avait une forte esthétique sonore – le Son Decca. Usage général de la méthode d’enregistrement Decca Tree avec 4 ou 5 microphones omnis. La captation de l’acoustique naturelle était au cœur de chaque enregistrement.³² (E1)

[Deutsche Grammophon :] une vision totalement différente de l’enregistrement, avec une technique plus multi-microphonique et une utilisation de delays pour préciser un enregistrement.³³ (E1)

DG a eu une technique de prise de son pendant longtemps, avec les micros XY en principal avec énormément d’appoints. […] Ils travaillaient dans des très belles acoustiques. […] [Decca :] Il y avait une esthétique, un sens du relief, de la profondeur. […] il y a encore 25 ans, 30 ans, on pouvait reconnaître un enregistrement, Decca, DG, Philips. De nos jours, je pense que ça n’existe plus. (F11)

Dans la grande période de l’enregistrement, pendant les années 60 et 70, je dirais que EMI, Decca et DG avaient des styles propres définis.³⁴ (E3)

Je dirais que ce sont plus certaines maisons de disque du passé qui avait un son caractéristique (comme Decca pour l’orchestre et l’opéra dans les années 60/70). (F4)

Il n’y avait pas d’esthétique sonore spécifique à un label, même chez DG et EMI, bien qu’ils aient fait de la publicité exactement sur cette notion.³⁵ (G8)

Autres labels :

Label Aparte : Micros exclusivement DPA omnis. (F2)

Dans les années 90 [j’ai travaillé] pour Denon : oui, il y avait une esthétique sonore : avec peu de micros d’appoints, obtenir un effet de salle naturel. La recherche de naturel était un critère de premier plan.³⁶ (G7)

Les disques d’Harmonia Mundi étant aujourd’hui en grande partie enregistrés au studio Teldex ou par des équipes de ce studio, le son d’Harmonia Mundi est peut-être un peu celui de Teldex. (G10)

Hyperion a la réputation d’un certain type de son.³⁷ (E2)

Pour ma part, je n’ai jamais travaillé pour un client (éditeurs, TV, cinéma) qui m’imposait une esthétique sonore particulière. (F8)

Je n’ai pour l’instant jamais travaillé avec un label qui avait des directives précises en matière de son.³⁸ (G6)

[esthétique des labels] : Peut-être cela est-il vrai de certains labels historiques, mais la modification du marché du disque semble avoir chamboulé tout ça. (F3)

Sony Classical : pas d’esthétique de label³⁹ (G7)

Je ne pense pas que Naïve a une esthétique propre. Par contre chaque artiste en a une. (F7)

[Naïve :] Conditions trop variables d’un disque à l’autre pour définir une esthétique. (F2)

3.3.5. Les radios

À Radio France, il semble qu’il y ait eu une identité sonore très forte pendant les années 50 à 80, mais qui a évolué au fil de ces années, et qui est désormais nettement moins marquée. Cependant, on retrouve encore, de nos jours, certaines manières de travailler et une esthétique particulière décrite par l’ingénieur (F1).

Il y a évidemment un style Radio France, clairement assumé, développé consciemment et volontairement durant les années 60 à 80 au fil de nombreux tests et expériences. C’est l’archétype de la structure qui produit énormément d’enregistrements (plusieurs centaines par an) avec des orchestres et des salles identiques et est à même d’affiner un processus de manière exhaustive. (F3)

Il y a certainement une idée du son Radio France, mais elle a évolué au cours du temps. Il y a 25 ans par exemple, on utilisait une rampe d’omnies devant l’orchestre au lieu d’un couple et de grands AB, cela ne se fait plus aujourd’hui. Chez Radio-France, il y a des modes… (F4)

Radio France, c’était le couple ORTF et des ailes en omni, tout en Schoeps.[…] ils ont un certain type de matériel, des façons de faire, effectivement. A Radio France il y a eu pendant longtemps une école, une façon de faire, qui existe toujours aujourd’hui. A la RSR [Radio Suisse Romande] c’est pareil, ils ont des façons de travailler qu’on retrouve. (F11)

Il y a longtemps eu une esthétique de prise de son Radio France, que j’essaie de pérenniser […] : prises de son d’orchestre larges et profondes, beaucoup d’espace et de relief, étagement des plans, … (F1)

[J’ai travaillé à] Radio France de 1993 à 2000 : Il n’y avait déjà plus d’identité propre ou homogène comme dans les années 50-70.

À Radio Classique, il semblerait qu’il y ait aussi une recherche d’esthétique commune :

Quand je travaille pour Radio Classique, je fais en sorte de me conformer à l’esthétique de cette radio en terme de captation. […] L’esthétique radio classique [est] plutôt au réalisme : plans, placements cohérents dans l’image… (F12)

Je crois que Radio Classique a développé une esthétique sonore particulière. […] Je dirais qu’elle privilégie l’espace et la qualité des timbres avant toute chose. (F7)

Pour les autres radios citées par les ingénieurs du son, (WestDeutscher Rundfunk, Bayerischen Rundfunk, NordDeutscher Rundfunk, British Broadcasting Corporation), les avis sont parfois contradictoires :

J’étais en échange pendant 2 semaines à la BBC à Londres, et là-bas, on travaille exactement comme à la WDR.⁴⁰ (G3)

J’ai eu un Tonmeister de la BBC en invité, il voulait gérer toutes les interventions instrumentales (Appoints).⁴¹ (G8)

Oui, je trouve que la WDR (WestDeutscher Rundfunk) ou plutôt les radios allemandes ont une esthétique sonore propre (en comparaison avec les Pays-Bas, l’Angleterre, les USA ou le Japon par exemple).⁴² (G2)

WDR : pas d’esthétique caractéristique.⁴³ (G7)

Le travail comme Tonmeister à la Bayerischen Rundfunk m’a toujours laissé cette indépendance.⁴⁴ (G6)

NDR Hambourg : non, pas d’esthétique sonore, plutôt dépendant du directeur artistique et de l’ingénieur du son que de l’institution. BR Munich : vraisemblablement oui, j’ai pour le moment trop peu d’expérience [pour le dire].⁴⁵ (G9)

3.4. Contraintes extérieures

Il a été demandé aux ingénieurs du son de décrire les contraintes extérieures auxquelles ils sont soumis pour leurs enregistrements d’orchestre. Les contraintes économiques sont décrites comme ayant de plus en plus d’impact sur les conditions d’enregistrement. Elles se manifestent en particulier dans le choix de la salle et dans le temps accordé à l’installation, à la balance et aux prises.

Ainsi, les deux contraintes principales citées sont le temps, pour 14 ingénieurs, et la salle, pour 16 ingénieurs. Cependant, parmi les ingénieurs citant ces deux critères, il semble que la salle soit celui qui soit considéré comme le plus contraignant, en particulier par les ingénieurs français, là où les ingénieurs allemands regrettent parfois davantage le manque de temps.

3.4.1. La salle

Le lieu d’enregistrement est, de l’avis de tous les ingénieurs du son, d’une importance capitale en ce qui concerne le résultat final. En effet, plusieurs d’entre eux aiment pouvoir intégrer l’acoustique du lieu de captation (F10). L’ingénieur (E1) explique qu’en ce qui concerne Decca, dont un des objectifs était de capturer l’acoustique naturelle, le choix de la salle a évidemment joué une part importante dans le succès sonore.⁴⁶

Plusieurs ingénieurs estiment que la salle a plus d’importance sur l’esthétique sonore que la plupart des autres critères :

L’acoustique de la salle d’enregistrement a, à mon avis, plus d’influence sur le son que la vision esthétique, qui réside principalement sur la reproduction exacte de la partition.⁴⁷ (G5)

Pour moi, c’est plutôt d’abord l’orchestre et la salle qui font le son.

Quelques ingénieurs font aussi un lien direct entre des écoles de prise de son et des salles : ainsi, (F3) explique que si Radio France a pu développer une esthétique et une méthode propres, c’est en particulier grâce au fait de travailler toujours avec des orchestres identiques dans des salles identiques. Toujours concernant Radio France, (F1) donne une liste plus précise des salles généralement utilisées pour leurs enregistrements : la Salle Pleyel, le Théâtre des Champs Élysées, le théâtre du Châtelet, et le studio Olivier Messiaen de la Maison de la Radio. On voit donc que les ingénieurs de Radio France travaillent principalement dans un nombre limité de salles, ce qui permet de comprendre comment ils ont pu développer des techniques et esthétiques adaptées plus particulièrement à ces salles.

(G5) estime de la même manière que on développe des images sonores comparables si on enregistre toujours dans la même salle.⁴⁸

(F9) développe plus précisément ce lien entre esthétique de prise de son et type de salle utilisé pour la prise de son d’orchestre : Il y avait au début de la stéréophonie de véritables écoles de prise de son qui accompagnaient fréquemment les traditions acoustiques des salles de concert. De la grande salle de fête viennoise au théâtre à l’italienne, l’Europe a suivi des modèles différents que l’on a retrouvés en partie dans les choix esthétiques des captations sonores. Nous pouvions trouver à cette époque, le découpage traditionnel entre une Europe du sud et une Europe du nord où une fois encore, la France se situe à la croisée des chemins, la Grande Bretagne dans sa superbe originalité et l’Allemagne en reconstruction dans ces années 60/70 testant de nouvelles salles de concert.

(E3) explique de la même manière le lien entre l’esthétique de certains labels et les salles utilisées : Chacun [EMI, Decca, DG] était caractérisé principalement par les acoustiques qu’ils utilisaient – EMI avait les studios Abbey Road/ Decca avait certaines des plus belles salles de concert/ DG avait des acoustiques merveilleuses, particulièrement à Berlin, comme l’Eglise Jesus Christus à Dahlem.⁴⁹ (F11) note lui aussi que Deutsche Grammophon avait pour habitude de travailler dans de très belles acoustiques.

Certains ingénieurs donnent les qualités indispensables à une bonne salle pour la prise de son d’orchestre symphonique. Ainsi, (F3) explique que Pour un symphonique, un grand volume avec une belle couleur est nécessaire. Pour l’ingénieur (F11), la salle idéale est la salle où l’on peut prendre du recul, mais où on a une tellement bonne projection de la source sonore que malgré le recul on ne perd pas en précision.

Enfin, (F11) donne des détails sur les salles qu’il considère comme bonnes ou mauvaises pour la prise de son d’orchestre :

En Angleterre ils ont la chance d’avoir […] des très belles salles. […] [Autres bonnes salles :] au Victoria Hall à Genève, la réverbération est assez importante, mais très dense, on peut vraiment avoir de la profondeur et de la perspective ; Arsenal de Metz ; … […] de nos jours, il existe plus de mauvaises salles que de bonnes salles. (F11)

Adaptation à la salle

Afin de réaliser un enregistrement convenable dans une acoustique moyenne, les ingénieurs du son développent des techniques spécifiques.

Ainsi, (E1) explique qu’il a deux configurations de base au niveau microphonique : une configuration formée d’un decca tree avec deux ailes et un nombre restreint d’appoints (pas d’appoints sur les cordes, deux appoints sur les bois, …) pour les bonnes acoustiques, et une deuxième technique formée d’un couple AB et d’un nombre beaucoup plus élevé d’appoints (2 appoints sur les violons I, 2 sur les violons II, 1 alto, 1 violoncelle, 1 contre-basse, un appoint pour chaque section de bois, …). Ainsi, il explique le principe de son premier set-up : L’idée est d’obtenir une bonne image sonore globale par le placement correct des cinq micros omni principaux. Les appoints sont utilisés pour apporter un peu de précision aux différentes sections, plutôt que d’avoir un mixage construit uniquement à partir de ces appoints. La technique ci-dessus est totalement dépendante d’une bonne acoustique naturelle dans la salle.⁵⁰ C’est donc en raison de la dépendance du résultat à l’acoustique de la salle qu’il a dû développer une deuxième technique, qui accorde plus d’importance aux appoints.

D’autres techniques sont utilisées pour s’adapter à la salle : choix de micros principaux avec des colorations différentes, directivité des ailes, placement des micros d’ambiance, nombre des micros d’appoint, utilisation de réverbération artificielle pour améliorer une acoustique trop sèche (F3 précise cependant que dans le cas d’une réverbération naturelle trop longue, il est impossible de la contourner par utilisation de réverbération artificielle, et que la couleur de la réverbération naturelle est particulièrement importante), utilisation ou non de delays selon la taille de la scène.

3.4.2. Le temps

Les contraintes économiques et la baisse des budgets dédiés à la production musicale se manifestent aussi par la réduction de la durée de l’enregistrement. Ainsi, les productions studio sont de plus en plus rares et les captations sont donc de plus en plus des concerts enregistrés, avec enregistrement de la répétition générale et du concert pour permettre un minimum de montage, avec parfois une séance de corrections. Si le nombre de prises et le temps accordé à la direction artistique n’a pas d’influence directe sur l’esthétique sonore, mais plutôt sur le travail d’interprétation, la diminution du temps de balance en revanche a une influence directe sur l’esthétique sonore.

Le temps est le plus gros problème. Aujourd’hui, il faut avoir le son dès le début… Mais les meilleurs enregistrements sont ceux où l’on peut écouter dans la salle et avoir le temps d’ajuster les microphones.⁵¹ (E3)

Le manque de temps peut m’empêcher d’optimiser la position des microphones.⁵² (G2)

Il faudrait avoir plus de temps, mais c’est trop cher…⁵³ (G3)

Actuellement, dans le domaine de la production musicale et des concerts, le facteur temps joue un rôle de plus en plus grand. Le temps, c’est cher. Ceci crée de la pression sur l’équipe. Beaucoup de choses qui étaient auparavant réglées à l’enregistrement doivent aujourd’hui être faites en post-production.⁵⁴ (G6)

Ces deux contraintes sont les deux principales citées par les ingénieurs interrogés, mais certains en évoquent d’autres, rencontrées lors des enregistrements :
- la discrétion visuelle, pour les concerts qui sont aussi captés par une équipe vidéo, ou plus généralement pour tous les enregistrements se déroulant avec du public. Cette discrétion visuelle implique le choix de microphones plus petits, mais surtout de suspendre le système principal, ce qui le rend moins facile à régler finement et donc à optimiser.
- l’acoustique de la régie d’enregistrement, pour les ingénieurs utilisant des régies mobiles, installées dans des locaux rarement adaptés.
- les conditions d’écoute actuelles, sur de mauvais systèmes, sur des écouteurs, etc. qui obligent les ingénieurs à mixer avec des objectifs parfois opposés (doit-on mixer pour ces auditeurs ou pour les systèmes hifi de bonne qualité ?)
- la taille de l’équipe d’enregistrement
4. Discussions

Les avis des ingénieurs interviewés sont assez partagés quant à l’existence d’écoles de prise de son. L’existence d’une esthétique propre à certains labels historiques semble cependant faire consensus. En ce qui concerne les productions actuelles, plusieurs pistes de réflexions sont évoquées par les différents participants, et nous allons ici les développer.

4.1. Évolution de l’industrie musicale

Les contraintes économiques et la baisse des budgets accordés à la production musicale ont entraîné de grandes modifications du métier d’ingénieur du son pour l’orchestre depuis les années 1990.

Aujourd’hui, les labels font appel à des ingénieurs du son freelance, alors qu’il y a encore une quinzaine d’années, un grand nombre de labels embauchaient des ingénieurs du son qui faisaient tous leurs enregistrements.

Beaucoup d’ingénieurs du son travaillent donc aujourd’hui de manière indépendante, en tant que prestataires de service. Des ingénieurs avec des esthétiques et techniques très différentes peuvent travaillent pour un même label. Réciproquement, un même ingénieur est amené à travailler pour plusieurs labels différents, et il ne change pas sa technique ou son esthétique en fonction de son employeur. Il est donc beaucoup plus compliqué pour un label de développer sa propre identité sonore, ce qui était possible quand chaque firme travaillait avec une équipe fixe qui évoluait pendant de nombreuses années dans l’entreprise, utilisait un matériel commun, dans des lieux d’enregistrement spécifiques.

Une autre évolution des conditions de production consiste en la diminution du temps attribué à toutes les étapes d’un projet d’enregistrement : installation, balance, temps de prises, post-production. Un grand nombre d’ingénieurs du son indique en effet que le temps imparti pour chacune de ces étapes a énormément diminué depuis l’âge d’or de l’enregistrement des années 1960 aux années 1980. Ceci peut obliger les ingénieurs du son à faire des compromis par rapport à leur idéal esthétique. Ainsi, un temps de balance mais aussi de mixage plus restreint limitera les possibilités d’optimisation sonore, un temps d’installation très court pourra impliquer le choix d’un set-up plus léger, etc.

En France, l’évolution économique du domaine de la production musicale a entraîné un changement important du paysage phonographique depuis les années 1980. Outre quelques structures importantes (Harmonia Mundi, Naïve, …) on observe surtout une multiplication des petites structures, liées à un artiste ou un ingénieur du son (entre 100 et 110 labels pour la musique classique en France en 2004 [22]). Il est donc beaucoup plus difficile aujourd’hui de faire un état des lieux esthétique puisque le marché n’est plus réparti entre quelques gros labels ayant une identité forte, mais entre un grand nombre de petits labels indépendants. La répartition des ventes en France se répartissait en effet de cette manière en 2004 [22] : 25% des ventes sont constituées par les parutions des multinationales, 25% par les parutions de labels français indépendants, et la moitié restante par des labels indépendants étrangers.

Cette évolution des conditions d’enregistrement a modifié le métier d’ingénieur du son. On demande maintenant une très grande flexibilité pour s’adapter à de mauvaises acoustiques, à des temps de production plus courts… Les budgets dédiés à la location de matériel sont aussi plus faibles, ce qui implique des compromis à ce niveau aussi. Pour toutes ces raisons, beaucoup d’ingénieurs du son se plaignent de ne pas avoir les possibilités d’obtenir le résultat qu’ils visent, et regrettent de devoir faire trop de compromis. Cependant, certains ingénieurs du son rappellent aussi que c’est dans la difficulté, en rencontrant des contraintes de temps ou d’acoustique, qu’ils ont parfois été amenés à trouver des nouvelles solutions pour faire face à ces obstacles.

4.2. Peut-on encore parler d’esthétique de label ?

Malgré ce changement de modèle économique, certains labels tentent tout de même d’homogénéiser les productions qu’ils produisent. C’est le cas de Deutsche Grammophon par exemple, qui a rédigé un Yellow Book [23] regroupant des instructions techniques.

Ce carnet d’instructions est communiqué préalablement à tout enregistrement Deutsche Grammophon à l’équipe technique qui le réalisera. La plupart de ces instructions concernent le format d’enregistrement (96kHz, 24 bit), les dénominations et consignes pour l’archivage des rushes et des masters, les ambiances à mettre entre les pistes, le choix de conserver les applaudissements sur un enregistrement de concert… Cependant, on peut aussi, par exemple, y lire l’instruction suivante :

Les microphones d’appoint doivent être retardés dans le mix suivant leur distance respective au système principal. Idéalement, il faudrait enregistrer une « click take » pour chaque set-up microphonique pendant l’enregistrement.⁵⁵

Nous voyons dans cet exemple que le label impose une technique particulière aux ingénieurs du son, en l’occurrence l’utilisation de delays. De plus, la création d’un « click take » pour ces delaysimplique que les retards appliqués aux micros doivent être des retards exacts, correspondant à la distance réelle. Nous avions vu dans le chapitre 3.2.3 que l’utilisation de delays n’est pas une technique utilisée par tous les ingénieurs du son. D’autre part, le Yellow Book stipule que Deutsche Grammophon se réserve le droit de soumettre le master final à un contrôle de qualité. Ainsi, on voit que le label tente de garder un contrôle et un droit de regard sur les enregistrements réalisés, même si le label n’a plus sa propre équipe technique.

Malgré cette volonté de Deutsche Grammophon de contrôler les enregistrements qui paraissent sous le label, ces instructions ont tout de même un impact limité. En effet, il n’y a pas d’indication sur l’esthétique que doit respecter l’ingénieur du son (le contrôle se fait a posteriori), ni d’indication de techniques microphoniques à utiliser (système principal, appoints, …), et les possibilités techniques et esthétiques, même en respectant les instructions données, restent très nombreuses.

En dehors de ce Yellow Book de Deutsche Grammophon, nous avons vu que la plupart des ingénieurs du son interrogés se sentent plutôt libres d’exprimer leur goût en matière de prise de son, et qu’aucun d’entre eux n’affirme avoir reçu de directives en matière d’esthétique sonore lorsqu’il a travaillé avec des labels actuels.

Nous avons aussi vu que les labels ne possèdent plus leurs propres équipes techniques, et qu’ils font donc appel à différents prestataires de service, dont ils n’ont pas l’exclusivité. Ceci nous amène donc à penser que la notion d’esthétique de label est difficilement applicable de nos jours. Quelques exemples d’enregistrements actuels de la Symphonie No 4 de Mendelssohn : (Pistes no 14 à 17)

Il faut cependant noter l’apparition d’un nouveau type de labels, qui pourraient bien dans l’avenir développer une esthétique et technique propre. Il s’agit de labels qui ont été créés par des orchestres particuliers. On peut citer l’exemple du LSO Live [24], fondé en 2000 et dont le rôle est d’enregistrer les concerts du London Symphony Orchestra, ou encore celui du Berliner Philharmoniker Recordings, label qui vient d’être fondé dans la continuité de la plateforme de streaming vidéo « Digital Concert Hall » (2008), qui retransmet les concerts de la Philharmonie de Berlin, et plus particulièrement ceux du Philharmoniker Orchester. Le premier cycle de ce label sort le 23 mai 2014, il est donc encore impossible d’analyser une éventuelle esthétique du label. [25]

On peut tout de même penser que ces labels regroupent des conditions favorables au développement d’une esthétique propre : ils travaillent très souvent avec les mêmes équipes, ont leur propre matériel, enregistrent fréquemment dans la même salle (la salle de résidence de l’orchestre), et un orchestre précis. Il sera donc intéressant de suivre l’évolution esthétique de ces labels dans les années à venir, et de voir si la notion d’esthétique de label peut s’y appliquer.

4.3. Les radios sont-elles les dernières structures à pouvoir développer une esthétique propre ?

Une distinction importante se dessine entre les personnes travaillant pour la production discographique et celles travaillant pour la diffusion radiophonique.

Si les ingénieurs du son sont actuellement beaucoup moins liés à un label qu’autrefois, les radios sont des structures qui embauchent encore à plein temps et peuvent assurer un suivi dans l’évolution professionnelle de leurs employés. En effet, certaines radios recrutent des jeunes étudiants en alternance et les forment (par exemple à la WDR) pour travailler ensuite chez eux. L’évolution professionnelle se fait de manière interne, suivant différentes étapes, qui permettent d’assimiler les techniques et esthétiques de la radio (on entre en tant qu’assistant, puis on monte en grade progressivement). Dans le secteur du disque, de la même manière que les ingénieurs ne sont pas attachés à un label, les assistants travaillent pour plusieurs labels, et ne sont donc pas « imprégnés » d’une technique précise.

Enfin, les grandes structures radiophoniques ont généralement un grand parc de matériel, des régies déjà installées dans les salles de concert où ils travaillent le plus fréquemment (la salle Pleyel et le Théâtre des Champs Élysées par exemple dans le cas de Radio France), des camions régie pour les autres lieux, ce qui leur permet de développer leurs propres techniques sans se soucier des contraintes d’achat ou de location de matériel des ingénieurs du son indépendants.

Cependant, les radios rencontrent d’autres types de contraintes qui limitent leurs possibilités de développer une esthétique propre. Le rôle principal des radios en ce qui concerne la prise de son d’orchestre est la retransmission de concerts. Cette contrainte du live (que retrouvent aussi les ingénieurs indépendants lorsqu’ils doivent enregistrer des concerts) les oblige à faire certains compromis. En effet, ils doivent obligatoirement suspendre leur système principal (ce qui n’est pas obligatoire lors d’une production sans public) et ainsi ont moins de flexibilité pour le régler. De la même manière, les microphones d’appoint doivent être placés et choisis de manière à ne pas être trop gênants visuellement pour le public. De plus en plus souvent, la captation est aussi une captation vidéo, et cette contrainte visuelle devient encore plus prédominante. D’autre part, ils doivent se plier à la disposition choisie par le chef d’orchestre pour le concert. Enfin, lors des diffusions en direct, le mixage est effectué en stéréo directe, et il n’y a donc pas d’étape de post-production qui permettrait de travailler de manière plus approfondie l’étape du mixage.

Quelques exemples d’enregistrements radiophoniques : (Pistes no 22 à 24)

4.4. Lien entre technique, esthétique et salle

Nous avons vu dans le chapitre 1.2.1 que les salles sont un critère important à prendre en compte quand on parle de technique et d’esthétique de prise de son.

Un nouvel axe de réflexion et d’analyse des résultats des questionnaires peut être proposé. Il s’agit de regarder le lien entre les salles dans lesquelles ont lieu les enregistrements et les techniques utilisées.

Nous avons vu qu’en France, durant les années 60 à 80, durant lesquelles se sont développées la plupart des techniques de prise de son stéréophonique, il n’y avait pas de salle réputée (celles qui sont aujourd’hui réputées ont été construites plus récemment). L’Allemagne comptait en revanche un certain nombre de salles à l’acoustique renommée. Ces salles étaient en particulier des salles en forme de « boîte à chaussures », très adaptées pour accueillir un orchestre symphonique (les salles italiennes et françaises étant généralement plutôt construites sur le modèle du fer à cheval, avec des acoustiques plus sèches, adaptées à l’opéra), mais aussi la salle de la Philharmonie de Berlin, révolutionnaire pour l’époque, et dont on louait déjà l’acoustique. Cette constatation est d’ailleurs confirmée par le fait que la plupart des ingénieurs français interrogés estiment que la contrainte qu’ils rencontrent principalement lors d’un enregistrement est l’acoustique de la salle, alors que les Allemands se plaignent en priorité d’un temps de production trop court.

Cette observation amène à se questionner sur un lien entre les différents types d’acoustique et la qualité des salles, et les techniques et esthétiques développées pour la prise de son. Cette problématique a été soulevée par les ingénieurs (F9) (qui évoque des écoles de prise de son liées aux salles existantes dans chaque pays) et (E1) (qui nous a expliqué avoir deux techniques de prise de son, qu’il choisit d’utiliser en fonction de la qualité acoustique de la salle dans laquelle il travaille). De plus, l’ingénieur (E1) précise que l’utilisation d’un système avec Decca Tree est selon lui extrêmement dépendante de la qualité de l’acoustique, alors que l’utilisation d’un système AB l’est moins.

Nous avons vu d’une part qu’aucun ingénieur du son français n’utilise systématiquement un Decca Tree pour ses prises de son d’orchestre, alors que c’est le cas de plusieurs ingénieurs du son allemands. D’autre part, (E1) explique que dans une salle ayant une bonne acoustique, il utilise un Decca Tree, et dans une salle ayant une mauvaise acoustique, un couple AB avec un plus grand nombre d’appoints. Si on fait un lien entre ceci et la constatation faite précédemment que l’Allemagne possède des salles avec une acoustique plus réputée que la France, on peut proposer une explication à ces choix de système de prise de son. Cette explication (parmi d’autres explications possibles) serait donc que l’absence d’utilisation du Decca Tree par les Français serait due à la mauvaise qualité acoustique des salles.

Un deuxième élément peut aussi intervenir dans ces observations. Nous avons vu que les ingénieurs allemands favorisent l’utilisation d’appoints cardioïdes sur les pupitres de cordes, alors que la plupart des ingénieurs français utilisent quand ils en ont la possibilité des appoints infra-cardioïdes (voire omnidirectionnels pour certains). La volonté d’utiliser de telles directivités en France, liée pour certains au souhait d’avoir un plus beau timbre sur les appoints, est peut-être liée à une utilisation plus importante de ces appoints dans le mix (le système principal étant trop dépendant de la qualité de la salle). Cependant, on peut aussi avoir une autre explication à ce choix de directivité sur les appoints, qui est le goût prononcé des Français pour la notion de timbre, comme nous l’avons vu dans le chapitre 3.1.6.

Il sera intéressant de voir comment ces techniques vont évoluer. En effet, nous avons vu que ces techniques se sont principalement développées avant les années 1990. Or, les salles françaises à l’acoustique réputée sont plutôt récentes (Arsenal de Metz, Auditorium de Dijon, prochainement peut-être la Philharmonie de Paris ou le nouvel Auditorium de la Maison de la Radio si leur acoustique est réussie, …). Elles n’ont donc pour le moment pas pu accompagner de véritable modification des techniques de prise de son en France. Il n’est cependant pas exclu que ces salles aient dans les années à venir un impact sur ces techniques.

4.5. Mobilité des ingénieurs du son

De nos jours, les ingénieurs du son sont beaucoup plus mobiles qu’autrefois, et beaucoup d’entre eux travaillent de temps à autre à l’étranger (avec leurs propres équipes ou avec des équipes locales).

En particulier, la quasi-totalité des ingénieurs du son interrogés indiquent avoir travaillé dans des pays européens. Il y a donc une très bonne circulation des ingénieurs en Europe, ce qui peut expliquer ce processus d’uniformisation de l’esthétique et des techniques qu’ont décrit plusieurs ingénieurs du son en réponse au questionnaire.

Cependant, si cette circulation est très bonne en Europe, seuls 4 ingénieurs parmi les 25 interrogés indiquent avoir parfois travaillé aux États-Unis, en Asie ou en Amérique du Sud. Les échanges avec d’autres continents semblent donc beaucoup plus limités.

De la même manière, les étudiants européens qui souhaitent effectuer une partie de leurs études à l’étranger le font généralement dans le cadre du programme Erasmus. Les échanges se font donc principalement (pour des raisons de proximité aussi) entre les pays européens.

D’autre part, les radios européennes (et de quelques pays proches de l’Europe) sont regroupées dans l’UER (Union Européenne de Radio-télévision), et proposent des programmes communs. De plus, des programmes de recherche sont mis en place en collaboration entre différentes radios européennes (par exemple actuellement Radio France et la BBC collaborent pour des recherches sur le binaural).

On peut donc se demander si les techniques et esthétiques de prise de son d’orchestre s’uniformisent dans le monde entier ou bien si ce processus de mélange des techniques se fait seulement en Europe. Cette piste de recherche n’a pas été étudiée dans ce mémoire, centrée sur les pratiques européennes, mais pourrait être intéressante à approfondir.

Conclusion

Ce travail de recherche a permis d’effectuer un état des lieux de la prise de son d’orchestre de nos jours en Allemagne et en France, ainsi qu’un aperçu des pratiques en Angleterre.

L’étude a montré que la notion d’esthétique de label est de nos jours beaucoup moins présente que jusqu’à la fin des années 1980. Cependant, un certain nombre de pistes de réflexions a pu être exploré.

Nous avons vu comment l’évolution du marché discographique a entraîné la disparition de ces esthétiques de label, mais aussi comment l’apparition de nouveaux labels associés à des orchestres permettra peut-être de faire apparaître de nouvelles identités sonores. De plus, les grosses structures comme les radios ont encore la possibilité de développer leurs propres caractéristiques sonores, car leurs équipes peuvent bénéficier de la transmission interne, et ces équipes travaillent très souvent avec le même matériel, dans les mêmes salles, avec les mêmes orchestres, …

Il serait intéressant d’étudier de manière plus précise et chiffrée l’évolution des conditions de production, des budgets attribués à une production musicale et la durée moyenne d’une production discographique. Cette étude n’a pas pu être menée dans le cadre de ce mémoire, car elle n’entrait pas dans le cadre des choix purement techniques et esthétiques de prise de son. L’évolution représente cependant un aspect important de l’état des lieux des pratiques de prise de son d’orchestre, et pourrait à ce titre être l’objet d’un travail de recherche complémentaire.

Nous avons aussi étudié les particularités de ce qui correspondrait à des « écoles nationales », bien que l’existence de ce type d’école de prise de son fasse débat parmi les ingénieurs du son : un type de salle plus répandu dans un pays que dans un autre, une attention particulière portée à certaines caractéristiques sonores…

Si les recherches ont été menées sur un nombre suffisant de sujets pour être représentatives des pratiques en Allemagne et en France, elles ne sont en revanche pas du tout généralisables en ce qui concerne l’Angleterre, le nombre de participants anglais au questionnaire étant trop faible. Cette recherche pourrait donc être complétée par une étude des habitudes d’un plus grand nombre d’ingénieurs du son anglais, mais aussi par un état des lieux des pratiques dans d’autres pays européens (Italie, Autriche, Russie). D’autre part, nous avons vu qu’il existe une bonne circulation des ingénieurs en Europe, mais il faudrait étudier les pratiques dans d’autres régions du monde (États-Unis, Asie, …) afin de voir si elles diffèrent des pratiques européennes.

Il serait aussi intéressant d’élargir ces recherches à d’autres types de formations (musique de chambre, opéra) pour voir si ces réflexions sont aussi valables dans ces genres instrumentaux.

Bibliographie
1. Colin Lawson. The Cambridge Companion to the Orchestra. Cambridge University Press, 2003.
2. Dictionnaire de la Musique. Larousse, 2005.
3. D. Kern Holoman. The Orchestra – A very short introduction. Oxford University Press, 2012.
4. Christian Merlin. Au cœur de l’orchestre. Fayard, 2012.
5. Rencontre avec philippe muller. Journal de l’Association Française du Violoncelle, (26), 2008.
6. Sylvie Pébrier. La notion d’école et la mondialisation. Musique et Mondialisation, Cité de la Musique, Octobre 2009.
7. Elisabeth Kemper. Realisierbarkeit und Beurteilung ästhetischer Klangkonzepte bei klassischen Musikaufnahmen. Master’s thesis, Erich-Tienhaus-Institut der Hochschule für Musik Detmold, 2007.
8. Halls for Music Performance – Two Decades of Experience 1962-1982. Acoustical Society of America.
9. Halls for Music Performance – Another Two Decades of Experience 1982-2002. Acoustical Society of America.
10. Leo Beranek. Concert and Opera Halls – How they sound. Acoustical Society of America, 1996.
11. Site officiel de l’Arsenal de Metz. http://www.arsenal-metz.fr/ dernière consultation : 23-05-2014.
12. Site officiel de l’Opéra de Dijon. http://www.opera-dijon.fr/opera-de-dijon/auditorium/ dernière consultation : 23-05-2014.
13. Site officiel de la Philharmonie de Paris. http://www.philharmoniedeparis.com/ dernière consultation : 22-05-2014.
14. François Delalande. Le son des musiques. Entre technologie et esthétique. Editions Buchet/Chastel, 2001.
15. Colin Symes. Setting the record straight – A material history of classical recording. Wesleyan University Press, 2004.
16. Denis Mercier. Le livre des techniques du son – Tome 3. Editions Eyrolles, 1993.
17. Rémy Louis, Thierry Soveaux, and Olivier Boruchowitch. Une vision de la musique : l’histoire de la Deutsche Grammophon. Editions Verlhac, 2009.
18. The Decca Sound. livret accompagnant le coffret de disques The Decca Sound, 2011.
19. The Decca Sound : Secrets Of The Engineers. site internet The Polymath Perspective. http://www.polymathperspective.com/?p=2484. dernière consultation 20-05-2014.
20. Eberhard Sengpiel. Decca Tree Recording mit Neumann-Druckempfängern M50. disponible sur le site www.sengpielaudio.com (dernière consultation mars 2014).
21. Page web présentant l’histoire de Mercury Living Presence et d’autres labels. http://www.soundfountain.com/amb/mercury.html. dernière consultation : 20-05-2014.
22. Louis Bricard. Vingt préconisations pour la survie des disques de musique classique. 2004.
23. Deutsche Grammophon. Yellow Book, 07-2013 edition.
24. Site officiel du LSO Live. http://lso.co.uk/about-lso-live. dernière consultation : 20-05-2014.
25. Site officiel du Berliner Philharmoniker. https://www.berliner-philharmoniker-recordings.com. dernière consultation 20-05-2014.
Annexe A : Ingénieurs du son interrogés

Liste des participants :
- Jonathan Allen
- Brigitte Angerhausen
- Cyril Bécue
- Laure Casenave
- François Eckert
- Jean-Martial Golaz
- Wolfram Graul
- Hannelore Guittet
- Bardo Kox
- Pierre Lavoix
- Jean-Pierre Loisil
- Paul Malinowski
- Wilhelm Meister
- Jean-Christophe Messonnier
- René Möller
- Aude-Marie Piloz
- Christian Schmitt
- Eberhard Sengpiel
- Pierre-Antoine Signoret
- Philip Siney
- Günther Wollersheim
- + 4 participants préférant rester anonymes
Annexe B : Questionnaire

Dans le cadre de mon mémoire de fin d’étude sur la prise de son d’orchestre, je vous sollicite afin de réunir les opinions et les habitudes de travail d’ingénieurs du son et directeurs artistiques venant de divers horizons en Europe.

Si vous souhaitez joindre à vos réponses des documents qui vous aident à illustrer vos propos (documents de production, patchs, photos, ou autre), n’hésitez pas à le faire.

Formation
1. Quelle est votre formation ? Avez-vous parachevé votre formation auprès d’un professionnel ou d’une structure comme assistant ou avez-vous tout de suite été autonome ?
2. Cette formation, ce compagnonnage sont-ils à l’origine de vos choix esthétiques ou aviez-vous des idées ou influences précises que vous avez cherché à réaliser et développer ?
Esthétique de la prise de son d’orchestre
1. Quel est votre goût en matière de prise de son ? Vous sentez-vous libre de l’exprimer ou êtes-vous parfois contraint par l’environnement, les artistes, les maisons de disques ?
2. Cherchez-vous à vous inscrire dans une continuité esthétique ? Votre esthétique a-t-elle évolué pendant votre carrière ? (mode ? évolution personnelle ?)
3. Durant votre carrière, vous avez travaillé pour une ou plusieurs structures de manière régulière (label, radio, studio).
Pour chacune, indiquez la période, le nom de la structure, et répondez à la question suivante : Pensez-vous que ce label/radio/studio a développé une esthétique sonore particulière ? Si oui, comment s’est-elle développée (volonté assumée par les ingénieurs/par la hiérarchie, habitudes/formation des équipes, contraintes économiques,…) ?

À quoi la reconnait-on selon vous ?
1. Pensez-vous qu’il existe aujourd’hui des écoles de prise de son (par pays, par maison de disque, par type de media : CD/radio, ou autre) ? Qu’est ce qui les caractérise ?
2. Avez-vous le sentiment d’appartenir à une de ces écoles ?
Habitudes de travail
1. Quelle est votre configuration habituelle pour une prise de son d’orchestre symphonique (de type symphonie de Beethoven) ?
Vous pouvez par exemple préciser le type de salle utilisée (salle de concert, studio,…), le système principal utilisé (nombre de micros, type de micros, directivité, espacement, etc), si vous utilisez des microphones d’ambiance et/ou des microphones d’appoints, …

Ou encore : plutôt prise de son lointaine ou proche ? Choix des appoints complémentaires ou homogènes avec le système principal ? Importance de la phase (remise en phase des micros systématique, occasionnelle) ?
1. Quels outils utilisez-vous habituellement pour le mixage ? (réverbération artificielle, delays, EQ, compression/suivi dynamique, …)
Préciser : suivi des appoints dans les solos d’orchestre ou mix statique ? Réalisme ou image spectaculaire ? (Par exemple, est-ce gênant d’avoir une image extra-large, ou des cuivres très stéréo et très larges, ou des harpes larges ?). Dans le cas d’une œuvre avec soliste(s), préférez-vous mettre le(s) soliste(s) en avant, ou plutôt respecter l’équilibre naturel ?
1. Classez ces critères par ordre d’importance selon vous : respect de l’image sonore (largeur, profondeur, localisation, …), espace (réverbération,…), homogénéité, définition, timbre, équilibre spectral, balance, dynamique, naturel, recherche de spectaculaire, autres critères (à préciser)
2. Êtes-vous plutôt influencé par la tradition symphonique, ou par la musique de film ?
3. Quelles contraintes vous limitent habituellement (contraintes de temps, choix de la salle, matériel disponible, taille de l’équipe d’enregistrement,…) ? Que changeriez-vous si ces contraintes n’existaient pas ?
Questions complémentaires
1. Quels autres critères influencent le son selon vous ? (chef d’orchestre, orchestre, organisation de l’équipe, goût des auditeurs/de la critique, effets de mode, …)
2. Avez vous travaillé à l’étranger, avec des équipes étrangères ? Quelle expérience en tirez-vous ? Sentez-vous des différences importantes (organisation, façon de travailler, esthétique sonore) ?
3. Avez-vous un enregistrement d’orchestre favori ? (pour le son)
Êtes-vous (ou avez-vous été) influencé par certains enregistrements dans vos choix esthétiques ? Lesquels ?

Préférez-vous que votre participation reste anonyme, ou m’autorisez vous votre nom dans mon travail si nécessaire ?

Acceptez-vous que je vous recontacte pour des précisions si nécessaire ?

Je vous remercie pour votre patience et votre aide !

Elsa Desjardins

Annexe C : Critères d’écoute
- Œuvre
- Compositeur
- Orchestre
- Chef d’orchestre
- Lieu d’enregistrement
- Date d’enregistrement
- Label Ingénieur du son
- Directeur artistique
- Remarques (enregistrement live, …)
Analyse sonore (d’après Guy Laporte, Radio France)
- Largeur
- Premier plan de prise de son
- Profondeur
- Relief
- Localisation
- Acoustique (niveau et longueur de réverbération, couleur de la salle, taille apparente de la salle, …)
- Homogénéité
- Balance
- Équilibre spectral
- Timbres
- Définition
- Intelligibilité
- Dynamique
- Transparence
Annexe D : Caractéristiques de quelques salles européennes

Le tableau suivant a été réalisé en réunissant des éléments des ouvrages suivants (ainsi que les sites internet de certaines salles décrites) :
[8] : Halls for Music Performance – Two Decades of Experience 1962-1982. Acoustical Society of America.
[9] : Halls for Music Performance – Another Two Decades of Experience 1982-2002. Acoustical Society of America.
[10] : Leo Beranek. Concert and Opera Halls – How they sound. Acoustical Society of America, 1996.
Remerciements

Je tiens à remercier chaleureusement Thomas Dappelo, mon directeur de mémoire, pour ses précieux conseils, son investissement et ses encouragements qui m’ont permis de mener à bien ce travail.

Merci à toutes les personnes qui par leur collaboration ont permis la réalisation de ce mémoire, à commencer par les ingénieurs du son ayant répondu à mon questionnaire, ceux qui par leurs discussions ont fait mûrir ma réflexion, et aux musiciens qui m’ont renseignée sur les spécificités de certains orchestres ou instruments particuliers.

Merci à Daniel Zalay et François Eckert, grâce à qui j’ai pu contacter un grand nombre de professionnels renommés et effectuer des stages très enrichissants en Allemagne.

Merci aux différents ingénieurs du son indépendants et structures qui m’ont permis d’expérimenter par la pratique les problématiques liées à la prise de son d’orchestre, en particulier Kali Son, le studio Teldex, la Westdeutscher Rundfunk et Radio France.

Merci à Laetitia Dimitriu, Simona Florescu et Volker Haller qui m’ont aidée lorsque j’ai rencontré des difficultés de traduction anglaise ou allemande.

Merci à la FSMS, à ses professeurs et à ses étudiants (particulièrement à la promotion 2010 : Guilhem Angot, Pierre Blaise, Thibaud Lalanne, Jonathan Lefèvre, Guillaume Le Hénaff, Yoann Saunier et Ken Yoshida) pour ces quatre belles années riches en expériences et en apprentissages. Une pensée particulière pour Guillaume Jay avec qui j’ai partagé de longues journées de travail durant la rédaction de ce mémoire.

Un grand merci enfin à mes proches et ma famille pour leur soutien sans faille.

Notes
1. On peut partir de deux postulats différents : que l’orchestre est un ensemble de musiciens, ou que l’orchestre est un instrument en soi. La distinction est en fait la même qu’entre l’orchestre en tant qu’institution et en tant que corps musical. (Cette citation a été conservée en anglais dans le texte car la subtilité de langage corporation/corporate disparaissait lors de la traduction). ↩︎
2. The warm, intimate sound of the hall itself, allowing the players not to force. Delicate, nuanced string playing sometimes called silver or velvety. Long associations with the symphonies of Bruckner and Mahler. Sophisticated percussion. ↩︎
3. Voluptuous, highly refined readings, typically ascribed to Herbert von Karajan’s instruction that left-hand vibrato was to begin before the bow touched the string. Loud, throaty brass. ↩︎
4. The “Chicago brass” : a grandeur and technical perfection ascribed variously to the conductor Fritz Reiner and to the principal trumpet player, Adolph Herseth, and tubist, Arnold Jacobs. ↩︎
5. Technical perfection, careful attention to dynamic contrasts, studied orchestral counterpoint often called transparent, and a lean, European sonority. George Szell drilled every nuance of his readings into the players during relentless rehearsals, with trademark results to be heard on an impressive discography. ↩︎
6. High-spirited extrovert readings, celebrated soloists in the ranks (James Galway, flute; Gervase de Peyer, clarinet; Barry Tuckwell, horn). Flexibility in adapting to its many distinguished visiting conductors. Film scores. ↩︎
7. Seamless string phrasing (the “Philadelphia sound”, “Those fabulous Philadelphians”). Often said to be a response to the dry acoustics of the orchestra’s former home, the Philadelphia Academy of Music ; accomplished in part by subtle overlapping of bow changes. ↩︎
8. Instruments unique to Vienna. The Vienna oboe and rotary-valve brass are small-bored with a delicate, focused quality. String instruments belong to the orchestra, not the players, and thus are handed down from generation to generation. The purity and ongoing tradition of the sound was long attributed, also, to gender and racial purity of the white European male musicians. ↩︎
9. The advent of broadcasting and recording has served to fix a standard and idealized orchestral sound. An inevitable consequence of these developments is that many orchestras have lost the distinctive elements of timbre that remained unique to certain countries before the First World War. ↩︎
10. In jedem Fall ist der Einfluss des Tonmeisters auf die Klanggestaltung größer als der des Aufnahmeraums, des Dirigenten und des Orchesters. ↩︎
11. In classical music circles, […] they never threw over the idea that the concert was the ultimate arti-culation of music and that the phonograph should defer to it. Modes of representing classical music on disc that have abandoned this concert benchmark have tended, with rare exceptions, to be marginalized. ↩︎
12. Where purist producers talk of balancing different sound sources to create a faithful impression of the original soundstage, the creative producer talks of mixing sound sources without aiming at fidelity. ↩︎
13. Es muss “natürlich” bleiben. ↩︎
14. My taste in recording sound is to reproduce a natural sounding performance ↩︎
15. eher „spektakulär“, allerdings immer so, dass es natürlich erscheint ↩︎ch erscheint ↩︎
16. I do not believe in trying to capture ‘the best seat in the house’, which is an (misguided and
  fallacious) argument one often hears. ↩︎
17. In a concert environment the eye focuses the ear. ↩︎
18. Das Klangbild ist ein Bild. Es soll zeigen, was der Zuhörer GLAUBT, gehört zu haben (in Wirklichkeit hat er ja gehört, gesehen, erlebt, plus ? ? ?). ↩︎
19. Ich mag direkte, effektvolle und spektakul¨are Aufnahme, die nicht allzu r¨aumlich ist, ohne dabei
  den warmen, offenen Klang zu verlieren… ↩︎
20. It’s the engineer’s job to create the illusion of reality. The recorded sound should engage and excite the listener, who does not have the experience of the live environment. ↩︎
21. Es gibt 2 große Quellen meiner ¨asthetischen Kriterien in zwei Kursen w¨ahrend des Studiums. In
  einem Kurs haben wir [. . . . über eine fantastische Anlage Musik aus allen Genres gehört, [. Verglichen wurden Aufnahmeästhetiken unterschiedlicher Orchester an unterschiedlichen Spielorten. Gelernt haben wir nur auf den Bass, nur auf die räumliche Darstellung, die räumliche Tiefe, nur auf die Auflösung der Höhen usw. Zu konzentrieren. Des Weiteren ein Kurs über Akustik. Im Rahmen des Kurses haben wir in insgesamt 10 Tonstudios unterschiedlichster Größe mit demselben Musiker und Mikro dasselbe Stück Gitarrenmusik aufgenommen und auch in der Regie dieselben Aufnahmen verglichen. [. . . ]Diese Arbeit beeinflusst mein Arbeiten in der Musikproduktion bis heute. ↩︎
22. Ja, Detmold ist die Quelle [meiner ästhetischen Kriterien]. ↩︎
23. Das Studium hat Anregungen zur Entwicklung eines eigenen persönlichen Stils in der Klangästhetik gegeben. ↩︎
24. In den 80er Jahren waren die Orchesteraufnahmen sehr pauschal und indifferent; heute suche
  ich einen Klang, [dem] strukturiert und klar, bei m¨oglichst großer R¨aumlichkeit, ist. Heute sind meine Stützmikrophone näher an den Instrumenten, aber sie sind verzögert und das Hauptmikrofon ist stärker.
  in der Mischung. ↩︎
25. Ich unterscheide zwischen objektiven und subjektiven Kriterien ; objektivierbare Fehler
  im Klang (z.B. Balance-, Ortungs- oder Panorama-Fehler) lasse ich nicht zu. ↩︎
26. Phase is never an issue that I worry about – if it doesn’t sound good, I move the mic ↩︎
27. I think there are different schools – probably mostly polarized as multi-microphone vs. Minimalist
  microphone techniques. ↩︎
28. Russian engineers have the reputation of highly focused and vibrant sound. ↩︎
29. and there is certainly a particular ‘style’ for radio engineers – mostly characterized by a main
  configuration of omni microphones [. . . ]I think the radio broadcast engineers are probably aiming for a more ‘natural’ concert sound. ↩︎
30. Radio engineers (especially in Germany) seem to balance a more distant and less defined mix. ↩︎
31. Die EMI liebt Hauptmikrofonaufnahmen in Koinzidenztechnik, weil einer ihrer Ingenieure Alan
  Blumlein war ↩︎
32. Decca had a strong Sound aesthetic – ‘The Decca Sound’. General use of The’ Decca Tree’ recording method involving four or five spaced Omni microphones. Capturing the natural acoustic was the heart of every recording ↩︎
33. [Deutsche Grammophon :] a totally different insight into recording in a more multi microphone technique and use of delay’s to sharpen a recording ↩︎
34. In the great period of recording during the 60’s 70’s I would say EMI/DECCA and DG had definite
  house styles. ↩︎
35. eine « firmenspeziefische Klang¨astehetik » gab es nicht, auch nicht bei der Deutschen Grammophon und bei EMI, obwohl diese genau damit Werbung machten ↩︎
36. in den 90er Jahren f¨ur Denon : ja, da gab es eine Klang¨astethik : mit wenig St¨utzmikros nat¨urliche Raumwirkung erzeugen. Uberhaupt stand hier Nat¨urlichkeit im Vordergrund. ↩︎
37. Hyperion has a reputation for a certain kind of sound. ↩︎
38. Ich habe bisher mit keinem Label gearbeitet, das bestimmte Vorgaben zum Klang gemacht hat. ↩︎
39. Sony Classical. Keine Label¨astethik ↩︎
40. Ich war im Austausch 2 Wochen bei der BBC in London und da arbeitet man genau so wie im
  WDR ↩︎
41. Ich hatte einen Tonmeister von der BBC zu Gast, er wollte alle Instrumenteneins¨atze geregelt haben (St¨utzen). ↩︎
42. Ja, ich finde der WDR bzw. die deutschen Rundfunkanstalten haben eine eigene Klang¨asthetik
  (gegen¨uber z.B. Holland, oder England, oder den USA oder Japan) ↩︎
43. WDR : keine char. Asthetik. ↩︎
44. Die Arbeit als Tonmeister beim Bayerischen Rundfunk hat mir diese Unabh¨angikeit stets gew¨ahrt ↩︎
45. NDR Hamburg, Nein, Klang¨asthetik, eher abh¨angig von Tonmeister- und Toningenieur als von der Institution. BR M¨unchen, wahrscheinlich ja, habe ich pers¨onlich zur Zeit noch zu wenig Erfahrung. ↩︎
46. choice of venue obviously played an important part in the sonic success ↩︎
47. die Akustik des Aufnahmeraumes [hat] meines Erachtens mehr Einfluß auf den Klang als die Idee
  der Asthetik, der die genaue Wiedergabe der Partitur zugrunde liegt. ↩︎
48. Es entwickeln sich vergleichbare Klangbilder, wenn man immer im selben Saal aufnimmt. ↩︎
49. Each were characterised mainly by the acoustics they used – EMI had Abbey Rd studios / DECCA
  had some of the finest concert halls / DG had some wonderful acoustics particularly in Berlin like Jesus Khriste Kirche in Dahlem. ↩︎
50. The idea is to achieve a good overall sound picture by correct placement of the main 5 omni mics.
  Spot mics are used to bring a touch of focus to the various sections rather than being totally relied upon. The above technique is totally dependent on a good natural acoustic being present in the venue. ↩︎
51. Time is the biggest problem. Today you must have the sound right from the start. . . but the best
  recordings are where you can listen in the room and have time to adjust the microphones. ↩︎
52. Zeitmangel kann dazu f¨uhren, dass ich die Mikrofonpositionen nicht optimieren kann ↩︎
53. Man m¨usste mehr Zeit haben, aber das ist zu teuer…. ↩︎
54. Im heutigen Musikproduktions und Konzertbetrieb spielt der Zeitfaktor eine immer gr¨oßere Rolle.
  Zeit ist teuer. Das bringt das Team unter Druck. Vieles muss heute auf die Nachbearbeitung geschoben werden, was fr¨uher in der Aufnahmezeit erledigt werden konnte. ↩︎
55. Spot microphones are to be delayed in the mix according to their respective distance to the main microphone array. Ideally a “click take” should be recorded for each microphone setup during the recording. ↩︎
mai 19, 2026

Enjeux de l’enregistrement en autonomie chez les étudiant.e.s en musique classique

Léna Jallon

Formation Supérieure aux Métiers du Son Décembre 2023

Résumé

L’enregistrement fait partie de la pratique instrumentale des musiciens. Cet outil est utilisé à tous niveaux dans le monde professionnel et les musiciens se doivent de savoir l’utiliser. Les deux premières parties de ce travail de recherche aboutissent à un état des lieux de l’évolution de ce besoin, des enjeux impliqués et des compétences nécessaires aux musiciens. La première partie s’appuie sur une revue de la littérature, la seconde sur l’analyse d’un corpus de consignes d’enregistrement de concours d’orchestres, de stages, de concours internationaux et de concours d’entrées en licence et en master.

Tout comme la performance publique, l’enregistrement est une pratique que les étudiants découvrent et développent au cours de leurs études. Dans une troisième partie, des entretiens avec huit étudiants nous renseignent sur leur manière de procéder et les problématiques qu’ils rencontrent. Grâce à une analyse par théorie ancrée, plusieurs thématiques se dégagent : l’aspect technique de l’enregistrement, la manière de préparer une performance musicale, de jouer sans public ou encore de s’organiser.

Dans une dernière partie de discussion critique, nous chercherons à optimiser le processus d’enregistrement des musiciens de manière à cibler les compétences et outils nécessaires pour que des étudiants puissent s’enregistrer dans les meilleures conditions possibles.

Cette étude est la première à s’intéresser aux pratiques d’enregistrements des étudiants en musique classique. Elle a permis de cerner les besoins et les enjeux auxquels ils font face, mais aussi d’ouvrir la réflexion à des stratégies d’enregistrement et de travail de préparation pour optimiser ces pratiques.

Introduction

En parallèle de mes études d’ingénieure du son, j’étudie la harpe. Comme tous les musiciens de mon niveau j’ai dû me confronter à l’exercice de l’enregistrement vidéo : d’une part pour pouvoir échanger avec ma professeure lors des confinements, d’autre part en tant que candidate à des concours d’entrée à des écoles supérieures.

C’est une tâche qui s’est avérée difficile. Du point de vue technique, je n’ai pas rencontré de difficultés pour mettre en œuvre les consignes d’enregistrement, mais être de l’autre côté des micros a soulevé beaucoup d’interrogations : quelle qualité sonore présenter, comment gérer son temps et son travail, comment se préparer, comment rester concentrée lorsqu’on joue sans public, vaut-il mieux s’enregistrer soi-même…?

En septembre 2022 j’ai débuté un bachelor de harpe à la Haute École de Lucerne (HSLU). En arrivant sur place j’ai découvert que les étudiants avaient accès en libre-service à du matériel d’enregistrement : des enregistreurs portables mais aussi des cartes son et des microphones. Tout est fait pour que les étudiants puissent s’enregistrer en autonomie. Après des échanges avec mon entourage et plusieurs étudiants, j’ai constaté qu’ils rencontraient les mêmes problématiques que moi et j’ai décidé de m’interroger sur leurs pratiques d’enregistrement.

À notre connaissance, peu de recherches ont été réalisées sur l’auto-enregistrement, notamment dans le domaine de la musique classique. C’est pourquoi nous nous sommes intéressés à ce sujet et avons opté pour une approche assez large de cette thématique.

Dans un premier temps, grâce à une revue de recherches scientifiques et de livres, nous contextualiserons le besoin de s’enregistrer. Une seconde partie d’analyse de données collectées auprès de différents concours permettra de mieux comprendre les consignes auxquelles doivent faire face les musiciens. Avant de conclure, nous étudierons les stratégies et les problématiques d’enregistrement à l’aide d’entretiens réalisés auprès de huit étudiants.

Première partie : contextualisation de l’étude et revue de la littérature

Cette partie s’intéresse aux différents rapports qu’entretiennent les musiciens avec l’enregistrement. Nous allons d’une part observer comment cette pratique s’intègre actuellement au monde professionnel, dans un second temps nous intéresserons à la performance musicale et à sa préparation.

I. Être musicien

Les études supérieures dans le domaine de la musique classique sont en plein essor. Au Royaume-Uni par exemple, ce domaine a connu un changement d’échelle, de diversité et d’objectifs sans précédent au cours des trois dernières décennies. Le nombre d’étudiants a énormément augmenté, il a même presque doublé en un siècle (Thomas, 2002). Avec cette augmentation, la gamme de diplômes en musique et la variété de ses objectifs se sont eux aussi accrus (Hewitt, 2009).

1. Perspectives d’emploi

En France, dans le domaine de la musique classique, on distingue trois statuts dans le secteur de l’interprétation : les musiciens indépendants, qui sont rémunérés exclusivement aux cachets sans avoir recours à l’intermittence, les membres permanents d’orchestre et les intermittents du spectacle (Pégourdie, 2015). L’emploi permanent en orchestre concerne toutefois 5% des musiciens interprètes. Les musiciens classiques peuvent aussi vivre pleinement ou partiellement de l’enseignement. (Coulangeon, 2004)

À l’étranger, les musiciens classiques tendent à être entièrement ou partiellement auto-entrepreneurs et cumulent plusieurs emplois allant de l’enseignement à la performance (Bennett, 2008 ; Cottrell, 2004 ; Gembris, Langner, 2005 ; Yoshihara, 2007). Selon le Musician’s Union (2012), seulement 10% des musiciens interrogés au Royaume-Uni étaient des salariés à plein temps. Les principales sources de revenus sont la performance et l’enseignement, suivis de la composition. Les musiciens classiques doivent alors construire leur carrière comme des entrepreneurs pour réussir (Beeching, 2010). Il est donc important pour eux de savoir se promouvoir grâce aux différentes formes du marketing (Mäkinen, 2012 ; Jarvin, Subotnik, 2010). Beaucoup de ces musiciens se décrivent comme des produits qui doivent être vendus (Scharff, 2015).

Les établissements supérieurs d’enseignement musical ont réagi à cette transformation néolibérale des marchés du travail par l’introduction de programmes

d’études en entrepreneuriat, visant à enseigner aux étudiants le développement d’identités de carrière fortes, adaptables et entrepreneuriales et la création d’emplois artistiques pour eux-mêmes afin de faire face aux réalités d’un marché du travail en diminution (Essig, 2017).

2. Être musicien indépendant

Beaucoup de jeunes musiciens pensent que leur travail consiste à travailler leur instrument et à jouer en concert, mais gérer sa publicité fait aussi partie des compétences nécessaires (Beeching, 2010). Pour répondre au besoin de se promouvoir et se créer un réseau de travail, Internet est devenu l’outil le plus indispensable. Le musicien se doit d’avoir un site web accessible avec un curriculum vitae, une biographie, un portfolio et des informations actualisées (Hugill, 2018). Il peut en plus se promouvoir via un listing par mail ou encore par les réseaux sociaux (Hugill, 2018 ; Beeching, 2010). Les mailing lists sont importantes pour annoncer les prochains concerts et partager ses enregistrements, cela sert à se créer une audience. Être présent sur les réseaux sociaux est également une nécessité aujourd’hui. Les musiciens avisés utilisent Facebook, Myspace, LinkedIn, Twitter ou encore Youtube. Les médias traditionnels tels que l’affichage et la presse écrite sont aussi un bon moyen de se créer une audience et de faire sa promotion à chaque événement de sa carrière (Beeching, 2010).

3. Auditions d’orchestre

Avec la standardisation des procédures de recrutement dans les orchestres, obtenir un poste est devenu très compétitif. Aux États-Unis par exemple, une audition pour un poste de flûtiste attirait moins de 30 participants dans les années 1970. En 2002, la même offre attire 70 à 90 participants et cela peut même monter au-delà de 200 participants pour certains orchestres (Buck, 2003). La plupart des musiciens commencent à participer à des auditions d’orchestre pendant leurs études, certains obtiennent même un poste au cours de leurs études. Il est généralement demandé d’envoyer un curriculum vitae, les candidats sont donc supposés avoir eu une expérience d’orchestre avant de se lancer dans le métier (Toskov, 2010).

L’expérience est primordiale pour réussir. Se former à l’orchestre en contexte, en dehors de l’école, est très important car, au-delà des compétences liées à la technique et à l’instrument, il faut apprendre à faire partie d’une communauté et à jouer avec l’orchestre. Il y a des codes, une hiérarchie à suivre, des protocoles et des obligations envers les autres. Les étudiants sont habitués à être en compétition,

mais à l’orchestre, l’unité de son est primordiale et les musiciens doivent se soumettre à un ensemble plus vaste (Johnsson, Hager, 2008).

Dans une démarche pédagogique, beaucoup d’orchestres organisent des auditions spécialement pour les étudiants afin de leur donner la chance de faire partie d’un orchestre professionnel. L’étudiant continue ses études tout en étant considéré comme un membre de l’orchestre pour une période définie, allant d’un à quatre semestres (Toskov, 2010). Dans la suite de ce mémoire, ces stages au sein de la saison de l’orchestre seront appelés par le terme allemand Praktikum, Praktika au pluriel, qui n’a pas de terme équivalent français dans ce contexte précis.

4. Enregistrer, pour quoi faire ?

Enregistrer s’avère nécessaire pour bien des occasions : présélections d’auditions, de compétitions, d’écoles de musique et de festivals, confection des maquettes pour être programmé, pour contacter la presse et avoir des critiques ou des articles, documentation des compositions originales, vente d’enregistrements après des concerts, en ligne ou dans des magasins locaux, pour l’obtention de bourses ou d’un poste d’enseignement. C’est un outil promotionnel plus qu’une source de revenus (Beeching, 2010).

Dans le cadre des concours et des auditions d’orchestre, l’enregistrement a fait son apparition au début des années 1980 aux États-Unis. À cause du nombre croissant de candidats et du temps de plus en plus limité, il a fallu trouver un moyen de présélectionner les candidats avant de les convier à la compétition. Les enregistrements sur cassettes ont alors commencé à faire office de premier tour de sélection (Buck, 2003 ; McCornick, 2008). Les premières compétitions historiques qui utilisent ce procédé de présélection sont le concours de piano Cliburn, puis les concours Honens et Rostropovich (McCornick, 2008).

Au-delà de la simple phase de présélection on voit maintenant apparaître des compétitions intégralement en ligne. Ce procédé permet de réduire les coûts à la fois pour les participants et pour les organisateurs, en évitant les frais de transport, d’hébergement et la logistique de transport pour certains instruments (Tokay, 2020 ; Berehova, Volkov 2019). Ces compétitions servent à dénicher de jeunes talents dans des tranches d’âge variées. Grâce à l’enregistrement, elles sont ouvertes à la mondialisation et touchent un large public (Tokay, 2020).

II. La performance musicale

a. La performance

Une performance publique et un enregistrement sont deux situations distinctes pour 97,4% des musiciens (Fabian, 2008). Il y a deux différences principales entre l’enregistrement studio et le live : premièrement, un enregistrement peut être réécouté de nombreuses fois, contrairement à une performance live. Deuxièmement, en studio, l’artiste est libre de répéter chaque passage jusqu’à ce qu’il soit satisfait, ce qui est impossible en concert. D’après les études de Fabian (2008), six thématiques répondent aux différences entre les deux pratiques : la prise de risques, la nervosité, la répétition, la précision technique, l’impact du public, et le cumul de la spontanéité et de l’excitation.

Avant les possibilités d’édition actuelles, les musiciens subissaient lors de l’enregistrement la même pression que lors d’un concert. Enregistrer avec peu ou pas de montage en post-production peut rendre les musiciens nerveux et prudents, réticents à prendre des risques si les erreurs ne peuvent être corrigées ensuite, car l’artiste a en permanence conscience qu’à la moindre faute il devra tout recommencer (Philipp, 2004). En effet, l’enregistrement enferme les musiciens dans un état de conscience de soi (Tomes, 2009). Même avec la possibilité de corriger, ils estiment en grande partie prendre moins de risques en studio qu’en concert, ce qui pourrait s’expliquer par des contraintes de temps et de budget (Fabian, 2008).

La pression s’est accrue au cours de ces soixante dernières années car le niveau d’attente a augmenté au fil du temps : il est de moins en moins acceptable d’entendre des fautes ou des problèmes d’intonation sur un enregistrement professionnel. Les disques sont aujourd’hui les témoignages d’une technique musicale parfaitement maîtrisée (Philipp, 2004). Paradoxalement, malgré les progrès techniques et la volonté d’un résultat musicalement parfait, dans le domaine classique l’enregistrement est souvent associé à un idéal de prise unique, sans montage. L’idée d’une performance construite qui n’a jamais existé est souvent questionnée (Greig, 2009). Enregistrer des petits fragments est pourtant une méthode qui a fait ses preuves (Hill, 2009 ; Tomes 2009). Elle a cependant ses avantages et ses inconvénients. D’une part, répéter certains passages rend à force le jeu plus guindé (Hill, 2009), néanmoins accepter que l’enregistrement soit artificiel permet d’utiliser cet outil de manière optimale (Tomes, 2009).

Lors d’une performance, les musiciens sont dans un état libre de toute distraction. Le temps semble suspendu, le corps travaille facilement tandis que l’esprit est calme et réceptif. Les psychologues parlent d’un état de flow dans lequel la concentration et la créativité sont à leur paroxysme. Une performance optimale n’est pas nécessairement techniquement parfaite, elle est idéale par la qualité de l’état

d’esprit. Lorsqu’un musicien se focalise sur la perfection technique, il ferme la porte à un élément essentiel à la performance : la liberté de contrôler sa pensée (Beeching, 2010).

En rapprochant ces propos de ceux de Philipp (2004) et Tomes (2009), on peut déduire qu’en enregistrement, l’état de flow est plus difficile à atteindre pour le musicien, car il aura plutôt tendance à rechercher une technique parfaite et à éviter les fautes. La différence d’état d’esprit est donc conséquente entre une représentation publique et un enregistrement. Ce dernier reste pourtant un moyen d’expression privilégié par certains musiciens, comme Glenn Gould, qui a préféré continuer sa carrière en tant que musicien studio à cause du trac (Beeching, 2010).

b. Le trac

Le trac est la peur ou l’angoisse que l’on ressent avant d’affronter le public, de subir une épreuve (Le Robert, 2023). Si l’on complète cette définition par les recherches de Ville (2020), le trac induit une perte de contrôle à travers des symptômes psychologiques et physiques, ce qui cause aux musiciens de nombreuses difficultés. Lehrer (1988) a identifié plusieurs inquiétudes des artistes liées à la performance : la peur d’être anxieux, d’être distrait, d’avoir des trous de mémoire, d’être critiqué par les autres et de posséder des capacités musicales insuffisantes.

Le trac n’a pas forcément des conséquences négatives. Il peut par exemple donner aux performances l’énergie qui peut manquer dans un enregistrement studio (Beeching, 2010). Reprendre le contrôle sur son stress permet d’en exploiter le potentiel positif, cela donnerait aux musiciens la possibilité d’atteindre un état de concentration et d’attention idéal (Ville, 2020). L’état de flow précédemment évoqué nécessite un travail émotionnel en amont de la prestation ayant comme base l’acceptation du stress (Green, Gallwey, 1986). Lors de leurs recherches, Spahn, Walther et Nusseck (2016) ont mis en place un cours d’entraînement aux auditions pour les étudiants en musique. Les cours ont permis aux étudiants une réduction des symptômes d’anxiété de la performance. Ils se sentent moins aliénés par le stress, subissent notamment moins de problèmes physiques comme des tremblements ou les mains moites, et sont plus satisfaits de leurs performances.

D’après Ville (2020), trois variables expliquent l’intensité du stress selon son contexte : l’enjeu de la performance (concert ou audition), le degré d’exposition (orchestre ou soliste) et la nature de l’audience (expert ou amateur).

c. Acquérir de l’expérience

Pour améliorer leurs performances et acquérir de l’expérience, les étudiants en musique sont encouragés à prendre part à diverses activités en dehors de leur établissement ou de leur formation. C’est le cas des Praktika (Toskov, 2010). Il leur est aussi conseillé d’assister et de participer à des masterclasses (Rodabaugh, 2008).

Les compétitions sont aussi mises en avant. Elles constituent un outil pédagogique en encourageant les musiciens à faire des performances techniques et artistiques, leur permettent de construire leur confiance en eux et de leur faire réaliser leur potentiel. Les compétitions en ligne apportent en plus une notion d’auto-évaluation, c’est une occasion de voir ses forces et ses faiblesses (Tokay, 2020). Avec l’apparition d’internet et avant même le covid, ces compétitions ont connu un nouvel essor et se sont ouvertes à la mondialisation (Tokay, 2020). Elles permettent aux jeunes musiciens de mettre en avant leur talent, offrent de grandes opportunités au vainqueur telles que des programmations de concert, des concertos avec orchestre, des enregistrements, mais aussi de la visibilité et de la médiatisation (Beeching, 2010). Les prix permettent de lancer des carrières internationales (Tokay, 2020).

d. Préparation

Savoir jouer ses pièces n’est pas suffisant pour espérer gagner un concours, obtenir un poste, préparer un concert ou encore mener à bien un enregistrement. Dans la littérature, les conseils donnés aux musiciens pour préparer une échéance peuvent être très variables mais se rejoignent en certains points.

Savoir jouer dans toutes les conditions. Il faut s’entraîner à tout ce qui peut-être source d’inquiétudes en jouant dans différentes acoustiques, le matin avant d’avoir chauffé, tard le soir ou encore en changeant aléatoirement l’ordre des pièces (Buck, 2003). Au lieu de chercher à se détendre, il faut apprendre à jouer avec les différents symptômes du stress tels que la bouche sèche, les tremblements et autres effets qui impactent la performance du musicien. Travailler la performance est différent de l’apprentissage des pièces. Une fois que les œuvres et tous leurs rouages sont sus, il faut s’entraîner à jouer sans s’arrêter (Rodabaugh, 2008).

S’enregistrer. L’enregistrement peut aussi être utilisé dans le travail personnel. Il a beaucoup de bienfaits. Il est même recommandé de s’enregistrer lors des séances de travail. Cela permet de visualiser sa progression, de voir objectivement ses performances de jeu (Willson, Lang,

2021) et aide à savoir quels points de technique ou d’interprétation sont perfectibles ou doivent être retravaillés (Willson, Lang, 2021 ; Beeching, 2010). Il est recommandé de le faire avant un enregistrement en studio pour éviter le choc de son propre son (Beeching, 2010), mais aussi avant une audition d’orchestre, car c’est un aussi bon exercice que de s’entraîner à jouer devant des gens (Buck, 2003). Il n’est pas efficace de réécouter ses enregistrements directement après, pour être plus objectif il vaut mieux le faire quelques heures plus tard, voire un ou deux jours après (Buck, 2003 ; Beeching, 2010).

Se préparer physiquement. Il faut faire du sport, du yoga, de la sophrologie, de la relaxation, avoir un bon régime alimentaire et un sommeil de qualité. On peut comparer cette préparation à celle d’un sportif avant une compétition (Buck, 2003 ; Prokop, Reitsamer, 2023 ; Rodabaugh, 2008 ; Güsewell, 2016). Certains pratiquent le yoga ou la sophrologie, d’autres adaptent leur régime alimentaire en évitant certains éléments nutritionnels (Güsewell, 2016).

Se détendre mentalement. La méditation aide à focaliser son esprit et à avoir les idées claires (Buck, 2003 ; Prokop, Reitsamer, 2023)

Organiser son temps. Les musiciens doivent aussi gérer d’autres activités que les auditions d’orchestres, telles que de la musique de chambre, des répétitions d’orchestre ou des performances, ce qui limite grandement le temps consacré à la préparation des auditions (Kegelaers, Hoogkamer, Oudejans, 2022). Dans le cadre d’un enregistrement, il est bien de planifier en amont l’ordre des pièces avec une durée approximative pour chaque pièce ou mouvement et s’y tenir. Si un passage, une section ou un mouvement n’est pas bon après 3 prises, il ne faut pas forcer les choses (Beeching, 2010).

Privilégier la qualité du travail. Celle-ci peut se diviser en quatre catégories : établissement d’objectifs stratégiques, structure du travail, pratique du suivi et réflexion sur les progrès. Les étudiants établissent souvent des objectifs sur le contenu de ce qu’ils travaillent mais pas sur la manière de le faire, et beaucoup privilégient la quantité horaire sans faire de pauses. (Kegelaers, Hoogkamer, Oudejans, 2022). Güsewell (2016) remarque une absence de stratégie et de planification temporelle chez les étudiants et une différence de durée de travail en fonction de l’instrument pratiqué. Pour lui, un vrai lien s’opère entre l’organisation du temps et l’enjeu.

Écouter des enregistrements. Cela permet d’améliorer : l’interprétation générale, l’expression, l’esprit, les dynamiques, les tempi à grande et petite échelle, l’articulation et le phrasé ainsi que le rythme. Les étudiants ont plus

tendance que les professionnels à modifier ces aspects de leur jeu en écoutant des enregistrements (Volioti, Williamon, 2017).

Arriver dans les meilleures conditions. Il est important de trouver des techniques pour cela, comme la respiration, la relaxation, l’adoption d’une attitude positive, le lien social… La préparation est aussi importante que l’échéance. Si la préparation est bien faite, cela permet de limiter les incertitudes et les états affectifs négatifs (Güsewell, 2016). L’échauffement est une étape tout aussi importante qui permet au musicien de se mettre dans de bonnes conditions (Güsewell, 2016 ; Beeching, 2010).

Problématique

La recherche littéraire permet de tirer trois conclusions :

Être musicien ne se résume pas à travailler des œuvres, il faut faire preuve de compétitivité et faire appel à d’autres compétences pour se créer un réseau de travail ou obtenir un poste. Cela s’applique dès les études où les musiciens prennent part à des concours d’orchestre, des Praktika ou des concours internationaux.
L’enregistrement n’est pas une source de revenus, c’est un outil pour se mettre en avant, faire sa promotion mais aussi une porte d’entrée à un certain nombre de concours et d’opportunités.
La situation d’enregistrement est très différente d’une performance publique pour le musicien et demande une préparation tout aussi exigeante. Les étudiants doivent apprendre à intégrer cet aspect du métier dans leur travail au même titre que les concerts et autres échéances.

Ces trois conclusions soulèvent plusieurs questions :

Comment la pratique de l’enregistrement s’intègre-t-elle à la formation des étudiants ? À quelles contraintes doivent-ils faire face ? Quels moyens ont-ils à disposition pour s’enregistrer ? Comment optimiser cette pratique ?

Nous tenterons d’apporter des éléments de réponse à ces interrogations au moyen d’une étude pratique fondée sur la collecte et l’analyse de données réalisée en deux étapes. Dans un premier temps nous nous pencherons sur un corpus de consignes d’enregistrements relatives aux différents types de concours auxquels les étudiants participent pour mieux appréhender les contraintes auxquelles ils doivent répondre. Dans une seconde partie, nous analyserons une série d’entretiens réalisés avec huit étudiants pour comprendre leurs pratiques. Enfin, dans une partie de discussion générale nous conclurons sur les phénomènes observés lors de notre étude et proposerons des solutions pour optimiser l’expérience d’enregistrement.

Deuxième partie : Analyse de consignes d’enregistrement vidéo

I. Cadre de l’étude

1. Méthode de collecte des données

Pour mieux comprendre les différents types d’enregistrements et leurs enjeux respectifs, nous allons dans cette partie nous intéresser aux concours auxquels participent les étudiants, et plus particulièrement aux consignes d’enregistrement qui leur sont imposées. Nous avons regroupé ces concours en cinq catégories :

les concours pour entrer dans une formation apte à délivrer des équivalents de Licence et/ou de Master
les académies : stages internationaux de musique, d’une durée de 4 jours à 2 mois qui s’adressent à des étudiants en école supérieure lors desquels ils reçoivent l’enseignement et l’accompagnement de professionnels
les Praktika : immersion d’un étudiant dans un orchestre professionnel, pour une durée variant de 10 mois à 2 ans. Le stagiaire participe à la saison de l’orchestre dans un nombre prédéfini de services
les concours internationaux de prestige
les postes professionnels d’orchestre.

197 concours de ces différentes catégories ont été analysés en s’appuyant sur les sites de chaque établissement, académie, stage, orchestre ou concours international, ainsi que sur la plateforme de recrutement Muvac. Toutes les informations de recrutement et les consignes sont listées en Annexe 1.

Pour fixer un cadre d’études commun à celui des entretiens, nous avons décidé de nous limiter aux concours les plus accessibles pour un étudiant français ou suisse. Cela limite notamment les écoles supérieures aux établissements présents en France et en Suisse, il en va de même pour les académies nationales d’été. Voici le cadre d’étude des différents concours :

Écoles supérieures : établissements d’enseignement supérieurs français et suisses, aptes à délivrer des diplômes degré Licence et/ou des Master
Académies : académies européennes ou nationales dont les concours étaient ouverts pour l’été 2023 ou la saison 2023/2024
Praktika : concours ouverts sur la plateforme Muvac pour la saison 2023-2024
Concours internationaux : concours basés en Europe et qui ont lieu en 2023 ou en 2022 ou 2024, si le protocole du concours est encore ou déjà disponible

Postes d’orchestre : concours ouverts au mois de février 2023 sur la plateforme de recrutement Muvac

2. Échantillon d’étude

Ces graphiques représentent l’échantillon de données collectées et étudiées

Fig. 1 : Échantillon des concours par catégorie

Fig. 2 : Part des consignes d’enregistrement dans l’échantillon de concours analysés

L’analyse s’appuie sur un total de 50 consignes d’enregistrement vidéo.

Fig. 3 : Consignes d’enregistrement analysées

II. Résultats

1. Procédés de recrutement

Fig. 4 : Procédés de recrutement par type de concours

Le recrutement par vidéo est présent dans toutes les catégories de concours, mais il l’est particulièrement pour les académies d’été et les concours internationaux.

Les processus de recrutement sont parfois variables au sein d’une même institution en fonction de différents paramètres tels que l’instrument, le niveau ou encore le poste visé. Ainsi, dans les écoles, le CNSMD¹ de Lyon organise l’intégralité de ses concours d’entrée en présentiel, et demande à certains instruments en master de présenter des vidéos de présélection (Flûte, Clarinette, Hautbois, Trombone, Trompette, Alto, Violon, Violoncelle, Piano, Chant, Chant musique ancienne). À l’inverse, la HEM² de Genève organise l’intégralité de ses concours par vidéo, sauf le second tour des masters de musicien d’orchestre, de musique contemporaine, de soliste et les cursus d’accompagnateur au piano et de musique de chambre. On retrouve cette différence pour l’Académie de l’Orchestre de Paris, pour laquelle tous les instrumentistes doivent se présenter par vidéo, mais les cordes doivent effectuer un second tour en présentiel. Cette différenciation en fonction des instruments est aussi présente dans les concours d’orchestre. Pour le Gewandhausorchester les postes de 1^er violon tutti, 2^e trompette et tuba sont recrutés en présentiel, mais le poste de harpe solo est soumis à une présélection vidéo. Au NDR (Norddeutschen Rundfunks) Radiophilharmonie c’est le poste de 1er violon tutti qui est soumis à une présélection vidéo, mais pas ceux de chef d’attaque des violons 2 et de trompette solo. Enfin, l’Orchestre de Paris recrute le premier violon soliste par une présélection vidéo, mais la 3^e contrebasse solo en présentiel.

Certains concours ont des procédés de recrutement différents. Par exemple, le Gustav Mahler Jugendorchester, académie d’orchestre d’échelle européenne, organise une tournée pour son concours de recrutement. Les candidats sont conviés à passer l’épreuve en présentiel dans la ville de leur choix, mais à la place du jury se trouve une personne de l’organisation qui filme et enregistre les candidats un à un, dans des conditions égales pour tous. Pour d’autres concours, les musiciens ont le choix de se présenter par vidéo ou en présentiel, comme pour l’académie Verbier Festival Orchestra.

L’EUYO, European Youth Orchestra, travaille avec des organisations de recrutement propres à chaque pays. Ainsi, les modalités varient en fonction des pays. Partout, les candidats doivent passer un ou deux tours en présentiel, à l’exception de l’Espagne où le premier tour se fait par vidéo et le second en présentiel, et en Italie où les candidats sont jugés lors de deux tours d’affilée sur la même vidéo.

Pour une compétition internationale, les candidats ont le choix entre passer la présélection du concours par vidéo ou en présentiel. C’est aussi le cas pour le Rotterdam Philharmonic Orchestra, suite à la présélection par vidéo, les candidats ont le choix de passer le second tour en présentiel ou par vidéo.

On retrouve aussi des concours pour lesquels les vidéos sont recommandées mais pas obligatoires. C’est le cas de deux Praktika et de deux postes d’orchestre.

Dans la suite de cette partie, les chiffres entre parenthèses sont utilisés pour compléter le référencement des concours qui peut être retrouvé en Annexe 1.

2. Consignes d’enregistrement

Fig. 5 : Nombre de mots en fonction des catégories de concours

La taille des consignes est disparate, variant d’une ou deux phrases à une page entière d’indications et de règles à respecter.

On peut ainsi trouver des indications qui ne se résument qu’à quelques phrases, parfois même une seule :

“Please provide recent video recording(s) of the performance of two representative pieces or movements (total length approx. 8–15 minutes).” (12) (Veuillez fournir un ou plusieurs enregistrements vidéo récents de l’interprétation de deux pièces ou mouvements représentatifs (d’une durée totale d’environ 8 à 15 minutes).)
“Die Aufnahme darf nicht geschnitten oder bearbeitet werden.” (13)

(L’enregistrement ne doit pas être coupé ou édité)

“Wir bitten um Bereitstellung eines ungeschnittenen und durchlaufenden Videos (« one-take » / « einfaches Handyvideo » ausreichend).” (16)
(Nous vous demandons de fournir une vidéo non coupée et défilante (« one-take » / « simple vidéo de téléphone portable » suffit).)

Différentes thématiques se dégagent des consignes.

Fig. 6 : Occurrences des thèmes dans les consignes d’enregistrement

Fig. 7 : Répartition d'apparition des thèmes selon les types de concours — Fig. 7 : Répartition d’apparition des thèmes selon les types de concours

a. Prises

Fig. 8 : Nombre de vidéos à rendre par oeuvre

Le fait de rendre une ou plusieurs vidéos est rarement indiqué explicitement, il faut souvent déduire de l’utilisation du pluriel ou du singulier employé pour parler des vidéos. Les concours autorisent en grande majorité le candidat à effectuer des prises différentes pour chaque œuvre.

Certains concours imposent le rendu d’une seule vidéo tout en laissant au candidat la possibilité de faire des prises séparées pour les différentes pièces.

Une notion n’est présente que pour les académies : essayer de reproduire les circonstances d’une audition en présentiel (8, 14) en enchaînant tout le programme

sans coupure. C’est d’ailleurs la catégorie de concours qui, proportionnellement, demande le plus aux candidats d’enchaîner les pièces en une seule prise.

Deux concours mentionnent les prises uniquement audio. Un concours pour une académie d’été les accepte même si les vidéos sont conseillées (11) et un concours international présélectionne les candidats uniquement sur des enregistrements audios (20).

La possibilité d’enregistrer séparément les mouvements d’une même œuvre est très variable et est abordée par peu de concours.

Un concours pour lequel le candidat doit enchaîner le programme sans interruption, précise qu’il est libre de choisir l’ordre des morceaux (46). Rien n’est précisé pour les autres.

b. Montage

Presque tous les concours spécifient que l’enregistrement doit se faire sans montage ni coupure. Certains ajoutent que les effets de post production sont interdits.

Pour surveiller les montages, un concours impose une règle aux candidats :

“Merci de laisser une horloge, un réveil ou un chronomètre bien visible dans le champ de la caméra afin de prouver l’absence de montage.” (8)

Pour dissuader les candidats, un autre affirme que des programmes vont être utilisés pour vérifier les tentatives de trucage (28). Deux concours affirment que la direction ou l’organisation du concours visionneront les vidéos en amont pour vérifier tout trucage (25, 30)

Un des concours demande au candidat de fournir une déclaration sur l’honneur :

“Fiche de déclaration sur l’honneur à signer :

Par la présente, je certifie, que l’enregistrement effectué par moi-même/par notre institution pour le/la candidat(e) susnommé(e) répond aux exigences citées dans le règlement du concours:

L’enregistrement a été effectué sans montage.
Ni la longueur ni la hauteur des tons n’ont été manipulées.” (31)

c. Cadrage

La majorité des consignes indique que la vidéo doit être filmée en plan fixe, et que le candidat doit être visible à tout moment. On trouve aussi d’autres consignes de cadrage : pas d’indications sur la vidéo, ni de mention de l’établissement d’origine du candidat (25, 32), prises de vue multiples autorisées (39, 45), angle de prise de vue de 45° (31), visibilité de l’instrument dans sa totalité (48), fond de la vidéo le plus propre possible (23), candidat debout si l’instrument le permet (3), si possible au moins 3 mètres entre la caméra et le candidat (3).

Les concours internationaux et les écoles supérieures donnent beaucoup d’indications quant au cadrage, mais concernant les autres concours peu de consignes sont données.

Un repère de 3 mètres est indiqué deux fois pour aider les candidats à placer la caméra (3, 14). Une autre indication vise à aider les candidats :

“the more reverberative the room, the closer you will need to be to the camera (usually 3 metres or 10 feet).” (14)

(plus la pièce est réverbérante, plus vous devrez être proche de la caméra (généralement 3 mètres).)

Un autre concours (23) fournit une photo pour montrer le cadrage souhaité :

Fig. 12 : Cadrage souhaité pour l’académie du festival Van Vlaanderen Brugge

d. Matériel

Fig. 13 : Qualité d’enregistrement attendue

Fig. 14 : Interdictions et recommandations de matériel

Les attentes concernant le matériel utilisé varient selon les consignes. Si beaucoup de concours n’apportent aucune précision à ce sujet, ou stipulent que les moyens techniques ne sont pas pris en compte par le jury, certains donnent des conseils ou même des règles assez strictes.

Ainsi, une école (3) impose aux candidats de s’enregistrer avec du matériel grand public (smartphones, tablettes, appareils photos, ordinateurs, Zoom) pour mettre les candidats sur un pied d’égalité. Ils ont interdiction de s’enregistrer avec plus de deux micros et d’avoir recours à un professionnel.

Au contraire, plusieurs concours d’écoles et d’académies recommandent vivement de s’enregistrer avec des microphones mais acceptent tout de même les vidéos enregistrées avec du matériel grand public. Certains précisent qu’une vidéo enregistrée au téléphone est suffisante (8, 11, 16, 17, 18, 19), même si une vidéo et/ou un son de qualité est préférable (8, 15, 17, 19). Les concours d’orchestres ont des recommandations tout aussi diverses.

Pour les concours internationaux, il est plutôt recommandé d’envoyer des vidéos professionnelles. Deux concours indiquent que la qualité n’a pas d’impact sur le jugement (42, 44) ou qu’elle n’a pas besoin d’être professionnelle (43) :

“You will not be penalised for the quality of your video, although it is important that it is good enough to see and hear you clearly.” (42)

(Vous ne serez pas pénalisé pour la qualité de votre vidéo, mais il est important qu’elle soit suffisamment bonne pour qu’on puisse vous voir et vous entendre clairement.)

“Recording should be a fair representation of the contestants’ abilities, but don’t need to be of a professional quality.” (43)

(Les enregistrements doivent représenter fidèlement les capacités des candidats, mais n’ont pas besoin d’être de qualité professionnelle.)

“Home-made or professional : It is up to you. Videos can be made with consumer cameras, camcorders, mobile phones, tablets, as well as professional equipment.” (44)

(Fait maison ou professionnel : c’est à vous de décider. Les vidéos peuvent être réalisées avec des appareils photo grand public, des caméscopes, des téléphones portables, des tablettes, ainsi qu’avec du matériel professionnel.)

Les autres concours internationaux recommandent des vidéos et/ou un son de qualité en conseillant : des microphones de qualité (21, 24), de ne pas utiliser de matériel grand public (21, 31), de travailler avec un professionnel (36) ou de faire une “vidéo aussi professionnelle que possible” (35).

e. Plateforme

Fig. 15 : Consignes de partage des vidéos

Pour les écoles, les académies et les concours internationaux il est demandé de mettre la ou les vidéos sur une plateforme tout public, parfois en imposant Youtube, et d’indiquer le lien au moment de l’inscription. Une seule école demande d’envoyer directement la vidéo en format mp4, avec une taille n’excédant pas 2,5 Go (6). Pour les postes d’orchestre, la plateforme Muvac est aussi utilisée pour transmettre les vidéos.

Pour les vidéos mises en ligne, le candidat doit parfois mettre les repères de durée dans la description, et mettre les vidéos en mode “non répertorié”.

Une autre contrainte s’ajoute pour les concours : les droits sur les vidéos. Deux concours (24, 36) demandent à ce que les vidéos ne soient pas soumises au copyright. Deux autres (25, 30) stipulent que les vidéos sont la propriété du concours jusqu’à sa fin et demandent au candidat de ne pas les diffuser. En effet, plusieurs concours diffusent les vidéos des candidats sur les réseaux sociaux ou sur leur site internet.

f. Cadre d’enregistrement

Il est parfois demandé d’enregistrer spécifiquement les vidéos pour l’occasion. C’est le cas de deux concours internationaux (29, 38) ainsi que d’une école (6).

“Les vidéos issues de concerts publics ne seront pas prises en considération. Au début de chaque vidéo, le/la candidat.e donne son nom et son prénom, indique le titre de l’œuvre, mentionne la date du jour de l’enregistrement et précise que l’enregistrement est destiné à la HEM.” (6)

Cette même école interdit les vidéos issues de performances publiques. Dans beaucoup de concours cette situation n’est pas spécifiée. Une académie (11) et des concours internationaux (21, 31, 32, 38) spécifient l’autorisation d’utiliser ce type d’enregistrement.

Du côté des concours d’orchestre aucune information n’est donnée sur le cadre d’enregistrement.

On trouve dans beaucoup de cas une contrainte temporelle : vidéos datant de moins de 6 mois (38), de moins d’un an (20, 22, 31, 32, 37, 42), de moins de deux ans (35,

40, 44) et même de moins de 3 ans (39).

“You can submit a video made anytime from 2021 and later, but it has to match with your age category on the day you submit your application.” (44) (Vous pouvez soumettre une vidéo réalisée à partir de 2021, mais elle doit correspondre à votre catégorie d’âge le jour où vous soumettez votre candidature.)

Un autre impose que la vidéo n’ait jamais été publiée auparavant (22). Pour certains il faut spécifier le lieu et la date de l’enregistrement (36, 39, 41).

“For each file, the candidate must certify its authenticity and that he/she is the soloist […] The videos may be recorded in different places and on different occasions.” (36)

(Pour chaque fichier, le candidat doit certifier son authenticité et qu’il est bien le soliste […] Les vidéos peuvent être enregistrées dans différents lieux et à différentes occasions.)

g. Accompagnement piano

Les quelques données concernant l’accompagnement par un pianiste indiquent des informations contraires, quel que soit le type de concours. Quatre concours laissent au candidat la possibilité au candidat de jouer seul s’il ne peut être accompagné (1, 2, 10, 19). Certains interdisent l’accompagnement (3, 14, 46, 49). Le concours n°3 autorise l’accompagnement uniquement pour le chant, le violoncelle, le violon et l’alto. Dans d’autres cas, l’accompagnement est obligatoire (38, 40, 47). Cela ne concerne que deux concours internationaux et un concours d’orchestre.

h. Conseils

Quelques concours donnent des conseils aux candidats.

“Sur l’appareil ou sur l’application que vous utilisez, le réglage automatique du niveau d’enregistrement doit être désactivé dans la mesure du possible pour rendre les nuances audibles. Vérifiez en jouant un passage piano et un passage fortissimo que toutes les nuances sont audibles sans déformation. Soyez très attentif à la réverbération et à la taille de la salle où vous enregistrez la vidéo, et à la distance entre vous et la caméra (qui doit si possible être au moins de 3 mètres).” (3)

Deux académies abordent la sonorité de la salle.

“Merci de filmer dans une pièce présentant une acoustique sèche ou medium (pas de réverbération du son) “ (8)
“Please take into account the size of the room and its acoustic” (14) (Veuillez tenir compte de la taille de la pièce et de son acoustique.)

Pour les concours d’orchestre et les concours internationaux peu de conseils sont donnés. L’un d’eux fournit un tutoriel vidéo pour aider les candidats à s’enregistrer (38). Un autre donne quelques conseils aux candidats :

“To ensure that poor recording quality does not interfere with the jury’s ability to review the material, avoid distortion, and ensure that the accompaniment is not louder than the applicant.” (42)

(Veiller à ce que la mauvaise qualité de l’enregistrement n’empêche pas le jury d’examiner les documents, éviter les distorsions et veiller à ce que l’accompagnement ne soit pas plus fort que le candidat.)

Un autre (44) indique que le candidat doit être bien habillé.

Une des académies (9) et un concours international (38) fournissent chacun un guide d’enregistrement sur leur site internet.

i. Format

Fig. 16 : Contenu des informations sur les formats vidéo

La spécification des formats est plutôt propre aux concours internationaux. Les quelques informations données sont précises.

“Video quality – 720p or 1080i or 1080p
Audio quality – PCM, flac, mp3 min. 256kbps or aac min. 192kbps
Microphone of adequate quality (no built-in microphones in mobile devices)
File format – mp4, mov, avi, mpg or mkv” (21)
“Resolution : 1920 x 1080 (horizontal)
Framerate : 25 (progressive, not interlaced)
Audio : Stereo (AAC)
Video codec : H.264/H.265 at 8Mbps
Video container / extension: MP4” (23)

j. Présentation

Certains concours demandent au candidat de se présenter et/ou de présenter les pièces au début de la vidéo. C’est le cas de quatre écoles (1, 4, 5, 6) et d’une académie (17). Un concours international demande aux candidats de filmer le flyer du concours au début de la vidéo (29).

III. Discussion

1. Procédés de recrutement

L’enregistrement est une pratique bien implantée dans le monde des concours et il semble difficile de l’éviter. Sur les 197 concours étudiés, 41% intègrent l’enregistrement dans au moins une étape de sélection. L’analyse des concours d’orchestre tend à montrer que les candidats doivent savoir s’adapter et être performants aussi bien lors des auditions en présentiel que lors des enregistrements vidéo pour obtenir un poste.

Les procédures de concours sont variables en fonction des instruments. Malhotra (1981) nous explique la hiérarchie des instrumentistes au sein de l’orchestre : le premier violon solo est le musicien au sommet de la hiérarchie, suivi dans l’ordre des premiers solistes de chaque instrument, des co-solistes, des anciens membres, des plus récents et des étudiants. Si l’on s’appuie sur les trois concours d’orchestre où les procédés de recrutement varient en fonction des postes, on peut conclure que l’étape de présélection ne dépend pas de la hiérarchie au sein de l’orchestre, mais que le processus de recrutement est propre à chaque institution. Cependant, le faible échantillon d’étude ne permet pas de tirer de conclusions sur ce phénomène.

Plusieurs hypothèses peuvent être formulées pour les autres types de concours. La différenciation entre les instruments pourrait se faire soit à l’appréciation des professeurs dans le cas des écoles, soit par souci d’organisation en fonction du nombre de candidats attendus dans les différentes catégories instrumentales.

2. Consignes d’enregistrement

La grande variabilité de la taille des consignes d’enregistrement peut impacter le candidat. En effet, des consignes très courtes pourraient lui donner l’impression de ne pas savoir précisément quoi envoyer. Au contraire, des consignes très longues peuvent l’empêcher de se consacrer pleinement à la musique pour se concentrer sur un cahier des charges très précis, mais cela peut aussi donner l’impression d’être guidé précisément dans les étapes de l’enregistrement. Beaucoup de consignes n’indiquent pas explicitement s’il faut rendre une ou plusieurs vidéos, ce qui peut mettre le candidat dans une situation d’incertitude. Devoir réunir toutes les œuvres en une seule vidéo lorsqu’elles ont été enregistrées séparément implique un travail de post-production pour le candidat qui doit savoir faire l’opération ou faire appel à quelqu’un.

Les deux concours acceptant ou imposant les prises uniquement audios sont comparables à une audition derrière paravent au cours de laquelle le jury ne voit pas le candidat et son anonymat est préservé. Elles laissent toutefois moins de chances au jury ou à l’organisation de repérer d’éventuels montages ou tricheries.

Les consignes se montrent intransigeantes sur le montage et plus généralement sur le travail de post-production. Un doute subsiste : lorsqu’il n’est pas indiqué que les effets de post-production sont interdits, les candidats sont-ils autorisés à traiter le son avec par exemple une réverbération artificielle ou un EQ (égaliseur) ?

Les consignes de cadrage sont assez générales. Elles ne se contredisent pas et semblent simples à appliquer.

Si les indications de qualité et de matériel sont variables, elles laissent tout de même le candidat libre de l’équipement utilisé dans la plupart des cas. Cependant, un son de qualité est souvent recommandé, ce qui implique que les musiciens aient à leur disposition du matériel et sachent s’en servir ou puissent faire appel à quelqu’un pour les aider.

Du côté des concours internationaux, deux catégories se distinguent. D’une part, les concours internationaux de prestige qui ont leur place depuis plusieurs années dans le paysage de la musique classique, d’autre part les concours qui se déroulent uniquement par vidéo. Alors que dans le premier cas, les vidéos ne sont qu’une étape de sélection parmi bien d’autres épreuves et qu’un enregistrement de qualité professionnelle est attendu, dans le second cas les critères de qualité sont bien plus faibles. Cela pourrait s’expliquer par l’exigence et la renommée des concours concernés d’un côté, et au contraire l’envie de rendre le concours accessible au plus grand nombre de l’autre, côté comme le soulignait Tokay (2020).

Concernant les formats, les termes employés sont techniques. On peut supposer que “Framerate : 25 (progressive, not interlaced)” et “Video codec : H.264/H.265 at 8Mbps” ne sont par exemple pas compris par tous les candidats.

La présentation au début des vidéos peut compliquer la période de concours pour un candidat qui souhaiterait par exemple utiliser ses enregistrements pour plusieurs écoles car les consignes ne sont pas toutes compatibles de ce point de vue. C’est un choix volontaire de certains concours qui demandent d’être nommés au début de la vidéo.

Troisième partie : Entretiens

I. Méthode de collecte des données

1. Technique d’entretiens

L’objectif de l’étude étant de documenter précisément les pratiques d’enregistrement des étudiants, nous avons choisi de fonder la base de notre recherche sur la technique de l’entretien. Comme l’expérience d’enregistrement peut être très variable et propre à chaque personne interviewée, il nous a semblé judicieux d’opter pour des entretiens semi-dirigés. Un guide d’entretien (Annexe 2) a été rédigé préalablement mais l’ordre des questions est variable pour s’ajuster le plus naturellement à la conversation. Des questions peuvent être ajoutées si l’interlocuteur aborde une thématique qui n’est pas dans le guide d’entretien car cela peut amener de nouvelles idées à étudier. Des questions peuvent aussi s’ajouter au fur et à mesure des entretiens si de nouvelles interrogations sont soulevées par les interlocuteurs précédents.

2. Procédure

Ayant dans notre entourage des connaissances dont les profils correspondent tout à fait aux critères définis dans cette étude, nous avons directement pris contact avec eux. Ils ont été mis au courant de l’objectif de l’étude et de la durée approximative de l’entretien, mais pas des questions posées. Ils ont été informés du cadre institutionnel de l’étude et nous avons pu adopter une attitude tout à fait formelle au cours des entretiens. Avec l’autorisation des participants, les entretiens ont été enregistrés pour être ensuite retranscrits. Ils ont eu lieu en grande partie à la Haute École de Musique de Lucerne dans des salles de travail. Deux entretiens ont été réalisés directement chez les participants et un autre par téléphone pour des raisons pratiques. L’anonymat a été garanti aux participants pour les inciter à s’exprimer plus librement.

3. Choix des participants

Nous avons fait appel à huit étudiants pour qu’ils nous fassent part de leurs expériences et de leur point de vue sur le sujet étudié. Le choix des participants s’est fait selon plusieurs critères. Chaque participant devait parfaitement parler le français pour pouvoir mettre en regard les propos des uns et des autres. Chacun devait être inscrit dans un cursus d’études supérieures en musique classique. L’instrument, le nombre d’années d’études ainsi que le nombre et le type d’expériences d’enregistrement étaient des aspects que nous souhaitions volontairement

hétérogènes sur l’ensemble des participants. Nous avons toutefois respecté une parité de genre en interrogeant quatre hommes et quatre femmes. En amont de chaque entretien, nous avons échangé avec les participants pour cerner de manière succincte leur parcours, leurs expériences et leur intérêt pour le sujet.

4. Profil des participants

Les tableaux ci-dessous présentent les différents participants. Le numéro attribué à chaque participant servira de code pour rendre plus fluide la présentation des résultats.

Participant	Âge	Instrument	Expériences d’enregistrement
1	23	Trompette	8 ou plus
2	24	Piano	2
3	23	Accordéon	4
4	19	Trompette	1
5	26	Harpe	5
6	25	Flûte	6
7	24	Basson	3
8	25	Direction d’orchestre (saxophone)	8 ou plus

Fig. 17 : Âge, instrument et expériences d’enregistrement des participants

Un participant étudie plusieurs disciplines. Sa discipline secondaire est marquée entre parenthèses dans le tableau ci-dessus.

Participant	Niveau d’études	Nombre d’années d’études en supérieur	Établissements fréquentés
1	Bachelor	2	Hochschule Luzern, Lucerne (Suisse)
2	Bachelor	3	Hochschule Luzern, Lucerne (Suisse)
3	Bachelor	4	Hochschule Luzern, Lucerne (Suisse)
4	Bachelor	3	Hochschule Luzern, Lucerne (Suisse)

5	2^nd Master	6	Hochschule für Musik, Karlsruhe (Allemagne) Trinity College of Music, Londres (Angleterre) Hochschule Luzern, Lucerne (Suisse)
6	Master	5	Hochschule Luzern, Lucerne (Suisse)
7	Bachelor	2	CNSMD, Lyon (France)
8	2^nd Bachelor	8	Haute École de Musique, Lausanne (Suisse) Hochschule Luzern, Lucerne (Suisse)

Fig. 18 : Niveau d’études et établissements fréquentés par les participants

II. Méthode d’analyse des résultats

1. Transcription des données orales

Nous avons réalisé les entretiens sur une durée de neuf mois entre octobre 2022 et juin 2023. La durée de chaque entretien est comprise entre 20 et 65 minutes. Nous avons par la suite procédé à la retranscription des données collectées à l’aide des enregistrements des entretiens. Par souci de clarté et pour faciliter l’analyse, nous nous sommes efforcés de gommer certaines marques d’oralité, fautes de langage, hésitations, onomatopées et ce, en restant le plus fidèle possible au discours original de l’interrogé.

2. Outil d’analyse : la théorisation ancrée

Pour procéder à l’analyse des entretiens nous nous sommes appuyés sur la méthode de la théorie ancrée. Cette méthode permet d’aboutir à une théorie sur un sujet à partir d’une analyse qualitative des données récoltées. Selon Paillé (1994), cette méthode d’analyse n’est pas l’analyse d’un contenu, mais un acte de conceptualisation. Sa particularité est la simultanéité de la collecte et de l’analyse. Nous avons donc procédé à la transcription des entretiens et à leur analyse à un intervalle régulier de deux entretiens, l’objectif étant de pouvoir orienter au mieux les entrevues suivantes.

Paillé (1994) distingue six étapes progressives dans la démarche d’analyse :

La codification : découpage des transcriptions par lignes ou groupes de mots pour en dégager le propos (de quoi est-il question ?)
La catégorisation : affinage de la phase de codification, l’analyse devient plus conceptuelle (quel phénomène se dégage de ces données ?)

La mise en relation : recherche des liens entre les différentes catégories (pourquoi et comment sont-elles liées ?)
L’intégration : délimitation de l’objet d’analyse (sur quoi porte l’étude ?)
La modélisation : reproduction de la structure du phénomène en se basant sur les catégories identifiées précédemment (quelles sont les causes, les conséquences et les processus en jeu ?)
La théorisation : étape finale

Afin de présenter notre analyse, nous avons choisi de regrouper nos résultats sous la forme de tableaux synthétiques. Chaque tableau correspond à une catégorie identifiée et regroupe les sous-catégories et les concepts émergents correspondants et leurs occurrences totales dans le corpus.

CATÉGORIE
Sous-catégorie 1	Concept émergent 1	partagé par…	occurrence totale
	…	partagé par…	occurrence totale
	Concept émergent N	partagé par…	occurrence totale
…	…	…	…
Sous-catégorie X	Concept émergent 1	partagé par…	occurrence totale
	…	partagé par…	occurrence totale
	Concept émergent N	partagé par…	occurrence totale

III. Présentation des résultats

27 concepts se sont dégagés, nous les avons regroupés en 3 catégories et 9 sous-catégories. Le tableau ci-dessous synthétise les résultats obtenus après analyse des données.

Catégories	Sous-catégories
CONTEXTE	Savoirs et capacités
	Enjeux
	Moyens à disposition
ENREGISTREMENT	Aspects techniques
	Organisation
	Résultat sonore
	Ressenti
PRATIQUE MUSICALE	Travail
PRATIQUE MUSICALE	Performance

Fig. 19 : Catégories et sous-catégories identifiées lors de l’analyse par théorisation ancrée

1. Contexte

CONTEXTE
Savoir et capacités	Accès à une formation	2,3,6,7,8	17
Savoir et capacités	Difficultés techniques	1,2,3,4,5,6,8	29
Enjeux	Occasions	1,2,3,4,5,6,7,8	51
	Évolution de la demande	1,3,4,5,6,7,8	25
	Moyens déployés	1,3,5,6,7,8	25
	Anticipation	1,2,6,7,8	15
Moyens à disposition	Moyens financiers	1,2,3,5,7,8	20
	Moyens matériels	1,2,3,4,5,6,7,8	19
	Système d’écoute	2,3,4,6,7,8	16
	Lieu	1,2,3,4,5,6,7,8	31

a. Savoir et capacités

✱ Accès à une formation

Les étudiants ont accès à des modules concernant les techniques du son au cours de leur formation d’instrumentiste. Les offres et formats de cours sont variables au sein des établissements.

“C’était obligatoire pour tout le monde. Ils obligeaient aussi les programmes sur lesquels on devait travailler. C’est-à-dire qu’on avait aussi des cours d’écriture de partitions donc on était obligés de travailler sur Sibelius. […] On a appris à faire de la composition, de la MAO³, en MIDI. Nous sommes restés très en surface mais sur beaucoup de choses. C’était sur un an, on avait 2h par semaine. […] on a fait des sessions studios. On avait pris des titres connus on devait faire des covers et le but c’était d’organiser une session.” (8)

“C’est un week-end où l’on découvre le matériel dont la HSLU dispose et on a tous manipulé, c’est en groupes et ils nous montrent comment faire. Certains étaient dans la régie et d’autres qui étaient dans des salles, on alternait les groupes entre ceux qui jouaient et les autres qui enregistraient.” (2)

Le format du cours influe sur l’apprentissage et la capacité à retenir les informations abordées dans le cours.

“On a fait ça sur trois jours et évidemment après tu oublies tout. Franchement je ne saurais plus comment le faire. On a regardé les petites tables de mixage, je ne sais même plus comment le faire.” (3)

Deux musiciens ne sont pas intéressés par ces cours, optionnels dans certaines écoles.

“C’est quelque chose qu’on prend en option, c’est en UV4⁴. Quand tu es bassoniste, tu as le basson baroque qui te tend les bras en UV4. On s’arrache les créneaux donc j’ai préféré privilégier le basson baroque.” (7)

✱ Difficultés techniques

Tous les participants à l’exception d’un éprouvent des difficultés à enregistrer car ils n’estiment pas avoir toutes les compétences nécessaires.

“Ça me prend un temps fou de savoir où est le problème. Mais c’est aussi un problème de formation j’imagine. Entre savoir si c’est le câble, le micro, l’entrée XLR ou si c’est juste que Protools ne s’est pas bien lancé… Parfois je me prends la tête, c’est assez compliqué” (8)

“Je me rends compte que c’est tout un monde et toute une formation qu’il faut avoir et en fait maintenant c’est ok de se dire je préfère me concentrer sur la partie artistique et c’est ok de ne pas tout savoir-faire.” (2)

Il en est de même pour la post-production.

“Je ne fais pas de mastering et je ne fais pas un mix poussé du tout parce que je ne sais pas le faire” (8)

Deux étudiants estiment leurs connaissances suffisantes pour leur usage.

“Pour la prise de son personnelle de mon instrument maintenant je sais faire, en tout cas je pense pouvoir faire quelque chose de tout à fait correct.” (1)

b. Enjeux

✱ Occasions

L’enregistrement est une pratique importante pour les musiciens, qui y sont confrontés lors de différentes occasions. Les raisons de s’enregistrer sont très variables, elles sont présentées dans le tableau ci-dessous.

Pour démarcher des festivals ou des concerts, une étudiante souligne l’importance de présenter des enregistrements.

“Quand tu veux jouer à un endroit ça fait la différence d’envoyer un dossier avec au moins une petite vidéo de ce que tu sais faire” (2)

La création a une place importante dans les enregistrements réalisés par les participants. Elle est évoquée aussi bien pour le travail de Maturité, dans un cadre professionnel ou simplement pour le plaisir.

“J’ai fait mon travail de Maturité, mon projet de fin de lycée. J’ai fait ça dans Audacity, c’était un livre audio avec de la musique de Schubert. J’ai fait du montage audio avec des enregistrements que j’ai mis avec une histoire que ma prof de flûte à bec a gentiment lue.” (6)

“Ça m’est déjà arrivé d’enregistrer pour des compositeurs qui demandaient des improvisations pour un projet. La première fois il voulait de l’inspiration, il a utilisé les impros pour faire des compositions avec. Avec un autre compositeur on devait enregistrer des sons spéciaux avec nos instruments et il les utilisait pour faire une tape électronique.” (3)
“Pour m’amuser je fais des maquettes un peu plus RNB où je chante” (1)

Dans le cadre de formation ou d’opportunités professionnelles, les enregistrements sont souvent imposés, notamment pour les concours d’entrée dans des écoles, les concours internationaux, les masterclasses, les académies, les postes d’orchestre et les Erasmus. Le suivi pédagogique grâce à l’enregistrement s’est mis en place lors des différentes restrictions liées au Covid mais cela reste un outil encore utilisé.

“Après les masterclasses je garde des contacts avec les profs, des fois je leur envoie des vidéos et ils me font un retour” (8)

“De temps en temps mon professeur me demande de m’enregistrer et d’écouter, voire de lui envoyer des enregistrements. Quand j’ai quelques cours qui sautent pour des raisons de tournée avec Radio France de son côté ou du mien avec des sessions d’orchestre, j’ai quand même un suivi pédagogique.” (7)

Enfin, l’enregistrement peut correspondre à une démarche de documentation personnelle.

“J’ai aussi enregistré de temps en temps des concerts. Là c’était un concert spécial où j’ai joué de la musique de chambre et c’était unique, c’était pour avoir une trace des morceaux.” (5)

✱ Évolution de la demande

Presque tous les participants constatent une omniprésence du besoin d’enregistrement.

“Aujourd’hui tous les concours sont par vidéo, enfin il y en a très peu où ça ne l’est pas, il faut rester ouvert à cette activité” (3)

Cette forte augmentation des besoins d’enregistrement est souvent attribuée au covid.

“Les vidéos de concours ont connu un essor incroyable et démesuré avec le confinement et c’est encore le cas même si beaucoup de mesures sont levées voire toutes dans certains pays. La quantité d’académies qui fonctionnent par vidéo c’est hallucinant. Il n’y a presque aucune académie ou tu dois faire un concours en vrai.” (1)

Deux participants se montrent critiques sur les sélections organisées par vidéo, mais l’un d’entre eux y trouve tout de même des avantages.

“Des fois c’est juste une phase de sélection, des fois c’est carrément le concours entier, tu gagnes un concours par vidéo. Ça existe, il y a beaucoup de concours par vidéo, et tu te dis mais qu’est-ce que c’est, est-ce qu’on fait de la musique ? Dans le classique moi je trouve ça un peu bizarre, pour pré-sélectionner pourquoi pas.” (1)

“Je pense que ça peut être un atout et que ça a aussi beaucoup encouragé l’inscription de candidats de l’étranger parce que ça évite un déplacement. Ça évite de s’embêter. Au moins tu sais que tu travailles sur place et que ça ne te coûte rien de monter un programme de 1^er tour.” (7)

✱ Moyens déployés

En fonction de l’enjeu, les candidats ne s’investissent pas de la même manière dans l’enregistrement. Cet investissement se traduit par le choix du matériel utilisé.

“Ça dépend de la qualité de l’enregistrement que je veux avoir et de ce que j’en fais après. Si c’est juste pour pouvoir participer à une masterclass je pense que mon zoom est suffisant, mais si par exemple c’est pour mettre une vidéo sur le site que j’aurais je pense que je ferais la chose différemment.” (3)

Quatre candidats préfèrent travailler avec un ingénieur du son en fonction du projet. L’ingénieur du son est privilégié pour mettre du contenu en ligne ou participer à des concours prestigieux.

“Pour enregistrer un CD ou pour faire des bons enregistrements j’aimerais travailler avec quelqu’un. Si c’est un grand concours international je prendrais peut-être un ingénieur mais si c’est un concours d’entrée je ne pense pas. En fait, s’il y a beaucoup de gens qui peuvent l’écouter j’aurais plus tendance à enregistrer avec quelqu’un que si c’est juste pour un jury.” (5)

Les participants 2 et 4 souhaitent travailler avec un professionnel dans tous les cas.

“Je ferais avec quelqu’un. Je serais là pour installer parce je trouve ça trop bien de pouvoir en parler avec la personne et de comprendre ce qui est bien, pourquoi le micro est mieux là, comment brancher ça… Mais je ne ferais pas ça toute seule, je ferais avec quelqu’un” (2)

✱ Anticipation

Parfois, les musiciens saisissent des opportunités qu’ils ne peuvent pas anticiper. Pour cette raison, enregistrer soi-même est la solution privilégiée.

“Si on me dit : il y a une académie, la deadline est dans une semaine, tu connais les traits d’orchestre, tu ne veux pas tenter, ça pourrait être une bonne expérience si jamais tu passes. Pour ça, je vais avoir tendance à le faire un peu plus à l’arrache parce que je me dis que comme je n’ai pas surpréparé le programme je ne vais pas mobiliser quelqu’un pour enregistrer ça.” (1)

Cela peut aussi influer sur le choix du matériel utilisé.

“Il m’est arrivé de faire une vidéo de concours pour une académie avec un Zoom parce que ça allait plus vite. C’était un Zoom qui faisait caméra aussi et comme j’avais peu de temps pour me filmer et m’enregistrer, une amie me l’a passé comme ça je n’avais pas de montage à faire.” (1)

Pour obtenir certains moyens, cela nécessite vraiment d’anticiper les échéances.

“On s’y est prises un mois à l’avance pour réserver une salle toute la journée” (2)

“L’ingénieur du son du CNSMD tu es obligé de le réserver six mois à l’avance et tu as des créneaux hyper serrés” (7)

Une participante évoque des difficultés pour s’organiser.

“Je n’ai pas le temps, je fais tout à la dernière minute. Je ne suis pas organisée” (6)

c. Moyens à disposition

✱ Moyens financiers

L’aspect financier est aussi à prendre en considération pour les étudiants. Pour certains, c’est un obstacle pour travailler avec quelqu’un.

“Même si je fais 5 ou 6 vidéos de concours par an, je me sentirais très mal à l’aise de demander à chaque fois à quelqu’un qui est professionnel de faire ça gratuitement. Si je devais le payer je n’aurais pas les sous pour le faire donc je me débrouillerais autrement.” (1)

L’argent investi dépend aussi de l’enjeu pour le musicien.

“C’est clairement une question d’enjeu, ce n’est pas une question financière puisque si je devais faire un vrai truc, j’imagine que je trouverais les moyens de le faire, je ferais des demandes de subvention.” (8)

Pour une étudiante, un changement d’avis s’est opéré après avoir demandé de l’aide à un professionnel.

“C’était aussi une question financière. Mais maintenant qu’on voit le résultat, tout est léger, on se dit que bien sûr, ça vaut le coup de faire appel à quelqu’un et de payer, c’est évident. Il y a une raison pour laquelle ces gens sont là. Autant mettre de l’argent pour éviter un poids sur la journée.” (2)

✱ Moyens matériels

Tous les candidats ont investi dans du matériel d’enregistrement. Six d’entre eux possèdent un Zoom.

“J’ai un Zoom. J’ai vu plein d’étudiants à la Haute École qui les utilisaient pour s’enregistrer, du coup je l’ai acheté parce que je me suis dit que j’allais sûrement m’en servir.” (3)

Quatre ont investi dans des microphones. Ils ont demandé conseil à des personnes de leur entourage qui ont des connaissances en enregistrement.

“J’ai une carte son Presonus il me semble, et un TLM 102 de la marque Neumann, c’est à peu près tout, donc je m’enregistre en mono. C’est ma copine qui m’a conseillé ce matériel […] Je me suis dit que c’était pratique, je paye mon matériel à un certain prix, au moins je n’ai pas besoin de solliciter quelqu’un à chaque fois. ” (1)

“Mon frère qui est dans le domaine du cinéma m’a conseillé de prendre deux micros que je mets de chaque côté de la harpe, donc j’ai acheté des micros Rode” (5)

Quand ils en ont besoin, les étudiants empruntent du matériel à leur école ou à des connaissances.

“Si je dois utiliser des statiques je n’ai pas les moyens, donc soit je les loue soit je demande à un copain qui a quelque chose de bien.” (8)

Pour la vidéo, ils utilisent des téléphones, des caméras ou des enregistreurs Zoom.

Seule une participante réfléchit à investir actuellement dans du matériel. Pour les autres, ce n’est pas une priorité, aussi bien pour le son que la vidéo.

“Je réfléchis actuellement pour une caméra, pour pouvoir mettre ensemble le Zoom et la caméra, pour avoir une belle image. Je me dis qu’avoir une bonne caméra ça peut être pas mal quand même.” (3)

Deux participants émettent des critiques sur leur matériel.

“La carte son n’est pas du tout suffisante par rapport à la qualité du micro que j’ai et c’est un peu dommage” (1)

“Ça ne marchait pas, il y avait toujours des fautes, des trucs qui sautaient ou des trous. Ce n’est pas super quand tu dois prouver que tu as tout enregistré d’un coup. Il y avait une application exprès pour enregistrer, tu pouvais aussi faire les vidéos avec mais ça marchait moyennement bien” (6)

✱ Système d’écoute

Les candidats ont des systèmes d’écoute de qualité variable.

“En général avec des écouteurs… Ou un casque. Mais pas avec le haut-parleur, ce n’est vraiment pas terrible.” (7)

“J’ai acheté seulement récemment un casque. C’est un Bose, pour le Bluetooth “ (3)

“J’ai des enceintes passives, qui sont branchées à mon ordinateur. À un moment j’étais au casque Bluetooth […]. Je fais de la composition et d’autres choses donc c’est bien d’avoir de bonnes enceintes” (8)

Deux participants qui n’ont aucun système d’écoute ont emprunté des casques dans leur école pour réaliser leurs enregistrements.

“J’avais un casque que je prenais à la Haute École. Ça, ou bien des écouteurs, pas très bien d’ailleurs. Avec le temps je me suis dit que c’était mieux de prendre un casque parce que les écouteurs avec fil, les petits, ça sonne quand même moins bien.” (4)

Un participant trouve le travail au casque peu confortable.

“À la base quand j’étais à Lausanne je faisais tout au casque. J’avais mon casque Bose avec le Bluetooth qui se connectait à l’ordinateur. Je me suis rendu compte que ça me faisait assez mal à la tête si je faisais une session de 3h d’ordinateur. Je ne sais pas si c’était à cause du Bluetooth ou juste parce c’était au casque. C’est quand même un confort d’avoir des enceintes.” (8)

✱ Lieu

Les candidats soulignent les problèmes pour obtenir des salles dans leur établissement.

“On connaît la problématique d’avoir des salles de travail en tant qu’instrumentiste, tu te contentes de ce que tu as.” (7)

Deux participants ont enregistré chez eux mais ont rencontré des problèmes.

“Des fois j’ai tenté d’enregistrer chez moi aussi mais en fait ça ne marchait jamais, puisque j’étais chez moi je n’étais pas dans le même état d’esprit.” (1)

“On ne savait pas trop à quel point les voisins toléraient.” (6)

Pour un étudiant, l’acoustique est un critère important pour le choix de la salle, mais pour les autres ce n’est pas prioritaire.

“Ma solution la plus simple c’est que j’ai 4-5 salles qui ne sonnent pas trop mal. J’en ai une dizaine où je veux être sûr de ne pas aller.” (8)

“La salle n’était pas mon premier critère parce que je sais que si tu joues bien et que tu n’es pas dans une bonne salle tu peux quand même le faire. Après c’est sûr que ça change, d’ailleurs ma meilleure vidéo était dans la grande salle d’orgue. Peut-être que ça a aidé, peut-être pas, je ne sais pas.” (4)

Un participant a essayé d’améliorer l’acoustique de la salle dans laquelle il enregistrait.

“C’était très fait maison dans des salles pas du tout adaptées, on se faisait des pare-son avec des manteaux.” (1)

2. Enregistrement

ENREGISTREMENT
Aspects techniques	Placement	1,2,3,4,5,6,7,8	33
	Réglages	1,2,3,4,6,8	36
	Post-production	1,2,4,5,6,8	30
	Aide extérieure	1,2,5,8	16
Organisation	Méthode	1,2,3,4,5,6,7,8	42
	Aspect répétitif	1,2,3,4,5,6,7,8	25
	Aspect temporel	1,3,4,5,6,7,8	30
Résultat sonore	Qualité	1,2,4,5,6,7,8	66
	Objectivité	1,2,4,6,7,8	32
	Références d’écoute	1,5,6,7,8	15

Ressenti	Intérêt	1,2,3,4,5,6,7,8	53
Ressenti	Attentes d’une formation	1,3,4,5,6,8	25

a. Aspects techniques

✱ Placement

Le placement des microphones ou appareils d’enregistrement fait partie des problématiques rencontrées par les participants. Deux d’entre eux se placent le plus loin possible de l’enregistreur, deux autres essayent différents placements avec leurs microphones.

“Je me mettais loin, ça dépend des salles mais je me mettais simplement le plus loin possible.” (3)

“Je fais quelques petites balances, en général je profite des balances pour chauffer. Si je n’ai pas chauffé avant, je fais 5 minutes de chauffe dans une position de micro. J’écoute et ensuite je refais 5 minutes un peu différemment en fonction de comment le son m’a plu, en m’éloignant, en bougeant un peu le micro etc.” (1)

Les candidats n’accordent pas la même priorité au placement des microphones.

“On était tellement focalisées sur la qualité musicale qu’on pouvait faire que pour la flûte par exemple on ne s’est pas dit mince c’est peut-être un peu trop proche. On n’a pas replacé les micros.” (2)

“Avec le temps je me suis rendu compte que le micro et la manière dont il était positionné ça faisait déjà tellement.” (8)

Certains jouent avec la position des musiciens pour améliorer l’enregistrement.

“Je revenais un peu au vieux système d’orchestre européen, je mettais 1^ers violons à gauche et 2^nds à droite pour que ça ne se noie pas trop, je trouvais que c’était plus facile à mixer après.” (8)

“On a un peu triché en se disant que comme j’étais probablement celle qui jouait le plus fort, je me mettais au coin de la salle le plus au fond puis la clarinette puis la chanteuse. On a un peu essayé de jouer avec la salle et avec la distance par rapport à l’enregistreur.” (3)

Une étudiante a testé le placement de ses microphones avec sa professeure.

“Quand je faisais les cours chez moi en Allemagne avec FaceTime ou Zoom j’avais les micros. Elle me disait de les mettre plus loin ou plus près de la harpe pendant le cours pour l’enregistrement.” (5)

✱ Réglages

La plupart des musiciens règlent le gain sur leurs appareils avant de s’enregistrer. Ce réglage n’est pas évident pour certains participants, deux d’entre eux ont rencontré des problèmes de niveau sonore.

“Au début ce n’était pas très bien, c’était nouveau le Zoom pour moi du coup c’était un peu bizarre, je le mettais un peu trop fort.” (4)

“Je ne le fais pas très bien, c’est souvent un peu trop bas. J’aurais pu faire plus mais je n’ose pas parce que j’ai peur que ce soit trop. Je me dis que c’est mieux trop peu que trop. Mais du coup j’ai des enregistrements qui sont beaucoup trop faibles.” (6)

Deux participantes ont demandé de l’aide à des amis ou des connaissances pour faire les réglages.

“Mon frère regardait quand je jouais le son le plus fort si ça ne saturait pas. Il m’aidait pour ça et après il partait.” (5)

Trois étudiants ne se sentent pas assez informés sur les réglages possibles avec leur matériel. Une d’entre elles éprouve aussi des difficultés avec son appareil photo.

Il y a beaucoup de paramètres quand même quand tu lis la notice d’emballage, tu peux faire beaucoup de choses. C’est génial mais il faut savoir les faire.” (4)

✱ Post-production

La post-production étant interdite par les concours, trois étudiants ont indiqué ne jamais avoir traité le son de leurs enregistrements. Pour cette raison, deux étudiants craignent d’enregistrer l’audio et la vidéo sur des appareils distincts.

“Comme ils ne voulaient pas de montage je craignais d’enregistrer le son et de mettre l’image par-dessus.” (2)

“Certes avoir le microphone devant l’instrument c’est plus authentique mais ça peut aussi faire plus modifié. […] Quand tu vois une vidéo avec un micro, si le son est bien tu peux te dire qu’il y a de la post-production.” (1)

Deux participants pratiquent le mixage. Ils estiment le faire de manière peu poussée et passent tous les deux par une personne extérieure pour contrôler.

“Je fais le strict minimum que je sais faire. Je règle les balances, je fais plein de choses, parfois je peux mettre un peu de réverbération. Je fais vraiment du mix très simple. Après, je ne fais pas dans le détail, j’ai un copain qui fait ça très bien à qui j’envoie les sessions Protools. Je fais un mix, je fais mes cuts, je mets la réverbération qui me plait et je règle un peu la balance et les choses comme ça, mais je ne fais pas du tout de mastering ou un mix poussé parce que je sais pas le faire.” (8)

“Ça m’est arrivé de faire deux ou trois points de montage rapidement, de mettre des EQ, une réverbération. Souvent je fais vérifier ça par des gens qui savent le faire mais j’aime bien essayer. J’ai déjà fait du montage et un peu de post-production pour m’amuser, pour faire des maquettes un peu plus RNB pour moi où je chante.” (1)

Pour les autres, la post-production correspond souvent à synchroniser le son et l’image s’ils ont été enregistrés séparément, ajouter une réverbération ou bien répartir les pistes dans l’espace.

Une participante a eu du mal à régler le niveau sonore.

“Il y a beaucoup de choses où j’étais dans le rouge à la fin, mais si ça ne saturait pas tout était trop bas donc je me suis dit que je m’en fichais si ça saturait.” (6)

Une autre a réalisé un montage entre plusieurs plans vidéo. Il s’agissait d’un plan large et de deux plans fixes avec un cadrage plus resserré.

“J’ai refait le montage avec les vidéos zoom. Parce qu’il y avait une caméra centrale et par-dessus j’ai mis des petits zooms sur la version qu’on avait choisie.” (2)

Les participants utilisent différents logiciels lors de leurs activités d’enregistrements audios, vidéos ou de Musique Assistée par Ordinateur.

Logiciel	Utilisé par
Protools	1, 8
Cubase	1, 2
iMovie	3, 5, 7
Audacity	6
Da Vinci Resolve	6
Microsoft Clipchamp	8
Sibelius	8
Sans logiciel	4

Fig. 21 : Logiciels utilisés par les participants

✱ Aide extérieure

Les participants font appel à d’autres personnes pour les aider. Il s’agit d’enseignants ou de connaissances. Cette aide concerne le choix du matériel et les réglages mais aussi la post-production.

“J’avais un copain ingénieur du son qui me prêtait son matériel. Il savait bien que ça ne devait pas être quelque chose de professionnel du coup il me conseillait et me disait comment les placer.” (8)

“Dans les faits, je sollicite quand même quelqu’un à chaque fois pour lui demander si ma post-production est bien ou pour lui demander de changer mon EQ parce que je n’arrive pas à la régler comme je veux.” (1)

“C’est mon frère qui m’aidait à mettre la caméra avec les micros, à tout superposer.” (5)

b. Organisation

✱ Méthode

Pour beaucoup de musiciens, l’enregistrement correspond à une période de plusieurs séances d’enregistrement variant de quelques jours à plusieurs mois.

“Quand j’ai enregistré pour Lucerne, qui était un gros objectif si on contextualise, j’ai dû enregistrer sur 10 à 14 jours différents. Quand je dis 14 journées d’enregistrement c’était souvent une matinée par exemple ou une soirée, 3h ou 4h maximum. Le pire que j’ai dû faire en terme de temps c’était 3h30-4h.” (1)

“Ça m’a pris deux mois pour faire une bonne vidéo, j’enregistrais tous les deux ou trois jours.” (4)

Deux candidats ont réalisé leurs enregistrements avec une stratégie précise.

“J’ai enregistré chaque morceau séparément. Il y avait en fait plusieurs morceaux à faire et j’avais plusieurs semaines, ça devait prendre un jour ou deux pour enregistrer un morceau. Le lendemain, si je me sentais de refaire ce morceau ou si j’avais l’impression que ce n’était pas tellement bien la veille, je le refaisais. Après, je passais au suivant. Une semaine je travaillais à fond un morceau et encore un peu les autres. Le jour de l’enregistrement je ne travaillais que ce morceau et je l’enregistrais quand je me sentais bien.” (5)

“J’ai fait avec une amie, on s’est un peu soutenues ensemble et du coup on s’est motivées. On a réservé une salle beaucoup de fois et on avait la salle d’à côté où l’une travaillait pendant que l’autre s’enregistrait puis on échangeait.” (6)

Les autres évoquent une absence de méthode. Ils enregistrent leur programme jusqu’à obtenir une vidéo dont ils sont satisfaits ou jusqu’à la date limite.

L’alternance entre le travail du programme et l’enregistrement nécessite de trouver un équilibre.

“Je faisais un jour une vidéo puis le lendemain je travaillais, enfin je l’écoutais

et puis je travaillais dessus.” (4)

“Je l’ai vécu pour faire mes vidéos de concours pour entrer à Lucerne, de ne plus prendre de temps pour travailler, de ne faire que des enregistrements et de me dire que dans tous les cas je progressais en faisant des enregistrements. C’est vrai mais tu as aussi besoin de prendre du temps pour juste retravailler des petits passages qui ne passent pas forcément bien ou qui peuvent facilement te faire perdre le contrôle.” (1)

Les étudiants doivent en plus gérer leur travail personnel ainsi que d’autres échéances pendant la période d’enregistrement.

“Il fallait que je travaille aussi pour les cours de trompette, je faisais ça en parallèle.” (4)

“Le problème c’est que le 1^er tour de Lyon est arrivé avant le 2^nd tour de Paris, qui était le concours que je visais. Donc il fallait que je monte des bonnes vidéos pour Lyon mais il fallait aussi que je monte un programme.” (7)

✱ Aspect répétitif

Lors de leur séance d’enregistrement, plusieurs musiciens répètent leur programme en boucle et ont tendance à s’arrêter au cours de leur pièce s’ils ne sont pas satisfaits.

“Je fais plusieurs fois la pièce jusqu’à ce que je sois obsédée et que je me dise qu’il faut changer.” (6)

“Si je dois faire une version concert et qu’une prise n’est pas bonne j’arrête tout de suite. J’arrête même si je ne trouvais pas bien la 1re note.” (8)

“On a fait un concert online au conservatoire à Londres, donc retransmis en direct, et une autre harpiste qui a aussi joué avait tellement l’habitude de recommencer quand elle faisait une faute qu’elle l’a aussi fait au concert.” (5)

Deux d’entre eux éprouvent des réserves quant à cette méthode.

“Le piège de s’auto-enregistrer c’est vraiment que tu as une possibilité illimitée de recommencer, ce qui est génial, sauf que tu arrives à un statut de l’enregistrement qui est presque malsain de te sur-enregistrer, de ne faire que ça.” (1)

Un participant s’impose un nombre limité de prises par séance.

“Si je joue un programme de 10 minutes j’ai trois chances, et encore. Si c’est plus court j’ai 5-6 chances et je me laisse du temps entre. J’ai trop fait d’enregistrements de 3-4h où tu perds ton temps et au bout de 3h tu te dis je suis fatigué, allez une petite dernière, on ne sait jamais.” (1)

✱ Aspect temporel

Les participants trouvent l’enregistrement chronophage et énergivore. Plusieurs d’entre eux y passent plus de temps que la durée initialement prévue.

Pour contrer cela, certains participants enregistrent en s’imposant une limite de temps. Parfois cette limite est liée à des contraintes comme la disponibilité de la salle ou celle des autres musiciens dans le cas d’un enregistrement de musique de chambre. Travailler avec un ingénieur du son fixe aussi une contrainte temporelle.

“Maintenant j’essaye le plus possible quand je m’auto-enregistre de me limiter en temps et de me dire que j’ai réservé une bonne salle pendant 2h ou 1h30.” (1)

Le temps peut aussi être une source de stress pour certains musiciens, qui préfèrent s’enregistrer sans cette contrainte.

“Avec un ingénieur du son tu sais que des séances tu n’en as pas tant prévu que ça parce qu’il n’est pas forcément disponible, ce qui est normal. Tu as une séance d’une certaine durée, et plus ta séance passe plus tu stresses de te dire est-ce que je vais avoir quelque chose de convaincant à l’issue.” (7)

Une fatigue découle de la répétition du programme et de la durée des séances d’enregistrement. Deux musiciens parlent de leur fatigue musculaire, il est physiquement impossible pour eux de jouer indéfiniment.

“Je joue d’un instrument qui est relativement physique, on ne peut pas filer une pièce de 8 minutes 10 fois dans la journée. Théoriquement, on peut mais au bout de la 3^e fois la qualité du son va être vraiment moins bonne à cause de la fatigue musculaire.” (1)

“Ce n’est pas dur au basson, quand tu commences à être fatigué, tu as les

lèvres qui n’y arrivent plus. En fait, ce que tu fais n’est plus bon parce que tu as une fatigue qui influe sur la justesse.” (7)

c. Résultat sonore

✱ Qualité

Les réactions quant aux résultats obtenus sont variables, elles dépendent notamment de l’équipement utilisé. Deux participants trouvent qu’ils obtiennent une mauvaise qualité à cause de leur matériel : l’un car la prise de son est trop proche, l’autre car elle constate des bogues sur ses enregistrements.

Plusieurs participants sont satisfaits du son obtenu avec un téléphone.

“Des fois tu poses un Iphone et finalement tu te rends compte que la vidéo est très bonne et que le son est pas mal et qu’en mettant parfois juste un EQ sur le son de ton Iphone tu as un son qui est presque plus audible et agréable.” (1)

Malgré certains défauts les participants apprécient la qualité du Zoom qu’ils trouvent représentatif.

“Le Zoom H4 ça donne une bonne idée de si c’est dur, ample, rond. Mais c’est souvent très sec.” (2)

“Avec un Zoom le son sera peut-être de moins bonne qualité, c’est possible que ça sature des fois sur une note, une fréquence, ou que le son soit globalement un peu moins bon, mais comme c’est plus ambiant comme prise de son on a l’idée.” (1)

Enfin, un participant trouve le résultat obtenu suffisant par rapport à l’enjeu.

“Ça me satisfait dans le sens où je sais déjà que ce que je fais est au-delà de ce que les gens demandent généralement pour présenter normalement à une masterclass. Ils ne demandent pas du tout d’avoir un enregistrement professionnel. Il y a beaucoup de gens qui envoient juste un Zoom posé sur un lutrin.” (8)

✱ Objectivité

Les participants estiment difficile de s’écouter objectivement, ils avancent différentes explications. Un participant remarque une perception différente du son lorsqu’il est produit par soi-même.

“On a une perception de l’instrument qui est très faussée par rapport à l’auditeur. Là où il y a juste le son de notre instrument, nous on entend principalement la réverbération de l’instrument dans le corps. On a une écoute interne, ce qui est très perturbant, je pense que pour nous il doit y avoir des harmoniques qui changent. La justesse on ne l’entend pas exactement pareil.” (7)

D’autres trouvent que l’enregistrement met en avant des défauts qu’ils entendent moins autrement. Le son est considéré comme plus aigre ou plus agressif et au delà du son, des informations liées à la performance se perdent lors de l’enregistrement.

“C’est plus agressif et en même temps le son est moins beau en fait. Je trouve que ça altère beaucoup tes qualités. Si tu as des qualités que tu veux montrer quand tu es en live, il y a beaucoup de choses qui ne sont pas là. Aussi ta présence, ce n’est pas que le son, c’est un tout. C’est ça qui me dérange un peu, mais le son ce n’est pas facile… Déjà la trompette ce n’est pas le même volume que tu as en enregistrement qu’en live. Il y a quand même une sacrée différence.” (4)

“La différence avec l’enregistrement est terrible dans le sens où elle est révélatrice. Elle met en lumière ce que tu n’entends pas. Des fois elle est méchante dans le sens où elle n’est pas réaliste en qualité de son effective, parce que ça filtre quand même. On ne peut pas tout capter avec des micros.” (8)

Les musiciens ont des difficultés à faire la part des choses entre le son qu’ils produisent et l’enregistrement qu’ils entendent. L’enregistrement est parfois considéré comme un support neutre et objectif et les participants tendent à attribuer les défauts entendus à leur manière de jouer.

“Je trouvais que c’était hyper sec et je m’inquiétais de mince, est ce que je joue sec ? Même quand je m’enregistre toute seule c’est vraiment super sec, est-ce que c’est vraiment mon jeu, l’acoustique ou le micro ? Je pense que je ne sais pas faire la part des choses.” (2)

“Je me suis demandé : ah ça c’est mes défauts et mes qualités ? Je pense que l’enregistrement c’est un truc objectif qui te redonne une idée. Ça l’est non ?” (6)

Enfin, certains ne prêtent pas particulièrement attention au son car ils sont plutôt concentrés sur l’aspect artistique.

“J’écoutais surtout musicalement, j’étais très concentrée sur comment je jouais et si je faisais des erreurs. Je n’ai pas tellement fait attention mais je trouvais que c’était bien, bien balancé.” (5)

✱ Références d’écoute

Les musiciens ont des références d’écoute, qui reflètent le son qu’ils pourraient eux-mêmes obtenir en jouant. Pour la plupart, les participants créent ces références en écoutant des enregistrements mais un participant se réfère plutôt au son d’autres musiciens entendus en présentiel.

“J’ai essayé d’écouter le son de mon prof des enregistrements d’orchestre. Quand je veux travailler une esthétique de son de basson je vais déjà essayer de chercher le peu d’enregistrements qu’il y a sur internet, d’orchestres avec un basson français mais c’est très ciblé sur la problématique d’un instrument.” (7)

“En terme de son je cherche la même chose que ce que je recherche quand j’écoute des gens parce que quand tu t’auto-écoutes en jouant c’est différent. Essayer de trouver la qualité de son que tu recherches quand tu écoutes quelqu’un qui joue seul de la trompette. Essayer de comparer à ce que tu peux entendre en présentiel.” (1)

Certains estiment avoir une oreille et une écoute de mauvaise qualité. Cela se traduit par l’incapacité de citer les défauts et les qualités d’un enregistrement, mais aussi ceux d’une salle ou du son d’un autre musicien. D’autres ont au contraire des critères définis de ce qui leur plaît ou non.

“Que ça ne sonne pas métallique, que ce soit à peu près le son naturel qu’on entend soi-même quand on joue.” (5)

d. Ressenti

✱ Intérêt

Les candidats expriment un intérêt mitigé pour l’enregistrement. Certains aiment l’aspect expérimental et créatif du travail du son qui leur permet d’acquérir des compétences.

“J’aimerais bien avoir cette possibilité de pouvoir s’enregistrer sur le long terme, carrément, même pour créer des sons. Pendant un moment je rêvais d’aller dans les forêts et d’enregistrer les bruits de la nature et de faire un montage après pour créer.” (2)

“C’est assez passionnant d’essayer plein de choses. C’est un peu un terrain de jeu illimité et si ça ne sonne vraiment pas bien ce n’est pas grave parce que c’est pour toi, tu peux vraiment aller dans les extrêmes.” (1)

L’indépendance est aussi appréciée par les musiciens qui trouvent plus simple le fait d’enregistrer en autonomie.

“Il y a aussi un truc quand tu es tout seul, il faudrait peut-être que j’arrête ça mais je trouve plus cool d’avoir le temps et de faire tout seul. […] C’est clair que ce n’est pas comme ça que ça marche sinon on n’aurait jamais le temps. Mais disons que j’aime bien le faire parce que je sais ce que j’ai fait, je sais où il pourrait y avoir un problème au lieu de devoir tout repasser derrière.” (8)

“C’est plus simple à organiser juste entre nous que d’organiser avec un ingénieur du son en plus.” (3)

Cependant, deux participants pensent qu’il est facile de se perdre et de ne pas savoir ce qui est le plus important quand on manque de connaissances.

“C’est juste la fierté de dire qu’on l’a fait toutes seules, mais en vrai j’avais l’impression de ne rien maîtriser. Oui il y avait des micros mais après coup, maintenant en en parlant avec toi et surtout en voyant le résultat on voit les détails qui sont importants et qu’on ne savait pas.” (2)

Deux autres n’apprécient pas cette pratique. L’un d’eux préfère éviter au maximum de s’enregistrer.

“Là je vais faire des concours d’entrée en Suisse dans des Hautes Écoles, toutes les écoles me plaisent en général, mais mon critère principal c’est que si c’est en vidéo je n’y vais pas parce que je n’aime pas du tout. Alors c’était une expérience mais je ne la referai pas. Je voulais aller à Genève mais c’est par vidéo alors…” (4)

✱ Attentes d’une formation

Les participants sont intéressés pour se former et apprendre à développer diverses compétences techniques telles que le choix et le placement des microphones, les réglages possibles des enregistreurs portables, les spécificités de leurs instruments ou encore la post-production. Un étudiant souhaiterait aussi apprendre la direction artistique. Plusieurs d’entre eux soulignent l’importance d’avoir un support écrit à la fin et d’avoir des cours en présentiel. Les envies de format d’enseignement sont variables, allant d’un week-end de cours à quelques séances en individuel. Les participants ayant déjà eu un cours sur un week-end n’étaient cependant pas satisfaits de ce format car ils ont mémorisé peu d’informations sur le long terme.

“Un week-end c’est pas mal je pense. Je ne sais pas ce qu’on ferait si c’était toutes les semaines. Je ne sais pas si on peut apprendre quelque chose d’autre à chaque fois ou si on ferait la même chose.” (5)

“Je pense que ce dont j’aurais besoin ce serait juste d’avoir quatre, cinq fois 2h avec quelqu’un qui s’y connaît vraiment, que je puisse venir avec mes trucs et que je puisse dire que là ça ne me plait pas pour ça, comment je pourrais faire pour régler ce problème, plus que pour avoir une énième introduction à Protools.” (8)

D’autres ne seraient pas intéressés par se former pour plusieurs raisons. D’une part cela nécessite du temps et n’est pas une priorité, d’autre part certains préfèrent faire appel à des professionnels s’ils en ont besoin.

“Soit mes conditions d’enregistrement me suffisent, soit il y a des gens qui seront plus qualifiés que moi avec ma formation. Donc autant faire appel directement à des gens qualifiés.” (6)

3. Pratique musicale

PRATIQUE MUSICALE
Travail	Préparation	1,2,4,5,6,7,8	23
Travail	Outil	1,2,4,5,6,7,8	47
Performance	Auditeur	1,2,4,6,7	12
	Stress	1,4,5,7,8	28
	Conscience du son	1,7,8	6

a. Travail

✱ Préparation

Les musiciens remarquent une différence dans leur travail de préparation si le programme est ensuite joué en concert ou en enregistrement. Dans le premier cas, ils pratiquent un travail mental et psychologique plus important. Ils estiment moins bien se préparer pour des enregistrements car ils savent qu’ils pourront recommencer plusieurs fois et éventuellement travailler entre les prises.

“En concert j’aime bien toujours jouer par cœur, je me prépare à ne pas avoir de trou de mémoire. Je me prépare à comment je vais être. Je me prépare physiquement à pouvoir jouer le programme en entier plusieurs fois à la suite. Je me prépare à comment je vais me sentir entre les pièces. Oui, je me prépare complètement différemment. Peut-être que je devrais me préparer un peu pareil.” (6)

“À l’époque je me disais : je travaille, on va enregistrer avec l’ingénieur du son et voir ce que ça donne, puis on va retravailler derrière et réenregistrer derrière.” (7)

Certains souhaitent mieux se préparer pour leurs prochains enregistrements. Le fait de travailler avec un ingénieur du son permet à certains participants de considérer l’échéance différemment et d’arriver mieux préparés qu’en enregistrant seul.

“J’ai demandé à quelqu’un de m’enregistrer mais c’était exceptionnel. Je m’étais vraiment beaucoup préparé pour les enregistrements. Forcément quand c’est un enregistrement où il y a quelqu’un je me met un peu plus de pression, j’essaye d’arriver en étant au taquet et j’essaye de faire le mieux possible.” (1)

✱ Outil

L’enregistrement est aussi utilisé par les musiciens comme un outil pour progresser. Ils en ressentent des bénéfices et c’est une aide dans leurs séances de travail personnel. Cela leur permet de prendre du recul et de se focaliser sur différents paramètres : le son, la technique, l’interprétation ou encore les objectifs de travail.

“Des fois j’avais un doute de l’ordre de l’interprétation, je m’enregistrais, je laissais une semaine à vide et je me réécoutais au bout d’une semaine pour que ce ne soit pas à chaud.” (8)

“Ça m’aide beaucoup. Parfois j’ai l’impression que je m’écoute plus objectivement : quand je joue j’entends ce que je veux entendre alors que quand j’écoute l’enregistrement j’entends ce que j’ai fait et pas ce que j’ai voulu faire.” (6)

C’est un outil utilisé plus ou moins régulièrement par les musiciens. Certains s’en servent par périodes, de manière irrégulière, à l’approche d’une échéance comme un examen ou un concert, d’autres le font plus régulièrement.

“Ça dépend des périodes, là j’avais mon récital il y a trois jours, je me suis enregistré trois fois par semaine durant un mois. Mais je fais l’erreur pendant mon travail hors récital de ne pas souvent m’enregistrer. Je sais qu’il faudrait le faire plus souvent…” (4)

“Deux fois par mois j’enregistre mes répétitions pour les revoir, pour moi. C’est juste pour voir comment je travaille, s’il y a des choses à changer dans le geste, dans la manière de travailler etc.” (8)

Un des musiciens a investi dans une application appelée Andante pour s’enregistrer, prendre des notes et archiver ses séances de travail.

“Tu mets ton niveau de satisfaction et surtout tu prends tes notes par rapport à ce que tu as ressenti. Après tu peux réécouter, prendre des notes aussi par rapport à ce que tu penses et ça archive. Donc tu peux avoir un suivi de ton travail et c’est bien pour ça.” (7)

b. Performance

✱ Auditeur

Les musiciens sont aidés lorsqu’une autre personne telle qu’un ingénieur du son ou un autre musicien est présente. Elle peut leur apporter des conseils musicaux, du réconfort ou un regard extérieur. Pour certains, le sentiment de solitude est démotivant.

“Tu as quelqu’un qui t’écoute et qui peut te donner un feedback, te dire un petit mot si c’était bien ou s’il y a un petit truc à améliorer. Si ce n’était pas bien et que tu es dégoûté elle peut te dire : “Allez, ne t’inquiète pas, ça va aller, prends cinq minutes, va boire un café.”” (1)

De plus, jouer pour une personne change beaucoup pour un musicien. Cela donne l’impression d’avoir un public et rend la performance plus proche d’un concert. Une participante raconte son expérience lorsqu’une amie l’a écoutée lors d’une prise.

“Si quelqu’un écoute j’ai plus l’impression que c’est un concert donc ça m’aide. J’ai joué une fois pour elle, je me souviens que ce n’était pas très bien la manière dont j’ai joué mais l’impression était mieux. C’était moins : “si je fais une faute là je m’arrête et je recommence” mais plutôt : “je vais jouer pour elle toute la pièce.”” (6)

Il est important de travailler avec une personne de confiance. Un participant a collaboré avec des ingénieurs du son pour enregistrer un orchestre qu’il dirige et a dû s’habituer à leur présence.

“Au début je n’aimais pas trop ça par un espèce de truc d’égo bête dans le sens où j’avais l’impression que parfois on pouvait ne pas tirer la même corde du tout. Et en fait avec le temps je me suis rendu compte qu’il faut toujours écouter l’ingénieur du son.” (8)

Enfin, l’auditeur peut aussi avoir un rôle pratique en aidant le musicien à bien cadrer sa vidéo, à lancer l’enregistrement ou à l’écouter à sa place.

“Pour moi qui suis accordéoniste c’est à chaque fois un peu demandant de devoir poser l’instrument et aller jusqu’à l’audio, puis remettre l’instrument… […] Du coup s’il y a quelqu’un et qu’on lui fait confiance je trouve que c’est clairement plus agréable.” (3)

✱ Stress

Les participants constatent un stress différent entre une performance publique et un enregistrement. Quand ils jouent en public, ils ressentent une pression de devoir jouer du mieux possible à cet instant précis et de ne pas s’arrêter s’ils font une faute.

“En concert tu as la pression de te dire que c’est maintenant qu’il faut tout donner et jouer le mieux possible, tout de suite, aujourd’hui. Pas demain, pas après-demain, pas hier.” (1)

Au contraire, l’enregistrement donne la sensation de tout graver et les musiciens sont stressés de faire des erreurs. La possibilité de pouvoir recommencer leur donne l’impression qu’une meilleure prise est toujours réalisable. S’ajoute à cela le stress de ne pas obtenir une vidéo qui leur convienne. Plusieurs participants remarquent qu’ils perdent de la spontanéité en enregistrement.

“J’ai le stress de ne pas avoir d’enregistrement que j’estime potable, et le stress d’arriver à jouer. Parce que quand tu joues devant des gens ça s’enchaîne et tu ne t’arrêtes pas sur un truc. En enregistrement tu graves tout et tu peux revenir en arrière et t’arrêter bêtement, c’est hyper exigeant. Ça te donne le stress de ne rien mettre à côté alors que ça peut arriver. Ça enlève de la spontanéité je trouve.” (7)

“De manière générale on a l’impression que quand on appuie sur rec c’est stressant. Pour moi il y a aussi un côté où je ne suis plus tout à fait naturel quand je fais ça. J’ai l’impression de devoir être une espèce de carte postale, je dois pouvoir montrer tout ce que je sais faire.” (8)

Un seul des participants se montre enthousiaste quant à son état d’esprit et à la performance qu’il a réalisée lors d’un enregistrement, malgré son stress.

“J’ai joué comme quand je travaillais, en fait j’oubliais la présence du téléphone et ça a très bien marché. Je pense que l’enregistrement ça marche bien à partir du moment où tu arrives à oublier qu’il est là. Tu joues comme si tu jouais devant des gens. Je pense que c’est pour ça qu’on demande d’enregistrer.” (7)

✱ Conscience du son

L’enregistrement demande une conscience de son propre son. Deux participants expliquent ainsi adapter leur technique de jeu à la réverbération enregistrée par le microphone. Ainsi, ils modifient leurs attaques ou leur timbre comme ils le feraient pour s’adapter à l’acoustique d’une salle de concert.

“Globalement tu vas avoir tendance à aller chercher un timbre beaucoup plus sombre quand tu enregistres en mono, à faire ressortir le plus possible les harmoniques graves, parce que naturellement dans notre instrument les harmoniques aiguës sonnent très métalliques, ce qui marche bien dans une grande salle mais beaucoup moins bien avec un micro en prise de son de proximité.” (1)

Cela demande aussi une conscience des bruits parasites. Un candidat indique se concentrer là-dessus quand il enregistre.

“Quand je dirige j’essaye déjà de faire attention à ne pas faire de bruits autres que rien. Parce que c’est vrai que des fois tu réécoutes et tu t’entends chantonner, ou faire du bruit avec les pieds, il peut y avoir plein de choses.” (8)

Quatrième partie : Discussion générale

Notre travail se proposait d’étudier les enjeux actuels de l’enregistrement en autonomie chez les étudiants en musique classique. Dans cette discussion nous orienterons notre réflexion vers l’optimisation du processus d’enregistrement au regard des propos que nous avons rassemblés ainsi que de la documentation littéraire et scientifique.

Contexte

Les opportunités et enjeux d’enregistrement sont très diversifiés et corroborent les résultats de la première et de la seconde partie : cette pratique est essentielle et inévitable dans la carrière professionnelle des musiciens. Les participants ont tendance à s’enregistrer en fonction des occasions qui se présentent à eux, mais contrairement aux écrits de Beeching (2010), faire sa promotion sur les réseaux sociaux n’est pas une priorité. Pour des raisons pratiques et financières, mais aussi à cause de la récurrence de leurs besoins, les étudiants ne peuvent souvent pas faire appel à un ingénieur du son et sont obligés de réaliser eux-mêmes leurs enregistrements.

Les écoles supérieures se sont adaptées à la transformation des marchés du travail comme le soulignait Essig (2017) en proposant des modules de formation liés notamment à l’enregistrement et à la sonorisation. Dans les modules suivis par les participants, le programme est surtout orienté vers la prise de son au microphone et moins vers l’utilisation du matériel grand public dont disposent majoritairement les musiciens. Cela explique certaines difficultés techniques concernant notamment les réglages de leurs outils d’enregistrement ainsi que la post-production.

Technique

Les participants se sont équipés en fonction de leurs besoins pour mener à bien leurs projets. Ils accordent certes de l’importance à la qualité du son, mais recherchent surtout des outils pratiques et faciles à prendre en main. Ils sont cependant moins bien équipés pour écouter leurs enregistrements ou plus généralement de la musique ainsi que pour se filmer. Lorsqu’ils en ont la nécessité, ils trouvent du matériel supplémentaire et une aide technique auprès de leur établissement ou de leur entourage.

Leurs connaissances techniques ne semblent néanmoins pas suffisantes car ils rencontrent de nombreuses difficultés pour utiliser leur matériel de manière optimale, obtenir un son qui leur convient ou encore effectuer des traitements.

Écoute

L’écoute est une problématique importante car il est difficile pour un musicien d’avoir une idée objective de son propre son. Les étudiants pourraient écouter plus d’enregistrements de leur propre instrument afin d’acquérir une plus grande culture sonore et d’avoir une idée plus précise de ce qui leur plaît. Cela peut les faire progresser sur plusieurs plans, à la fois dans leur musicalité mais aussi dans la conscience des qualités et défauts du son. Ainsi, ils pourraient mieux faire la part des choses entre le son qu’ils produisent et le résultat qu’ils obtiennent. Avec une meilleure capacité d’écoute critique, les musiciens pourraient se détacher plus facilement de l’aspect artistique pour rechercher un son qui leur convient.

Les participants ont inconsciemment déjà intégré certaines références d’écoute. En effet, un jeune musicien qui doit préparer ses vidéos de concours se réfère à des enregistrements accessibles dans le commerce ou sur internet qui, grâce à la possibilité d’enregistrer par petits fragments et de faire du montage (Hill, 2009 ; Tomes 2009), témoignent d’une technique musicale parfaite (Philipp, 2004). La pression est alors élevée pour un étudiant qui n’a pas le droit au montage mais qui a intégré cet idéal d’un résultat sans fautes ou problèmes d’intonation.

Optimisation

Un des points essentiels à optimiser est la stratégie d’enregistrement, aussi bien au cours de la séance que sur le long terme.

Sur le court terme, les musiciens font en majorité preuve d’une absence de méthode et répètent leur programme en boucle jusqu’à obtenir une bonne prise, quitte à planifier une nouvelle séance d’enregistrement s’ils ne sont pas satisfaits. Se fixer des contraintes extérieures semble être une stratégie qui porte ses fruits, comme réserver une salle avec des horaires précis, faire appel à un ingénieur du son ou à des connaissances qui pourraient venir écouter et aider par exemple à cadrer, s’imposer un nombre de prises limité ou éventuellement, lorsque c’est possible, jouer des œuvres de musique de chambre ou nécessitant un pianiste accompagnateur.

Deux problématiques apparaissent concernant l’optimisation de l’enregistrement sur le long terme. Tout d’abord, il semble important de choisir avec soin la date d’enregistrement. Une séance planifiée suffisamment tard par rapport à la date limite de rendu permet au musicien de se préparer au mieux, de considérer cette échéance avec la même importance qu’un concert ou qu’une audition, mais aussi de ne pas multiplier indéfiniment les séances d’enregistrement et ainsi économiser du temps et de l’énergie. Cela peut cependant être une source de préoccupation pour ceux qui ont tendance à stresser de ne pas avoir de bonne prise au fur et à mesure de leurs séances et qui préfèrent prendre leur temps pour obtenir un résultat satisfaisant. Néanmoins, il ne faut pas programmer la séance trop tard pour pouvoir rebondir en cas d’imprévus. Choisir une date à l’avance permet aussi de mieux gérer le travail extérieur à l’enregistrement. Cette méthode est toutefois difficile à appliquer pour des échéances de dernière minute qui ne peuvent être anticipées.

Le travail de préparation a lui aussi un rôle majeur et a tendance à être sous-estimé par les participants. Si les méthodes de travail et de mise en condition utilisées par les participants pour un concert ou une audition concordent avec celles exposées en première partie, elles ne sont toutefois pas exploitées pour la préparation d’un enregistrement. Ce dernier est largement utilisé comme un outil bénéfique pour s’améliorer et prendre du recul, mais est peu souvent considéré en tant qu’objectif final. Comme pour les concours ou les représentations publiques, le musicien pourrait intégrer la performance de l’enregistrement à son travail et se préparer de la même manière, afin d’enchaîner le programme sans interruption pour rechercher l’état de flow décrit par Green et Gallwey (1986) et ressenti par l’un des participants. La présence de stress est constructive si elle est correctement appréhendée. Plusieurs participants remarquent lors de l’enregistrement une absence de stress, ce qui empêche de transformer ce sentiment en une sensation positive. La recherche d’un état de créativité et de concentration optimale passe par une connaissance de soi-même et un travail émotionnel qui impliquent de la pratique et de la réflexion (Ville, 2020).

Dans la seconde partie nous avons observé que de nombreux concours autorisaient les candidats à présenter des enregistrements de représentations publiques. Aucun participant ne s’est tourné vers cette possibilité à l’exception d’une musicienne qui a fait ce choix par défaut. Pourtant, les étudiants préfèrent leurs performances publiques car ils sont mieux préparés et jouent de manière plus spontanée, ce qui confirme les écrits de Fabian (2008). Cette possibilité pourrait être davantage exploitée, par exemple en organisant une performance publique dans le but de l’enregistrer.

Formation

L’envie de se former est disparate entre les participants mais ils partagent tous le besoin d’acquérir de plus amples connaissances au sujet de l’enregistrement. Cette partie rassemble les observations pertinentes pour créer un module de formation adapté aux besoins et aux contraintes des étudiants en musique. L’étude des enjeux et pratiques d’enregistrements de cette population nous montre qu’il est certes important de posséder un minimum de connaissances techniques, mais que le travail musical et l’organisation sont tout aussi importants pour mener à bien un enregistrement en autonomie.

Concernant les connaissances techniques, les étudiants souhaitent apprendre à enregistrer avec le matériel qu’ils utilisent : microphones et cartes son, enregistreurs portables, caméras et appareils photos, ainsi que leurs téléphones et tablettes. La connaissance des réglages de chacun de ces appareils est importante pour aborder un enregistrement dans les meilleures conditions. Les étudiants pourraient être conseillés sur leurs achats de matériel d’enregistrement et d’écoute en fonction de leur budget. Différentes notions répondant aux préoccupations des musiciens pourraient être abordées : la projection des différents instruments, le placement de l’enregistreur par rapport au musicien et à la salle, ainsi qu’une approche simple de la post-production et des niveaux sonores. Les étudiants travaillent aussi avec de la vidéo et il leur serait bénéfique d’aborder le cadrage, les réglages vidéo de leurs appareils, quelques notions de montage et de post-production, ainsi que les diverses spécifications techniques retrouvées dans les consignes d’enregistrement.

Apprendre à écouter des enregistrements, reconnaître leurs défauts et pouvoir en parler est une autre thématique importante. Il semble d’autant plus important pour un musicien d’être capable de distinguer le son qu’il entend lorsqu’il joue, le son acoustiquement produit et entendu du point de vue de l’auditeur et le résultat issu de l’enregistrement.

L’organisation, le travail et la performance artistique sont des problématiques personnelles, mais il nous semble pertinent de les aborder. Un échange entre étudiants sur leurs méthodes de préparation, leurs stratégies d’enregistrement ainsi que sur leurs ressentis liés à la performance peut s’avérer enrichissant et ouvrir la porte à de nouvelles idées. Il n’y a pas de méthode universelle pour enregistrer un programme en économisant du temps et de l’énergie, celle-ci est le fruit d’une réflexion et d’une expérience toutes deux personnelles. Cette réflexion peut aussi être alimentée par des connaissances plus théoriques sur la performance, le stress ou encore la mise en condition physique et mentale.

Un format de cours sur une période trop resserrée ne semble pas optimal car les étudiants tendent à oublier les informations sans une pratique régulière. Il est important de leur laisser un support écrit, un guide pour les aider lorsqu’ils en ont besoin. L’intérêt pour cet apprentissage étant tout à fait personnel et propre à chacun, une possibilité serait de développer un support pratique adapté à des étudiants qui souhaiteraient consacrer peu de temps à cet apprentissage, mais aussi un format plus développé pour les plus intéressés.

Conclusion

Contributions

Cette étude est, à notre connaissance, la première à s’intéresser de manière approfondie aux rapports qu’entretiennent les étudiants avec la pratique de l’enregistrement. Ce travail de recherche nous a permis, dans un premier temps, de placer ce besoin dans le contexte actuel et de voir comment cette pratique s’intègre dans les études supérieures musicales. Nous avons ainsi cerné les enjeux et les contraintes liés aux différentes opportunités d’enregistrement, puis nous avons observé comment les étudiants appréhendent cette pratique en s’appuyant sur une analyse de huit entretiens par théorisation ancrée. Nous avons ainsi pris connaissance des moyens et savoirs dont disposent les étudiants interrogés, mais aussi cerné les difficultés qu’ils rencontrent. Au cours de notre travail, une problématique s’est dégagée : comment optimiser la préparation et les méthodes d’enregistrement ? Grâce aux résultats de la recherche empirique nous y avons apporté plusieurs éléments de réponse mais ce sujet mériterait une étude qui lui serait entièrement consacrée.

Limitations

Il nous semble important d’exposer les limites de ce travail pour mieux comprendre l’impact et la pertinence des résultats obtenus.

Concernant l’analyse des consignes d’enregistrement, il est important de préciser que sur le grand échantillon de concours d’orchestres étudiés, très peu indiquent des consignes d’enregistrement. Elles sont parfois fournies après l’inscription au concours et, dans ce cas, nous n’avons pas pu y avoir accès. Les consignes analysées dans cette catégorie ne sont donc pas forcément représentatives de tous les concours d’orchestre. De plus, l’échantillon interrogé est restreint et ne permet pas de généraliser nos conclusions à l’ensemble des étudiants en musique classique. Il serait intéressant d’élargir l’étude à des professionnels récemment diplômés, de plus jeunes musiciens en train de préparer des concours d’entrée dans les établissements d’enseignement supérieur ou à des étudiants dans d’autres domaines comme le jazz. En émettant l’hypothèse qu’un étudiant avait accès aux mêmes concours et opportunités quel que soit l’établissement qu’il fréquente, le panel s’est beaucoup centré sur des étudiants de la Haute École de Lucerne. Il serait donc intéressant de diversifier les établissements d’origine, mais aussi les instruments en incluant par exemple des chanteurs ou des instruments à cordes frottées.

Dans le cas de cette étude, notre double compétence d’ingénieure du son et d’étudiante en musique aurait pu compromettre notre tentative d’objectivité totale. Nous nous sommes efforcés de mettre de côté nos présupposés et de construire le plus objectivement possible notre analyse par souci de rigueur scientifique. Cependant, nous pensons que les participants n’ont pas oublié qu’ils s’adressaient à une ingénieure du son, ce qui a pu influencer leurs propos.

Le sujet est vaste et les thématiques abordées relèvent de différents domaines de connaissances comme la psychologie ou la performance artistique. Il est impossible d’avoir simultanément un savoir pointu de ces différents domaines et il serait intéressant qu’une personne issue d’un milieu différent réalise une étude similaire.

Il nous paraît important de rappeler que cette étude s’inscrit dans le cadre d’un projet de recherche étudiant qui pourrait être davantage approfondi avec du temps et des moyens supplémentaires.

Perspectives

L’ensemble des constatations faites lors de ce travail de recherche pourraient être utile à des étudiants ou à des musiciens souhaitant optimiser leur processus d’enregistrement. Comme évoqué précédemment, elles pourraient aussi contribuer à l’élaboration d’un module de formation intégré aux cursus d’études des musiciens, ou à l’ajustement des modèles existants pour répondre au mieux aux besoins des étudiants.

Ce travail peut aussi servir de base à l’élaboration d’un livret à destination des étudiants et enseignants pour présenter de manière synthétique les résultats obtenus et les accompagner dans leur travail et leurs projets.

Enfin, plusieurs questions mériteraient d’être approfondies : comment intégrer l’enregistrement à sa pratique de l’instrument ? Quel rapport les musiciens professionnels ont-ils avec l’enregistrement ? Comment améliorer sa performance en l’absence de public ?

Bibliographie

Antonini Philippe, R., & Güsewell, A. (2016). La simulation de concours d’orchestre : analyse qualitative et située de l’activité des musiciens. Les Cahiers de la Société québécoise de recherche en musique, 17(1), pp.71–82. https://doi.org/10.7202/1044671ar

Beeching, A. (2010). Beyond Talent: Creating a Successful Career in Music, Oxford University Press.

Bennett, D. E. (2008). Understanding the Classical Music Profession: The Past, the Present and Strategies for the Future, Ashgate.

Berehova, O., & Volkov, S. (2019). Piano Competitions in the Socio-Cultural Realities of Globalization. Journal of History Culture and Art Research, 8(4), pp.329-346. http://dx.doi.org/10.7596/taksad.v8i4.2325

Buck, E.Y. (2003). The orchestral flute audition: An examination of preparation methods and techniques. Rice University.

Cottrell, S. (2004). Professional Music-Making in London: Ethnography and Experience, Ashgate.

Coulangeon, P. (2004). L’expérience de la précarité dans les professions artistiques. Le cas des musiciens interprètes. Sociologie de l’Art, 3(5), pp.77-110. https://doi.org/10.3917/soart.005.0077

Direction de la formation et des affaires culturelles, DFAC. (2023). Guide cantonal du travail de maturité dans les classes gymnasiales.

Essig, L. (2017). Same or different? The “cultural entrepreneurship” and “arts entrepreneurship” constructs in European and US higher education. Cultural Trends, 26(2), pp.125–137. https://doi.org/10.1080/09548963.2017.1323842

Fabian, D. (2008). Classical Sound Recordings and Live Performances: Artistic and Analytical Perspectives. Dans M. Doğantan (dir.), Recorded Music: Philosophical reflections, pp.232-60. London: Middlesex University Press. https://www.researchgate.net/publication/277716245

Gembris, H., & Langner, D. (2005). Von der Musikhochschule auf den Arbeitsmarkt: Erfahrungen von Absolventen, Arbeitsmarktexperten und Hochschullehrern, Wißner.

Green, B., & Gallwey, W. T. (1986). The Inner Game of Music, Pan Macmillan UK.

Hewitt, A. (2009). Musical Styles as Communities of Practice Challenges for learning, teaching and assessment of music in higher education. Arts and Humanities in Higher Education, 8(3), pp.329-337. https://doi.org/10.1177/1474022209339956

Hugill, A. (2018). The Digital Musician (3e éd.). Routledge.

Jarvin, L., & Subotnik, F. R. (2010). Wisdom From Conservatory Faculty: Insights on Success in Classical Music Performance. Roeper Review, 32(2), pp.78-87. https://doi.org/10.1080/02783191003587868

Johnsson, M.C., & Hager, P. (2008). Navigating the wilderness of becoming professional, Journal of Workplace Learning, 20(7/8), pp.526-536. https://doi.org/10.1108/13665620810900346

Kegelaers, J., Hoogkamer, L., & Oudejans, R. R. (2022). Practice and performance management strategies of emerging professional musicians in preparation for orchestra auditions. Research Studies in Music Education, 44(1), pp.175–191. https://doi.org/10.1177/1321103X211054659

Lehrer, P. (1988). The causes and cures of performance anxiety: A review of the psychological literature. In F. L. Roehmann & F. R. Wilson (Eds.), The biology of music making: Proceedings of the 1984 Denver Conference, pp. 32–46. St. Louis: MMB Music.

Le Robert. (s. d.). Trac. Dans Dictionnaire en ligne. Consulté le 14 septembre 2023 sur https://dictionnaire.lerobert.com/definition/trac

Mäkinen, K. (2012). Becoming Valuable Selves: Self-Promotion, Gender and Individuality in Late Capitalism. Tampere University Press.

Malhotra, V.A. (1981). The social accomplishment of music in a symphony orchestra: A phenomenological analysis. Qualitative Sociology, 4, pp.102–125. https://doi.org/10.1007/BF00987214

McCormick, L. L. H. (2008). Playing to win: A cultural sociology of the international music competition, Yale University ProQuest Dissertations Publishing. https://www.proquest.com/dissertations-theses/playing-win-cultural-sociology-i nternational/docview/304390225/se-2?accountid=169375

Musicians’ Union, (2012), The Working Musician, commissioned by the Musicians’ Union. DHA Communications.

Paillé, P. (1994). L’analyse par théorisation ancrée. Cahiers de recherche sociologique, (23), pp.147–181. https://doi.org/10.7202/1002253ar

Pégourdie, A. (2015). L’« instrumentalisation » des carrières musicales: Division sociale du travail, inégalités d’accès à l’emploi et renversement de la hiérarchie musicale dans les conservatoires de musique. Sociologie, 6(4), pp.321-338. http://journals.openedition.org/sociologie/2645

Philip, R. (2004). Performing Music in the Age of Recording. Yale University Press. http://www.jstor.org/stable/j.ctt5vkwgk

Prokop, R., & Reitsamer, R. (2023). The DIY careers of young classical musicians in neoliberal times. DIY, Alternative Cultures & Society, 1(2), pp.111–124.

Rodabaugh, H. V. (2008). Preparation for orchestral trumpet auditions: The perspectives of three prominent orchestra players. The University of Oklahoma. https://doi.org/10.1177/27538702231174197

Scharff, C. (2015). Blowing your own Trumpet: Exploring the Gendered Dynamics of Self-Promotion in the Classical Music Profession. The Sociological Review, 63(1_suppl.), pp.97–112. https://doi.org/10.1111/1467-954X.12243

Spahn, C., Walther, J.-C., & Nusseck, M. (2016). The effectiveness of a multimodal concept of audition training for music students in coping with music performance anxiety. Psychology of Music, 44(4), pp.893–909. https://doi.org/10.1177/0305735615597484

Thomas, L. (2002). Student retention in higher education: the role of institutional habitus. Journal of Education Policy, 17(4), pp.423–42. https://doi.org/10.1080/02680930210140257

Tokay, D. (2020). Impact of Online Music Competitions on the Young Musicians Professional Skills and Their Musical Development During the Covid-19 Pandemic. European Journal of Social Sciences Education and Research Articles, 7(3), pp.56-61. https://revistia.com/files/articles/ejser_v7_i3_20/Tokay.pdf

Toskov, A. (2010). Audition and the first months in the orchestra, Universitetet i Agder: University of Agder. http://hdl.handle.net/11250/138484

Ville, C. (2020). Faire du stress son métier : l’anxiété de performance chez les interprètes de musique classique. Tracés. Revue de Sciences humaines 38(38), pp.63-82. https://doi.org/10.4000/traces.11272

Volioti, G., & Williamon, A. (2017). Recordings as learning and practising resources for performance: exploring attitudes and behaviours of music students and professionals. Musicae Scientiae, 21(4), pp.499–523. https://doi.org/10.1177/1029864916674048

Willson, B., & Lang, M. (2021). Practicing Music: How the Professionals Do It.

Meredith Music.

Yoshihara, M., (2007). Musicians from a Different Shore: Asians and Asian Americans in Classical Music. Temple University Press. https://www.jstor.org/stable/j.ctt14bszkj

Annexes

1. Consignes de concours

Certains tours par vidéo et d’autres en présentiel

Uniquement en présentiel

Uniquement en vidéo

Cas particuliers

Fig. 22 : Légende de couleur des processus de recrutement

Écoles supérieures

IESM, Aix-en-Provence	Admissibilité vidéo
HEAR, Strasbourg	Admissibilité vidéo
CNSMD, Lyon	DNSPM : présentiel Master : présélection vidéo pour certains instruments : Flûte, Clarinette, Hautbois, Trombone, Trompette, Alto, Violon, Violoncelle, Piano, Chant, Chant musique ancienne Pas de présélection vidéo pour : Basson allemand et français, Tuba ténor et tuba basse, Cor, Contrebasse, Percussions, Harpe, Orgue, Accompagnement piano, Direction de chœurs, Musique ancienne sauf chant, Musique de Chambre
CNSMDP	Tout en présentiel (Master : présélection sur dossier)
ESM Bourgogne-Franche-Co mté	Présentiel
ESMD, Lille	Tout en vidéo
ISDAT, Toulouse	Présentiel
Pôle Aliénor, Poitiers	Présentiel
Le Pont Supérieur,	Admissibilité vidéo

Rennes
Pôle Supérieur La Courneuve	Présentiel
PSPBB, Boulogne-Billancourt	Présentiel, ouvert à un nombre très restreint de candidats car restructuration des études pour l’année suivante
HEMU, Lausanne	Présentiel
HEM, Genève	Tout en vidéo sauf le 2^nd tour des Masters de musicien d’orchestre, musique contemporaine, soliste et les cursus d’accompagnateur au piano et de musique de chambre
HKB, Berne	Présentiel
FHNW, Bâle	1^er tour par vidéo
HSLU, Lucerne	Présentiel
ZhDK, Zürich	Présentiel
Conservatorio, Lugano	Présentiel

IESM Aix-en-Provence (1)

L’épreuve d’admissibilité est organisée en distanciel et consiste en l’envoi d’un enregistrement vidéo d’un extrait du programme présenté d’une durée minimum de 10 minutes et maximum de 15 minutes, comportant au moins deux œuvres de styles différents.

Cahier des charges de l’enregistrement vidéo :

Chaque œuvre du programme devra être enregistrée sans aucun montage ni coupure.

À l’image, le plan devra être fixe et large, de face (la caméra disposée à l’emplacement habituel du public), le candidat devant être visible à tout moment. Les conditions de lumière devront être suffisantes.

Au début de la vidéo, le candidat se présentera en indiquant son nom et son prénom.

Au début de chaque pièce, le candidat mentionnera son titre.

Si le candidat n’a pas la possibilité d’être accompagné au piano, alors que le programme le requiert, il pourra jouer seul les pièces concernées (pas d’accompagnement par des sons MIDI).

Le fichier vidéo devra être nommé de la manière suivante : DNSPM Instrument Nom Prénom

HEAR Strasbourg (2)

Présélection (enregistrement vidéo) :

Interprétation d’un programme libre d’une durée de 10 à 20 minutes maximum, composé d’au moins 3 œuvres de styles différents. Le programme prévu pour l’admission peut être utilisé également pour la vidéo de présélection.

Informations sur l’enregistrement :

Il est demandé aux candidats de publier, en mode « non répertorié », sur la plateforme YouTube, des enregistrements selon les modalités définies ci-dessous. L’ensemble des vidéos doivent être intégrées à une playlist unique. Le lien vers cette playlist est à renseigner dans l’onglet « Questions supplémentaires » du dossier de candidature sur la plateforme Taïga, au plus tard le vendredi 3 mars 2023, délai de rigueur.

Prise et édition des vidéos : Le candidat enregistre chaque pièce en une seule prise. Les coupures/montages au sein d’une œuvre sont interdites. Le candidat peut enregistrer tout le programme en une seule vidéo, ou chaque pièce séparément.

L’édition des vidéos est interdite sauf pour couper la séquence où vous allumez et où vous éteignez la vidéo, mais ce n’est pas obligatoire car cela n’aura aucune incidence sur le jugement du jury.

Accompagnement : selon la situation sanitaire, si le candidat n’est pas en mesure de réaliser ses enregistrements avec accompagnement, l’absence de celui-ci ne sera pas prise en compte dans la notation du jury.

Cadrage de la vidéo : la prise de vue doit se faire au plus près du candidat étant entendu que le candidat doit apparaître dans sa totalité.

Combinaison d’une source vidéo et d’une source audio : la combinaison d’une source vidéo et audio provenant d’appareils différents est autorisée, mais bien évidemment, l’édition, la modification ou les points de montage à l’intérieur d’un enregistrement sont interdits.

CNSMD Lyon (3)

Appareil d’enregistrement

Par souci d’égalité entre les candidats, les vidéos doivent être enregistrées avec du matériel « tout public » comme les smartphones, tablettes, appareils photo ou ordinateurs. Les enregistreurs portable type Zoom sont acceptés. Le candidat ne pourra pas utiliser plus de 2 micros pour effectuer l’enregistrement. Le son et la vidéo doivent être enregistrés en simultané, les effets de post-production ne sont pas admis. Il n’est pas permis aux candidats d’avoir recours à un enregistrement professionnel.

2. Conditions pour l’enregistrement

Le candidat doit se filmer sans montage ni coupure, en plan fixe.

Sur l’appareil ou sur l’application que vous utilisez, le réglage automatique du niveau d’enregistrement doit être désactivé dans la mesure du possible pour rendre les nuances audibles. Vérifiez en jouant un passage piano et un passage fortissimo que toutes les nuances sont audibles sans déformation.

Soyez très attentif à la réverbération et à la taille de la salle où vous enregistrez la vidéo, et à la distance entre vous et la caméra (qui doit si possible être au moins de 3 mètres).

Le candidat devra se filmer face caméra et en pied. Veillez à ce que le plan permette de voir vos doigts et votre archet si vous êtes instrumentiste à cordes, vos doigts et la partie supérieure de votre corps si vous êtes instrumentiste à vent. Vous devrez adopter la position debout sauf si votre instrument ne le permet pas.

Le candidat devra enregistrer une vidéo par œuvre, sauf s’il est indiqué autrement dans le programme de l’épreuve.

L’enregistrement doit se faire SANS accompagnement (sauf pour le chant, violoncelle, violon et alto).

Après l’enregistrement, veuillez écouter l’ensemble de la vidéo. Il peut en effet arriver que le son de certains passages soit altéré, pour une question d’orientation du son produit

3. Envoi de l’enregistrement

Votre vidéo devra être nommée selon le format suivant : NOM_Prenom_Compositeur_Nom de l’œuvre

Les vidéos doivent être hébergées par vos soins, en utilisant une plateforme tout public. Il est conseillé d’héberger les vidéos en mode « privé » et ne fournir le lien qu’au jury, via le formulaire de dépôt.

ESMD Lille (4)

Les concours d’entrée se dérouleront à distance.
Les candidats devront faire parvenir des enregistrements vidéo selon un programme instrumental propre à chaque instrument (le programme sera communiqué sur ce site) sous forme de fichiers numériques avant le 6 mars 2023.
Ces enregistrements audiovisuels devront être enregistrés en plan fixe, sans montage, coupure ou post-production, et respecter une prise de vue reprenant l’emplacement habituel du jury.
Ils devront comprendre l’enregistrement vidéo des interprétations en solo (ou en groupe en Musiques actuelles amplifiées et Jazz) des œuvres demandées ainsi qu’une présentation orale du candidat qui exprimera ses motivations pour intégrer l’ESMD.
Des épreuves supplémentaires pourront être organisées, le cas échéant en présentiel, à partir du 9 mai 2023.

Le jury, particulièrement attentif à garantir une parfaite équité de traitement entre tous les candidats, pourra décider de dispositions spécifiques pour traiter les cas ayant un caractère exceptionnel.

Le pont supérieur, Rennes (5)

1^RE PHASE // ADMISSIBILITÉ

Dépôt de votre candidature en ligne sur la plateforme entre le 4 janvier et le 27 février 2023 inclus : https://scolarite.lepontsuperieur.eu/inscription

Merci de bien consulter les modalités de dépôt en ligne.

La vidéo est à envoyer au plus tard le 27 février 2023. Informations importantes et modalités techniques :

Les moyens techniques/numériques pour la réalisation de la vidéo ne sont pas pris en compte dans l’évaluation
Importation de la vidéo sur YouTube. Faire le choix de ne pas la répertorier
Pour le titre de votre vidéo : ESTHÉTIQUE* – NOM + prénom (instrument/chant/tessiture) Ex : MAA – DUPONT Martin (basse)
Dans le descriptif de la vidéo, notez les repères de durée permettant de situer le début des œuvres
Tutoriel pour la mise en ligne : https://www.youtube.com/watch?v=xGxA4-yiSEM

*TRAD : musiques traditionnelles, MAA : musiques actuelles amplifiées, CAC : classique à contemporain, CHLY : chant lyrique

POUR LES CLASSIQUES À CONTEMPORAINS (CAC) :

Votre vidéo (8 minutes minimum – 10 minutes maximum) devra débuter par une courte présentation : vous y énoncerez de manière distincte, face caméra, votre nom, votre instrument et les œuvres ou extraits d’œuvres que vous interpréterez, dans l’ordre de diffusion. En cas de coupure (dans un concerto par exemple), merci de préciser clairement le numéro de mesure auquel vous vous arrêterez.

Le cadrage de votre enregistrement vidéo devra permettre à tout moment de voir votre visage et vos deux mains (privilégiez un plan unique, suffisamment large et sans montage)
Votre prestation devra obligatoirement comporter au moins deux œuvres de langage ou d’époques différents
L’inclusion dans votre prestation d’une œuvre ou d’un extrait d’œuvre de langage contemporain sera appréciée
Pour les instruments monodiques, il est fortement conseillé d’inclure dans votre programme au moins une œuvre pour instrument seul

POUR LES CHANTEUSES ET CHANTEURS LYRIQUES (CHLY) :

Votre vidéo (8 minutes minimum – 10 minutes maximum) devra débuter par une courte présentation : vous y énoncerez de manière distincte, face caméra, votre nom, votre tessiture et les œuvres ou extraits d’œuvres que vous interpréterez, dans l’ordre de diffusion.

Merci de privilégier la présentation d’œuvres vocales d’époques et de formes différentes (oratorio, opéra, lied/mélodie) avec l’obligation du français et de l’italien et au moins d’une autre langue de votre choix.

POUR LES MUSIQUES ACTUELLES AMPLIFIÉES (MAA) :

Votre vidéo (8 minutes minimum – 10 minutes maximum) devra débuter par une courte présentation : vous y énoncerez de manière distincte, face caméra, votre nom et les morceaux ou extraits de morceaux que vous interpréterez, dans l’ordre de diffusion.

Votre prestation instrumentale et/ou vocale pourra être individuelle ou en groupe

POUR LES MUSIQUES TRADITIONNELLES (TRAD) :

Votre vidéo (10 minutes maximum) devra être accompagnée d’un document (format PDF) présentant votre aire culturelle et votre répertoire.

Le cadrage de votre enregistrement vidéo devra être en plan suffisamment large
Votre prestation devra être représentative de votre pratique artistique actuelle. Il doit obligatoirement comporter au moins deux pièces différentes dont une à danser

HEM Genève (6)

Avant de commencer votre enregistrement, veuillez prendre connaissance des consignes suivantes :

Les candidates et candidats, quel que soit leur lieu de domicile ou leur possibilité de se déplacer dans les locaux de la haute école, sont invités à transmettre un enregistrement vidéo du programme qu’ils ou elles ont indiqué dans leur dossier de demande d’admission. Aucune audition n’aura lieu dans les locaux de la haute école, à l’exception des filières, orientations et disciplines principales expressément identifiées.

Chaque œuvre du programme pourra faire l’objet d’une vidéo distincte ; chaque œuvre ou mouvement exigé selon le répertoire de l’examen devra être enregistrée dans son intégralité, sans aucun montage ni coupure.

À l’image, le plan doit être fixe et large, de face (la caméra disposée à l’emplacement habituel du public), le/la candidat.e devant être visible à tout moment.

L’enregistrement doit être réalisé spécifiquement pour la présente session d’admission 2023. Les vidéos issues de concerts publics ne seront pas prises en considération. Au début de chaque vidéo, le/la candidat.e donne son nom et son prénom, indique le titre de l’œuvre, mentionne la date du jour de l’enregistrement et précise que l’enregistrement est destiné à la HEM.

La durée et la composition du programme enregistré respectent les exigences indiquées sur le site de la haute école. Les enregistrements qui présentent un programme dont le contenu ne correspond pas au répertoire exigé ne seront pas pris en considération et le/la candidat·e sera jugé·e non admissible.

Le fichier doit être transmis au format mp4 d’une taille maximale de 2.5 giga.

FHNW, Bâle (7)

Applicants must submit a video when registering. Video requirements :

The length of the video should be minimum 20 minutes to maximum 30 minutes. It should contain a representative selection of the repertoire requirements.

The single works/movements submitted must indispensably be recorded without any cuts. If applicants submit one straight video with the whole programme, the applicant must set marks after every work/movement so that it is possible for the jury to purposely skip within the video.

Microphone :

We recommend using a suitable stereo microphone and place it conveniently. If necessary, you may also use the microphone of a camera, computer, or smartphone. Please record the video from a fixed point of view. The hands and the face of the musician must be visible. Publicly recorded concerts may be submitted as long as they correspond to the above-mentioned requirements (no cuts) and as long as they are not older than 6 months.

Please upload the video onto Youtube and add the link in the registration tool. Please add the list of works to your application or send it by mail to registration.hsm@fhnw.ch until 15th February at the latest.

Only those applicants who will be considered for the second round will be invited for the live audition.

Académies

Gustav Mahler Jugendorchester (orchestre)	Présentiel mais pas de jury, enregistrement vidéo
Académie de l’Orchestre de Paris (orchestre)	vents : sélection vidéo cordes : pré-sélection vidéo, 2^nd tour présentiel
Orchestre Français des jeunes (orchestre)	Présentiel
Verbier Festival Orchestra	Choix entre vidéo ou présentiel
Académie Philippe Jaroussky	Présentiel
Académie Seiji Ozawa (quatuor à cordes)	Présentiel
Gstaad Academy (piano, voix, cordes, baroque, direction)	Vidéo (pas de consignes)
Zermatt Academy (orchestre)	Vidéo (pas de consignes)
EUYO (orchestre)	Dépend de chaque pays Partout 1 ou 2 tours en présentiels sauf : Espagne, 1er tour vidéo, 2e tour présentiel Italie, 2 tours sur la même vidéo
Karayan Akademie (orchestre)	Présélection vidéo, 2^nd tour présentiel
Moritzburg Festival Academy	Vidéo
Berlin Opera Academy	Vidéo
Davos Festival Academy	Vidéo
Mendelssohn-Orchesterakademie	Présélection vidéo, 2^nd tour présentiel
Zwischentöne Kammermusikfestival Engelberg	Vidéo
International Orchestra Academy Toblach	Vidéo
Luzern Festival Academy	Vidéo

Chamber orchestra of Europe	Présélection vidéo, 2^nd tour présentiel
Orchestre Symphonique Suisse des Jeunes	Présentiel

Académie de l’orchestre de Paris (8)

Instructions pour les vidéos

Ces instructions permettent de minimiser les risques de problèmes techniques et d’assurer que le format de votre enregistrement soit pris en compte par le jury

Seules les vidéos seront acceptées pour ces pré-sélections.
Nous encourageons les candidat·es à soumettre des enregistrements vidéos de qualité, cependant nous acceptons les vidéos prises avec un smartphone, une tablette etc.
Les vidéos devront être faites en une prise, sans montage ou post production afin de reproduire les circonstances d’une audition live.
Merci de ne pas parler sur ces vidéos.
La vidéo doit être prise avec une seule caméra et les candidat·es doit être visible de la tête aux pieds durant l’intégralité de l’enregistrement. Assurez-vous que vos deux mains sont également bien visibles.
Merci de laisser une horloge, un réveil ou un chronomètre bien visible dans le champ de la caméra afin de prouver l’absence de montage.
Merci de filmer dans une pièce présentant une acoustique sèche ou medium (pas de réverbération du son)Les candidatures ne respectant pas ces conditions ne seront pas prises en compte
Votre enregistrement doit exactement correspondre aux extraits demandés (voir programme des vidéos) Vous pouvez téléverser directement votre vidéo dans le formulaire ou partager un lien (YouTube par exemple)

EUYO (9)

Italy

2 rounds

The deadline to apply for the Italy auditions is 30 September.

You must submit a video audition and there will be two rounds. The first-round video will be judged by one, two or several jurors provided by the local Italian organiser.

To apply you must submit a video with up to 4 minutes of an own choice piece plus the two mandatory excerpts. This must be filmed in one take and uploaded to YouTube as an unlisted or public video.

The own choice piece can be longer than 4 min. (i.e. a movement of a Concerto or Sonata, etc.), but you should only play about 4 minutes of it.

If you have been a member or on the reserve list the last two years you MUST also submit a video in your application as the final round will be online. You will pass directly to the final round audition but you MUST include a video in your application.

Your first-round video will be viewed and judged again during the second round.

Moritzburg Festival Academy (10)

(no piano accompaniment required)

You may send one or multiple videos (please title the videos clearly. In case of a single video, please add the minutes and the title in the description)

Please only send video links where we can see you playing! Audio recording only will NOT be accepted.

Berlin Opera Academy (11)

We ask that you upload two recordings that best display your musical abilities. We recommend one excerpt from an operatic or symphonic work and one solo or piano-accompanied piece, however, you may submit any recordings that you feel showcase your playing. The recordings do not need to be professional nor from a performance. Video is preferred, but audio-only is also accepted. Recordings must be submitted via link (eg: Youtube, Vimeo, Soundcloud etc). If using Youtube, please ensure your videos are uploaded as either Unlisted or Public videos (not Private).

Davos Festival Academy (12)

Please provide recent video recording(s) of the performance of two representative pieces or movements (total length approx. 8–15 minutes).

Mendelssohn-Orchesterakademie (13)

Die Aufnahme darf nicht geschnitten oder bearbeitet werden. (L’enregistrement ne doit pas être coupé ou édité)

Verbier (14)

Please read ALL of the following instructions before starting your application or recording your video:

Please note that you must perform all the works/orchestral excerpts listed under ‘Audition Repertoire’ above. You must play the works as if you were giving a live audition (i.e. straight-through in the order listed). The recording must be made in one shot, without cuts or edits.

Applicants are not required to play the full movement of their selected concerto or solo work(s). Please focus on recording the first 3 to 5 minutes of solo playing from the movement of your choice, without any accompaniment.

Please take into account the size of the room and its acoustic as well as the distance from the camera: the more reverberative the room, the closer you will need to be to the camera (usually 3 metres or 10 feet).

The use of artificial reverberation or any other audio modification via post-production (editing, splicing, etc.) is strictly prohibited and will result in disqualification.

IMPORTANT: watch and listen to your recording to be sure is represents what you want to the jury to consider.

Luzern Festival Académie (15)

All recordings should be made with video. No splicing is allowed within individual videos (including between movements), but each piece should be on a separate video. Use of high-quality microphones is strongly encouraged. Separate audio and video equipment can be used, but should be recorded live simultaneously. Digital effects, enhancements, or any other post-production audio manipulation techniques are not permitted.

Praktikum

Tonhalle Orchester Zürich	Présentiel
WDR Funkhausorchester Köln	Présentiel
Musikkollegium Winterthur	Présentiel
Sinfonieorchester Basel	Présentiel
Göttinger Symphonie Orchester	Présélection vidéo
Akademie des NDR Elbphilharmonie Orchesters e.V.	Présélection vidéo
Akademie des Symphonieorchesters des Bayerischen Rundfunks	Présélection vidéo
Bayerisches Staatsorchester	Présentiel
Czech Philharmonic	Présentiel
Deutsche Kammerakademie Neuss am Rhein	Présentiel
Deutsche Staatsphilharmonie Rheinland-Pfalz	Vidéo recommandée mais pas obligatoire
Dresdner Philharmonie	Présélection vidéo
Gürzenich-Orchester Köln	Présélection vidéo
Luzerner Sinfonieorchester	Présentiel
Mendelssohn-Orchesterakademie	Présélection vidéo
Orchester der Komischen Oper Berlin	Présélection vidéo
Orchesterakademie der Essener Philharmoniker e.V.	Présentiel
Philharmonia Zürich	Présentiel
Sächsische Staatskapelle Dresden	Vidéo recommandée mais pas obligatoire
Staatskapelle Weimar	Présentiel
Staatsorchester Kassel	Présentiel

Komische Oper Berlin (16)

Wir bitten um Bereitstellung eines ungeschnittenen und durchlaufenden Videos (« one-take » / « einfaches Handyvideo » ausreichend).

Nous vous demandons de fournir une vidéo non coupée et défilante (« one-take » / « simple vidéo de téléphone portable » suffit).

Dresdner Philharmonie (17)

nehmen Sie das Video bitte mit einer festen Perspektive auf (die Kamera nicht bewegen).
Sie können ein Smartphone oder eine professionelle Kamera zum Aufnehmen verwenden.
bitte achten Sie auf einen guten Klang. Sie können auch gern mit Mikrofonen aufnehmen.
Sie müssen gut zu sehen sein. Besonders Ihre Hände müssen gut sichtbar sein.
zu Beginn des Videos stellen Sie sich vor und sagen Sie bitte Ihr Programm an, mit Blick auf die Kamera. Sie müssen Deutsch sprechen.
Sie können jedes Stück einzeln einspielen, zwischen den einzelnen Stücken und der Anmoderation kann auch geschnitten werden. Videos von verschiedenen Stücken fügen Sie bitte zu einem einzigen Video zusammen.

Veuillez enregistrer la vidéo avec une perspective fixe (ne pas bouger la caméra).
Vous pouvez utiliser un smartphone ou une caméra professionnelle pour enregistrer.
Veuillez veiller à ce que le son soit de bonne qualité. N’hésitez pas à enregistrer avec des microphones.
Vous devez être bien visible. Vos mains, en particulier, doivent être bien visibles.
Au début de la vidéo, présentez-vous et annoncez votre programme, face à la caméra. Vous devez parler allemand.
Vous pouvez enregistrer chaque morceau séparément, il est également possible de couper entre les différents morceaux et la présentation. Les vidéos de différents morceaux doivent être assemblées en une seule vidéo.

Deutsche Staatsphilharmonie Rheinland-Pfalz (18)

Eine einfache Handy-Aufnahme reicht. Handy-Audio genügt, die Verwendung eines besseren (externen) Mikrofons ist aber willkommen. Bitte keine akustische Nachbearbeitung (künstlicher Hall usw.).

Un simple enregistrement sur téléphone portable suffit. L’audio d’un téléphone portable suffit, mais l’utilisation d’un meilleur microphone (externe) est la bienvenue. Merci de ne pas faire de post-traitement acoustique (réverbération artificielle, etc.).

Akademie des NDR Elbphilharmonie Orchesters e.V. (19)

Die Kandidatin/ der Kandidat muss während des gesamten Videos zu sehen sein. Klavierbegleitung im Video wünschenswert, aber nicht zwingend erforderlich.

Keine besondere Videotechnik erforderlich: Handykamera Querformat oder einfache Videokamera genügt.

Nur eine Kameraperspektive bitte, keine Schwenks, Zooms, Überblendungen o.ä.

Handyaudio genügt, die Verwendung eines besseres (externen) Mikrofons ist aber willkommen

Bitte keine akustische Nachbearbeitung (künstlicher Hall usw.)

Sollte einer der Punkte nicht beachtet werden, können wir die gesamte Bewerbung leider nicht berücksichtigen.

Le candidat doit être visible pendant toute la durée de la vidéo. Accompagnement au piano souhaitable dans la vidéo, mais pas obligatoire.

Aucune technique vidéo particulière n’est requise : une caméra de téléphone portable format paysage ou une simple caméra vidéo suffit.

Un seul angle de caméra s’il vous plaît, pas de panoramiques, de zooms, de transitions ou autres.

L’audio du téléphone portable suffit, mais l’utilisation d’un microphone (externe) plus performant est la bienvenue.

Pas de post-traitement acoustique (réverbération artificielle, etc.).

Si l’un des points n’est pas respecté, nous ne pourrons malheureusement pas prendre en compte l’ensemble de la candidature.

Concours internationaux

ARD	Pré-séléction vidéo
Concours de Genève	Pré-sélection vidéo + online recital Demi-finale et finale en présentiel
Concours international de chant-piano Nadia et Lili Boulanger	Présélection vidéo (aucune indication)
Epinal International Piano Competition	Présentiel
Hans Gabor Belvedere singing competition	Présentiel
Heidelberg Frühling – Das Lied Wettbewerb	Présélection vidéo
International Edvard Grieg Piano Competition	Présélection Vidéo
International Henryk Wieniawski Violin Competition	Présélection vidéo
International piano competition JS Bach, Würzburg	Présélection vidéo
International Piano Competition Prize Jaén	Présentiel
International Schubert Competition Dortmund	Présélection vidéo
International Tchaikovsky Competition	Présélection vidéo (aucune indication)
International Violin Competition Henri Marteau	Présentiel
Internationaler Akkordeonwettbewerb Klingenthal	Présentiel
Internationaler Bach Wettbewerb Leipzig	Présélection vidéo
James Mottram International Piano Competition	Présélection vidéo (pas encore d’indications)
Maj Lind International Piano Competition	Présélection vidéo
Montecarlo Music Masters	Présentiel

	Si impossible de venir à la présélection, vidéo + présélection live la veille du concours
Neue Stimmen Competition	Présélection Vidéo
Ottavio Ziino International Opera Competition	Choix entre présélection vidéo ou présentiel
Paris Opera Competition	Présélection dossier, présentiel
Queen Elisabeth Competition	Présélection vidéo
The Queen Sonja Classical Music Competition	Présélection vidéo
Tibor Varga International Violin Competition	Présélection Vidéo (pas d’indications accessibles)
Pablo Casals International Award	Présélection vidéo
Fritz Kreisler International Violin Competition	Présélection vidéo (aucune spécification)
Concours de Piano Liège	Présentiel
Concours International Adolphe Sax	Présélection vidéo
Maria Canals Competition	Présélection vidéo
Concours International Olivier Messiaen	Présélection vidéo (aucune spécification)
Concours international Long-Thibaud	Présélection vidéo (aucune spécification)
Concours International de piano Nice Côte d’Azur	Présélection vidéo (aucune spécification)
Concours International Clara-Haskil	Présélection vidéo
Carl Nielsen Competition	Présélection vidéo (aucune spécification)
International Clarinet Competition Ghent	Présélection vidéo (aucune spécification)
Aeolus International Competition	Présentiel
The Muri Competition	Présélection vidéo
Werner Pirchner Preis	Présélection vidéo (aucune spécification)


International Competition of Polish Music (Pianists)	Présélection vidéo (aucune spécification)
Festival Van Vlaanderen Brugge	Présélection vidéo
International Chamber Music Competition Pinerolo E Torino	Présélection vidéo
International Jeunesses Musicales Competition in Belgrade	Présentiel
Concours International de Saxophone d’Andorre	Présélection vidéo
Internationaler Instrumentalwettbewerb Markneukirchen	Présélection audio
Prague Spring International Music Competition	Présélection vidéo
International Piano Competition “Iturbi Prize”	Présélection vidéo
Concours international pour Orgue de Saint-Maurice	Présélection vidéo (aucune spécification)
Santa Cecilia International Competition	Présélection vidéo (aucune spécification)
Grand Prize Virtuoso	Vidéo
World Classical Music Awards	Vidéo (aucune spécification)
The Muse International Competition	Vidéo
Online London International Music Competition	Vidéo

Internationaler Instrumentalwettbewerb Markneukirchen (20)

For the pre-selection a personally recorded audio file (no video, no DVD or similar) in mp3 format. The recording must not have been edited and must not be older than one year. (The works required for the preselection are listed in the repertoire regulations).

Prague Spring International Music Competition (21)

The selection of candidates to take part in the Competition in Prague shall be based on this recording, shall be anonymous and in random order. The video recording must fulfill the following parameters:

Pieces must be recorded in their entirety and without any cuts or editing;
Individual parts of the pieces (movements) must be recorded separately or indexed;
Microphones should be positioned at a distance allowing to obtain a good sound quality;
The video should be filmed from a fixed camera angle; musician´ s hands and face must be entirely visible all the time;
It is highly recommended to ensure a good sound quality of the recording, to provide the jury with the best possible conditions for judging in the preliminary round;
Public recordings are accepted if they meet the recording conditions stated above (especially no cuts);
Upload your recording (recordings) to a cloud server such as Dropbox, iCloud, Google Drive, etc. (not YouTube) and include the link in your application – always set the access to the video as public.

Technical requirements :

Video quality – 720p or 1080i or 1080p
Audio quality – PCM, flac, mp3 min. 256kbps or aac min. 192kbps
Microphone of adequate quality (no built-in microphones in mobile devices)
File format – mp4, mov, avi, mpg or mkv

International Piano Competition “Iturbi Prize” (22)

Recording: The URL where an audio-visual document can be viewed, preferably in high resolution HD, where the contestant will perform a free programme of between 20 and 30 minutes, will be communicated in the application form. The link must be available for consultation and download until 12 December 2022. Each of the works performed must have been recorded in a single take, without any cuts or editing within each of the works and in a single fixed shot. The recording must have been made after 1 March 2022 and in the circumstances declared responsible in the entry form, and the participant must be physically recognisable in the recording.

Festival Van Vlaanderen Brugge (23)

Every Video must be recorded live, unedited and presented as video recording.

Recordings that have already been published as well as concert recordings etc. are not admissible as competition entries.

In the video, the hands must be visible at all times. You take the video from audience side with a full view on the keyboard, your hands and face (side profile) at all times. An example of this angle can be found at the bottom of this document.

Videos that do not meet these requirements will be disqualified.

Make sure your video meets the following export quality specifications :

Resolution : 1920 x 1080 (horizontal)
Framerate : 25 (progressive, not interlaced)
Audio : Stereo (AAC)
Video codec : H.264/H.265 at 8Mbps
Video container / extension: MP4

You are free to decide which device you use to record your performance, as long as decent video quality is guaranteed.

Make sure good audio quality is guaranteed as well. Make sure to avoid external disturbing suns during your performance.

Try to make your video background as clean as possible.

Make sure the video is well lit, not overexposed or too dark. The use of natural lighting will do.

Do not add any textual or graphical elements (logo’s, names, etc…) to the video

Pablo Casals International Award (24)

The videos must be recorded from the front with only one camera and the contestant’s hands and face must remain visible.
No cut or editing are tolerated.
The information section of each video will include the date and place of the video recording.
The videos cannot be subject to any (copyright) restrictions.

The sound of the videos must be clear, and it is recommended that professional equipment or a camera with good sound quality recording be used.
Candidates are recommended to upload videos within 48 hours of the closing date of the competition call in order to avoid any problems.

Concours Adolphe Sax (25)

Sur l’image, le candidat doit être à tout moment visible en pied et le plan doit être fixe. Le candidat est filmé en plan-séquence (un plan-séquence par œuvre interprétée) sans aucun montage. La vidéo ne comportera ni générique ni indications visant à valoriser artificiellement le candidat. Aucune mention d’établissement d’enseignement musical ne peut figurer sur la vidéo. La direction du concours visionne toutes les vidéos au préalable de façon confidentielle afin de vérifier qu’aucun trucage technique n’a été réalisé. Il lui appartient de statuer sur l’irrecevabilité d’une vidéo, en raison d’une qualité technique insuffisante ou du non-respect des règles de captation définies ci-dessus. Dans ce cas, la direction du concours se réserve le droit de demander au candidat de fournir une nouvelle vidéo. Jusqu’au terme du concours, le candidat a l’interdiction formelle de diffuser ces vidéos sur n’importe quel support que ce soit, notamment les réseaux sociaux, sous peine de sanctions pouvant mener à l’exclusion. La vidéo reste la propriété de l’Association Internationale Adolphe Sax jusqu’au terme du concours.

Maria Canals Competition (26)

A recent and good quality recording uploaded on a YouTube channel, using a fixed camera with no postproduction and with a maximum duration of 20 minutes, including one fast movement of a Beethoven sonata and a work of the applicant’s own choice. The contestants must email the YouTube video link and clearly state the chosen pieces on the video description, through the registration form. The Competition will not be liable for any external technical problems related to access to these links.

Clara Haskil (27)

Le programme doit être enregistré en une seule prise, avec une seule caméra et sans coupures ni montage. Le plan doit être fixe et le visage et les mains doivent être visibles à tout moment.

The Muri Competition (28)

The videos may not be edited, manipulated or cut in any way, they must be recorded from one and the same camera position.

Specialized programs will be used to test the submitted recordings for any signs of tampering.

International Chamber Music Competition Pinerolo E Torino (29)

The video must have been recorded expressly and exclusively for this competition. INSTRUCTIONS FOR MAKING AND UPLOADING YOUR VIDEO:

Download and print the competition flyer that you will find on our website, in the section HOW TO ENTER.
Check that the framed image is fixed and horizontal and that it includes all members of the group.
Make sure that the lighting is adequate for the space you are filming.
Start the video recording with a shot of the flyer you printed.
Begin your performance.
The video must be a continuous live recording. NO EDITING allowed.
Ensure that the audio is of the highest quality possible.
Upload your video on Youtube / Vimeo, or on other platforms, as protected content.
Save the link and password, as this information must be included in your application.

Concours international de saxophone d’Andorre (30)

Nom du fichier : NOM_PRENOM_CADENZA_TOMASI Résolution : minimum 640 x 480 pixels.

Format : uniquement mp4.

Le fichier vidéo ne doit pas dépasser 2Gb

Dans la vidéo, le candidat doit être parfaitement visible à tout moment sur l’écran et l’angle de la caméra doit être fixe.

Le candidat doit être filmé en une seule prise. Aucun montage de la vidéo ne sera accepté.

Toutes les vidéos sont visionnées en toute confidentialité par l’équipe organisatrice du concours pour s’assurer qu’aucune astuce technique n’a été utilisée.

Il appartient à l’équipe organisatrice du concours de décider si une vidéo est inadmissible en raison d’une qualité technique insuffisante ou d’un non-respect des normes de capture vidéo définies ci-dessus.

Dans ce cas, l’équipe organisatrice du concours se réserve le droit de demander au candidat de fournir une nouvelle vidéo.

Jusqu’à la fin du concours, il est strictement interdit au candidat de diffuser ces vidéos sur quelque support que ce soit, y compris sur les réseaux sociaux, sous peine d’exclusion.

La vidéo est la propriété de l’Association des Saxophonistes d’Andorre jusqu’à la fin du concours.

ARD (31)

Fiche de déclaration sur l’honneur à signer :

Par la présente, je certifie, que l’enregistrement effectué par moi-même/par notre institution pour le/la candidat(e) susnommé(e) répond aux exigences citées dans le règlement du concours:

L’enregistrement a été effectué sans montage.
Ni la longueur ni la hauteur des tons n’ont été manipulées.

VIDEO RECORDING Requirements Content :

Recent (less than 12 months old) video recording, containing the required program for the preliminary audition only (no YouTube links e. a.)

Recording :

Pieces must be recorded in their entirety and have to be UNEDITED (no cuts). Movements can be send as single files. Exception for the harp category: Both works have to be recorded in one single session without any cuts.

Microphones should be positioned at a distance allowing to obtain a good sound quality.

For soloists: The video must be filmed from the side in a 45 degree angle, using a fixed and wide camera angle; musician’s hands and face must remain visible all the time. This also applies for ensembles, if possible.

Public recordings are accepted, as long as they meet the recording conditions stated above (especially no cuts).

Technical specifications (suggested) :

Video quality – 720p or 1080i or 1080p Audio quality – 256kbps mp3 or 128aac

Microphone of adequate quality (no built-in smart phone mic)

File Format – mp4 or mov max. 9 Mbit, max. 900 MB

Concours de Genève (32)

TECHNICAL REQUIREMENTS

FOR THE VIDEO PRESELECTION ROUND

Candidates must provide recent (less than 12 months) and high-quality video recordings, containing the required programme for the Video Preselection Round only.
Recording must be anonymous. Please do not include your name in the video/file title nor any distinctive sign such as your school logo, for example.
All recordings must be UNEDITED (no cuts – no sound editing). Microphones should be positioned at a distance allowing to obtain a good sound quality. The video must be filmed from the front using a fixed and wide camera angle. The performer must always remain visible. For the piece with piano, both performers must be visible.
Candidates must provide separate recordings for each piece.
Each piece must be recorded in one take.
Public recordings are accepted if they meet the recording conditions stated above.
It is highly recommended to take into consideration the quality of the sound, to allow the Jury to have the best possible judgement.

VIDEO PRESELECTION ROUND

The purpose of the preselection round based on video recordings is to select candidates who are up to the standards required to take part in the public rounds of the Competition.

This preliminary phase takes place in camera in the presence of a preselection jury, whose five members include at least two members of the official Jury of the 2023 Flute Competition. It is held in a studio guaranteeing the best possible technical conditions.

The names of the selected candidates will be published on our website on 5 May 2023. Selected candidates will be notified personally and will receive further information regarding the next stages of the Competition, as well as technical specifications for the recording of their Online Recital.

ONLINE RECITAL

The first stage of the 2023 Competition will be held online and consists in a 45-minute online pre-recorded recital, which will be broadcast from 11-17 September 2023. The running order of the candidates will be determined by random draw.

It will remain the same for all the following stages of the Competition. Candidates will have until 10 July 2023 to submit their video for this first stage of the Competition. They will each receive CHF 500.- to cover the expenses of the recording, which will have to respect a set of very strict technical specifications. These specifications will be sent to the selected candidates.

Schubert international competition (33)

Editing of the video and cuts within the songs are not permitted. Cuts between the songs are possible, so that three individual videos can be put together into one video.

Bach Leipzig Wettbewerb (34)

Candidates must present uninterrupted video recordings. Splices may be made between individual pieces, but not within a piece. Splices between the movements of a work are not allowed.

International piano competition JS Bach, Würzburg (35)

Due to the inconveniences and difficulties caused by COVID-19, we will not set any specific requirement for the format of the video recording. Please make sure that your video recording is filmed as professional as possible.

The video recording or excerpts from a live concert from the last two years are permitted, as long as they match the recording requirements of the Bach Competition!

That means:

any cuts or editing in the video recording is forbidden!
Pianists must be fully visible at all times, which means the video can be taken with ONE camera only!

Competitors are allowed to record each work from Preliminary round separately, eventually creating 2 links.

An example from the Preliminary Round : the entire French Suite can be recorded first and the second required work on a later date. A whole set of work must be played and recorded without any interruptions !

Queen Elisabeth competition (36)

Technical requirements

In the application form, the candidate must provide information on the place and date of recording for each file.
For each file, the candidate must certify its authenticity and that he/she is the soloist and must confirm that it is not subject to copyright restrictions.
Each piece must be recorded in a single take.
No editing is allowed.
The candidate must be clearly visible ; the candidate’s chest and face should be clearly visible at all times.
It is strongly recommended that the sound should be recorded professionally.
The videos may be recorded in different places and on different occasions.
A video whose quality, visual and/or audio, does not allow the jury to evaluate the candidate’s abilities will be rejected (see Article 96 and following).

Das Lied Wettbewerb (37)

Die Video-Aufnahmen müssen per Link über ein gängiges Online-Videoportal (z.B. youtube, vimeo, dailymotion o.ä.) abrufbar sein, dürfen nicht geschnitten oder nachbearbeitet und zum Zeitpunkt der Einsendung nicht älter als ein Jahr sein ; die Lieder des Aufnahme müssen nicht dem Wettbewerbsrepertoire entsprechen.

Les enregistrements vidéo doivent être accessibles par un lien sur un portail vidéo en ligne courant (p. ex. youtube, vimeo, dailymotion ou autres), ne doivent pas être coupés ou retravaillés et ne doivent pas dater de plus d’un an au moment de l’envoi ; les Lieder de l’enregistrement ne doivent pas correspondre au répertoire du concours.

Neue Stimmen (38)

Technical demands:

One video per aria

Both videos must be specifically recorded for the NST 2021 competition, existing video material cannot be used

Both videos should be recorded between November 2020 and June 2021 Both videos must be in an MP4-format

Each aria must be recorded in a single take

Do not edit the sound of the videos after recording!

Recordings must be made entirely live, only with piano accompaniment (no pre-recorded backing tracks, no orchestra accompaniment)

Watch our tutorial video “How to produce a good audition video” before you start. This tutorial shows you step by step how to produce your own audition video

Find the checklist from the video here :

Decide on your repertoire

Set a date for recording AND schedule enough time!
Arrange a pianist
Ask a friend to join you for help
Get, rent, or borrow good equipment

Find a room with good acoustics for recording
Best would be a rehearsal room or use a larger room at home
Neither too big… nor to small
Walk around, test acoustics – avoid echoes or a „boomy“ sound
Close doors and windows
Clean up

Avoid back light
Natural light works best
Make sure to have enough light on your face and no shadows
Your face must be clearly visible
If needed, use extra lighting but keep lamps out of your shot

Smartphones are ok – use landscape orientation
Put your phone in a steady position – a tripod, books, or a box on a table are helpful to get equipment at eye level
For better quality, use a separate microphone or recorder
Find the right distance between you and your equipment
Put your smartphone about 2,5 meters in front of you, so your whole body is in the frame and face and eyes are clearly visible
If you use a separate recorder, put it at least 3 to 4 meters in front of you

Dress in a smart and professional way
Your make-up should be natural, no stage make-up

Before you start, concentrate on your performance, pay attention to character and text
Put artistry first, technology second
Introduce yourself with name and repertoire
Aim for a compelling performance. Move less – only little changes with body and face are needed when recording for screen

Make a test video and watch it several times
Get honest feedback – from your friend, your teacher…
Give yourself time to experiment – you have more than one take

Edvard Grieg (39)

Important information about the pre-qualification videos:

It is possible to use different recordings for different pieces (live recordings are also accepted), as long as the required repertoire is included. Multi-camera recordings are accepted, but editing of the audio within one piece is not allowed (it has to be one continuous recording). Recordings may not be older than 20 April 2019. Please include the name(s) of the venue(s) and the date(s) of the recording(s). You will find more information about videos in the « Uploads » section of the application portal.

Ottavio Ziino International Opera Competition (40)

Competitors may choose to participate in the Elimination through:

the sending of 2 recent high quality and resolution videos of opera arias among those listed in the registration form, performed in the last two years (2021-2022), one of which in Italian, with exclusive piano or orchestra accompaniment (no registered bases).

If the videos are already public on the net, indicate the corresponding links or use alternative channels for sending as an example (« We Transfer ») or by showing up on one of the dates and places indicated for the live selection

Maj Lind Competition (41)

The video must clearly show the performance, the player’s hands and face. The video must not be edited. Individual works or movements may, however, be recorded as different takes. The application must state when and where the video was made.

Queen Sonja Classical Music Competition (42)

Video recordings must be performed by the applicant and may not be edited, nor should any effects be added. Applicants are responsible for ensuring that the video is recorded with good quality (image and sound). To ensure that poor recording quality does not interfere with the jury’s ability to review the material, avoid distortion, and ensure that the accompaniment is not louder than the applicant. You will not be penalised for the quality of your video, although it is important that it is good enough to see and hear you clearly. Videos should be recorded no more than 6-12 months before the date of your submission.

Grand Prize Virtuoso (43)

Participants are required to submit video materials for the jury audition. Recording should be a fair representation of the contestants’ abilities, but doesn’t need to be of a professional quality.

The muse international piano competition (44)

You can submit a video made anytime from 2021 and later, but it has to match with your age category on the day you submit your application.

The participant should be dressed well and in an appropriate manner. Performances in sportive or casual clothes will not be accepted for evaluation!

The hands and the face should be visible during the recording, as well as the keyboard.

Cutting and merging multiple takes is not allowed. However, merging two or more movements of the same work into one video, but from different takes, is possible.

Home-made or professional : It is up to you. Videos can be made with consumer cameras, camcorders, mobile phones, tablets, as well as professional equipment.

Your video must be posted on YouTube and set to either “Public” or “Unlisted”.

Online London International Music Competition (45)

The contest will accept videotapes with piano, orchestra, chamber ensemble, wind band, percussion, or any other accompaniment required by the composer in the published work.

COVID-19 Exception. The contest will accept recordings with pre-recorded accompaniment for those applicants who are unable to record with a live accompanist due to social distancing.

The video must contain recordings made during the 18 months before the deadline. Each age category has a maximum duration for the video.

Each piece must be performed in one take with no edits. If you submit multiple pieces, they must be submitted together as one video file not to exceed the maximum time limits for the applicant’s age category. Online London International Music Competition reserves the right to immediately disqualify any applicant whose tape shows evidence of editing within one take of a piece other than a cut to meet time limits.

Multiple cameras can be used for video recording but no sound effects should be added to any portion of video entry (it is acceptable to have an introduction title with musician’s name, title of piece and composer).

There is no live round : all awards will be made online via video submission. It is suggested that the applicant submit the highest quality video possible to give a fair representation of their performance.

Postes d’orchestre

Badische Staatskapelle	Présentiel
Belgian National Orchestra	Présentiel
Arctic Philharmonic	Présélection Vidéo
Auditorium Orchestre national de Lyon	Présentiel
Bamberger Symphoniker – Bayerische Staatsphilharmonie	Présentiel
Basque National Orchestra	Vidéo facultative
Bayerisches Staatsorchester	Présentiel
Bergische Symphoniker	Présentiel
Bielefelder Philharmoniker	Présentiel
Bochumer Symphoniker	Présentiel
Bruckner Orchester Linz	Présentiel
Deutsche Oper Berlin	Présentiel
Deutsche Radio Philharmonie Saarbrücken Kaiserslautern	Présélection vidéo
Deutsche Staatsphilharmonie Rheinland-Pfalz	Présentiel
Deutsches Symphonie-Orchester Berlin	Présélection vidéo
Duisburger Philharmoniker	Présentiel
Düsseldorfer Symphoniker	Présentiel
Elbland Philharmonie Sachsen	Présentiel
Finnish Radio Symphony Orchestra	Vidéo facultative
Folkwang Kammerorchester Essen	Présentiel
Fondazione Teatro alla Scala	Présentiel
Gewandhausorchester (Harpe)	Présélection Vidéo
Gewandhausorchester (1^er violon tutti, 2^e trompette, tuba)	Présentiel

Gürzenich-Orchester Köln	Présélection Vidéo
Győr Philharmonic Orchestra	Présentiel
Hessisches Staatsorchester Wiesbaden	Présentiel
hr-Sinfonieorchester \| Frankfurt Radio Symphony	Présentiel
Kärntner Sinfonieorchester	Présentiel
Koninklijk Concertgebouworkest	Présélection vidéo
Konzerthaus Berlin – Konzerthausorchester	Présentiel
Luzerner Sinfonieorchester	Présélection vidéo
Mecklenburgische Staatskapelle Schwerin	Présentiel
MDR-Sinfonieorchester des Mitteldeutschen Rundfunks	Présentiel
Mozarteumorchester Salzburg	Présentiel
Münchener Kammerorchester	Présélection vidéo
Münchner Philharmoniker	Présentiel
Musikkollegium Winterthur	Présentiel
NDR Elbphilharmonieorchester	Présentiel
NDR Radiophilharmonie (1^er violon tutti)	Présélection vidéo
NDR Radiophilharmonie (chef d’attaque des violons 2, trompette)	Présentiel
Netherlands Radio Philharmonic Orchestra	Présentiel
NFM Leopoldinum Orchestra	Présélection vidéo
Norrkopings Symfoniorkester	Présentiel
Opera Ballet Vlaanderen	Présentiel
Opéra National de Paris	Présentiel
Oper Frankfurt	Présélection Vidéo

Opéra Royal de Wallonie-Liège	Présentiel
Orchestre de Chambre de Lausanne	Présentiel
Orchestra della Toscana	Présentiel
Orchestre de Paris (Konzertmeister)	Présélection vidéo
Orchestre de Paris (3^e contrebasse solo)	Présentiel
Orchestre de Picardie	Présentiel
Orchestre National Avignon-Provence	Présentiel
Orchestre national d’Île-de-France	Présentiel
Orchestre National de Cannes	Présentiel
Orchestre National de Lille	Présentiel
Orchestre Philharmonique de Strasbourg	Présentiel
Orchestre Royal de Chambre de Wallonie	Présélection Vidéo
Orchestre Symphonique Bienne Soleure	Présentiel
Orquestra Gulbenkian	Présélection Vidéo
Philharmonisches Orchester der Hansestadt Lübeck	Présentiel
Staatskapelle Berlin	Présentiel
Philharmonie Zuidnederland	Présentiel
Philharmonisches Orchester Würzburg	Présentiel
Residentie Orkest	Présélection Vidéo
Rotterdam Philharmonic Orchestra	Présélection Vidéo 2^nd tour : choix présentiel ou vidéo
Royal Swedish Opera	Présentiel
Sächsische Staatskapelle Dresden	Présentiel
Sinfonieorchester St. Gallen	Présentiel

Sinfonieorchester Wuppertal	Présentiel
South Czech Philharmonic	Présentiel
Staatskapelle Berlin	Présentiel
Staatskapelle Halle	Présentiel
Staatsorchester Braunschweig	Présentiel
Staatsorchester Darmstadt	Présentiel
Staatsorchester Kassel	Présentiel
Staatsorchester Rheinische Philharmonie	Présentiel
Staatstheater am Gärtnerplatz	Présentiel
Stuttgarter Philharmoniker	Présentiel
Swedish Radio Symphony Orchestra	Présélection vidéo
Symfonieorkest Vlaanderen	Présentiel
Symphoniker Hamburg	Présentiel
Symphonieorchester des Bayerischen Rundfunks	Présentiel
Teatro del Maggio Musicale Fiorentino	Présentiel
Theater Plauen-Zwickau	Présentiel
Thüringen Philharmonie Gotha Eisenach	Présentiel
WDR Sinfonieorchester Köln	Présentiel
WDR Funkhausorchester Köln	Présentiel
Wiener Staatsoper/Wiener Philharmoniker	Présentiel
Zürcher Kammerorchester	Présentiel

Luzern Sinfonieorchester (46)

Das Video muss durchlaufend ohne Schnitte aufgenommen werden, wobei keine professionelle Aufnahmequalität erwartet wird. Das Konzert muss ohne Klavierbegleitung gespielt werden.

Die Reihenfolge der Stücke dürfen Sie selbst bestimmen.

La vidéo doit être enregistrée en continu, sans coupures, et aucune qualité d’enregistrement professionnelle n’est attendue. Le concerto doit être joué sans accompagnement de piano.

Vous pouvez choisir l’ordre des morceaux.

Oper Frankfurt (47)

Konzert und Orchesterstelle können als separate Dateien geschickt werden. Innerhalb der Stücke darf das Video aber nicht geschnitten oder auf andere Art nachbearbeitet sein.

Bild und Audio dürfen nicht getrennt voneinander aufgenommen werden. Das Konzert bitte mit Begleitung.

Le concerto et la partie d’orchestre peuvent être envoyés sous forme de fichiers séparés.

Cependant, à l’intérieur des morceaux, la vidéo ne doit pas être coupée ou retravaillée d’une autre manière.

L’image et l’audio ne doivent pas être enregistrés séparément. Le concerto doit être accompagné.

Arctic Philharmonic (48)

You are to make 3 video files, where the orchestra excerpts are gathered in one file. There are no technical demands to the video, but please attempt to get as high quality as possible, make the video in a well-lit room with proper sound/volume. The whole of you, as well as the whole instrument, should be visible in the picture. Use YouTube, to secure that all videos are on the same platform. The videos are uploaded to YouTube as “unlisted”, and links to YouTube are to be attatched in your application. Remember to specify which piece you choose as your chosen piece.

Münchener Kammerorchester (49)

The MKO has decided to ask all candidates to submit a video with their application on MUVAC. The video should be without piano accompaniment and submitted in two files, each consisting of a single unedited take of the following audition repertoire:

exposition of the first movement of Stamitz Viola Concerto in D Major or Hoffmeister Viola Concerto in D Major
one movement of Bach unaccompanied Suites for cello or the Partitas and Sonatas for violin

We recognize that not everyone has access to professional recording equipment, and would like to assure you all that a video recording made on a normal smartphone will be considered with the same care as recordings made using professional equipment.

Gewandhausorchester (50)

Wählen Sie für Ihre Aufnahme ein qualitativ hochwertiges Format. Die Ausrichtung sollte möglichst im Querformat (16×9) sein und ein Mindestabstand zum Mikrophon von mind. 3 Metern eingehalten werden.

Bitte stellen Sie sicher dass:

Ton und Bild im Video synchron sind
Ihr Mikrophon die Dynamik (piano/forte) nicht automatisch anpasst
Sie Ihr Video auf „public“/ „unlisted“ einstellen
Sie Ihr Video eindeutig beschriften

Choisissez un format de haute qualité pour votre enregistrement. L’orientation doit être si possible en format paysage (16×9) et une distance minimale d’au moins 3 mètres doit être respectée par rapport au microphone.

Veuillez vous assurer que :

le son et l’image soient synchronisés dans la vidéo
votre microphone n’adapte pas automatiquement la dynamique (piano/forte)
vous réglez votre vidéo sur « public »/ »non-répertorié ».
vous nommerez clairement votre vidéo

2. Guide d’entretien

Formation :

Avez-vous déjà été formé à l’enregistrement ?

Dans quel cadre ?

Nom/durée/lieu de la formation ?

Quel était le contenu ?

Utilisez-vous ces connaissances ?

Pratiques d’enregistrement

Vous êtes-vous déjà enregistré vous-même ?

Quel était la destination de l’enregistrement ?

Combien de temps a pris l’enregistrement ?

Quel était le déroulement de l’enregistrement ?

Avez-vous besoin de vous enregistrer de manière récurrente ?

À quelle fréquence ?

Cela vous a-t-il fatigué ?

Comment gérez-vous votre travail à côté ?

Ressentez-vous une différence lorsque vous jouez seul ou pour quelqu’un ?

Comment vous préparez-vous à un enregistrement dans votre travail ?

Est-ce la même préparation que pour une performance publique ?

Appréciez-vous cette pratique ?

Technique d’enregistrement :

Combien de temps a pris l’installation technique ?

Avec quel matériel ?

Comment l’avez-vous choisi ?

Où avez-vous enregistré ?

Pourquoi ?

Comment avez-vous placé le matériel ?

Avez-vous beaucoup écouté le son avant d’enregistrer ?

Que pensez-vous du résultat sonore ?

Reconnaissez-vous le son de votre instrument ?

Avez-vous des références d’écoute ?

Avec quoi écoutiez-vous le son ?

Post-production :

Avez-vous fait de la post-production ?

Si oui, quoi ?

Comment avez-vous procédé ?

Avec quel logiciel ?

Avec quel matériel ?

Comparatif travail avec/sans ingénieur du son :

Considérez-vous y avoir passé beaucoup de temps (enregistrement et post-production) ?

Qu’est-ce qui vous a plu ou déplu dans le fait de vous enregistrer de manière autonome ?

Étiez-vous satisfait du résultat ?

Pourquoi ne pas être passé par un ingénieur du son ?

Avez-vous déjà eu recours à un ingénieur du son ?

Si non, quelles attentes avez-vous du travail avec un ingénieur du son ?

Si oui, préférez-vous vous enregistrer vous-même ou avoir recours à un professionnel ?

Pour quelles raisons ?

Pour quel type d’enregistrement préférez-vous être autonome ou travailler avec un ingénieur du son ?

Équipement

Comment avez-vous choisi le matériel que vous avez acheté ?

Seriez-vous prêt à investir dans du matériel ?

Si oui, quoi ?

Pour quel usage ?

Besoins de formation

Seriez-vous intéressé pour vous former ?

Quel format vous intéresserait (cours, vidéos internet, livres…) ?

Quels sujets ?

3. Entretiens

Entretien n°1

Le 27/10/2022

Est-ce que tu as déjà été formé à l’enregistrement ?

À proprement parler non, pas de formation ou d’études, mais par des amis oui pour la prise de son home studio, pour des projets personnels ou juste pour mon instrument seul, oui.

Tu t’es déjà enregistré toi-même ?

Oui, plusieurs fois, pour des concours d’entrée, pour des vidéos de concours d’orchestre, d’académie, ce genre de choses. Pour le fun aussi, pour faire soit des petites productions ou juste des petites choses pour le fun, mais sinon dans le milieu du classique plutôt pour des auditions ou des concours d’entrée.

Quel matériel avais-tu ?

J’ai une carte son Presonus il me semble, et un TLM 102 de la marque Neumann, c’est à peu près tout, donc je m’enregistre en mono.

Avec quel logiciel ?

Sur Protools.

Pourquoi Protools ?

Parce que c’est le logiciel qu’on m’a dit d’utiliser, il n’y a absolument aucune raison personnelle.

Avec ton ordinateur personnel ?

Oui, avec mon PC.

Ce matériel, comment as-tu choisi de l’acheter ?

C’est ma copine qui m’a conseillé ce matériel, le micro et la carte son notamment. Si je pouvais être un peu critique, la carte son n’est pas du tout suffisante par rapport à la qualité du micro que j’ai, et c’est un peu dommage parce que je n’arrive pas à avoir le son que j’aimerais avoir en m’enregistrant seul. Pour la prise de son personnelle de mon instrument, maintenant je sais faire, en tout cas je pense pouvoir faire quelque chose de tout à fait correct, je parle d’enregistrer juste une trompette. Du coup je sens que ma carte son n’est vraiment pas au même niveau de qualité que le micro que j’ai. Par comparaison, je crois que le micro était à 550€ neuf et la carte son autour de 110€. Si je devais racheter quelque chose dans le futur je

crois que ce serait plutôt une carte son, éventuellement peut-être un couple, mais le fait est que ma carte son n’a que deux entrées, donc dans tous les cas si jamais dans le futur je fais des récitals piano/trompette ou ce genre de chose, peut-être qu’il faudrait que j’envisage d’acheter une carte son plus grosse, ou d’en emprunter une et d’avoir un couple en plus pour mettre un appoint sur la trompette et un couple, mais ça sous-entendrait qu’il faudrait aussi mettre un appoint sur le piano, sinon ça fait peu de sens.

Tu as déjà essayé les enregistreurs Zoom ?

Oui, je me souviens qu’au lycée je jouais dans un groupe et on avait très peu de moyens parce qu’on avait 15 ans. Deux personnes du groupe avaient des Zoom du coup on les mettait comme un double couple, ceux-là enregistraient en stéréo. C’était très fait maison dans des salles pas du tout adaptées, on se faisait des pare-son avec des manteaux et on jouait dans des positions incongrues pour pouvoir enregistrer correctement.

C’étaient des enregistrements pour quelle destination ?

Il y a pas mal de trucs qui étaient pour nous ou pour faire des mini maquettes, pour faire notre pub. Il y en a même une qu’on avait mis sur Youtube qui y est encore. Le son est loin d’être bon, surtout par exemple le son de la batterie qui est une plaie à enregistrer, même avec du bon matériel. Le son n’est pas si mauvais, il était plutôt correct vu les moyens engagés. Sinon il m’est arrivé de faire une vidéo de concours pour une académie avec un Zoom parce que ça allait plus vite, c’était un Zoom qui faisait caméra aussi. J’avais peu de temps pour filmer et m’enregistrer donc une amie m’a passé son Zoom, comme ça je n’avais pas de montage à faire. C’était un petit peu à l’arrache mais la qualité audio en tout cas était bien. La qualité vidéo était terrible, vraiment très mauvaise, mais la qualité audio était plutôt correcte, surtout pour de la trompette.

Du coup qu’est-ce que tu entends comme différences entre un enregistrement de toi au Zoom et un enregistrement de toi au micro ?

Le problème que j’ai et ce qui me fait regretter de ne pas avoir une meilleure carte son c’est que le son est meilleur quand je m’enregistre avec mon matériel à moi. Le problème, c’est que c’est un son très très sec sans ajouter de réverbération ou de traitements. Comme c’est en mono et un enregistrement de proximité, forcément c’est hyper sec. Bien sûr, je mets une petite réverbération et parfois un léger EQ, mais le problème c’est que souvent ce son-là me déplait un peu parce que je ne le trouve pas très représentatif de ce qu’est notre instrument. Avec un Zoom le son sera peut-être de moins bonne qualité, c’est possible que ça sature des fois sur une note, une fréquence, ou que le son soit globalement un peu moins bon, mais comme c’est une prise de son plus ambiante on a au moins l’idée. D’un point de vue totalement extérieur, quand je demande à des amis trompettistes, juste musiciens ou mon prof, ils préfèrent souvent des enregistrements au portable ou au Zoom, moins

optimal niveau son, mais où l’on entend la réverbération de la salle par exemple. C’est un son de moins bonne qualité mais plus naturel qu’un son qui est très sec, et on se dit : “ah, il a mis une réverbération ou un truc comme ça”, même si au final c’est plus fidèle à la réalité, mais ce n’est pas très vendeur quand même. Toutes les vidéos que j’ai faites moi-même ce n’était pas hyper vendeur et je n’étais jamais entièrement satisfait de ce que je faisais.

Tu mets ça sur le compte de la mauvaise qualité de la carte son ?

Pour moi c’est un peu un mélange de mauvaise qualité de la carte son et du fait de ne pas avoir de couple ou de son d’ambiance qui prend la salle en même temps, même si ça se recrée… J’ai fait deux ou trois trucs en re-recording et comme ce n’était pas en live, pas une prise de son globale mais plus en proximité, forcément en re-recording, le son n’était jamais très bon. En tout cas, ça ne sonnait pas ensemble. Forcément après intervient le mixage et c’est plus ou moins bien fait, ça se mixe plus ou moins bien après au reste.

Quand t’ enregistres toi-même comment ça se déroule ?

Je vais mettre en place mon matériel, ça va me prendre 15 minutes de brancher, allumer mon PC, ouvrir une session. Ensuite je fais quelques petites balances, en général je profite des balances pour chauffer. Si je n’ai pas chauffé avant, je fais 5 minutes de chauffe dans une position de micro et j’écoute, puis ensuite je refais 5 minutes un peu différemment en fonction de comment le son m’a plu, en m’éloignant, en bougeant un peu le micro etc. Après je mets en place le téléphone ou la caméra qui va me filmer et je fais des prises. Je fais entre 30 minutes et 1h15 de prises mais ça dépend vraiment beaucoup de ce que j’ai à enregistrer. Si c’est 3-4 minutes de traits d’orchestre, 5-6 traits d’orchestre, je vais le faire 8 ou 10 fois en 2h, en prenant des pauses. Si c’est par contre des pièces un peu plus longues de 10 à 15 minutes je vais faire deux filages d’affilée maximum, quitte à m’arrêter même au bout de la première pièce si je ne suis pas satisfait. Je n’aime pas tellement faire ça moi-même. Ce qui est bien en ayant un objectif de quelqu’un qui t’aide à faire ça, quelqu’un dont c’est le métier ou en tout cas qui sait faire ça, c’est que tu te mets un objectif de te dire qu’il est là 1h30 avec moi, 1h30 où je peux jouer. Il vient 30 minutes avant, on fait une petite balance et après, il ou elle est là 1h30 donc il y a une question de résultat qui est attendu, tu te dis : “bon allez, là je ne peux pas jouer quatre fois”. Comme en plus je joue d’un instrument qui est relativement physique, le fait est qu’on ne peut pas filer une pièce de 8 minutes 10 fois dans la journée. Théoriquement on peut mais au bout de la troisième prise, la qualité du son va être vraiment moins bonne par la fatigue musculaire. Forcément, plus tu fais de prises, plus tu te fatigues. Le piège de s’auto-enregistrer c’est vraiment ça, tu as une possibilité illimitée de recommencer, ce qui est génial, sauf que tu arrives à un statut de l’enregistrement qui est presque malsain de se sur-enregistrer, de ne faire que ça. Et aussi, je l’ai vécu pour faire mes vidéos de concours pour entrer à Lucerne, de ne plus prendre de temps pour travailler. De ne faire que des enregistrements et de se dire que dans tous les cas on progresse en faisant des enregistrements, ce qui est vrai, mais tu as aussi besoin de prendre du temps juste pour travailler, retravailler des petits passages qui ne passent pas forcément bien ou qui peuvent facilement te faire perdre le contrôle. C’est pour ça que maintenant, le plus possible, j’essaye quand je m’auto-enregistre de me limiter en temps, et de me dire que j’ai réservé une bonne salle pendant 2h ou 1h30. Comme ça je prends 20 minutes pour m’installer, 10 minutes pour gérer le son et 5-10 minutes à la fin pour remballer et j’ai une heure d’enregistrement maximum. En gros, si je joue un programme de 10 minutes j’ai trois chances, et encore. Si c’est plus court j’ai cinq ou six chances et je me laisse du temps entre. J’ai trop fait d’enregistrements de trois ou quatre heures où tu perds ton temps, et au bout de trois heures tu te dis je suis fatigué, bon allez une petite dernière, on ne sait jamais. Et souvent, les derniers enregistrements ce sont les mieux de ta session mais ce n’est quand même pas suffisant parce que ton son n’est plus bon, tu es fatigué, tu rates certains trucs bêtement, mais c’est quand même souvent les meilleurs parce que tu as l’impression de te dire qu’il faut tout donner. Au pire j’essaye de me mettre une limite de temps quand je m’auto-enregistre, et au mieux j’essaye de demander à quelqu’un de le faire pour moi parce que c’est toujours mieux et parce que tu as un public aussi. Tu as quelqu’un qui t’écoute et qui peut te donner un feedback, te dire un petit mot si c’était bien ou s’il y a un petit truc à améliorer. Si ce n’était pas bien et que tu es dégoûté il te dit “allez t’inquiètes, ça va aller, prend 5 minutes, va boire un café on recommence dans 10 minutes, t’en refais une et ça va bien se passer”. Tu te dis que tu ne vas pas lui prendre sa semaine, surtout si tu payes la personne, mais même si tu ne la payes pas ou que tu la connais bien et qu’elle te fait ça généreusement tu ne vas pas la monopoliser pendant cinq fois 2h toute la semaine ou pendant deux semaines. Tu fais une séance, à la limite si elle est sympa elle peut te refaire une séance le lendemain ou 2-3 jours après, mais tu as des limites de temps. Si tu n’arrives pas à faire mieux c’est un peu comme un concert. Tu as un concert, à la limite un 2^e et un 3^e, mais au final il ne faut pas non plus abuser de se sur-enregistrer.

Tu parlais des vidéos par exemple du concours d’entrée à Lucerne, tu disais que ça t’avais pris plusieurs jours, la période d’enregistrement t’as pris combien de temps ?

Je pense que quand j’ai enregistré pour Lucerne, qui était un peu un gros objectif si on contextualise, j’ai dû enregistrer peut-être sur 10 à 14 jours différents. Parce que j’ai pris des salles au conservatoire d’où je viens, et en même temps j’ai parfois tenté d’enregistrer chez moi aussi, mais en fait ça ne marchait jamais puisque j’étais chez moi et je n’étais pas dans le même esprit. Je dirais que j’ai fait 2 semaines, 14 journées d’enregistrement. Quand je dis 14 journées d’enregistrement c’était souvent une matinée par exemple ou une soirée, 3h, 4h maximum. Le pire que j’ai dû faire en termes de temps c’était 3h30-4h. Sinon, par exemple l’année dernière, j’ai postulé pour deux académies, et pour le coup ça m’a pris beaucoup moins de temps puisque je m’étais vraiment fixé un principe de ne pas faire trop de vidéos. Il y en a une que je n’ai même pas enregistrée avec mon matériel par pure flemme, j’ai juste enregistré avec mon Ipad. Du coup le son n’est pas terrible, il est ok on va dire. Là j’ai mis je dirais 2 ou 3 sessions d’enregistrement de 1h30 chacune. Vraiment pas beaucoup mais en même temps le programme était plus court, c’était vraiment 5 minutes de musique, ce n’était que des traits d’orchestre donc c’était beaucoup plus léger. Même si finalement les traits d’orchestre que j’ai envoyés sont individuellement plutôt très bons en termes de jeu, ça n’a pas suffi pour cette académie-là. Il y avait 4 ou 5 traits d’orchestre.

Quand tu dis que tu fais des balances, que tu chauffes en même temps et que tu retournes t’écouter, qu’est-ce que tu écoutes dans le son ? Quels sont tes critères ?

Alors déjà les basiques de ne pas saturer, parce que je joue d’un instrument qui peut jouer fort et qui peut jouer piano, et tout simplement de voir si les nuances sont cohérentes, essayer d’avoir un gain optimal et en même temps de ne pas prendre de risques non plus parce que ce serait dommage…

Tu fais ça à l’oreille ?

Non, avec le logiciel. Je regarde simplement sur le logiciel si je sature, oui des fois à l’oreille tu entends que tu es à la limite et tu vois simplement avec ton fader sur Protools que tu es à -2dB ou -1,5dB. Tu te dis que tu n’as pas forcément joué au plus fort de ce que tu peux faire, il faut peut-être prendre une marge, ce ne sera pas perdu. Et sinon en terme de son pur, je cherche la même chose que ce que je recherche quand j’écoute des gens, parce que quand tu t’auto-écoutes en jouant c’est différent, mais je recherche une homogénéité de timbre, si je retrouve les qualités qui me plaisent dans mon son, si ce n’est pas trop frontal aussi, et ça l’est forcément comme c’est en mono. J’essaye de trouver la qualité de son que je recherche quand j’écoute quelqu’un qui joue seul de la trompette.

En présentiel pas en enregistrement ?

Oui, j’essaye de comparer ce que je peux entendre en présentiel en prenant aussi en compte que je n’ai pas toute la salle. Comme c’est du mono il y a beaucoup moins de salle dans le son, c’est plus sec donc il faut accepter que tu ne peux pas avoir le même son que si tu écoutes quelqu’un jouer dans la salle dans laquelle tu es en train de jouer. Mais oui, globalement une qualité de son, simplement ça, que le son soit chaud et en même temps pas trop gras non plus, c’est une question de timbre.

Quand tu dis homogénéité du timbre c’est homogène entre quoi et quoi ?

Ça c’est plus par rapport à la manière dont je joue peut-être. Par exemple, si tu entends un peu plus d’air dans le son, que tu as un timbre très présent, ça veut dire que ta langue est un peu trop montée. Ce sont des choses que tu entends beaucoup moins dans une salle puisque c’est noyé. J’essaye d’adapter aussi un peu mon jeu par rapport à l’enregistrement parce que ça ne va pas sonner pareil que quand je suis dans une salle de concert où il y a 9 secondes de réverbération, même si ça se rajoute après.

Comment adaptes-tu ton jeu à l’enregistrement ?

L’adapter c’est un grand mot. Disons qu’au-delà d’adapter, l’enregistrement durcit les traits, souligne les trucs que tu fais. Si ton son est un peu aigre quand tu joues, c’est à dire beaucoup plus d’harmoniques aiguës par exemple, cela signifie en trompette que ta langue est plus haute dans ta bouche qu’elle ne devrait l’être, ça peut servir pour certaines pièces, certains moments. Ça, tu ne l’entends pas forcément dans une grande salle quand tu joues, et ton professeur ne va pas forcément l’entendre. Il va l’entendre mais beaucoup moins. Par contre quand tu t’enregistres ça va être beaucoup plus évident que c’est trop. Du coup, au-delà d’être une adaptation, ça peut être un outil pour remarquer ce que tu ne fais pas bien quand tu joues dans une grande salle. Et c’est vrai que globalement, tu vas avoir tendance à aller chercher un timbre beaucoup plus sombre quand tu enregistres en mono, à faire ressortir le plus possible les harmoniques graves, parce que naturellement dans notre instrument les harmoniques aiguës sonnent très métalliques, ce qui marche bien dans une grande salle, mais beaucoup moins bien avec un micro en prise de son de proximité.

Tu as déjà fait de la post production ? Du montage ou du mixage ? Tu as parlé de faire des EQ.

Oui j’ai déjà fait les deux. Le montage pour mon utilisation de trompettiste peu, ça m’est arrivé de faire un, deux ou trois points rapidement. Des EQ et mettre une réverbération oui. Je fais souvent vérifier ça par des gens qui savent le faire, mais j’aime bien essayer de le faire. J’ai déjà fait du montage et un peu de post-production pour m’amuser, pour moi, pour faire des maquettes un peu plus RNB où pour le coup je chante. Je travaille un peu plus sur ma voix mais absolument rien de professionnel ou de comparable à un très bon travail. J’aime bien expérimenter plutôt pour m’amuser et essayer d’acquérir des compétences. Si d’aventure je voulais sortir une chanson par exemple, je pense que dans tous les cas je demanderais à quelqu’un dont c’est le métier de passer derrière moi, ou alors de faire un montage carrément et un mix avec ce que je lui enverrais, de sorte à avoir un truc beaucoup plus qualitatif parce que j’estime que je suis capable de faire des maquettes correctement mixées on va dire, qui ne sonnent pas mal, mais chacun son métier.

Quand tu fais des EQ c’est pour corriger quoi ?

Pour la trompette plus l’aigreur du son justement, le côté métallique du son. Dans l’ordre : pour enlever les fréquences graves un peu polluantes qui ne sont pas forcément très intéressantes en dessous de 50Hz, il me semble que ça s’appelle un bypass. Après essayer de réhausser aussi un peu les harmoniques médiums justement, entre 400 et 800 Hz, et justement essayer de supprimer ces fréquences pas terribles un peu nasillardes, enlever quelques fréquences aux alentours de 3000, 4000, 5000 Hz selon la prise de son et ce que j’entends aussi.

Tu appliques toujours la même chose ?

Pour la trompette plus ou moins oui. Je fais en fonction de ce que j’ai, mais comme j’ai toujours le même micro et la même carte son et que j’obtiens toujours à peu près le même son, j’applique après plus ou moins ça, je fais les modifications plus ou moins aux mêmes points.

Tu fais aussi la postproduction sur Protools ?

Oui.

Toujours sur Protools ou tu as déjà essayé d’autres logiciels ?

Oui, j’ai fait quelques trucs un peu plus musique électro sur Cubase mais je n’ai jamais vraiment fait de post-production au-delà d’une réverbération, un EQ et à la limite un FX ou deux.

Sur de la voix ?

Oui ou sur un instrument électronique, vraiment pour les productions électro, pas sur la trompette.

Qu’est-ce qui t’a plu ou déplu dans le fait de t’enregistrer tout seul ?

Ce qui m’a plu c’est que c’est sympa d’être tout seul et pas dépendant de quelqu’un d’autre, tu peux expérimenter et c’est assez passionnant d’essayer plein de choses. C’est un peu un terrain de jeu illimité et si ça ne sonne vraiment pas bien ce n’est pas grave parce que c’est pour toi, tu peux vraiment aller dans les extrêmes. Ce qui m’a déplu c’est que tu peux vite te perdre en faisant ces trucs-là, et tu peux vite penser que certaines choses que tu fais sont essentielles et ne le sont finalement pas. C’est très facile de passer des heures à régler un truc et de se dire que c’est absolument ce qu’il te faut. Pour le coup, ça c’est beaucoup plus pour les maquettes que j’ai pu essayer de faire. Des fois, tu as l’impression que c’est ça qui va tout changer dans ta musique, tu passes 1h30 à régler un EQ sur un refrain et en fait ça ne marche pas parce que ce n’est pas ça. Et en fait, souvent, c’est que ta basse n’est pas bien réglée, c’est pour ça que ta voix ne ressort pas et ce n’est pas parce tu mets plus fort ta voix ou que tu changes les settings de ta voix qu’elle va ressortir plus, mais parce que tu vas faire un bypass sur ta basse ou parce que ta batterie n’est pas bien réglée. C’est facile de se perdre et du point de vue classique pour la trompette, pour moi c’est compliqué. Je n’ai jamais été extrêmement content d’un enregistrement que j’ai fait moi-même avec du bon matériel. Pas plus que d’un enregistrement avec un téléphone qui enregistre bien, avec un micro de qualité correcte où tu peux régler le gain ou alors avec un téléphone qui a un gain automatique correct qui ne fait pas des bypass de fou furieux de moins 18 dB sans que tu lui demandes quand tu joues un peu fort. Je n’ai jamais été vraiment beaucoup plus content d’un enregistrement que j’ai fait moi-même avec du matériel qui coûte beaucoup plus d’argent. Des fois tu poses un Iphone et finalement tu te rends compte que la vidéo est très bonne et que le son est pas mal, et qu’en mettant parfois juste un EQ sur le son de ton Iphone tu as un son qui est presque plus audible et agréable. Ça fait amateur ou en tout cas ça ne fait pas professionnel, mais c’est difficile de faire professionnel quand tu ne l’es pas. Certes, avoir le microphone devant l’instrument fait plus authentique mais ça peut aussi faire plus modifié. Quand on voit qu’il n’y a pas de micros sur l’image, que quelqu’un est sur une scène et qu’on comprend que c’est juste filmé par un téléphone ou une caméra, si le son est correct on se dit que c’est pas mal, au moins c’est naturel. Alors que si tu vois une vidéo avec quelqu’un qui a un micro, même un seul, alors que le son est bien, tu peux te dire qu’il y a de la post-production, c’est sûr. Alors que tu peux faire de la post-production avec un téléphone, ce qui est finalement stupide et qui n’a aucun sens, parce que tu peux faire la même post-production quelle que soit l’origine de ton son. Le signal de base n’est pas forcément de la même qualité mais c’est le côté qui me déplaît dans ce que je fais, et ça prend aussi beaucoup de temps à faire.

Qu’est-ce qui t’empêche de passer par un professionnel des fois ? Une envie de faire toi-même ?

Rien. Il y a eu une envie de faire moi-même à un moment, cela correspondait surtout au confinement où j’avais envie de m’amuser et de faire des maquettes. Ça m’a toujours plu et je me suis toujours dit que ça me ferait marrer de faire des trucs moi-même.

Et plutôt en enregistrement classique ?

Le confinement aussi. Le fait est que toutes les vidéos de concours ont connu un essor incroyable et démesuré avec le confinement et c’est encore le cas même si beaucoup de mesures sont levées voire toutes dans certains pays. C’est hallucinant la quantité d’académies qui fonctionnent par vidéo. Il n’y a presque aucune académie où tu dois faire un concours en vrai. Des fois c’est juste une phase de sélection, des fois c’est carrément le concours entier, tu gagnes un concours par vidéo. Ça existe, il y a beaucoup de concours par vidéo, et tu te dis mais qu’est-ce que c’est, est-ce qu’on fait de la musique ? Dans le classique je trouve ça un peu bizarre, pour présélectionner pourquoi pas. Du coup c’était parce que je me disais que comme ça c’est pratique, même si je suis tout seul je paye mon matériel à un certain prix et au moins je n’ai pas besoin de solliciter quelqu’un à chaque fois. Dans les faits, je sollicite quand même quelqu’un à chaque fois pour lui demander si ma post-production est bien ou pour lui demander de changer mon EQ parce que je n’arrive pas à le régler comme je veux. Le problème c’est que ça a un coût aussi de faire ça tout le temps, même si je ne paye pas parce que j’ai des relations qui le font très gentiment pour moi. En même temps, je suis aussi dans un esprit où même si je fais 5 ou 6 vidéos de concours par an je me sentirais très mal à l’aise de demander à chaque fois à quelqu’un qui est professionnel de faire ça gratuitement. Si je devais le payer je n’aurais pas les sous pour le faire donc je me débrouillerais autrement. Là je peux le faire, je l’ai fait l’année dernière pour m’inscrire à un concours où j’ai demandé à quelqu’un de m’enregistrer mais c’était exceptionnel. Je m’étais vraiment beaucoup préparé pour les enregistrements et on a fait ça en une ou deux fois 2h30, vraiment pas beaucoup de temps d’enregistrement pour deux pièces de trompette seule et je suis très content. Le son et la vidéo sont très bien, pour le coup ça fait beaucoup plus professionnel. Ce n’est pas encore le plus optimal parce qu’il n’y avait qu’une caméra qui était de bonne qualité mais qui aurait pu être encore mieux. Ça présente quand même très bien mais je ne me vois pas pour des académies où je n’ai pas beaucoup le temps, demander à quelqu’un de m’enregistrer le week-end prochain. C’est un peu par solution de facilité aussi.

Tu disais que tu te préparais mieux pour un enregistrement quand tu enregistres avec quelqu’un ?

Oui, c’est comme la différence entre un concert et un filage à un copain. Pour le filage à un copain tu lui demandes ça quand tu es en train de travailler. Tu lui dis : “eh, je peux te filer la pièce que je suis en train de jouer ?”. Ça n’empêche pas que ça peut déjà être très très bien, voire déjà parfait ou presque. Forcément tu te prépares et tu as la date. On va comparer ça plutôt à un concert et un filage que tu fais pour toi dans ta salle, tout seul. Le filage que tu fais pour toi, c’est un bon entraînement mais en même temps tu peux en faire autant que tu veux et tu peux en faire un par jour. Le concert, tu as la pression et le moment de te dire que c’est maintenant qu’il faut tout donner et jouer le mieux possible, tout de suite, aujourd’hui. Pas demain, pas après-demain, pas hier. Alors que le filage finalement, si tu joues très bien c’est cool, mais si tu joues un peu moins bien qu’hier tu te dis que tu es moins en forme. Donc forcément quand il y a un enregistrement où il y a quelqu’un, je me mets un peu plus de pression et j’essaye d’arriver en étant au taquet et de faire le mieux possible.

Pour quel genre de projets tu préfères passer par un ingénieur du son ou être autonome ?

Les concours un peu importants et les trucs un peu moins importants : les académies où je me présente un peu à l’arrache. Si on me dit qu’il y a une académie, la deadline c’est dans une semaine, les traits d’orchestre tu les connais, tu ne veux pas tenter, ça pourrait être une bonne expérience si jamais tu passes ? Ça, je vais avoir tendance à le faire un peu plus à l’arrache parce que je me dis que je n’ai pas sur-préparé le programme, je ne vais pas mobiliser quelqu’un pour enregistrer ça.

À quelle fréquence tu as besoin de t’enregistrer ?

Je dirais entre 5 et 10 fois par an.

Tu serais prêt à réinvestir dans du matériel, tu as des références en vue ?

Pas du tout, aucune référence en vue. Je vois un peu ce qui existe mais je n’en sais rien du tout. Et ce n’est pas du tout ma priorité, je pense que je le ferai dans un certain temps.

Est-ce que tu aurais envie de te former là-dessus ?

Oui j’aurais envie, ça m’intéresserait d’en savoir plus et de savoir le faire mais non, je n’ai pas le temps, j’ai beaucoup trop d’activités musicales pour avoir le temps de faire ça et disons que ce n’est pas non plus dans mes priorités de me dire tiens, si j’étais aussi ingénieur du son. Et comme je suis jusqu’au-boutiste, si jamais je le faisais ce serait pour m’y connaître, pas juste un peu. Là je me satisfais du fait de pouvoir faire un EQ tout seul et de pouvoir choisir une réverbération correcte pour faire ce que j’ai à faire et pour m’amuser à bidouiller des plugins sur ma voix et faire des choses marrantes mais c’est soit tout soit rien et là en l’occurrence ce n’est pas rien, mais ça me suffit.

À la fois pour la prise de son et pour entraîner ton oreille ?

Entraîner mon oreille pour le coup, faire de la direction artistique ça me plairait beaucoup si c’est la question.

C’était plus savoir écouter un enregistrement, reconnaître les défauts techniques du son, pour mieux savoir t’enregistrer toi-même.

Non, je n’ai pas le temps.

Entretien n°2

Le 20/10/2022

Comment avez-vous choisi les micros ?

Alors ce qui était déjà la première étape c’est qu’on a eu un cours de In house recording. C’est un week-end où l’on découvre le matériel dont la HSLU dispose. C’était en groupes, on a tous manipulé et ils nous montrent comment faire. Il y en a qui étaient dans la régie et d’autres qui étaient dans des salles en haut, donc on alternait les groupes entre ceux qui jouaient et les autres qui enregistraient. On a vite appris à brancher les trucs mais je trouve qu’on était beaucoup… Après je me suis dit qu’on allait enregistrer notre duo avec Florence⁶^,⁷, donc je suis allée voir Eric et Hervé⁸ en leur disant que j’avais envie de faire ça pour savoir de combien de microphones et de quel matériel j’avais besoin. Ils m’ont conseillé les micros, ceux qui sont tout fins, et après on a organisé une séance crash test avec mon ordinateur et les microphones et la carte son de l’école. Pendant la séance crash test on a branché les trucs, j’avais des souvenirs de comment ça fonctionnait à peu près mais on a galéré parce que le son dans le micro n’était pas activé. On a appelé Hervé qui est venu nous aider et finalement le copain de Florence qui s’y connait un peu est venu nous aider. En fait on avait du son dans le micro, c’est juste que ce n’était pas relié à la piste de Cubase.

Tu as une version gratuite de Cubase ?

Non, c’est la licence de l’école. Une fois que ça marchait, on a programmé le jour J. Le jour J on avait rendez-vous vers 9h-10h et on a dû finir vers 17h.

Comment as-tu réservé une salle ?

On a envoyé un mail à la Raum HSLU⁹ et c’est vrai qu’on s’y est pris un mois à l’avance pour réserver une salle pour le crash test et une salle toute la journée le dimanche, comme ça on était sûres d’être tranquilles.

Le jour J vous avez installé tous vos micros, ça vous a pris combien de temps à peu près ?

Je pense que ça nous a pris une heure parce qu’il y avait trois caméras avec. En fait il fallait d’abord installer la salle donc pousser tous les instruments, puisque c’était une salle avec deux pianos, une batterie et des enceintes partout, une Ensembleraum¹⁰. Donc tout pousser puis installer les micros je pense que ça nous a pris une heure et demi avec les caméras et après lier avec l’ordinateur et faire le check son pour régler la puissance.

Vous avez beaucoup écouté ce que ça donnait dans les micros ?

C’est le copain d’Isabelle qui nous a fait le soundcheck. On lui a fait confiance et une fois qu’on s’est enregistrées on s’est écoutées après chaque prise, mais c’est tout.

Est-ce que vous avez replacé les micros ?

Oui, après comme on a vu toutes les deux le piano c’était pas le…

Justement c’est intéressant, est-ce que sur le moment c’était bien ?

Non, on ne s’est même pas dit, on était tellement focalisées sur la qualité musicale qu’on pouvait faire que pour la flûte par exemple on ne s’est pas dit mince c’est peut-être un peu trop proche. On n’a pas replacé les micros.

Vous aviez un casque pour vous deux, trois ?

On avait deux casques, le copain d’Isabelle est venu le matin avec nous et après il n’était plus là.

C’était pour démarcher des festivals ?

Oui.

À chaque prise vous coupiez ?

À chaque prise on coupait tout, le son et les trois caméras et on écoutait, après on faisait un petit débrief musical, on était tout le temps avec la partition ou alors on faisait une pause mais on avait trop peur de dérégler des trucs donc on laissait tout allumé à chaque fois.

Vous avez mis de 9h à 17h, vous avez fait 3 prises complètes ?

Oui 3 prises complètes et après on a fait deux passages en deux prises à répéter en boucle en se disant qu’on pourrait peut-être l’utiliser.

Et ce n’était pas mieux ?

Quand j’ai réécouté je pense que c’était suffisant les trois prises qu’on a faites.

Vous avez fait les deux prises répétées en boucle après ?

On a fait ça entre la 2^e et la 3^e prise complète.

Après ça vous avez tout remballé, et vous avez fait d’abord le montage vidéo ?

Non, je suis allée voir Eric et Hervé en leur disant que j’avais ce montage son à faire, comment faire pour que ce soit un peu plus réverbéré ? Il m’a juste ajouté la réverbération et dit que je pouvais décaler les pistes à droite et à gauche. J’ai juste fait ces deux manips, plus à droite, plus à gauche et mettre la réverbération, essayer de jouer avec ça. Le soir même j’ai mis les vidéos par-dessus pour montrer à Florence le lendemain les trois versions qu’on avait. Là elle m’a dit que ça n’allait pas le son, que ce n’était pas cohérent avec la pièce, qu’il y avait trop de réverbération. Elle m’a dit que ce n’était pas complet ce que j’avais fait. Elle a appelé son copain qui a remis une réverbération plus naturelle, qui a égalisé, mis des EQ. Par-dessus j’ai refait le montage avec les vidéos zoom. Parce qu’il y avait une caméra centrale et par-dessus j’ai mis des petits zooms sur la version qu’on avait choisie. Et finalement on s’est dit que c’était trop dommage, et j’ai fait appel à toi pour faire le montage.

Et du coup c’est son copain qui a filmé les zooms ?

Non c’étaient juste les caméras qui étaient posées, elles étaient fixes.

En post-production tu as fait le zoom ?

Non, il y avait trois caméras fixes qui ne bougeaient pas, le zoom était déjà fait sur nous. Donc je n’ai rien touché à l’image, j’ai juste mis l’image au bon moment pour que ça corresponde et j’ai joué avec les zooms.

Et le logiciel tu avais appris à t’en servir au week-end de inhouse recording ?

Cubase ? Oui, entre guillemets, je ne sais pas le maîtriser.

Tu ne t’en es jamais servie à l’extérieur de ce cours ?

Du coup avec cet enregistrement oui. Je sais mettre les pistes, relier les trucs, tout ce que je sais faire c’est l’enregistrement mais l’après enregistrement je ne sais pas.

Si tu avais enregistré avec un ingénieur du son, qu’est-ce que tu aurais attendu de différent ?

Déjà le fait qu’il n’y ait plus cette charge de mettre en place les micros et les caméras, On devait couper puis regarder si tout était bien en place, enlever cette charge. J’aurais aussi attendu des retours entre les prises, très concrets : tu es trop forte, plus de phrasé. On était toujours le nez dans le guidon, je pense que ça nous aurait allégées que quelqu’un d’extérieur puisse nous guider.

Qu’est-ce qui t’a plu dans le fait de ne pas avoir d’ingénieur du son avec vous ? C’est juste la fierté de dire on l’a fait toutes seules, mais en vrai pas grand-chose parce que j’avais l’impression de ne rien maîtriser. Oui, il y avait des micros mais après coup, maintenant en en parlant avec toi et surtout en voyant le résultat on voit les détails qui sont importants et qu’on ne savait pas. Je dirais juste le truc de le faire toute seule, mais c’était hyper crevant.

Le choix de ne pas faire ça avec quelqu’un s’est fait de soi-même parce que vous ne connaissiez personne ?

Si, il y a un mec qui fait ça à l’école. Moi au départ je m’étais dit trop bien, j’ai envie d’apprendre à faire ça, comme ça je peux avoir cette carte dans ma valise et me dire ok, je peux faire ça toute seule. Mais en fait je me rends compte que c’est tout un monde et toute une formation qu’il faut avoir, et maintenant c’est ok de se dire que je préfère me concentrer sur la partie artistique et c’est ok de ne pas savoir tout faire. C’était un peu un truc de trop bien, je vais le faire toute seule et m’y intéresser. Je m’y intéresse mais je pense que c’était un peu naïf de me dire que je le ferais toute seule.

Maintenant si tu devais le refaire tu ferais autrement ?

Je pense que oui, je ferais avec quelqu’un. Je serais là pour installer parce je trouve ça trop bien de pouvoir en parler avec la personne et comprendre ce qui est bien : pourquoi le micro est mieux là, comment brancher ça… Mais je ne ferais pas ça toute seule, je ferais avec quelqu’un. C’était aussi une question financière. Mais maintenant qu’on voit le résultat, tout est léger, on se dit que bien sûr, ça vaut le coup de faire appel à quelqu’un et de payer, c’est évident. Il y a une raison pour laquelle ces gens sont là. Autant mettre de l’argent pour éviter un poids sur la journée.

Tu n’as pas besoin de t’enregistrer souvent ?

Si, je m’enregistre souvent, je le fais de plus en plus pour travailler parce que je vois les bénéfices. J’ai un Zoom H4 avec lequel je m’enregistre. D’ailleurs il y a des réglages à faire, quand tu joues fort le son se réduit, et quand tu joues piano ça augmente. J’utilise souvent ça pour les rodages pour m’enregistrer mais je vois de plus en plus l’utilité de s’enregistrer. C’est juste pour moi toute seule, ça ne devient jamais un matériel pour montrer aux gens.

Ça fait combien de temps que tu l’as ton Zoom ?

Ça fait depuis 2018 ou 2019.

Tu avais dû faire des vidéos de concours pour rentrer ici ?

Oui.

Tu avais fait ça au Zoom ?

Non, j’avais fait avec un appareil photo, il y avait un micro branché dessus. Comme ils ne voulaient pas de montage j’avais peur d’enregistrer le son et puis de mettre l’image dessus.

L’appareil photo et le micro sont à toi ?

Oui, à mon père.

Tu vas devoir te réenregistrer pour faire des entrées en master ?

Oui, ou même pour ma documentation personnelle, c’est vrai que ça fait une différence quand tu veux jouer à un endroit. Ça fait la différence quand tu envoies un dossier avec au moins une petite vidéo de ce que tu sais faire.

Tu as déjà investi dans du matériel donc ?

Oui, le Zoom H4.

Est-ce que tu serais prête à investir dans du matériel ou ça te semble inutile ?

Oui, j’aimerais bien avoir cette possibilité de pouvoir enregistrer sur le long terme, carrément. Même pour créer des sons, pendant un moment je rêvais d’aller dans les forêts et d’enregistrer les bruits de la nature et de faire un montage après pour créer. Je pense que quand tu enregistres un truc dans un but professionnel, le fait qu’il y ait un regard extérieur c’est hyper important en fait. C’est ce que je m’imagine et j’ai l’impression que même pour les CDs ça se passe souvent comme ça. C’est bien de faire la part des choses entre l’artiste et celui qui s’occupe du son.

Est-ce que ça t’intéresserait d’avoir un apprentissage pour mieux écouter et reconnaître les défauts d’un enregistrement ?

Oui carrément, pour comprendre. C’est une autre façon d’écouter, je ne pensais pas du tout.

En t’enregistrant tu arrivais à faire la part des choses entre le son et ce que tu jouais musicalement ?

Oui, je trouvais que c’était hyper sec et je m’inquiétais de mince, est ce que je joue sec ? Mais même quand je m’enregistre toute seule c’est vraiment super sec, est-ce que c’est vraiment mon jeu, l’acoustique ou le micro ? Je pense que je ne sais pas faire la part des choses.

Et tu arrives à retrouver ton son, les graves, les aigus ?

Oui avec le Zoom H4 ça donne une bonne idée de si c’est dur, ample, rond. Mais c’est souvent très sec et en plus comme on est hyper dur avec soi-même je ne sais pas si je suis vraiment objective. Je pense qu’il y aurait un effort de mon oreille à faire, même entre ce qu’il se passe sur le moment, quand je joue, et après quand j’écoute. C’est intéressant, est-ce que le son quand tu le produis et quand tu l’écoutes il doit sonner pareil ?

Entretien n°3

Le 06/01/2023

Est-ce que tu peux te présenter rapidement, dire ton instrument, ton niveau, ton école ?

Je joue de l’accordéon à la Haute école de Lucerne, je suis étudiante en quatrième année de Bachelor parce que j’ai rajouté deux semestres.

Tu t’es déjà enregistrée toute seule ? C’était pour quoi, dans quel but ?

Une fois pour m’enregistrer pour pouvoir participer à une masterclass, et en fait ça m’est déjà arrivé d’enregistrer pour des compositeurs qui demandaient des improvisations pour un projet. J’ai dû m’enregistrer en train d’improviser et après ils ont utilisé les enregistrements. C’est arrivé 2-3 fois avec des compositeurs.

Ils en font quoi après des improvisations ?

La première fois je crois qu’il voulait de l’inspiration. Il a utilisé les improvisations pour faire des compositions avec, c’était le concept de sa pièce. Et avec un autre compositeur on devait enregistrer des sons spéciaux avec notre instrument et après il utilisait les sons, il a fait une tape électronique à côté. On jouait avec dans la pièce, il avait aussi écrit des parties à jouer pour nous en plus de l’enregistrement.

Pour ça c’est toi qui t’es enregistrée ?

Il nous a demandé de nous enregistrer nous-mêmes.

Et dans les deux cas comment tu as fait ?

Je ne sais pas quel est le modèle mais j’ai un Zoom que j’ai acheté parce que j’ai vu plein d’étudiants à la Haute École qui les utilisaient pour s’enregistrer. Tu sais, ça ressemble un peu à un téléphone avec les micros croisés. Du coup je l’ai acheté, je me suis dit que j’allais sûrement m’en servir. Pour la masterclasse j’ai utilisé le Zoom pour le son et mon téléphone pour la vidéo et puis sinon seulement le Zoom pour les deux autres.

Tu l’as placé comment par rapport à toi ?

C’est vraiment un problème. Une fois j’ai demandé à un copain de venir enregistrer pour moi parce qu’il a un Zoom et qu’il le connaît bien mais sinon je ne vais jamais lire les réglages assez loin. Je suis un très mauvais exemple. Je sais que tu peux faire le réglage le plus basique, c’est juste de baisser ou de monter le son sur le côté. Donc je faisais des petites prises et après j’écoutais avec un casque pour voir si c’était trop fort. J’ai aussi fait un enregistrement avec chanteur et clarinette, aussi avec le Zoom et la vidéo avec le téléphone.

Vous étiez trois à jouer en même temps ?

Oui. On avait un peu peur de la clarinette et de la chanteuse à cause de ça justement, que ce soit trop haut et que ça pète un peu dans les aigus. Du coup, là on avait vraiment beaucoup fait de réglages sur le côté pour être sûrs que la chanteuse soit bien.

C’était pour quoi ?

C’était pour un festival, on voulait se présenter pour ce festival et on devait envoyer des vidéos.

Vous avez réussi à avoir un niveau où personne n’était au-dessus ou en dessous des autres ? Vous avez trouvé un équilibre ?

Oui, on a quand même un peu bidouillé. On était dans la salle des clavecins, on avait une grande salle donc on s’est mis très loin de l’enregistreur et on a un peu triché en se disant que, comme moi j’étais probablement la plus forte, je me mettais au coin de la salle, le plus au fond, puis après la clarinette, puis après la chanteuse. On a un peu essayé de jouer avec la salle et avec la distance par rapport à l’enregistreur. Mais franchement l’enregistrement n’était vraiment pas fou.

Est-ce que pour documenter je peux récupérer un enregistrement ?

Oui, il faut que je regarde si je retrouve ça sur mon ordinateur. C’est juste que l’enregistrement avec chanteur et clarinette on l’a un peu modifié sur GarageBand.

Donc tu n’avais jamais utilisé le Zoom avant de l’acheter ?

Non mais on l’avait déjà utilisé sur moi.

Et tu avais entendu le résultat ?

Non.

Tu dirais que tu as passé combien de temps à t’écouter pour faire les réglages avant d’enregistrer ?

Je ne sais pas, c’est dur à dire. Toute seule je prends beaucoup moins de temps qu’avec les autres et en fait j’ai compris qu’il fallait le faire un peu après, quand j’ai fait la musique de chambre. Quand je le faisais toute seule je me mettais simplement loin, ça dépendait des salles mais je me mettais simplement le plus loin possible. Et puis je ne faisais pas trop attention aux réglages, c’est plus avec le chanteur que j’ai commencé à faire attention aux réglages. Du coup combien de temps c’est un peu dur à dire, j’imagine quand même à chaque fois une bonne demi-heure. En groupe quand même 20 bonnes minutes.

Est-ce que quand tu réécoutes tu reconnais le son de ton instrument ? Qu’est-ce que tu penses du son ?

C’est une bonne question, je n’ai jamais trop fait gaffe.

Si ça ne t’a pas frappé, peut-être que tu reconnais le son ?

En tout cas les enregistrements que j’ai dû faire c’était à chaque fois quelque chose que je devais faire puis donner à quelqu’un après, donc peut-être que j’ai moins fait attention à me demander comment le son était vraiment, donc je ne sais pas trop.

Quand tu dis que tu le donnes à quelqu’un d’autre, c’est quelqu’un d’autre qui a justement fait les trucs dans GarageBand ?

Alors avec la chanteuse et puis le clarinettiste oui, c’est le clarinettiste qui a fait la chose sur GarageBand et sinon pour les compositeurs c’est eux qui ont modifié l’audio. Je ne sais pas ce qu’ils ont utilisé, certainement pas GarageBand.

Du coup toi tu n’as jamais retouché le son. Et tu utilisais quoi pour t’écouter justement, tu as quoi comme casque ?

J’ai utilisé les casques de la Haute École et sinon c’étaient les casques d’autres personnes. Parce que moi j’ai acheté seulement récemment un casque.

Est-ce que tu considères que tu as passé beaucoup de temps à placer le micro, à t’enregistrer toi-même, à faire tout ça ou pas ?

Ça dépend ce que ça veut dire beaucoup de temps pour toi, mais ça prend quand même son temps. À chaque fois je me dis qu’en 45 minutes c’est joué mais c’est si jamais j’ai 45 minutes. Si vraiment on veut faire un bon truc il me faut quand même presque deux heures pour être sûre d’avoir une version ou les réglages sont vraiment bons, et où moi je fais une bonne version aussi.

Comment tu gères ? Tu fais une prise en entier du morceau et après tu réécoutes, comment tu fais ?

Non je faisais juste les réglages au début où on ne jouait presque rien. Soit le début soit les moments les plus forts ou les moins forts. Mais pas la pièce en entier non. Après la première fois on écoute et si le son est bon on fait juste des versions pour y aller.

En boucle ?

Oui, pour avoir une bonne version.

Et dès qu’il y en a une qui est bonne vous arrêtez ?

Ça dépend, toute seule je n’avais pas fait comme ça, j’avais fait plein de versions que j’avais d’ailleurs fait aussi sur plusieurs jours, pas les mêmes enregistrements. Mais avec un groupe c’était plus compliqué parce qu’on n’avait que ces heures-là pour se voir donc on a fait jusqu’à ce qu’on doive partir.

À la fin vous étiez fatigués ou ça allait ?

Ça va parce qu’on n’avait pas eu trop de temps. Donc ça va.

Et tu penses qu’en ayant eu quelqu’un avec vous ça aurait pris plus ou moins de temps pour faire les réglages ?

Ah, moins de temps.

Et plus ou moins de temps pour gérer la séance, conduire ?

Je pense moins de temps aussi parce qu’en fait ce qui est un peu embêtant, en tout cas en musique de chambre quand on a fait ça, c’est qu’il y en a un qui va écouter et puis moi qui suis accordéoniste je dois à chaque fois poser l’instrument, aller jusqu’à l’audio et remettre l’instrument, c’est un peu demandant quand même… Donc je disais à chaque fois aux autres qui n’avaient pas l’instrument d’aller voir eux. Au bout d’un moment il y a tout le temps quelqu’un qui me disait d’écouter aussi pour me dire si ça me plaisait, du coup il fallait quand même se lever et y aller. S’il y a quelqu’un à qui on fait confiance, je trouve que c’est clairement plus agréable.

Quelqu’un que tu connais ou tu ferais aussi confiance à quelqu’un que tu ne connais pas ?

Ça m’est un peu égal tant que la personne connaît bien le Zoom peut-être.

Et la musique, est-ce que tu attends des avis musicaux ou pas ?

Non, pas forcément, je ne crois pas ou en tout cas oui alors peut-être au niveau de la balance. Après ça c’est lui qui gère peut-être avec le Zoom en disant : « toi joue peut-être un peu plus et toi avance un peu plus ou un peu moins”.

Pendant le morceau ?

Non pour les réglages. Enfin peut-être que c’est musical du coup.

Et si vous aviez eu le choix par exemple pour la musique de chambre, vous l’auriez fait avec un ingénieur du son ou non ?

Ah oui.

C’était par simplicité ?

Parce qu’on ne voulait pas payer pour ça. Et c’est plus simple à organiser juste entre nous que d’organiser avec quelqu’un en plus. Et parce que je ne sais pas combien ça va coûter.

Si tu voulais tu saurais à qui demander ou pas pas ?

Pas vraiment. À la Haute École oui mais si c’est en dehors de la Haute École pas tellement.

Est-ce qu’il y a des projets que tu ferais plus toute seule et des projets que tu ferais plus avec un ingénieur du son ?

Oui, je dirais que ça dépend de la qualité de l’enregistrement que je veux avoir. Et ce que je fais de l’enregistrement après. Si c’est juste pour pouvoir participer à une masterclass je pense que mon Zoom est suffisant. Si c’est pour envoyer une improvisation à des compositeurs qui ont l’air de ne pas avoir de matériel, ça me parait aussi suffisant. Mais je ne sais pas, si c’est pour mettre une vidéo sur le site que j’aurais par exemple, là je pense que je ferais la chose différemment.

Et tu attendrais de l’ingénieur du son vraiment un travail du son et pas du tout une aide musicale ?

Je ne pense pas non.

Ni de te dire que tu es fatiguée, que tu as besoin d’une pause ?

Je ne serais pas contre mais j’imagine que je m’en rendrais compte moi-même. Je ne veux pas non plus que ce soit un truc où on ne se parle pas mais j’imagine qu’il fait le son et que moi je fais la musique.

Tu as besoin de t’enregistrer à quelle fréquence ? Pendant tes études ça t’arrive beaucoup ?

Oh non, vraiment pas beaucoup.

Tu as l’impression qu’à l’avenir ça va évoluer ?

Quand même plus, j’utilise mon Zoom régulièrement quand même, mais régulièrement c’est peut-être tous les trois mois. Je trouve que je l’ai rentabilisé parce que je l’ai quand même utilisé plusieurs fois.

Est-ce que ça te convient ou à terme tu penses acheter plus de matériel ?

Alors je réfléchis actuellement à une caméra pour pouvoir les mettre ensemble, le Zoom et la caméra, pour avoir une belle image. C’est vrai que pour les vidéos, là je suis en plein dans les concours d’entrée, ce n’est pas si grave mais je me dis qu’avoir une bonne caméra ça peut être pas mal pour après. Enfin je me dis que la Suisse c’est encore facile quand tu es chez toi, mais quand tu vas dans d’autres pays c’est peut-être bien d’avoir une qualité d’image en plus du son. Donc je suis en train de réfléchir à ça en ce moment.

Et ton casque c’est quoi comme casque ?

C’est un Bose. C’est pour le Bluetooth.

Tu l’as choisi ? Quels étaient tes critères ?

C’est d’être tranquille dans le train.

Donc réduction de bruit ?

Oui.

Est-ce qu’éventuellement, si tu avais accès à un petit module de formation pour savoir écouter, placer ton Zoom, est-ce que tu serais intéressée par ce genre de choses ?

Oui, j’en ai déjà fait un peu pour amplifier un concert live. C’est juste qu’on a fait ça sur trois jours et évidemment après tu oublies tout.

La formation de l’école ?

Oui. Mais franchement je ne saurais plus comment le faire. On a regardé les petites tables de mixage, je ne sais même plus comment le faire. Donc en soi oui à fond, je serais intéressée.

Quel genre de format tu trouverais intéressant ? Plutôt des cours en physique ou des vidéos sur Internet ou des applications ?

Je ne sais pas, peut-être moitié-moitié, quand tu as fini le cours tu as quand même un petit support si jamais tu as oublié justement. Que tu puisses avoir une vidéo ou

un dossier, quelque chose de très pratique qui peut vite réexpliquer comment refaire au cas où.

Donc d’abord avec quelqu’un et après avoir un support ?

Oui quand même.

Sur l’auto-enregistrement, le Zoom ou d’autres micros ? Est-ce que tu en aurais l’usage ou pas ?

Oui, j’avais aussi réfléchi une fois à m’acheter un micro voix, enfin avant je disais micro voix maintenant je sais qu’il y en a d’autres. Je ne saurais pas lequel prendre mais oui, je me dis que ça peut toujours être utile, mais pour l’instant je n’en aurais pas l’utilité. C’est juste que je me dis qu’il y aurait des trucs marrants à faire. Mais pour l’instant c’est tout.

Toi tu n’as jamais fait de post-production sur ton ordinateur ?

Ça m’est arrivé une fois sur iMovie pour me donner un petit peu de réverbération mais c’était vraiment nul.

Et avec ton Zoom tu t’enregistres des fois pour travailler ?

Non pas beaucoup et si je le fais je le fais avec mon téléphone.

Tu n’as pas tout le temps ton Zoom avec toi ?

Non.

Entretien n°4

Le 12/01/2023

Est-ce que tu peux te présenter rapidement ?

Je suis en dernière année de Bachelor en trompette à Lucerne, j’ai 19 ans.

Tu t’es déjà enregistré ?

Des examens pour des concours d’orchestre, pour le Verbier Junior¹¹ l’année passée.

Donc tu as fait une fois ?

Oui j’ai fait une fois, c’est la seule fois. Ça s’est mal passé d’ailleurs. Je n’aime pas trop faire ça… Tu commences à faire ces vidéos et tu es content mais en même temps tu sais que tu peux faire mieux. À la fin ça a été mais tu es toujours un peu frustré.

Tu as l’impression d’y passer beaucoup de temps pour essayer de faire mieux ?

Oui et des fois tu as l’impression de perdre du temps parce que tu te concentres sur des trucs un peu… À la fin ça avait été mais ça m’a pris deux mois pour faire une bonne vidéo.

Et pendant deux mois, tu as enregistré tous les jours ?

Tous les deux ou trois jours. Je faisais un jour une vidéo puis le lendemain je travaillais, enfin je l’écoutais et je travaillais sur ça mais à la fin le rythme était quand même… J’en faisais beaucoup plus à la fin parce que je me disais qu’il ne me restait qu’une ou deux semaines. Mais c’est toujours comme ça, on se dit qu’on a le temps et puis finalement j’ai envoyé la dernière vidéo que j’ai faite parce que je me suis dit que c’était presque la meilleure.

Et les jours où t’enregistrais, tu enregistrais combien de temps ? Tu faisais une prise ?

Oui je faisais une prise ou deux ça dépendait. Il y a un jour où j’en ai fait trois mais je ne sais pas… Tu les fais et puis ce que tu as fait faux tu le fais juste mais après tu fais d’autres trucs. Et c’est un peu bizarre, c’est pour ça que je préfère aller en live parce que tu fais l’examen et c’est fini, tu n’as pas besoin de repenser à ça. Mais là tu te dis que tu peux toujours faire mieux. En vrai ce ne sera jamais parfait, il y a toujours quelque chose qui ne va pas.

En faisant une ou deux fois maximum tu ne te sentais pas trop fatigué à la fin ?

Non ça allait, il fallait que je travaille aussi mes autres trucs parce qu’il n’y avait pas que ça. Il fallait que je travaille pour les cours de trompette, je faisais ça en parallèle. Mais si le programme durait quand même 15-20 minutes où c’est non-stop, si tu fais deux fois c’est quand même… Aussi psychologiquement tu es un peu fatigué après mais ça va.

Tu faisais ça à l’école ?

Oui je faisais ça ici. Je faisais ça toujours le soir d’ailleurs. Je commençais à 17h. J’arrivais, je m’échauffais et je faisais une fois, je l’écoutais peut-être, et si je n’étais pas content et que je savais que je pouvais encore en faire une je faisais, sinon je travaillais le reste.

Du coup pendant la journée tu travaillais ta trompette ?

Oui j’avais mes cours aussi. Je savais que je devais le faire alors…

Comment tu choisissais les salles, tu faisais en fonction de quoi ?

C’était un peu ça le problème parce qu’il y avait encore plus de problèmes de salles que maintenant. La salle n’était pas mon premier critère. Parce que je sais que si tu joues bien et que tu n’es pas dans une bonne salle tu peux quand même le faire.

Après c’est sûr ça change, d’ailleurs ma meilleure vidéo était dans la grande salle d’orgue, peut-être que ça a aidé, peut-être pas, je ne sais pas. Mais c’est vrai qu’au début je les faisais dans des petites salles, enfin des salles moyennes. Après je me suis dit que j’allais prendre des salles plus grandes et je faisais dans des salles plus grandes.

Donc tu cherchais surtout ce qui était libre et tu faisais un peu en fonction ?

Oui.

Et du coup tu as fait comment, tu avais un Zoom ?

Oui j’avais une caméra, je ne connais pas la marque, et je la raccordais à un Zoom. C’était bien, la qualité était bien.

C’est ton matériel ?

C’était mon matériel, oui.

Est-ce que tu prenais du temps pour placer ton Zoom ? Comment tu faisais ?

Je prenais plus de temps pour régler le son que l’image. Il y avait des critères comme d’habitude. Je prenais le temps qu’il fallait pour régler le son, pour régler la prise de son tu sais ?

Le gain ?

Oui le volume voilà ! Et après c’était presque toujours réglé. Mais au début ce n’était pas très bien. Au début c’était nouveau le Zoom pour moi donc c’était un peu bizarre, je le mettais un peu trop fort en fait. Et quand tu mets trop fort après ça envoie, alors après je le réglais tout le temps pareil et à la fin c’était bien.

Et par rapport à toi tu le mettais proche, loin ?

Je le mettais assez proche mais pas en face de moi, un peu sur le côté.

C’est quoi assez proche, c’est un ou deux mètres ? Plus ? Moins ?

Oui 2 ou 3 mètres.

Sur une table ?

J’avais un trépied pour la caméra et le Zoom je le mettais sur une table.

Tu réglais le gain et après tu écoutais ton son avant d’enregistrer ou pas ?

Avant de faire une vraie prise ? Alors j’allumais et je jouais quelques mesures et après j’écoutais. Mais après je n’avais plus besoin de faire ça parce que je savais que c’était bien.

Ok donc à la fin des deux mois tu n’écoutais plus ? En écoutant tu changeais quoi, le volume ?

Le gain oui.

Est-ce que derrière tu as rajouté une réverbération ou fait quelque chose ?

Non. Je n’avais pas envie de faire des trucs parce que je ne savais pas si c’était permis. Non je n’ai rien fait.

Quand tu réécoutes la vidéo est-ce que tu reconnais ton son à toi quand tu joues ? Non. C’est ça qui me dérange un peu aussi parce qu’en vrai c’est dur de se rendre compte… On n’est pas des professionnels alors si c’est toi qui le fais c’est dur de reproduire ton propre son.

Tu trouves que c’est comment par rapport à ton son habituel ?

Le son était plus… maigre. Ce que tu joues reste comme ça, bien sûr mais ton son est encore plus… Surtout dans les petites salles au début, quand tu t’écoutes en jouant tu te dis “ah c’est cool”, après tu réécoutes la vidéo et tu te dis “ah oui c’est ça… bon on va refaire”.

Plus agressif ?

C’est plus agressif oui. C’est plus agressif et en même temps le son est moins beau.

Tu arriverais à le décrire plus ou pas ? À décrire ce qui ne te plaît pas dans le son ? Je trouve que ça altère beaucoup tes qualités. Si tu as des qualités que tu veux montrer quand tu es en live, il y a beaucoup de choses qui ne sont pas là en fait. Aussi ta présence, ce n’est pas que le son, c’est un tout. C’est ça qui me dérange un peu, mais le son ce n’est pas facile… Déjà la trompette ce n’est pas le même volume que tu as en son qu’en live. Il y a quand même une sacrée différence.

En même temps quand tu écoutes un enregistrement de trompette est-ce que tu as cette sensation de grosse différence ou pas ?

Non, là non justement quand c’est un bon enregistrement tu te dis que c’est bien. Tu reconnais quand même un bon son de trompette. Mais quand tu fais des trucs seul c’est plus dur… Parce que je sais qu’avec un Zoom c’est possible de faire quelque chose de bien. Mais quand tu es seul c’est compliqué.

Tu mets ça sur le compte de quoi ? Du matériel ?

Non pas du matériel, je ne le connaissais pas trop au début, maintenant ça va mieux. Parce que je vais enregistrer des fois pour m’écouter comme ça. Pour mon récital j’enregistrais. Je jouais le programme trois fois par semaine. Maintenant ça donne bien mais au début, c’était l’année passée, je venais de l’acheter. Il y a beaucoup de paramètres quand même quand tu lis la notice d’emballage, il y a beaucoup de choses que tu peux faire. C’est génial mais il faut savoir les faire.

Comment ça s’est passé pendant deux mois avec ton professeur, tu avais des cours à ce moment-là ? Il t’aidait, ou il te disait de faire d’une certaine manière ?

Je lui envoyais les vidéos. Il ne critique pas la vidéo parce qu’on fait avec ce qu’on sait faire et ce qu’on a.

Mais je veux dire psychologiquement, parce que deux mois c’est long, est-ce qu’il t’a aidé ou pas ?

Alors musicalement il m’aidait dans les choses qu’il fallait améliorer oui. Mais à la fin il en avait marre. En fait, j’ai envoyé la vidéo un jour avant la fin des inscriptions. À la fin il m’a dit “fais ce que tu peux” et ça avait bien donné mais oui avec le recul je me dis que j’aurais quand même pu mieux faire. Mais on ne peut jamais savoir.

Et tu penses que si tu avais travaillé pendant deux mois et que tu avais fait 3-4 jours d’enregistrement avant ça aurait été différent ?

Ça aurait été mieux je pense.

Maintenant tu ferais comme ça plutôt ?

Oui parce que là je me dis que j’ai quand même perdu beaucoup de temps et d’énergie en enregistrement. Au final j’avais 20 et quelques vidéos. Ça fait beaucoup. Et à la fin je les ai éliminées… Et puis tu es aussi moins concentré, tu te dis : “ah oui je peux refaire”. Oui je pense que maintenant je travaillerais… Enfin comme tout le monde, presque tout le monde fait comme ça en fait. Maintenant je travaillerais bien mon programme, quitte à le jouer en entier mais sans enregistrer. Et après j’enregistrerais, pas juste avant mais je ferai des jours intensifs comme ça avant. Et puis j’enverrai la meilleure. J’en ferais plus par jour que ce que je faisais.

Et est-ce que tu as déjà essayé de t’enregistrer avec quelqu’un comme si t’avais du public ?

Non.

Tu as toujours été tout seul ?

Oui, j’aurais peut-être dû faire comme ça, je ne sais pas. Mais toujours seul.

Et tu penses qu’être avec quelqu’un, soit quelqu’un d’extérieur soit avec un ingénieur du son, ça peut t’aider ?

Oui clairement, quelqu’un comme toi aurait pu quand même donner des conseils et ça change tout. Même quand tu as un bon musicien qui est là, il t’en donne. À mon avis ça changerait.

Est-ce que si tu devais le refaire tu travaillerais avec un ingénieur du son ou pas ?

Oui clairement.

Pour tout type de projet ?

Pour tout oui, pour tout. C’est toujours intéressant d’avoir des commentaires et des retours sur ce qu’on fait.

Donc tu attends vraiment de l’ingénieur du son un retour musical ?

Oui parce qu’il sait ce qu’il dit.

Et un son qui te ressemble plus ou pas ?

Oui… Avec un ingénieur du son est-ce que je retrouverais mon son de trompette ? Oui je pense quand même. Alors pas à cent pour cent c’est clair mais plus que ce que j’ai fait.

L’ingénieur du son a aussi d’autre matériel que le Zoom, est-ce que tu penses que ça aide beaucoup de changer de matériel ou pas ?

Peut-être oui peut-être.

Est-ce que toi tu serais prêt à acheter autre chose ou tu préfères rester au Zoom ? Si quelqu’un me conseille d’acheter autre chose, pourquoi pas investir un jour. Mais après je suis quand même content de ce que j’ai. Maintenant j’ai quand même de l’expérience avec ce genre de choses, tu apprends, tu vois des trucs. Mais je pense que si je devais changer un jour je changerais oui.

Pour l’instant tu n’en as pas l’utilité ?

Oui pour l’instant ça va. Et puis je ne fais pas ça chaque mois…

Tu t’enregistres à quelle fréquence ?

Ça dépend des périodes, là j’avais mon récital il y a trois jours… Je me suis enregistré trois fois par semaine durant un mois. Mais je fais l’erreur pendant mon travail sans récital de ne pas souvent m’enregistrer. Il faudrait le faire plus souvent je sais… mais ce n’est pas facile.

Donc tu n’as jamais fait de post-production… Et s’il y a un an tu avais eu l’occasion de travailler avec un ingénieur du son tu l’aurais fait ou pas ?

Oui clairement mais je ne connaissais pas encore d’ingénieur du son.

Et avec quoi tu as l’habitude d’écouter ? Par exemple le Zoom tu l’écoutais avec quoi ?

J’avais un casque que je prenais ici. Ça ou bien des écouteurs pas très bien d’ailleurs. Avec le temps je me suis dit que c’était mieux de prendre ça. Parce que les écouteurs avec fil, les petits, ça sonne quand même moins bien.

Tu as déjà fait les modules de cours d’enregistrement ?

Oui, en deuxième année, en septembre 2020. C’est un module Inhouse recording. C’était surtout pour nous apprendre les opportunités qu’on avait de faire de l’enregistrement de salle à salle dans l’école. Tu es dans la régie et tu peux t’enregistrer dans une salle. Après je n’ai jamais essayé de le faire ça parce que c’est compliqué quand tu dois réserver les deux salles et je me suis dit qu’il y a des gens qui en ont plus besoin que moi. Et c’est compliqué, franchement c’est compliqué.

Tu as des souvenirs de cours ou tout t’es sorti de la tête ?

Pas tout m’est sorti de la tête mais 95 %.

Qu’est-ce que tu as retenu ?

J’ai surtout retenu ce qu’on pouvait faire mais après ça allait très vite, c’était en suisse allemand alors c’était compliqué. D’ailleurs c’était ma 2^e année je parlais encore moins bien que maintenant. Alors c’était dur et ce n’était que des suisses allemands qui parlaient entre eux et puis toi tu es là et tu ne comprends rien. Alors je faisais les exercices qu’ils nous demandaient. On devait s’enregistrer dans une salle et puis eux ils faisaient… mais c’était… je ne comprenais rien. Alors avec le recul je me dis qu’en français ça aurait été intéressant ce cours parce que c’est quand même bien fait ce qui est là. Mais non je ne saurais pas te dire un truc…

Et ils vous ont donné des fiches ou ce n’était que de l’oral ?

Non ce n’était que de l’oral. C’était deux week-end de suite, non un week-end complet samedi-dimanche. Je n’en pouvais plus, j’étais fatigué. Et c’était au début, je ne connaissais personne ici. Il y avait beaucoup de jazz en fait. C’était notre première semaine dans ce bâtiment et on ne se connaissait pas avec les jazz, si j’étais avec des gens de classique ça aurait été mieux mais j’étais là avec ma trompette, il fallait improviser… Alors je pense qu’il s’est amélioré le cours. Enfin je ne dis pas que ce n’était pas bien mais il s’est amélioré parce que des gens y sont allés et il parait que c’était bien. Avec ce cours tu as accès à des micros apparemment ?

Oui à du matériel.

Mais je n’ai jamais… On ne sait pas où c’est. Je sais que c’est sur Internet mais je n’ai jamais… je n’ai même pas pensé à ça parce que je savais que c’était compliqué. Toi tu sais comment ça marche ?

Non, je n’ai pas fait le module. Mais du coup qu’est-ce qui t’a poussé à acheter le Zoom ?

C’était un cadeau. Non ce n’est pas vrai, j’avais gagné un concours en Valais, j’avais gagné un bon de trois cents francs et il coûtait deux cent et quelques francs, je me suis dit j’achète ça et ça va servir. Et ça a servi.

Et niveau formation, si par exemple ils refaisaient la même chose en français, toi tu irais ?

Oui clairement parce que ça m’intéresse mais quand même avec un autre plan de formation, plan de du cours… J’attendrais qu’on reçoive un dossier, quelque chose d’écrit. Il y avait quelque chose d’écrit sur le tableau, une présentation Powerpoint. Et c’est les deux profs d’informatique, ils sont très gentils mais ils parlent vite suisse allemand alors je comprends le suisse allemand mais pas ce qu’ils disent, c’est compliqué. C’est des trucs qu’on ne connaît pas déjà en français alors en plus en suisse allemand…

Du coup tu attendrais de savoir comment utiliser ton Zoom ?

Mon Zoom et puis d’apprendre d’autres choses aussi. Parce que je sais qu’il y a plein d’autres micros, tout en fait… Aussi comment placer le micro. Enfin ils nous ont tout expliqué, c’est compliqué. On faisait de la pratique mais on a fait ça deux jours et après plus rien.

Si tu devais faire une formation là-dessus tu préférerais en physique ou par vidéo ?

En vrai.

Et acheter un livre par exemple ? Tu préfères passer par quelqu’un ?

Oui c’est mieux.

Tu n’as pas eu non plus besoin d’enregistrer pour rentrer dans des écoles ?

Non parce que j’ai eu la chance de rentrer avant le Covid et ça n’existait pas tellement avant. Je suis rentré en 2019. Là je vais faire des concours d’entrée en Suisse dans des Hautes Écoles et mon critère principal, parce que toutes les écoles me plaisent en général, mais mon critère principal c’est que si c’est en vidéo je n’y vais pas. Parce que je n’aime pas du tout. Alors c’était une expérience mais je ne la referai pas. Je voulais aller à Genève mais c’est par vidéo alors…

Et si un jour il y a un concours d’orchestre que tu rêves de faire par vidéo ?

Ah je le ferai bien sûr. Quand j’ai le choix je ne fais pas. Mais je sais qu’un jour ce sera la norme. Parce que maintenant ce sont des exceptions les hautes écoles qui ne demandent pas ça. Là je vais à Fribourg et ils ne demandent pas ça heureusement, mais c’est parce que le prof n’aime pas ça. Heureusement parce que je n’aime pas ça. Quand je suis sur Muvac et que je regarde les postes d’orchestre si c’est par vidéo je ne regarde même pas. Parce que je trouve que tu perds beaucoup de temps.

Tu te dis que ça va te reprendre deux mois ?

Oui.

Même si tu te dis que tu fais ça avec quelqu’un ?

Oui parce que finalement c’est toi qui fais 90 % du travail.

Tu ne te prépares pas pareil quand c’est par vidéo ou en vrai ?

Non.

C’est quoi la différence ?

Quand c’est en vrai tu fais encore plus de travail psychologique, enfin plus de travail mental, que tu n’as pas besoin de faire là.

Par rapport au stress ?

Oui parce que là tu n’as pas de stress, de ce côté-là c’est peut-être mieux. Mais moi j’aime bien ce stress de se dire que c’est maintenant que tu dois le faire, tu es capable de le faire et tu peux le faire. Mais là, à chaque fois que je fais une vidéo je me dis “oui, je la referai demain”.

Et justement travailler avec quelqu’un pour te dire qu’il n’est là qu’aujourd’hui ? Comme j’ai dit avant, si je devais le refaire je demanderais à quelqu’un de venir pendant 4 jours pour faire à fond parce que c’est mieux. C’est quand même plus efficace de travailler comme ça parce qu’à chaque fois, si tu te dis que pendant deux mois tu vas faire une vidéo tous les deux jours, je n’ai pas fait les calculs mais tu en as énormément et tu dois choisir. Si tu pouvais coller les mesures entre elles ça irait mais on n’a pas le droit de faire ça. Et c’est aussi le fait d’être seul, il n’y a pas de piano. Alors il y a certains concours où c’est avec piano mais la plupart du temps c’était seul. Tu dois enchaîner une pièce et plusieurs traits d’orchestre, 4 ou 5 traits d’orchestre. Si tu devais faire ça dans un récital ce ne serait pas très long, ce serait comme un concours normal. Mais si tu fais ça tu es seul, tu n’as personne qui t’écoute. Tu sais que tu vas l’écouter toi après. Moi j’aime bien ce stress de la scène. Je vis pour ça. Enfin j’aime bien me dire que maintenant je dois le faire et puis si je ne le fais pas ce n’est pas cool.

Tu aimes avoir un objectif précis ?

Oui mais là tu n’as pas d’objectif, tu as juste un objectif de faire une bonne vidéo mais tu te dis que tu as deux mois et après tu te retrouves trois jours avant et tu n’as rien. Alors non, si j’ai le choix je ne le fais pas.

Entretien n°5

Le 07/02/2023

Est-ce que tu peux te présenter rapidement ?

Je joue de la harpe et j’ai étudié à différents endroits, j’ai d’abord fait un Bachelor en Allemagne, après un Master performance à Londres et maintenant je fais un Master pédagogie à Lucerne. J’ai 26 ans.

Tu as le nom des écoles ?

Oui, en Allemagne c’était la Hochschule für Musik Karlsruhe et à Londres c’est le Trinity Laban Conservatory.

Tu as déjà une expérience, tu t’es déjà enregistré toi-même ?

Oui à cause du Covid j’ai dû faire plein d’enregistrements moi-même parce que les cours sont passés en live pendant le Master à Londres. Donc les examens et les auditions d’orchestre étaient par vidéo.

Donc à la fois pour ta prof, pour les concours d’orchestre et pour les examens ?

C’est ça oui.

Pendant toute la période du confinement ?

Oui quand ça a commencé, donc en mars 2020 jusqu’à la fin. Mon examen final c’était en juillet 2021 et là c’était encore des vidéos.

Depuis tu en as fait ou pas ?

Depuis j’en ai encore fait pour l’examen d’entrée que j’ai fait à Lausanne et Zürich, il fallait faire des vidéos. Et j’ai aussi enregistré des concerts, maintenant qu’il y a de nouveau les concerts, donc là c’est mon frère qui m’a aussi aidée à enregistrer.

À chaque fois que tu as un concert tu enregistres ou c’est de temps en temps ?

Non c’est de temps en temps. Là c’était un concert spécial où j’ai joué de la musique de chambre et c’était unique donc c’était pour avoir les morceaux.

Pour avoir une trace ?

Oui.

Si on retourne à Londres, comment tu faisais pour t’enregistrer là-bas ? Tu avais du matériel ? Tu avais quoi ?

Tout au début quand j’étais enfermée je n’avais rien, j’avais juste mon téléphone. Je faisais les enregistrements avec le téléphone et ce n’était pas très bien la qualité. Je me rappelle qu’on faisait aussi les cours par FaceTime, là on avait du mal à bien

avoir les sons aigus et tout le volume. Du coup après, quand j’ai pu rentrer chez moi, mon frère qui est dans le domaine du cinéma m’a conseillé de prendre deux micros, j’en mets un de chaque côté de la harpe. On a acheté les micros, c’était des Rode, quelque chose comme ça. Au début j’avais ces deux micros, je m’enregistrais avec ça et j’avais un une sorte d’appareil rouge où on branchait les micros et l’ordinateur.

Tu faisais avec quoi comme logiciel ?

Je ne sais plus, je sais que j’utilisais iMovie mais pour enregistrer je ne sais pas. Si tu as besoin je peux demander à mon frère, il doit savoir parce qu’il m’aidait toujours avec ces deux microphones

Donc comment ça marchait ? Tu les plaçais, tu écoutais ? Lui il était là dès le début pour t’aider ?

Il était là dès le début et il regardait quand je jouais le son le plus fort si ça ne saturait pas. Il m’aidait pour ça et après il partait.

Et est-ce que tu réécoutais pour voir si le son te plaisait ou pas ?

J’avoue que pas trop.

Et en réécoutant après est-ce que tu faisais un peu attention au son ou tu écoutais vraiment musicalement ?

J’écoutais surtout musicalement, j’étais très concentrée sur comment je jouais et si je faisais des erreurs. Je n’ai pas tellement fait attention mais je trouvais que c’était bien balancé.

Et comment tu faisais avec les deux micros, tu faisais un traitement ou tu prenais les deux sons et tu les superposais, est-ce que tu te rappelles ?

Il me semble que je les superposais.

Quand tu enregistres tu fais une prise et après tu écoutes ? Ou tu refais des prises jusqu’à être contente ? Comment ça se passe ?

Ça dépendait de mon humeur et de si j’étais stressée. Ça arrivait souvent que je joue plein de fois à la suite, jusqu’à ce que j’arrive à jouer une fois déjà sans fautes, après j’écoutais et je refaisais des prises.

Et par exemple quand tu as fait tes vidéos pour Lausanne ça t’a pris combien de temps ?

Pour Lausanne ce n’était plus avec mon frère, j’étais seule et j’avais une caméra Zoom avec les deux microphones au-dessus de la caméra. Là ça m’a pris… En fait j’ai fait chaque morceau séparément. Il y avait plusieurs morceaux à faire et j’avais plusieurs semaines pour le faire. Pour enregistrer un morceau ça devait prendre peut-être un jour ou deux.

Donc tu travaillais et quand tu te sentais prête tu enregistrais ?

Oui c’est ça, c’était plutôt vers le soir que j’enregistrais et je faisais plusieurs prises, ça pouvait durer une ou deux heures. Après, le lendemain si je me sentais de refaire ce morceau ou que j’avais l’impression que ce n’était pas tellement bien le jour d’avant, je refaisais ce morceau. Après je passais au suivant.

Mais tu travaillais tous les morceaux ensemble ?

Ça dépendait de la situation. Pour cette situation-là il y avait un morceau que je travaillais vraiment à fond une semaine peut-être et je travaillais encore un petit peu les autres. Le jour de l’enregistrement je ne travaillais que ce morceau et je l’enregistrais quand je me sentais bien.

Tu avais combien de morceaux ?

Je crois que c’était quatre morceaux.

Donc ça t’a pris un mois ?

Oui.

Et dans d’autres situations ?

Il y avait aussi la situation de l’orchestre, il fallait enregistrer plusieurs traits d’orchestre à la suite donc je les travaillais tous dans la même journée.

Tu as enregistré tout en une fois ?

On était obligés d’enregistrer tout sans couper.

Tu as pris une soirée, et en une soirée tu avais quelque chose qui te satisfaisait ?

Oui.

Pendant que tu faisais ces concours-là tu étais étudiante à Londres, est-ce que la professeure t’accompagnait dans ces enregistrements, tu lui envoyais ?

Je lui envoyais quand j’avais fait les enregistrements et elle écoutait. Aussi, quand je faisais les cours avec FaceTime ou Zoom et que j’étais chez moi en Allemagne j’avais les micros, donc là je ne sais pas comment c’était pour elle, si elle entendait à travers les micros, mais elle disait de les mettre plus loin ou plus près de la harpe pendant le cours pour l’enregistrement.

C’était une sorte de répétition pour enregistrer ?

Oui.

C’est elle qui t’a dit de te focaliser une semaine sur un morceau ?

Non ça c’est moi.

Et elle, elle n’a rien dit là-dessus ?

Non.

Pourquoi pour Lausanne tu n’utilisais plus les micros que tu avais achetés ?

Je ne sais pas, c’était plus simple pour moi en fait parce que c’est mon frère qui m’aidait à mettre la caméra avec les micros, à tout superposer. Et moi j’avais la caméra donc j’avais directement le son et l’image.

Et au niveau du son tu peux comparer ?

C’est quand même mieux avec les microphones qu’avec la caméra je pense mais c’était quand même de bonne qualité aussi.

C’est quoi pour toi qui caractérise la bonne qualité du matériel ?

Déjà que ça ne sonne pas métallique, que ce soit à peu près le son naturel qu’on entend soi-même quand on joue.

Quand tu t’enregistrais, tu étais tout le temps seule, il n’y avait jamais quelqu’un qui t’écoutait ou qui pouvait te guider ?

Non alors j’ai aussi fait des enregistrements dans un studio, où quelqu’un m’enregistrait mais en fait il ne me guidait pas.

C’était pour quoi ?

De nouveau c’est quand j’étais à Londres, on avait le droit d’enregistrer dans le studio pour ses examens. Je ne l’ai pas fait pour tous les examens, le studio n’était pas très libre puisque tout le monde voulait l’utiliser. Je l’ai fait pour deux morceaux. Là il y avait quelqu’un qui enregistrait et qui mettait aussi un peu de réverbération mais il ne disait rien.

Tu aurais aimé qu’il dise quelque chose ou pas ?

Oui peut-être.

Sur ce que tu faisais musicalement ou sur le son ?

Oui sur le son en fait.

Pour te dire de jouer plus d’une certaine manière ? Qu’est-ce que tu aurais attendu qu’il dise ?

Je ne sais pas, essayer plusieurs emplacements de microphones. Je ne sais pas si ça aurait été mieux plus loin ou plus près, on n’a pas trop essayé ça par exemple.

Et il t’a fait écouter, tu as validé ?

Oui.

Et après vous avez enregistré ?

Oui.

D’accord, donc peut-être que si tu avais dit que ça ne te plaisait pas vous auriez essayé ?

Oui.

Et c’est en temps limité ?

Oui, on avait le droit à 1h-1h30.

Tu avais combien de temps de programme ?

J’ai pris une heure pour un morceau, 10 minutes de morceau.

Et après c’est toi qui gérais comme tu voulais pour faire une pause ou enchaîner ?

Oui c’est ça. Après il m’a fait écouter, il m’a envoyé plusieurs versions et j’ai choisi.

C’était spécifique au Covid ou en temps normal dans cette école tu peux faire ça ? Oui, en temps normal tu peux enregistrer mais tu dois payer, ce n’est pas tellement, 20 francs pour une ou deux heures. Mais les enregistrements pour les examens étaient gratuits. Je ne sais pas si ce serait aussi gratuit hors covid. Je crois que c’était juste pour les examens internes.

Il y a un module de formation InHouse recording ici pour apprendre justement à utiliser des micros, est-ce que tu sais s’il y avait un équivalent à Londres ?

Je ne sais pas, ici je n’étais pas au courant donc là-bas je ne sais pas. Je crois qu’on avait juste eu des feuilles où il y avait écrit comment faire.

Tu pouvais emprunter du matériel ?

Oui je pouvais emprunter des caméras Zoom avec les microphones.

En Allemagne comment ça se passait quand tu devais enregistrer quelque chose ? Je n’avais pas encore fait d’enregistrement pendant les études de Bachelor. Si, j’avais fait un enregistrement, pour le concours pour faire un Erasmus et il y avait aussi un ingénieur du son, il a enregistré avec moi.

C’était dans l’école, dans le cadre de l’école ?

Oui.

Tu faisais une demande ?

Oui.

C’était pareil entre l’enregistrement en Allemagne et à Londres ?

Là ce n’était pas dans un studio mais dans une salle qu’on avait pour les concerts, donc il me parlait à travers un microphone.

Tu t’enregistres beaucoup pour travailler ou pas ?

Plutôt vers la fin, enfin vers la fin d’un morceau quand je le sais déjà plutôt bien et que je vais le jouer quelque part. Je l’enregistre pour voir si c’est vraiment comme j’ai l’impression que c’est.

Pour avoir un retour musical ?

Oui.

Et est-ce que parfois tu t’enregistres aussi dans le but de roder un concert par exemple ou de t’obliger à enchaîner ?

C’est vrai que je n’ai pas encore fait ça, mais j’ai remarqué que quand j’enregistre je suis plus stressée que si je n’enregistre pas, donc ce serait un bon truc à faire. Quand je joue pour moi et après quand j’allume l’appareil pour enregistrer je ne joue plus pareil. C’est comme si j’étais stressée de devoir jouer.

Est-ce que c’est le même stress que quand tu joues un concert ?

Pas tout à fait mais c’est une préparation.

Qu’est-ce qui est différent ?

Il n’y a personne donc c’est juste moi qui vais écouter après. Mais c’est quand même un peu comme s’il y avait quelqu’un. Ça met un peu la pression.

Est-ce que c’est une pression qui t’aide à jouer ou pas ?

Je pense que parfois ça ne m’aide pas, enfin c’est plutôt négatif, ça me stresse. Mais après quand j’essaye plusieurs fois et aussi quand j’écoute et que j’essaye d’améliorer ça m’aide, donc ça m’aide à mieux jouer.

Est-ce que quand tu joues pour t’enregistrer et que tu fais une erreur tu arrives à continuer ? Comment ça se passe ?

Je crois que je recommence. D’ailleurs je me rappelle qu’une fois on avait fait un concert online au conservatoire à Londres, donc c’était retransmis en direct. Il y a une autre harpiste qui a joué et elle a dit qu’elle avait tellement l’habitude de recommencer quand elle faisait une faute qu’elle avait aussi fait ça au concert.

Mais toi ça te gêne moins ?

Non non.

Est-ce que tu te prépares différemment pour un enregistrement et pour un concert ? Oui. Pour l’enregistrement déjà je ne fais pas tous les morceaux, pas tout le programme. Je suis vraiment concentrée sur un morceau. J’ai l’impression que comme je pense que je vais pouvoir recommencer plusieurs fois peut-être que je me prépare moins bien que si c’était un concert. C’est peut-être différent aussi si on fait un CD ou si c’est un enregistrement. En CD on n’a qu’un temps limité pour enregistrer ou alors si, on a tout plein de temps pour enregistrer.

Quand tu avais enregistré avec l’ingénieur du son en Allemagne il ne te faisait pas de retours non plus ?

Ça fait un peu longtemps mais il me semble qu’il me faisait des retours.

Musicaux ou sur le son ?

Je ne sais plus trop. Il me semble peut-être aussi musicaux, enfin de jouer plus ou moins fort, je ne sais plus.

Quand tu écoutes des enregistrements de harpe, est-ce qu’il y a des enregistrements où tu préfères le son et d’autres où tu aimes moins le son ou c’est quelque chose auquel tu n’es pas vraiment sensible ?

Sur les CD, entre les CD je n’ai pas vraiment remarqué de différence, enfin je n’ai pas vraiment fait attention. Mais par exemple si c’est un enregistrement d’un concert et un CD je préfère le CD parce que le son est plus beau.

Qu’est-ce qui fait que par exemple pour Lausanne, où tu enregistrais sans ton frère, tu as préféré travailler seule et pas avec un ingénieur du son ?

Je pense déjà au déplacement et au coût, et au fait de ne pas être limitée dans le temps aussi.

Il y a des projets pour lesquels tu préférerais travailler avec quelqu’un ?

Oui, pour enregistrer un CD, ou pour faire des bons enregistrements j’aimerais travailler avec quelqu’un.

Des enregistrements de concours, ou pour mettre sur internet ? Qu’est-ce qui fait que tu préfères faire un bon enregistrement ?

peut-être pour publier.

Pour les concours tu préfères faire seule ?

Ça dépend du concours aussi, si c’est un grand concours international je prendrais peut-être un ingénieur mais si c’est un concours d’entrée je ne pense pas. S’il y a beaucoup de gens qui peuvent l’écouter, j’aurais plus tendance à aller chez quelqu’un que si c’est juste pour un jury.

Les micros, tu ne t’en sers plus trop ?

Je vais peut-être de nouveau m’en servir mais pour l’instant non.

Tu as acheté un Zoom avec la caméra c’est ça ?

Oui, au concert que j’ai enregistré je n’ai pas mis les micros à côté, j’ai mis la caméra un peu loin derrière le public.

C’est ton frère qui t’a conseillé d’acheter le Zoom ?

En fait ils avaient ça au conservatoire donc j’ai essayé et j’aimais bien. Je n’avais rien pour comparer non plus mais je trouvais ça pratique d’avoir la vidéo et l’enregistrement, de ne rien devoir faire soi-même à l’ordinateur.

Donc avec ça tu es autonome, tu n’as plus besoin de ton frère ?

Oui, je suis indépendante, ça c’est pas mal.

Tu n’as pas vraiment envie de réinvestir dans du matériel, tu as tout ce qu’il te faut ?

Oui je pense.

Et tu es à l’aise avec, tu peux faire tout ce que tu veux, tu as l’impression de bien le maîtriser ?

Je ne sais pas.

Il y a des choses que tu as du mal à faire ?

Je me demande pour l’emplacement. Ou si on enregistre dans une chambre où on habite, dans laquelle le son est moins bien que dans une autre salle ou dans un studio.

Du coup ce n’est pas vraiment le Zoom, c’est plus de la prise de son. Tu as essayé justement de faire avec différents placements du Zoom ou pas ?

Oui, j’ai essayé un peu plus près, un peu plus loin. Je crois que c’était un peu mieux plus loin.

Parce qu’en général tu le places comment par rapport à la harpe ?

Un peu loin devant moi, à 3 ou 4 mètres.

En face, dans l’axe de la harpe ?

Comme c’était filmé j’étais un peu tournée pour qu’on me voit, dans l’axe de la caméra.

Et tu as remarqué beaucoup de différences quand tu as essayé les différents changements ?

Je n’ai pas trop remarqué.

Donc tu fais vraiment confiance à l’ingénieur du son quand tu travailles avec quelqu’un ?

Oui.

Si tu avais accès ici ou ailleurs à une petite formation sur le son, est-ce que ça t’intéresserait ?

Tu veux dire pour apprendre moi-même ? Oui ça m’intéresserait.

Tu attendrais quoi ? De voir les différentes salles et les placements si je reprends ce que tu as dit ?

Oui, et peut-être s’il y a des spécificités de la harpe, puisque c’est différent pour chaque instrument je pense. J’avais cherché sur internet comment enregistrer une harpe mais il n’y a pas tellement d’informations. Donc si quelqu’un est vraiment professionnel et sait ce qui est le mieux pour la harpe ça m’intéresserait.

Et vraiment apprendre à enregistrer au Zoom ou avec des micros aussi ?

Oui avec des micros aussi.

Même si tu ne t’en sers pas tant que ça ?

Oui, peut-être que je m’en servirais plus après.

Qu’est-ce que tu préférerais, quelque chose en présentiel, des vidéos, des tutos ou une fiche ?

Je préfère en présentiel parce que j’ai l’impression que c’est plus facile pour moi d’apprendre avec quelqu’un de présent.

Et quel temps tu serais prête à investir pour ça ?

Je ne sais pas.

Ici ils font une formation en un week-end, mais il y a d’autres endroits où c’est 2 heures par semaine, qu’est-ce que tu préférerais ?

Je ne sais pas, un week-end c’est pas mal je pense. Je ne sais pas ce qu’on ferait si c’était toutes les semaines. Je ne sais pas si on peut apprendre quelque chose d’autre à chaque fois ou si on fait la même chose.

Et est-ce que tu as déjà un peu retravaillé le son sur ton ordinateur après l’enregistrement ?

Non, moi-même je n’ai pas fait ça parce qu’on n’avait pas le droit et je ne saurais pas comment le faire. Donc ça m’intéresserait aussi, une formation sur comment savoir faire les effets, les réverbérations etc.

Et pour le plaisir tu fais des trucs aussi ou c’est vraiment quand tu en as besoin ?

Non je ne m’enregistre pas trop comme ça moi-même.

Entretien n°6

Le 07/02/2023

Est-ce que tu peux te présenter rapidement ? Où tu as étudié, ce que tu joues ?

Je suis flûtiste et j’étudie depuis cinq ans à la Haute école de Lucerne. J’ai fait le Bachelor et le master en pédagogie.

Tu as quel âge ?

J’ai 25 ans.

Tu t’es déjà enregistrée toi-même pour des projets ?

Oui, enfin c’est-à-dire des projets ? J’ai enregistré des choses genre Podium¹² et je me suis enregistrée pour des auditions et des examens d’entrée.

Pour des écoles ou pour quels genres de choses ?

C’est là où le Covid a commencé, c’était super… Je voulais aller en Erasmus pendant mon master et je devais de toute façon faire des enregistrements, mais après tout a fermé donc j’ai dû faire des enregistrements toute seule, sans piano, dans ma chambre…

Tu avais combien de temps de programme à enregistrer ?

Je ne sais plus… Franchement ce n’était pas ma période… Comme pour beaucoup de gens je crois. Je crois que c’était trois pièces, il n’y avait pas de limite de temps et j’allais envoyer une pièce solo et deux pièces avec piano, mais du coup je n’ai envoyé que des pièces solo. Bien sûr ça n’a pas marché mais ça peut être beaucoup de choses, pas seulement le fait que je ne jouais pas bien du tout… J’ai enregistré Syrinx et Telemann et des pièces contemporaines et au final je ne sais plus ce que j’ai envoyé.

Tu devais enregistrer tout d’un bloc ou tu pouvais faire chaque pièce séparément ?

Non séparé. Et au final justement j’ai envoyé des trucs que j’avais fait à une audition avec mon téléphone, même pas bien joué. J’avais juste fait ça pour le réécouter, ce n’était pas du tout quelque chose que tu veux envoyer à des gens, mais au final j’avais envoyé ça aussi je crois.

Parce que tu n’étais pas contente de ce que tu avais ?

Oui parce que ce n’était que du solo. Et puis c’était tout fait dans le même état d’esprit de “je suis chez moi toute la journée et je ne vois personne, et je suis un peu déprimée mais j’essaie quand même de penser à mon futur”. C’était horrible maintenant que j’y repense. C’était un bazar dans ma chambre, c’était ici dans cet appartement. Tous les meubles étaient d’un côté, tu ne pouvais rien faire d’autre dans la chambre, tu ne pouvais qu’enregistrer. En plus il y aurait eu un coin de lit ça n’aurait rien changé. J’avais tout poussé pour qu’il y ait assez de mur blanc derrière moi. Pour qu’on voit mes pieds mais on ne voyait même pas mes pieds, ça n’aurait rien changé.

Tu te rappelles pour quelle école c’était ?

Oui, c’était pour les endroits les plus difficiles où obtenir une place, c’était Budapest, Berlin et Barcelone. Tu peux faire trois trucs, je ne sais pas si c’est partout comme ça mais dans cette école il y a une limite. Je crois que tu payes 200 francs et après tu peux envoyer au maximum dans trois écoles parce qu’il y a beaucoup de papiers…

Et depuis ça tu as dû t’enregistrer pour des concours, pour démarcher ?

J’ai fait Gustav Mahler¹³, et j’ai fait aussi pour un concours. J’ai dû faire deux mouvements de Bach.

Pour un concours d’orchestre ?

Non, c’est un concours.

Et tu avais tout fait toi-même ?

Oui.

Tu t’es déjà fait enregistrer par quelqu’un d’autre ?

Non jamais.

Et sonorisée par exemple pour des concerts ?

Oui, enfin c’est-à-dire ? Avec un micro ? Oui, par quelqu’un. Je ne ferais pas ça moi-même, parce qu’il faut savoir où mettre quel câble, et relier avec quoi, et après il faut que tu t’entendes de dehors, tu n’arrives pas à jouer et écouter. Alors que si tu t’enregistres tu peux jouer et ensuite réécouter. Quand j’enregistre c’est un Zoom, ce n’est pas un truc avec des micros, enfin pas des micros en plus que tu relies au Zoom.

Quand tu t’enregistres, comment tu procèdes ? Tu règles des choses, comment tu fais ?

Je mets en stéréo dans les réglages. Après je joue, je réécoute et je mets la limite, je ne sais pas comment ça s’appelle.

Le gain ?

Oui, mais je ne le fais pas très bien, c’est souvent un peu trop bas. J’aurais pu faire plus mais je n’ose pas parce que j’ai peur que ce soit trop. Je me dis que c’est mieux trop peu que trop. Mais d’ailleurs je crois que du coup j’ai des enregistrements qui sont beaucoup trop faibles.

Tu as toujours fait au Zoom, tu n’as jamais fait avec autre chose ?

Non, j’ai reçu le Zoom de mes parents l’année passée et avant j’avais un micro que tu mets sur le téléphone, sur l’iPhone.

Tu le branches ?

Tu le mets là où ça charge. J’ai commandé ça au début du covid et ça ne marchait pas du tout. C’était assez cher pour quelque chose que tu mets sur ton téléphone mais peut-être que j’aurais dû demander à quelqu’un parce que je ne savais juste pas du tout comment l’utiliser.

Comment as-tu choisi d’acheter ça ?

Je ne sais plus, j’ai lu des comparatifs en ligne, ça disait que c’était de bonne qualité et c’était dans mon budget. Je demande toujours à mon frère parce qu’il est très doué. Il a étudié la même chose. Du coup je l’ai commandé et ça ne marchait pas, il y avait toujours des fautes, des trucs qui sautaient ou des trous. Ce n’est pas super quand tu dois prouver que tu as tout enregistré d’un coup… donc c’est un peu triste. Il y avait une application exprès pour enregistrer et ça marchait moyennement bien. Tu pouvais faire les vidéos avec, mettre le micro et faire une vidéo, ce n’était pas de la bonne qualité, c’était super bas, vraiment pas très fort. J’utilisais ça pour envoyer des vidéos à mon prof pendant le Covid et il me disait : “c’est cool mais je n’entends pas trop ce que tu joues”. Là par contre il n’y avait pas de fautes, c’était très aléatoire, c’était quand tu mettais le micro sur le téléphone et qu’après tu faisais une vidéo. Mais depuis je me suis demandé si ce n’est pas un micro que les gens utilisent pour faire des podcasts, super proches. Je n’ai pas du tout acheté le truc fait pour ça.

Après tu as demandé à tes parents un Zoom pour Noël ?

Je ne leur ai pas demandé, ils m’en ont juste acheté un. Enfin, ce sont mes parents qui ont demandé à mon frère d’en acheter un.

Et maintenant tu préfères, c’est plus simple ?

Oui, ça marche surtout !

Et la vidéo tu la fais avec ton téléphone ?

Oui c’est plus simple. J’ai aussi un appareil photo mais je n’arrive pas trop à le régler. L’autre fois j’ai essayé en Salquin¹⁴ et je n’arrivais pas à faire en sorte qu’on ne ressemble pas à des fantômes, il y avait trop de lumière. Et surtout, si tu le règles à l’avance et qu’après tu l’éteins parce que tu ne joues pas en premier, si tu demandes à quelqu’un de faire les réglages il ne le fait pas. Donc je préfère l’iPhone, au moins tu peux faire un appui sur la personne et après c’est à peu près réglé. J’ai filmé d’autres gens aussi avec mon appareil, c’était pas mal.

Donc tu préfères quand c’est toi qui filmes avec l’appareil ?

Non mais ça c’est différent parce que c’était dans une autre salle. Les lumières étaient mieux, elles étaient partout.

Quand il y a assez de lumière c’est bien avec l’appareil photo mais sinon ça ne l’est pas ?

Oui. Sinon c’est possible mais je ne sais pas comment faire.

Est-ce que tu passes beaucoup de temps à t’écouter avant d’enregistrer ?

Non parce que je n’ai pas le temps, je fais tout à la dernière minute. Je ne suis pas organisée.

Tu as pris combien de temps pour faire tes vidéos pour les Erasmus ?

Alors je ne suis vraiment pas sûre. C’était très long mais ce n’était pas à cause de la technique. J’en ai fait le premier jour et après j’ai réécouté la qualité et ça allait. J’ai fait ce réglage et après j’ai passé trois autres semaines à déprimer parce que je ne sais pas faire de flûte.

Donc tu as passé trois semaines à t’enregistrer ?

C’était du 15 mars au 30 mars donc c’était deux semaines.

Pendant deux semaines tu enregistrais tous les jours ?

Oui je crois, je n’avais rien à faire et c’était mon seul but.

Et dans la journée tu passais combien de temps à faire ça ?

On ne savait pas trop encore à quel point les voisins toléraient donc je ne sais pas, je pense que je me disais : je vais travailler deux heures et à la fin je fais une prise et après j’en faisais trois parce que je n’étais pas contente, après il était tard, il n’y avait plus de lumière… Et j’en refaisais quand même.

Tu avais l’objectif d’en faire une par jour ?

Non, ce n’était pas aussi structuré dans ma tête.

Finalement tu étais contente ?

Non pas du tout.

Et au niveau du son, est-ce que tu étais contente du son ?

Je n’avais pas trop le choix… au final j’avais déjà ce micro qui ne marchait pas et du coup j’ai utilisé celui de ma coloc, elle a un Zoom aussi. Il a l’air très cheap mais il est bien. Du coup j’ai utilisé ça pour tout.

Tu as renoncé au micro ?

Oui parce que ça ne marchait pas. Mais je m’étais dit que dans ma chambre c’est là où l’acoustique sonne le mieux. Je ne me suis pas dit que je pouvais changer ça, j’aurais pu. Du coup c’est le son que c’est.

Mais quand tu l’entends est-ce que tu reconnais ton son ?

Bah oui.

C’est les mêmes défauts, les mêmes qualités ?

Je ne me suis pas demandé… Enfin je me suis demandé : ah ce sont mes défauts et mes qualités ?

Donc pour toi ce que tu entendais c’est vraiment ce que tu jouais ?

Je pense que c’est un truc objectif qui te redonne une idée. Ça l’est non ?

Tu travaillais avec ton prof en même temps, tu lui envoyais les vidéos au fur et à mesure ?

Non.

Tu étais vraiment toute seule ?

Oui.

Et en parallèle tu travaillais un programme pour ton professeur ou tu étais vraiment là-dessus ?

Non, au début on était tous un peu perdus. Je pense que mon prof a bien mis un mois aussi à réagir et à nous envoyer des mails.

Pour les autres concours c’était pareil ? Comment tu as fait pour Mahler ?

Là c’était mieux déjà, j’étais plus préparée, j’avais réservé une bonne salle. Non, je me souviens, j’ai aussi envoyé pour Moritzburg, je crois que c’est une académie. Et tu dois envoyer n’importe quelle pièce, ça c’est bien. C’est sympa ça ne te déprime pas. Du coup j’avais enregistré mais vraiment à la dernière minute dans une salle sans fenêtres au quatrième étage, mauvais côté. C’était horrible. Enfin c’est joli mais ça sonne comme ça sonne…

Donc après tu t’es dit que tu allais réserver une bonne salle ?

Et après pour Mahler j’ai fait avec Fanny¹⁵, on s’est un peu soutenues gegenseitig¹⁶ et on s’est motivées, on a réservé la salle 250 beaucoup de fois. Du coup j’ai fait là-bas.

Et elle le faisait aussi ?

Oui. On s’aidait parfois à être dans le plan, tu n’avais pas besoin de te filmer, de rentrer dans le cadre et de revenir pour regarder parce qu’il y avait une personne qui regardait si tu étais dedans. Enfin on était là 5 minutes.

Vous ne vous écoutiez pas du tout l’une l’autre ?

Si, parfois. Parfois non.

Est-ce que ça aide ou pas ?

Franchement, je n’ai jamais réussi à faire un enregistrement où je suis contente de la manière dont je joue, donc si quelqu’un écoute j’ai plus l’impression que c’est un concert, ça m’aide oui. Je l’ai fait une fois pour elle, je me souviens que ce n’était vraiment pas très bien la manière dont j’ai joué. Mais c’était mieux comme impression, c’était moins : “oh si je fais une faute là je m’arrête et je recommence” mais plutôt “je vais jouer pour elle toute la pièce”.

Oui, ça te pousse à ne pas t’arrêter ?

Oui.

Vous aviez fait sur une période de combien de temps à peu près ?

Je ne sais pas, je pense qu’en une semaine on a fait 2, 3 jours.

Donc parfois vous vous aidiez pour cette histoire de caméra, et parfois vous vous écoutiez mais peu.

Oui et on avait la salle d’à côté où l’une travaillait pendant que l’autre s’enregistrait et on échangeait. On le refait la semaine prochaine mais on upgrade en Salquin s’ils veulent bien nous laisser réserver parce que ce n’est pas gagné.

Donc vous refaites un concours ?

Oui, là on fait Cluj, mais cette fois on le fait toutes les deux. On va voir comment on fait, on n’a pas toujours le temps en même temps.

Et quand tu enregistres pour Cluj, Mahler ou ailleurs est-ce que ça te prend beaucoup de temps sur ton temps de travail à côté ? Est-ce que tu ne fais que ça ou tu as quand même des programmes à jouer à côté ?

Non, là non mais quand j’ai fait Mahler j’ai tout fait en même temps…

Tu t’en sortais ?

Non.

Donc tu as laissé un peu de côté ton travail pour te concentrer sur les enregistrements ?

Non parce que je devais tout faire en même temps mais du coup j’ai tout fait au minimum, j’ai tout fait un peu moyennement bien.

Ces enregistrements-là tu les as montrés à ton professeur ?

Non. Je n’en ai jamais montré à mon professeur. Tu sais pourquoi ? Parce que j’ai fait les enregistrements trop tard pour pouvoir en refaire et du coup si je lui envoie l’enregistrement que je vais envoyer ce n’est pas super. À part me dire de ne pas l’envoyer, il ne pourrait pas me donner de feedback. La seule fois où je lui ai demandé c’est quand j’ai enregistré Mozart pour un autre concours, j’en avais fait trois et je lui ai envoyé parce que je n’arrivais pas à choisir, je m’étais dit qu’ils étaient tous ok, que c’était le mieux que je puisse faire à ce moment-là.

Donc à chaque fois tu travailles le plus possible et tu enregistres quelques jours avant ?

Oui. Ou le jour même. Non quelques jours avant.

Quand tu te sens prête ?

Non quand j’ai la salle.

Tu n’as jamais retouché ton enregistrement après ?

Non c’est illégal. Non je n’ai jamais fait.

Tu penses que par exemple c’est interdit de changer juste le son de la salle ou ça fait partie des choses qu’on peut faire ?

Oui c’est probablement interdit mais je me dis qu’ils ne l’entendent pas. Si je savais comment faire je le ferais peut-être. Mais je crois que je préfère avoir une bonne salle dès le début. Mmh, quel monde de possibilités !

Quand tu enregistres au Zoom, tu écoutes avec quoi ? Un casque ? Des écouteurs ?

Sur l’ordinateur.

Tu transfères et tu écoutes ?

Oui ou parfois je peux mettre des écouteurs mais je n’en ai plus. Je n’ai pas de casque, je n’ai pas de très bons trucs pour écouter de la musique.

Donc ça veut dire que quand tu veux faire tes réglages tu enregistres, tu transfères sur ton ordinateur, tu écoutes et tu réenregistres ?

Oui, c’est pénible…

Comment tu places le Zoom dans la salle par rapport à toi ?

Un peu devant la caméra mais sans que ce soit dans le cadre. Donc 2, 3 mètres.

Face à toi ?

Oui, un peu plus bas que la caméra.

Sur une chaise par exemple ?

Oui, ou un lutrin, à la moitié de ma hauteur.

Et le Zoom tu en es contente, ça te convient ?

Oui.

Tu n’as pas besoin d’acheter autre chose ?

Non, je l’utilise pour faire ce genre d’enregistrements mais c’est souvent plus pour moi, par exemple pour les Podium. Je le pose quelque part, ce n’est pas forcément pour en faire quelque chose que je veux montrer à d’autres gens, à part quand je suis obligée parce que je dois faire des enregistrements pour des gens.

Et en musique contemporaine tu n’as jamais eu besoin d’enregistrer pour des compositeurs ?

Non. Une fois on a enregistré des bruits de papier pour une pièce. On a détruit un piano en papier. On a enregistré plein de bruits de papiers, on les a un petit peu manipulés et on les a mis sur un clavier. Après, pendant que je jouais au piano en papier, une autre personne jouait sur son clavier avec le bruit des papiers. Ça c’était avec son micro à lui. C’est lui qui a géré le son.

Et quand tu as fait le spectacle pour enfants avec les hamburgers¹⁷, il y avait du son dans la vidéo ?

Oui, j’ai aussi enregistré avec le Zoom.

Donc après tu as fait un petit peu de montage ?

Oui, sur Da vinci, directement avec la vidéo.

Donc tu n’as pas touché au son ?

J’ai fait des trucs basiques, mais ce n’était pas très professionnel. J’ai ajouté de la réverbération et j’ai retourné, enfin mis à l’envers. C’est tout, sinon j’ai découpé dans tous les sens. C’était difficile parce qu’ils avaient fait des petits bruits comme taper sur des tables et ils faisaient tout ça dans une même pièce. Ils faisaient des petites pièces d’une minute. Pour la toute première, j’ai enregistré tous les sons de la pièce séparément. Du coup ils étaient censés jouer en rythme mais ce n’était pas pareil… C’est le seul morceau pour lequel j’ai fait ça, pour le reste on n’avait pas le temps donc j’ai juste essayé d’être proche.

Comment tu as fait après au montage, tu as découpé ?

Il y a des sons qui se sont un peu perdus. Oui, j’essayais de découper et de les mettre beaucoup plus fort. Mais c’était très mal fait cette vidéo, il y a beaucoup de choses où j’étais dans le rouge à la fin.

Ça saturait ?

Oui. Mais si ça ne saturait pas tout était trop bas, donc je me suis dit que je m’en fichais, que ça allait saturer. J’ai exporté comme ça et ça allait. Mais je crois que le technicien a mis une limite dessus au concert. Et c’était trop bas d’ailleurs, mince, je me rends compte que tout était à cause de ça.

Comment as-tu appris à faire ça sur Da Vinci Resolve ?

Je n’ai pas appris… Quand on a fait les bruits de papier, Grégoire¹⁸ nous a montré pendant 20 minutes des choses basiques qu’on pouvait faire. Mais ça c’était dans un autre logiciel que j’ai toujours, je ne sais plus le nom.

Tu ne te sers plus de ce logiciel maintenant ?

Non parce que c’était compliqué… Si, un petit peu pour les bruits de papier. Mais je n’ai pas trop compris. C’était juste pour le son, pour moi c’est plus pratique d’utiliser vidéo et son en même temps.

Et si tu as des traitements à faire pour le son tu le ferais sur Da Vinci Resolve ou dans l’autre logiciel?

Peut-être dans l’autre. Mais j’ai aussi Audacity.

Tu t’en sers ?

J’ai fait des trucs dans Audacity à l’école. J’ai fait mon travail de Maturité. Mon projet de fin de lycée. J’ai fait ça dans Audacity. C’était un livre audio avec de la musique de Schubert.

Donc tu as pris des enregistrements qui existaient ?

Oui et j’ai mis ensemble avec une histoire que ma prof de flûte à bec a gentiment lue. Mon frère m’a donné son micro et son… Je ne sais pas, c’était compliqué il y avait beaucoup de boutons.

La carte son ? Tu branchais le micro dedans ?

Oui. Le son était bien à la fin. Tout était très bien sauf l’histoire, j’ai tout réussi toute seule. Les enregistrements je ne m’en souviens pas, je ne sais pas si ça sonnait plus professionnel. Ce n’était pas du tout légal aussi je pense. J’ai fait avec Audacity, tu peux enregistrer le son de l’ordinateur et après j’ai juste joué sur Spotify. Et je me demande s’il n’y avait pas quelque chose pour avoir une meilleure qualité. J’aurais pu télécharger depuis Youtube. Ce n’était pas très professionnel comme projet. Est-ce que c’est bien Audacity ? Pour moi c’était bien. Mais pour faire des choses plus compliquées c’est bien ?

Tu deviens limitée à partir d’un moment… Et quand tu t’enregistres pour travailler c’est vraiment pour écouter musicalement ce que tu fais ?

Oui, je fais souvent avec mon téléphone, je n’ai pas toujours le Zoom avec moi.

Tu fais ça souvent ?

Oui, tous les jours. Non, j’ai un peu des périodes. Par exemple hier j’ai l’impression de n’avoir fait que ça mais parfois je me dis que j’ai besoin de distance et je n’écoute pas trop. Mais ça m’aide beaucoup. Parfois j’ai l’impression que je m’écoute plus objectivement. Quand je joue j’entends ce que je veux entendre et du coup quand j’écoute l’enregistrement j’entends ce que j’ai fait et pas ce que j’ai voulu faire.

Et ça t’aide aussi à filer un programme ? Par exemple avant ton Abschluss¹⁹ ?

Oui j’en ai fait parfois mais je n’ai souvent pas réécouté. Parce que c’est beaucoup. Je m’enregistre pour me dire je vais faire ça d’un coup. Mais justement par exemple avant mon Abschluss, je n’ai pas fait tant que ça d’enregistrements. À un moment, je me suis dit qu’il n’y avait plus le temps de se frustrer par rapport à ça.

Est-ce qu’il y a des projets pour lesquels tu ferais appel à un ingénieur du son ?

Oui, bien sûr, si je voulais faire un truc pour mettre sur Youtube, ou si c’est quelque chose pour me faire de la pub bien sûr. Ce qu’il faut que je fasse une fois dans ma vie.

Pour des concours tu préfères toujours faire ça seule ?

Oui.

Quelle est la différence d’enjeu pour toi, d’enregistrer avec quelqu’un ?

C’est vrai… Je ne sais pas. Jusqu’à maintenant quand je me dis que je vais faire un concours je ne me dis jamais assez à l’avance que je vais être prête, faire ça bien, avoir mon ingénieur du son organisé pour ce jour-là. Je me dis plutôt : “ah mince il y a des deadlines, bon j’ai déjà joué cette pièce, ok”. Je ne me suis jamais dit : “oh là ça va être tellement bien”, peut-être que je ne me suis jamais dit que je pouvais gagner le concours. J’envoie des enregistrements en mode j’ai essayé. Du coup si un jour je suis vraiment prête… Mais peut-être que je ne le serai jamais parce que c’est juste ma personnalité qui est comme ça.

Alors que pour mettre sur Youtube ?

Ce serait la même chose, si je m’enregistrais pour un concours en sachant que je montre tous mes meilleurs côtés ce serait la même chose que si je voulais mettre sur Youtube.

Donc quand tu prépares un concours tu vois un programme et tu te dis que tu as déjà joué les pièces et tu les reprends ?

Oui.

Il n’y a pas de concours où tu te dis : “il y a ça et j’y vais” ?

Non, mais ce serait peut-être mieux comme stratégie. Je n’ai pas l’impression d’avoir eu un moment dans ma vie avec suffisamment de temps pour me dire que j’allais faire un concours. Ce n’est jamais un objectif de temps dans ma vie.

Et à l’inverse, tu t’enregistrerais seule pour mettre sur Youtube ?

Je crois que je ne le ferais pas.

Par souci de…?

Parce que si ce n’est pas parfait je ne vais pas mettre sur Youtube. Je me dis que je n’ai pas l’oreille pour écouter les qualités. Si tu me demandes avant ton concert d’aller dans la salle pour dire s’il faut que tu ouvres ou que tu fermes le piano, il vaut mieux demander à quelqu’un d’autre. J’ai l’impression que je me dis toujours que c’est bien, et je ne me demande pas ce qui pourrait être mieux. Si on n’entend pas trop je me dis que ce n’est pas grave, que je vais mieux écouter. Et pour ça, un ingénieur du son va dire de jouer plus fort, de fermer le piano ou d’augmenter le volume, je n’ai pas l’estime pour ça.

Ça t’arrive d’écouter sur Youtube des vieilles versions d’un morceau que tu cherches et de trouver que le son n’est vraiment pas bien ?

Oui, mais si c’est vieux…

Le son ce n’est pas un critère d’écoute pour toi ?

Que le son soit bien ? Non. Je pense que je clique sur des choses où je me dis que le son va être bien, tu sais, quand c’est bien filmé. Je ne sais même pas si je m’en rendrais compte. Si c’est bien filmé, je suis très visuelle, et qu’ils ont juste posé un Zoom je me dirais que c’est un bon enregistrement.

Et à l’inverse, est-ce que ça te gêne quand tu te filmes pour des concours et qu’on voit un microphone à l’image ?

Non, si c’est bien fait non. Enfin oui ça me gêne beaucoup si tu voies que la personne a juste posé son téléphone sur son lit. C’est mon occupation préférée de juger les gens sur leur incapacité à faire un cadre, c’est fou, ce n’est pas compliqué. Mais vraiment des choses basiques, comme mettre en horizontal.

Quand tu écoutes des grands flûtistes ou des flûtistes moins avancés, est-ce que tu entends entre eux une différence de son ? Tu te dis que certains musiciens ont un son incroyable ?

Oui. Parce que c’est contradictoire ?

Non mais c’est pour voir : est-ce que ton critère c’est le son de l’instrumentiste, et que tu n’écoutes pas vraiment le son de l’enregistrement, ou est-ce que tu n’écoutes pas le son du tout ?

Je ne sais pas. C’est intéressant. Je ne sais vraiment pas.

Quand tu enseignes, et qu’un enfant a un son immonde, comment fais-tu pour qu’il l’améliore ?

Je fais des exercices. Il faudrait qu’ils écoutent plus de flûtistes, je n’y ai jamais pensé. Je vais faire ça la semaine prochaine. Je ne sais vraiment pas, il faut que tu sois un peu curieux et que tu ailles écouter des trucs sinon tu n’as pas vraiment d’idée de quel son tu pourrais avoir. Moi ça m’énerve parce que si tu n’es pas curieux je ne peux pas l’être à ta place. Mais je ne sais pas si j’ai un idéal, j’ai mon idéal du son que je veux pour moi avec ma flûte mais chez les autres je ne me demande pas si ça pourrait être beaucoup mieux.

Ça ne t’intéresse pas vraiment ?

Si, c’est quelque chose qui m’intéresse.

Mais instinctivement tu ne te poses pas la question ?

Non mais j’ai l’impression qu’à la flûte et sûrement à tous les instruments ce n’est pas seulement quel son tu arrives à avoir, c’est quel son tu arrives à avoir malgré tout ce que tu dois jouer. Et du coup il y a beaucoup trop de critères et quand quelqu’un a un beau son c’est que techniquement et musicalement la personne arrive super bien à balancer le tout.

Donc le son c’est un peu le dernier critère, il faut que tout le reste soit parfait ?

Oui et du coup y’a des sons différents mais c’est à cause des personnes et des flûtes différentes. Tu as juste le meilleur son que tu puisses faire avec cette flûte. Je ne sais pas si c’est la réponse que je donnerai demain…

Est-ce que toi tu as déjà fait le module de formation InHouse Recording à l’école ?

Non, j’aurais pu, ça aurait été utile.

Tu regrettes ?

Je me dis qu’en général dans mes études j’ai fait beaucoup de trucs intéressants et créatifs et peu de choses où je me suis demandé ce qui serait utile pour mon futur. Mais partout, que ce soit enregistrement ou comment payer ses impôts ou Probespiel training²⁰… C’est fonctionnel et je ne suis pas une personne fonctionnelle.

Et si tu avais accès à quelque chose pour te former maintenant tu le ferais ou pas ? Probablement pas parce que je n’ai pas appris de mes erreurs… Mon futur est ouvert à beaucoup de possibilités, je ne sais pas, je vais réfléchir. Peut-être que je vais aller voir mon frère et lui demander s’il veut tout m’expliquer sur comment s’enregistrer. Il va me dire qu’il n’a pas le temps.

Et pour toi c’est rédhibitoire quand tu vois un concours par vidéo, tu ne te dis pas “ah non je ne le fais pas” ?

Si, j’ai la flemme, mais aujourd’hui tous les concours sont par vidéo, enfin il y en a très peu où ça ne l’est pas si tu veux rester ouvert à cette activité.

Et pour revenir à comment tu prépares les concours, quand tu prépares un concert par exemple ça n’a rien à voir ou c’est un peu pareil ?

Non, ça n’a rien à voir.

Tu te prépares comment pour un concert ?

Je pense beaucoup plus à ce moment, comment je vais devoir être à ce moment-là et je me prépare. J’aime bien toujours jouer par cœur, je me prépare à ne pas avoir de trou de mémoire. Je me prépare à comment je vais être. Je me prépare physiquement à pouvoir jouer le programme en entier plusieurs fois à la suite. Je me prépare à comment je vais me sentir entre les pièces. Oui, je me prépare complètement différemment. Peut-être que je devrais me préparer un peu pareil.

Comment tu fais, j’imagine que tu te prépares en enchaînant tout pour la fatigue ? Comment tu te prépares à ce que tu vas faire entre les pièces ?

En enchaînant les pièces. Là je pense à mon récital parce que c’est le plus récent, par exemple le point critique c’était le changement entre flûte moderne et traverso.

Donc je travaillais en alternant les deux. Après il y avait de l’improvisation donc c’est différent de tous les autres concerts que j’ai fait dans ma vie. Mais c’est important de savoir ce qui va venir après quoi et dans quel état d’esprit être après.

Et justement pour faire un enregistrement tu fais moins de filages pour te préparer ? Non, je n’en fais pas du tout. Mais je pense que j’ai dû faire moins d’enregistrements où il y avait plusieurs pièces à la suite. Je me dis qu’il faut juste que je survive à ce truc.

Quand tu as plusieurs pièces à enregistrer comment tu fais ? Tu fais plusieurs fois une pièce puis plusieurs fois l’autre ou tu fais tout ?

Non, je fais plusieurs fois la pièce jusqu’à ce que je sois obsédée et que je me dise qu’il faut changer.

Tu commences par la même ou tu alternes ?

Non je crois que j’alterne.

Entretien n°7

Le 08/06/2023

Tu peux te présenter ?

Je suis étudiant en deuxième année de Licence en basson français au Conservatoire National de Lyon. J’ai 24 ans.

Qu’est-ce que tu as comme expérience d’enregistrement, que ce soit seul ou avec quelqu’un ?

En auto-enregistrement, par rapport à tout ce qui a été confinement et covid j’ai eu mes vidéos de concours pour le premier tour il y a deux ans pour les concours de Paris et de Lyon. Ensuite, un projet de musique de chambre où on a monté un arrangement de Pierre et le Loup pour quintette à vent, et on a enregistré chacun dans notre coin nos parties instrumentales qui ont été ensuite collées les unes aux autres et mises sur un fichier vidéo. Et après, régulièrement mon prof me demande de m’enregistrer, justement suite au travail de préparation de vidéos de concours pendant le covid. Sachant qu’il me préparait déjà, même avant que j’envoie les vidéos au concours. Il me demandait de lui envoyer des vidéos pour avoir un suivi régulier de mon évolution pendant le covid, vu que je ne pouvais pas aller prendre de cours avec lui à Lyon.

Quand tu parles du quintette, le but c’était vraiment de mettre sur internet ou c’était pour démarcher ?

Oui on a mis une vidéo sur Youtube. C’est juste pour ça. Ce n’est pas grandiose, c’était un projet de confinement quoi.

Et depuis que tu es au CNSM ?

De temps en temps Philipp²¹ me demande de m’enregistrer et d’écouter, voire de lui envoyer des enregistrements ou de lui faire écouter mon travail personnel, que ce soit déjà pour juger de la qualité de mon travail en autonomie, ou pour avoir quand même un suivi pédagogique quand j’ai quelques cours qui sautent pour des raisons de tournée de son côté à Radiofrance ou de sessions d’orchestre de mon côté.

Donc à chaque fois que vous n’avez pas de cours ensemble tu fais une vidéo ?

Ce n’est pas régulier, des fois il expérimente un peu. Il a développé ça avec le covid je pense justement, le fait de devoir évaluer le travail des élèves par vidéo plutôt que par un cours particulier. Je crois qu’à Lyon ils ont dû notamment faire des cours en visio et que c’était un peu compliqué. Le problème c’est que forcément, avec les restrictions de qualité visio ou audio qu’on a par les logiciels de discussion c’est un peu compliqué de pouvoir faire pleinement un travail pédagogique.

Et pour des académies d’orchestre ou des stages tu as fait ?

Non.

Ce que tu fais en ce moment c’est vraiment pour travailler ?

Oui.

Tu dirais que tu fais ça tous les combien ?

Ça dépend. Peut-être une journée ou deux de travail dans le mois. Ce n’est pas régulier. En fait le but c’est de mettre en place des réflexes d’écoute active. L’avantage de l’enregistrement pour le travail c’est que ça permet de prendre du recul sur ce que l’on fait et d’avoir déjà une oreille extérieure, notamment dans le cadre d’une pratique d’un instrument à vent. On a une perception de l’instrument qui est très faussée par rapport à l’auditeur. Là où il y a juste le son de notre instrument, nous on entend principalement la réverbération de l’instrument dans le corps. On a une écoute interne ce qui est très perturbant, je pense qu’il doit y avoir des harmoniques qui changent. La justesse on ne l’entend pas exactement pareil. Et en plus ça permet aussi de prendre du recul. Quand on s’écoute sans jouer on n’est plus en train de se concentrer sur des paramètres techniques instrumentaux, on écoute juste ce qu’il y a par rapport à la musique et la représentation qu’on en a. Du coup c’est plus facile de dégager des objectifs et des paramètres de travail. Enfin de vraiment identifier ce qui pêche de manière récurrente, pour qu’une fois que c’est dégagé ça devienne intégré au travail sans enregistrement.

Ça tu le fais quand ton prof te le demande, mais est-ce que tu le fais aussi pour toi ?

Oui ça m’est arrivé puisqu’il y a une application que j’ai achetée. Elle est gratuite mais je l’ai achetée pour avoir plus de paramètres. C’est sur l’Iphone, elle s’appelle Andante. En gros dans l’application tu peux lancer une session de travail et quand tu lances ta session, l’application a plein d’items. Tu as métronome, accordeur et notamment enregistreur, et à la fin de ta séance de travail tu peux prendre des notes dessus. C’est un peu bête, tu n’as pas besoin d’un téléphone pour ça mais au moins ça permet de classer par jour. Tu mets ton niveau de satisfaction, et surtout tu prends tes notes par rapport à ce que tu as ressenti. Après tu peux réécouter, prendre des notes aussi par rapport à ce que tu penses et ça archive. Donc tu peux avoir un suivi de ton travail et c’est bien pour ça. Des fois, quand je me mets à travailler avec l’application, j’essaye de ne pas m’en servir parce que c’est vrai que je ne suis pas forcément pour l’usage d’applications dans le travail régulier. Ça permet de voir où tu en es, notamment quand tu commences à travailler une pièce pour vérifier si tu n’es pas en plein contresens ou si tu ne pars pas dans des directions qui ne sont pas saines. Et aussi pour pouvoir comparer à des enregistrements. Ce qui est bien c’est par exemple quand j’ai travaillé pour le concours d’orchestre que j’ai fait, et qu’il fallait que je monte le concerto de Mozart, il n’y a pas l’orchestre mais tu entends ta partie de basson et tu peux aller prendre des enregistrements de solistes sur internet pour comparer leurs idées musicales, juste pour faire de l’écoute comparée.

Donc tu t’en sers à la fois pour la musique, et tu disais aussi pour la justesse ?

Oui pour la justesse et aussi j’ai remarqué pour la précision rythmique. J’ai un défaut à l’instrument, en formation musicale de manière générale je suis plutôt très bon et très précis rythmiquement et peut-être que c’est à cause d’une raison digitale, je ne sais pas, je creuse encore là-dessus, j’ai tendance à être parfois un peu flou rythmiquement. Mon professeur notamment part du principe que pour lui la première chose qui cadre le rythme c’est aussi la manière de souffler. Enfin par rapport à tout ça, des fois tu n’as pas l’impression de ne pas être précis et quand tu écoutes un enregistrement dans un trait, tu entends clairement que le trait n’est pas précis. Ça aide beaucoup à la précision rythmique.

Tu connais NoMad Play ?

Oui, le conservatoire de Chalon où j’étudiais avant de rentrer à Lyon, en classe préparatoire, nous avait chopé des abonnements pendant la période covid. Le problème c’est que je m’en suis très peu servi puisque étant bassoniste, l’offre Nomad Play était très restreinte pour le basson. Tu as Mozart, Saint-Saëns et c’est terminé. Il y a aussi un autre problème. Ce qui était bien dans les deux pièces c’est qu’il y avait Saint-Saëns et que c’est souvent un imposé, c’est ce que j’ai joué au second tour de Lyon. Le problème c’est que, surtout pour de la musique romantique, ça joue bêtement en rythme et que la sonate de Saint-Saëns au basson bêtement en rythme ce n’est pas top.

Tu disais que tu fais beaucoup de concours d’orchestre en ce moment ?

Justement j’ai passé mon premier concours d’orchestre il y a un mois.

Donc c’était tout en présentiel ?

Oui.

Et les vidéos c’était vraiment pour t’entraîner ?

C’était juste mon prof qui me demandait d’écouter Mozart parce que j’avais tendance, en début de travail justement, à partir sur des directions personnelles qui n’étaient pas forcément très académiques disons, ce qui peut poser problème dans un concours d’orchestre, notamment sur une pièce comme Mozart. Je sais qu’en basson ça peut se faire beaucoup les concours sur vidéo, mais je ne suis pas trop concerné parce que je ne postule qu’en France avec le basson français. Par contre, je sais qu’il y a beaucoup d’orchestres à l’étranger, notamment des grosses formations, qui font des premiers tours sur vidéo encore aujourd’hui. J’ai eu des camarades de classe qui s’enregistraient, et je sais que pour eux ça pouvait être un bon exercice parce que ça exige de se réécouter, un peu comme un concours de CNSM. Mais c’est un peu bizarre pour un concours d’orchestre. Encore, sur un concours de CNSM ça permet de contrôler un niveau technique, on demande surtout sur un premier tour, littéralement une admissibilité, de voir si tu valides les items qu’une institution estime nécessaire avant de rentrer, mais alors pour un orchestre c’est un peu bizarre et des fois ils prennent des gens en vidéo et puis une fois que tu arrives sur place, tu ne corresponds pas du tout au profil qu’ils recherchent.

Est-ce que si tu vois un concours avec un 1^er tour par vidéo ça te freine ou tu t’en fiches ?

Je ne me suis pas réellement posé la question, ça peut entre guillemets être un atout. C’est ce qui s’est passé notamment dans les CNSM pendant qu’il y a eu le covid, je pense que ça a aussi beaucoup encouragé l’inscription de candidats de l’étranger parce que ça évite un déplacement, ça évite de t’embêter. Au moins tu sais que tu travailles sur place et ça ne te coûte rien de monter un programme de premier tour. Ça va beaucoup écrémer en plus.

Quand tu t’enregistres pour ton concours d’orchestre, est-ce que tu ressens une différence quand tu joues pour ta vidéo ou pour des gens ? Est-ce que psychologiquement tu es dans le même état ?

Ça varie au fur et à mesure de la séance de travail. Notamment quand il faut envoyer la vidéo. Au début tu y vas spontanément. Tu te réécoutes et tu identifies des problèmes. Quand c’est des problèmes musicaux encore ça va mais quand c’est des problèmes techniques… Enfin quand je dis musicaux c’est de musicalité. Quand c’est des problèmes techniques ou de trucs qui accrochent ou qui ne sont pas tip top, le problème c’est qu’au fur et à mesure de l’enregistrement soit tu ne te focalises que là-dessus et tu oublies d’autres choses, soit au contraire tu te stresses, et moi et ça m’arrive beaucoup. Je stresse de plus en plus et je sais qu’il ne faut pas que je fasse des séances d’enregistrement trop longues parce qu’à la fin ça a un effet plus destructeur qu’autre chose, je me crispe et j’intègre la crispation dans le travail. Ça a pu arriver sur des enregistrements de concours notamment.

Quand tu dis que tu stresses au fur et à mesure c’est de l’enregistrement ou de la séance globale ?

Les deux. C’est le stress de ne pas avoir d’enregistrement que j’estime potable personnellement, et le stress d’arriver à jouer. Parce que disons que quand tu joues devant des gens, tu joues et puis ça passe, enfin ça s’enchaîne et tu ne t’arrêtes pas sur un truc. En enregistrement tu graves tout et tu peux revenir en arrière et t’arrêter bêtement sur un truc, c’est hyper exigeant. Je sais que ça été le cas de certains jurys au concours et ça te donne le stress de ne rien mettre à côté, alors que ça peut arriver d’en mettre une, ce n’est pas forcément stressant. Ça enlève de la spontanéité je trouve.

Comment se déroule ta séance d’enregistrement ?

Quand je suis vraiment dans le cadre d’une séance purement de travail, par exemple sur une gamme, ça m’est déjà arrivé. Tu travailles ta gamme, tu enregistres au fur et à mesure. Je travaille un intervalle précisément et au bout d’un quart d’heure je m’enregistre et j’écoute. J’identifie des trucs, je refais mieux, je réenregistre et après je monte le tempo. Quand c’est juste pour surveiller un paramètre ça marche plutôt bien. Pour les gammes par exemple c’est très bien. En fait c’est plus un outil plutôt qu’un truc que tu gardes, comme une sorte de troisième oreille. Dans le cadre d’un enregistrement, par exemple pour envoyer à mon prof, c’est bêtement le téléphone sur le pupitre et puis la partition. Je commence mon filage et soit ça se passe bien et j’écoute, soit il y a quelque chose qui ne se passe pas bien, je coupe directement et je réenchaine, je réenchaine, je réenchaine, je prends des pauses. Des fois ça va vers le mieux, des fois ça ne va pas vers le mieux. Je sens quand je sature, je pose et après j’enlève l’enregistrement, je refais calmement et j’essaye de prendre du recul, du calme. Des fois je me remets à enregistrer et ça se passe bien. Dans le cas d’un enregistrement, pour avoir quelque chose de concret, je n’ai pas encore trouvé de méthode fiable. Par exemple, je sais que dans le cadre de mes vidéos de concours ça avait bien marché pour Lyon, mes vidéos étaient très très bonnes. Je n’arrivais à rien au niveau enregistrement, j’avais fait des enregistrements avec ingénieur du son. Au final pour Lyon le règlement exigeait un enregistrement téléphone et les meilleures vidéos que j’ai faites, celles que j’ai envoyées, c’était quand j’étais en train de travailler dans ma salle, ça se passait très bien, je me suis dit tiens je vais mettre le téléphone, on va enregistrer un coup et on va voir. J’ai fait, j’ai joué comme quand je travaillais, en fait j’oubliais la présence du téléphone et là ça a très bien marché. Je pense que l’enregistrement ça marche bien à partir du moment où tu arrives à oublier qu’il est là. Tu joues comme si tu jouais devant des gens. Je pense que c’est pour ça qu’on demande d’enregistrer.

Et pour le contexte, toi quand tu as passé Lyon c’était uniquement par vidéo ?

Lyon comme Paris, d’ailleurs c’était le même programme au premier tour sur vidéo. Je n’ai pas envoyé les mêmes vidéos. Et après tu étais convoqué ou non au second tour, en présentiel.

Et pour Lyon tu avais anticipé ? Tu avais commencé par enregistrer Paris ?

Oui parce que le concours tombe après. En gros, le programme de Lyon était tombé juste avant de passer le second tour de Paris. Donc j’avais déjà monté le programme, j’avais déjà envoyé des vidéos. Je crois qu’il y avait un mois d’écart. J’avais envoyé des vidéos à Paris, de pas très bonne qualité et mon prof de Lyon qui me préparait pour le concours de Lyon, il restait 2-3 semaines, m’avait demandé de les améliorer. Et c’est ce que j’ai fait et je les ai envoyées ensuite. Après il y a eu le second tour de Paris et le second tour de Lyon en présentiel sur des programmes différents.

Tu disais que tu as fait avec un ingénieur du son ?

Oui pour Paris, j’avais des ingénieurs du son. Il n’y avait pas de restrictions d’enregistrement. C’est un peu compliqué les séances d’enregistrement comme ça parce qu’il y a vraiment le stress de la prise. D’autant plus que, tu vois quand je sors mon téléphone comme j’ai fait pour Lyon, tu prends ton téléphone et tu le sors n’importe quand. Si tu es content de ta séance de travail, tu te dis que si ça se trouve, ça vaut le coup que je m’enregistre. Tu mets le téléphone sur le pupitre, tu enregistres, ça marche. Dans l’autre sens avec un ingénieur du son tu sais que des séances tu n’en as pas tant de prévues que ça parce qu’ils ne sont pas forcément disponibles, ce qui est normal. Tu as une séance d’une certaine durée, plus ta séance passe plus tu stresses de te dire est-ce que je vais avoir un truc convaincant à l’issue de ces, admettons, trois heures d’enregistrement. C’est un exercice et je pense que ça doit être pareil pour un musicien studio pour un CD. Je pense que c’est des trucs sur lesquels on n’est pas formés, surtout à l’époque covid on n’était pas formés à ça et c’est vrai que ça joue pour certains. Surtout dans mon cas où c’était la première fois que ça se produisait. Je pense que ça peut en gêner plus d’un.

Tu penses que maintenant, j’imagine que tes méthodes de travail ont évolué depuis, tu arriverais mieux à préparer une séance avec un ingénieur du son pour que ça se passe mieux ? Ou tu préfères quand même faire seul ?

Je pense que je serai plus préparé parce que là où à l’époque c’était : je travaille, on va enregistrer avec l’ingénieur du son et voir ce que ça donne, puis on va retravailler derrière et réenregistrer derrière. Je pense que là je ne m’y prendrais pas du tout de la même manière. Je pense que l’échéance ingénieur du son je prendrais ça comme si c’était un concert, une date butoir. Qu’en fait il n’y ait pas de travail derrière et que tu joues comme si c’était le concours, et pas comme si on allait voir et écouter. Non, vraiment prêt quoi.

C’est la seule fois où tu as enregistré avec des ingénieurs du son ?

J’ai déjà fait des enregistrements de projets d’ingénieurs du son pour Paris.

Donc ce n’était pas pour toi, c’était pour eux ?

Oui et à titre personnel des enregistrements d’ensemble de musique de chambre pour à la base préparer un CD. C’est tombé à l’eau parce qu’on s’est rendus compte qu’il y a eu des problèmes d’enregistrement, de travail et de qualité musicale. Et des problèmes d’enregistrement : louer un gîte à 1 km d’une ligne TGV ça peut pourrir un enregistrement. Surtout quand c’est la ligne Paris-Lyon.

Et ce CD c’était dans quel but ?

Pour avoir des goodies à filer avec les concerts de musique de chambre. Mais de toute façon le groupe est tombé à l’eau et le CD lui-même aussi, ce n’est pas plus mal.

Quand tu parlais de tes gammes tu disais que l’enregistrement te permettait de surveiller certains paramètres, est-ce qu’une fois que tu as identifié ces paramètres avec l’enregistrement tu les entends quand tu joues ?

Oui. Du coup en plus tu peux cumuler le métronome du logiciel avec l’enregistrement et tu superposes. En fait, si je lis pour la dernière gamme par exemple, je remarquais des notes qui craquaient de manière régulière et pourquoi. Par exemple, tu sais qu’au basson admettons tu as fait ta gamme, tu as des sol# qui craquent, mais là tu entends que cette note craque de manière récurrente quand elle vient de telle ou telle note, donc ça te permet d’identifier un problème, pas juste ça craque mais pourquoi. Donc tu prends note et ensuite tu corriges et il n’y a plus. Ça permet aussi des fois de voir dans mon cas des problèmes de conduite d’air dont tu ne te rends pas forcément compte. Tu souffles et des fois tu ne sais pas si c’est bien conduit. C’est plus facile de s’en rendre compte quand tu prends du recul.

Et la qualité audio de ton téléphone te suffit pour entendre la conduite d’air par exemple ?

Oui. J’ai de la chance d’avoir un téléphone qui enregistre bien. J’avais eu un téléphone un peu plus vieux quand j’ai préparé Lyon, le micro ne devait pas être mauvais. Mon iPhone 10 avait un meilleur rendu que le Zoom, les deux ont servi en simultané. Le problème c’est que le Zoom c’est le genre de micro où si tu ne t’en sers pas dans de bonnes conditions le rendu est moins bon. L’avantage du téléphone c’est que c’est un peu moins capricieux sur les conditions d’enregistrement. Tu as toujours un truc à peu près lissé, je pense qu’il y a tellement de compression là-dedans que tu entends bien. Ce n’est pas forcément incroyable mais ça te permet d’avoir une bonne vision. Ce n’est peut-être pas fidèle à l’acoustique de ta salle mais au moins ça te permet d’avoir une bonne perception de ton instrument.

J’ai vu qu’au CNSM de Lyon ils ont un module de cours sur la prise de son. Est-ce que toi tu l’as fait ou pas ?

Module sur la prise de son ? Le fait qu’on puisse demander à un ingénieur du son du conservatoire de nous enregistrer ? On pouvait, mais il est parti à la retraite. C’est compliqué mais on peut, normalement ils ont quelqu’un. Il y a un régisseur ingénieur du son à qui on peut demander d’enregistrer, à partir de la 3^e année, une ou deux fois par an pour des concours. Du coup moi je suis pas encore en 3^e année. Pour le cours je n’en ai jamais entendu parler. Tu as une plaquette récente ? Des fois ce genre de truc c’est uniquement pour les étudiants en composition.

Là c’est obligatoire pour les étudiants en composition mais ouvert pour les autres disciplines.

C’est quelque chose qu’on prend en option, c’est en UV4. Quand tu es bassoniste, tu as le basson baroque qui te tend les bras en UV4. On s’arrache les créneaux donc j’ai préféré privilégier le basson baroque.

Tu enregistres avec ton téléphone, tu n’as pas un Zoom ou autre chose ?

Non.

Quand tu réécoutes tes enregistrements, tu écoutes avec quoi ? Directement sur le téléphone ?

En général avec des écouteurs… Ou un casque mais pas avec le haut-parleur, ce n’est vraiment pas terrible. Le but étant quand même de faire un travail sur la qualité du son et la justesse… D’ailleurs le fait de m’enregistrer m’a beaucoup fait progresser. C’est pour ça que mon prof m’aiguillait beaucoup là-dessus, parce qu’il a vu qu’étonnamment, par rapport à beaucoup d’élèves, j’ai énormément progressé pendant le covid sans avoir de cours grâce aux enregistrements de concours qui me permettaient d’avoir des repères. Donc pour lui c’est le fait que j’avais une vraie

prise de conscience sur mon son et j’ai beaucoup, beaucoup rectifié ma qualité de son, l’esthétique du son, grâce aux enregistrements.

Pour Lyon tu disais que tu t’étais enregistré pendant une séance de travail, mais tu avais quand même anticipé ta tenue ?

Je n’étais pas en tenue de concert. Je n’étais pas mal habillé. Je ne sais même plus mais je crois que je m’étais dit que pendant une semaine il fallait que je produise des vidéos donc je m’étais débrouillé pour être toujours plus ou moins en tenue et travailler en tenue.

Donc tu n’avais fait qu’une fois, tu as travaillé, tu t’es dit c’est bien, tu as enregistré et c’était bon ? Ou tu as fait ça plusieurs jours d’affilée ?

Non, j’avais plusieurs pièces à enregistrer. Il y avait un Vivaldi et une pièce moderne du 20^e siècle. Le Vivaldi n’a jamais été très problématique, c’était la pièce moderne… Elle fait 5 ou 6 mouvements et les plus difficiles sont les derniers. Ce qui fait que c’est assez frustrant à enregistrer parce que tout le début se passe très bien, mais tu lâches des trucs immondes en toute fin et tu es obligé de te retaper les 10 minutes. En fait j’arrivais toujours à produire des versions très bonnes mais toujours avec des erreurs qui ne passent pas en concours, vraiment le truc éliminatoire. Donc j’ai fait la très bonne version, ça passait tout seul. Pour moi ça a été vraiment très bien et je sais que mes vidéos ont été très bien reçues par le jury. Mais en gros cette fois-là c’était une sorte d’état de grâce. Donc tu te dis, est-ce que je vais vraiment me fatiguer à essayer de produire mieux ? Je pense que la vidéo est très bonne et qu’il faut peut-être maintenant se mettre à assurer le programme du second tour qui est en présentiel.

Tu avais déjà fait d’autres jours avant ou c’était vraiment ce jour-là coup de chance ? J’avais des trucs presque bons, c’est juste que ce coup-là c’était vraiment au-dessus. Mais je n’en ai pas refait après. Disons que ce n’était pas un coup de chance, ça fait partie de la progression de ce qu’il y avait avant.

Comment tu gérais, ça c’était sur une semaine en gros ?

Le problème qu’il y avait avec ces enregistrements, si je ne dis pas de bêtises c’est que le premier tour de Lyon est arrivé avant le second tour de Paris, qui était le concours que je visais. Il fallait que je monte des bonnes vidéos pour Lyon mais il fallait que je monte un programme donc j’essayais de ne pas trop perdre de temps avec ça.

Comment tu gérais avec ton travail pour Paris en même temps ?

Sur des journées de travail type de 5-6h, avec des sortes de petits services de 2h30 par demi-journée. Tu consacres une demi-journée à ton programme de premier tour et une demi-journée à ton programme de second tour.

Sur ta séance tu commençais par travailler et à la fin tu te disais je suis prêt, je vais enregistrer ?

Non, je chauffais l’instrument et j’enregistrais directement pour avoir un enregistrement à froid dans des conditions de concours. Je ne me fatigue pas trop à jouer, je fais une gamme pendant 15-30 minutes et je passe. J’avais des enregistrements pas mal. Après je retravaillais certains paramètres. Le paramètre en question était réglé mais le reste de l’enregistrement n’était pas forcément bon. Et dans le cas où j’ai eu un bon enregistrement c’est que j’avais fait une bonne séance de travail. J’ai dû faire mon premier enregistrement, très bonne séance de travail, pause, 30 minutes pour déchauffer, enregistrement et ça s’est très bien passé.

C’était le jour où ça marchait. Les autres jours tu réécoutais à chaque fois juste après l’enregistrement ?

Oui, pour comprendre quand même pourquoi ça marche, pourquoi ça ne marche pas, essayer de peaufiner le travail. Pas faire des enregistrements pour faire des enregistrements, ce qui est bête parce qu’au final tu as un truc qui ne va pas te servir et si tu ne t’en sers pas au moins pour rectifier le tir tu as juste perdu ton temps.

Est-ce que tu te poses la question de t’acheter du matériel ou tu n’en as pas l’utilité ? Non. Éventuellement je sais qu’ils font des micros pour le téléphone que tu branches juste à ton port lightning pour l’iPhone. Je ne sais pas comment ça marche, si c’est de bonne qualité mais éventuellement il y a ça. Je ne suis pas trop confronté à un usage plus professionnel de l’enregistrement que ça et dans le cadre d’un support supplémentaire de travail mon téléphone fait amplement l’affaire.

Tu n’es jamais passé par un logiciel de son, ou même de vidéo pour recoller ensemble ? Tu as toujours tout fait avec ton téléphone ?

Oui.

Tu places comment ton téléphone par rapport à toi ?

Quand c’était pour des vidéos de concours assez loin sur un trépied pour filmer en même temps. Quand c’est pour travailler je le mets sur le pupitre en faisant attention à le mettre sur le côté, à l’horizontale et pas à la verticale. En gros, si je le mets à la verticale les micros qui sont en dessous sont en appui sur le pupitre donc c’est étouffé. Et j’essaye de bien me reculer parce que vu que le basson ça projette dans tous les sens, si je suis trop près il n’y a que certaines harmoniques qui passent et les fuites d’air… Mes profs m’ont toujours dit que pour enregistrer un basson il faut que tu prennes le plus d’espace possible.

Et tu as dû faire des réglages sur ton téléphone, il y a un auto gain ou tu n’as rien fait ?

Non, rien de particulier.

Comme tu dis, la dynamique est compressée ?

Oui, je pense. Tu parles justement des dynamiques, les nuances ce n’est pas du tout un truc que j’évalue. Déjà ce n’est pas le but dans mon travail et je ne pense pas que le téléphone puisse aider à ça.

Et tu reconnais ton son ou pas ?

Oui mais ça justement c’est le travail que veut mon prof. Il veut que je me forge un son et ça je n’y suis pas encore. Pas vraiment on va dire.

Tu t’es habitué à ce son que tu entends mais ce n’est pas forcément ce que toi t’entends quand tu joues ?

Je n’ai pas un son fixe, j’ai changé d’instrument il y a peu de temps, j’ai changé de marque et mon prof me fait changer d’esthétique donc je n’ai pas une base stable sur laquelle je peux me reconnaître.

Et est-ce que tu as des références de son d’autres gens ? Ou d’enregistrements ? J’ai essayé d’écouter le son des enregistrements d’orchestre de mon prof. Déjà quand je veux travailler une esthétique de son au basson je vais essayer de chercher le peu d’enregistrements qu’il y a sur internet, d’orchestres avec un basson français mais c’est très ciblé sur la problématique d’un instrument.

Tu entends des différences de son entre les bassons français ?

D’un musicien à l’autre ? Pas tellement parce que ça s’uniformise beaucoup. Surtout qu’on joue tous la même marque et que chez Buffet-Crampon la qualité et le défaut c’est que c’est très neutre. Ça lisse beaucoup les personnalités de son, c’est hyper académique, c’est pareil pour les clarinettes. Donc au moins l’avantage c’est que tu sais qu’on ne va pas te reprocher des défauts mais j’estime qu’on va te trouver moins de qualités individuelles, sauf chez certains rares excellents musiciens. Mon professeur tu le reconnais parce que lui c’est un peu un cas à part.

Quand tu enregistrais par exemple avec les ingénieurs du son tu les connaissais d’où ?

C’était les étudiants en prépa son à Chalon-sur-Saône qui étaient en train de préparer les concours pour la Formation Supérieure aux Métiers du Son. C’était avec les micros à la fois du conservatoire et de Nicéphore Cité. Il y a eu en plus des problèmes de quels micros utiliser, de réglages. C’était des premières années qui m’enregistraient à l’époque et qui n’avaient pas forcément la même expérience des micros et des réglages. Et au final il y a eu beaucoup de problèmes de comment régler les micros.

Et toi le son te plaisait ?

La reconnaissance d’une bonne esthétique de son n’a jamais été mon fort donc j’ai laissé mon professeur faire.

Est-ce que tu as l’impression quand tu joues pour un micro d’adapter ton son ? Il y a quelque chose qui change ou tu joues vraiment pareil et ça ne change rien ?

À la base je ne change pas et justement quand tu fais des enregistrements pour un ingénieur du son tu t’adaptes par rapport à ce que perçoit le micro sur le rendu studio.

Tu adaptes quoi par exemple ?

Tu peux adapter ta manière de timbrer, ta justesse sur certaines notes. Il y a des fois des harmoniques qui passent ou qui ne passent pas, donc en fonction, en changeant ton placement, ta longueur de note forcément, en fonction de la réverbération qui est prise par le microphone, tu augmentes tes attaques pour détacher. Un peu comme si tu t’adaptais à une acoustique quand par exemple tu fais des répétitions d’orchestre, que tu es dans une acoustique avec telle réverbération ou qu’il n’y en a pas justement et que tu te retrouves à jouer dans une église qui a 10 secondes de réverbération. Dans ton expérience de musicien tu apprends à adapter ton attaque et c’est un peu pareil avec un micro.

C’est avec les micros, mais toi avec ton iPhone tu as moins cet enjeu j’imagine ?

Quand je m’enregistre avec mon téléphone, déjà quand c’était pour le CNSM de Lyon, le fait que tout le monde doive faire un enregistrement téléphone, tu savais que dans l’évaluation des vidéos il y avait certains paramètres qui étaient de fait éliminés, donc tu enlevais ça. Sinon quand je me sers de mon téléphone c’est plus pour travailler le contrôle d’homogénéité de son, je vais vraiment voir si chaque note est timbrée de la même manière. Et aussi le travail de la régularité rythmique, de la justesse mais pas forcément des paramètres plus fins et plus précis, vraiment de l’écoute de base on va dire.

On a déjà un peu parlé, comment tu te sens quand tu joues pour du public ou quand tu joues pour un enregistrement ?

De toute façon, que ce soit avec du public ou avec un micro, j’ai une fâcheuse tendance à être un énorme stressé, donc forcément le fait d’avoir du public et surtout un micro ne m’aident pas quand j’en prends conscience.

Donc dans les deux cas c’est pareil ?

Oui. Ce n’est pas forcément le même stress. Il y en a un où c’est vraiment le stress d’en mettre une à côté et l’autre où c’est le stress de ce que je peux dégager. Je sais que dans une performance live il peut se passer des choses et que le but c’est soit que ça ne se remarque pas, soit tant pis. Mais ça ne m’affecte pas. L’autre c’est qu’il n’y ait rien qui aille à côté.

Et tu arrives à te libérer musicalement pendant l’enregistrement ou tu es vraiment coincé ?

Ça dépend de mon état physique, de mon état de fatigue et de mon état mental au moment de la prise. Mais comme à un concert en fait. Si tu arrives sur scène et que tu sais que tu es préparé, que physiquement tout va bien et que tu as mangé, que tu te sens bien, tu stresses moins que si tu as eu ton train en retard et que tu es en stress ou que dans ta vie ça ne va pas, tu es naturellement plus crispé, forcément ça joue aussi.

Est-ce que le lieu, la salle, c’était un critère important pour toi pour enregistrer Lyon ?

Disons que j’étais au conservatoire de Chalon, donc forcément j’étais dans des salles qui avaient une bonne acoustique. Et je m’arrange toujours quand je travaille à Chalon pour être dans des salles avec une acoustique qui marchait bien pour le basson. Là où par exemple quand je m’enregistre pour le travail à Lyon, déjà quand on connaît la problématique d’avoir des salles de travail en tant qu’instrumentiste, que ce soit à Paris ou à Lyon, tu te contentes de ce que tu as. Dans notre cas, à Lyon tu te contentes des box du 4^e étage qui résonnent à mort. Ce qui fait que de toute façon tu n’as pas le choix et tu fais avec.

Tu disais que tu préférais la spontanéité de t’enregistrer seul par rapport à faire ça avec quelqu’un ?

Pour le travail ça va, sauf si c’est pour envoyer une vidéo à mon professeur parce qu’il y a forcément un côté bon élève qui n’a pas envie de se faire engueuler et qui a peur d’envoyer n’importe quoi. Mais si c’est juste pour du travail, et c’est ce que demande mon prof, il n’y a pas ce soucis là. Par contre ça peut être le travers d’un enregistrement de concours, et justement ce qui était bien avec ma prise envoyée à Lyon c’est que c’était dans la spontanéité mais que si tu cherches à vouloir absolument le truc parfait, que ça provient du fait que tu aies passé les deux heures avant à faire des prises qui étaient plus ou moins bonnes, forcément ça va peut-être s’orienter vers un truc un peu plus scolaire.

Que si tu fais avec quelqu’un ?

Oui. Enfin si tu fais devant public. Et je pense que si tu leur files le même programme pendant deux heures et qu’ils te corrigent, à la fin tu obtiendrais cette même bouillie scolaire. C’est plus le contexte du micro que le micro en lui-même.

Et la présence de quelqu’un, le fait d’avoir quelqu’un qui t’écoute, est-ce que ça t’aide ou ça rend les choses plus dures ? Dans le contexte d’enregistrer avec quelqu’un pour un concours.

Non. Si j’enregistre avec un micro ou quelqu’un derrière le micro ça ne me change pas forcément. De toute façon le problème est le même, c’est qu’il y a un micro qui t’enregistre et que tu dois l’envoyer à la fin. Pour moi c’est plus le truc qui peut intervenir.

Et le fait que quelqu’un puisse te donner un feedback ?

Ça ne me stresse pas, au contraire. Je le prends juste comme étant une aide dans le bon sens. C’est l’aide qui est là pour m’éviter d’écouter la vidéo. C’est un gain de temps. Si, justement, tu choisis une personne qui a un bon avis là-dessus, ça t’évite de perdre ton temps à réécouter ce que tu as fait. Du coup tu es deux fois plus efficace.

Est-ce que ça t’aide aussi que la personne te dise que tu es fatigué, qu’il faut faire une pause, ou ça tu arrives à le gérer toi-même ?

En général, quand ça arrive la personne ne prend pas l’initiative. Elle me confirme que je le sens venir et je demande conseil. De toute façon ce n’est pas dur au basson, quand tu commences à être fatigué tu as les lèvres qui n’y arrivent plus. En fait, ce que tu fais n’est plus bon parce que tu as une fatigue qui influe sur la justesse. Si tu ne tiens plus ton anche, tu vas avoir un autre muscle de la bouche qui va vouloir compenser, du coup pas de la même manière, et si tu tiens plus ou moins ton anche tu vas être plus ou moins haut et tu perds en stabilité de justesse, donc la fatigue ça se paye.

C’est toujours la fatigue physique qui arrive avant la fatigue mentale ?

Oui, en général.

Et financièrement, tu les avais payés les ingés son ?

Non.

C’étaient des étudiants ?

Oui.

Pour toi c’est un frein ou pas de devoir payer les gens si tu as besoin de faire une vidéo ?

Je pense que si j’ai besoin de faire une vidéo pour un concours international par exemple, comme ça peut arriver pour des cordes, ou un concours de musique de chambre, ça dépend du prix. Mais tout comme un musicien est content d’être payé, de cachetonner quand on joue, je comprends qu’un ingénieur du son qui consacre du temps de présence soit rémunéré. Ce n’est pas forcément un frein, ça dépend, c’est comme justement en fonction du niveau d’importance de ton concert tu vas être plus ou moins payé, c’est pareil. Si c’est pour un petit enregistrement sans importance je ne vais peut-être pas demander à un ingénieur du son de venir ou d’être payé. Je pense que je lui demanderais plutôt de ne pas venir parce que je comprends qu’il veuille être payé. Mais pour un CD ou une préparation de gros concours, s’il a d’autant plus un rôle de direction artistique, pour moi c’est du même enjeu que le rôle du musicien en lui-même.

Donc pour toi faire appel à quelqu’un ça dépend surtout de l’enjeu. Si tu veux enregistrer avec quelqu’un, est-ce que tu sais à qui demander autour de toi ?

L’avantage d’être passé par Chalon et de connaître les prépa son qui remplissent allègrement les promos de Louis-Lumière et du CNSM, et d’avoir été présent à Chalon depuis maintenant une dizaine d’années, c’est que ça en fait des gens à contacter, j’ai cette chance-là.

Tu ne passerais pas par l’ingénieur du son du CNSM de Lyon du coup ?

C’est galère, tu es obligé de booker six mois à l’avance et tu as des créneaux hyper courts, dans un CNSM qui n’est pas forcément adapté pour. Ce n’est pas hyper pratique. Là où je sais qu’en passant par un ingénieur du son de Paris tu peux avoir des locaux peut-être plus adaptés.

Tu avais envoyé plusieurs vidéos à ton prof pour Lyon ? Comment ça s’était passé ?

Philippe me demandait même des vidéos de travail, il me demandait de lui envoyer une vidéo tous les trois jours, c’est sa méthode. Du coup comme pour mon prof particulier, qui est son collègue à l’orchestre, je lui envoyais des vidéos et il me faisait des feedbacks. Philippe s’enregistrait lui-même sur le programme puisque c’étaient des pièces qui avaient très peu de versions, comme ça j’avais une version, en plus sur le basson français, que j’imitais au final. Parce qu’il trouve que je suis notamment bon sur le fait de recopier un geste musical. On a beaucoup travaillé comme ça par échange de vidéos.

Oui parce qu’en même temps vous n’aviez plus de cours en présentiel.

Non. Sachant que ce n’était pas mon prof aussi. C’est une tradition chez les bassonistes en France, dans les deux CNSM, de prendre les élèves qui préparent les concours gratuitement et de leur faire tout un suivi.

Est-ce que toi, si jamais tu avais accès à une formation sur le son dans ton école ça t’intéresserait ou pas ?

Pas forcément, parce que soit mes conditions d’enregistrement me suffisent, soit il y a des gens qui seront plus qualifiés que moi avec ma formation. Donc autant faire directement appel à des gens qualifiés.

Entretien n°8

Le 19/06/2023

Est-ce que tu peux te présenter ?

J’étudie actuellement la direction d’instruments à vents à la Haute École de Lucerne. Avant j’ai étudié le saxophone à la Haute École de musique de Lausanne. J’ai étudié en parallèle quand j’étais à Lausanne aussi la direction d’orchestre, c’était un double cursus que j’ai fait. Et puis je joue du saxophone et je dirige, c’est mon activité principale. Je dirais que je dirige plus que ne je joue maintenant. Je pense que je suis plus à 80% de direction et 20% de musique effective à l’instrument. Je dirige des orchestres, des chœurs, des ensembles à vent, plein de trucs.

Tu étais en classique ou en jazz en saxophone ?

J’ai fait les deux. J’ai commencé par le jazz et j’ai fait classique après. J’ai fait les deux à Lausanne.

Tu es en master maintenant ?

Non, je refais un bachelor ici.

Tu as déjà fait des enregistrements, est-ce que tu peux expliquer les différents projets que tu as fait ?

Il y a déjà les enregistrements de vidéos d’entrée qui est le premier truc que j’ai dû faire et qui consistaient à faire des vidéos pendant la période covid. Dans le cadre de mes études je n’en ai pas fait beaucoup plus que ça, par contre ce que j’ai fait beaucoup c’est des enregistrements en studio et j’ai aussi dû faire des enregistrements vidéo quand je dirigeais l’orchestre pour participer à des masterclasses. J’ai beaucoup plus fait ça que des enregistrements vraiment dans le cadre de mes études. À Lausanne en jazz on avait tout un cours de musique assistée par ordinateur donc là on a pas mal enregistré en studio, c’était assez intéressant.

Donc les vidéos d’entrée tu as fait ça en 2020 ?

Pour Lucerne. En fait, avant, on ne devait pas faire de vidéos, c’était la nouveauté covid donc j’ai dû faire ça en 2020 oui.

Tu n’avais fait que Lucerne ?

Oui, j’ai enregistré des vidéos seulement pour Lucerne. Cette année-là, je n’ai fait que Lucerne et je suis rentré ici. C’étaient des vidéos où on devait diriger en fait. Il y avait une répétition et un concert, on devait se filmer en répétant avec l’orchestre et en faisant une œuvre de A à Z en version concert, ou un mouvement, je ne me rappelle plus.

Comment tu faisais avec le covid pour répéter avec un orchestre ?

En Suisse on avait quand même la possibilité, en tout cas à cette période-là précisément de pouvoir le faire. Je me rappelle qu’il y avait les cordes avec les masques et les vents qui devaient être à distance. C’était assez compliqué pour placer les micros.

Pour ça tu as fait appel à quelqu’un pour le faire ?

Non, je l’ai fait moi.

Comment ça s’est passé ? On peut commencer par la technique.

Alors les enregistrements d’orchestre, je dirais que j’en ai bien fait une quinzaine maintenant, donc je commence à connaître un tout petit peu. Je ne parle vraiment que pour moi, je n’ai rien fait de professionnel. Je te parle de devoir enregistrer quelque chose de précis pour pouvoir participer à une masterclass ou à un cours. Dans ce cadre-là j’en ai fait pas mal. Ça devient toujours mieux. Sinon en termes techniques j’utilise Protools par principe, c’est là-dessus que j’ai étudié à Lausanne. Comme micros j’avais des AKG C414 pour les cordes et les bois. Sinon j’avais mis des micros d’ambiance, j’avais mis des Shure KSM141.

Tu as une carte son ?

Oui, j’avais une carte son. C’est toujours du matériel que j’empruntais, ce n’est pas le mien. J’avais un copain ingénieur du son qui me prêtait son matériel.

C’est lui qui te conseille les micros aussi ?

Oui en fait il était assez cool parce qu’il savait bien que ça ne devait pas être quelque chose de professionnel, du coup il me conseillait et il me disait comment les placer. Après j’ai fait moi et j’ai appris un peu sur le tas.

Comment tu places les micros ?

Chez les cordes et les bois j’utilise les mêmes micros et je les mets à peu près la même chose, parce qu’ils n’ont pas la dureté des cuivres et percussions vu que ce ne sont pas des micros dynamiques, je veux dire qu’il faut quand même faire un peu attention, et puis ça ne sonne pas terrible sinon. Du coup je les mets relativement proches en fait, enfin dessus.

Par exemple sur les cordes ?

Oui j’en mets un par registre. Je revenais un peu au vieux système d’orchestre européen, je mettais 1^ers violons à gauche et 2^nds à droite pour que ça ne se noie pas trop et je trouvais que c’était plus facile à mixer après.

Donc tu as cinq micros cordes ? Et les bois ?

Les bois je mettais aussi par famille d’instruments.

Et cuivres et percussions rien ?

Si, c’était pris par les micros d’ambiance. J’en mettais pas mal, des espèces d’overheads par-dessus. Pour la percussion, s’il y avait des claviers je mettais sur les claviers, sur les timbales, sur tout. Sinon le reste j’avoue que c’était plus anecdotique. Ce qui était important pour moi ce n’était pas vraiment qu’il y ait une très grande qualité du son, c’était juste que ça sonne à peu près bien. Parce que c’est toujours compliqué quand tu fais de la direction, le but c’est aussi qu’ils voient que quand tu diriges ça sonne bien. Et c’est clair que si tu enregistres à l’iPhone tu prends un peu des risques.

Tu as vraiment des micros par instrument ? Est-ce que tu mets des micros un peu globaux aussi ? Tu parlais d’ambiances.

Oui, ça je mettais. Généralement j’enregistrais soit dans une salle de répétition soit sur une scène donc je mettais vraiment des espèces d’overheads croisés, assez en hauteur, présents dans la salle. Je n’ai pas fait ça tout le temps, je l’ai peut-être fait les dernières fois.

Comment ça se déroule ?

Quand je l’ai fait, généralement ce sont des orchestres que je dirige avant donc je prends une heure de la répétition pour faire ça. Ils sont au courant, ça peut être un accord qu’on a où je leur offre 3-4 répétitions qu’ils n’ont pas besoin de me payer par exemple. On fait des lectures et ensuite on enregistre. Après c’est moi qui fais tout puisque sinon ça me coûterait trop cher.

Tu es à la place du chef et tu as ton ordinateur à côté ?

Oui. Ça, c’est dans le cadre où je dois avoir des œuvres précises pour les masterclasses. Il y a d’autres trucs où tu dois juste envoyer des vidéos où tu diriges déjà. Là il y a eu des concerts qui étaient enregistrés du coup ce n’est pas moi qui me suis occupé de ça.

Tu as fait combien de fois pour les masterclasses ?

Une dizaine de fois je pense. Pour des masterclasses, des workshops, des cours, des retours de profs. Par exemple après les masterclasses je garde des contacts avec les professeurs donc des fois je leur envoie des vidéos et ils me font un retour. Des concours aussi.

Et ça tu ne le fais plus ? Tu parles au passé.

Là j’ai fait une pause, je pense que ça fait une année que je n’ai pas refait de masterclass, je n’ai pas prévu d’en faire cet été. Mais je pense que l’année prochaine ça va repartir.

Si on reste dans la partie technique, comment tu rééquilibres toutes tes pistes ? Honnêtement c’est un truc que je n’ai pas trop fait moi-même. J’utilise Protools et je fais le strict minimum que je sais faire. Je règle les balances, je fais plein de trucs. Parfois je peux mettre un peu de réverbération. Je fais vraiment du mix très simple. Après je ne le fais pas dans le détail, j’ai un copain qui fait ça très bien à qui j’envoie les sessions Protools. Je fais un mix, je fais mes cuts, je mets la réverbération qui me plaît et je règle un peu la balance et les choses comme ça, mais je ne fais pas de mastering et je ne fais pas un mix poussé du tout parce que je sais pas le faire.

Tu fais une balance globale mais pendant le morceau tu ne touches rien ?

Exactement.

Et tu répartis dans l’espace aussi ?

Oui.

Après il te renvoie un audio mixé et toi tu colles sur ta vidéo ?

Voilà. Généralement aussi, en tout cas les dernières fois, je m’étais mis un micro pour qu’on m’entende si je devais faire des versions de répétitions. Je mettais sous le lutrin.

Tu as toujours fait comme ça ?

Disons qu’au début j’avais moins de micros, moins de matériel. En fait je remarque que plus tu investis de temps pour faire quelque chose de bien, et plus ils ont l’impression que tu es motivé. C’est à double tranchant j’ai l’impression. C’est comme si tu te présentes dans une école avec un super truc ils vont se dire : “ah ok il est motivé pour faire quelque chose”.

Donc tu arrives à une grosse dizaine de micros ?

En tout oui. La dernière fois j’avais 18 entrées, quelque chose comme ça.

Et c’est quelque chose que tu aimes bien faire ?

J’aime bien faire tout jusqu’au moment où je suis sur Protools.

Donc installer les micros ?

Oui. Peut-être aller chercher des références de micros. Du coup j’ai un peu fait à Lausanne mais c’était vraiment juste de la surface quoi. J’aime bien aller regarder des vidéos sur Youtube, écouter des podcasts sur comment placer un micro, des trucs comme ça. Cet aspect-là me plait assez bien, après pour le reste je ne suis pas très à l’aise dans le travail derrière l’ordinateur.

Pour la post-production ?

Oui.

Quand tu fais la post-production, tu écoutes avec quoi ?

Alors j’ai des enceintes mais passives, qui sont branchées à mon ordi. À un moment j’étais au casque Bluetooth, pas fou, dans le sens où ça filtre quand même beaucoup par principe, vu que c’est Bluetooth, c’est actif. Je ne connais plus les références.

Tu as acheté les enceintes pour ça ?

Oui et aussi parce que je fais de la composition et d’autres trucs donc c’est bien d’avoir des bonnes enceintes.

Pour filmer tu utilises quoi ?

Je crois que c’est une Canon, une caméra.

Et c’est toujours en plan fixe ?

Oui.

Si on parle plus de la séance d’enregistrement, comment ça se passe, comment tu gères ça ?

Avec l’orchestre généralement ça se passe très bien, parce que je sais exactement ce que je dois faire. Donc si je dois faire une version concert et qu’une prise n’est pas bonne j’arrête tout de suite. Même si je ne trouvais pas bien la première note, on arrête. C’est le principe d’une session studio même si ça n’a rien à voir avec une session studio. J’ai pu vivre des sessions studio mais pas forcément dans le cadre d’une masterclass. J’imagine que ta question c’est de savoir comment ça se passe au niveau du ressenti.

Dans un premier temps dans l’organisation de ta séance. Tu dis que tu dois enregistrer un filage et une partie de travail, comment tu gères ça ?

Quand je devais faire les deux généralement la partie de travail est entre guillemets biaisée parce que j’ai préparé ma répétition. Donc je devais faire une répétition de vingt minutes. En fait ils n’avaient pas besoin de bien jouer, au contraire. J’exagère un peu mais moins bien ça joue plus il y a l’effet “waow” donc si à la fin de tes vingt minutes tu as décidé de ne travailler que quinze mesures, ou même moins, cinq mesures. Si ces cinq mesures ont fait “wow” c’est ça qui est intéressant, en tout cas dans ce cadre-là. Ça ne demande pas beaucoup de préparation pour eux en tout cas. Ce que je faisais tout le temps, c’est que je commençais par les versions de concert, c’est quelque chose qui demande plus de concentration et il faut être un peu plus réveillé des deux côtés. Ensuite je faisais la partie répétition parce qu’ils doivent juste faire comme d’habitude.

C’est sur combien de temps, un service de 3h ?

Oui, généralement ça me prenait un peu moins, 2h-2h30. Généralement les répétitions chez nous c’est plutôt 2h, maximum 2h30.

À la fin tu arrives toujours à obtenir quelque chose qui te plaît ?

Oui, ça me satisfait dans le sens où, de nouveau, je sais déjà que ce que je fais est au-delà de ce que généralement les gens demandent pour présenter normalement à une masterclass. Ils ne demandent pas du tout d’avoir un enregistrement professionnel. Il y a beaucoup de gens qui envoient juste un Zoom posé sur un lutrin ou des trucs comme ça. Au-delà de ça, ce n’est pas forcément ce qui les intéresse beaucoup, je crois que c’est plus la technique de travail que la qualité de l’enregistrement. Mais comme je disais avant, j’ai l’impression que c’est un plus, parce qu’ils sentent que si tu fais ce travail-là, c’est que tu as vraiment envie de le faire.

Et au niveau de la qualité musicale, tu arrives à trouver ton compte en 2 heures ? Avec l’orchestre, si vraiment je viens de commencer à lire, généralement jamais, c’est impossible. Si je dois faire un filage d’un mouvement de 8-9 minutes je prends déjà 1h pour faire entre guillemets la partie répétition. En juste 1h je n’arrive pas à faire un truc qui me satisfait. Donc non.

Comment tu fais du coup ?

Je garde la meilleure version. Je ne peux pas faire de service en plus.

Tu disais que pour les musiciens ça ne change rien de faire l’enregistrement, est-ce que pour toi, dans ton état d’esprit ça change quelque chose ou pas ?

Moi ça me change. De toute façon je pense qu’il y a un truc stressant de manière générale parce qu’on a l’impression qu’il y a quelque chose qui reste tout le temps. Ça c’est pour tous les enregistrements que j’ai fait, puisque j’ai fait du studio avec des trucs rock, funk, de la chanson etc. De manière générale on a l’impression que quand on appuie sur rec c’est stressant. Pour moi, il y a aussi un côté où je ne suis plus tout à fait naturel quand je fais ça. J’ai l’impression de devoir être une espèce de carte postale, je dois pouvoir montrer tout ce que je sais faire. Par exemple, pour aller dans une masterclass où je dois faire une répétition, j’ai l’impression que je dois travailler et le geste, et l’intonation, et la musicalité, et le son… Du coup j’ai toujours ces petites cases qui me disent n’oublie pas de faire ça. En tant que chef il y a quand même pas mal de trucs à faire, il y a mille facettes d’un chef et c’est toujours intéressant de pouvoir montrer tout ce que tu sais faire. Cet aspect-là je l’appelle carte postale, c’est une espèce de checklist et puis il y a une espèce de règle à suivre. Si tu commences ta répétition et que c’est un chantier phénoménal ça ne sert à rien de parler de la grande musicalité. Il y a aussi un ordre des choses à faire. Donc de ce point de vue-là je suis un peu plus robotique que ce que je ferais en répétition normalement.

Et sur un filage ?

Sur le filage, je pense que je ne suis pas tout à fait naturel non plus, dans le sens où j’ai aussi envie d’être une carte postale du chef et du visage aussi. Du coup, je sors un peu de ma trousse à outils les choses que j’ai.

Oui du coup ça te change, le public d’habitude ne voit pas ton visage ?

Oui exactement. Ça a arrêté de me stresser puisque je le fais même pour moi tout le temps, j’enregistre mes répétitions et je les reregarde pour me faire une autocritique, donc je n’ai aucun problème avec le fait de me voir. Je n’aime pas ça, comme tout le monde j’imagine, mais ça ne m’énerve plus parce que je le fais hyper régulièrement.

Et le fait de faire ça régulièrement ça t’aide à faire abstraction ou pas ?

Oui complètement. Je pense vraiment que deux fois par mois j’enregistre mes répétitions pour les revoir, pour moi. C’est juste pour voir comment je travaille, s’il y a des choses à changer dans le geste, dans la manière de travailler etc.

Tu sens une différence entre quand tu joues et quand tu diriges ? Est-ce que c’est le même état d’esprit ?

Non ce n’est pas pareil. Quand je joue je suis très rivé sur le son que je produis, tandis que quand je dirige, j’essaye déjà de faire attention à ne pas faire de bruits autres que rien. Parce que c’est vrai que des fois tu réécoutes, et tu t’entends chantonner, ou faire du bruit avec les pieds, il peut y avoir plein de choses. En fait tu ne produis pas de son donc tu n’es pas du tout dans la même logique quand même.

Mais tu produis le son de l’orchestre en même temps…

Oui. Je m’imagine en train de m’enregistrer avec mon instrument, je serais vraiment très très concentré sur la projection. Tandis que quand je dirige, je ne parle vraiment que du cadre d’enregistrement de masterclasses, je fais plus attention à ce que je dégage.

Si l’on revient au saxophone, en classique tu n’as jamais eu besoin de faire des enregistrements ?

Si, j’en ai fait pour de la radio, pour des trucs comme ça. En Suisse c’est la Radio Télévision Suisse, la RTS, et je jouais dans pas mal d’émissions, généralement ce n’était pas moi qui m’occupais du son, forcément. Mais sinon on a déjà enregistré des quatuors nous-même ou des trucs comme ça, pour pouvoir aussi participer à des concours. Je crois que ce n’est jamais vraiment moi qui me suis occupé de faire ça.

Et en jazz tu as fait du studio ?

Oui, là en jazz ou autre j’ai vraiment fait des sessions de studio. Chacun est dans sa

box.

Au casque ?

Oui.

En jazz c’était toujours dans le cadre de l’école ?

Non, en pur jazz, je n’ai jamais enregistré en quintet par exemple, j’ai plus enregistré de la section big band ou des sections de cuivres pour des chanteurs ou des groupes, ou même des groupes à nous. On a eu des groupes avec seulement des cuivres, on avait fait des reprises ou des choses comme ça. Pour ça c’était facile parce qu’on était entre nous.

Tu ressens quoi comme différence ? En saxophone tu as toujours fait enregistrer par quelqu’un et en direction tu as toujours enregistré toi-même… Est-ce que tu ressens une différence entre enregistrer seul et avec quelqu’un, même si les domaines sont différents ?

En direction j’ai déjà fait des sessions studio aussi, mais ce n’était pas du tout dans un cadre scolaire. Au brass band où je dirige maintenant on vient de faire un enregistrement pour sortir un album puisqu’on a fait des créations avec un compositeur anglais, du coup on a enregistré ces pièces. Ce n’était pas du tout une session studio, puisqu’on était dans notre salle de répétition, c’est la radio qui est venue enregistrer ça. Je pense que ce n’est pas du tout pour transmettre mais ils ont dû mandater la radio pour enregistrer. Mais du coup je n’ai pas du tout eu besoin de m’occuper de ça, il y avait quelqu’un qui était derrière sa console avec le casque. S’il entendait quelque chose qui ne lui plaisait pas il pouvait aussi couper. Moi je pouvais couper quand ça ne me plaisait pas. Le compositeur pouvait couper quand ça ne lui plaisait pas. Mais je ne me suis pas du tout occupé de l’aspect technique.

Et travailler avec plusieurs personnes pour faire la direction artistique ça te change quoi ?

Au début, je n’aimais pas trop ça par un truc d’égo bête, dans le sens où j’avais parfois l’impression qu’on pouvait ne pas tirer la même corde du tout. Et en fait avec le temps je me suis rendu compte qu’il faut toujours écouter l’ingénieur du son. Si, par principe, il a décidé qu’il fallait couper parce qu’il entendait des pieds il fallait le faire. Même parfois il y a eu des ingénieurs qui m’ont dit qu’il fallait que ce soit plus piano ou plus forte et en fait ils ont tout le temps raison.

Est-ce qu’ils apportaient des éléments que toi tu n’entendais pas ?

Oui clairement. Ça peut aussi être tout d’un coup une note qui a craqué et que toi tu n’as pas entendu parce que tu es dans le truc. Cela dit j’ai aussi dirigé l’orchestre, on avait fait un CD, on avait aussi laissé aux musiciens le droit de couper s’ils voulaient, si quelque chose n’avait pas marché, puisqu’on était en orchestre de chambre on devait être 23 ou 24. S’ils avaient vraiment planté un truc et que personne de nous n’avait entendu ils pouvaient dire : “on refait pour moi”.

Ils ne disaient pas à la fin de la prise ?

Non, ils disaient tout de suite comme ça on ne perdait pas de temps, on refaisait.

Et comment tu gères la séance d’enregistrement. Tu fais d’abord une grande prise ou tu prédécoupes ?

Là par exemple c’était facile avec le compositeur anglais, on avait des pièces qui duraient entre 5 et 10 minutes, ce n’était pas une pièce de 40 minutes. Donc c’était facile, on a fait 4-5 versions entières et ensuite après on a fait des découpages, qui étaient déjà prédéfinis. Évidemment tu joues toujours 2 mesures après et tu reprends 2 mesures avant. On faisait vraiment 25 mesures, on va deux mesures plus loin, on arrêtait, et ensuite quand on reprenait pour faire de 25 à 50 on reprenait à 23.

Si on revient à ta formation, tu as fait un cours de MAO, c’était obligatoire ?

C’était obligatoire pour tout le monde. Ils obligeaient aussi les logiciels sur lesquels on devait travailler. C’est à dire qu’on avait aussi des cours d’écriture de partition donc on était obligés de travailler sur Sibelius. On était obligés de travailler sur Protools etc.

Quand tu enregistres sur Protools, tu as une version achetée ?

À Lausanne ils nous avaient obligés à devoir payer notre Protools mais on avait un rabais étudiant, j’avais payé ça 150 CHF. Donc depuis ce jour-là je l’ai.

C’étaient quoi les objectifs de ce cours ?

Je pense que c’était un peu de la vulgarisation, puisqu’il y en a qui venaient déjà avec un joli bagage. En jazz beaucoup plus qu’en classique, il y a des étudiants qui peuvent venir avec pas mal d’expérience. Il y a des étudiants qui avaient déjà 30 ans, donc ils avaient déjà des grosses expériences de studio. Il y avait même dans ma volée un mec qui était ingénieur du son. Du coup on partait tous avec des niveaux… Moi typiquement je n’avais jamais fait ça, faire du Protools vraiment poussé. On a appris à faire de la composition, de la MAO, en MIDI. On est restés très en surface mais sur beaucoup beaucoup de trucs. C’était sur un an, on avait 2h par semaine. Mais on allait voir un peu partout, on avait fait des sessions studios. On avait pris des trucs connus, on devait faire des cover et le but c’était juste d’organiser une session studio et de se dire : “ok on s’organise, comment ça marche ? Tout bêtement, comment ça fonctionne ?”.

Et vous avez appris les différents micros ?

Oui.

Vous avez écouté différents micros sur un même instrument ?

Ça non. C’était plutôt : c’est comme ça que ça doit se faire. Ce n’était pas : c’est comme ça parce que vous pouvez venir écouter la différence pour vous rendre compte. C’est comme les histoires d’enceintes. Moi j’ai acheté des enceintes passives un peu par principe parce qu’on avait un prof qui nous avait dit que les enceintes actives c’était nul. Mais est-ce que j’ai vraiment vérifié… Je le crois.

Vous avez appris à écouter, à entendre un enregistrement ?

Ça on a eu. Ce n’était pas forcément écouter différents enregistrements mais c’était écouter où ça en était dans le processus. Par exemple quand on venait d’enregistrer, ensuite après un mix, après un mastering. Plutôt dans le sens de qu’est-ce qu’une étape peut apporter à un enregistrement, que vraiment écouter des qualités d’enregistrement.

Tu t’en sers quand tu fais tes enregistrements d’orchestre ?

Pour les masterclasses vraiment très peu. Mais par contre j’entends puisque j’ai fait pas mal de trucs pop et j’ai pas mal de groupes où j’entends vraiment la différence et j’arrive à dire ce que je trouve bien ou pas dans un mix ou dans un mastering par exemple.

Et sur du saxophone, est-ce que tu as des sons de référence de saxophonistes qui te plaisent ? Par exemple si tu enregistres et qu’on te fait écouter ton son est-ce que ça te choque ou est-ce que tu sais dire ce qui te plaît ou pas précisément ?

Oui. Déjà avec le temps je me suis rendu compte que le micro et la manière dont il était positionné ça faisait déjà tellement. Après je pense qu’on a déjà tous nos références de ce qu’on aime ou pas. Ça dépend aussi du style que je joue. Mais ça j’ai appris aussi à régler moi. C’est vrai que j’ai fait des sessions studio où j’ai vu un ingénieur du son qui m’a mis un micro n’importe comment et du coup je le replaçais.

Là tu estimes que tu sais faire tout ce que tu as besoin de faire en son ?

Je pense que ce que je pourrais faire de mieux et ce qu’il faudrait vraiment que je fasse c’est gérer Protools. Enfin dans le sens vraiment aller plus loin dans Protools.

Qu’est-ce qu’il te manque ?

Je pense que ce serait vraiment de faire un truc professionnel et aller chercher le détail. Mais je pense que je n’ai pas forcément l’oreille et les outils pour faire du mix. Je crois que le mastering ça ne m’intéresse pas vraiment. Pour vraiment faire du mix et juste me rendre compte de ce que je pourrais faire pour que ça sonne comme je veux. Des fois je me dis qu’il manque un truc mais quoi…

Est-ce que si tu avais accès à une formation, même si tu as déjà fait, tu le ferais ou ça te prend trop de temps ?

Ça dépend de ce que c’est comme formation. Je pense que ce dont j’aurais besoin ce serait juste d’avoir quatre, cinq fois 2h avec quelqu’un qui s’y connaît vraiment, que je puisse venir avec mes trucs et que je puisse dire là ça ne me plait pas à cause de ça, comment je pourrais faire pour régler ce problème, plus que pour avoir une énième introduction à Protools, chose qu’on a ici par exemple et qui était vraiment très longue. Je pense que si je le faisais je ne ferais pas un cours, j’irais voir un copain ou une copine et ce serait plus dans ce sens-là.

Donc plus avoir quelqu’un à disposition que vraiment avoir des cours.

Oui je pense.

Et pour ta documentation personnelle ou pour les réseaux sociaux tu ne fais jamais d’enregistrement ?

Non. Pour les réseaux sociaux… Je ne sais pas si je dois le dire parce que je ne voulais pas que ça se sache mais si tu fais ça… J’ai un compte Instagram où on ne voit pas mon visage, où je poste soit des répétitions soit des bouts de concerts de chefs d’orchestre que je trouve intéressants. Du coup ça m’arrive parfois, si ce sont des vidéos que j’ai prises sur Youtube par exemple, ou des passages qui ne sont vraiment pas fous de remixer un peu derrière aussi. Ce n’est pas pour faire ma pub, juste pour le plaisir. Après je le publie sur ce compte.

Et tu fais pas mal de création, de composition ?

Oui ça m’arrive. J’ai eu il y a une année pas mal d’activités par rapport à ça, pas mal de commandes où je devais écrire des trucs. Cette année un peu moins, ça ne me prend pas beaucoup plus de temps que ça. Mais je pense que j’écris un jour par semaine, je prends du temps pour composer.

C’est 100% de la musique assistée par ordinateur ?

Non c’est 100% musique classique. Donc si je compose c’est parce que j’ai reçu une commande et du coup c’est voué au live, pas du tout à faire de la MAO. Je ne fais pas d’électro ou de trucs comme ça. Par contre ce que je fais tout le temps c’est que je fais une version MIDI de mes pièces, soit pour pouvoir envoyer à la personne qui me l’a envoyée, pour qu’il puisse se faire une idée de ce qu’il a payé, ou alors ça peut être aussi pour moi des fois. Maintenant ça peut être assez cool ce qu’on peut faire avec un autre performer. Aussi pour me rendre compte de si l’idée est bonne, des trucs d’orchestration des fois. Des fois j’écris pour l’orchestre et j’ai une idée et je me dis “bon en fait ce n’est pas fou”. Pour ça je suis sur Sibelius et j’ai un autre performer, ensuite ça peut m’arriver de le rentrer sur Protools si j’ai envie de faire un mix après, mais sinon non.

Tu as acheté une banque de sons ?

Oui je l’ai achetée.

Sibelius tu l’as aussi acheté quand tu étais à Lausanne ?

Oui.

Ton ordinateur tu l’as acheté spécifiquement pour ça ?

J’ai une tour à la maison. Ça c’est une tablette que j’utilise pour me déplacer.

Tu ne joues plus de saxophone, tu n’enregistres plus ?

Non, j’ai fait une session studio il y a deux semaines donc je joue encore et j’enregistre. Il ne faudrait pas que je le dise mais je ne travaille plus mon instrument. Je cachetonne mais je ne vais jamais faire un concours de saxophone. Je ne travaille plus pour moi, je travaille pour un projet, si je dois jouer je vais travailler mon instrument pour que ça marche mais je ne vais jamais prendre 2h pour travailler ma technique. C’est un truc que je n’aime plus faire. Je pense que j’ai un espèce de rapport conflictuel avec l’instrument.

Les microphones que tu utilises c’est toujours à quelqu’un d’autre ?

Oui et non. Moi j’ai des micros dynamiques quand même à la maison, j’ai des Shure SM58, des Sennheiser MD421 et MD441 et sinon si je dois utiliser des statiques, je n’ai pas les moyens déjà, mais au-delà de ça, soit je les loue, soit je demande à un copain qui a quelque chose de bien.

Les dynamiques tu t’en sers pour quoi ?

Je m’en sers de moins en moins mais je les ai utilisés par exemple pour enregistrer des quatuors de saxophone, ce n’était pas fou. Mais je les utilise des fois pour enregistrer des bêtises avec des copains ou parfois j’aime bien quand je fais de la MAO enregistrer n’importe quoi, des bruits. Et sinon je les utilise un peu pour la scène.

Tu n’investiras pas dans des statiques ?

Non, je ne pense pas.

Et en vidéo ?

C’est la caméra de ma copine.

Quand tu as acheté les micros on te les a conseillés ? Pourquoi ces micros ?

Mon copain ingé son m’avait dit : “tu verras ça, c’est bien pour les cordes” mais pourquoi… Si tu veux à nouveau la référence il m’avait donné des AKG C414. Pourquoi il m’a donné ça, je ne peux pas te le dire…

Mais les dynamiques que tu as achetés ?

Je pense que quand je suis allé au magasin j’ai demandé des choses et ils m’ont dit : “ah il faut que vous achetiez ça, c’est un peu la référence”. Ou peut-être que j’étais allé sur internet. Parce que c’était un peu les micros qu’ils conseillaient par défaut.

Les enceintes tu as choisi comment ?

En fait, à la base quand j’étais à Lausanne je faisais tout au casque. J’avais mon casque Bose avec le Bluetooth qui se connectait à l’ordinateur. Bon, déjà je me suis rendu compte que ça me faisait assez mal à la tête si je faisais une session de 3h d’ordinateur, après je ne sais pas si c’était à cause du Bluetooth ou juste si c’est parce que c’était au casque. Et puis c’est quand même un confort d’avoir des enceintes. Quand je me suis dit que ce serait bien d’avoir des enceintes, je me suis rappelé de ce prof qui disait qu’il fallait prendre plutôt des enceintes passives, ne serait-ce que parce que le son n’est pas filtré. Je crois que c’est un copain qui me les avait conseillées. Il les avait achetées, il avait ça et c’était un bon rapport qualité prix. Mais de nouveau je n’ai plus la référence.

Tu n’as jamais acheté de Zoom ou de choses comme ça ?

Si, j’ai un Zoom. Pour les répétitions, quand je filme et que j’enregistre les répétitions pour moi, pour me faire un retour, j’utilise un Zoom.

C’est un Zoom qui fait caméra ?

Oui. C’est un H1N ou quelque chose comme ça. Des fois j’utilise des Zoom si j’ai envie d’entendre. Des fois quand je prépare un concours d’orchestre j’enregistre et je branche deux micros dans le Zoom, juste pour ne pas avoir qu’un son Zoom mais aussi faire un retour à l’orchestre de ce qui marche ou pas. Donc ça peut m’arriver aussi. Dans le contexte où on a une échéance avec un orchestre pour un concours, pas un concours de direction pour moi mais pour l’orchestre, des fois je réécoute à la maison et je leur refais un feedback. Je gagne du temps, ça fait une double répétition.

Le Zoom tu l’avais acheté au début de tes études ?

Oui. Même avant. Je me rappelle que je m’étais amusé à m’enregistrer ou à me filmer mais pas dans le cadre musical. Pour me filmer avec des amis en train de jouer, tu sais, tu fais un podcast.

Quand tu fais toutes tes installations de micros tu as déjà eu des problèmes techniques ? Comment tu gères ?

Plein de fois, je gère très mal. Je gère surtout mal parce que ça me prend un temps fou pour savoir où est le problème. Mais ça c’est aussi un problème de formation j’imagine. Mais entre savoir si c’est le câble, le micro, l’entrée XLR ou si c’est juste que Protools ne s’est pas bien lancé… Des fois je me prends la tête, c’est assez compliqué. Je pense qu’avec l’expérience ça va mieux. Enfin j’ai l’impression d’avoir de moins en moins de problèmes, ou en tout cas peut-être que j’en ai autant qu’avant, mais je les règle plus vite. Si tu me voyais à l’œuvre je pense que tu trouverais ça catastrophique.

C’est quand tu installes ou quand tu es face à l’orchestre ?

Non quand j’installe. Généralement j’y vais quand même bien à l’avance. Si je dois faire mon installation, c’est prêt quand ils arrivent.

Tu installes combien de temps avant ?

Ça peut m’arriver d’aller 2-3h à l’avance.

Et tu es tout seul ?

Oui. Il y a aussi un truc quand tu es tout seul, il faudrait peut-être que j’arrête mais je trouve ça plus cool d’avoir le temps et de faire seul. Tu sais où tu as mis quelle entrée et quel truc. Je vois sur scène des fois quand on fait des lives. J’ai fait pas mal de scènes où tu as l’ingénieur du son qui est derrière la table et l’autre qui dit : “ah j’ai mis ça en 13 mais il n’y a rien dans le retour”. Des fois j’ai l’impression que c’est prise de tête et que s’il y en avait un qui avait fait ça tout seul ce serait tellement plus simple parce qu’il sait ce qu’il a fait. Mais c’est clair que ce n’est pas comme ça que ça marche sinon on n’aurait jamais le temps. Mais disons que j’aime bien le faire parce que je sais ce que j’ai fait, je sais où il pourrait y avoir un problème au lieu de devoir tout repasser derrière.

Tu installes, tu vérifies que tout marche, et après tu prends un petit temps avec l’orchestre ?

Oui je fais un sound check, ça ne prend pas très longtemps.

Comment tu gères ta caméra, elle est en face de toi, loin ? Tu la coupes ou tu la laisses tout du long ?

Non je filme tout du long.

Et après comment tu mets le son et la vidéo ensemble ?

J’utilise Microsoft Clipchamp. C’est le logiciel vidéo de base sur tous les Microsoft, sur les PC.

Comment tu synchronises ?

Je fais des claps à chaque fois.

C’est quoi pour toi, quand tu entends tes enregistrements ou d’autres enregistrements sur internet, les critères d’un bon son d’orchestre ? Ou plus simplement, qu’est ce qui fait que tu te dis que tu aimes bien ou pas ?

Je pense qu’il y a plusieurs critères différents suivant le type d’orchestre. Si c’est un orchestre symphonique, je vais vraiment plus me concentrer sur comment ils ont géré les cordes. Parce que c’est quand même la colonne vertébrale de l’orchestre.

Si je devais être avec une harmonie par exemple, un ensemble à vents, plutôt le parterre clarinettes et bois. Et puis avec un brass band, plutôt les cornets et les euphoniums. De manière générale, plutôt les musiciens qui sont assez proches du chef, je pense que c’est un peu la charnière. Après techniquement, je suis incapable de te dire pourquoi un enregistrement me plaît ou pas.

Donc quand tu dis les musiciens proches du chef, tu essayes de retrouver le son que tu entends de ta place ?

Sûrement. Il y a surtout un truc de balance générale. Par exemple dans les vieux enregistrements c’est vraiment flagrant, ça s’entend qu’ils ne mettent les micros vraiment que pour les cordes et que la petite harmonie au-dessus galère. Maintenant ça a quand même évolué, forcément, et la balance est réussie du coup. Mais je dirais que si tu as des vents qui ne sont pas très bien mixés ce n’est vraiment pas fou mais c’est vivable. Si tu as des cordes qui sont vraiment mal faites c’est juste imbuvable. Je ne sais pas comment dire, mais il y a un truc de qualité de base. C’est terrible à dire puisque je joue d’un vent, mais le son de l’orchestre est géré par les cordes quand même.

Est-ce que ça sonne pareil pour toi quand tu es à la place du chef et quand tu réécoutes ?

Pas du tout.

Qu’est-ce qui change ?

Il y a deux trucs. Déjà je n’entends pas la même chose si je suis à la place du chef ou si je suis 4 mètres derrière dans la salle. J’ai fait pas mal de fois où j’étais assistant et je me disais : “wow c’était la folie”, il y a des fois où tu te retrouves devant un pupitre, et des fois tu te retrouves 15 mètres derrière pour donner un feedback au chef. Donc ça, c’est déjà une grosse différence. Et puis celle de l’enregistrement est terrible, dans le sens où elle est révélatrice. Elle met en lumière ce que tu n’entends pas. Des fois elle est méchante, dans le sens où elle n’est pas réaliste en qualité de son effective, parce que ça filtre quand même. On ne peut pas tout capter avec des micros.

Ça filtre quoi ?

Je pense que dans l’extrême aigu et dans l’extrême grave il y a trop peu d’informations. Même si j’ai entendu plein de choses sur le fait que ce soit en train de se compenser. Mais au-delà de ça, il y a quelque chose de l’ordre de l’impalpable, des résonances, des vibrations, des énergies. Je ne suis pas tellement dans ce mood-là mais quand même, il y a quelque chose qui fait que l’enregistrement, forcément par principe ça ne va pas… Parfois c’est révélateur, parce qu’il y a en effet des choses qui n’ont pas marché, mais il y a plein de fois où tu te dis que c’était super et ce n’est pas que ça sonne faux ou que le son qui a été diffusé est mauvais, mais il n’y a pas le truc “wow” alors qu’en live il y avait le truc “wow”.

Pour toi c’est lié aux micros ? Est-ce que ça met en avant d’autres défauts ou c’est juste cette sensation physique de présence de l’orchestre et de résonance ?

Je pense qu’il y a aussi quelque chose de spirituel dans la performance. Il y a un espèce de dépassement de quelque chose, que quoi que tu fasses, il y a de toute façon des millions d’informations que tu vas vivre dans la performance que tu ne vivras pas dans la prise de son. Même si je suis le premier à consommer mille enregistrements et que j’adore ça et que je continuerai à adorer ça, il y a forcément quelque chose qui est de l’ordre de l’impalpable.

Ça c’est vraiment par rapport à un auditeur qui entend un concert enregistré ?

Ou même pour les musiciens.

Quand tu diriges, tu sens la différence dans ce que les musiciens donnent en enregistrement et en concert ? Par exemple, entre un filage enregistré et un concert, tu sens une différence dans ce que les musiciens jouent ?

Oui. En fait c’est peut-être de ma faute du coup. Je pense que je n’adopte pas le même comportement d’irradier ou de transmission d’énergie, ou même de transmission tout court quand j’enregistre que quand je suis en concert. Il y a sûrement moins l’aspect performance artistique et plus l’aspect performance technique.

Quelle en serait la cause ?

Si j’ai envie qu’artistiquement ce soit génial ça veut dire que je suis prêt à laisser tomber des trucs techniques de base qui seront moins bien pour la performance. En concert zéro problème, je m’en fiche complètement. Tandis que quand j’enregistre ça m’embêterait d’entendre que la technique n’ait pas marché, même si l’artistique est fou. C’est un peu comme si tu as deux jeunes musiciens et que tu dois dire quel est le meilleur, qui est le premier et qui est le second. Tu mets celui qui a fait la plus belle musique ou celui qui a les meilleures qualités techniques ? C’est la question bête, mais est-ce que tu vas privilégier celui qui a peut-être travaillé beaucoup plus son instrument, donc il a plus de technique mais sur le moment il n’a rien compris à la pièce, donc artistiquement c’était vraiment nul, ou alors tu vas privilégier celui qui a tout compris. C’est un débat sans fin j’imagine mais du coup quand j’enregistre j’ai ce problème et je me dis qu’il faut que ce soit super techniquement et moi aussi, il faut que je sois une très belle carte postale de ce que je sais faire et de ce que l’orchestre sait faire et du coup je ne vais jamais aller aussi loin dans mes choix artistiques.

Et d’un autre côté tes choix artistiques tu les montres pendant la séance de travail ?

Oui beaucoup plus.

Donc tu préfères privilégier la technique au filage et l’artistique au travail à côté ?

Oui.

On repart sur autre chose, est-ce que des fois tu as l’impression d’adapter, plutôt quand tu joues, ton mode de jeu au fait d’enregistrer ou pas ?

Je ne pense pas.

Tu disais que tu avais plutôt tendance à bouger le micro ?

C’est ça oui. Quand je joue, vraiment pas. Après, quand je dirige là oui, dans le cas où je dois faire mon histoire de carte postale.

Non plutôt dans le son.

Alors là vraiment pas, je joue comme d’habitude et je sais que je peux sonner comme ça, donc je sais qu’il faut qu’on fasse ce qui doit être fait pour que ça sonne comme ça.

Et en saxophone tu t’enregistrais pour travailler ou pas ?

Oui je l’ai fait, de plus ou moins bonne qualité. Mais ce n’était pas tellement pour travailler mon son, c’était peut-être plus pour me mettre une pression et me réécouter techniquement. Des fois j’avais un doute de l’ordre de l’interprétation, je m’enregistrais, je laissais une semaine à vide et je me réécoutais au bout d’une semaine pour ne pas que ce soit chaud. Je me disais : “mon dieu…”.

Quand tu dis pour te mettre une pression, comment tu te sens quand tu dois jouer pour un enregistrement, même pour travailler, est-ce que ça te perturbe ou pas ?

Je pense qu’il y a un truc humain, c’est qu’on n’a pas envie de perdre de temps donc on a envie que ce soit parfait dès la première, ce qui n’arrive jamais. Du coup, je pense que juste ça, ça amène du stress de se dire j’ai prévu 30 minutes pour faire ça et en fait on y passe 1h. C’est plus cette pression-là que la pression de me filmer.

Donc ça te prend souvent plus de temps que ce que tu prévois ?

Généralement oui. Mais des fois il y a des bonnes surprises.

Et justement par rapport à ça, quand tu fais avec l’orchestre, est-ce que des fois tu as l’impression de perdre du temps aussi ? Tu disais que dès que quelque chose ne te va pas, tu coupes. Est-ce que tu arrives à aller au bout des choses ? Comment tu le gères ?

En fait c’est la même problématique qu’en répétition, sauf qu’en répétition tu peux toujours dire qu’on verra ça la semaine prochaine, mais là tu ne peux pas. Si tu as vraiment buté sur un truc qui de toute façon ne va pas être réglé sur le moment tu dois faire avec. Mais je dirais que l’enregistrement de la répétition ne change rien, dans le sens où en tant que chef, tu dois juste trouver. Si tu veux régler le problème directement, que ça ne marche pas, que tu prends un chemin détourné pour essayer de régler le problème, que ça ne marche toujours pas et que tu reprends encore un autre chemin de manière à essayer d’être pédagogue, c’est exactement le même travail qu’en répétition, la problématique de l’enregistrement n’est pas différente.

Du coup quand c’est comme ça, tu envoies ça dans l’enregistrement ?

Oui, de toute façon ce ne sera jamais parfait.

Et sur les filages, est-ce que c’est comparable à ce que tu disais quand tu joues au saxophone, que tu ne veux pas perdre de temps et que du coup tu t’acharnes des fois ?

Là, je pense que c’est différent parce qu’il y a un délai. Dans le sens où en 2h30 il faut que ce soit dans la boîte. Donc je m’en rends assez vite compte si ça devient de l’acharnement ou pas, et je pense que de toute façon, à son niveau on a toujours quelque chose qui ne nous plaît pas. Après il y a différentes problématiques, si c’est vraiment la catastrophe, là ça devient compliqué. Même si c’est vraiment la catastrophe ce n’est pas compliqué, je pense qu’il faut faire avec.

Donc si on résume, le fait d’avoir une deadline précise, ça t’aide à faire le tri et à te dire bon c’est raté mais c’est moins grave ?

Oui clairement.

Quand tu fais tes checks de gain, tu as ton casque pour écouter ? Tu replaces tes micros ?

Oui, si, si.

Qu’est-ce que tu changes ou qu’est-ce qui te fait dire que tu vas bouger ton micro ? Beaucoup de choses, le son de manière générale. Je ne parle pas du volume, quand je dis le son je parle de comment ça sonne, en fonction de comment est la salle. Par exemple si j’ai une salle qui résonne très peu, je vais plutôt m’éloigner un peu. Enfin ça dépend de si j’ai des micros qui sont très directifs.

Donc tu prends ton temps quand même avec l’orchestre ?

Je dirais que je ne prends jamais plus de 30 minutes.

Tu arrives toujours à être satisfait ?

Je crois que je suis vite satisfait, aussi parce que je me dis que ce n’est pas professionnel. Je sais que de toute façon, c’est déjà beaucoup mieux que ce que 95% des gens font pour cette échéance-là. Si je devais mettre cette vidéo sur Youtube par exemple, je pense que je serais beaucoup plus pointilleux.

Si tu devais mettre sur Youtube tu passerais par quelqu’un ou tu ferais pareil ?

Non, je passerai par quelqu’un.

Il y a des enjeux pour lesquels tu passerais plutôt par quelqu’un que d’autre ?

Je pense qu’à partir du moment où ça ne me concerne pas moi et quelqu’un d’autre dans un cadre pédagogique, je le ferais passer par quelqu’un d’autre. Quand je dis cadre pédagogique c’est moi, un prof ou un copain qui me fait un retour, ce cadre-là. Si ça devient de l’ordre du cadre artistique, c’est-à-dire qu’on va faire quelque chose d’artistique avec ça, là je ne le ferais pas moi-même. J’aurais trop peur que ce ne soit pas de qualité. Ou en tout cas que ce soit trop tard, dans le sens où mal placer un micro, tu peux faire ce que tu veux au mix ça peut vite devenir compliqué.

J’imagine que des, fois tu as des salles qui ne sonnent pas bien, comment tu gères ça ?

Tout à fait, très mal. Moi je ne sais pas le faire. Je sais que maintenant tu peux beaucoup tricher quand même avec Protools, mais je dirais que ma solution la plus simple c’est que j’ai 4-5 salles qui ne sonnent pas trop mal. J’en ai une dizaine où je veux être sûr de ne pas aller du tout. Une fois que j’y suis, je dois régler le problème avec des positions de micros, des trucs techniques, je n’aurais pas les capacités.

Vu que c’est 2h-2h30 tu ne ressens pas trop de fatigue ?

Généralement je suis crevé après, mais sur le coup ce n’est pas un problème. Je pense que je ne suis pas plus fatigué qu’après une répétition normale, si ce n’est que j’y étais 2h avant la répétition pour tout installer et que j’y serai 1h après pour tout désinstaller.

Et concrètement tu es aussi tout seul à décharger ta voiture ?

Généralement oui, ça peut arriver que j’aie un copain qui vienne m’aider. Mais de nouveau, pour ça, je suis assez bien tout seul.

Quand tu prépares ta séance de répétition, tu te prépares différemment pour quelque chose que tu vas enregistrer et quelque chose que tu vas diriger ou pas ? Dans ton travail personnel.

Je prépare différemment parce que ce n’est pas une question d’efficacité, mais si je parle d’une séance d’enregistrement de masterclass, c’est toujours ce même truc où je sais que j’ai des critères et qu’il faut que je fasse tout travailler. Après, je crois que la dernière séance où on a enregistré pour ce compositeur anglais, je me suis préparé normalement. Ce n’est pas que je me prépare mieux, c’est juste que j’appelle ça une répétition post-it. Pour la masterclass j’ai entre guillemets des post-its, j’ai déjà des remarques prédéfinies. C’est de la poudre aux yeux. Par contre le geste je le travaille toujours pareil.

Tu arrives aussi prêt à un concert et à un enregistrement ?

Oui.

Le fait de passer par quelqu’un ou de le faire toi-même c’est vraiment une question d’enjeu ?

Clairement.

Ce n’est pas une question financière ou de gain de temps ?

C’est clairement une question d’enjeu, ce n’est pas une question financière puisque si je devais faire un vrai truc, j’imagine que je trouverais les moyens de le faire, je ferais des demandes de subvention. C’est de toute façon un gain de temps puisque je perdrais un temps fou à le faire moi.

Et pourquoi par exemple tes vidéos de masterclass tu choisis de les faire tout seul ? Ça se confirme, c’est que ça me permet de ne pas avoir besoin de faire des demandes de subvention pour faire des vidéos de masterclass. De gagner du temps peut-être dans l’organisation quand même, parce que si tu dois engager quelqu’un, régler tout avec lui ou avec elle, j’ai l’impression que je perdrais plus de temps que de tout faire moi-même et je me connais. C’est sûrement faux, parce si tu le fais une fois avec la personne, je pense qu’après tu peux le faire plein de fois et ça marcherait. C’est juste la première fois où il faudrait qu’on se mette d’accord sur quels seraient les enjeux, même s’il n’y en a pas tellement.

Quand tu enregistrais pour travailler le saxophone c’était avec ton Zoom ?

Oui, généralement c’était avec le Zoom, en tout cas au début. Après, des fois je me mettais juste un micro, un dynamique, juste pour pouvoir avoir au moins du plaisir à m’écouter.

Remerciements

Je souhaite remercier chaleureusement toutes les personnes qui m’ont aidée dans l’élaboration de ce travail.

C’est pour moi l’occasion de remercier toute l’équipe pédagogique de la FSMS, Denis Vautrin, Catherine Barbe, Muriel Charpentier-Leroy, Justine Huet, Virginie Evennou, Alexis Ling qui par leur énergie et dynamisme entretiennent un cadre d’études formidable et une formation riche et stimulante.

Un grand merci à l’équipe mémoire qui a su me guider pas à pas malgré la distance, Corsin Vogel, Valentin Bauer, Jean-Pascal Jullien.

Merci aux enseignants qui depuis le début de mes études m’ont transmis leur passion et leurs connaissances aussi bien sonores que musicales : Guillaume Dulac, Sebastien Tondo, François Eckert, Jean-Christophe Messonnier, Jean-François Boukobza, Yves Balmer, Anne Bassand, Thomas Ospital…

Merci à mes compagnons de la promotion 2018 : Clémentin, Jean-Baptiste, Léo, Rémi, Léonard, Jean et Alexandre, mais aussi à tous les autres étudiants FSMS qui m’ont embarquée dans de merveilleuses aventures.

Un immense merci à mes parents pour leur aide et leur soutien sans faille dans tous mes projets.

Merci à tous les participants interviewés qui se sont prêtés au jeu et qui ont enrichi mes réflexions, et merci à Raphaëlle, grâce à qui l’idée de ce sujet a germé.

Merci à la Haute École de Lucerne, où j’ai rédigé la plus grande partie de ce mémoire, et à toutes les formidables rencontres que j’y ai faites, qui m’ont aidée et soutenue à travers une première année riche en émotions.

Enfin, merci une nouvelle fois à mes parents ainsi qu’à Aude pour la relecture de ce travail.

Notes

Conservatoire National Supérieur de Musique et de Danse ↩︎
Haute École de Musique ↩︎
Musique Assistée par Ordinateur. ↩︎
Dans l’établissement concerné, l’UV4 correspond à un enseignement au choix de l’étudiant. ↩︎
Travail en autonomie obligatoire à réaliser à la fin des études secondaires en Suisse. Il fait l’objet d’un rendu écrit ainsi que d’une présentation orale et peut prendre plusieurs formes, par exemple une recherche scientifique ou bien une création artistique. (DFAC, 2023) ↩︎
Pour garantir l’anonymat, les prénoms ont été modifiés. ↩︎
Flûtiste qui forme un duo avec la participante. ↩︎
Enseignants du cours In House Recording. ↩︎
Salle d’ensembles. ↩︎
Salle d’ensembles. ↩︎
Académie d’orchestre du Verbier Festival. ↩︎
Auditions publiques. ↩︎
Académie d’orchestre ↩︎
Salle de concert de la Haute École de Lucerne. ↩︎
Une amie de la participante. ↩︎
Ensemble. ↩︎
Spectacle hybride entre musique, théâtre, projection sonore et vidéo à destination d’un public d’enfants, créé et interprété par la participante en 2022 à la Haute École de Lucerne. Pour la bande sonore, la participante a enregistré des rythmes réalisés par les enfants des écoles de Lucerne. ↩︎
Réalisateur en Informatique Musicale et enseignant de la Haute École de Lucerne. ↩︎
Récital de fin de Bachelor ou de Master. ↩︎
Entraînement aux auditions d’orchestre. ↩︎
Professeur d’instrument de l’étudiant. ↩︎

mai 18, 2026

De la place de l’artiste dans l’économie de l’industrie musicale

BAPTISTE LAGRAVE

Formation Supérieure aux Métiers du Son Directeurs de mémoire : Jean-Pascal Jullien et Matthieu Gazier

Septembre 2019

Remerciements

Je remercie sincèrement Mr. Jean-Pascal Jullien et Mr. Matthieu Gazier, co-directeurs de ce travail de recherche, pour leur expertise et leur disponibilité tout au long de ce travail.

Je tiens à remercier tout particulièrement Philippe Zdar pour son accompagnement personnel, professionnel et artistique durant ces 3 dernières années.

Merci aux compositeurs d’avoir accepté de partager leur expérience avec autant de réactivité : Romain Allender, Joakim Bouaziz, Christophe Chassol, Thierry Escaich, Jackson Fourgeaud, Pierre Juarez, Marie-Jeanne Serero, Thomas Roussel et Pedro Winter.

Je remercie l’équipe pédagogique du CNSMDP qui a permis via son accompagnement, la concrétisation de mes expériences professionnelles en toute confiance et sérénité, particulièrement Mr. Denis Vautrin et Mme. Marie-Jeanne Serero.

Merci à ma famille pour leur soutien à long terme et à mes parents pour leur relecture attentive. Merci à Adrien, Gauthier, Samuel, Stéphane, Thibault, Mathilde, Benedikt et mon chat Tina pour leurs encouragements !

Introduction

Durant les quatre années d’étude au Conservatoire National de Musique et de Danse de Paris, j’ai eu la chance d’être accompagné dans la réalisation de projets personnels et d’entreprendre une multitude d’expériences dans différentes structures : assistant auprès de Philippe Zdar à Motorbass Studio, un semestre d’étude à Los Angeles en cursus spécialisé de production musicale actuelle et en business de la musique, composition dans un projet musical autour de la musique sacrée, associant voix, orgue et musique électronique, puis plus récemment, développement d’un duo d’orgue et de musique électronique avec Thomas Ospital. Toutes ces expériences n’ont fait que confirmer ma passion pour la composition musicale.

Le sujet de ce mémoire s’est alors rapidement imposé : en tant que jeune artiste compositeur, il m’a paru judicieux de creuser dans les méandres de l’industrie musicale pour en comprendre plus sérieusement les rouages, les relations entre les différents acteurs afin de s’assurer une évolution sereine et avertie, tant sur le plan artistique qu’économique.

Une mutation immense de l’économie de l’industrie musicale a eu lieu ces dernières années, notamment en raison de la multiplication des offres de matériel de composition auprès du grand public, la dématérialisation de la consommation de musique avec le streaming, la chute vertigineuse de la vente de disques, l’émergence d’artistes en autoproduction.

Aujourd’hui, la finalité de la musique ne se limite ainsi plus à celle du CD. C’est une chance inouïe pour les compositeurs : multiplication de la variété des projets, et aussi diversification des revenus. En effet, les créateurs sont amenés à travailler dans la musique à l’image (cinéma, animation, jeu vidéo, publicité), à écrire de la musique pour le spectacle vivant (musique de ballet, de défilé, de soirée d’inauguration), à associer leur image à des marques, à proposer des concerts inédits.

Dans une première partie, je dresserai un état des lieux de l’industrie musicale en 2019 en décortiquant le rôle des partenaires du compositeur, ses droits et ses différents types de revenus. Ainsi, comment les artistes s’adaptent ils à la composition pour d’aussi nombreux supports et comment gèrent-ils leurs revenus ?

Puis, dans une deuxième partie, je mettrai en avant l’avis de différents artistes confirmés sur la place du compositeur dans l’industrie musicale.

Mots clés : auteur/compositeur, artiste-interprète, droit d’auteur, industrie de la musique, contrats, revenus de l’artiste

NB : le terme artiste est plutôt large et peut englober plusieurs activités au sein de l’industrie musicale. Par artiste, je veux parler de toute personne ayant un impact créatif sur la musique, depuis son élaboration jusqu’à son interprétation.

PARTIE I : Revue de littérature

I. Environnement professionnel de l’artiste musical

I.1. La notion de droit d’auteur

Afin de cerner les enjeux modernes faisant face à l’artiste en 2019, il paraît judicieux de se pencher sur les notions juridiques entourant un tel acteur, notamment via le code de la propriété intellectuelle (CPI). Dans ce dernier, le compositeur de musique instrumentale est également dénommé l’auteur.

I.1.1 Droits patrimoniaux

Comme le dispose le CPI (articles L.122-3 et L.122-2), il existe 3 types distincts de droits dits “patrimoniaux” qui entraînent une rémunération de l’auteur :

Le droit de représentation ou d’exécution publique (DEP) : il représente le droit d’auteur résultant de l’interprétation d’une œuvre sur une station de radio, club, spectacle vivant, chaîne de télévision, cinéma, streaming…
Le droit de reproduction lié à la diffusion des œuvres à l’aide de supports enregistrés : il représente les œuvres diffusées à la radio, à la télévision, en discothèques et dans les lieux publics sonorisés.
Le droit de reproduction mécanique (DRM) sur les supports enregistrés (phonogrammes et vidéogrammes) : il est la résultante de l’exploitation des CD, Blu-Ray, DVD et téléchargements.

Tous ces droits patrimoniaux, depuis la loi Lang du 3 juillet 1985, se prolongent 70 ans après la mort du dernier auteur. Au-delà de cette durée, les ayants droit ne peuvent plus bénéficier des revenus engendrés par leur exploitation, les droits appartiennent ainsi au domaine public et nul ne peut revendiquer une rémunération liée à l’exploitation de l’œuvre.

I.1.2 Droit moral

Il se transcrit par un accord de l’auteur pour toute utilisation complète ou partielle de son œuvre. Il existe cependant une exception en France via la loi Lang qui montre que les ayants droit ne peuvent pas s’opposer à la radiodiffusion (TV, radio, discothèque) de leur œuvre. Nous verrons par la suite comment sont compensés financièrement les ayants droit.

I.1.3 Droit de synchronisation ou droit à l’utilisation d’une musique préexistante

Il s’agit de l’incorporation de musique à des images par reproduction mécanique. Il ne s’agit pas d’un droit nommé dans le CPI. Il ne se différencie pas, aux yeux de la législation française, du droit de reproduction. Il engendre l’accord explicite des ayants droit et des exploitants de l’œuvre. Il en résulte ainsi un accord financier entre ces deux parties.

Aux États-Unis, pour certaines œuvres (appartenant à 9 catégories), il est possible de réaliser un buyout, c’est à dire d’acheter les droits pour une certaine durée. L’auteur perçoit ainsi une rémunération unique en échange de laquelle il renonce à réclamer le fruit de l’exploitation de son œuvre et la titularité de son droit d’auteur qui revient à l’acheteur.

On parle aussi de work for hire, (Passman, 2015) souvent dans le cadre de musique créée pour l’image. Cette démarche est actuellement impossible en Europe, car le droit moral est inaliénable.

I.1.4. Droits des autres acteurs créatifs

L’artiste compositeur est souvent amené à interpréter ses propres œuvres, ou assure parfois le rôle de réalisateur artistique musical, arrangeur pour d’autres artistes. Il est donc nécessaire de comprendre le fonctionnement de ces rôles.

I.1.4.1 Artiste-interprète

Selon l’article L.212-3 du CPI, l’artiste-interprète bénéficie du droit moral d’autoriser l’exploitation de sa prestation. Cela se traduit par un contrat de cession de droits voisins qui engendre une rémunération proportionnelle aux ventes de l’enregistrement. L’artiste-interprète donnera son accord pour l’exploitation de sa prestation. En contrepartie, il percevra une rémunération complémentaire lors de l’utilisation de l’enregistrement (ex : synchronisation). Dans ce cas de figure, on parle alors de droit voisin du droit d’auteur, entraînant lui aussi une rétribution financière.

I.1.4.2 Réalisateur artistique, arrangeur, orchestrateur

Toutes ces activités interviennent auprès de l’artiste auteur. Si nous prenons l’exemple du réalisateur artistique, il a la charge d’assurer le suivi de la production de l’album. Il peut aussi intervenir sur les arrangements, le choix du mixeur, des instrumentistes. C’est un rôle déterminant dans la couleur musicale qui sera donnée à l’œuvre. Il peut être rémunéré sous deux formes :

Une rémunération forfaitaire conclue dans le cadre de sa prestation lors de la production de l’album
Une redevance proportionnelle calculée selon les modalités dédiées à l’artiste. Souvent, si cette part excède 2%, l’artiste se voit amputé d’une partie de sa redevance (Bouvery, 2019).

Nous entrerons plus en détail dans le fonctionnement des redevances dues aux ayants droit ultérieurement.

I.2. L’Edition musicale

L’éditeur musical est le cessionnaire des droits de l’auteur (et des droits moraux inaliénables à l’auteur). Il bénéficie d’un droit à la rémunération au titre des exploitations de l’œuvre musicale (article L. 132-12 du CPI). Il a la charge de la mise à disposition de l’œuvre par tous moyens. Historiquement, il était chargé de reproduire l’œuvre sous forme graphique (partitions, songbook) et de la vendre. Le compositeur signe un pacte de préférence avec l’éditeur.

Pour un compositeur, l’éditeur musical est aujourd’hui le partenaire qui peut lui apporter un appui financier dans le développement de sa carrière comme la co-production d’un single ou l’accord d’une avance financière. Cette avance de droits d’auteur est recoupable, c’est-à-dire que l’artiste doit attendre que l’éditeur ait gagné le montant de son avance pour pouvoir toucher des revenus engendrés par des droits d’auteurs. A ce titre, le partage des revenus engendrés par ces droits d’auteurs se fait en 50/50%. (Bouvery, 2019)

Par exemple, si l’éditeur décide d’accorder une avance de 10 000 euros, l’artiste devra attendre que les revenus engendrés par l’exploitation de son œuvre dépassent 20 000 euros pour pouvoir commencer à bénéficier des fruits.

Dans le cadre de la musique à l’image, le producteur demande fréquemment les droits d’éditions par un contrat de cession. La plupart des producteurs audiovisuels sont dotés d’une structure d’édition (ex : La bande Son pour Canal +).

La majeure partie de son activité financière de nos jours se traduit par l’incorporation des œuvres de son catalogue avec des images, les “synchros”. Il est en effet rémunéré à 2 titres : d’abord par les revenus engendrés par la reproduction, payée par le diffuseur à la SACEM et redistribuée aux ayants droit, mais aussi par la rémunération forfaitaire (droit de synchronisation) payé par le producteur audiovisuel (producteur de film, jeu vidéo, agence de publicité…). Cette rémunération forfaitaire distribuée à l’éditeur et aussi au producteur est rarement inférieure à 80 000 euros dans le cadre d’une publicité télévisuelle de notoriété moyenne, et de l’ordre de 10 000 euros pour une utilisation dans un film. (Bouvery, 2019)

Le dialogue est très marqué entre les sociétés d’édition musicale et les marques. Selon Charles- Henri de Pierrefeu, responsable publicité, service Film and TV chez Universal Music Publishing, le travail de communication et de relation avec les marques est qualifié comme étant de la “propagande ou la présence à l’esprit est vitale. (Les clients) … ne pensent pas à vos titres, il faut générer de l’exposition pour devenir synchros-friendly”. (Chabaud, 2017)

I.3. La production phonographique

Dans le langage courant, l’expression “signer avec un producteur” va de soi. Ce producteur est en réalité représenté par trois corps de métiers différents : le producteur phonographique, l’éditeur phonographique (à ne pas confondre avec l’éditeur musical) et le distributeur. Dans la majorité des cas, ces activités sont exercées par une seule et même entité : le label.

I.3.1 Producteur phonographique

Selon l’article L.213-1 du CPI, le producteur phonographique est la personne physique ou morale qui a l’initiative et la responsabilité de la première fixation d’une séquence de sons.

Il est ainsi le propriétaire matériel et immatériel du phonogramme, de l’enregistrement sonore (du “Master”, des “bandes”). Depuis la loi Lang du 3 juillet 1985, il bénéficie également d’un droit voisin, à savoir d’un droit monopolistique sur l’enregistrement qui lui permet à titre exclusif d’autoriser sa reproduction et sa représentation (streaming, commercialisation, exploitation sous forme de synchronisation à l’image…).

La durée légale de ces droits est également de 70 ans après la première communication au public de l’enregistrement (article L.211-4 du CPI).

Il finance la production de la musique. En contrepartie, il se rémunère sur les ventes et l’exploitation de l’œuvre. Ce producteur peut aussi assurer d’autres missions telles que le marketing, l’édition musicale, la distribution du catalogue, comme c’est le cas des majors labels.

Aujourd’hui, les majors labels de l’industrie musicale désignent trois sociétés qui se partagent la majorité du marché de la musique. Au premier semestre 2011, elles représentaient 71,7 % des ventes de productions musicales sur le marché mondial avec la répartition suivante : (Nicolas, 2011)

Universal Music Group : 38,9 % ;
Sony Music Entertainment : 21,5 % ;
Warner Music Group : 11,3 %.

Le reste du marché (28,3%) était à cette date partagé par des labels indépendants. L’artiste se voit offrir différents types de contrats : d’exclusivité ou de licence.

I.3.1.1 Le contrat d’enregistrement d’exclusivité ou “contrat d’artiste”

C’est la forme de contrat la plus populaire entre un artiste et son label. Le producteur prend à sa charge les frais d’enregistrement ainsi que la majorité du processus de publication et de diffusion. L’artiste cède au producteur l’entière propriété des enregistrements et leurs diverses exploitations selon des rémunérations prévues au contrat. L’artiste est rémunéré de plusieurs manières dans le cadre de ce contrat :

Selon son temps de travail, c’est-à-dire ses séances d’enregistrement et plus globalement de création artistique,
Par des redevances (ou « royalties »), un pourcentage (généralement entre 5 et 20%) calculé sur ses ventes de disques
Par d’autres revenus directement liés à sa musique.

Les artistes sont liés contractuellement pour une durée spécifique comprenant la réalisation de X projets. Généralement, cette durée est de 2 ou 3 ans comprenant la création d’1 ou 2 projets musicaux (albums, EP, etc.) (Bouvery, 2019)

I.3.1.2 Le contrat de licence

Il existe deux options : l’artiste est déjà rattaché à un producteur qui détient les droits des masters, ou bien l’artiste s’est autoproduit et les droits d’exploitation lui appartiennent. (Bouvery, 2019)

Dans le premier cas de figure, le label se lie au producteur via un nouveau contrat afin d’acquérir les droits d’exploitation exclusifs et ainsi pouvoir diffuser la musique de l’auteur.
Si l’artiste s’est autoproduit, en finançant lui-même ses séances d’enregistrement ainsi que les diverses charges rattachées aux sorties de ses précédents projets, c’est à lui de signer ce contrat de licence. C’est par exemple le cas avec de nombreux compositeurs de musique électronique, qui créent, mixent et distribuent leur musique sans aide extérieure. Le contrat de licence consiste alors en la concession par le producteur au licencié, du droit de reproduire, fabriquer et communiquer l’enregistrement dont le producteur est propriétaire. Ainsi, il ne s’agit pas d’une cession définitive, puisque le producteur cède pour un temps ses droits tout en restant propriétaire de ces derniers. Dans le cadre d’un contrat de licence, la durée et le territoire doivent être bien définis dans les termes du contrat.

I.3.1.3 Redevances dues à l’artiste dans le cas d’un contrat avec un producteur phonographique

La figure 1 présente la cartographie en France des taux de redevances, aussi appelées royalties, versées à l’auteur en fonction du type de contrat :

Figure 1 : Taux de redevance par mode d’exploitation en fonction du type et du label.
Source : Ministère de la culture, direction générale des médias et des industries culturelles, 4 juillet 2017 — *Figure 1 : Taux de redevance par mode d’exploitation en fonction du type et du label.*
*Source : Ministère de la culture, direction générale des médias et des industries culturelles, 4 juillet 2017*

Ainsi, si pour un contrat d’exclusivité la différence entre un label et une major est peu signifiante (3,4 points d’écart sur le téléchargement), elle est notable dans le cas d’un contrat de licence (7,7 points d’écart sur le téléchargement). On note également que les majors assurent un taux de redevance plus intéressant (3,6 points) sur le physique dans le cadre d’un contrat de licence.

Aux États-Unis, les taux de redevance font intervenir également la notoriété de l’artiste. Ainsi, dans le cadre d’un contrat d’exclusivité. La figure 2 illustre les différents taux de redevances appliqués en moyenne pour les ventes physiques :

Figure 2 : Fourchette du taux de redevance du producteur à l’artiste aux États-Unis dans le cas d’un contrat d'exclusivité, ventes physiques.
Source : (Passman, 2015) — *Figure 2 : Fourchette du taux de redevance du producteur à l’artiste aux États-Unis dans le cas d’un contrat d’exclusivité, ventes physiques.*
*Source : (Passman, 2015)*

Dans certains cas, notamment dans le cadre de la composition d’une œuvre de musique à l’image, ce producteur est incarné par le producteur de cinéma (Chabaud, 2017). L’artiste se voit alors doté d’une prime de commande dont le montant varie selon sa notoriété, la durée totale de musique, ou en facturant lui-même via une société. Souvent s’il cumule la casquette d’auteur et d’artiste-interprète, il percevra alors en plus un salaire pour son interprétation (chef d’orchestre, soliste…).

I.3.2 Éditeur phonographique

A ne pas confondre avec l’éditeur musical, l’éditeur phonographique assure la reproduction/fabrication des exemplaires et s’engage dans la distribution physique/numérique. Un contrat dit “de licence” est conclu entre le producteur phonographique et l’éditeur phonographique (le licencié). Dans la grande majorité des cas, ces deux entités sont représentées par une seule.

Il prend en charge la publication, la distribution et la promotion des exemplaires auprès du public. Il perçoit également une rémunération par droit voisin puisqu’il a la responsabilité exclusive de la reproduction de l’œuvre.

Pour toute utilisation secondaire de l’œuvre mettant en avant les droits voisins (radio, synchronisation…), les redevances sont partagées à parts égales entre le producteur et l’éditeur phonographique.

I.3.3 Distributeur

I.3.3.1 Dans le domaine physique

La distribution d’un enregistrement consiste, par le biais d’un contrat de distribution passé avec le producteur et l’éditeur phonographique, à le rendre disponible via toutes les formes possibles auprès du public. Le distributeur assure également la promotion et la valorisation du catalogue qu’il distribue.

La figure 3 illustre la chaîne des différents acteurs transitant entre les artistes interprètes et le consommateur dans le domaine physique :

Figure 3 : Schéma des échanges contractuels entre l’artiste et le consommateur.
Source : (Bouvery, 2019) — *Figure 3 : Schéma des échanges contractuels entre l’artiste et le consommateur.*
*Source : (Bouvery, 2019)*

La rémunération du distributeur est traduite par une commission sur chaque exemplaire physique vendu. En France, elle est comprise entre 35% et 40%, et peut diminuer si les ventes augmentent.

La figure 4 décrit l’anatomie moyenne de la répartition des revenus issus de la vente physique :

Figure 4 : Anatomie de la répartition des revenus issus d’une vente physique
Source: (Mulligan, 2014) — *Figure 4 : Anatomie de la répartition des revenus issus d’une vente physique*
*Source: (Mulligan, 2014)*

Ce graphique illustre la répartition des revenus engendrés par la vente d’un album après la commission du détaillant. En ce qui concerne l’artiste, il a déjà effectué son recoupement, c’est- à-dire que le label s’est remboursé de l’avance accordée à l’artiste. Cette redistribution est une moyenne, certains artistes (surtout via les labels indépendants) se voient offrir une part plus importante, selon le type de contrat qu’ils ont passé avec le producteur (cf §I.3.1.3).

I.3.3.2 Dans le domaine numérique

Certaines sociétés sont spécialisées dans la distribution numérique (Pias, Muzicast, Believe, Idol…). Ces structures assurent les mêmes rôles qu’un distributeur physique (rendre disponible le titre auprès du public via les plateformes de consommation de musique en ligne, promotion et valorisation du catalogue). Les agrégateurs comme Tunecore, CD Baby, iMusician ont le même rôle qu’un distributeur numérique, à savoir la livraison de la musique vers les plateformes mais ils n’en assurent pas la promotion. Leur commission tarifaire est comprise entre 30 et 50 euros pour la livraison d’un album vers toutes les plateformes. Les agrégateurs perçoivent directement leurs revenus auprès des clients-artistes alors que ceux des distributeurs numériques proviennent des plateformes de musique en ligne.

Ce modèle passant par les agrégateurs peut être pertinent pour les compositeurs étant eux- mêmes leur propre producteur.

Les producteurs phonographiques négocient directement avec les plateformes de consommation de musique en ligne (aussi appelées éditeurs de service) qui jouent le rôle du distributeur. Cette négociation a pour but d’obtenir une certaine visibilité du catalogue des producteurs en faisant de la mise en avant auprès du consommateur. La commission de la plateforme varie entre 20% et 40%, selon le potentiel commercial du catalogue concédé et le type de service proposé (streaming, téléchargement…). (Bouvery, 2019)

I.4. Les sociétés de perception et de répartition de droits (SPRD)

I.4.1 État des lieux

Elles sont aussi appelées organismes de gestion collective, les OGC. Elles bénéficient des apports de droits à leur répertoire par les ayants droit. Elles collectent les informations d’exploitation et les sommes correspondantes pour les reverser aux ayants droit au titre de droit d’auteur (droit de reproduction, de représentation).

Les ayants droit disposent depuis 2008 d’un délai légal de 5 ans pour réclamer leurs droits auprès de ces organismes.

Le tableau 1 présente un récapitulatif des différentes SPRD en fonction des acteurs qu’elles représentent :

SACEM-SDRM	Auteurs (compositeur, parolier, arrangeur…) et éditeurs
ADAMI SPEDIDAM	Artistes interprètes principaux Artistes interprètes additionnels
SCPP SPPF	Producteurs de phonogramme

Tableau 1 : SPRD exerçant en France

Nous nous attarderons sur la SACEM-SDRM qui représente le respect et la protection des auteurs compositeurs de musique. En effet, elle gère les droits d’exécution publique (DEP) des œuvres. Le droit de reproduction mécanique est quant à lui géré par l’intermédiaire de la SDRM (Société pour l’administration du Droit de Reproduction Mécanique) depuis 1935, filiale de la SACEM. Nous ne rentrerons pas dans le détail des contrats de représentation passés avec les exploitants (cinéma, entrepreneurs de spectacle, télévisions, radios, plateformes de streaming, etc.) des 80 millions d’œuvres musicales de leur répertoire.

La figure 5 présente un récapitulatif des flux transitant dans la chaîne de valeur économique entre le producteur phonographique, les plateformes de services en ligne et les SPRD qui collectent une somme liée au droit de reproduction mécanique :

*Figure 5 : Échanges de flux entre le producteur phonographique et les plateformes de services de streaming en ligne Source : (Bouvery, 2019)*

Avant de s’attarder sur le mode de répartition de la SACEM, il est judicieux de se pencher sur un droit annexe lié à une rétribution financière des ayants droit. Il s’agit du droit à la rémunération légale.

I.4.2. Droit à la rémunération légale

I.4.2.1. La rémunération équitable

Nous avons vu en 1.1.2 que les ayants droit ne peuvent pas s’opposer à la radiodiffusion (TV, radio, discothèque) de leur œuvre. En contrepartie de cette autorisation faisant exception au droit moral, les utilisateurs de la musique versent ainsi une rétribution financière à destination des producteurs phonographiques et des artistes interprètes.

Il s’agit de la rémunération équitable, perçue par la SPRE (société pour la perception de la rémunération équitable) et répartie par moitié entre les artistes interprètes et les producteurs de phonogrammes (article L 214-1 du CPI). Cette répartition s’appuie sur les relevés de diffusion des radios et télés ainsi que les déclarations de vente.

Les programmes de flux (programmes propres des entreprises de communication audiovisuelle) tels que les bulletins d’informations, reportages, compétitions sportives, émissions de plateaux, météo, bénéficient d’une législation spécifique. Ces programmes sont par principe destinés à une diffusion unique. On parle ainsi de licence légale qui, par le biais de la rémunération équitable, permet aux exploitants de s’affranchir de l’autorisation des ayants droit. Il s’agit en fait d’une autorisation indirecte via les sociétés de gestion collective de droits qui exigent une rémunération selon les barèmes en vigueur (décision du 19 mai 2010 de l’article L214-4 du CPI).

En opposition, les programmes de stock (fictions de télévision, films de cinéma, documentaires) conservent quant à eux leur valeur de production audiovisuelle indépendamment du nombre de diffusions. L’utilisation d’une musique dans une telle production ne fait pas exception au droit moral.

En 2017, la rémunération équitable s’élevait à 122,4 millions d’euros qui ont été collecté auprès des lieux sonorisés, radios et télévisions (SPRE, 2018).

La figure 6 illustre le fonctionnement de la rémunération équitable :

*Figure 6 : Collecte de la rémunération équitable par la SPRE Source : (Bouvery, 2019)*

L’artiste compositeur se voit ensuite rétribuer financièrement sur la part du producteur phonographique selon le type de contrat passé avec lui.

I.4.2.2. La copie privée

Une rémunération a été prévue pour compenser la duplication des œuvres audio et visuelles faite par les particuliers à domicile. Il s’agit d’une taxe que versent les fabricants de supports de reproduction (CD, clé USB, graveur…) à Copie France. Il existe deux types de copie privée, une sonore et l’autre audiovisuelle. Elles sont ensuite reversées aux ayants droit de la façon suivante : (figures 7 et 8)

*Figure 7 : Répartition de la copie privée sonore.*
*Source : (Bouvery, 2019)*

*Figure 8 : Répartition de la copie privée audiovisuelle Source : (Bouvery, 2019)*

La copie privée a vu ses bénéfices multipliés par 7 depuis son instauration en 1985 (11 millions d’euros contre 88 millions en 2012).

Le producteur de phonogramme est bénéficiaire de la copie privée à hauteur de 50%, soumis à l’exception de licence légale compensée par la rémunération équitable (article L214-1 du CPI).

Nous allons maintenant étudier en détail le rôle des sociétés de gestion collective de droits (SACEM, Adami, SPFF…) qui assurent notamment la répartition des sommes collectées par la SPRE.

1.4.3. Chiffres clés de la SACEM

En 2017, 79% des revenus collectés par la SACEM ont été reversés aux ayants droit. (SACEM, 2017) Les perceptions de la SACEM se répartissent comme l’illustre la figure 9 :

*Figure 9 : Répartition des collectes de la SACEM en millions d’euros, 2017 Source : (SACEM , 2017)*

Elles ont l’obligation légale de consacrer 25% des montants provenant de la copie privée et des sommes « non répartissables » à des actions d’aide à la création, à la diffusion du spectacle vivant, au développement de l’éducation artistique et culturelle et à des actions de formation des artistes (articles L321-1 et 321-9 du CPI).

La figure 10 représente les pôles de dépense de la SACEM :

Figure 10 : Répartition des flux d’argent de la SACEM Source : (SACEM, 2017) — *Figure 10 : Répartition des flux d’argent de la SACEM Source : (SACEM , 2017)*

Nous avons vu précédemment les différentes natures de droits détenus par le compositeur. Le tableau 2 montre les taux de répartition entre l’auteur et l’éditeur :

Nature du droit	Type de répartition	Taux de répartition
Droit d’Exécution Publique	Statuaire de la SACEM	⅔ auteur, ⅓ éditeur
Droit de reproduction lié à la diffusion à l’aide de supports enregistrés	Statuaire de la SACEM	½ auteur ; ½ éditeur
Droit de Reproduction Mécanique (DRM)	Contractuelle et négociable entre auteur et éditeur	Moyenne constatée : ½ auteur, ½ éditeur

Tableau 2 : taux de répartition entre l’auteur et l’éditeur selon le type de droit

En 2017, les SPRD de plusieurs nations (USA, UK, France) ont uni leurs forces en lien avec IBM afin de mettre au point un système pour mieux gérer l’identification numérique des œuvres. Il s’agit de la technologie blockchain qui, en s’appuyant sur les codes ISRC (International Standard Recording Codes) des fichiers masters et des ISWC (International Work Codes) correspondant aux œuvres musicales, permet de créer une base facilitant largement l’identification des œuvres par les organismes de gestion collective.

I.5. L’autoproduction

L’artiste peut lui-même assurer le rôle de producteur, on parle alors d’autoproduction. En effet, grâce à la démocratisation croissante des outils de la chaîne de production musicale tels que les home studios, la diminution des prix du matériel, les logiciels d’édition et de mixage et les banques de son, les artistes ont de moins en moins besoin d’avoir accès à un studio d’enregistrement et peuvent ainsi réaliser eux même la production depuis l’enregistrement jusqu’au mastering.

D’après le cabinet de consulting et de recherche Midia Research, le segment des artistes en autoproduction affiche une croissance de 27,2% sur l’année 2014 et une part de marché de 2,7% (Mulligan, 2014). En 2018, elle est passée à 3,4%, soit une hausse de 8% pour un chiffre d’affaires de 19 milliards de dollars. Il s’agit des revenus générés par la distribution via les plateformes numériques telles que CD Baby, Tunescore, Bandcamp ou Believe Digital. Cumulé au chiffre d’affaires des labels indépendants, cela représente plus de 30% des revenus globaux.

Les sources de financement peuvent être le crowdfunding -comme le groupe Stupeflip en 2017 qui a récolté plus de 400.000 € (Stupeflip, 2017) – ou encore des aides comme celle de la SACEM qui propose 4500 €.

L’autoproduction se place en disrupteur vis à vis des producteurs phonographiques incarnés par les labels, comme l’illustration la figure 11 suivante :

*Figure 11 : Risque de désintermédiation dans la chaîne de valeur économique Source: (Goldman Sachs , 2016)*

I.6. Bilan de la répartition de valeur économique dans l’industrie phonographique numérique

Il faut bien distinguer les droits captés par les différents acteurs :

Le droit de reproduction mécanique est capté en France par la SACEM directement auprès des plateformes
Le droit d’interprétation ou d’exécution publique (DEP) est reversé par les plateformes aux producteurs phonographiques. Ces derniers reversent ensuite aux artistes selon les taux évoqués en §I.3.1.3.

On distingue trois modes d’accès à la musique dans le domaine du numérique : (Bouvery, 2019)

Services de partage de contenu : YouTube, Dailymotion …

Les autorisations sont désormais accordées individuellement par les producteurs sur la base d’un partage des recettes publicitaires générées par le service en ligne. La fourchette de redevance pour le producteur est comprise entre 50 et 60%.

Téléchargement : après les redevances réglées aux SPRD¹ par la plateforme (8% du prix HT en France), le taux de redevance au producteur est généralement aux alentours de 70% du prix HT du téléchargement, assorti d’un minimum garanti par téléchargement de 50% du prix de vente TTC.

Streaming : après déduction de la redevance aux SPRD (12% des recettes), le taux de redevance de la plateforme au producteur est calculé selon le mode de consommation. On distingue deux modèles de consommation de la musique en streaming :
- freemium : financé par la publicité, le taux de redevance au producteur oscille entre 50 et 70% des recettes publicitaires, assorti d’un minimum garanti (condition amenée à disparaître progressivement) variant de 0,001 à 0,003 euros HT par enregistrement écouté.
- premium : financé par le paiement d’un abonnement par l’utilisateur, le taux de redevance est généralement compris entre 50 à 70% des recettes d’abonnements, calculées au prorata de la part de marché respective de chaque ayant droit. La rémunération moyenne va de 0,005 à 0,3 euros HT par enregistrement écouté.

Les parts de marchés reposent sur la comptabilisation du nombre d’écoutes (aussi appelé streams) sur une période donnée. Elles se traduisent par le ratio entre le nombre de streams cumulés par un ayant droit et le nombre total de streams cumulés par la plateforme sur cette même période. La figure 12 illustre ce modèle premium de répartition :

*Figure 12 : Méthode de calcul de la part mensuelle reversée aux artistes sur Spotify, modèle premium Source : Music Streaming Index, Spotify Royalty Formula, 2015*

Cette formule simplifiée ne prend pas en compte les taxes ainsi que les redevances dues aux SPRD. Aussi, la case 3 est sujette à modification puisque chaque producteur phonographique négocie l’exploitation de son catalogue. L’artist’s royalty rate renvoie à la part que redistribue le producteur à l’artiste. Cela a été approfondi dans le §I.3.1.3.

C’est un modèle qu’il faut envisager sur le long terme, puisque les revenus engendrés par un stream sont dérisoires au regard de ceux générés par l’achat d’un CD où le nombre d’écoutes du CD n’a aucune influence sur la rémunération des ayants droit. Prenons un exemple avec des chiffres simples :

100 streams premium sont réalisés sur une plateforme sur une période d’un mois. Sur ces 100 streams, 40 ont été réalisé sur des enregistrements appartenant à un même producteur. Cet ayant droit dispose donc 40% des parts de marché sur cette période. Il partage avec la plateforme 40% du pot commun restant, selon le pourcentage négocié. S’il est de 70%, l’ayant droit percevra ainsi 28% (0,7*0,4=0,28) des revenus issus des abonnements, après déduction des redevances dues aux SPRD et à l’état. Enfin, la part de l’artiste est de 5,04% des revenus issus des abonnements, si son taux de royalties auprès du producteur est de 18% (0,18*0,28).

Exemple 1 : répartition des recettes auprès de l’artiste depuis la plateforme de streaming

Depuis septembre 2019, Deezer teste un nouveau modèle de répartition de la valeur qui consiste à considérer les parts de marché à l’échelle de l’utilisateur, et non à celle de l’ensemble des abonnés.

Selon Deezer, les artistes au bas de l’échelle en termes de revenus pourraient gagner environ 30

% de plus tandis que les artistes les plus performants actuellement pourraient perdre 10 % (Louis, 2019). Ainsi, dans la figure ci-dessus montrant le calcul des royalties, il faut remplacer les cases 1 et 2 de la manière suivante :

1 : “Spotify monthly revenue” par “Spotify monthly revenue by user”

2: “total Spotify streams” par “total user’s streams”.

Ce nouveau mode répartition de la valeur est un véritable enjeu pour les prochaines années à venir. On parle de modèle user centric qui permet ainsi de faire revenir l’argent collecté par un abonné aux artistes qu’il a effectivement écoutés (Stassen, 2019).

Cela favoriserait une rémunération plus conséquente pour les genres musicaux dits « de niche » comme le classique, le jazz ou le métal ; au détriment des autres genres les plus écoutés appartenant le plus souvent au catalogue des majors labels. (Felin, 2019)

Nous omettrons volontairement dans cet état des lieux le partage effectué par les services de

web radio, services de podcast avec les producteurs, car ils sont pour le moment dérisoires.

La figure 13 ci-dessous récapitule les flux transitant entre les acteurs dans la chaîne de valeur économique de l’industrie musicale du numérique. Ce schéma est uniquement valable en France. Aux États-Unis, la perception des DRM se fait en suivant le chemin des droits voisins en France, à savoir en passant par les producteurs.

*Figure 13 : Schéma de l’industrie musicale du numérique Source : (Becquet, 2018)*

II. Autres activités en lien avec l’artiste

II.1. Le spectacle vivant

Le compositeur peut être amené à interpréter ses œuvres lors de concerts ou de performances en tant qu’artiste interprète, chef d’orchestre, DJ… En France, le chiffre d’affaire global du spectacle vivant est estimé à 746 millions d’euros en 2014 (Centre National de la Chanson et des Variétés du Jazz, avril 2014). Aujourd’hui, les recettes du spectacle vivant dépassent désormais celles des ventes de l’industrie phonographique. En 2015, le chiffre d’affaires de la billetterie de spectacle s’élevait à 16,5 milliards de dollars en Europe, soit le double de l’industrie phonographique (6,3 millions de dollars) (CISAC, 2015).

La figure 14 met en avant la répartition de la population en fonction des types de lieux musicaux fréquentés aux USA :

*Figure 14 : Proportion de la population allant aux concerts par type de lieux (USA) Source : Institut Nielsen, Billboard 2017*

Voici les différents acteurs du spectacle pouvant entourer l’artiste :

Producteur de spectacle : Il est à l’initiative de la création du spectacle, en prenant en charge le budget de création (frais de répétitions, salaires, location) et assure le déroulement sur scène du spectacle (location de la salle, émission de la billetterie). Il est l’employeur au regard de tout le personnel et a la responsabilité en supportant le risque financier.
Entrepreneur de tournées (tourneur) : Il n’est pas systématiquement à l’initiative de la création du spectacle, mais il est chargé de vendre le show à des diffuseurs ou à des exploitants de salles. Le producteur de spectacle est souvent également tourneur pour amortir ses frais. Dans un contexte de spectacle étranger, le producteur fait souvent appel à des promoteurs ou tourneurs locaux.

Booker : Le booking consiste à négocier et placer la vente d’un spectacle auprès des diffuseurs. C’est aussi le rôle du producteur mais ces dernières années ont vu l’émergence de cette activité au sein de structures indépendantes. Cette prestation de service se voit rémunérée sous forme d’un pourcentage sur le prix de vente (de 10 à 15%), parfois assorti d’un minimum garanti par vente.

Diffuseur : aussi appelé organisateur, il exploite ou loue un lieu pouvant accueillir une représentation (salle de spectacle, lieu en plein air, église…). Il achète ou coréalise le spectacle. La coréalisation diffère d’un achat dans la rémunération du producteur :
- Contrat de vente (ou contrat de cession) : le producteur perçoit une rémunération forfaitaire
- Contrat de coréalisation : le producteur perçoit une rémunération proportionnelle aux recettes du spectacle, potentiellement assortie d’un minimum garanti.
Promoteur local : Il peut organiser un spectacle pour le compte du producteur ou du tourneur ou alors il peut acheter le spectacle au producteur pour le revendre à des diffuseurs.

Les liens entre chaque acteur peuvent se résumer comme le montre la figure 15 :

*Figure 15 : Relation contractuelle entre les artistes dans le spectacle vivant avec intermédiaires Source : (Bouvery, 2019)*

Bien entendu, il est possible de supprimer des acteurs et de rester dans des configurations simples comme l’illustre le schéma suivant :

*Figure 16 : Relation contractuelle entre un organisateur de concert et des artistes sans intermédiaires Source : (Bouvery, 2019)*

II.2. La commande d’une œuvre musicale

La commande d’une œuvre peut représenter une source majeure de revenus pour un compositeur aujourd’hui. Il n’existe cependant pas de données publiques sur leurs montants et leurs proportions dans l’industrie.

Il est important de noter deux catégories de commanditaires :

les organismes subventionnés par l’État ou par le mécénat privé (orchestres, opéras, etc.)
les sociétés privées : des marques par le biais d’appel d’offres, ou encore des producteurs cinématographiques (cf. I-3.1.3)

Dans le genre de la musique contemporaine, il s’agit presque exclusivement des acteurs de la première catégorie évoquée ci-dessus.

Il existe deux modes de rémunération dans le secteur privé : une rétribution financière fixe dans le cas d’un appel d’offres ; et une rémunération négociable en fonction de la notoriété du compositeur dans le cas de commande directe à ce dernier.

II.3. Exploitation des droits dérivés

II.3.1. Merchandising

Le merchandising (ou merch) consiste à commercialiser des produits de marque déposée qui portent les attributs de la personnalité de l’artiste : affiches, prêt à porter, musique inédite dédicacée, etc.

Il s’agit d’un contrat de cession d’exploitation des droits dérivés de l’artiste. Le taux au profit de l’artiste varie de 15 à 50%. Ces redevances, tout comme les royalties dues à l’artiste interprète au titre de l’exploitation des enregistrements, sont considérées comme des bénéfices non commerciaux. Elles sont cependant assujetties à un taux de TVA de 20% au lieu du taux réduit de 10% des royalties. (Bouvery, 2019)

II.3.2. Endorsement et sponsoring

Il est possible de faire appel à la « marque » plus large de l’artiste – où il peut approuver un produit ou même développer ses propres produits. Une maison de disques peut avoir jusqu’à 200 partenariats de marques à long terme, actifs à tout moment pour le compte de leurs artistes.

Le sponsoring représente des opérations associant des produits à l’activité de l’artiste. A titre d’exemple, l’artiste pourrait s’engager à n’utiliser que des micros DPA dans ses concerts.
L’endorsement décrit les opérations dans lesquelles l’artiste associe son image à des produits ou à une marque (artiste devient ambassadeur de France pour une marque). Par exemple, Noel Gallagher et les guitares Epiphone, Bob Sinclar et les casques Sennheiser, Missy Elliot et Adidas.

Le taux de redevances prévu au profit de l’artiste oscille entre 40 et 70% des recettes encaissées par le producteur pour l’opération considérée. En 2016, ces activités représentaient 3,3% du chiffre d’affaire de l’industrie phonographique. (Bouvery, 2019)

II.4. Gestion de carrière

Depuis la loi relative à la libéralisation du métier d’agent artistique de 2010, cette activité est appelée également agent artistique même si le terme de manager reste couramment utilisé, surtout dans le secteur de la musique actuelle. (Bouvery, 2019)

Son activité recouvre deux fonctions principales :

Recherche de partenaires de l’artistes (producteur, distributeur, mixeur…) avec négociation des contrats qui ont sont liés
Organisation et promotion de la carrière de l’artiste auprès de l’ensemble des professionnels du secteur.

L’artiste mandate l’agent pour le représenter et agir en son nom et pour son compte (article 1984 du code civil).

En guise de rémunération, l’agent perçoit une commission plafonnée légalement à 10% des revenus bruts perçus par l’artiste. Elle peut aller jusqu’à 15% dans le cas de missions particulières justifiant une rémunération complémentaire. Cette assiette de calcul est basée sur les rémunérations avant déduction des prélèvements sociaux. On note que les redevances issues de l’exploitation phonographiques (royalties) sont incluses dans cette assiette. (Article 7121-8 du code du Travail) : cachets d’enregistrement, cachets de spectacle, rémunération légale, etc.

II.5. Contrats 360, ou contrats à droits multiples

Ce genre de contrat regroupe les 4 activités d’un compositeur de musique :

La production phonographique
L’édition musicale
Le spectacle vivant (dans le cas où l’auteur est également artiste-interprète)
Les droits dérivés : merchandising, sponsoring/endorsement

La figure 17 ci-dessous récapitule l’organisation du contrat 360 :

*Figure 17 : Les contrats 360 Source : (Bouvery, 2019)*

Dans le cas d’un compositeur-interprète, chaque domaine représente une source de revenu pour l’artiste :

Les cachets et les royalties dans la production phonographique
Les redevances (en provenance de la SACEM et de son éditeur) dans l’édition musicale
Les cachets dans le spectacle vivant
Les cachets et les redevances dans le cadre de l’exploitation de son image

Ce genre de contrats 360° est développé la plupart du temps par les producteurs phonographiques. En effet, la diversification des sources de revenus permet aux structures proposant ce type de contrats, de penser au développement sur le long terme d’un artiste. Si un secteur génère moins de revenu, il peut être compensé par les recettes d’un autre. D’autre part, selon Thierry Chassagne, cette stratégie de contrat 360 “est la plus cohérente pour la carrière de l’artiste, car il sait en arrivant chez nous tous que la synergie entre les professionnels qui travaillent avec lui existe et que l’ensemble de ses droits sera correctement exploité.” (Musique Info Hebdo, 18 janvier 2008)

« Une bonne illustration de ce contexte est l’exemple de Lady Gaga. Si vous êtes un de ses fans, vous connaissez sa musique ; et comme c’est une artiste de « live », vous voulez la voir en concert, vous voulez voir ses vidéos, le documentaire sur Netflix qui lui est consacré, vous voulez la voir lors de son intervention pendant le Super Bowl, vous voulez voir le film dans lequel elle a tourné, vous la suivez sur les réseaux sociaux etc. Il y a tellement de points d’accès à un artiste aujourd’hui, le travail d’un label est de définir la bonne stratégie pour mettre au point la connexion la plus pertinente entre ses fans et lui.” Patrick Mushatsi-Kareba, CEO, Sony Music (IFPI , 2019).

III. Évolution économique de l’industrie phonographique

Après l’âge d’or du disque, bien représenté par la vente de disques entre 1970 et 1995, la révolution numérique et l’apparition d’internet ont bouleversé l’économie de la musique.

III.1. La révolution numérique et le piratage

Dans les années 90, le CD se standardise. A la fin de cette décennie, une vaste opération financière menée par Cor Boonstra – PDG de Philips – va dessiner le tournant économique des prochaines années : après avoir mis sur le marché du grand public le graveur de CD, il décide de revendre sa filière musicale Polygram pour 11 milliards de dollars à Seagram, qui deviendra par la suite Universal Music Group, racheté par Vivendi en 2000 (Nidam, 2000). Philips aura donc fourni au consommateur l’outil pour faire chuter son activité. Le résultat est sans précédent, selon l’IFPI en 2004, les CD gravés vendus représentent 34% du marché mondial, soit 1,2 milliards de disques.

Un autre acteur majeur entraînant le déclin de l’industrie musicale fait son apparition : Napster. Ouvert en juin 1999 par deux étudiants de l’université de Boston dont Shawn Parker, ce logiciel de peer-to-peer permet à l’utilisateur de télécharger de façon illimitée et gratuite (hormis les frais de connexion internet) la musique qu’il souhaite. Avec l’apparition du format mp3 entre 1995 et 1999, sous l’impulsion initiale de l’Union européenne, le consommateur de musique peut obtenir de plus en plus rapidement de la musique sur son ordinateur. Après de nombreuses poursuites judiciaires pour violation du droit d’auteur, la plateforme ferme ses portes pour avoir engendré plus de 3 milliards de téléchargements illégaux au niveau mondial (Juilliard, 2002).

Puis, l’avancée à une vitesse immense de la technologie va permettre au consommateur de renouveler l’expérience de piratage via de nouveaux outils comme Bittorrent, avec une plateforme décentralisée contrairement à Napster, ce qui rendra difficile la traçabilité des téléchargements par les autorités. Des sites de streaming émergent et permettent ainsi de ne laisser aucune trace d’un acte de piratage sur le disque dur du consommateur.

La réaction des maisons disques pour lutter contre le piratage est de travailler avec les industriels pour proposer des CD anti pirates : Key2audio de Sony et ensuite le Copy Control. Ces systèmes de DRM (Digital Right Management) ne séduisent pas le consommateur qui peine à les faire fonctionner dans certaines platines laser.

Les majors sont très réticentes à utiliser l’outil web pour commercialiser leur musique. Il faut attendre 2001 pour que les majors proposent un système d’abonnement pour télécharger une partie du contenu de leur catalogue (Musicnet pour Warner et Pressplay pour Universal et Sony). Le client peut ainsi télécharger cent titres par mois moyennant 10 dollars, tout en limitant au maximum la copie et la synchronisation avec un baladeur MP3. 1,5 millions de téléchargement de logiciel de peer-to-peer (Kazaa, Morpheus) ont été recensés contre 18 000 de téléchargement de Musicplay (Juilliard, 2002).

Tout ce processus se développe grâce à la multiplication des offres d’accès internet à haut-débit auprès du grand public. Les fournisseurs d’accès à Internet (FAI) s’en donnent à cœur joie en surfant sur la légalité comme en témoigne cette campagne publicitaire de Wanadoo de 2002 : « télécharger 1000 musiques en 24 heures pour 45 euros/mois » (Petrover, 2015). Les FAI sont pris à parti par les acteurs de l’industrie musicale mais sans retombées.

Ainsi, selon l’ARCEP, observatoire du haut débit en ligne, le nombre d’abonnés à internet haut- débit passe de 6 millions en 2004 à 17,7 millions en 2008. Ce phénomène est indissociable de l’augmentation du nombre de téléchargements illégaux, bouleversant ainsi l’industrie musicale. En effet, on observe une baisse considérable du nombre de contrats des nouveaux artistes, une fusion des maisons de disque Sony et BMG en 2004, des plans sociaux sans précédent. Ces bouleversements touchent même certains artistes jugés comme n’étant plus assez rentables. C’est le cas d’Alain Chamfort qui, après une rupture de contrat avec sa maison de disque (EMI), a écrit une chanson pour dénoncer ce phénomène. (Alain Chamfort, Les beaux yeux de Laure).

III.2. Les premières offres numériques légales

En 2001, Apple met sur le marché son premier IPod. Dans l’esprit de la marque, Steve Jobs souhaite que l’utilisateur ne sorte pas de l’écosystème définissant ses outils. Ainsi, il est impossible d’utiliser l’iPod sans iTunes (anciennement Soundjam) et les titres sont codés numériquement dans un nouveau format propriétaire² semblable au MP3, l’AAC. Son ambition le mène à obtenir un accord inédit avec les majors du disque : il sera possible à l’utilisateur Apple d’acheter des morceaux à l’unité pour un prix de 99 cents. 70% de la somme sera reversée directement aux maisons de disques.

Ainsi, le 28 avril 2003, Apple lance d’abord aux États-Unis l’Itunes Music Store, plateforme permettant d’acheter numériquement n’importe quel titre d’un artiste. C’est une révolution étant donné qu’il est possible à l’internaute de se procurer légalement un titre faisant partie du catalogue des cinq majors, soit plus de 200 000 titres. En une semaine, plus d’un million de titres sont vendus. Cela bouleverse considérablement la distribution de la musique. Après un accord avec la SACEM, il faudra attendre un an avant que le service soit accessible en France. Le catalogue comportait ainsi 700 000 titres, comprenant également le catalogue des labels indépendants. En 2006, un milliard de titres seront vendus via l’Itunes Store.

Malgré ce nouveau canal de distribution légal et séduisant pour le consommateur, les majors du disque sont quelques peu réticentes : en 2004, 10 CDs sont vendus physiquement contre 1 numériquement, et le nombre de pirates se comptent en dizaine de milliers (IFPI, 2004). Aussi, c’est l’industriel de l’informatique qui fixe les prix et qui décide de se mettre en avant sur sa plateforme.

Amazon prendra le relais quelques années plus tard pour proposer au client de télécharger des titres au format mp3. En 2007, Apple détient 70% du marché du commerce de la musique en ligne (Brafman, 2007).

La figure 18 ci-dessous illustre l’évolution de la vente de musique selon le support depuis 1973. La crise du début des années 2000 se traduit ainsi par un creux :

*Figure 18 : Évolution des ventes de musique (en millions d’unités vendues) selon leur support Source : (Goldman Sachs , 2016)*

III.3. L’arrivée du streaming

En février 2005, YouTube arrive sur internet. Chaque utilisateur peut mettre en ligne ses propres vidéos. Dès 2006, les majors signent un accord permettant la diffusion de leurs vidéos. Google rachète YouTube en 2009 pour 1,65 milliards de dollars.

Son modèle économique freemium, financé entièrement par les pubs, lui permet de s’imposer rapidement dans les foyers français dotés d’une connexion internet. Il remplace progressivement les radios FM ainsi que les chaînes musicales. La rémunération versée aux organismes de gestion collective de droits est fonction du nombre de vues, avec des taux évolutifs, selon l’accord passé en 2010 avec la SACEM.

Certains organismes de gestion collective de droits étrangers comme l’Allemagne (Versieux, 2013) ou le Japon ont refusé la mise en ligne de leur catalogue car ils estiment les revenus versés par YouTube trop faibles. Les bras de fer entre les avocats de maisons de disque et le géant YouTube referont surface en 2014, lors du lancement de son service de streaming payant Music Key. La surpuissance de Google aboutit à des négociations jugées peu équitables entre les 2 parties (Woitier, 2014).

Parallèlement à l’émergence de ce modèle freemium de streaming vidéo, deux services de streaming audio en Europe (Spotify et Deezer) s’imposent grâce à la démocratisation de l’accès au réseau 3G (puis 4G) et au développement de la fibre optique. L’utilisateur ne possède ainsi plus le fichier audio mais le “loue” temporairement.

Deezer, fleuron de l’industrie musicale française, se développe également en 2007 en séduisant plus de 20 millions d’utilisateurs. Reposant d’abord sur un modèle freemium, il faudra attendre 2009 pour qu’un premier modèle premium d’abonnement soit mis sur le marché. En 2010, un accord est signé avec le FAI Orange, intégrant ainsi l’abonnement premium aux offres d’abonnement internet et de téléphone. Ainsi, 30 millions d’utilisateurs (freemium et premium) sont recensés en 2012, dont 4 millions de premium en 2014. Un service similaire est lancé en Suède par Spotify. Il suivra le même chemin d’implémentation dans les foyers français en signant un partenariat avec SFR en 2011. En 2015, la firme suédoise revendique 60 millions d’utilisateurs dont 15 millions d’abonnés premium. Apple Music a été lancé en 2015.

La figure 19 illustre l’évolution du nombre d’abonnés premium selon les plateformes :

*Figure 19 : Évolution du nombre d’abonnés premium en millions à l’échelle mondiale selon les différentes plateformes Source: Music Business worldwide, Spotify, Apple Music, Deezer*

Les atouts de ces services ont un pouvoir de séduction très fort : ils permettent à l’utilisateur de créer ses propres playlists, comme dans le passé avec les compilations CD gravés ou les playlist iTunes. Il y a aussi les algorithmes brassant l’immense base de données permettent au client de bénéficier de recommandations musicales très personnalisées.

La figure 20 montre l’évolution de la proportion des abonnements premiums chez Spotify :

*Figure 20 : Évolution de la proportion d’abonnements premium de Spotify par rapport au nombre total d’abonnés Source: (Goldman Sachs , 2016)*

En 2013, la SACEM commande au cabinet d’audit Ernst & Young une étude sur le poids économique du secteur culturel. Selon ce rapport, l’industrie culturelle représente en 2013 4% du PIB national et 5% de l’emploi intérieur. Quant à la musique, son chiffre d’affaire avoisine les 8,6 milliards d’euros et elle représente 1% des emplois en France.

En 2013, selon l’Institut Nielsen Soundscan, on observe une baisse du nombre de morceaux téléchargés aux États-Unis : une première depuis le lancement du service. En France, le nombre de morceaux achetés à l’unité recule de 7,1% (Ferran, 2013). L’année suivante, Apple affiche une baisse considérable de 13% des ventes de titres à l’échelle mondiale. La même année, le streaming affiche une croissance inouïe, plus de 33%.

En 2014, selon le Wall street Journal, un utilisateur gratuit de YouTube rapporte aux ayants droit 4 dollars par an contre 60 dollars pour un abonné Spotify.

III.4. Anatomie des dépenses d’un major label

A l’apogée du physique, l’enregistrement d’un album s’étalait entre 100 000 et 150 000 euros. Grâce à la modernisation des équipements (disparition des magnétophones multipistes à bandes, arrivée des stations audionumériques, remplacement progressif des orchestres par les synthétiseurs) le coût de production d’un album s’évalue en 2002 à 20 000 euros (Petrover, 2015). Les coûts de promotion ont alors doublé en sept ans pour passer de 85 en 1995 à 163 millions en 2002.

Par rapport aux recettes totales de l’industrie en 2017, les dépenses consacrées aux artistes ont atteint 34%. Cela est sept points supérieur à 2015 : ces dépenses ont absorbé 27% des revenus totaux des major labels. (Ingham, 2019).

La figure 21 illustre la répartition des différents pôles de dépenses d’un major label, avec l’exemple de Warner :

*Figure 21 : Anatomie des dépenses de Warner Music pour la musique enregistrée, 2016 Source : warnermusic.com*

Nous remarquons que les coûts de production avoisinent en 2016 ceux du marketing : ils ne sont plus que de 25%. L’artist and Répertoire (A&R)³ concentre le plus gros pôle de dépense avec 33% du budget global. Ces chiffres montrent la mutation significative de l’économie d’un label depuis une vingtaine d’années.

Rentrons maintenant dans le détail des dépenses liées uniquement à la production d’un album d’un artiste signé dans une major. La figure 22 montre les différents pôles de dépenses dans le cadre de la signature d’un nouvel artiste :

*Figure 22 :Dépenses moyennes d’une major après signature d’un nouvel artiste Source: (IFPI, 2016)*

Avances : des avances sont généralement versées aux artistes pour leur permettre de se concentrer sur l’écriture de leur musique. Ces avances sont non remboursables, mais récupérables contre les redevances futures.

Coûts d’enregistrement : ceux-ci peuvent varier considérablement d’un artiste à l’autre et atteindre 500.000 dollars pour des projets avec les producteurs et les musiciens de studio les plus recherchés.
Production vidéo : pratiquement toutes les nouvelles productions impliquent la production d’une vidéo.
Tour support : dans de nombreux cas, les labels peuvent offrir un soutien aux tournées à leurs artistes.

Marketing et promotion : il s’agit du principal poste de dépenses pour lequel les labels ont un impact majeur. Alors que les consommateurs ont de plus en plus accès à la musique par voie numérique, les efforts de marketing se sont considérablement déplacés vers les productions en ligne. Les labels créent des campagnes qui lient directement les fans à des artistes et à des services leur permettant d’accéder à leur musique.

Le SNEP indique que les producteurs tireraient moins de revenus issus de leur activité en pointant le fait qu’ils sont déficitaires sur les productions locales, comme le montre le figure 23 suivante :

Figure 23 : Les productions locales sont déficitaires, en millions d’euros.
Source : (SNEP, 2014) — *Figure 23 : Les productions locales sont déficitaires, en millions d’euros.*
*Source : (SNEP, 2014)*

Si le SNEP indique qu’investir dans de nouvelles productions peut être déficitaire, il faut garder à l’esprit que les majors labels ont emmagasiné beaucoup d’artistes au sein d’un catalogue dont ils détiennent toujours les droits. Cette partie de leur répertoire, aussi appelé back catalogue (albums de deux ans et plus), leur permet d’avoir des sources de revenus non négligeables : sur l’année 2015, les ventes – physiques et digitales – de back catalogue sont légèrement supérieures (51 %) aux ventes de nouveautés (49 %). (SNEP, 2015)

IV. Analyse économique de l’industrie phonographique en 2019

IV.1. Chiffres clés

L’IFPI⁴, organisme assurant la promotion de la musique enregistrée dans le monde (représentée par le SNEP⁵ en France) fournit chaque année des rapports très complets sur l’industrie musicale.

La figure 24 retrace l’évolution des revenus mondiaux de l’industrie phonographique :

Figure 24 : Évolution des revenus mondiaux de l’industrie de 2001 à 2018 en US$ billions Source : (SNEP, 2019)

Depuis 2001, le chiffre d’affaires global a baissé de 20,5%. Il est très intéressant d’y observer la répartition progressive des revenus : la baisse croissante de la part du physique a été compensée par la montée en puissance du numérique (téléchargements et streaming). Notons qu’entre 2001 et 2014, année où le CA a atteint son minimum sur cette période, on observe une baisse de 41% des revenus globaux.

Les revenus issus des droits voisins ont progressé de 9,8 % en 2018 pour atteindre 2,7 milliards de dollars. Cela représente 14% du revenu total de l’industrie phonographique.

Avec un chiffre d’affaires de 11,2 milliards de dollars, les revenus issus du numérique ont augmenté de 21,8% en 2018 et représentent 58,9% des revenus de l’industrie phonographique mondiale. Parmi ces exploitations, c’est le streaming, en hausse de 34% par rapport à l’année précédente, qui génère à lui seul la croissance via l’abonnement payant (offre premium) qui a eu un rôle déterminant dans cette progression (+32,9%). Les téléchargements ont quant à eux baissé de 21,2% et ne représentent plus que 7,7% du marché total.

La figure 25 montre, en 2018, comment se répartissent les sources de revenus de l’industrie phonographique :

Figure 25 : Revenu mondial de l’industrie phonographique en 2018 par segment Source: (SNEP, 2019)

La figure 26 illustre la répartition du marché de l’industrie selon les zones géographiques :

Figure 26 : Parts de marché de l’industrie phonographique par zone géographique Source: (Goldman Sachs , 2016) — Figure 26 : Parts de marché de l’industrie phonographique par zone géographique
Source: (Goldman Sachs , 2016)

Le domaine du physique affiche une baisse de 10% et ne correspond plus qu’à 25% du marché mondial. On note cependant une augmentation dans certains pays qui vient contredire cette tendance : Inde +21,2% ; Japon +2,3% ; Corée du Sud +28,8%. Il faut aussi noter que les ventes de vinyles affichent une ascension depuis 12 années, représentant ainsi 3,6% du marché aujourd’hui.

D’autres part, les revenus provenant de l’incorporation de la musique dans le cinéma, la publicité, les programmes de télévision et les jeux-vidéo ont augmenté de 5,2%, conservant ainsi une part de 2,3% du chiffre d’affaires total. (SNEP, 2019)

IV.2. Diversité des écoutes

En 2013, 1% de l’ensemble du catalogue en ligne représentait à lui seul 77% des revenus phonographiques de tous les artistes confondus. Alan Krueger parle d’une économie dite “superstar” (Krueger, 2005), comme l’illustre la figure 27 :

Figure 27 : Répartition des revenus des artistes issus de l’industrie phonographique Source: (Mulligan, 2014)

Intuitivement, la démocratisation de l’accès à la musique ainsi que la variété immense du catalogue offert dans les plateformes de streaming devraient se traduire par une dilution de cette économie superstar. La théorie du long tail stipule que le consommateur pourra plus facilement s’engager dans un contenu dit « de niche » grâce à la grande facilité d’accès de ce catalogue ainsi qu’aux outils de découverte des services de streaming.

La figure 28 montre l’anatomie d’un catalogue de service de streaming comprenant 25 millions de titres :

Figure 28 : Distribution typique d’un service de streaming Source: (Mulligan, 2014) — Figure 28 : Distribution typique d’un service de streaming
Source: (Mulligan, 2014)

L’augmentation rapide du contenu des catalogues a cependant des effets secondaires, dont deux très importants (Mulligan, 2014) :

La tyrannie du choix : chaque mois, en moyenne 100 000 nouveaux titres viennent s’ajouter au catalogue qui en comprenait 25 millions en 2014. Plus de contenu signifie paradoxalement moins de découverte. Il y a tellement de choix qu’il n’y a en réalité que peu de choix. Cela entraîne le consommateur type (qui écoute exclusivement des superstars) à stagner dans son cercle de consommation familier et facile d’accès.
Dilution de la qualité : Avec la recrudescence du home studio et de l’autoproduction, les circuits de distribution d’un morceau sont bouleversés : tout le monde peut ainsi ajouter du contenu dans le catalogue des plateformes de streaming. Sur les 25 millions de titres, seulement 1,25 million (catalogue fréquenté) fait l’objet de streams avec un minimum de récurrence. L’étude du cabinet Nielsen montre que 94% des titres ayant été achetés sur iTunes étaient téléchargées moins de 100 fois (Nielsen Music, 2019). Les titres de qualité sont ainsi dilués dans un océan de productions dont la qualité peut parfois laisser à désirer.

Nous retrouvons le phénomène de concentration du catalogue également dans le streaming vidéo. Selon Next Big Sound, 1% du catalogue représente 79% des vues YouTube et Vevo (Next Big Sound, 2012). Si nous nous intéressons à la radio, ce phénomène est encore plus accentué. Une étude de PRS for Music a montré qu’un diffuseur radio moyen passera en moyenne 15 000 titres différents sur une année, soit 0,01% du contenu disponible (PRS for Music, 2017). Une radio pourrait en théorie diffuser environ 115 000 titres différents sur un an, soit plus de sept fois plus de variété.

IV.3. Impact de la mise en avant dans les playlists

Une étude de l’université du Minnesota (Waldfogel, 2018) s’est questionnée sur l’impact des playlists de Spotify sur leurs utilisateurs. L’étude montre qu’un titre présent dans une playlist suivie par 19 millions d’utilisateurs sera streamé en moyenne 2,6 millions de fois. Elle avance également qu’être en première place du top 100 aux USA engendrerait 14 millions de streams, dont la valeur serait comprise entre 83 000 et 117 000 $. Spotify est le principal manager de ces propres playlists, et les majors du disque (actionnaires à 20%) sont les premiers bénéficiaires de ce modèle de playlist.

Les capacités de personnalisation via les playlists ont été un succès majeur auprès des consommateurs. Depuis août 2016, ces playlists sont écoutées par plus de 40 millions de personnes, plus de 6 à 7 milliards de morceaux ayant déjà été écoutés (Swant, 2016). En mai 2016, Spotify a signalé que plus de la moitié des auditeurs de la playlist personnalisée Discover Weekly avaient écouté au moins 10 titres, et que plus de la moitié des auditeurs étaient de retour la semaine suivante.

Cette mise en avant dans les playlists proposées est donc un atout considérable pour la visibilité de l’artiste. Il s’agit d’un enjeu de taille dans le dialogue entre les producteurs phonographiques et les services de streaming.

IV.4. Évolution des revenus de l’artiste

Entre 2000 et 2013, le rapport des revenus de l’artiste par rapport aux revenus globaux de la musique enregistrée est passé de 14% à 17%. Depuis 2010, l’augmentation du nombre d’utilisateurs de streaming a aidé à maintenir des revenus stables aux l’artistes, en augmentant même de 6,25% en 2013.

Les revenus des artistes en 2013 sont cependant toujours 1,1 milliard en dessous de leur niveau en 2000, comme le montre la figure 29 :

Figure 29 : Évolution des revenus de l’artiste en regard de la proportion du chiffre d’affaire de l’industrie phonographique Source: (Mulligan, 2014) — Figure 29 : Évolution des revenus de l’artiste en regard de la proportion du chiffre d’affaire de l’industrie phonographique
Source: (Mulligan, 2014)

Les revenus des artistes liés à la musique enregistrée sont bien plus diversifiés qu’en 2000. A cette période, les ventes physiques représentaient 99% des revenus, contre 46% en 2013. Avec le lancement de l’Itunes Store en 2003, les téléchargements sont devenus progressivement la seconde source de revenus, pour laisser la place au streaming qui passera en tête en 2017.

L’implication des labels indépendants dans la répartition des revenus est devenue plus avantageuse pour l’artiste (contrats à 50/50%). Elle se manifeste par le fait que 1% de leur répertoire représente 84% des revenus du streaming. 1% des artistes représentent 82% de tous les revenus. Le nombre d’ayants droit en musique populaire est en moyenne de 9 (Les echos, 2018).

La figure 30 illustre la part prépondérante qu’occupent les artistes ‘superstars’ dans l’industrie musicale :

Figure 30 : Évolution des revenus des artistes en fonction de leur catégorie, et part des revenus des artistes “superstars” par rapport aux revenus globaux
Source: (Mulligan, 2014)

Dans cette partie l’accent a été mis sur les revenus des redevances liées à la musique enregistrée. Elle est devenue une source de revenus beaucoup moins importante pour les artistes, représentant ainsi 16% des sommes perçues des 40 artistes les mieux rémunérés. A l’inverse, les revenus engendrés par le spectacle vivant sont plus importants et représentent 80% des revenus de ces artistes superstars.

Ainsi, dans l’industrie phonographique, l’artiste fait face à de nouveaux enjeux qui peuvent entraîner des situations de stress. Une étude menée auprès de 1500 compositeurs (Record Union, 2019) montre que 73% des artistes indépendants ont eu des expériences très négatives concernant leur statut : stress, anxiété, dépression sévère, crises d’angoisses. Les principales raisons données à ces symptômes sont : la peur de l’échec, l’instabilité financière, la pression de la réussite, la solitude…

IV.5. Prévisions d’évolution

Une étude du cabinet Goldman Sachs, « Music in the Air – Stairway to Heaven » a projeté l’évolution de l’industrie musicale jusqu’à 2030, comme l’illustre la figure 31 :

	Spectacle vivant	Industrie phonographique	Edition musicale
2015	$24,70	$23,80	$5,40
2030	$38,30	$56,30	$9,30
Évolution	+55%	+137%	+72%

Figure 31 : Évolution des différentes activités de l’industrie musicale, en million de dollars Source: (Goldman Sachs , 2016)

La figure 32 montre une évolution potentielle de l’industrie phonographique envisagée par l’entreprise :

Figure 32 : Prévision d’évolution de l’industrie phonographique Source : (Goldman Sachs , 2016)

Cette prévision semble cohérente : elle affiche une baisse significative des ventes de musique sur un format physique, les derniers pourcents restants pourraient correspondre au vinyle. Le streaming à tendance à augmenter, notamment dû à la démocratisation de ce service dans les pays émergents.

Conclusion

Dans cette première partie qui a tenté d’être la plus exhaustive possible, nous avons fait un état des lieux de l’industrie musicale aujourd’hui et de son évolution, en exposant tous les liens entre l’artiste les différents acteurs gravitant autour de lui.

Il est possible de le résumer comme le montre la figure 33 :

Figure 33 : Récapitulatif des échanges autour de l’artiste compositeur-interprète Source : (Bouvery, 2019) — *Figure 33 : Récapitulatif des échanges autour de l’artiste compositeur-interprète*
Source : (Bouvery, 2019)

L’industrie musicale semble ainsi remonter la pente activement depuis la crise du disque en raison d’une mutation structurelle inouïe. Les artistes ont dû réagir en adaptant leur stratégie, le dialogue avec leurs partenaires.

L’objet de la seconde partie est amené à répondre à la problématique suivante :

Comment bien se positionner en tant qu’artiste dans l’économie de l’industrie musicale en 2019 ?

Pour cela, il faut comprendre comment l’artiste est amené à structurer et privilégier ses activités pour gérer au mieux ses revenus. Il est judicieux d’également réaliser comment obtenir un équilibre de vie afin de mener à bien l’acte créatif.

PARTIE II : Être compositeur-interprète en 2019 : enquête auprès d’artistes confirmés

A. Objectifs de l’enquête

L’état des lieux effectué dans la première partie fait ressortir le rôle de chaque partenaire de l’artiste, mais aussi toutes les sources de revenus auxquelles il peut prétendre.

Cette enquête a pour objectif de mettre en perspective le point de vue d’artistes, ayant tous des carrières différentes bien entamées, sur leurs sources de revenus, leur dialogue avec les différents acteurs, leur structuration, les difficultés rencontrées.

Comment s’entourer et quel statut adopter ? Quelles sont aujourd’hui les activités à privilégier et les compétences requises afin de bien se positionner dans l’économie ? Comment organiser ses activités afin de garder du temps créatif ? Quelles sont les difficultés rencontrées ? Peut-on, en tant que compositeur en 2019, se passer de certains partenaires de la chaîne de production ? Est-ce un modèle viable ?

B. Méthodologie

B.1. Approche qualitative privilégiée

J’ai décidé d’approcher cette problématique de manière plutôt qualitative, car chaque artiste a une manière bien particulière d’évoluer dans le monde musical. Chaque profil est tellement spécifique et unique que les expériences et impressions de chaque créateur sont difficilement comparables au regard du faible échantillonnage par type de profil. Cependant, cette enquête permet aussi de mettre en avant les différences de profils par le biais de statistiques primaires.

J’ai tenté d’effectuer des entretiens avec des personnes différentes, dont chacune est plutôt spécialisée dans un secteur d’activité précis (disque, musique à l’image, spectacle vivant, endorsement…). Au niveau de l’esthétique de l’univers musical des compositeurs, j’ai choisi de dialoguer avec ceux dont le langage me touche personnellement, et j’étais ravi de pouvoir rencontrer certains dont j’écoute la musique depuis mon plus jeune âge.

La méthodologie repose sur des entretiens semis-directifs. Une base de questions communes⁶ à tous les participants interviewés a été conçue en fonction des recherches précédemment exposées et des problématiques qu’elles soulevaient. Ces questions plutôt ouvertes ont permis d’aborder un sujet et ainsi de se laisser guider sur ce qui en découlait spontanément, afin d’approfondir par la suite chacune des directions proposées.

B.2. Participants aux entretiens

Les participants à l’étude sont tous des artistes professionnels et profondément ancrés dans l’industrie musicale. Au total, dix artistes ont répondu favorablement à ma demande d’entretien et se répartissent de la façon suivante (par ordre chronologique des entretiens) :

Christophe Chassol (Tricatel Records) : pianiste et compositeur, il a développé sa méthode particulière de composition : l’ultrascore.

Thierry Escaich (Éditions Gérard Billaudot) : organiste, compositeur et pédagogue au CNSMDP, son catalogue comprend plus d’une centaine d’œuvres.

Romain Allender (October8 Music) : pianiste et compositeur, il est spécialisé dans l’écriture orchestrale pour la musique à l’image. Il est aussi assistant personnel du compositeur Alexandre Desplat.

Thomas Roussel (Universal Music) : violoniste et compositeur, sa carrière est axée dans la musique à l’image, la musique pour les défilés de mode, et d’autres projets pop.

Jackson Fourgeaud (Warp Records) : musicien et compositeur de musique électronique, il a développé son univers musical unique avec son projet Jackson and his computerband. Il a été pensionnaire en résidence à la villa Médicis en 2015.
Joakim Bouaziz (Tigersushi) : producteur, compositeur et DJ de la scène électronique française, il est aussi fondateur des labels Tigersushi et Crowdspacer.
Marie Jeanne Serero (indépendante) : pianiste et compositrice, elle est sollicitée en France comme à l’étranger par d’importantes personnalités et maisons de production pour composer, orchestrer, et diriger des projets musicaux dans le cadre du cinéma, du théâtre, et du spectacle événementiel, ou pour la réalisation d’albums très divers.

Pierre Juarez (indépendant) : producteur/réalisateur et ingénieur du son, il est reconnu pour ses collaborations avec Matthieu Chedid et le groupe britannique Franz Ferdinand.

Hugo Leclercq (Columbia Records, Sony) : compositeur de musique pop, il effectue une carrière internationale avec son projet musical Madeon. Il a notamment collaboré avec Lady Gaga.
Pedro Winter (Ed Banger Records) : compositeur, fondateur du label Ed Banger, ex- manager de Daft Punk et DJ, il est une véritable figure de la musique électronique en France depuis plus de vingt-cinq ans.

Chaque participant s’est vu proposé plusieurs options possibles concernant l’intégration de leur propos dans l’enquête :

aucun anonymat
nom cité dans la liste des artistes, anonymat partiel sur certaines citations
nom cité dans la liste des artistes, anonymat complet sur toutes les citations
anonymat complet

B.3. Procédure des entretiens

Les entretiens ont duré en moyenne 45 minutes. Ils ont été enregistrés afin de permettre une retranscription écrite exacte et précise. Ils ont tous été réalisés en tête à tête à l’exception d’un seul qui a été réalisé par téléphone pour des raisons logistiques.

L’intitulé de l’étude⁷ était annoncé avant l’entretien de façon très ouverte afin de ne pas trop influer sur les futures réponses des compositeurs. Ils découvraient au fur et à mesure les questions pour laisser part à la spontanéité le plus possible.

Mes interventions durant les interviews étaient très minimes afin de ne pas orienter les réponses obtenues. Je lisais principalement les questions et relançais dans le cas où la réponse pouvait être plus développée. Dans le cas où les participants avaient un doute sur le sens des questions, j’ai pu être amené à donner plus de précisions.

Durant certains entretiens, des discussions ont pu naître entre deux questions, ce qui a permis d’aborder certains points que les questions ne soulevaient pas.

B.4. Questionnaire

Le questionnaire commun à tous les artistes est le suivant :

Pouvez-vous décrire votre environnement de travail et votre statut juridique ?

Cette première question large a permis d’ouvrir la discussion sur le champ d’activité de l’artiste et sur sa structuration.

2. Quels types de revenus liés à votre musique percevez-vous ?

Cette question, sûrement l’une des plus importantes de l’étude, met en avant les différentes sources de rémunération pour le compositeur, et fera ainsi ressortir les activités liées.

3. Quelles sont pour vous les meilleures compétences à développer pour bien se positionner dans l’économie de l’industrie musicale ?

Cette question a particulièrement suscité l’intérêt des participants puisqu’elle fait appel à la fois à des critères psychologiques, musicaux et financiers. Elle permet de mettre en évidence certaines capacités nécessaires à l’artiste pour développer sereinement son activité.

4. Quelle importance donnez-vous au réseau professionnel ?

Nous avons vu dans la première partie que les acteurs sont très divers et variés, il paraît alors légitime de connaître les liens qu’entretient l’artiste avec l’ensemble des acteurs qui l’entourent.

5. Quelles difficultés liées à votre carrière rencontrez-vous aujourd’hui ?

Certainement le plus personnel, ce point permet d’appréhender les problématiques rencontrées par les artistes dans leur carrière afin d’évoluer sereinement.

6. Pensez-vous que le partage de la valeur liée à votre musique est juste et équitable ?

Cette question fermée permet de cerner le ressenti des artistes concernant la distribution des richesses entraînée par leur œuvre.

7. Que pensez-vous de l’autoproduction ?

Cette question plutôt ouverte permet de mettre en avant l’opinion de l’artiste de manière indirecte sur ses partenaires et de voir à quel point il est possible et légitime de s’autoproduire une fois bien inséré dans l’industrie.

8. Quelle importance donnez-vous au temps dédié à la création ?

Cette question est la plus ouverte de toutes, elle a suscité des thèmes de discussion très différents et personnels. La composition de musique est avant tout le cœur l’économie de l’industrie musicale.

Les questions personnalisées ne seront pas détaillées ici. Elles permettaient de mieux cerner les rôles et les approches des artistes en fonction de leurs spécificités artistiques. Elles étaient relativement plus fermées que les questions présentées ci-dessus.

B.5. Méthode d’analyse

Après chaque question, nous avons d’abord exposé, sous forme de récapitulatif, les points de vue émergents pour ensuite analyser dans le détail les différentes réponses. Enfin, nous avons discuté ces résultats pour chaque question.

Les extraits ont été retranscrits dans un tableau, triés par catégorie d’analyse et par sujet. Ensuite, un travail de synthèse a été effectué afin de faciliter la lecture des résultats.

Dans un premier temps, nous exposerons pour chaque question un récapitulatif des résultats obtenus. Nous ferons ensuite une analyse plus approfondie avant d’en tirer une interprétation Enfin, il sera mis en avant mon vécu en regard des résultats identifiés dans la partie précédente.

C. Résultats et discussion

C.1. Question 1 : Pouvez-vous décrire votre environnement de travail et votre statut juridique ?

C.1.1. Récapitulatif des résultats

Figure 34 : Entourage et statuts juridiques évoqués par l’échantillon

C.1.2. Résultats détaillés

Un des premiers faits évoqués par les participants a été le rôle de l’agent (ou manager) du compositeur. Les avis divergent et sont plutôt tranchés quant au fait de faire appel aux services d’un tel acteur.

D’un côté, il y a ceux (40%) pour qui se passer d’un agent est tout à fait possible, et même nécessaire, comme en témoigne le propos de Joakim Bouaziz :

“Je n’ai pas de manager, je n’aime pas leur façon de travailler. J’ai vu beaucoup de managers saccager des carrières en prenant de mauvaises décisions à la place de l’artiste. La qualité importante d’un manager est que ce soit quelqu’un qui comprenne l’identité du projet et qui ait le réseau adéquat, et je n’ai jamais rencontré quelqu’un qui puisse apporter ceci.” –Extrait 1 : Joakim Bouaziz

L’autre partie des profils affiche un besoin de s’entourer d’un manager, pour consacrer le maximum de leur temps à la création :

“Je pense que la première personne avec qui je travaille est mon agent depuis 10 ans. Il dit qu’il donne de la valeur aux choses. Aujourd’hui, mon agent est mon associé, on travaille main dans la main. Il s’occupe de tout ce qui n’est pas musical donc beaucoup de choses, et je n’ai plus qu’à composer” –Extrait 2 : Thomas Roussel

L’argument de valorisation de l’artiste par l’agent, lié au manque de savoir-faire du compositeur a été évoqué par trois participants :

“Mon agent est capable de voir à quel point je suis endorsé par rapport à une marque, la visibilité que cela apporte, le temps que cela nécessite. Je ne saurai pas me vendre comme ça. Cela demande des compétences juridiques, managériales… ” –Extrait 3 : Thomas Roussel

“Les revenus sont ascendants, notamment par la négociation à la hausse des commandes. Je ne sais pas faire ça et cela me met mal à l’aise. Le véritable agent pour le compositeur est l’éditeur. Mon éditeur ou agent anglais arrive à négocier parfois le double du montant que je pouvais percevoir il y a quelques années. Je ne demanderai pas autant qu’eux, ça ne me viendrait pas à l’idée.” –Extrait 4 : Thierry Escaich

“J’ai un agent qui gère les affaires de ma société et que dès qu’il y a un client potentiel, elle gère. Il y en a qui sont très spécialisés dans la prospection, trouver des clients…Je ne ferai certainement pas aussi bien !” –Extrait 5 : Jackson Fourgeaud

Thierry Escaich, représentant la musique contemporaine dans cette étude, exprime explicitement le rôle de l’éditeur :

“La chose qui est la plus structurante pour un compositeur est d’avoir un éditeur. A l’époque ancienne c’était le commanditaire. Je suis maintenant chez Gérard Billaudot qui m’appelle pratiquement tous les jours (demande de partition, demande de tel pianiste veut me jouer, suivi du travail de composition, etc.). L’éditeur s’engage et est responsable de la livraison de la partition. Ils viennent aux concerts, la notoriété du compositeur influe sur leur maison d’édition”. -Extrait 6 : Thierry Escaich

Il est intéressant de relever que la musique contemporaine (et plus largement, la musique “classique”) présente une différence notable dans le rôle de l’éditeur. En effet, dans les autres genres de la musique, l’éditeur n’a jamais été évoqué en tant que partenaire privilégié à ce stade de l’étude.

70% des participants ont indiqué avoir déjà signé dans leur carrière un contrat d’artiste avec un label. La difficulté de signer avec un tel acteur a été évoquée par Christophe Chassol :

“Je voulais un label qui puisse sortir mes disques de compositeur et des groupes que je montais. J’ai été tout seul pendant 15 ans de ma carrière. J’ai eu de mauvaises expériences avec des managers qui ne faisaient pas leur travail. J’ai écrit et envoyé des CD a tous les festivals et labels susceptibles d’être intéressés et je n’ai jamais eu de réponse. J’ai tout fait tout seul, j’ai même fait des plaquettes et des CD avec un faux texte de présentation. J’ai toujours connu beaucoup de monde dans l’industrie mais aucun label n’a été intéressé avant 2011”. –Extrait 7 : Christophe Chassol

Cette difficulté de signer avec un label a été nuancée par Hugo Leclercq :

“J’ai eu la chance d’être découvert avec une vidéo virale, donc dès le début de ma carrière, les labels se battaient pour me signer. J’ai pu négocier un contrat avec certains avantages.” –Extrait 8 : Hugo Leclercq

En ce qui concerne le statut, la grande majorité des compositeurs a une multitude d’activités qui les amène à créer leur entreprise et ainsi à avoir le statut de gérant de cette société. Aucun d’entre eux n’a répondu avoir le statut d’intermittent du spectacle, mais 50% ont précisé que lors de leur prestation, ils cotisent pour le statut sans pouvoir en bénéficier des avantages.

En ce qui concerne le statut, 80% des participants ont monté une structure leur permettant de facturer des prestations de création comme le montrent ces propos :

“J’ai fait 2 sociétés (SASU), une de production qui empoche l’argent des primes de commandes, qui investit pour payer des orchestres, et une autre d’édition. Je suis coéditeur de toutes mes œuvres, je prends 50% de la part d’éditeur donc il me revient 75% en tant que personne physique.” –Extrait 9 : anonyme

“Je suis freelance avec ma société d’audiovisuel pour rester indépendant. Cela fait que je peux travailler sur différents projets sans être affilié à un acteur en particulier. Mon cœur d’activité est la réalisation d’album et le mixage d’album. ” –Extrait 10 : anonyme

Trois participants ont un statut lié à la transmission du savoir : Marie-Jeanne Serero et Thierry Escaich sont professeurs au CNSMDP et Christophe Chassol effectue des chroniques pédagogiques dans une émission sur France Musique.

Enfin, deux participants ont indiqué privilégier une organisation pour favoriser la création :

“Le but de mon organisation est de m’assurer que l’essentiel de mon temps est dédié à créer et à inventer des choses. Si je ne suis pas impliqué trop dans le détail juridique de la structuration, c’est que c’est quelque chose qui marche. C’est en mouvement permanent.” –Extrait 11 : Hugo Leclercq

“Je continue exactement ce que j’ai appris avec Daft Punk au milieu des années 90, à savoir être indépendant, créer un outil, créer un système, écrire une histoire tout en étant conscient du système réel qui existe et de l’environnement qui nous entoure (maisons de disques, éditeurs, tourneurs…). Mon label est bénéfique pour les artistes avec qui je collabore, ils sont dans un confort de création et de vie.” –Extrait 12 : Pedro Winter

C.1.3. Discussion

Il est intéressant d’observer que la nature des résultats obtenus dépend en grande partie du profil de chaque artiste. Par exemple, dans le cas des personnes ne s’entourant pas d’agent, il y a Joakim Bouaziz qui est diplômé de l’école HEC. Il dispose de compétences managériales et commerciales solides : en plus de son statut de compositeur, il est aussi dirigeant de deux labels. Il sait ainsi donner de la valeur aux choses, notamment à ses compositions en les valorisant sur le marché de la musique.

En ce qui concerne le rôle du manager, il semble qu’un tel acteur soit approprié en fonction de la personnalité de chaque artiste. Il a été mis en avant que ce corps de métier doit être un choix de confiance et réfléchi puisqu’il semble que certains agents n’exercent pas leur activité de manière consciencieuse. Cela a été le cas notamment avec le cas de Tim Bergling (Avicii) : le documentaire retraçant le succès de sa carrière montre bel et bien le profil de l’agent qui, omnibulé par les chiffres, ne prend pas en compte la santé de l’artiste (Tsikurishvili, 2017). Cela a mené au suicide de l’artiste.

L’une des structurations d’activité les plus remarquables en termes d’optimisation dans l’économie est celle qui vise à créer une société d’édition musicale pour partager la part revenant à l’éditeur. C’est le cas de 2 participants à l’étude.

Enfin, le fait d’exercer une activité liée à la musique avec un emploi stable tel que l’enseignement permet de sécuriser financièrement son activité de compositeur.

C.2. Question 2 : Quels types de revenus liés à votre musique percevez-vous ?

C.2.1. Récapitulatif des résultats

Figure 35 : Types de revenus évoqués par l’échantillon

C.2.2. Résultats détaillés

La première chose qui est frappante dans les réponses, c’est que les participants ont presque tous évoqués (90%) les commandes d’œuvre comme étant une des sources de revenus importantes, comme l’indique ce graphique des revenus évoqués ci-dessus.

Thierry Escaich a fait écho à la commande en expliquant son degré de liberté :

“Il faut savoir que les commandes ne sont pas forcément contraignantes parce qu’elles ne nous disent pas ce qu’il faut écrire. Évidemment, l’opéra l’est un peu, parce qu’une fois que le livret est choisi, c’est un gros travail. Quand Valery Gergiev m’a commandé une pièce pour orchestre, il m’a dit ‘fais-moi un genre ouverture’ alors j’ai fait une sorte d’ouverture, cela tombait bien parce que je n’avais pas trop cela dans mon catalogue. Le fait d’avoir une commande vous oblige à le faire : il y a aussi la paresse du compositeur, se mettre dans l’idée d’une pièce à écrire est souvent inhibant. Si on n’a pas l’aiguillon du fait que la pièce doit être jouée, même si vous êtes compositeur et que vous avez envie d’écrire, il y a un moment où on est pris dans un tas de questionnements qui fait qu’on n’écrit pas. La commande a cet avantage qui donne une direction, tout en restant libre.” –Extrait 13 : Thierry Escaich

Un participant a quant à lui évoqué l’aspect mercantile de cette activité auprès de marques :

“La fourchette de la prime de commande pour une pub est comprise entre 10 000 et 40 000 euros, en sachant que je fais beaucoup d’appels d’offres. Ce qui me prend le plus de temps et qui est le plus rémunérateur pour moi est de composer de la musique pour des événements : opening d’un musée, lancement d’une collection de mode, soirée de lancement d’un nouveau produit. J’adore faire cela, c’est très luxueux. Ils me demandent de composer une musique pour une soirée. Cela va être joué qu’une seule fois, mais souvent la marque s’approprie la musique en l’utilisant pour son identité sonore. Le chiffre d’affaire dépasse parfois 100.000 euros pour cette activité. 80% de mon business est là.” –Extrait 14 : Thomas Roussel

En ce qui concerne les revenus issus des droits d’auteur, une grande partie des participants a indiqué cette source comme étant intéressante, comme le montre les extraits suivants :

“Cela fait plus de 20 ans que je réalise des commandes pour de la musique à l’image, donc les droits d’auteurs sont conséquents” –Extrait 15 : Christophe Chassol

“La principale source de revenus est issue des droits d’auteur. C’est assez régulier et ne fait que croître. Au fur et à mesure, de plus en plus de mes pièces ont tourné en concert à l’échelle mondiale. Les droits de concerts sont peu importants, seulement ceux dans les philharmonies sont notables. Les droits de télé et de radio sont très importants. Cela dépend des pays aussi, notamment en Russie où il n’y a qu’avec Gergiev et le Mariinsky que c’est déclaré. Chaque pays a sa notion des droits.” –Extrait 16 : Thierry Escaich

“Entre 80 et 90% de mes revenus sont issus des droits d’auteur, je le touche à titre personnel via la musique que je compose pour les séries d’animation.” –Extrait 17 : Romain Allender

“Je perçois des droits d’auteur, notamment sur le travail que j’ai pu faire avec Lady Gaga. L’éditeur m’a aussi accordé une avance. C’est très pratique pour les personnes qui ont besoin d’avoir une sécurité de l’emploi, parce que les royalties mettent beaucoup de temps à arriver. » –Extrait 18 : Hugo Leclercq

Il est intéressant de noter que dans certains cas précis, le droit d’auteur n’est pas récolté par les SPRD auprès des exploitants de l’œuvre, impactant ainsi directement le compositeur :

“En ce qui concerne les droits d’auteur, on me fait souvent miroiter des conséquences financières importantes alors que ce n’est finalement pas le cas. Par exemple, pour l’habillage sonore de Pathé Gaumont (petits jingles diffusés avant le lancement d’un film dans tous les cinémas de l’entreprise), la prime de commande était faible mais ils m’ont dit cela va passer 700 fois par jour ! Je n’ai encore rien vu de l’argent ! Les éditeurs, très intéressés par les droits d’auteurs, sont en discussion avec la SACEM. En fait, l’argent n’est collecté qu’à partir de la première seconde du film diffusé en salle, et pas pendant la préséance. Cela fait 2 ans que ma musique est diffusée 700 fois par jours et que je n’ai pas touché de droits d’auteurs! Warner Chappell⁸ en a fait un vrai sujet de bataille pour débloquer cela, surtout que c’est rétroactif.” –Extrait 19 : Thomas Roussel

Bien que sporadiques dans la carrière d’un compositeur, les synchronisations avec une œuvre audiovisuelle ont été évoquées comme étant une source de revenu très importante. Un participant a donné exemple intéressant pour se rendre compte des montants en jeux lors d’un enjeu important :

“Lorsqu’une marque veut utiliser ma musique pour une de leur publicité, c’est de 100 000 à 500 000 euros. Récemment, lorsqu’une marque a choisi l’un de mes titres, il y a eu 500 000 euros répartis entre mon label, les éditeurs, ma société d’édition, celle de production ainsi que ma personne physique de compositeur. Ainsi, j’ai pu toucher environ 300 000 euros. Je me suis donc demandé pourquoi faire de la musique d’appels d’offre ? Cela rémunère environ 10 fois plus qu’une commande !” –Extrait 20 : anonyme

Le spectacle vivant ressort des entretiens en partie (60%), principalement parce que certains des participants ne pratiquent pas une activité d’artiste-interprète. Certains actes comme les DJ- sets ont été évoqués comme étant très rémunérateurs (aucun chiffre n’a été donné).

Thierry Escaich a mentionné une certaine forme de paradoxe concernant les montants touchés lors de certaines représentations :

“J’ai été plus payé pour interpréter la 3ème symphonie de St-Saëns avec le Berliner Philharmoniker que j’ai donné 3 fois en concert que pour la pièce que j’écrivais pour eux qui m’a demandé 6 mois. Même là, l’opéra que je suis en train d’écrire, cela ne me rapporte presque rien mais je me dis que ça apportera un peu de notoriété.” –Extrait 21 : Thierry Escaich

La création d’un spectacle peut être très coûteuse et n’engendre parfois aucun bénéfice. C’est le cas évoqué par Jackson Fourgeaud et Hugo Leclercq qui ont créé un show visuel inédit avec une scénographie très élaborée :

“La tournée en théorie génère du profit mais sur la mienne je n’ai pas gagné d’argent. La production du show était trop coûteuse et aucun bénéfice n’a été dégagé. J’avais vraiment envie de proposer quelque chose de singulier et de travaillé, je n’ai pas regardé les dépenses.” –Extrait 22 : Jackson Fourgeaud

“En ce moment je suis sur une tournée européenne qui n’est pas bénéficiaire. Même si Paris et Londres sont complets, cela coûte tellement cher de faire venir 15 personnes des USA, un camion, un tour-bus, que ce n’est pas rentable économiquement. On le fait donc uniquement pour des raisons de promotion avec l’idée de revenir plus tard pour faire de plus grandes salles. C’est le label qui complète le manque à gagner pour qu’on se retrouve à un équilibre financier. Ainsi, tout le monde est payé sauf moi. Cela est logique puisque dans les tournées rentables, c’est moi qui récupère la mise. Là où cela sera rentable c’est quand la production sera ramenée en festivals qui ont déjà leur propre infrastructure. Je vais donc montrer la qualité du show dans des dates peu rentables, prouver l’adhésion du public pour revenir l’an prochain faire du profit.” –Extrait 23 : Hugo Leclercq

La vente de disque ou les revenus générés par le streaming n’ont été que rarement évoqués (30%) comme étant une source de revenu intéressante, comme en témoigne ces extraits :

“La vente de disques, je n’y songe même pas ! Je ne compte absolument pas dessus, mais le disque représente une carte de visite, entraîne une exposition, des synchros…” –Extrait 24 : Christophe Chassol

“Le streaming, c’est encore pire ! Cela monte mais ne représente rien. Il faudrait vraiment avoir une place énorme dans le nombre d’écoutes pour que cela fonctionne. C’est pour la musique populaire.” –Extrait 25 : Thierry Escaich

Ces propos sont contrastés dans le cas notamment de Pierre Juarez :

“Avec mes points de royalties sur les albums que je réalise, je perçois des revenus non négligeables sur les ventes physiques si les disques se vendent bien.” –Extrait 26 : Pierre Juarez

Le merchandising a été évoqué à deux reprises, mais signalé comme une part de revenu non négligeable :

“Le merchandising est important également, mais cela est inégal selon les produits. Par exemple, en ce moment on propose des stickers, on les vend assez chers mais on ne fait pas de marge dessus. J’ai envie que ces stickers existent. En revanche, les t-shirts sont plus profitables.” –Extrait 27 : Hugo Leclercq

La multiplication d’activités est ce qui est beaucoup ressorti des entretiens. Ces extraits appuient bien cet autre aspect :

“Ce sont vraiment toutes mes activités qui font partie de mes revenus : deejaying, écrire de la musique pour des marques, des expositions, produire des artistes, mixer des albums, musique à l’image. Ma manière de rester actif sans devoir me compromettre à faire des choses que je ne voudrais pas faire, c’est de multiplier mon activité, ce qui correspond dans mon intérêt général à ne pas m’enfermer dans un domaine d’action.” –Extrait 28 : Joakim Bouaziz

“Il y a une tendance générale à être de plus en plus complet en touchant de plus en plus de domaines. Il y a aussi un déplacement de compétences dans le monde du compositeur orchestral : maintenant les orchestrateurs font le travail de copiste, le copiste devient imprimeur.” –Extrait 29 : Romain Allender

“Nous avons réussi à rendre les clips musicaux, qui étaient au début des outils marketing, complètement associés à l’œuvre d’art qu’est la musique. La pochette des albums est dans cette même démarche. Nous travaillons avec un graphiste depuis 25 ans, Bertrand Lagros de Langeron (So Me), pour sublimer les pochettes. Avec l’exemple de Justice, l’œuvre est musicale, graphique et audiovisuelle, comme le témoigne le film que nous avons sorti fin août.” (Chémétoff, 2019) –Extrait 30 : Pedro Winter

C.2.3. Discussion

Il ressort de cette question que les commandes sont le nerf de la guerre des ressources financières du compositeur, tout comme le sont les synchronisations et les cachets d’artiste- interprète.

Les revenus engendrés par le streaming ou la vente de disque ne représentent pas un axe de focalisation d’attention, même si ces revenus ont tendance à augmenter (cf. I-4.1). La notion de tyrannie du choix évoquée en I-4.2 se vérifie bel et bien ici. Avec ce modèle de rémunération en part de marché, seuls les artistes disposant le plus d’écoute comme Mathieu Chedid peuvent bénéficier de revenus significatifs via ce mode de consommation de la musique.

On notera enfin que la multiplication d’activités renvoie à la notion de “jack in all-trade”. Elle peut être connotée péjorativement, mais le sociologue Pierre-Michel Menger indique qu’ils “sont des individus polyvalents, ou de petites entreprises unipersonnelles. Ces jack-in-all trade doivent détenir des compétences qui relèvent des ressorts intimes de la créativité, et d’autres qui sont sociales, économiques et gestionnaires, d’autres qui relèvent de l’aptitude à démarcher, monter des projets, négocier des financements”. (Menger, 2019)

C.3. Question 3 : Quelles sont pour vous les meilleures compétences à développer pour bien se positionner dans l’économie de l’industrie musicale ?

C.3.1. Récapitulatif des résultats

Figure 36 : Compétences évoquées par l’échantillon

C.3.2. Résultats détaillés

Cinq grands axes sont ressortis dans les réponses à cette question.

Le premier axe, évoqué par cinq artistes, correspond à la capacité de savoir se valoriser auprès d’un certain réseau (le networking), comme l’indiquent ces extraits :

“La notion de réseau et la manière de se vendre sont très importantes. C’est révélateur de la société. Parfois on peut passer plusieurs rendez-vous entiers à ne pas parler de musique mais uniquement d’image. Ce n’est pas pour autant que je sais mieux me vendre maintenant ou que c’est quelque chose d’important pour moi, mais je suis moins surpris et conscient de ce facteur. Cela va être de mieux en mieux pour les gens qui savent se vendre et de pire en pire pour les autres.” –Extrait 31 : Romain Allender

“Ma capacité à effectuer de la direction d’ensemble a développé des capacités de relationnel, d’organisation, de vision d’ensemble… Le network est essentiel pour entretenir les liens avec les partenaires, comme l’indique très bien la biographie de Quincy Jones.⁹

D’ailleurs, si on me dit d’aller à tel vernissage pour rencontrer un réalisateur susceptible de réaliser une synchro avec l’une de mes compositions, j’y vais !” –Extrait 32 : Christophe Chassol

Toujours dans cette notion de relationnel, un extrait de l’entretien avec Thierry Escaich indique que ce réseau est très important parce qu’il peut déclencher un acte créatif mais qu’il n’est pas toujours à priori une source de revenu immédiate :

“Il y a les commandes qui sont le résultat d’une relation humaine avec un musicien, je ne lui ai d’ailleurs rien fait payer. Je n’aime pas me faire payer directement par des gens, je n’ai pas ce rapport à l’argent. Il est très rare que je me fasse payer dans ce genre de cas. En sachant que peut-être, cette pièce pourra être rentable si elle jouée par d’autres interprètes.” –Extrait 33 : Thierry Escaich

Un autre vecteur partagé par moitié des participants correspond à la capacité à s’ouvrir et à collaborer avec d’autres formes artistiques : la danse, le théâtre, arts plastiques, la vidéo etc. Les extraits ci-dessous l’illustrent :

“Je ne sais pas si on peut appeler cela des compétences, mais j’ai franchi un cap lorsque j’ai commencé à composer un opéra via la proposition d’un ami qui ne m’a pas laissé me défiler. Cela m’a fait découvrir un autre monde où l’on collabore avec des metteurs en scène par exemple. J’ai pris goût à travailler avec des metteurs en scène et des réalisateurs. C’est vrai que c’est un autre travail, et moi qui suis assez proche de tout ce qui dramaturgique, cela m’a fait du bien. Je n’avais pas eu de rapport avec la danse et Benjamin Millepied m’a démarché pour que je lui écrive un ballet lorsqu’il était au New York City Ballet. Cela fait partie des choses qui m’ont fait progresser, et j’ai même inclus une partie de ballet dans le prochain opéra que je suis en train de composer. J’aime aussi travailler avec des gens qui sont en dehors de la musique classique comme Richard Galliano.” –Extrait 34 : Thierry Escaich

“En 2005, avec l’apparition de YouTube j’ai développé des compétences de vidéo pour réaliser moi-même un travail à l’image.” –Extrait 35 : Christophe Chassol

“Je me suis notamment intéressé aux arts plastiques, ce qui m’a amené à faire une résidence à la Villa Médicis ou encore de jouer à l’IRCAM… Cela a vraiment été fondateur, j’ai eu ce besoin artistique de me renouveler en m’intéressant à une autre façon de présenter et de vivre mon métier. J’ai complètement élargi ma pratique artistique. 90% de ma motivation à créer provient de mon envie d’apprendre et de découvrir par moi-même ! ” –Extrait 36 : Jackson Fourgeaud

“Vouloir créer toujours mieux en explorant des zones de création que je ne connaissais pas auparavant est une source de motivation immense ! Par exemple, avec le théâtre ou le cinéma, j’aime avoir un projet qui m’amène à découvrir quelque chose de l’ordre de mon potentiel afin de l’élargir.” –Extrait 37 : Marie-Jeanne Serero

“Il est important d’essayer de ne pas s’enfermer dans son statut et dans son univers musical, il faut essayer de s’enrichir musicalement et culturellement en permanence.” –Extrait 38 : Romain Allender

Ensuite, deux participants à l’étude ont évoqué l’atout technique qu’est la maîtrise des outils modernes de production musicale (maquettage orchestral, plugins, DAW¹⁰…) et plus largement la technologie. Les trois extraits suivants appuient cette direction :

“D’un point de vue technique, savoir maîtriser le maquettage avec les plugins de sample d’orchestre est un atout considérable. On a déjà eu un réalisateur qui avait mis une maquette sur la version finale du film ! J’enregistre quand même avec un orchestre parce que cela fait partie de ma valeur ajoutée.” –Extrait 39 : Thomas Roussel

“L’arrivée des ordinateurs et des plugins a rendu le métier très indépendant, on peut quasiment gérer l’ensemble de la chaîne de production sous réserve de temps et de financement nécessaire.” –Extrait 40 : Romain Allender

“Je pense que c’est toujours plus facile lorsqu’on est un profil attentif, soucieux de la qualité produite, qui sait maîtriser les outils technologiques. Ce qui me plait est d’être très impliqué dans les éléments de productions (quelles lumières ou quels écrans mettre sur scène par exemple). Le fait d’être intéressé par cela aide à prendre les bonnes décisions, à être raisonnable ou à dépenser l’argent de manière intelligente.” –Extrait 41 : Hugo Leclercq

Aussi, un autre axe abordé par deux compositeurs est la capacité à s’adapter aux différentes demandes et de faire preuve d’une certaine flexibilité :

“Je pense aussi qu’une grosse qualité est d’être très adaptable : on demande toujours beaucoup plus aux compositeurs, le fait de s’adapter et de rester réactif permet de rester dans la boucle. Dans la musique à l’image, je ne crois plus vraiment au musicien qui fait son œuvre et qui ne revient pas dessus après sollicitation des réalisateurs. Par exemple, avec Alexandre Desplat qui collabore en ce moment avec Wes Anderson, la manière de travailler est très différente des précédentes avec Roman Polanski ou encore Costa Gavras. Le réalisateur passe 2 semaines en studio afin de retravailler sur la musique avec Alexandre Desplat. Cette méthode est assez unique mais elle a notamment pu donner un Oscar sur The Grand Budapest Hotel. Sans cette capacité, le compositeur est remplacé très vite.” –Extrait 42 : Romain Allender

“Parfois il faut savoir se montrer souple et à l’écoute de son environnement et d’autres ou il faut peut-être se montrer en rupture et l’assumer. Je pense que c’est comme cela que naissent de nouvelles idées.” –Extrait 43 : Jackson Fourgeaud

Enfin, le dernier axe abordé, partagé par 20% des participants, indique qu’il faut privilégier de s’entourer intelligemment en construisant une structure autour de l’artiste, favorisant ainsi la création :

“L’idée c’est que chaque artiste invente quelque chose d’intéressant parce qu’il a une personnalité et une identité. On construit ensuite autour une infrastructure qui fait l’interface entre une personnalité et le monde. Un rappeur n’a pas les mêmes qualités qu’un chanteur de chanson française, en termes de personnalité et de relation avec l’industrie, et pourtant les 2 carrières peuvent avoir beaucoup de succès. Il vaut mieux construire autour de l’artiste plutôt que d’obliger l’artiste à s’adapter.” –Extrait 44 : Hugo Leclercq

“Dans un premier lieu, c’est vraiment l’œuvre et la création qui priment sur toutes les autres compétences possibles. Le caillou pur est primordial. Le façonnage du diamant, l’embellissement et le packaging sont nécessaires et indispensables, mais ils viennent en second lieu. Je suis convaincu que l’artiste a besoin d’être entouré, à la fois dans le processus créatif, celui de défendre leur musique, de la faire entendre.” –Extrait 45 : Pedro Winter

C.3.3. Discussion

Ces cinq axes sont cohérents entre eux et paraissent sainement exploitables pour tirer le meilleur parti financier de l’activité de compositeur. Le networking est directement en lien avec la quatrième question.

C.4. Question 4 : Quelle importance donnez-vous au réseau professionnel ?

C.4.1. Récapitulatif des résultats

Figure 37 : Avis évoqués par l’échantillon

C.4.2. Résultats détaillés

Cette question a suscité une certaine forme d’approbation auprès des participants de l’étude. D’abord, il y a l’entretien du réseau et le fait de démarcher en personne les différents acteurs qui sont ressortis majoritairement :

“J’ai eu des groupes, je faisais de la musique de film, pour la publicité, pour des séries, des arrangements. Tout cela se faisait grâce à mon réseau personnel que j’ai développé au cours du temps en démarchant les producteurs directement (maisons de disque, boîte de production de télé, boite de synchro, boite de production de cinéma…)” –Extrait 46 : Christophe Chassol

“Je ne suis pas le meilleur placé pour en parler parce que je ne suis pas réputé pour être quelqu’un de très mondain, mais j’entretiens des liens avec des gens importants comme avec des directeurs de salle. Cependant, même si je vois peu de gens, entretenir la relation peut donner des fruits, parfois plus qu’un agent. J’organise parfois des déjeuners pour faire des demandes importantes, sans passer par mon agent. J’ai un de mes anciens élèves qui me demande des projets, mais il ne sort jamais, n’entretient aucune relation avec des interprètes et attend que je le fasse. Il faut le faire par soi- même, cela permet de créer une certaine proximité avec ces acteurs qui penseront à vous. Il y a tellement de productions aujourd’hui !” –Extrait 47 : Thierry Escaich

“C’est très important, j’ai arrêté de tout faire par mail uniquement et de favoriser le contact humain. Le meilleur exemple que je connaisse est Pedro Winter. Il connaît tout le monde du milieu, et prend vraiment plaisir humainement à entretenir ces relations.” –Extrait 48 : Thomas Roussel

“Le réseau est très important. Comme m’avait dit Pedro Winter, le plus important dans ce milieu est d’être bien entouré, le reste est plus accessoire.” –Extrait 49 : Joakim Bouaziz

“Malgré le fait que les réseaux sociaux et plus largement internet permettent de toucher directement un grand nombre de personnes, la réalité est plus complexe. Il y a certes des exemples qui vont dans ce sens, je pense notamment à DJ Snake qui revendique le fait de ne pas avoir besoin d’aller au journal de 20h pour vendre son album, parce que lorsqu’il publie quelque chose sur les réseaux sociaux, il touche directement 1 million de personnes. Avoir un pied réel dans l’industrie musicale, en rencontrant directement ses acteurs permet de tracer sereinement sa route.

Maintenant, le pouvoir s’est dirigé auprès des plateformes de streaming. Avant, nous allions voir les directeurs de radio pour valoriser les morceaux. Maintenant, il faut être copain avec le directeur des playlists Spotify pour s’assurer que le morceau sera mis en avant. C’est un modèle qui ne correspond pas à mon idéal, mais cela ne me pose aucun problème de me rendre dans les locaux des services de streaming pour valoriser mes artistes. Le plus important est de ne pas être esclave de ce phénomène. Je suis notamment en train de développer l’activité du label sur Bandcamp, qui est un modèle à prendre en considération. ” –Extrait 50 : Pedro Winter

Ce qui pourrait ressortir implicitement de ces réponses est le fait de forcer les relations afin d’obtenir absolument un projet via son réseau. Cette idée a été largement anticipée par une grande majorité des participants (80%) :

“Je pense que ce n’est pas important dans le sens où si cela provient d’une action personnelle c’est de l’ordre du pathétique. Si c’est pour prendre le téléphone pendant 3 jours et dire “bonjour, je suis là”, je trouve que c’est triste. S’il s’agit de l’entretien par les actions et la créativité qui s’y fait et qui est reconnue, là oui. Toutes mes actions sont efficaces par rapport à mon métier, la création, la composition ou l’efficacité pour enseigner, pour transmettre et faire en sorte que chacun y trouve son compte.” –Extrait 51 : Marie-Jeanne Serero

“Réseauter au sein de l’industrie pour essayer de percer, je n’y crois pas du tout. Tous les artistes qui ont eu une carrière signifiante, ils ont produit leur musique dans leur coin et c’est l’industrie qui les a repérés. L’un des métiers de l’industrie musicale consiste à repérer ces talents-là. Faire du forcing à donner son CV à tout le monde est perçu par les acteurs de l’industrie comme étant décrédibilisant. Les personnes qui font beaucoup de bruit pour se faire remarquer auprès de l’industrie, ça n’est pas pris au sérieux. En revanche, toucher directement le public fonctionne, et l’industrie le remarque par la suite.” –Extrait 52 : Hugo Leclercq

“Il est important d’entretenir un certain relationnel sans qu’il s’agisse de jouer la comédie pour dénicher des commandes.” –Extrait 53 : Thierry Escaich

“Je crois au naturel des rencontres, trop les provoquer ou les attendre peut parfois biaiser la dynamique. Aujourd’hui, je pense qu’il faut faire des choses de qualité et se débrouiller pour les diffuser. Je préfère être dans ma bulle.” –Extrait 54 : Jackson Fourgeaud

“J’essaye au maximum de ne dépendre de personne pour avoir ma liberté. J’essaye d’imposer mes conditions. Je ne veux pas que cela entrave la création. Je préfère passer 6 mois sur un projet pour en faire quelque chose de dont je suis satisfait sans contraintes, le sortir en indépendant, plutôt que de me perdre dans le réseau pour essayer de convaincre les acteurs.” –Extrait 55 : Pierre Juarez

C.4.3. Discussion

Privilégier les interactions professionnelles en réel semble être cohérent avec la thèse développée par Pierre-Michel Menger. Il indique que “réduire la distance spatiale entre les différents acteurs est primordial : il vaut mieux que les acteurs soient réunis dans un espace suffisamment dense pour que le jeu de l’interconnaissance se fasse. Il s’agit de l’économie d’agglomération.”

Certains participants indiquent cependant une certaine volonté d’indépendance, pour focaliser leur attention sur la création.

Après s’être intéressé aux compétences à privilégier et au networking, il est intéressant de s’attacher aux difficultés rencontrées par les artistes.

C.5. Question 5 : Quelles difficultés liées à votre carrière rencontrez-vous aujourd’hui ?

C.5.1. Récapitulatif des résultats

*Figure 38 : Difficultés évoquées par l’échantillon*

C.5.2. Résultats détaillés

Cette question très personnelle a suscité un grand intérêt auprès des participants. L’exploitation des réponses a permis de regrouper les difficultés en six catégories.

La première, partagée par une grande majorité des participants (70%), correspond au manque de temps. Les extraits ci-dessous vont dans cette direction :

“Tout ce qui est en amont de la création d’une pièce sur le plan artistique n’est pas délégable, et c’est très compliqué à gérer. Il faudrait que je fasse comme Henri Dutilleux, c’est à dire d’arrêter de faire le reste (enseigner, diminuer les concerts). Je suis en surdosage d’activités par rapport aux conséquences de la composition.” –Extrait 56 : Thierry Escaich

“La plus grande difficulté est le manque de temps. Mais aussi de faire en sorte que ce métier puisse s’intégrer à la vie personnelle parce que j’ai une infinité d’envies et elles ont du mal à se contenir dans une seule vie.” –Extrait 57 : Marie-Jeanne Serero

Une deuxième catégorie est ressortie des réponses, il s’agit de la disponibilité et la visibilité de la musique auprès du public. Les propos suivants vont dans ce sens :

“Ce qui est frustrant aujourd’hui c’est qu’il y a tellement de musique avec le streaming qui sort que c’est très dilué, c’est difficile d’être présent. J’ai souvent l’impression que cela ne sert à rien, et que le public s’en moque. Le rapport du public à la musique a l’air d’être devenu très éphémère, peu intéressé, sans passion.” –Extrait 58 : Joakim Bouaziz

“Faire exister un disque aujourd’hui est plus compliqué, tout simplement parce qu’il y en a beaucoup plus. Je trouve génial cette espèce de chaos infernal dans lequel on est, il y a une musique de masse très présente et tout ce qui est de l’ordre de la contre- culture est marginalisé. Je pense que c’est un enjeu de taille, tout en ne sachant pas quel cours peuvent prendre les événements. » –Extrait 59 : Jackson Fourgeaud

Dans ce dernier extrait, même si cette immensité de choix est montrée comme une difficulté, elle est aussi considérée comme étant une source de motivation.

Cette visibilité de l’artiste auprès du public a été évoquée également par Pedro Winter, avec une notion de temporalité :

“Le problème est aussi temporel. Il est possible d’être visible dans une temporalité très réduite, parce que le lendemain de la sortie d’un album, il y aura déjà une centaine d’autres albums qui auront pris la place. Cela est facilement constatable avec la programmation du Pitchfork Festival. Ils annoncent en effet qu’il s’agit des artistes immanquables dans le paysage musical. Avec un regard plus détaillé dans la programmation, on s’aperçoit que les artistes ont une présence immense sur les réseaux sociaux mais qu’on n’a jamais entendu parler de leur musique. A l’édition du festival suivant, ils annoncent à nouveau une dizaine de nouveaux artistes avec les mêmes qualités. C’est un peu effrayant. Aujourd’hui, le développement d’artiste se fait dans une zone temporelle divisée par cent. Les outils de la création et de diffusion de la musique sont très performants. Mais au final, il est beaucoup plus compliqué d’exister.” –Extrait 60 : Pedro Winter

Ensuite, la compétitivité extrême dans le secteur de la musique à l’image a été évoquée à plusieurs reprises, comme l’illustre ce propos de Romain Allender :

“Un ami compositeur s’est fait viré par son agent. En vérité, la chaîne est inversée : le compositeur peut devenir jetable ! S’il ne compose pas, l’agent n’a pas de travail et ainsi de suite pour tous les acteurs. Malheureusement, l’industrie a réussi à inverser la tendance, le compositeur est devenu remplaçable très facilement, notamment dans le milieu du dessin animé, où si le compositeur ne remporte pas l’offre, il y a en aura pléthore pour le faire. “ –Extrait 61 : Romain Allender

Le fait d’avoir un avenir incertain constitue le quatrième pôle de difficultés évoqué :

“Ne pas avoir de vision de carrière claire peut parfois pomper une grosse énergie. On ne peut pas savoir ce qu’il sera des droits d’auteurs dans 3 ans et les cartes sont rebattues très souvent.” –Extrait 62 : Romain Allender

“Peut-être qu’après je serai très déçu parce que je serai de moins en moins joué ou passé de mode. C’est le questionnement de chaque compositeur, et heureusement qu’on n’a pas la réponse. J’avais peur en commençant mon activité de ne pas gagner ma vie alors j’ai conjugué ma passion pour l’enseignement avec mon activité professionnelle de compositeur.” –Extrait 63 : Thierry Escaich

“En 2014, j’ai refusé d’écrire pour les films de comédie, c’est un choix qui m’a un peu coûté humainement parce que j’avais peur de l’avenir.” –Extrait 64 : Thomas Roussel

“Parfois, il est possible de ressentir une certaine insécurité concernant l’avenir. C’est rude parce que le public est attentif, exigeant, dur, critique… On prend la responsabilité morale et financière de tout ce qu’on fait. Il y a une forme de responsabilité de chef qui parfois peut être difficile parce que ce n’est pas le métier de base (création). Il est difficile d’anticiper que cela va impliquer des responsabilités humaines et sociales. Il y a des personnes dont le revenu dépend de mon inspiration. Ces difficultés sont certainement communes à tous les chefs d’entreprise.” –Extrait 65 : Hugo Leclercq

La difficulté à séparer le milieu professionnel et personnel a été répertoriée auprès de 30% des participants :

“On a tendance à très vite dépasser la sphère professionnelle en mélangeant avec la vie personnelle, menant parfois à des situations inconfortables avec des collègues mêlant émotions, affect et enjeux professionnels.” –Extrait 66 : Romain Allender

“C’est un métier qui nécessite énormément de sacrifices personnels, où la frontière est très floue entre l’intime et le professionnel.” –Extrait 67 : Hugo Leclercq

Enfin, le dernier axe répertorié au sein des réponses est le risque d’avoir des problèmes de santé mentale :

“Il y a aussi une corrélation très forte entre le métier de musicien professionnel et des obstacles de santé mentale. Je pense qu’il peut y avoir deux facteurs : d’abord, les personnes disposant d’un aspect créatif très fort peuvent être prédisposées à ce genre de problème. Aussi, l’industrie peut les favoriser avec le rythme de travail qu’elle impose. Les personnes qui vont avoir des facilités pour entreprendre un projet artistique peuvent avoir une sorte de comorbidité avec des problèmes de manie ou de bipolarité. C’est assez logique finalement. L’industrie n’a pas les infrastructures en place pour gérer ce genre de profils.” –Extrait 68 : Hugo Leclercq

C.5.3. Discussion

Il semble que nous pouvons regrouper ces six axes au sein de deux catégories :

Les difficultés propres aux métiers créatifs :

❏ La disponibilité de l’œuvre auprès du public, dûe au mode de consommation de la musique via le streaming. La notion de tyrannie du choix prend à nouveau sens dans ce cas de figure.

❏ L’avenir incertain, lié à l’instabilité d’un tel métier qui ne peut pas offrir d’emploi stable tel qu’un CDI où il semble plus facile d’avoir une forme de sérénité concernant le travail.

❏ L’atteinte à la santé mentale. L’étude de Record Union évoquée en I-IV (p. 42) est en concordance avec ce résultat.

Les difficultés rencontrées par tous les corps de métiers de la société moderne :

❏ Le manque de temps, les deadlines rapprochées, une compétitivité très intense.

❏ La séparation de la vie professionnelle et personnelle.

Maintenant que nous avons appris la structuration du compositeur, les sources de revenus et compétences à privilégier ainsi que les difficultés rencontrées, il est important de savoir s’ils estiment que le partage de la valeur créée par leurs œuvres est équitable.

C.6. Question 6 : Pensez-vous que le partage de la valeur liée à votre musique est juste/équitable ?

C.6.1. Récapitulatif des résultats

Figure 39 : Arguments évoqués par l’échantillon

C.6.2. Résultats détaillés

Les participants aux entretiens ont souhaité que leur réponse soit anonymisée dans le cadre de ces propos. Ce qui est ressorti majoritairement (80%) de cette question est que le streaming est peu avantageux au niveau des revenus, sans surprise au regard de l’état des lieux de son économie effectué dans la première partie. Cela ressort dans ce propos :

“En ce qui concerne le streaming, une vingtaine d’artistes sont les artistes les plus écoutés qui gagnent très bien leur vie. Il y a beaucoup de compositeurs qui ont beaucoup d’écoutes mais ils ne vivent pas de leur musique par ce biais. De mon point de vue, nous sommes au point culminant du streaming mais cela va forcément muter parce que ce n’est pas viable pour plus de 90 % des artistes.” –Extrait 69 : anonyme

“Concernant le streaming, je vois des sommes clairement ridicules. En plus, les majors ont fait des hold-up qui ont été des infamies parce qu’ils ont demandé un chèque de 250 millions d’euros aux services de streaming sous menace de retirer leur catalogue de leurs plateformes. Après, les 250 millions récoltés par les labels sont restés au chaud et n’ont jamais été redistribués aux artistes.” –Extrait 70 : anonyme

Cependant, il a été soulevé par un participant à l’étude que ce moyen d’écoute apporte une visibilité permettant de rassembler le public durant les tournées de concert :

“Le streaming n’est vraiment pas avantageux. En revanche, il semble que ça se rééquilibre avec la tournée, parce que plus on est écouté plus on est amené à tourner.” –Extrait 71 : anonyme

La répartition liée au streaming a été aussi relativisée, notamment par l’aspect immatériel de cette consommation :

“Les versements des plateformes de Streaming sont encore ridicules. Mais en même temps, quelle est la valeur d’un fichier impalpable ?” –Extrait 72 : anonyme

Ensuite, la répartition des droits d’auteur avec l’éditeur a été contestée, et cela dans tous les domaines de la musique.

“Je me demande toujours à quoi servent concrètement les éditeurs. Certes, ils perçoivent les droits mais ils ne sont proactifs sur rien. Le seul intérêt d’avoir un éditeur est à mon avis l’avance de droits d’auteurs concédée lors du pacte de préférence. Cela permet de développer son activité.” –Extrait 73 : anonyme

“L’édition est un drôle de métier. C’est étonnant que leur fonction ait perdurée. Je pense que 80% des artistes ont signé un contrat d’édition parce qu’ils avaient besoin d’avance monétaire de l’éditeur pour écrire leur musique avant de la présenter à un label. Aujourd’hui, un artiste qui n’en a pas besoin garde ses éditions, ou il passe un deal de coédition.” –Extrait 74 : anonyme

“En ce qui concerne l’éditeur, notamment dans l’édition de la musique dédiée à la télévision, le rôle est assez biaisé. Ils sont juste là pour prendre ⅓ des droits sans réelle action de leur part. Dans le cas de la musique à l’image, ce champ est très verrouillé et les producteurs de film prennent le rôle d’éditeur. D’ailleurs, on peut se poser la question de leur utilité : ils donnent de l’argent pour la prime de commande mais se remboursent sur les droits d’édition.” –Extrait 75 : anonyme

Ces propos sont ainsi balancés par le fait que l’éditeur peut concéder des avances, ce métier reste remis en question même dans le cas de propos a priori élogieux :

“Même si l’éditeur prend énormément, la fabrication d’un CD peut coûter 50 ou 60 000 euros alors que cela ne me coûte rien personnellement et me rapportera des revenus via les droits d’auteurs. Le mien fait un bon travail, mais ils ne sont pas équipés pour faire un bon travail comme le font les éditeurs anglo-saxons : ils n’engagent personne pour faire de la promotion.” –Extrait 76 : anonyme

Dans le cas de collaborations avec d’autres artistes, le partage de la valeur liée au travail du compositeur a été mis en avant dans ce propos :

“Une autre difficulté rencontrée a été ma collaboration avec un autre artiste. J’ai touché une prime de commande de 6000 euros et absolument aucun droit, même pas ceux d’arrangements. Si on ne discute pas avant des termes du contrat, on a perdu d’avance, d’autant plus en discutant en tant qu’artiste. D’où l’intérêt d’être bien entouré. Ce n’est finalement pas important, parce que cela permet d’être reconnu et apporte une certaine notoriété.” –Extrait 77 : anonyme

La répartition injuste entre le label et l’artiste a été évoqué par 10% des participants, comme l’illustre le propos suivant :

“Dans les royalties provenant du label, j’estime que c’est extrêmement injuste par rapport à ce qu’ils fournissent. Ce ne sont pas tous des visionnaires, cela reste une entreprise où les têtes tournent, et parfois les équipes proposées ne sont pas forcément au niveau de ce qu’on attend. Pendant une période, j’avais même employé à temps plein des assistants, un vidéographe, etc. En interne, j’ai pu produire énormément de contenu en tout maîtrisant sans passer par le label. Alors quand ils gardent une part immense des revenus et que je finance les projets moi-même, c’est une sorte de double peine.” –Extrait 78 : anonyme

Un participant a aussi indiqué que le partage de la valeur s’était amélioré :

“Cela tend à être plus juste. Les nouvelles plateformes comme Bandcamp permettent d’avoir une rémunération pour les ayants droit plus transparente et directe.” –Extrait 79 : anonyme

Enfin, il faut aussi noter que 60% des participants ont mentionné d’être idéologiquement en faveur du partage de la valeur de la musique, ce qui nuance les propos ci-dessus.

C.6.3. Discussion

Si les résultats relatifs à cette question convergent dans le sens d’un partage de la valeur inéquitable entre les différents acteurs, faudrait-il se passer d’eux en s’autoproduisant ?

C.7. Question 7 : Que pensez-vous de l’autoproduction ?

C.7.1. Récapitulatif des résultats

*Figure 40 : argument évoqué par l’échantillon*

C.7.2. Résultats détaillés

Pour 60% des participants à l’étude, devenir producteur soi-même a été envisagé ou déjà fait. Pour le reste, cela n’est pas ressorti et les artistes n’ont jamais songé ni voulu s’autoproduire. Il est important de noter que dans le cadre de la musique à l’image, l’autoproduction a moins de sens parce que, comme nous l’avons vu dans la revue de littérature, le producteur de cinéma est à l’origine de la commande auprès du compositeur.

D’abord, l’autoproduction a été envisagée dans l’optique de conserver les droits sur l’enregistrement (le master, les bandes) afin de bénéficier pleinement des rémunérations issues de ce droit. C’est notamment l’argument de Thierry Escaich :

“J’ai quelquefois pensé à financer mes projets parce qu’il est très difficile de faire des disques aujourd’hui. Si vraiment je veux faire un disque pour mes 3 concertos pour orgue, il faudra peut-être que je finisse par le produire moi-même en cherchant des aides de financement. Le seul avantage est d’être propriétaire du master. Si Universal arrêtait de diffuser mes anciennes productions, je ne serais absolument pas propriétaire et il se passerait la même chose qu’avec Johnny Hallyday il y a une quinzaine d’années lorsqu’il a voulu récupérer ses bandes. Je me demande ainsi si pour certaines productions de CD, je n’aurais pas intérêt à devenir producteur. Je pense que cela constitue un vrai avantage.” –Extrait 80 : Thierry Escaich

Cet argument a cependant été nuancé par Pedro Winter :

“Certains artistes ne cherchent absolument pas à garder la propriété de leur master, et donc une carrière accompagnée par un label se justifie complètement. Est-ce que l’indépendance a quelque chose de plus héroïque ? Je pense que cela dépend du plaisir personnel avant tout de l’artiste, et il faut trouver une structure autour de l’artiste menant à son épanouissement.” –Extrait 81 : Pedro Winter

Ensuite, Pierre Juarez a mis en avant le fait que l’autoproduction, combinée avec des collaborations très ciblées semble être un modèle viable :

“C’est le futur de l’industrie musicale. En étant quelqu’un de créatif, il est possible de faire un disque de A à Z tout seul. Ce que je trouve intéressant, c’est de faire appel à des personnes aux compétences très précises, ce qui enlève tout le superflu. Ainsi, il est possible pour soi-même d’aller à l’essentiel, de faire ce qu’on sait faire le mieux. D’un autre côté, les maisons de disques disposent d’un fort réseau, mais il n’est pas possible de choisir ses partenaires.” –Extrait 82 : Pierre Juarez

Si ce propos constitue une projection dans l’avenir, Thomas Roussel, quant à lui, a complètement autoproduit son premier EP¹¹ en précisant que cela a porté ses fruits :

“Pour mon premier EP, j’ai tout fait en autoproduction. J’ai eu au final 4 synchros. J’ai ensuite signé le reste de l’album avec Universal. Un disque peut ainsi ne pas passer inaperçu en autoproduction ! Universal m’a ensuite permis d’enregistrer avec le London Symphony Orchestra sans rien débourser de ma poche.” –Extrait 83 : Thomas Roussel

Notons que le schéma d’autoproduction suivi ici a mené à la signature avec une major du disque, ce qui est appuyé par le discours de Romain Allender :

“Je pense que c’est tout à fait faisable, mais à partir du moment où il y a une dimension commerciale, il est quelque part obligé de rentrer dans une chaîne ou dans une autre.” –Extrait 84 : Romain Allender

Ce propos a été nuancé par Hugo Leclercq qui indique que le rôle du label est complètement remis en question, en indiquant le poids du back-catalogue :

“Ce que je devine, c’est que les responsabilités des labels vont passer dans la main du management avec des contrats complètement différents : il y aura davantage de risque financier de la part des artistes mais avec une rétribution financière plus importante. Les responsabilités et les risques changent. Le rôle du label va être de moins en moins pertinent. Aujourd’hui, notamment dans le secteur du rap, les labels sont presque assimilés à un métier d’assureur. Ils estiment ainsi leur risque à investir des millions. Ils ne sont pas vraiment dans le développement et l’accompagnement d’artiste. C’est ainsi une sorte de banque qui se spécialise dans les risques musicaux. Ils signent des artistes qui marchent déjà. Ces structures survivent des droits engendrés par le back- catalogue.” –Extrait 85 : Hugo Leclercq

C.7.3. Discussion

Si pour 60% des participants, la question de l’autoproduction est ou a été envisagée, il reste tout de même 40% qui n’y ont pas songé ou qui ne veulent pas se séparer des acteurs privilégiés.

Il reste enfin une question fondamentale concernant l’importance donnée au temps dédié à la création dans ce milieu qui est une industrie, alors que son fondement est purement basé sur l’acte créatif.

C.8. Question 8 : Quelle importance donnez-vous au temps dédié à la création ?

C.8.1. Récapitulatif des résultats

Figure 41 : Propos évoqués par l’échantillon

C.8.2. Résultats détaillés

Trois grands axes de réponses sont ressortis de cette question.

D’abord, il est ressorti que ce temps créatif a besoin d’un certain calme pour s’activer, avec une grande notion de liberté. Ce propos a été partagé à plusieurs reprises :

“Je veux le maximum de temps pour pouvoir procrastiner, prendre du recul sur ma musique parce que c’est primordial pour le développement des idées” –Extrait 86 : Christophe Chassol

“J’aimerais avoir des plages de quelques mois devant moi pour m’ennuyer et écrire de la musique.” –Extrait 87 : Romain Allender

“Il y a des périodes où je ne compose pas de musique. Je m’installe en terrasse d’un café pour noter des idées, réfléchir ou je fais des recherches sur un sujet qui m’intéresse. Pour continuer à avoir l’envie de créer, je pense qu’il faut être prêt à découvrir et à apprendre tout le temps.” –Extrait 88 : Jackson Fourgeaud

“Je trouve que la création relève de l’entraînement. Par exemple, les Daft Punk prennent beaucoup de temps pour composer. Je pensais à l’origine que la rareté des productions des Daft Punk était une sorte de stratégie commerciale, mais en fait c’est vraiment dans leur nature et vision de la musique. C’est de l’authenticité, ce qui permet de transmettre les émotions. Il est important de s’écouter, c’est comme un sportif qui écoute son corps pour être performant. Les acteurs de l’industrie ont pris une certaine habitude que les choses aillent très vite, les deadlines sont de plus en plus rapprochées. De manière générale, j’ai l’impression qu’on oublie le processus de création. “ –Extrait 89 : Pierre Juarez

“Je fais tous les choix pour que le temps créatif soit libre, et que je ne sois pas contraint de composer dans une esthétique. De mon point de vue, les personnes dépendantes trop d’une créativité ciblée sont malheureux. Tous les choix que je fais avec ma carrière sont faits non pas pour optimiser le profit, mais pour optimiser ma liberté. Parfois, il est possible de sacrifier de la liberté sur l’autel d’un peu plus de profit, mais je crois dans mon fort intérieur que le taux de change entre liberté et profit est sous-estimé. La chose qui m’intéresse le plus est de rester libre.” –Extrait 90 : Hugo Leclercq

Une des capacités déployées pour disposer de ce temps signalé comme étant précieux est la réalisation de projets rentables où il faut faire preuve d’une efficacité sans nom dans un laps de temps très court :

“La musique de film et de pub permettait de sécuriser l’apport financier, même si éthiquement je ne suis pas pour le principe. Il s’agit du meilleur rapport temps/argent. Par exemple, j’ai pu faire un jingle en 30 minutes qui m’a rapporté 10 000 euros alors que pour d’autres projets plus personnels j’ai pu travailler durant des mois et cela m’a rapporté 10 fois moins. J’ai pu acheter mon temps de création, de mûrissement des idées grâce à la musique de pub. Le temps important passé au développement de mes projets personnels a été rendu possible grâce à ces activités rentables de pub et de musique de film. J’ai fait de la musique de film et de pub parce que cela achète ma liberté. ” –Extrait 91 : Christophe Chassol

“Parfois, je compose les morceaux en une journée, donc c’est très rentable. Par exemple, en ce moment dans le cadre d’un événement pour une marque, le chiffre d’affaires est au-delà des 100 000 euros et j’ai passé 2 jours à composer. À côté de cela, je peux travailler sur mon EP très personnel et cela me prend beaucoup plus de temps.” –Extrait 92 : Thomas Roussel

D’autres exemples de projets rentables ont été cités, notamment par le biais de dj-sets :

“À titre d’exemple, pour l’enregistrement de mon dernier album, l’enregistrement a coûté très cher parce que j’employais des gens à plein temps, je louais des studios, j’engageais des musiciens… En contrepartie, j’ai fait des dj sets pour payer cela.” –Extrait 93 : Hugo Leclercq

“Mes artistes ont carte blanche pour leur musique. Par exemple, Justice sort un album tous les 5 ans, Sebastian tous les 8 ans. C’est un rapport de confiance immense. Ils arrivent également à développer une activité de DJ, ils reçoivent des commandes pour des défilés, qui leur permettent d’avoir un certain confort financier.” –Extrait 94 : Pedro Winter

Enfin, tous les participants ont répondu que durant les périodes dédiées à la composition, il s’agit d’un travail acharné quotidien, comme le montrent les propos ci-dessous :

“Il y a diverses sortes de compositeurs, ceux qui s’astreignent à un travail chez eux comme Dutilleux qui composait tous les matins. De mon côté, je suis beaucoup plus fantasque. Mon environnement de travail est celui de ma vie quotidienne de pédagogue et d’interprète. Je n’extrais pas ma vie de compositeur des autres parts de ma vie. Je peux composer n’importe où : entre 2 deux répétitions, entre 2 cours… Je compose là où il m’est donné d’être dans ma vie professionnelle.” –Extrait 95 : Thierry Escaich

“J’y dédie mes journées entières ; je gère ça difficilement parce que je fais le grand écart tous les jours. C’est comme un marathon quotidien !” –Extrait 96 : Marie-Jeanne Serero

“Depuis 4 jours, j’ai envie d’être dédié à la musique pour en faire 7 heures par jour.” –Extrait 97 : Jackson Fourgeaud

C.8.3. Discussion

Pour l’interprétation de cette dernière question, il peut être judicieux de citer un des travaux de Pierre-Michel Menger. Il a fait part d’une enquête en cours d’exploitation sur le temps de création sur un échantillon de 6000 artistes-plasticiens français. Ils devaient estimer la répartition de leur temps en fonction de 4 catégories :

❏ Part de temps consacrée à la création (core activity) ?

❏ Part pour la recherche de financements (appels à projets, demande de subventions, etc.) ?

❏ Part pour la communication (presse, réseaux, etc.) ?

❏ Part pour le segment administratif et fiscal ?

Les résultats sont les suivants :

Figure 42 : Répartition du temps d’un artiste plasticien Source : (Menger, 2019)

Ces résultats permettent ainsi de donner une certaine pondération de notre étude qualitative.

Il en ressort tout de même que, dans notre société plutôt axée sur la productivité, l’argument de savoir prendre le temps semble contrebalancer le rapport à la rentabilité. Il semble aussi être un atout nécessaire qui pourrait rentrer dans la liste des compétences évoquées en II-3.3.

D. Confrontation de l’enquête à mon expérience personnelle

Le questionnaire a permis de centrer l’étude sur la place du l’artiste dans l’industrie musicale et a aussi permis de mettre en avant des convergences ou des divergences parmi les points de vue des différents participants.

Dans cette partie, j’aimerais discuter les résultats obtenus au regard de mon vécu dans l’industrie musicale. Une grande partie des acteurs ou projets évoqués seront anonymisés.

D.1. Relation contreproductive avec un agent

D’abord, rappelons le propos de Joakim Bouaziz cité en C.1.2 : “J’ai vu beaucoup de managers saccager des carrières en prenant de mauvaises décisions à la place de l’artiste.” De mon côté, j’ai signé dans le passé un contrat de représentation d’artiste avec un agent. Il s’avère que cette relation contractuelle a largement dépassé la sphère professionnelle, pour devenir extrêmement négative et contre-productive. Cela confirme ainsi le fait que bien s’entourer est primordial, comme cela a été soulevé dans la question 3.

D.2. Responsabilité de l’éditeur musical

Le rôle et les responsabilités de l’éditeur ont été soulevés dans la question 6. En ce qui me concerne, j’ai pu signer un pacte de préférence avec un éditeur musical. Comme nous l’avons vu précédemment, le rôle de l’éditeur est de rendre disponible la musique au public par tous les moyens et, il peut être amené à concéder des avances financières sur les droits d’auteur pour accompagner le projet. Ce projet est encore en cours de développement et vise à sortir bientôt un album, et il n’a jamais été question de pouvoir bénéficier d’une avance. Aussi, l’éditeur n’a toujours pas déposé les feuillets que nous avons signés ensemble auprès de la SACEM, m’empêchant ainsi de profiter des droits d’exécution publique et des droits mécaniques : les œuvres ont été interprétées plus d’une quinzaine de fois en concert dans le cadre de festivals, et cumulent une petite dizaine de diffusions radio, notamment sur France Musique. Cela renvoie directement aux propos relevés en B-3.2 concernant le rôle mitigé de l’éditeur. Le plus paradoxal dans mon cas, c’est qu’il se prive lui-même de revenus !

D.3. Importance de négociation au préalable du contrat

Par ailleurs, l’enquête précédente a montré que la négociation au préalable du contrat est primordiale, afin de ne pas avoir de mauvaises surprises.

J’ai pu être amené à travailler sur une production de musique à l’image où je devais réaliser un travail technique. Rapidement, j’ai aussi pu composer certaines petites parties. En voulant faire valoir mon droit d’auteur, mes collaborateurs m’ont indiqué que le contrat signé avec les producteurs cinématographiques ne permettait pas d’ajouter un autre auteur. La musique que j’ai composée sera ainsi signée par les personnes sur le contrat avec le producteur. Cela m’a permis de comprendre, avant de commencer un projet, la nécessité de s’assurer que le contrat signé fera valoir son droit d’auteur.

D’autre part, j’ai pu être très surpris par les conditions dans lesquelles j’étais censé jouer à un concert. Ce dernier était à l’initiative d’une structure de l’État et soutenu par de nombreux partenaires tels que Arte, le CNC ou encore la SACEM.

J’ai accepté de faire cette prestation sans parler d’argent dans un premier temps. J’ai appris par la suite qu’aucune rémunération n’était prévue, même avec de tels partenaires ! J’ai donc dû lutter pour faire valoir mes droits et négocier un cachet d’artiste. Cela renforce la notion de s’assurer des termes du contrat avant de se lancer dans un projet.

D.4. S’ouvrir sur d’autres formes d’art

L’une des compétences évoquées dans la troisième question est celle de l’ouverture sur d’autres formes d’art. Je me sens directement concerné par celle-ci, comme en témoignent certains de mes projets : création d’une œuvre sonore et plastique interactive, compositions réalisées pour trois pièces chorégraphiques.

D.5. Privilégier les rencontres en personnes

Enfin, au regard de la quatrième question, le fait de démarcher directement les acteurs concernés par un projet est ressorti.

Durant ma scolarité, je voulais absolument effectuer un stage auprès de Philippe Zdar qui représentait une véritable icône et modèle de carrière durant mon adolescence. Étant une figure de l’industrie très sollicitée, j’ai décidé d’aller le rencontrer en personne à la sortie de l’une de ses interviews en radio. Je lui ai ainsi présenté mon souhait d’effectuer un stage, ce à quoi il m’a indiqué de lui envoyer un mail en n’hésitant pas à le relancer. Ainsi, durant quatre mois, tous les deux jours, il recevait des mails de ma part. Au bout de cette période, il m’a répondu : “Ton opiniâtreté est toute à ton honneur. C’est exactement le genre de verrue que j’apprécie et qui est primordiale dans ce métier. Viens demain matin au studio.”

Je pense que la rencontre en direct avec Philippe a permis de pouvoir réaliser mon souhait. Cette expérience a même donné suite à du travail, j’ai ainsi pu contribuer à l’élaboration du dernier album de Cassius12 en étant assistant.

Mon vécu personnel n’entre ainsi pas en contradiction avec les propos recueillis durant l’enquête.

12Cassius est un duo appartenant à la french touch formé par Philippe Zdar et Hubert de Blanc Francard.

E. Synthèse générale des résultats

Dans cette enquête, plusieurs points ont été soulevés que nous pouvons synthétiser au sein de cette liste :

❏ le rôle mitigé de l’éditeur, remis en question par le fait qu’il ne serve plus qu’à accorder une avance

❏ s’entourer intelligemment, rôle nécessaire d’un agent pour valoriser l’artiste dans certains cas

❏ négociation dans le détail des contrats au préalable

❏ les sources de revenus à privilégier : commandes, concerts, synchronisations

❏ réalisation de projets rentables pour consacrer le maximum de temps à la création

❏ favoriser la multiplication d’activités et l’ouverture sur d’autres arts

❏ le networking en démarchant en personne les partenaires

❏ bien gérer sa santé mentale (surdosage d’activités, peur de l’avenir incertain, place au sein d’un marché compétitif)

❏ le streaming : grand choix mais peu de visibilité

❏ les avantages de l’autoproduction en faisant appel ponctuellement à des acteurs de la chaine si besoin

Conclusion

Contributions

Cette étude a permis de clarifier l’écosystème important pour un créateur et de mettre en évidence les évolutions de l’industrie l’entourant.

Elle a aussi montré qu’il fallait donner une importance particulière au fait que l’artiste est aujourd’hui une sorte de chef d’entreprise qui veut garder le contrôle créatif au maximum en s’entourant intelligemment. L’économie de l’industrie musicale s’est complètement déplacée vers de nouveaux horizons. Une infime partie des artistes arrive à vivre directement de l’industrie phonographique par la vente ou le streaming de ses œuvres. Le compositeur peut aujourd’hui cumuler plusieurs activités pour générer des revenus : artiste-interprète dans le spectacle vivant, éditeur de ses propres œuvres, réaliser du merchandising, etc. Le secteur privé, par ses commandes, ses demandes de synchros, apporte une part très prépondérante des revenus. Il ne faut pas s’attendre à ce que les contrats proviennent du secteur public.

Ainsi, le mode de financement des artistes est presque complètement dissocié du consommateur : quel poids a le prix d’un billet de concert au regard des sommes perçues lors d’une synchro pour une marque de luxe ?

L’enquête aura aussi démontré l’importance de s’entourer intelligemment, de prendre le temps et de garder une certaine forme de liberté.

Limitations

Cette enquête a permis de mettre en avant des points de vue personnels des acteurs créatifs de l’industrie musicale sur leur place dans l’industrie musicale. Il serait souhaitable de compléter les avis des compositeurs par d’autres acteurs non représentés dans cette étude (major label, éditeur, SACEM) pour enrichir l’analyse du milieu.

D’autre part, les intervenants ont tous une renommée et une carrière prestigieuse. Il aurait pu être intéressant de dialoguer avec des artistes dont l’évolution est plus stagnante et qui rencontrent moins de succès.

Perspectives

Ce travail a permis de mieux comprendre le fonctionnement de l’industrie musicale dans une grande partie de ses ramifications et d’observer les relations entre les acteurs créatifs et leurs partenaires. L’étape suivante consisterait à lever les limitations évoquées pour consolider les points de vue.

Cette étude peut apporter des outils pour bien se placer dans cette industrie. Les résultats obtenus dans l’enquête montrent qu’il est tout à fait possible de s’insérer dans l’industrie musicale, en prenant en compte le rôle des différents acteurs.

Certaines tendances identifiées concernant les outils technologiques modernes (maîtrise des DAW, le virage du streaming, marketing digital, etc.) montrent à quel point il est important de leur accorder une place privilégiée.

Enfin, l’avenir de cette industrie semble tout à fait prometteur. Au regard de l’enquête et de l’état de l’art effectué dans la première partie, l’industrie musicale est un marché porteur. Il y a une forte demande, des circuits d’accès en grand nombre. Il n’y a pas tout à façonner. C’est une industrie qui fonctionne avec une certaine complexité, sujette à des mutations régulières, et qui semble afficher une perspective d’évolution encourageante.

Bibliographie

BECQUET, S. (2018). Quelles solutions pour améliorer le partage de la valeur à l’avènement du streaming musical. Mémoire de fin d’études FSMS.

BOUVERY, P.-M. (2019). Les contrats de la musique. Irma.

BRAFMAN, N. (2007, avril 7). Emi et Apple verrouillent l’offre payante de la musique en ligne. Le monde.

CENTRE NATIONAL DE LA CHANSON ET DES VARIETES DU JAZZ. (avril 2014). Hors-Série. CNV Info.

CHABAUD, M. (2017). La musique à l’image, entretien du 8 décembre 2016. Irma. CHEMETOFF, A. (Réalisateur). (2019). Iris : a space opera by Justice [Film].

CISAC. (2015). Un monde très culturel I Premier panorama mondial de l’économie de la culture et de la création .

CODE DE LA PROPRIETE INTELLECTUELLE (loi n°92-597 juillet 1, 1992).

FANEN, S. (2012, Février 29). Itunes Store, Qobuz : la musique sort du saccage. Libération. FELIN. (2019, Juin 27). Streaming : les arguments du User Centric. Récupéré sur Fédaration

Nationale des Labels Indépendants: http://fede-felin.org/2019/06/27/streaming-les- arguments-du-user-centric/

FERRAN, B. (2013, mai 31). Le téléchargement de musique ralentit . Le Figaro. GOLDMAN SACHS. (2016). Music in the Air – Stairway to Heaven.

IFPI. (2019). Global Music Report.

IFPI. (2016). Investing in music, the value of record companies.

INGHAM, T. (2019, Juin 2). Can the major labels overcome these 5 threats in the years ahead?

Récupéré sur Music Business Worldwide: https://www.musicbusinessworldwide.com/can-the-major-labels-overcome-these-5- threats-in-the-years-ahead/

JONES, Q. (2003). Quincy. Paris: Robert Laffont.

JUILLIARD, N. (2002, janvier 19). Payer la musique sur internet, l’offensive est lancée. Le temps.

KRUEGER, A. (2005). Rockonomics : the economics of popular music.

LES ECHOS. (2018, Octobre 11). Business of Music (BOM) : les majors sont-elles has been ? LOUIS, J.-P. (2019, septembre 11). Deezer propose un nouveau partage du gateau du streaming. Récupéré sur Les echos: https://www.lesechos.fr/tech-medias/medias/deezer-propose-un-nouveau-partage-du-gateau-du-streaming-1130884 MENGER, P.-M. (2019). 58 MIN Comment achever une œuvre ? Travail et processus de création. Episode 8 : le temps créateur. Paris.

MULLIGAN, M. (2014). The death of the long tail. Midia Consulting. MUSIQUE INFO HEBDO. (18 janvier 2008).

NEXT BIG SOUND. (2012). The state of online music.

NICOLAS, A. (2011). Les marchés de la musique enregistrée. Cité de la musique. NIDAM, A. (2000, janvier 22). CD : la folie copie . Libération.

NIELSEN MUSIC. (2019). Mid-Year Report.

PASSMAN, D. S. (2015). All you need to know about the Music Business. Simon & Schuster. PETROVER, B. (2015). Ils ont tué mon disque. First .

PRS FOR MUSIC. (2017). Stream-ripping: How it works and its role in the UK music piracy landscape.

RECORD UNION. (2019). The 73 percent report.

SACEM . (2017). Rapport annuel et comptes 2017.

SNEP. (2014). Le partage des revenus de la musique enregistrée, vrais chiffres et contrevérités.

SNEP. (2015). Economie de la Production Musicale.

SNEP. (2019). Global Music Report, Etat des lieux de la musique enregistrée.

SPRE. (2018). Les chiffres clés. Récupéré sur SPRE: https://www.spre.fr/index.php?page_id=43

STASSEN, M. (2019, Septembre 11). Deezer plans 2020 User-Centric payment . Récupéré sur Music Business Worldwide: https://www.musicbusinessworldwide.com/deezer-plans- 2020-user-centric-payment-system-pilot-launch/

STUPEFLIP. (2017). Stupeflip. Nouvel Album. 3 Mars 2017. . Récupéré sur Ulule: https://fr.ulule.com/stupeflip/

SWANT, M. (2016, août 28). Even Spotify Is Surprised by the Huge Success of Its Discover Weekly Playlists. Récupéré sur Adweek: https://www.adweek.com/digital/even-spotify- surprised-huge-success-its-discover-weekly-playlists-173129/

TSIKURISHVILI, L. (Réalisateur). (2017). Avicii: True Stories [Film].

VERSIEUX, N. (2013, février 5). L’Allemagne déconne à plein Youtube . Libération. WALDFOGEL, L. A. (2018). Platforms, Promotion, and Product Discovery: Evidence from

Spotify Playlists .

WOITIER, C. (2014, novembre 13). Youtube dévoile son service musical payant Music Key.

Le figaro.

Voir I.4 ↩︎
L’AAC a été élaboré par l’institut allemand de recherche en sciences appliquées Fraunhofer en collaboration avec l’opérateur mobile AT&T, Sony et Dolby. (Fanen, 2012) ↩︎
A&R est une division au sein des labels visant à rechercher de nouveaux talents et développer les carrières d’artistes. ↩︎
International Federation of the phonographic Industry ↩︎
Syndicat National de l’Édition Phonographique ↩︎
Cf. B-4, p.48 ↩︎
De la place de l’artiste dans l’économie de l’industrie musicale ↩︎
L’éditeur contractuel de Thomas Roussel ↩︎
(Jones, 2003) ↩︎
Digital Audio Workstation (Protools, Logic Pro, Ableton Live…) ↩︎
EP : Extended Play, c’est un format musical plus long que celui du single mais plus court qu’un album. Il comporte en général 4 titres. ↩︎

mai 15, 2026