Par Pascal Le Saec
Dernière mise à jour : novembre 2018

1. Définition

Un son est une sensation auditive, perçue différemment selon les individus (notion subjective), engendrée par une onde acoustique. Objectivement, cette onde est générée par une vibration (cordes vibrantes, cordes vocales, membrane d’un haut-parleur...).

Caractéristiques d’un son
Le son peut être caractérisé par trois paramètres :

  • La fréquence (ou sa hauteur)
  • L’intensité (ou le niveau sonore)
  • Le timbre (la « richesse » du son)

La fréquence est le nombre d’oscillations périodiques par seconde. Elle s’exprime en Hertz (Hz). On parlera également de hauteur d’un son. Une fréquence de 100 Hz correspondra donc à 100 oscillations par seconde.

Plus un son sera aigu et plus sa fréquence sera haute. A l’inverse, plus un son sera grave, plus sa fréquence sera basse.

Les fréquences audibles par l’être humain s’étendent de 20 à 20 000 Hz. Ces chiffres peuvent varier suivant l’âge et les personnes. Notons également que nos oreilles sont plus sensibles aux fréquences médium et aigues, correspondant aux fréquences de la voix. En dessous de 20 Hz, il s’agit d’infrasons et d’ultrasons au-dessus de 20 KHz. Ceux-ci ne donnent pas lieu à une sensation sonore.

Les humains reconnaissent les instruments de musique à leur timbre. La définition du timbre d’après le Petit Robert est la suivante : « qualité spécifique des sons produits par un instrument, indépendante de leur hauteur, de leur intensité et de leur durée ».

Cette qualité spécifique est plus précisément due à plusieurs éléments parmi lesquels :

  • le principe d’émission (corde frottée ou pincée, sifflet, anche simple ou double, embouchure, etc.),
  • la nature du corps vibratoire (peau, métal, bois…),
  • la forme et le volume de l’instrumentiste,
  • les compétences de l’instrumentiste.

Tous ces éléments impliquent un nombre et une répartition spécifiques des composantes fréquentielles dans le signal sonore. On verra au paragraphe « Bruit ou son ? » que la richesse en harmonique d’un instrument détermine le timbre d’un instrument.

2. Propagation du son

2.1. Quelques définitions

Un signal sinusoïdal est un signal (onde) périodique dont l’amplitude est une fonction sinusoïdale du temps. Il est caractérisé par son amplitude maximale et sa fréquence et peut se mettre sous la forme :

s(t) = A sin (ωt + φ)

avec A son amplitude maximale ou valeur de crête,

φ la phase à l’origine en radian,

ω = 2π f la pulsation en radian/s (vitesse angulaire),

(ωt + φ) est la phase instantanée en radian.

Lorsque l’on compare deux signaux de même fréquence, il est nécessaire d’indiquer de combien de temps ils sont décalés. Les signaux sont « en phase » s’ils sont superposés, sinon il y a un déphasage.

Formation d’un signal sinusoïdal à l’aide du cercle trigonométrique. Attention, φ est dans ce dessin la phase instantanée.

Lorsqu’on écoute un signal sinusoïdal, on entend un son avec une seule fréquence, son spectre est représenté par une seule raie dans le spectrogramme (voir paragraphe « les modes de représentation des sons »).

Un signal périodique est un signal qui se reproduit identique à lui-même à intervalles de temps égaux. Un signal périodique de fréquence F0 est la somme d’une infinité de signaux sinusoïdaux de fréquences n x F0 (les harmoniques).

La période T d’un signal périodique est la plus petite durée au bout de laquelle le signal se reproduit identique à lui-même. Elle s’exprime en secondes (s).

La longueur d’onde est la distance parcourue par un signal pendant une période.

La célérité (ou vitesse du son) dépend principalement de la nature (densité, compressibilité) du milieu de propagation. La célérité est d’autant plus grande que la masse volumique du milieu et sa compressibilité sont faibles. Pour un milieu gazeux, la masse volumique et la compressibilité dépendent de la température. Soit, pour l’air, 330 m/s à 0°C, 340 m/s à 16°C ; l’eau 1435 m/s ; le verre 540 m/s, etc.

Pour un signal périodique de période T et de longueur d’onde λ, la célérité est égale à C=λT. La fréquence du signal périodique est F = 1/T.

2.2. L’intensité acoustique

Une source sonore diffuse de l’énergie acoustique. En général, l’énergie désigne tout ce qui permet d’effectuer un travail, fabriquer de la chaleur, de la lumière ou un mouvement. L’énergie se mesure en Joules (J). L’énergie acoustique correspond aux mouvements des molécules d’air propageant l’onde acoustique. Si une source acoustique émet un son d’énergie égale à E Joules pendant un intervalle de temps δt secondes, alors on définit la puissance acoustique P de la source comme :

La puissance acoustique se mesure en Watts (W).

La puissance acoustique est une donnée propre à une source : elle ne dépend pas de la distance à la source. Lorsque plusieurs sources émettent simultanément un signal sonore, ce sont leurs énergies et donc leurs puissances qui s’additionnent.

Quand on appuie sa main contre un mur, on exerce une « pression » sur ce mur. En fait, la pression résulte d’une force F appliquée sur une surface S. La valeur de la pression est alors définie comme :

p = F/S

La pression se mesure en Pascal (Pa).

Lors de la propagation d’une onde acoustique, les molécules d’air en mouvement modifient légèrement la pression localement. Cette variation de pression est ce que l’on appelle la pression acoustique p.

Cette pression acoustique exerce une force sur le tympan. Elle met en vibration le tympan qui transmet les ondes au cerveau via les mécanismes de l’oreille moyenne et de l’oreille interne.

L’intensité acoustique, ou intensité sonore, correspond à une quantité d’énergie acoustique E (en Joules) qui traverse une surface (réelle ou virtuelle) S (en m2) pendant un temps δt (en secondes). Elle se définit comme :

I = E/Sδt

L’intensité acoustique se mesure en W/m2.

Une source isotrope, ou homogène, est une source qui rayonne dans tout l’espace. Cette source émet des ondes sphériques, donc les fronts d’onde sont des sphères. La surface d’une sphère vaut S = 4πr2 avec r le rayon de la sphère. L’intensité reçue sur un front d’onde vaudra donc :

Ainsi, une source isotrope de puissance P émettra des sons dont l’intensité sonore variera en fonction de la distance à la source.

Par ailleurs, l’intensité et la pression acoustique sont reliées par la relation suivante :

I = P/ρ0c' avec c la célérité du son et ρ0 la masse volumique du milieu.

Remarque : cette relation n’est valable que pour le son direct provenant d’une source acoustique et non pour le son réfléchi ou réverbéré dans une salle.

Dans l’air, ρ0  1,2 kg/m3 et c = 340m/s, d’où :

I =     p²/400  en W/m2 avec p en Pa.

Ainsi, le seuil d’audition correspond à une intensité sonore de : Iref = 10-12W/m²

Elle est appelée intensité de référence et correspond à la pression de référence :

Et le seuil de douleur correspond à une intensité sonore de : Idouleur = 1 W/m2 (correspondant à la pression Pdouleur = 20 Pa).

3. Perception

3.1. Bruit ou son ?

On rencontre rarement  un « son pur », de seule fréquence F mais, le plus souvent, une composition d’un grand nombre d’oscillations ayant des fréquences diverses. L’analyse des fréquences d’une onde sonore (ou d’un signal) est donnée par le spectre du signal calculé à l’aide d’un outil mathématique, la transformée de Fourier.

Si ces fréquences sont une fréquence dite fondamentale et ses multiples 2f, 3f, 4f,…, nf, dites harmoniques, la sensation auditive est un son agréable, musical. Les sons dont les fréquences ne sont pas des multiples de la fréquence fondamentale sont appelés « partiels » ; par exemple : un son de cloche. Ils peuvent contribuer au « timbre » du son mais sont parfois désagréables sans être qualifiés de bruit.

Un bruit est une vibration acoustique erratique, intermittente ou statistiquement aléatoire non désirée. La sensation auditive d’un bruit est souvent désagréable ou gênante. Il s’agit souvent de sons complexes qui se caractérisent par la difficulté de leur attribuer une hauteur (fréquence).

3.2. La loi de Fechner

La loi de Fechner : « la sensation varie comme le logarithme de l’excitation » signifie qu’entre 10 violons jouant simultanément et 1 violon, nous « gagnons » exactement autant, en sensation d’intensité, qu’entre 100 et 10 violons ou entre 1000 et 100 violons…

Chaque rapport étant égal à 10 = 10/1 = 100/10 = 1000/100 et log 10 = 1, la sensation d’intensité augmente de 1.

En acoustique, nous appellerons cette unité le bel, qui correspond au « gain » de sensation quand le rapport entre le nombre de sources est égal à 10.

3.3. Le décibel

Le bel exprime un rapport de puissances. Les microphones que nous utilisons généralement étant des capteurs de pressions, il est intéressant de définir le décibel par rapport aux pressions. On sait que la puissance acoustique est proportionnelle au carré de la pression, il en découle :

p0 est la pression de référence, la pression minimale nécessaire pour que l’oreille entende quelque chose (seuil d’audition) à 1000 Hz. Cette pression est statistiquement voisine de 210-5 pascals.

Le décibel exprime une intensité acoustique relative basée sur la perception, différente de l’intensité acoustique physique vue au chapitre précédent. Le phone est un décibel à 1000 Hz (son sinusoïdal).

Applications :

  • Calcul : si l’on double la puissance (la cause du bruit), l’intensité augmente de 3  dB (le bruit). Ex. : 60 dB + 60 dB = 63 dB.            
  • Lorsqu’on additionne deux sources de niveaux différents, si cette différence est importante (au moins 10 dB) il s’opère un effet « de masque ». Ex : 60 dB + 70 dB = 70 dB la guitare classique est masquée par la guitare électrique, le bruit d’une voiture est masqué par le bruit d’un camion.
  • Statistiquement, l’individu a la sensation que le bruit est doublé lorsque l’énergie acoustique est multipliée par 10. L’intensité augmente alors de 10 dB.               

3.4. Le diagramme de Fletcher

Le diagramme de Fletcher, établi à l’aide de mesures effectuées sur un large panel d’individus, illustre le fait que la sensibilité de l’oreille n’est pas identique à toutes les fréquences. Ces courbes, aussi appelées « isotoniques », représentent la sensibilité moyenne de l’oreille pour une plage de fréquences audibles.

Ces courbes sont paramétrées en phones. Par définition, le numéro de chaque courbe (ou niveau en phones) est égal à l’intensité correspondant en décibels une fréquence de 1000 Hz.

On vérifie que, pour chaque fréquence, il existe un niveau minimum ou l’on commence à entendre quelque chose. C’est le seuil de perception (ou d’audition). Si on augmente graduellement le niveau du son, il vient un moment où il devient insupportable, où il fait mal : on atteint le seuil de douleur. Relevons les seuils aux diverses fréquences. Pour cela, adoptons comme niveau zéro sur l’ordonnée, le seuil d’apparition du son à 1000 Hz. Pour 100 Hz, le seuil de perception sera de 40 dB au-dessus de zéro. Cela signifie qu’à cette fréquence, il faut 40 dB de plus pour commencer à entendre quelque chose comparativement avec un son de 1000 Hz. D’autre part, avec le même son, on attendra le seuil de douleur vers 125 dB. On relève de même les seuils aux autres fréquences. Finalement, seuil de perception et seuil de douleur délimitent ce qu’on appelle l’aire audible.

Le diagramme de Fletcher met en évidence une zone sensible de l’oreille, entre 500 et 5000 Hz, en deçà et au-delà de laquelle l’oreille perd graduellement sa sensibilité. Lorsqu’un son comporte, comme c’est couramment le cas, 30 ou 40 composantes, harmoniques ou non, le diagramme de Fletcher atteint ses limites dans la réalité perceptive de l’audition humaine.

En technique de bruit, son insuffisance est démontrée par les innombrables tentatives de correction des unités d’intensité, comme les unités dBA, dBB, dBC…

Loudness : le correcteur loudness présent sur les matériels d’amplification permet à bas niveau d’amplifier les fréquences graves et aiguës afin d’obtenir la sensation d’un son équilibré en niveau sur toute la bande de fréquences audibles.

dB(A), dB(B), dB(C) : afin de faire correspondre aux mieux les mesures, des courbes de pondérations ont été créées. Ces pondérations vont permettre de tenir compte approximativement de la variation de la sensibilité  de l’oreille en fonction de la fréquence et de l’intensité.

  • Pondération A dB(A) : pour des niveaux de 25 à 55 dB
  • Pondération B dB(B) : pour des niveaux de 55 à 85 dB
  • Pondération C dB(C) : pour des niveaux supérieurs à 85 dB

4. Applications

4.1. Réponse en fréquence

La courbe de réponse en fréquence (ou bande passante) d’un matériel audio correspond à la représentation graphique des diverses fréquences en fonction de leur niveau.

Cette courbe indique donc la plage de fréquences que l’enceinte, le micro, l’enregistreur… est capable de restituer ou de reproduire.

L’idéal théorique en analyse logarithmique se traduit par une courbe horizontale linéaire, permettant une reproduction ou une restitution de toutes les fréquences avec la même intensité. En pratique, il n’en est pas de même.

Le graphique qui suit montre la courbe de réponse en fréquence d’un casque audio.

La courbe de réponse en fréquence est généralement donnée dans un gabarit de +/- 3 dB par rapport à un niveau de référence (généralement 0 dB à 1000 Hz). On peut alors observer sur le graphique de la courbe de réponse en fréquence les différences de niveaux pour chaque fréquence.

Il arrive également souvent que seule la réponse en fréquence (ou bande passante) soit donnée dans les fiches techniques. Il n’y aura alors pas de graphique pour l’illustrer.

On donnera par exemple comme indication : 60 à 18000 Hz à +/- 3 dB.

4.2. Octave et tiers d’octave

Lorsqu’il est nécessaire d’obtenir des informations plus détaillées sur un son complexe, la gamme de fréquence de 20 Hz à 20kHz peut être divisée en sections ou bandes. Ceci est fait électroniquement par le sonomètre.

Ces bandes ont généralement une largeur d’une octave ou d’un tiers d’octave. Des instruments plus élaborés sont capables de donner une analyse des données sonores en bandes plus étroites.

Une bande d’octave est une bande de fréquence où la fréquence la plus élevée correspond à deux fois la fréquence la plus basse.

Par exemple, un filtre par octave avec une fréquence centrale de 1kHz a une basse fréquence de 707 Hz et une haute fréquence de 1,414 kHz. Les fréquences au-dessous et au-dessus de ces limites sont rejetées. Un tiers d’octave a une largeur correspondant à 1/3 de la largeur d’une bande d’octave.

Ces bandes d’analyses sont normalisées. Elles sont centrées sur les fréquences : 16, 31, 5, 63, 125, 250, …, 16000 Hz pour les analyses par bandes d’octave et sur les fréquences : 12,5, 16, 20, 25, 31,5, 40, 50, 63, 80…, 12500, 16000, 20000 Hz pour les analyses par bande de 1/3 d’octave.

Voici un exemple où l’analyse fréquentielle est très utile : un ensemble turbine + compresseur a un niveau de bruit égal à 113 dB(A). En utilisant des filtres par bandes d’octave 1 : 1, nous pouvons détailler le bruit de chaque machine dans ses différentes composantes et il est très clair que la turbine produit beaucoup plus de bruit en basse fréquence que le compresseur.

Ceci a une implication directe sur le choix d’une protection auditive adéquate. Une protection auditive différente sera nécessaire pour chaque machine car la protection choisie pour le compresseur ne conviendra pas pour la turbine.

5. Notions d’acoustique des salles

5.1. Introduction

La musique est généralement jouée dans une salle. La salle est un prolongement de l’instrument et ses variables propres interviennent au même titre que celles de l’instrument. Ces variables sont : la réflexion des ondes, l’absorption par les parois, la diffusion par l’état des surfaces, la focalisation par les surfaces courbes, la diffraction à travers des trous (comme si une nouvelle source se trouve en ce point, les rayons acoustiques se propagent sphériquement à partir du trou) et la réfraction lorsque le son traverse un mur, passe d’un milieu à l’autre, de nature différente, sa direction est modifiée. Le rayonnement des instruments sera donc modifié par ces variables.

L’acoustique des salles de spectacles vise à offrir la meilleure qualité possible d’écoute dans les différents lieux dédiés au spectacle. La qualité d’une salle est une notion subjective mais statistiquement et écologiquement fondée à travers les études réalisées ces dernières années dans les salles en situation réelle. Il s’agit ici de s’intéresser à l’acoustique interne des salles sans faire intervenir les problématiques d’isolation acoustique et vibratoire liées à leur environnement extérieur.

5.2. Théorie de Sabine

Sabine jeta les bases théoriques de l’acoustique des salles modernes. Avec lui apparait la notion de durée ou temps de réverbération. Il considère que le son réverbéré est statistiquement homogène (uniformément réparti) dans la salle (en pratique, pas vrai près des parois absorbantes par exemple).

On appelle temps de réverbération TR le temps mis par le son réverbéré pour décroitre de 60 dB après extinction de la source. Des exemples typiques sont donnés ci-dessous, du plus réverbérant au plus sourd :

Cathédrale : 2 – 10 s

Salle de concert : 1,2 – 2,5 s

Salle de conférence / salle de cours : 0,8 – 1,1 s

Studio d’enregistrement / chambre à coucher : 0,3 – 0,6 s

Il établit une formule permettant de calculer cette durée :

Avec V le volume de la salle (en m3) et A son absorption (en m2). 0,16 est un coefficient de dimension m-1 s.

A = αS où S est la surface de la salle et α le coefficient d’absorption moyen et si on peut décomposer les surfaces, A = i αiSi où αi est le coefficient d’absorption de la surface Si.

Cette formule est d’autant moins valide que l’absorption est grande. En effet, le champ réverbéré n’est uniformément réparti dans la salle que si elle est suffisamment réfléchissante. En pratique, cette formule est utilisée pour un coefficient d’absorption moyen inférieur à 0,2. En fait, elle dépend de la fréquence car l’absorption des matériaux varie avec la fréquence.

Voici les coefficients d’absorption typiques à 1000 Hz de divers matériaux :

  • Plaque de plâtre 0,04
  • Parquet stratifié 0,1
  • Moquette fine 0,3
  • Moquette épaisse 0,4
  • Plafond suspendu 0,85
  • Panneau de bois 0,4

5.3. Applications

L’acoustique d’une salle de spectacle peut être prévue aujourd’hui avant sa construction grâce à des logiciels de simulation intégrant les méthodes de calculs issues des recherches développées en laboratoire. Typiquement, un bureau d’étude en architecture réalisera un plan en 3 dimensions de la salle à l’aide d’outils comme SketchUp ou AutoCAD puis l’importera dans un logiciel de simulation acoustique tel que CATT-Acoustic.

Dans CATT-Acoustic, des rayons sont lancés dans toutes les directions à partir d’une source virtuelle et le logiciel prédit l’ensemble des critères acoustiques utilisés en acoustique des salles : le temps de réverbération (RT60) ; la clarté à 50 ou 80 ms (C50, C80) désigne les propriétés acoustiques d’une salle où les détails de l’image sonore sont aisément perceptibles ; le temps de décroissance précoce EDT (Early Decay Time) est le temps de décroissance sur les 10 premiers dB, subjectivement plus important car se rapproche de l’impression de réverbération alors que le RT60 fait référence aux propriétés de l’auditorium ; les critères d’intelligibilité normalisés STI et RASTI ; la définition D50 exprime le degré de séparation acoustique d’un son par rapport à un autre ; l’intensité acoustique, disponible par bandes d’octave ou exprimé en dB(A)…

De plus, au sein de CATT-Acoustic, le temps de réverbération obtenu peut être comparé à celui calculé par la formule de Sabine, avec des courbes assez distinctes si les parois de la salle sont très absorbantes.

Dans une salle existante, une méthode consiste non plus à calculer la réverbération mais à la mesurer, plutôt à l’enregistrer. On tire un coup de pistolet, dont le signal acoustique contient, en principe, toutes les fréquences. On relève la décroissance du son à l’enregistreur de niveau, qui fournit directement la courbe désirée.

Une autre méthode pour tester une salle consiste à y diffuser un bruit blanc. Un bruit blanc est un signal aléatoire qui contient, par définition, toutes les fréquences. On mesure alors, dans chaque bande de fréquence, ce qui est perdu du fait de l’absorption.

6. Les modes de représentation des sons

Les 3 figures, ci-dessous, correspondent à la représentation d’un même signal, une attaque de saxophone pendant 1 seconde. Dans l’ordre :

  • La représentation temporelle montre l’évolution de l’intensité du son dans le temps.
  • La représentation fréquentielle (ou spectrale) ou spectrogramme permet de visualiser la composition fréquentielle d’un son mais également l’intensité ou la magnitude de chaque fréquence (fréquence en abscisse, magnitude en ordonnée calculée en dB sur la figure).
  • La représentation tridimensionnelle, sous la forme d’un sonagramme, est très utilisée pour étudier les sons. L’exemple, ci-dessous, montre bien l’évolution de la fréquence et de l’intensité dans le temps (temps en abscisse, fréquence en ordonnée). L’intensité est définie par la couleur : plus la couleur évolue vers le rouge, plus l’intensité est importante.

Tags :
    
© 2023 CNFPT