Entrer un son dans l'ordinateur

Mise en projet

Le son est un domaine moins connu que les images. En conséquence, nous examinerons d'abord en quoi consiste le son et quelles sont ses caractéristiques. Dans un second temps, nous aborderons sa transformation en une suite de nombres. Nous terminerons sur l'explication de ce qu'est la stéréophonie.

Qu'est-ce qu'un son analogique ?

Un son analogique est une onde propagée par un élément porteur (l'air, l'eau, le bois, un stéthoscope,... Il ne peut pas y avoir de propagation du son dans le vide). La succession des compressions et dépressions des particules fait vibrer notre tympan. La chaîne des osselets amplifie 14 fois la vibration et la transmets à notre cochlée qui, elle-même, génère un message nerveux à destination de l'aire auditive de notre cerveau.

Examinons deux éléments particuliers d'une onde : son amplitude et sa fréquence. Le graphe suivant n'a rien à voir avec le son mais il a l'avantage d'aborder un phénomène connu : la propagation de 2 courants électriques alternatifs dans un fil. L'onde bleue est un courant de 230 V à 50 Hz (50 cycles par seconde). L'onde rouge est un courant de 110 V à 60 Hz.


Deux courants alternatifs. Onde bleue : 220 V - 50 Hz et onde rouge : 110 V - 60 Hz, via Wikimedia Commons*.

Sur ce graphe, nous pouvons constater différentes choses :

  1. L'amplitude (la hauteur de l'onde sur le graphe) de l'onde bleue est 2,1 fois supérieure à celle de l'onde rouge, ce qui explique les voltages (forces électromotrices) dans quasiment le même rapport;
  2. La durée d'une onde bleue complète (appelée sa période) est de 20 millisecondes; par seconde, elle va donc osciller 50 fois, sa fréquence est de 50 Hz;
  3. La période de l'onde rouge est 16,67 ms; en une seconde, elle oscillera (1.000 ms / 16,67 ms) soit 60 fois.

Au niveau auditif, l'amplitude va déterminer le volume du son. La fréquence va déterminer sa hauteur (son grave ou aigu). Nous ne sommes pas tous égaux face au son, nous avons toutes et tous des différences quant à la gamme des sons que nous pouvons percevoir. Pour vous en rendre compte, rendez-vous sur l'application permettant de Tester son spectre sonore sur YouTube.
Cette application émet un son pur (sans harmoniques, voir ci-dessous) dont la fréquence augmente progressivement. Si vous stoppez le déroulement de la vidéo au moment où vous n'entendez plus rien, le nombre de secondes écoulées vous permettra de savoir jusqu'à quelle fréquence vous pouvez entendre (voir les valeurs sur le tableau affiché).

Tous les musiciens ont une note pure qui est leur référence de base : le la. Cette note a une fréquence reconnue internationalement de 440 Hz. Mais comment se fait-il que nous percevions cette note différemment si elle provient d'un piano, d'un violon ou d'un saxophone ? C'est dû aux harmoniques, ondes qui ont des fréquences qui sont des multiples de l'onde de base (pour le la : 880 Hz, 1.320 Hz,...) et dont les amplitudes respectives dépendent de l'instrument. Ce sont ces harmoniques qui donnent la "couleur" du son.

Intéressons-nous maintenant à la manière dont l'ordinateur va transformer un son en nombres.

Le principe

Prenons l'extrait d'un solo de batterie, celui de la caisse claire transitoire de "Cliffs of Dover" d'Eric Johnson. Le son est capté par un micro qui transforme les ondes sonores en un courant électrique dont l'amplitude et la fréquence sont analogues aux vibrations de l'air. Cela fournit le schéma suivant sur un analyseur de fréquences analogiques (les deux ondes superposées correspondent aux deux canaux d'une captation stéréo, nous en dirons un mot en fin de chapitre).


Image d'une caisse claire transitoire de "Cliffs of Dover" d'Eric Johnson, via Wikimedia Commons*.

Comme pour le scannage d'une image, l'échantillonneur de son va appliquer une trame à cette onde. Cette trame doit être choisie en fonction du son à échantillonner et de la qualité finale désirée.


La trame de droite a une densité deux fois plus élevée que celle de gauche (une résolution deux fois plus grande).
Les lignes mauves représentent les valeurs binaires qui seront mesurées et stockées.

On peut constater sur le schéma ci-dessus qu'avec une résolution double, la courbe numérique résultante (en vert) "colle" beaucoup mieux à l'onde de base (en noir) que dans la résolution simple, surtout aux niveaux des pics et des creux.

Comme pour les images, plus la résolution est importante, plus la numérisation donnera un fichier fidèle au son de départ, mais plus ce fichier sera imposant.

La voix humaine n'utilise pas des fréquences très aiguës, il est possible de garder une bonne qualité avec une résolution de 11.025 Hz (mesures par seconde). L'enregistrement d'une œuvre musicale, avec ses différents instruments et ses harmoniques à hautes fréquences, nécessitera une résolution 4 fois plus élevée à 44.100 Hz si l'on veut conserver un maximum de détails sonores.

L'outil

Pour une fois, il n'y a pas grand-chose à dire à propos de l'outil. Il s'agit d'un composant électronique recevant en entrée le courant analogique en provenance d'un micro, d'un instrument de musique ou d'un enregistrement et donnant en sortie un fichier de nombres binaires contenant la séquence des mesures effectuées (mesures des hauteurs mauves dans les deux graphes ci-dessus).

La stéréophonie

Lorsque, dans une salle de concert, nous écoutons un orchestre en fermant les yeux, comment ce fait-il que nous ayons la perception de l'endroit où se trouve chaque instrument ?


Comment s'effectue le perception stéréophonique d'un orchestre ?

En fonction de la position de notre tête et de nos deux oreilles (symbolisées ici par les points d'interrogation), nous voyons que, plus le son vient de côté, plus le décalage est grand entre le moment où il arrive à une oreille et le moment où il arrive à l'autre. Avec l'expérience (le bébé qui jette sa cuillère par terre en regardant où elle tombe), notre cerveau a pris l'habitude d'analyser ces décalages pour interpréter d'où vient le son.

L'enregistrement du même concert en stéréo se fera à l'aide de deux microphones espacés de la même distance que nos oreilles. Lorsque nous réécouterons cet enregistrement, le baffle de gauche diffusera le son capté par le micro de gauche et le baffle de droite le son capté par le micro de droite. Nous aurons alors l'impression d'être plongé dans cette salle de concert où chaque instrument aura repris sa place.

Continuons maintenant notre passage en revue de tous les éléments entourant l'ordinateur.

Retour