Musique numérique : fréquence d’échantillonnage et quantification

Comme nous l’avons vu dans notre article sur les différences entre le son analogique et le son numérique, la numérisation d’un son consiste à prélever des échantillons du signal analogique, auxquels on y associe une valeur d’amplitude. La première est déterminée par la fréquence d’échantillonnage (exprimée en kHz), la seconde s’appelle la quantification -ou résolution - (exprimée en bits).


Mais pourquoi parle-t-on de 16 bit / 44,1 kHz lorsque l’on évoque la qualité CD ou encore que signifie l’appellation hi-res audio dont on entend maintenant parler ?

A l’origine, le théorème de Nyquist-Shannon

En réalité, les valeurs des taux d’échantillonnage n’ont absolument rien d’arbitraire : elles se basent toutes sur le théorème de Nyquist - Shannon.

Selon les deux théoriciens, la fréquence d’échantillonnage doit effectivement être égale ou supérieure au double de la plus haute fréquence à numériser.

Notre oreille percevant un spectre allant de 20 Hz (graves) jusqu’à 20 000 Hz (aigus), la fréquence d’échantillonnage doit donc être au moins égale à 40 000 Hz pour qu’il n’y ait pas de déperdition de qualité.

Spectre de l'oreille humaine - source de l'image techniquesduson.com

Source de l'image - deveniringeson.com

Quantifications et échantillonnages les plus fréquents

Les quantifications les plus utilisées sont de 16 bits, 24 bits, ou 32 bits.


Les fréquences d’échantillonnages les plus connues sont quant à elles de 44,1 kHz, 48 kHz, 96 kHz voire 192 kHz. Cette dernière constitue le summum des enregistrements audio haute résolution, le but étant de se rapprocher le plus possible du son en studio d’enregistrement.

Aujourd’hui et avec le matériel adéquat, tout le monde peut désormais en profiter à la maison.

Exemple du CD : 16 bits / 44,1 kHz


L’échantillonnage sans doute le plus connu est celui du CD, 16 bits à 44,1 kHz, ce qui correspondait à la meilleure qualité disponible au lancement du CD dans les années 80.

Concrètement, ces valeurs signifient que pour numériser le son analogique en qualité CD, on prélève 44 100 échantillons par seconde, auxquels on associe une valeur d’amplitude de 16 bits. Cette dernière va influer sur la plage dynamique exprimée en dB.

La règle est que pour 1 bit, on a 6 dB de dynamique : l’amplitude oscille donc sur 6 dB en 1 bit.

Concernant les 16 bits de la qualité CD, le son oscillera donc sur 96 dB (16 bits x 6 dB).


Qu’appelle-t-on musique haute définition ou haute résolution ?

L’audio haute résolution (HRA) correspond à n’importe quel format d’enregistrement supérieur à la qualité CD. Généralement, la HRA utilise un échantillonnage de 24 bits / 48 kHz, permettant notamment une plage dynamique bien plus importante qu’un CD, de l’ordre de 144 dB (24 bits x 6 dB).


Si on devait faire une comparaison, imaginez que le CD équivaut au DVD et que la haute-résolution correspond au Bluray voire à la 4K.

En revanche, ne vous y trompez pas ! Qu’on la nomme haute résolution, HRA, HD, hi-res : il s’agit bien de la même chose, tous se réfèrent à des fichiers de qualité 24 bits / 48 kHz minimum.

Si vous souhaitez plus d'informations sur les différents formats de fichier audio supportant la qualité haute résolution, n'hésitez pas à consulter cette page.

La norme Hi-Res Audio

La Japan Audio Society (JAS) associée à d’autres acteurs de l’industrie musicale ont établi la norme Hi-Res Audio, que l’on retrouve aujourd’hui estampillée sur de plus en plus d’appareils.


Parmi ses critères d’attribution, notons que les fichiers audio numériques doivent impérativement être égaux ou supérieurs à 24 bits / 96 kHz.

Et en pratique, à l’écoute ?

Plus l’échantillonnage (kHz) est élevé, plus l’analyse du signal est fine et plus la reproduction sera fidèle.

Plus la quantification (bits) est élevée, plus les morceaux seront entendus dans toute leur profondeur. Les sons les plus faibles seront bien plus audibles, les fins de notes plus présentes.

Le gain - ou la perte !- à l’écoute est donc évident selon l’échantillonnage choisi, en terme de richesse et de spatialisation.

Mais ... si notre oreille est limitée dans le spectre, quel est l'intérêt des fichiers audio HD ?

Elémentaire mon cher Watson ! Il est tout-à-fait légitime de se demander quel est l'intérêt d'écouter des fichiers de 96 kHz voire 192 kHz, si notre oreille ne pourra de toute manière jamais percevoir les fréquences au-delà de 20 000 Hz. Pourquoi ne pas se cantonner sur l'échantillonnage de 44,1 kHz du CD ?

Plusieurs réponses peuvent être apportées.

La première raison est que les studios ont véritablement besoin de travailler dans des niveaux d'échantillonage et de quantification élevées. Le mastering, c'est à dire tout le travail réalisé au studio, est ainsi beaucoup plus fin et précis. 

La seconde est d'ordre acoustique : le dégradé harmonique des instruments est bien davantage respecté. Le son d'un instrument possède en effet une multitude de fréquences appelées harmoniques, qui se superposent à la fréquence fondamentale : le son d’un instrument n’est pas un signal purement sinusoïdal

Une plus grande fréquence d'échantillonnage retranscrira donc bien mieux les variations de tonalité et la richesse harmonique du son.

Vous n'êtes toujours pas convaincu ? N'hésitez pas à venir nous voir, rien ne remplace une écoute !

Nous pourrons par exemple écouter et comparer deux versions du titre Midnight Blue de Kenny Burrel sur Qobuz. L'un en qualité CD et l'autre en qualité hi-res. Nous sommes convaincus que vous entendrez la différence !