21 décembre 2008
ÉCOUTER LA MUSIQUE AVEC UN SON IMPEC À L’AIDE DE STEREO TOOL
ÉCOUTER LA MUSIQUE AVEC UN SON IMPEC À L’AIDE DE STEREO
TOOL
Depuis la
publication de mon topic précédent, Stereo Tool a beaucoup évolué.
Depuis peu (décembre 2008), il est en version 3.40 et bénéficie d’une refonte
complète de ses filtres correcteurs et d’une consommation CPU
revue nettement à la baisse. Cet article est la suite dudit topic
e s’occupe à expliquer comment produire une ambiance sonore bien équilibrée en
aigues et en basses avec la dernière version d’un des plug-ins les plus géniaux
de Winamp.
Une fois Stereo Tool nouvelle version
installé, procédez comme suit :
1.
Dans la zone Preset, choisir Constant volume, increased
stereo. Il s’agit d’un preset qui
normalise parfaitement le son tout en augmentant l’effet stéréo
2. Choisir un affichage épuré de Stereo Tool en cliquant sur Basic
mode. En effet, cet affichage permet d’avoir une vue plus globale des
fonctions et un paramétrage plus aisé en ce qui nous concerne
3. Dans la zone Multiband Compressor,
cochez HQ,
ce qui permettra aux filtres de Stereo Tool de traiter plus finement les signaux audio, surtout
les basses qui ne risquent pas ainsi de saturer au-delà de l’original
4. Dans la zone CPU Usage, cochez Normal quality et décochez Low latency (low quality).
Notez qu’il n’y a pas de différences sensibles de résultat final entre High quality et Normal quality
5. De nouveau dans la zone Multiband Compressor, régler les
deux premiers potentiomètres à 2.54,
les trois derniers à 10.00 et les restants à 5.08. À
la manière d’un égaliseur, avec un tel réglage, les basses sont légèrement affaiblies,
les médiums presque comme à l’original et les aigues augmentées. Toutefois, à
la différence d’un égaliseur, les divers traitements effectués par Stereo Tool atténueront quelque
peu cet effet d’égalisation en vertu des paramètres de compression dynamique
(attaques et délais correspondant aux deux groupes de potentiomètres placés en
dessous)
6. Dans la zone Loudness,
régler à 1.50. Le loudness a comme rôle de gonfler artificiellement le son
tout en lui donnant plus de tonus et parfois plus de clarté. Une valeur
supérieure peut réduire la qualité (surtout dans les aigues).
7. Dans la zone Final pre-limiter,
cochez ON
et PRE.
Ces deux options ont pour vocation de limiter le volume final de sortie pour
une normalisation excellente
8. Toujours dans la zone Multiband Compressor, dans la sous-zone clipping (en dessous), régler
les deux premiers potentiomètres à 3.00, le troisième à 2.50, les quatre suivants à 1.98 et les trois derniers
à 18.99. Cette fonction permet de
« tondre » le signal qui dépasserait une certaine limite imposée par
les valeurs susmentionnées. Notez que les trois derniers potentiomètres gèrent
les sons aigus et le fait de les porter à une aussi grande valeur permet de les
conserver le mieux possible
9. Cliquez sur Save pour
sauvegarder vos réglages une fois pour toutes. Une boîte de dialogue vous permettra
de choisir le nom et le lieu de destination desdits réglages. Cliquez sur Enregistrer pour fermer cette boîte de
dialogue
10. Si vous désirez rendre le son
monophonique pour une raison ou pour une autre, allez dans la zone Stereo Image/Flat Stereo.
Placez les paramètres phase et width à 0.00.
Très bonnes conditions d’écoute !
QUID DES DÉBITS TROP HAUTS OU TROP BAS EN WMA 9.2 VBR 50 ?
QUID DES
DÉBITS TROP HAUTS OU TROP BAS EN WMA 9.2 VBR 50 ?
Le mode VBR, je ne le répéterai jamais assez, est le mode idéal d’encodage des sons, car il maintient une qualité constante au sein
d’un même fichier (tout en créant pour ce faire une fluctuation permanente
de débit). Et le paramètre dit de qualité moyenne (VBR 50) s’avère, à mon sens, le
meilleur compromis qualité – taille de fichier. C’est ainsi que je me focaliserai
sur ce paramètre, ce qui n’empêche guère que ce qui sera dit plus loin
s’applique aux autres paliers de qualité (10, 25, 75, 90 et 98).
Comme signalé dans plusieurs de mes articles, du moins
en WMA 9.2, la plupart des chansons enregistrées en VBR 50 ont un bitrate moyen oscillant entre 40 et 112 kbps. Parmi
lesdites chansons, la grande majorité
bénéficie d’un débit compris entre 64 et 85 kbps. Mais d’autres ont une
vitesse de transmission soit en-deçà de
64 kbps (débits trop bas), soit au-delà
de 85 kbps (débits trop hauts). Dans ce topic,
j’expliquerai pourquoi ce comportement extrême.
- Pourquoi certaines chansons sont encodées en WMA 9.2 VBR 50 en-deçà de 64
kbps ?
1. La pauvreté de l’effet stéréo : une chanson dont les variations sonores d’un
baffle à un autre ne sont pas prononcées comporte de multiples redondances dans les canaux audio. Tout algorithme de
compression audio encodant en VBR sait exploiter ladite redondance et la coder
avec moins de bits. Une illustration typique est la chanson « Hey there Delilah » de Plain White T’s que j’ai copiée à
partir du réseau audio DMX (bouquet DSTV) qui est réputé diffuser en
bonne qualité (fréquence de coupure aux alentours de 18 kHz). Le fichier
converti en WMA 9.2 VBR 50 de
ce chef-d’œuvre a un bitrate moyen de seulement 43
kbps et le son est d’une qualité superbe, sans artefacts du genre son métallique
2. La pauvreté en fréquences aigues associée à la pauvreté
de l’effet stéréo : en mode VBR 50, WMA atténue (voire élimine) les fréquences supérieures
à environ 13,2 kHz. L’atténuation
des fréquences supérieures sera d’autant plus forte que leur intensité sera
faible. Ainsi, un son aigu de 15 kHz peu être mieux conservé, si son
intensité est très forte, qu’un son aigu de 14 kHz d’intensité moindre. Or
l’encodage des aigues sollicite beaucoup de bits. Moins il y a des fréquences aigues, plus le bitrate
baisse. Toutefois, pour que WMA 9.2 VBR 50 diminue le bitrate global
d’une chanson, il ne suffit pas qu’elle soit pauvre en fréquences aigues :
l’effet stéréo doit également être peu
présent. En effet, comme on le verra plus loin, il suffit d’une stéréo,
même avec de basses fréquences, pour augmenter le débit d’un fichier. Une
illustration typique est la chanson « Zookey » d’Africanism Sinclar diffusée à plusieurs
reprises à Trace TV en 2005. Trace TV, en général, diffuse en coupant les fréquences
supérieures à 15,5 kHz, avec atténuation des fréquences comprises entre 12 et
14 kHz et pics étranges entre 14 et 15,5 kHz. Zookey est particulièrement
pauvre en effets stéréo en plus d’avoir peu d’aigues en son sein. Lors de la
conversion du WAV en WMA
9.2 VBR 50, j’ai obtenu un fichier de bitrate moyen de 61 kbps
3. La pauvreté de l’effet stéréo associée à la pauvreté en
aigues associée à un volume élevé : plus le
volume est élevé, plus il semble que l’algorithme du WMA
9.2 VBR 50 encode avec un débit moindre. Cela est peut-être dû à une valeur de facteur
d’échelle (scale factor) plus réduite pour
représenter le segment audio en question. Je n’ai pas d’exemples sur le moment
pour ce qui est des débits inférieurs à 64 kbps, mais tout un tas de cas quant
à d’autres valeurs de bitrate. Ainsi, « Blinded by the Lights » de The Streets,
encodé en WMA 9.2 VBR 50 à
partir d’un fichier MP3 à 192 kbps, produit un fichier à débit moyen de 85
kbps. Amplifié à 6 dB, le débit du fichier en WMA 9.2
VBR 50 chute à 81 kbps
Notez que dans
certains cas, une chanson pauvre en
aigues peut engendrer une très
légère résonance métallique quand elle est convertie en WMA
9.2 VBR 50. Cela s’explique par le fait que l’algorithme traitant chaque segment avec
un niveau théorique égal de qualité, les segments de mauvaise qualité
originelle seront de nouveau amoindries en qualité (ici, 50), ce qui ne
peut que créer des distorsions.
- Pourquoi le débit moyen de certaines chansons
grimpe au-delà de 85 kbps ?
1. L’effet stéréo prononcé combiné à plusieurs sonorités
haute fréquence : plus les différences entre canaux sont marquées,
moins l’information audio est redondante et plus il
faut de bits pour encoder. Le débit monte de manière plus
spectaculaire lorsqu’un baffle est muet ou joue plus faiblement que l’autre. Par ailleurs, les sons aigus, comme vu supra, prennent beaucoup d’espace mémoire à
l’encodage, surtout ceux proches en fréquences de la fréquence de coupure
et ceux de fréquences supérieures qui sont de forte intensité. Un exemple
typique est la chanson « Feedback »
de Janet Jackson. Cette piste est riche en effets stéréo et bardée de sonorités
aigues. Le débit moyen atteint est de 103 kbps
2. L’effet stéréo prononcé combiné à moult sons aigus
combiné à un volume faible : pour
une raison que j’ignore (mais que je crois liée au facteur d’échelle), une chanson riche en stéréos et en aigus
dont le volume global est réduit est généralement encodée en WMA 9.2 VBR 50 à un débit plus élevé que la même chanson avec
un volume plus haut. Exemple : « Le rêve du pêcheur » de Laurent Voulzy joue dans le CD
d’origine avec un volume bas. Elle est riche en effets stéréo de type salsa et
très chargée en aigues. Encodée en WMA 9.2 VBR 50, elle affiche une vitesse de transmission moyenne de
89 kbps. Amplifiée de 7 dB, le débit avoisine 85 kbps
3. L’effet stéréo (prononcé ou pas) combiné à certains
artefacts de compression : il est certains artefacts de compression qui,
ré-encodés en WMA 9.2 VBR
50, produisent des bitrates élevés. Cela est peut-être le fait
d’une mauvaise gestion du masquage. Un tel phénomène survient souvent lors de
la conversion en WMA des MP3 enregistrés avec un mauvais encodeur et spécialement à 112 kbps. Je cite pour
illustrer mes propos la chanson « Threatened » de Michael Jackson, que j’avais copiée à partir d’un CD MP3 pirate acheté à Victoire (Kinshasa).
Sur ledit CD, la chanson est encodée à 112 kbps. En WMA
9.2 VBR 50, il est en moyenne de 91 kbps. La même
chanson tirée du CD d’origine (« Invincible ») produit un WMA de bitrate moyen de 75 kbps
4. Certains bruits de fond : même si l’effet stéréo n’est pas toujours prononcé,
une chanson chargée d’un souffle analogique
issu d’une K7 (audio ou vidéo) convertie en WMA
9.2 VBR 50 produit généralement une vitesse de transmission assez élevée. Tel est
le cas de la plupart des clips qui passent sur Channel O. Encodées en WMA 9.2 VBR 50, leur débit frôle
souvent 100 kbps. Cela s’explique par le fait que le souffle est composé pratiquement toutes les fréquences audibles à
égale intensité. Il est malaisé pour un codec audio de tirer dans ce chaos
les fréquences utiles au maintien du niveau de qualité. Notez que les bourdonnements électriques ne sont pas
ici concernés, vu que leurs fréquences sont plutôt basses ou basses médium.
5. Certaines musiques « lourdement chargées »
d’instruments de type guitare rock : la guitare rock produit plusieurs fréquences d’intensités voisines,
pas aigues nécessairement, mais suffisamment complexes pour dérouter
l’algorithme de compression du WMA 9.2 VBR 50. Exemple : « It’s my life » de No Doubt,
que j’ai piquée au réseau audio DMX, donne un bitrate final moyen de 90 kbps si elle est encodée en WMA 9.2 VBR 50
Notez que les chansons
« lourdement chargées », celles à artefacts d’origine et celles avec
souffles peuvent engendrer de la distorsion,
souvent très légère, parfois remarquable, si elles sont
encodées en WMA 9.2 VBR 50.
Je suppose que cela est dû au fait que l’algorithme peine à trier l’utile de
l’accessoire dans cette jungle de complexité, notamment pour le rock (c’est connu, WMA
n’est pas un codec très intéressant lors de l’encodage de ce style pour des
débits inférieur à 128 kbps).
