QUID DES DÉBITS TROP HAUTS OU TROP BAS EN WMA 9.2 VBR 50 ?

Le mode VBR, je ne le répéterai jamais assez, est le mode idéal d’encodage des sons, car il maintient une qualité constante au sein d’un même fichier (tout en créant pour ce faire une fluctuation permanente de débit). Et le paramètre dit de qualité moyenne (VBR 50) s’avère, à mon sens, le meilleur compromis qualité – taille de fichier. C’est ainsi que je me focaliserai sur ce paramètre, ce qui n’empêche guère que ce qui sera dit plus loin s’applique aux autres paliers de qualité (10, 25, 75, 90 et 98).

Comme signalé dans plusieurs de mes articles, du moins en WMA 9.2, la plupart des chansons enregistrées en VBR 50 ont un bitrate moyen oscillant entre 40 et 112 kbps. Parmi lesdites chansons, la grande majorité bénéficie d’un débit compris entre 64 et 85 kbps. Mais d’autres ont une vitesse de transmission soit en-deçà de 64 kbps (débits trop bas), soit au-delà de 85 kbps (débits trop hauts). Dans ce topic, j’expliquerai pourquoi ce comportement extrême.

  1. Pourquoi certaines chansons sont encodées en WMA 9.2 VBR 50 en-deçà de 64      kbps ?

1. La pauvreté de l’effet stéréo : une chanson dont les variations sonores d’un baffle à un autre ne sont pas prononcées comporte de multiples redondances dans les canaux audio. Tout algorithme de compression audio encodant en VBR sait exploiter ladite redondance et la coder avec moins de bits. Une illustration typique est la chanson « Hey there Delilah » de Plain White T’s que j’ai copiée à partir du réseau audio DMX (bouquet DSTV) qui est réputé diffuser en bonne qualité (fréquence de coupure aux alentours de 18 kHz). Le fichier converti en WMA 9.2 VBR 50 de ce chef-d’œuvre a un bitrate moyen de seulement 43 kbps et le son est d’une qualité superbe, sans artefacts du genre son métallique

2. La pauvreté en fréquences aigues associée à la pauvreté de l’effet stéréo : en mode VBR 50, WMA atténue (voire élimine) les fréquences supérieures à environ 13,2 kHz. L’atténuation des fréquences supérieures sera d’autant plus forte que leur intensité sera faible. Ainsi, un son aigu de 15 kHz peu être mieux conservé, si son intensité est très forte, qu’un son aigu de 14 kHz d’intensité moindre. Or l’encodage des aigues sollicite beaucoup de bits. Moins il y a des fréquences aigues, plus le bitrate baisse. Toutefois, pour que WMA 9.2 VBR 50 diminue le bitrate global d’une chanson, il ne suffit pas qu’elle soit pauvre en fréquences aigues : l’effet stéréo doit également être peu présent. En effet, comme on le verra plus loin, il suffit d’une stéréo, même avec de basses fréquences, pour augmenter le débit d’un fichier. Une illustration typique est la chanson « Zookey » d’Africanism Sinclar diffusée à plusieurs reprises à Trace TV en 2005. Trace TV, en général, diffuse en coupant les fréquences supérieures à 15,5 kHz, avec atténuation des fréquences comprises entre 12 et 14 kHz et pics étranges entre 14 et 15,5 kHz. Zookey est particulièrement pauvre en effets stéréo en plus d’avoir peu d’aigues en son sein. Lors de la conversion du WAV en WMA 9.2 VBR 50, j’ai obtenu un fichier de bitrate moyen de 61 kbps

3. La pauvreté de l’effet stéréo associée à la pauvreté en aigues associée à un volume élevé : plus le volume est élevé, plus il semble que l’algorithme du WMA 9.2 VBR 50 encode avec un débit moindre. Cela est peut-être dû à une valeur de facteur d’échelle (scale factor) plus réduite pour représenter le segment audio en question. Je n’ai pas d’exemples sur le moment pour ce qui est des débits inférieurs à 64 kbps, mais tout un tas de cas quant à d’autres valeurs de bitrate. Ainsi, « Blinded by the Lights » de The Streets, encodé en WMA 9.2 VBR 50 à partir d’un fichier MP3 à 192 kbps, produit un fichier à débit moyen de 85 kbps. Amplifié à 6 dB, le débit du fichier en WMA 9.2 VBR 50 chute à 81 kbps

Notez que dans certains cas, une chanson pauvre en aigues peut engendrer une très légère résonance métallique quand elle est convertie en WMA 9.2 VBR 50. Cela s’explique par le fait que l’algorithme traitant chaque segment avec un niveau théorique égal de qualité, les segments de mauvaise qualité originelle seront de nouveau amoindries en qualité (ici, 50), ce qui ne peut que créer des distorsions.

  1. Pourquoi le débit moyen de certaines chansons      grimpe au-delà de 85 kbps ?

1. L’effet stéréo prononcé combiné à plusieurs sonorités haute fréquence : plus les différences entre canaux sont marquées, moins l’information audio est redondante et plus il faut de bits pour encoder. Le débit monte de manière plus spectaculaire lorsqu’un baffle est muet ou joue plus faiblement que l’autre. Par ailleurs, les sons aigus, comme vu supra, prennent beaucoup d’espace mémoire à l’encodage, surtout ceux proches en fréquences de la fréquence de coupure et ceux de fréquences supérieures qui sont de forte intensité. Un exemple typique est la chanson « Feedback » de Janet Jackson. Cette piste est riche en effets stéréo et bardée de sonorités aigues. Le débit moyen atteint est de 103 kbps

2. L’effet stéréo prononcé combiné à moult sons aigus combiné à un volume faible : pour une raison que j’ignore (mais que je crois liée au facteur d’échelle), une chanson riche en stéréos et en aigus dont le volume global est réduit est généralement encodée en WMA 9.2 VBR 50 à un débit plus élevé que la même chanson avec un volume plus haut. Exemple : « Le rêve du pêcheur » de Laurent Voulzy joue dans le CD d’origine avec un volume bas. Elle est riche en effets stéréo de type salsa et très chargée en aigues. Encodée en WMA 9.2 VBR 50, elle affiche une vitesse de transmission moyenne de 89 kbps. Amplifiée de 7 dB, le débit avoisine 85 kbps

3. L’effet stéréo (prononcé ou pas) combiné à certains artefacts de compression : il est certains artefacts de compression qui, ré-encodés en WMA 9.2 VBR 50, produisent des bitrates élevés. Cela est peut-être le fait d’une mauvaise gestion du masquage. Un tel phénomène survient souvent lors de la conversion en WMA des MP3 enregistrés avec un mauvais encodeur et spécialement à 112 kbps. Je cite pour illustrer mes propos la chanson « Threatened » de Michael Jackson, que j’avais copiée à partir d’un CD MP3 pirate acheté à Victoire (Kinshasa). Sur ledit CD, la chanson est encodée à 112 kbps. En WMA 9.2 VBR 50, il est en moyenne de 91 kbps. La même chanson tirée du CD d’origine (« Invincible ») produit un WMA de bitrate moyen de 75 kbps

4. Certains bruits de fond : même si l’effet stéréo n’est pas toujours prononcé, une chanson chargée d’un souffle analogique issu d’une K7 (audio ou vidéo) convertie en WMA 9.2 VBR 50 produit généralement une vitesse de transmission assez élevée. Tel est le cas de la plupart des clips qui passent sur Channel O. Encodées en WMA 9.2 VBR 50, leur débit frôle souvent 100 kbps. Cela s’explique par le fait que le souffle est composé pratiquement toutes les fréquences audibles à égale intensité. Il est malaisé pour un codec audio de tirer dans ce chaos les fréquences utiles au maintien du niveau de qualité. Notez que les bourdonnements électriques ne sont pas ici concernés, vu que leurs fréquences sont plutôt basses ou basses médium.

5. Certaines musiques « lourdement chargées » d’instruments de type guitare rock : la guitare rock produit plusieurs fréquences d’intensités voisines, pas aigues nécessairement, mais suffisamment complexes pour dérouter l’algorithme de compression du WMA 9.2 VBR 50. Exemple : « It’s my life » de No Doubt, que j’ai piquée au réseau audio DMX, donne un bitrate final moyen de 90 kbps si elle est encodée en WMA 9.2 VBR 50

Notez que les chansons « lourdement chargées », celles à artefacts d’origine et celles avec souffles peuvent engendrer de la distorsion, souvent très légère, parfois remarquable, si elles sont encodées en WMA 9.2 VBR 50. Je suppose que cela est dû au fait que l’algorithme peine à trier l’utile de l’accessoire dans cette jungle de complexité, notamment pour le rock (c’est connu, WMA n’est pas un codec très intéressant lors de l’encodage de ce style pour des débits inférieur à 128 kbps).