21 décembre 2008
QUID DES DÉBITS TROP HAUTS OU TROP BAS EN WMA 9.2 VBR 50 ?
QUID DES
DÉBITS TROP HAUTS OU TROP BAS EN WMA 9.2 VBR 50 ?
Le mode VBR, je ne le répéterai jamais assez, est le mode idéal d’encodage des sons, car il maintient une qualité constante au sein
d’un même fichier (tout en créant pour ce faire une fluctuation permanente
de débit). Et le paramètre dit de qualité moyenne (VBR 50) s’avère, à mon sens, le
meilleur compromis qualité – taille de fichier. C’est ainsi que je me focaliserai
sur ce paramètre, ce qui n’empêche guère que ce qui sera dit plus loin
s’applique aux autres paliers de qualité (10, 25, 75, 90 et 98).
Comme signalé dans plusieurs de mes articles, du moins
en WMA 9.2, la plupart des chansons enregistrées en VBR 50 ont un bitrate moyen oscillant entre 40 et 112 kbps. Parmi
lesdites chansons, la grande majorité
bénéficie d’un débit compris entre 64 et 85 kbps. Mais d’autres ont une
vitesse de transmission soit en-deçà de
64 kbps (débits trop bas), soit au-delà
de 85 kbps (débits trop hauts). Dans ce topic,
j’expliquerai pourquoi ce comportement extrême.
- Pourquoi certaines chansons sont encodées en WMA 9.2 VBR 50 en-deçà de 64
kbps ?
1. La pauvreté de l’effet stéréo : une chanson dont les variations sonores d’un
baffle à un autre ne sont pas prononcées comporte de multiples redondances dans les canaux audio. Tout algorithme de
compression audio encodant en VBR sait exploiter ladite redondance et la coder
avec moins de bits. Une illustration typique est la chanson « Hey there Delilah » de Plain White T’s que j’ai copiée à
partir du réseau audio DMX (bouquet DSTV) qui est réputé diffuser en
bonne qualité (fréquence de coupure aux alentours de 18 kHz). Le fichier
converti en WMA 9.2 VBR 50 de
ce chef-d’œuvre a un bitrate moyen de seulement 43
kbps et le son est d’une qualité superbe, sans artefacts du genre son métallique
2. La pauvreté en fréquences aigues associée à la pauvreté
de l’effet stéréo : en mode VBR 50, WMA atténue (voire élimine) les fréquences supérieures
à environ 13,2 kHz. L’atténuation
des fréquences supérieures sera d’autant plus forte que leur intensité sera
faible. Ainsi, un son aigu de 15 kHz peu être mieux conservé, si son
intensité est très forte, qu’un son aigu de 14 kHz d’intensité moindre. Or
l’encodage des aigues sollicite beaucoup de bits. Moins il y a des fréquences aigues, plus le bitrate
baisse. Toutefois, pour que WMA 9.2 VBR 50 diminue le bitrate global
d’une chanson, il ne suffit pas qu’elle soit pauvre en fréquences aigues :
l’effet stéréo doit également être peu
présent. En effet, comme on le verra plus loin, il suffit d’une stéréo,
même avec de basses fréquences, pour augmenter le débit d’un fichier. Une
illustration typique est la chanson « Zookey » d’Africanism Sinclar diffusée à plusieurs
reprises à Trace TV en 2005. Trace TV, en général, diffuse en coupant les fréquences
supérieures à 15,5 kHz, avec atténuation des fréquences comprises entre 12 et
14 kHz et pics étranges entre 14 et 15,5 kHz. Zookey est particulièrement
pauvre en effets stéréo en plus d’avoir peu d’aigues en son sein. Lors de la
conversion du WAV en WMA
9.2 VBR 50, j’ai obtenu un fichier de bitrate moyen de 61 kbps
3. La pauvreté de l’effet stéréo associée à la pauvreté en
aigues associée à un volume élevé : plus le
volume est élevé, plus il semble que l’algorithme du WMA
9.2 VBR 50 encode avec un débit moindre. Cela est peut-être dû à une valeur de facteur
d’échelle (scale factor) plus réduite pour
représenter le segment audio en question. Je n’ai pas d’exemples sur le moment
pour ce qui est des débits inférieurs à 64 kbps, mais tout un tas de cas quant
à d’autres valeurs de bitrate. Ainsi, « Blinded by the Lights » de The Streets,
encodé en WMA 9.2 VBR 50 à
partir d’un fichier MP3 à 192 kbps, produit un fichier à débit moyen de 85
kbps. Amplifié à 6 dB, le débit du fichier en WMA 9.2
VBR 50 chute à 81 kbps
Notez que dans
certains cas, une chanson pauvre en
aigues peut engendrer une très
légère résonance métallique quand elle est convertie en WMA
9.2 VBR 50. Cela s’explique par le fait que l’algorithme traitant chaque segment avec
un niveau théorique égal de qualité, les segments de mauvaise qualité
originelle seront de nouveau amoindries en qualité (ici, 50), ce qui ne
peut que créer des distorsions.
- Pourquoi le débit moyen de certaines chansons
grimpe au-delà de 85 kbps ?
1. L’effet stéréo prononcé combiné à plusieurs sonorités
haute fréquence : plus les différences entre canaux sont marquées,
moins l’information audio est redondante et plus il
faut de bits pour encoder. Le débit monte de manière plus
spectaculaire lorsqu’un baffle est muet ou joue plus faiblement que l’autre. Par ailleurs, les sons aigus, comme vu supra, prennent beaucoup d’espace mémoire à
l’encodage, surtout ceux proches en fréquences de la fréquence de coupure
et ceux de fréquences supérieures qui sont de forte intensité. Un exemple
typique est la chanson « Feedback »
de Janet Jackson. Cette piste est riche en effets stéréo et bardée de sonorités
aigues. Le débit moyen atteint est de 103 kbps
2. L’effet stéréo prononcé combiné à moult sons aigus
combiné à un volume faible : pour
une raison que j’ignore (mais que je crois liée au facteur d’échelle), une chanson riche en stéréos et en aigus
dont le volume global est réduit est généralement encodée en WMA 9.2 VBR 50 à un débit plus élevé que la même chanson avec
un volume plus haut. Exemple : « Le rêve du pêcheur » de Laurent Voulzy joue dans le CD
d’origine avec un volume bas. Elle est riche en effets stéréo de type salsa et
très chargée en aigues. Encodée en WMA 9.2 VBR 50, elle affiche une vitesse de transmission moyenne de
89 kbps. Amplifiée de 7 dB, le débit avoisine 85 kbps
3. L’effet stéréo (prononcé ou pas) combiné à certains
artefacts de compression : il est certains artefacts de compression qui,
ré-encodés en WMA 9.2 VBR
50, produisent des bitrates élevés. Cela est peut-être le fait
d’une mauvaise gestion du masquage. Un tel phénomène survient souvent lors de
la conversion en WMA des MP3 enregistrés avec un mauvais encodeur et spécialement à 112 kbps. Je cite pour
illustrer mes propos la chanson « Threatened » de Michael Jackson, que j’avais copiée à partir d’un CD MP3 pirate acheté à Victoire (Kinshasa).
Sur ledit CD, la chanson est encodée à 112 kbps. En WMA
9.2 VBR 50, il est en moyenne de 91 kbps. La même
chanson tirée du CD d’origine (« Invincible ») produit un WMA de bitrate moyen de 75 kbps
4. Certains bruits de fond : même si l’effet stéréo n’est pas toujours prononcé,
une chanson chargée d’un souffle analogique
issu d’une K7 (audio ou vidéo) convertie en WMA
9.2 VBR 50 produit généralement une vitesse de transmission assez élevée. Tel est
le cas de la plupart des clips qui passent sur Channel O. Encodées en WMA 9.2 VBR 50, leur débit frôle
souvent 100 kbps. Cela s’explique par le fait que le souffle est composé pratiquement toutes les fréquences audibles à
égale intensité. Il est malaisé pour un codec audio de tirer dans ce chaos
les fréquences utiles au maintien du niveau de qualité. Notez que les bourdonnements électriques ne sont pas
ici concernés, vu que leurs fréquences sont plutôt basses ou basses médium.
5. Certaines musiques « lourdement chargées »
d’instruments de type guitare rock : la guitare rock produit plusieurs fréquences d’intensités voisines,
pas aigues nécessairement, mais suffisamment complexes pour dérouter
l’algorithme de compression du WMA 9.2 VBR 50. Exemple : « It’s my life » de No Doubt,
que j’ai piquée au réseau audio DMX, donne un bitrate final moyen de 90 kbps si elle est encodée en WMA 9.2 VBR 50
Notez que les chansons
« lourdement chargées », celles à artefacts d’origine et celles avec
souffles peuvent engendrer de la distorsion,
souvent très légère, parfois remarquable, si elles sont
encodées en WMA 9.2 VBR 50.
Je suppose que cela est dû au fait que l’algorithme peine à trier l’utile de
l’accessoire dans cette jungle de complexité, notamment pour le rock (c’est connu, WMA
n’est pas un codec très intéressant lors de l’encodage de ce style pour des
débits inférieur à 128 kbps).
Commentaires
Poster un commentaire
Rétroliens
URL pour faire un rétrolien vers ce message :
http://www.canalblog.com/cf/fe/tb/?bid=161527&pid=11825790
Liens vers des weblogs qui référencent ce message :
