29 avril 2009
PAS DE DOUTE : LE WMA VBR N’ÉCONOMISE QUE RAREMENT DE L’ESPACE
PAS DE DOUTE : LE WMA VBR N’ÉCONOMISE QUE RAREMENT DE L’ESPACE
Ce topic est la suite logique de ceci.
N.B. : Il s’agit ici de la version standard du format, version 9.2.
Je l’ai déjà démontré, avec un peu d’astuces, mais également dans bien des cas ordinaires, le WMA en mode VBR n’est pas un si bon économiseur d’espace que Microsoft, son concepteur, veut bien le faire croire. Voici à présent une autre preuve de ce que j’avance, me basant sur la comparaison des fréquences de coupure des modes CBR et VBR du format WMA.
Le comparatif proprement dit
Une consultation de cette page vous donnera une vue mieux structurée et plus compréhensible de ce qui suit. Ne manquez pas non plus de cliquer ici et là pour d’autres détails complémentaires.
1. VBR 10
Ce mode VBR, excellent dans l’encodage de la voix parlée, mais pas fameux dans l’archivage des chansons, coupe les fréquences à environ 12050 Hz. Ce lowpass est partagé par deux débits binaires en mode CBR : 48 et 64 kbps. Il serait tentant de croire que VBR 10, qui crée des fichiers de taille moyenne de 50 kbps, s’avère intéressant par rapport au CBR à 64 kbps. Je vous déconseille malheureusement d’encoder de la musique en VBR 10, vu la qualité, je l’ai dit, vraiment médiocre du résultat final. Le CBR à 64 kbps réalise un boulot nettement meilleur (bien que pas optimal). En revanche, VBR 10 peut être comparé au CBR à 48 kbps du point de vue qualitatif. Mais il est assez rare de trouver en ce mode VBR des sons dont le débit moyen est inférieur à 48 kbps. Le gain de place est par conséquent très faible. Le WMA est l’un des rares formats audio, le seul qui sait, à générer un lowpass identique pour deux vitesses de transmission assez éloignées (48 et 64 kbps), mais de qualité très différente.
2. VBR 25
Sa fréquence de coupure est de 13 kHz, légèrement inférieure au CBR à 80 kbps dont le lowpass est de 13,2 kHz. Le bitrate moyen du VBR 25 se situe aux alentours de 65 kbps, avec des pics à 85 kbps et des chutes à 40. L’économie d’espace n’est pas spectaculaire par rapport au CBR à 80 kbps, mais c’est mieux que le VBR 10 face au CBR à 48 kbps. Toutefois, quant à la qualité, je préfère au VBR 25 le CBR à 64 kbps qui, certes, souffre d’un lowpass plus marqué (12 kHz), mais, paradoxalement, assure une meilleure conservation des aigues (vraiment bizarre, le WMA !). Et du CBR à 80 kbps sonne mieux que du CBR à 64 kbps, quoi de plus logique. Donc, en termes de ratio qualité-taille de fichier, VBR 25 est un échec, plusieurs fois décrié par les testeurs et l’une des causes de discrédit du WMA (notamment dans sa version 9.1, sérieusement buggué dans l’encodage VBR, tous modes confondus).
3. VBR 50
Ici, la fréquence de coupure est similaire au mode CBR à 80 kbps : environ 13,2 kHz. Un saut infime comparé au VBR 25, mais un gain drastique de qualité. Le bitrate du VBR 50 varie beaucoup selon les morceaux, pouvant être aussi bas que 45 kbps et dépasser 100 kbps. Les meilleurs gains se remarquent dans la musique classique et les moins bons dans le rock et dans la musique électronique (techno et autres dances). En général, les débits tournent autour de 75-85 kbps, ce qui fait que par rapport au CBR à 80 kbps, le gain d’espace est anecdotique.
4. VBR 75
Bien qu’il partage le même lowpass que le WMA CBR à 96 kbps, le VBR 75 a meilleure qualité sonore que celui-là. Question sauvegarde de la taille mémoire, notre mode VBR n’est nullement un modèle : le bitrate moyen se situe aux alentours de 125 kbps. Il est peu fréquent de descendre en-dessous de 100 kbps, mais assez courant d’atteindre 135 kbps. Ainsi, à fréquence de coupure équivalente, le CBR à 96 kbps économise clairement plus d’espace que VBR 75.
5. VBR 90
Coupant la majorité des fréquences au-delà de 18760 Hz, VBR 90 partage exactement le même lowpass que CBR à 160 kbps et presque le même lowpass que CBR à 192 kbps qui, lui, supprime la majorité des signaux audio de fréquences supérieures à 18770 Hz. En moyenne, ce mode VBR produit des fichiers à débits compris entre 180 et 200 kbps, avec des pics à 220 kbps et des baisses à 130. Comparativement au CBR à 192 kbps, l’économie de place n’est pas si grande. Elle n’existe quasiment plus en comparaison avec le CBR à 160 kbps. Notez par ailleurs qu’en WMA VBR, lorsque la vitesse de transmission moyenne dépasse 192 kbps, certains baladeurs et autoradios lisent par saccades, voire ne lisent pas du tout le fichier concerné. Détail intéressant : encodé à 48 kHz d’échantillonnage, VBR 90 augmente son lowpass à environ 20 kHz, avec un bitrate moyen à peine plus élevé que ce que produit un encodage à 44 kHz. Une augmentation de qualité non négligeable, je dois le reconnaître.
6. VBR 98
Les ingénieurs à Billou n’ont sûrement pas conçu ce mode en ayant dans leur caboche l’intention d’économiser de l’espace mémoire. Ils escomptaient plutôt produire des fichiers audio proche du sans faute en matière de qualité, tout en conservant un poids raisonnable. Et le but est réellement atteint (même si le MP3 fait mieux à des bitrates plus bas). La fréquence de coupure (20050 Hz) est celle du CBR à 256 kbps et proche du lowpass du CBR à 320 kbps (20060 Hz). Eu égard au CBR à 256 kbps, aucune économie d’espace n’est décelée, VBR 98 générant la plupart du temps un bitrate moyen voisin de 320 kbps, rarement de 270-300 kbps. Par rapport au CBR à 320 kbps, on ne gagne que des miettes en termes de place, et encore, car les vitesses de transmission peuvent culminer à 360 kbps au sein de certaines chansons assez « compliquées ». Bref, pour raisons de gain de place, mieux vaut user du CBR à 256 ou à 320 kbps que du WMA VBR 98.
Conclusion : ouste, le VBR ?
Si votre vœu est le gain d’espace, le mode VBR n’est pas le candidat valable qui satisfasse vos désirs numériques, en tout cas pas dans l’utilisation du format WMA standard. À fréquence de coupure équivalente en mode CBR, le mode VBR a généralement tendance à augmenter le débit, histoire de glaner quelques infos supplémentaires dans le souci du maintien de la qualité. Il ne baisse la vitesse de transmission que lorsqu’il estime que tel segment d’un son est moins « riche » et/ou moins « dense » que tel autre. Et fait très souvent, il bien son travail ; c’est la raison pour laquelle les utilisateurs avertis préfèrent se servir du mode VBR : son respect des détails est plus pointu que celui du mode CBR. Cela doit néanmoins être nuancé. À des débits supérieurs ou égaux à 128 kbps, mon oreille d’amateur ne distingue plus entre un fichier encodé en CBR et le même fichier encodé en VBR. À partir de ce bitrate, j’ai comme l’impression que le CBR est suffisamment mûr dans son modèle psycho-acoustique et peut être utilisé sans crainte de qualité ni… de perte de mémoire.
WMA Imperator.
18 avril 2009
BITRATES LORS DES SILENCES STÉRÉO EN WMA VBR 1-PASS
BITRATES LORS DES SILENCES STÉRÉO EN WMA VBR 1-PASS
WMA STANDARD v. 9.2 | |||
Niveau de qualité VBR |
Bitrate moyen (en kbps) |
Bitrate maximal (en kbps) |
Bitrate du fichier non compressé |
Q10 (44 kHz) 16 bits |
26.2 |
26.6 |
1411.2 |
Q25 (44 kHz) 16 bits |
34.9 |
35.0 |
1411.2 |
Q50 (44 kHz) 16 bits |
34.9 |
35.0 |
1411.2 |
Q75 (44 Khz) 16 bits |
51.9 |
51.9 |
1411.2 |
Q90 (44 kHz) 16 bits |
103.1 |
103.1 |
1411.2 |
Q90 (48 kHz) 16 bits |
103.4 |
103.4 |
1536 |
Q98 (44 kHz) 16 bits |
137.3 |
137.3 |
1411.2 |
Q98 (48 kHz) 16 bits |
137.4 |
137.4 |
1536 |
WMA PROFESSIONAL v. 10 | |||
Q10 (44 kHz) 24 bits |
12.7 |
13.6 |
2116.8 |
Q10 (48 kHz) 24 bits |
13.1 |
17.6 |
2304 |
Q25 (44 kHz) 24 bits |
25.4 |
1590.2 |
2116.8 |
Q25 (48 kHz) 24 bits |
19.7 |
25.5 |
2304 |
Q50 (44 kHz) 24 bits |
25.4 |
1590.2 |
2116.8 |
Q50 (48 kHz) 24 bits |
26.2 |
33.4 |
2304 |
Q75 (44 kHz) 24 bits |
38.0 |
1590.2 |
2116.8 |
Q75 (48 kHz) 24 bits |
39.3 |
50.3 |
2304 |
Q75 (88 kHz) 24 bits |
40.4 |
69.2 |
4224 |
Q75 (96 kHz) 24 bits |
39.3 |
50.3 |
4608 |
Q90 (44 kHz) 24 bits |
50.7 |
1590.2 |
2116.8 |
Q90 (48 kHz) 24 bits |
52.4 |
66.2 |
2304 |
Q90 (88 kHz) 24 bits |
53.9 |
92.2 |
4224 |
Q90 (96 kHz) 24 bits |
52.4 |
66.2 |
4608 |
Q98 (44 kHz) 24 bits |
76.1 |
1590.2 |
2116.8 |
Q98 (48 kHz) 24 bits |
78.7 |
99.2 |
2304 |
Q98 (88 kHz) 24 bits |
80.8 |
137.2 |
4224 |
Q98 (96 kHz) 24 bits |
78.7 |
99.2 |
4608 |
WMA LOSSLESS 9.2 | |||
Q100 (44 kHz) 16 bits |
221.9 |
221.9 |
1411.2 |
Q100 (44 kHz) 24 bits |
846.5 |
846.5 |
2116.8 |
Q100 (48 kHz) 24 bits |
876.4 |
876.4 |
2304 |
Q100 (88 kHz) 24 bits |
1053.7 |
1053.7 |
4224 |
Q100 (96 kHz) 24 bits |
1076.6 |
1076.6 |
4608 |
Commentaires d’ensemble
Le silence traité ici a été généré par Audacity. Il s’agit d’un fichier de 30 secondes échantillonné à 44 kHz, 16 bits, au format WAV Stéréo.
Pour ce qui est du WMA 9.2 (WMA Standard), il est aisé de constater que l’algorithme de compression ne crée pas de fluctuations sensibles de débit au sein des fichiers convertis en un mode donné. Ledit débit va de 26 à 137 kbps selon le mode VBR choisi.
En ce qui concerne le WMA Professional, un codec disposant d’un modèle psycho-acoustique plus élaboré, je suis allé de surprises en surprises. La vitesse de transmission peut descendre à 13 kbps et ne dépasse pas en moyenne 77 kbps, même en VBR Q98 échantillonné à 96 kHz ! Reconnaissons-le, il s’agit là d’un exploit technique… Cependant, les fluctuations de débits sont assez marquées au sein d’un fichier. Elles deviennent même carrément démentielles lorsque le fichier encodé est échantillonné à 44 kHz à partir de VBR Q25. Le bitrate atteint 1590 kbps avec une moyenne parfois aussi basse que 25 kbps, mais jamais supérieure à 77 kbps, comme dit supra !! Je me creuse les méninges, cherchant à savoir ce qui peut créer un dandinement de bitrates dans l’encodage d’un silence, ce dernier étant supposé exempt de données sonores. Autre détail intéressant : les fichiers encodés en un mode VBR donné, de fréquence d’échantillonnage de 48 kHz et de 96 kHz, ont une vitesse de transmission moyenne identique ! La raison de cet étrange comportement m’échappe. Elle n’est sûrement pas due au fait que ces deux fréquences d’échantillonnage ont un rapport exact de 2 sur 1. En effet, ce phénomène ne se produit pas avec les fréquences de 44 kHz et de 88 kHz…
Quant au WMA Lossless, le débit moyen est grandement fonction de la résolution en bits et de la fréquence d’échantillonnage. À 44 kHz de fréquence et à 16 bits d’échantillonnage, le taux de compression est élevé. Toutefois, à 24 bits par échantillon, fréquence de 44 ou de 48 kHz, franchement, le gain de place n’est pas extraordinaire pour un silence, comparé à un fichier non compressé. De même pour les fréquences de 88 et de 96 kHz à 24 bits par échantillon, mais le ratio de compression est un peu plus satisfaisant. Est-ce un bug dans l’algorithme lossless du WMA 9.2 ? Ou plutôt une mauvaise gestion des imperfections causées peut-être par l’interpolation fréquentielle opérée par l’algorithme en question lors du passage d’une résolution 16 bits (fichier originel) à une résolution 24 bits ? Aux ingénieurs à Billou de répondre…
