Les deux fichiers ci-dessous donnent la forme d'onde du fichier difs.wav, tant en encodage WMA standard (GRAPHSTD) qu'en encodage WMA pro (GRAPHRO).
COMMENTAIRES DES CAPTURES D’ÉCRAN
Il s’agit de l’analyse spectrale de l’échantillon
WAV en mode VBR dans ses six paliers, tant en WMA version standard (version 9.2)
que professionnelle (version 10). Ledit échantillon est une
bizarrerie sonore d’une seconde, formé d’un bruit blanc (piste gauche) de très faible volume associé à un bruit
rose (piste droite) de volume plus haut. Ce choix a été dicté du fait que
WMA est un format qui a du mal en débit
variable de gérer ce type de signaux qui compliquent sérieusement son
algorithme d’encodage. Dans les fichiers GRAPHST (captures d’écran WMA Standard) comme GRAPHPRO (captures d’écran WMA Professional), les deux premières captures d’écran sont celles du fichier WAV original.
I. Analyse
du WMA standard (v. 9.2)
Quel que soit le
mode VBR utilisé, il est aisé de constater que le WMA standard a du mal à respecter correctement le son soumis à son
encodage : il manque dans tous
les cas 100 ms de signal en début de fichier, remplacées par un silence.
Est-ce une mauvaise gestion des « transients » (attaques brusques et
brèves) ou un temps de pré-analyse du signal rendu long à cause de la
complexité de ce dernier ? Aux spécialistes de répondre. Quoi qu’il en
soit, il s’agit d’une anomalie, d’un
irrespect du son original, même si le silence peut ne pas être audible.
Par ailleurs, vu
la nature chaotique du signal soumis
à encodage, les débits binaires sont
très élevés, trop élevés même, l’algorithme tentant de gonfler le bitrate
pour maintenir le niveau de qualité qui lui est assigné.
Enfin, le signal est amplifié lors de la
conversion, tous modes VBR confondus.
1. WMA VBR 98
La vitesse de
transmission moyenne, qui est de 676
kbps, est la plus grande jamais atteinte par un codec purement lossy,
largement supérieure à l’intervalle théorique fixé par Microsoft (240-355
kbps) ! En outre, on remarque le
lowpass à 20 kHz.
2. WMA VBR 90
Le débit de 346
kbps est également assez haut
(valeurs théoriques comprises entre 135 et 215 kbps). Le son se dégrade à partir de 15,9 kHz et s’effondre aux alentours de 18,8 kHz, ce qui est exceptionnel en ce mode VBR qui a
coutume de respecter assez fidèlement le signal original jusque 18 kHz.
Surement une étrangeté commandée par le
modèle psycho-acoustique qui estime (à tort ou à raison) qu’avec ce genre
de bizarrerie sonore, l’oreille ne percevra pas de différence si le signal est
atténué de la sorte.
3. WMA VBR 75
Au lieu de la
fourchette 85-145 kbps théorisée par les ingénieurs de la firme de Redmond, la vitesse de transmission moyenne de 255
kbps n’est pas négligeable. Elle est même excessive pour un mode qui coupe, comme ici, le son à 15,5 kHz.
4. WMA VBR 50
Atteindre le bitrate de 129 kbps (au lieu, pour des sons
« normaux », de la marge 50-95 kbps) est honteux pour un format audio en 2010 dont le lowpass en ce mode est
à peine de 13,2 kHz. Je pense, sans
trop m’y connaître, qu’il y a moyen, pour ce type de signal, de programmer l’encodeur en lui permettant
d’accepter une certaine distorsion en diminuant le débit, distorsions qui,
j’en suis convaincu, ne sera pas audible. Cette remarque vaut d’ailleurs pour
les deux modes VBR susmentionnés.
5. WMA VBR 25
L’écart de débit avec le mode précédent n’est
pas terrible : à peine
20 kbps de moins. Cela peut s’expliquer par le lowpass de WMA VBR 25 qui est très voisin de WMA VBR 50 : 13 kHz pour l’un, 13,2 kHz pour
l’autre. Toutefois, en VBR 25, le manque
de respect des signaux résiduels de haute fréquence est plus prononcé, ce
qui est un signe évident de déformation,
généralement audible dans la musique courante. Comme je l’ai toujours écrit, il
s’agit du mode VBR le moins abouti du
WMA standard, dont la raison d’être ne se justifie guère.
6. WMA VBR 10
Le bitrate moyen de 98kbps est une aberration pour un mode qui coupe les
fréquences à 12,1 kHz. Le MP3, en mode ABR, fait mieux à 96 kbps en coupant à environ 15,4 kHz,
certes avec des distorsions, mais moins qu’ici.
II. Analyse
du WMA Professional (v. 10)
Le mode VBR du WMA Pro fonctionnant en de
hautes résolutions (24
bits), la précision de l’analyse du
signal audio est plus grande, ce qui
fait que les bugs d’encodage sont nettement minimisés. Ainsi, fini le silence de 100 ms en début de
fichier, quel que soit le mode VBR.
Toutefois, à
l’instar du WMA standard, les débits
binaires moyens sont élevés, mais nettement
moins que celui-là. Cela peut indiquer que les algorithmes du WMA Pro traitent plus efficacement les signaux
redondants ou, du moins, usent
d’astuces plus sophistiquées de réduction de bits.
1. WMA VBR 98
La vitesse de
transmission de 486 kbps rappelle quelque peu le mode q10 du format Ogg Vorbis
qui crée des fichiers de débits moyens aux alentours de 500 kbps. Tout comme le
Vorbis, WMA Pro en ce mode VBR crée un
audio quasi sans perte, dépourvu de saturations ou d’affaissements, avec un
spectre identique à l’original. En mon sens, ce palier peut valablement remplacer un encodage lossless.
2. WMA VBR 90
Hormis un débit un peu plus bas que le mode
précédent (324 kbps), débit du reste très raisonnable, le signal est respecté, tout comme en VBR 98, presque à l’identique de l’original. Ce palier également peut
valablement remplacer un encodage lossless.
3. WMA VBR 75
L’irrespect par rapport à l’original débute en ce mode VBR. En effet, à l’instar
du WMA standard, le signal original
semble amplifié. Cette anomalie
entache également tous les modes VBR inférieurs. Cependant, la coupure à
18,6 kHz est acceptable pour la vitesse de transmission de 213 kbps.
4. WMA VBR 50
Le lowpass de 15,9 kHz est meilleur qu’en WMA
standard en ce palier de qualité, mais
n’est pas fameux si on a en face la concurrence des autres formats de compression
récents (MP3 avec LAME, Vorbis, AAC) qui, pour le débit concerné (155
kbps), coupent tous aux alentours de 18 kHz.
5. WMA VBR 25
Le bitrate de 142 kbps, proche de celui
engendré par VBR 50, s’explique par une fréquence
de coupure très similaire à ce dernier (15,8 kHz). L’analyse spectrale révèle par ailleurs une mauvaise gestion des fréquences résiduelles
qui paraissent comme hâchées. Décidément, les développeurs du format ont eu
quelques ennuis avec ce palier VBR. Néanmoins, la distorsion par rapport au WMA standard est moins gênantes (juste
un léger excès d’aigues).
6. WMA VBR 10
Les ingénieurs à
Billou ont retuné ce mode lors de la
sortie de XP SP3. Jusqu’en 2006, il tronquait les fréquences au-delà de 12,9
kHz. Depuis 2008, son lowpass a
spectaculairement augmenté, atteignant 20
kHz pour un bitrate de 129 kbps ! Ça sent l’artifice, la synthèse des hautes fréquences de type SBR et
compagnie et c’est trop beau pour être vrai : le signal WAV n’est pas respecté. Hormis l’amplification susmentionnée,
une observation attentive du spectre montre des disparités par rapport aux deux modes VBR directement
précédents. Par curiosité, je me suis proposé d’auditionner un extrait de
musique « ordinaire » (une R&B du groupe Mis-Teeq) encodé en ce
palier. Certes, le son est net, mais
la métallisation assez remarquable,
presque déplaisante. WMA VBR 10 est
un mode cobaye dont je déconseille
d’user.