Les deux fichiers ci-dessous donnent la forme d'onde du fichier difs.wav, tant en encodage WMA standard (GRAPHSTD) qu'en encodage WMA pro (GRAPHRO).

difs

GRAPHST

GRAPHPRO

COMMENTAIRES DES CAPTURES D’ÉCRAN

Il s’agit de l’analyse spectrale de l’échantillon WAV en mode VBR dans ses six paliers, tant en WMA version standard (version 9.2) que professionnelle (version 10). Ledit échantillon est une bizarrerie sonore d’une seconde, formé d’un bruit blanc (piste gauche) de très faible volume associé à un bruit rose (piste droite) de volume plus haut. Ce choix a été dicté du fait que WMA est un format qui a du mal en débit variable de gérer ce type de signaux qui compliquent sérieusement son algorithme d’encodage. Dans les fichiers GRAPHST (captures d’écran WMA Standard) comme GRAPHPRO (captures d’écran WMA Professional), les deux premières captures d’écran sont celles du fichier WAV original.

 I. Analyse du WMA standard (v. 9.2)

Quel que soit le mode VBR utilisé, il est aisé de constater que le WMA standard a du mal à respecter correctement le son soumis à son encodage : il manque dans tous les cas 100 ms de signal en début de fichier, remplacées par un silence. Est-ce une mauvaise gestion des « transients » (attaques brusques et brèves) ou un temps de pré-analyse du signal rendu long à cause de la complexité de ce dernier ? Aux spécialistes de répondre. Quoi qu’il en soit, il s’agit d’une anomalie, d’un irrespect du son original, même si le silence peut ne pas être audible.

Par ailleurs, vu la nature chaotique du signal soumis à encodage, les débits binaires sont très élevés, trop élevés même, l’algorithme tentant de gonfler le bitrate pour maintenir le niveau de qualité qui lui est assigné.

Enfin, le signal est amplifié lors de la conversion, tous modes VBR confondus.

1. WMA VBR 98

La vitesse de transmission moyenne, qui est de 676 kbps, est la plus grande jamais atteinte par un codec purement lossy, largement supérieure à l’intervalle théorique fixé par Microsoft (240-355 kbps) ! En outre, on remarque le lowpass à 20 kHz.

2. WMA VBR 90

Le débit de 346 kbps est également assez haut (valeurs théoriques comprises entre 135 et 215 kbps). Le son se dégrade à partir de 15,9 kHz et s’effondre aux alentours de 18,8 kHz, ce qui est exceptionnel en ce mode VBR qui a coutume de respecter assez fidèlement le signal original jusque 18 kHz. Surement une étrangeté commandée par le modèle psycho-acoustique qui estime (à tort ou à raison) qu’avec ce genre de bizarrerie sonore, l’oreille ne percevra pas de différence si le signal est atténué de la sorte.

3. WMA VBR 75

Au lieu de la fourchette 85-145 kbps théorisée par les ingénieurs de la firme de Redmond, la vitesse de transmission moyenne de 255 kbps n’est pas négligeable. Elle est même excessive pour un mode qui coupe, comme ici, le son à 15,5 kHz.

4. WMA VBR 50

Atteindre le bitrate de 129 kbps (au lieu, pour des sons « normaux », de la marge 50-95 kbps) est honteux pour un format audio en 2010 dont le lowpass en ce mode est à peine de 13,2 kHz. Je pense, sans trop m’y connaître, qu’il y a moyen, pour ce type de signal, de programmer l’encodeur en lui permettant d’accepter une certaine distorsion en diminuant le débit, distorsions qui, j’en suis convaincu, ne sera pas audible. Cette remarque vaut d’ailleurs pour les deux modes VBR susmentionnés.

5. WMA VBR 25

L’écart de débit avec le mode précédent n’est pas terrible : à peine 20 kbps de moins. Cela peut s’expliquer par le lowpass de WMA VBR 25 qui est très voisin de WMA VBR 50 : 13 kHz pour l’un, 13,2 kHz pour l’autre. Toutefois, en VBR 25, le manque de respect des signaux résiduels de haute fréquence est plus prononcé, ce qui est un signe évident de déformation, généralement audible dans la musique courante. Comme je l’ai toujours écrit, il s’agit du mode VBR le moins abouti du WMA standard, dont la raison d’être ne se justifie guère.

6. WMA VBR 10

Le bitrate moyen de 98kbps est une aberration pour un mode qui coupe les fréquences à 12,1 kHz. Le MP3, en mode ABR, fait mieux à 96 kbps en coupant à environ 15,4 kHz, certes avec des distorsions, mais moins qu’ici.

 II. Analyse du WMA Professional (v. 10)

Le mode VBR du WMA Pro fonctionnant en de hautes résolutions (24 bits), la précision de l’analyse du signal audio est plus grande, ce qui fait que les bugs d’encodage sont nettement minimisés. Ainsi, fini le silence de 100 ms en début de fichier, quel que soit le mode VBR.

Toutefois, à l’instar du WMA standard, les débits binaires moyens sont élevés, mais nettement moins que celui-là. Cela peut indiquer que les algorithmes du WMA Pro traitent plus efficacement les signaux redondants ou, du moins, usent d’astuces plus sophistiquées de réduction de bits.

1. WMA VBR 98

La vitesse de transmission de 486 kbps rappelle quelque peu le mode q10 du format Ogg Vorbis qui crée des fichiers de débits moyens aux alentours de 500 kbps. Tout comme le Vorbis, WMA Pro en ce mode VBR crée un audio quasi sans perte, dépourvu de saturations ou d’affaissements, avec un spectre identique à l’original. En mon sens, ce palier peut valablement remplacer un encodage lossless.

2. WMA VBR 90

Hormis un débit un peu plus bas que le mode précédent (324 kbps), débit du reste très raisonnable, le signal est respecté, tout comme en VBR 98, presque à l’identique de l’original. Ce palier également peut valablement remplacer un encodage lossless.

3. WMA VBR 75

L’irrespect par rapport à l’original débute en ce mode VBR. En effet, à l’instar du WMA standard, le signal original semble amplifié. Cette anomalie entache également tous les modes VBR inférieurs. Cependant, la coupure à 18,6 kHz est acceptable pour la vitesse de transmission de 213 kbps.

4. WMA VBR 50

Le lowpass de 15,9 kHz est meilleur qu’en WMA standard en ce palier de qualité, mais n’est pas fameux si on a en face la concurrence des autres formats de compression récents (MP3 avec LAME, Vorbis, AAC) qui, pour le débit concerné (155 kbps), coupent tous aux alentours de 18 kHz.

5. WMA VBR 25

Le bitrate de 142 kbps, proche de celui engendré par VBR 50, s’explique par une fréquence de coupure très similaire à ce dernier (15,8 kHz). L’analyse spectrale révèle par ailleurs une mauvaise gestion des fréquences résiduelles qui paraissent comme hâchées. Décidément, les développeurs du format ont eu quelques ennuis avec ce palier VBR. Néanmoins, la distorsion par rapport au WMA standard est moins gênantes (juste un léger excès d’aigues).

6. WMA VBR 10

Les ingénieurs à Billou ont retuné ce mode lors de la sortie de XP SP3. Jusqu’en 2006, il tronquait les fréquences au-delà de 12,9 kHz. Depuis 2008, son lowpass a spectaculairement augmenté, atteignant 20 kHz pour un bitrate de 129 kbps ! Ça sent l’artifice, la synthèse des hautes fréquences de type SBR et compagnie et c’est trop beau pour être vrai : le signal WAV n’est pas respecté. Hormis l’amplification susmentionnée, une observation attentive du spectre montre des disparités par rapport aux deux modes VBR directement précédents. Par curiosité, je me suis proposé d’auditionner un extrait de musique « ordinaire » (une R&B du groupe Mis-Teeq) encodé en ce palier. Certes, le son est net, mais la métallisation assez remarquable, presque déplaisante. WMA VBR 10 est un mode cobaye dont je déconseille d’user.