RIP DE CD : POUR EN FINIR AVEC LE "BITPERFECT"

 

Objectif :


Essayer de déterminer si certains logiciels d’extraction peuvent effectivement prétendre au label « bit-perfect », c’est-à-dire garantir de façon certaine que le fichier extrait est strictement identique au contenu du CD. Le deuxième objectif est de déterminer si certains logiciels sont capables de corriger les erreurs de lecture engendrées par une surface de CD endommagée et de mesurer à quel point ces logiciels sont capables de corriger ces erreurs.


En effet, lassés de lire tout et son contraire au sujet de ces logiciels qui prétendent tous être meilleurs que les autres et qui revendiquent – pour certains – ce fameux label « bit-perfect », nous avons souhaité réaliser des tests par nous-mêmes afin d’en tirer nos propres conclusions.

Il convient de préciser en préambule que ces tests n’ont pas de valeur scientifique, ni de caractère exhaustif. Il ne s’agit que de quelques échantillons que nous considérons comme représentatifs des cas qui peuvent se présenter à qui souhaite dématérialiser sa CDThèque et dont les CD ne sont pas tous en parfait état.

Enfin, cet article est, par nature, assez technique et assez long. Il ne concernera que les personnes qui souhaitent aller au fond des choses sur ce sujet.

Echantillons utilisés pour l’extraction :

CD 1 : excellent état, pistes 4 et 11
CD 2 : quelques rayures légères, pistes 7 et 13
CD 3 : plusieurs rayures légères et traces de doigts, piste 9

L’extraction a été réalisée sur le même PC, à l’aide des dernières versions des logiciels suivants, choisis parmi les plus courants :

• Audiograbber v1.83
• dBpoweramp R13.3
• EAC v0.99 prebeta 5
• Foobar2000 v1.0.3
• iTunes v9.2.0.61
• Winamp v5.58

NB : avec iTunes, les fichiers ont été extraits une fois avec la correction d’erreur désactivée et une fois avec la correction d’erreur activée.

Le format d’extraction choisi est le WAV, sans aucun tag pour être certain que le contenu des fichiers ne pourrait pas varier à cause des tags.

Premier constat :

La taille des fichiers extraits ne varie pas d’un logiciel à l’autre et ce, quel que soit l’état du CD.

 

 Tailles des fichiers

 

Nous avons donc voulu savoir si, malgré une taille de fichier identique, le contenu était identique également. Pour cela, nous avons d’abord calculé un code CRC de chaque fichier selon 3 méthodes (CRC32, MD5 et AccurateRip). Cette méthode permet seulement de savoir si les fichiers sont rigoureusement identiques ou non. En effet, le principe d’un code CRC est qu’il est unique pour un contenu donné. Si un seul bit de données est différent, le code CRC sera différent.

Deuxième constat :

dBpoweramp et EAC (Groupe 1) génèrent à chaque fois des fichiers parfaitement identiques. Audiograbber, Foobar, iTunes (avec et sans correction d’erreur) et Winamp (Groupe 2) génèrent également à chaque fois des fichiers rigoureusement identiques (à une exception près, voir ci-dessous). En revanche, le premier groupe de logiciels et le second génèrent à chaque fois des fichiers qui sont différents.

Il y a eu une exception sur le CD 3 : une première fois, Audiograbber a généré un fichier différent des autres logiciels de son groupe mais lors d’une seconde extraction, il a généré le même fichier que le reste du groupe.

Nous avons donc poussé les tests en réalisant les extractions plusieurs fois de suite sur la piste du CD 3 (le plus rayé) et sur deux PC différents. A part l’exception rencontrée initialement avec Audiograbber, les résultats ont été à chaque fois les mêmes, avec les mêmes code CRC.

Troisième constat :

Sauf exception sur un CD assez endommagé, les logiciels sont capables de faire plusieurs fois de suite la même extraction et ce, sur des PC et des lecteurs de CD différents.

 

Codes CRC

 

Ensuite, nous avons voulu essayer de déterminer à quel point les fichiers étaient différents les uns des autres. Nous avons donc utilisé tout d’abord le logiciel Audio Comparer 1.5. Ce logiciel – qui a un mode de fonctionnement qui n’est pas détaillé – permet en principe de déterminer si deux fichiers audio sont identiques ou seulement proches. Le résultat est exprimé sous la forme d’un pourcentage de « ressemblance ».

Nous avons pris comme fichiers « référents » les fichiers du groupe 1 et nous les avons comparés successivement aux fichiers du groupe 2.

Le résultat de cette comparaison indique pour tous les logiciels du groupe 2 :

CD1 : 100% sur les deux pistes
CD2 : 98% sur la piste 7 et 99% sur la piste 13
CD3 : 100% sur la piste 9

 

Audiocomparer

 

Ce résultat est étonnant car les différences trouvées l’ont été sur le CD légèrement rayé, alors que sur le CD le plus rayé, il ne constate pas de différence. Par ailleurs, le degré de précision (en pourcentages entiers, sans décimales) nous a paru insuffisant. Nous avons donc souhaité effectuer une comparaison plus précise du signal audio lui-même.

Pour cela, nous avons utilisé la fonction « Compare WAV » du WAV Editor de EAC.

Cette fonction met en évidence des différences (erreurs) entre les fichiers issus du groupe 1 et ceux issus du groupe 2. A chaque fois, soit il y a le message « missing sample » soit le message « repeated samples » et l’endroit où le problème se trouve sur le fichier. Le souci, c’est que le logiciel ne précise pas à quel point ces différences sont importantes ou non, à part le nombre de samples concerné. Nous avons donc voulu trouver un outil qui permette une analyse plus fine.

Pour cela nous avons utilisé un logiciel d’analyse de spectre audio (Sigview 2.2.1) qui a la particularité de proposer des fonctions de comparaison entre deux fichiers audio.

Ce logiciel propose plusieurs fonctions de comparaison et nous avons utilisé celle qui nous a paru la plus simple pour mettre en évidence les différences entre fichiers : la soustraction des signaux. Selon ce principe, lorsque l'on soustrait deux signaux parfaitement identiques, ces deux signaux s'annulent complètement. Dans ce cas, notre logiciel affiche une droite à 0 sur la totalité de l'échantillon.

Nous avons donc comparé un échantillon (CD 1 – piste 4) issu du groupe 1 avec un échantillon issu du groupe 2. Le résultat montre une courbe extrêmement torturée, comme si les deux échantillons étaient totalement différents.

 

Différences avant alignement

 

Ce premier résultat nous a laissé perplexes. Nous avons donc utilisé un logiciel (Sonic Visualizer v 1.7.2) permettant d’éditer les deux échantillons avec un niveau de détail très élevé. Nous avons alors constaté que les deux échantillons présentent un décalage dans le temps. Les échantillons du groupe 2 débutent toujours un peu en retard par rapport à ceux du groupe 1, jusqu’à plus d’une seconde de décalage (ex : CD 2 – Piste 7). Cela semble confirmer le diagnostic de la fonction « Compare Wav » de EAC qui signalait des samples manquants en début d’échantillons mais cela paraît un peu étonnant.

Décalage temporel

 

Quatrième constat :

Les logiciels ne démarrent pas tous l’extraction au même moment. Il peut y avoir des écarts de plus d’une seconde. Il est probable que ce phénomène soit dû à un problème de décalage d’offset du lecteur de CD, lequel peut être évalué et pris en compte automatiquement par les logiciels du groupe 1 et non par les logiciels du groupe 2 (parfois partiellement ou manuellement).

Ce phénomène ne nous a pas facilité les choses car, pour obtenir des résultats cohérents, nous avons dû recaler les échantillons dans le temps pour qu’ils démarrent exactement au même moment.

Recalage temporel

Nous avons ensuite refait la comparaison entre échantillons avec la fonction de soustraction et nous avons pu mettre en évidence que les différences observées étaient dues au décalage temporel. En effet, une fois les échantillons recalés, la soustraction des échantillons donne bien une valeur nulle sur la totalité de la piste.

Cinquième constat :

Sur des CD en bon état ou légèrement rayés, tous les logiciels testés donnent le même résultat, sans la moindre différence entre les échantillons.

P04_Diff_Apres_Alignement.jpg

 

 P09_Diff_Apres_Alignement.jpg

 

Premières conclusions :

Quelles premières conclusions pouvons-nous tirer de ces différents tests ?

Il apparaît clairement que les logiciels d’extraction appartiennent à deux catégories distinctes :

• Ceux qui utilisent des process de relecture/correction avancés et un paramétrage permettant de prendre en compte tout ou partie des spécificités du lecteur de CD (offset). Ces logiciels sont, en outre, compatibles avec la technologie AccurateRip. Ce sont les logiciels du groupe 1 (dBpoweramp et EAC).

• Ceux qui n’utilisent pas ces process et ces paramétrages. Ce sont les logiciels du groupe 2 (Audiograbber, Foobar2000, iTunes et Winamp). Curieusement, l’un d’eux (Foobar2000) annonce être compatible AccurateRip mais ne fournit pas les mêmes informations que les logiciels du groupe 1.

Pour autant, sur des CD en bon état ou comportant de légères rayures, tous ces logiciels donnent un résultat absolument identique, au décalage temporel près mais qui n'a pas d'incidence sur le contenu musical).

Ce point est plutôt rassurant car le résultat obtenu ne sera pas dépendant du logiciel utilisé pour l'extraction sur des CD en bon état et semble même indiquer qu'il est possible d'envisager de qualifier ces différents logiciels de "bit-perfect"...

Une question se pose alors : Obtiendrait-on les mêmes résultats avec des CD plus endommagés ?

Pour tenter de les départager, il est possible d’effectuer un test simple : numériser une piste d’un CD en bon état, endommager le CD (rayures, traces de doigts), re-numériser la même piste et voir quel groupe est le plus proche du l’échantillon extrait du CD en parfait état. Cela permettra de voir si certains logiciels sont capables de mieux corriger les défauts présents sur un CD et donc, s’ils sont globalement plus fiables.

Nous avons donc utilisés le CD fourni par Diapason ce mois-ci (quitte à sacrifier un CD…). Ce CD était parfaitement neuf et n’avait jamais été écouté.

Première étape : CD en parfait état.


Ce premier test ne permet donc pas de départager les deux groupes. Tous les échantillons donnent des résultats identiques.

Différence entre tous

 

Deuxième étape : CD légèrement rayé.

Nous avons utilisé une éponge scotch-brite et nous avons légèrement rayé le CD, puis nous avons à nouveau extrait la même piste avec les différents logiciels. Ce second test a donné les mêmes résultats que le premier : tous les échantillons donnent des résultats strictement identiques. Ce test confirme donc le test effectué avec le CD3 - qui était également légèrement rayé - et ne permet toujours pas de départager les logiciels entre eux.

Différence entre tous

Troisième étape : CD très rayé

Ne reculant devant aucun sacrifice, nous avons réutilisé notre éponge et avons rayé un peu plus le CD en ajoutant des rayures circulaires qui sont beaucoup plus difficiles à gérer à la lecture de par la structure des données redondantes stockées sur un CD, réparties de manière décalée sur la surface du CD, justement, pour limiter l’impact de rayures droites (du centre vers le bord). Néanmoins, ces rayures n’étaient pas plus nombreuses ou plus profondes que celles vues sur certains CD ayant été souvent écoutés dans un auto-radio ou ayant été stockés en dehors de leur boite. Nous en avons vu souvent des beaucoup plus rayés que cela (il s’agit de rester dans un cadre réaliste, tout de même !).

Là, les chose se sont sérieusement compliquées…

Nous avons remarqué que nous obtenions enfin des résultats différents au sein d’un même groupe de logiciels. Ce premier résultat nous a donc incité à effectuer plusieurs extractions de la même piste avec chaque logiciel pour voir si, d’une extraction à l’autre, nous obtenions les mêmes résultats. Nous n’avons pas été déçus…

En résumé, nous obtenons les résultats suivants :


• les logiciels du groupe 1 ont obtenu strictement le même résultat sur le CD en parfait état, le CD légèrement rayé et le CD très rayé, y compris sur les 3 extractions effectuées sur ce CD. Pour le test du CD très rayé, nous avions paramétré ces deux logiciels en mode « ultra-secure » pour dbPoweramp et en mode « error recovery quality medium » pour EAC. Ces deux logiciels ont extrait cette piste en, respectivement, 5 min 30 s et 9 min 30 s en moyenne.

• Les logiciels du groupe 2 ont obtenus des résultats systématiquement différents entre eux mais aussi, entre chacune des 3 extractions du CD très rayé. Autrement dit les 15 extraction au total ont donné 15 résultats différents dont aucun, sauf un, n’était commun aux extraction du CD en parfait état. Seul Foobar2000, sur une de ses trois extractions, a trouvé un résultat identique à celui du CD en parfait état. Il faut également noter que iTunes, utilisé avec et sans correction d’erreur, a cette fois obtenu des résultats différents à l’extraction, ce qui n’avait pas été mis en évidence jusque là. En moyenne, ces logiciels ont extrait la piste dans un temps de 21 sec pour iTunes et Audiograbber, 40 s pour Winamp et 1 min 40 s pour Foobar2000.

Codes CRC CD en très mauvais état

Que pouvons-nous en conclure à ce stade ?



Nous pouvons en conclure que les logiciels du groupe 1 ont la capacité de corriger des erreurs importantes de lecture pour obtenir le même résultat qu’un CD en parfait état.

Nous pouvons également en conclure que les logiciels du groupe 2, n’ont pas cette capacité et que plusieurs extractions de la même piste donnent des résultats différents.

Toutefois, nous avons vu que des différences de codes CRC pouvaient ne pas être significatives, compte tenu du décalage temporel qui peut exister entre les échantillons. Il est donc trop tôt pour en tirer des enseignements définitifs.

Nous avons donc voulu savoir à quel point les extractions effectuées par les logiciels du groupe 2 sur le CD très rayé étaient différentes de l’extraction effectuée à partir du CD en parfait état.

Nous avons donc recalé dans le temps les différents échantillons et nous avons comparé, pour chaque logiciel, les trois extractions réalisée à partir du CD très rayé à celle effectuée à partir du CD en parfait état pour mesurer le niveau moyen des différences avec celui-ci. Cette comparaison ayant pour objectif de déterminer la capacité de chaque logiciel à corriger efficacement les erreurs de lectures réalisées sur un CD endommagé.

Comparaison des 3 échantillons dBpoweramp avec l'échantillon du CD en parfait état

Comparaison des 3 échantillons dBpoweramp avec l'échantillon du CD en parfait état

Comparaison des 3 échantillons EAC avec l'échantillon du CD en parfait état

Comparaison des 3 échantillons EAC avec l'échantillon du CD en parfait état

Comparaison des 3 échantillons Foobar2000 avec l'échantillon du CD en parfait état

Comparaison des 3 échantillons Foobar2000 avec l'échantillon du CD en parfait état

Comparaison des 3 échantillons Audiograbber avec l'échantillon du CD en parfait état

Comparaison des 3 échantillons Audiograbber avec l'échantillon du CD en parfait état

Comparaison des 3 échantillons iTunes (sans correction d'erreurs) avec l'échantillon du CD en parfait état

Comparaison des 3 échantillons iTunes (sans correction d'erreurs) avec l'échantillon du CD en parfait état

Comparaison des 3 échantillons iTunes (avec correction d'erreurs) avec l'échantillon du CD en parfait état

Comparaison des 3 échantillons iTunes (avec correction d'erreurs) avec l'échantillon du CD en parfait état

Comparaison des 3 échantillons Winamp avec l'échantillon du CD en parfait état

Comparaison des 3 échantillons Winamp avec l'échantillon du CD en parfait état

Résumé et Conclusion : "Bit-Perfect", oui mais... pas tous.

 

Ces différents test mettent en évidence plusieurs points intéressants :

* les différents logiciels n'utilisent pas tous les mêmes techniques d'extraction des pistes d'un CD et semblent pouvoir être classés en deux groupes, d'après le premier résultat des codes CRC :

          - Groupe 1 : Exact Audio Copy et dBpoweramp
          - Groupe 2 : Audiograbber, iTunes, Foobar2000 et Winamp

* en poussant l'analyse, l'on s'aperçoit que les écarts de codes CRC peuvent être dus à un décalage temporel au début de l'échantillon.

* après recalage dans le temps des échantillons, l'on constate que le contenu extrait est rigoureusement identique avec tous les logiciels testés, tant que le CD est en relativement bon état.

* en revanche, lorsqu'un CD est endommagé (nombreuses rayures, même légères), les logiciels du groupe 2 sont incapables :

          - d'extraire les pistes avec un résultat constant et ce résultat est variable d'une extraction à l'autre
          - de corriger efficacement les erreurs de lecture, avec un niveau de correction, là-aussi, variable d'une extraction à l'autre.

sauf pour le logiciel Foobar2000 qui, après recalage de son échantillon, est capable de proposer des résultats absolument identiques à ceux des logiciels du groupe 1 qu'il peut donc intégrer.

L'on constate également, que Itunes ne propose plus le même résultat d'extraction lorsque la correction d'erreurs est activée ou non, sans pouvoir déterminer précisément lequel de ces modes est le plus efficace.

* a contrario, toujours lorsqu'un CD est endommagé, seuls les logiciels du groupe 1 sont capables :

          - d'extraire les pistes avec un résultat constant (voir test de l'extraction multiple de la même piste), sauf pour Foobar2000 qui génère un décalage temporel en début d'extraction mais qui n'a pas d'incidence sur le résultat final après recalage.
          - d'extraire les pistes exactement comme si le CD n'était pas endommagé et donc, de corriger efficacement les erreurs

Il est donc possible de conclure que, parmi les logiciels testés, seuls les logiciels dBpoweramp, Exact Audio Copy et Foobar2000 peuvent être qualifiés de "Bit-Perfect" puisque ce sont les seuls à proposer un résultat strictement identique quel que soit l'état du CD.

Les autres logiciels : Audiograbber, iTunes (avec ou sans correction d'erreur) et Winamp ne peuvent prétendre au label "Bit-Perfect" puisqu'ils ne sont pas capables de proposer un résultat constant et identique lorsqu'un CD est endommagé.

 


Suivez-nous sur Facebook