CONSIDERATIONS DIVERSES SUR LE NUMERIQUE EN AUDIO
Depuis l’avènement du “numérique”, la compréhension des techniques de la reproduction musicale à été radicalement modifiée, comme dans beaucoup d’autres domaines.
Le marketing gagne à fausser cette compréhension par la mise en avant des paramètres positifs d‘obtention aisée, en occultant souvent l’essentiel plus difficile ou coûteux à mettre en œuvre. Ainsi en photographie, on parlera rarement de la provenance d’un objectif, qui ne laissera pourtant passer rien de bon s’il est quelconque, et cela quel que soit le nombre de pixels (la résolution) disponibles. Nous sommes entré dans la génération de l’informatique, dans laquelle seule la rapidité et le stockage sont les données devenues essentielles de ce que l’on croit être le bon choix (et dans ce domaine aussi, le raisonnement est très sommaire)
Ces pages ont pour but de permettre au mélomane de dissocier dans les informations lues tant sur des brochures publicitaires que dans des articles critiques, ce qui peut avoir un rapport avec la musique de ce qui n’en a pas, et surtout de ne plus porter aucun intérêt aux surenchères techniques tant de fois rencontrées.
Il y a un minimum de connaissances utiles simples et élémentaires, acceptons-les dans le même état d’esprit de celui qui aime savoir à peu près comment fonctionne le moteur de la voiture qu’il utilise tout les jours.
La première partie traitant de la conversion analogique/numérique a pour but de rappeler les principales terminologies rencontrées; elle pourra être survolée par tous ceux qui les connaissent déjà bien.
AVERTISSEMENT
Ce texte ne se veut ni polémique, ni publicitaire, ni réactif, ni pédagogue, juste informatif. Il se préoccupe des techniques utilisées pour l’enregistrement et la lecture des compacts discs uniquement, l’intérêt porté à d’autres supports n’étant à débattre qu’après la bonne compréhension de ces bases, puisqu’elles leur sont communes.
Il est rédigé sous la responsabilité de l’auteur qui recevra avec plaisir toute information complémentaire ou contradictoire afin de le corriger. Il sera fait allusion à des techniques ou des composants dont la liste ne peut être exhaustive, ceux ci étant en continuelle évolution; les labels déposés sont la propriété de leurs dépositaires.
La reproduction de ce texte est libre si elle est complète et sous réserve d’être accompagnée de la référence précise à son origine.
LA TRANSFORMATION D’UN SIGNAL AUDIO EN DONNEES NUMERIQUES
Le signal audio est la traduction électrique des pressions acoustiques qui s’exercent à des fréquences variées, essentiellement rassemblées dans ce que l’on appelle le spectre audio, défini grossièrement de 20Hz à 20 KHz.
Ce spectre englobe les fréquences fondamentales des instruments de musique et des voix humaines, ainsi que la majeure partie des harmoniques qui en sont issues.
Rem 1. La limitation du spectre audio à (plus ou moins) 20 kHz est effective à tous les niveaux du traitement sonore pour des raisons tant mécaniques qu’électroniques.
Elle est particulièrement violente à 15 KHz pour la radio modulation de fréquence, 19 KHz pour la radio numérique ou 22 KHz pour le CD audio, brutale au delà de 22 kHz sur la majorité des haut parleurs.
La conversion numérique consiste à relever cycliquement le niveau de ces pressions pendant un instant aussi bref que possible. Ce prélèvement se traduit par un nombre exprimé suivant un code binaire (1 donne 1, 2 donne 10, 3 donne 11, quatre donne 100 etc.)
Le nombre prélevé est l’échantillon
La fréquence du cycle de prélèvement est la fréquence d’échantillonnage.
rappel
Un nombre exprimé en binaire n’utilise comme chiffres que le 0 et le 1; chaque chiffre supplémentaire multiplie par deux les valeurs possibles avant lui; ainsi, 2 chiffres peuvent représenter 0 à 3 (4 nombres), un de plus 0 à 7 (8 nombres), un de plus 0 à 15 (16 nombres) etc.
Chaque chiffre, n’ayant que deux états possibles, 0 ou 1 est appelé bit. A l’origine il a été défini que 16 bits et 44,1 KHz étaient nécessaires -et suffisants- pour obtenir une reproduction dont la qualité de définition surpasserait tous les autres procédés employés. Une valeur exprimée sur 16 bits peut représenter un nombre maximum de 2 puissance 16 soit 65536 valeurs parfaitement différentiées possibles.
Rem 2: La conversion numérique effectuée pour obtenir un signal numérique au standard CD est et sera toujours effectuée avec une résolution maximale de 16 bits et une fréquence d’échantillonnage de 44, 1 KHz quelque soit le procédé d’enregistrement employé en amont.
La conversion numérique devant servir à de nombreuses utilisations, il s’est avéré vite nécessaire de rajouter à la simple valeur de l’échantillon d’autres informations d’utilisation des données afin de les normaliser. Aussi,16 bits supplémentaires ont été réservés à cette fin. Un échantillon audio se compose donc de 32 informations successives, 0 ou 1.Il est suivi par un autre en alternance pour traiter un signal stéréophonique.
Rem 3:Tous les éléments numériques destinés à l’audio traitent toujours, depuis l’origine, l'information sur 32 bits.
QUEL INTERET PEUT AVOIR UNE CONVERSION NUMERIQUE, ET QUE PEUT IL EN RESULTER
Le principal intérêt de la transformation d’un signal analogique en signal numérique réside dans la facilité avec lequel ce dernier pourra être stocké, transformé et véhiculé parce qu'il n’a que deux états, tout ou rien, et que donc toute pollution qui n’atteindrait pas le niveau 1 peut être considéré au niveau 0 et donc inexistante.
L’ennui, c’est que le tableau se gâte à tous les niveaux de l’utilisation de ce signal.
Les limites du standard 16 bits 44,1 KHz sont de loin les paramètres les moins importants en jeu, car si il n’y avait que celles ci, le résultat serait effectivement de très loin supérieur à toute autre technologie. Il est donc essentiel de connaître le fonctionnement de la chaîne analogique / numérique / analogique à tous ses niveaux pour comprendre où se situent les pièges, comment et par quelles approximations ils sont contournés, avant de vouloir mettre en cause un standard encore largement sous exploité et vouloir le remplacer par un autre qui ne se préoccuperait pas d’avantage des problèmes fondamentaux.
LA TECHNIQUE DE LA CONVERSION ANALOGIQUE / NUMERIQUE DU CD
Le choix de l’échantillonnage
La valeur de 44,1 KHz n’est pas choisie par hasard; elle correspond au minimum nécessaire et suffisant pour définir correctement une information jusqu’à 20 KHz, tout en ayant un rapport exact avec un standard de télévision.
Il faut savoir que le premier problème rencontré en numérique est que la conversion produit une image répétitive du spectre que l’on numérise de part et d’autre de la fréquence d’échantillonnage retenue. Il faut donc que celle ci soit au moins le double de la plus haute fréquence à reproduire pour que cette image ne vienne pas polluer le spectre initial puisque alors elle le suit directement. Pour la même raison, le spectre initial devra être radicalement limité à la moitié de cette fréquence pour que le problème ne soit pas posé en sens inverse. Une marge de manœuvre de 10% est allouée à la zone à partir de laquelle commencera le filtrage des ces images, un filtre total n’étant pas réalisable, d’ou le choix d’une fréquence minimale de 44 KHz.
Dans l’absolu, la fréquence maximale reproduite correctement étant inférieure à la moitié de la fréquence d’échantillonnage, il est évident que plus celle ci sera élevée, plus la bande passante du spectre audio sera large.
Dans la réalité, cela entraîne d’autres problèmes dont les effets peuvent altérer d’avantage la restitution sonore et rendre ce choix inopportun.
On a souvent utilisé l’image désuète d’une sinusoïde en forme de marches d’escalier afin d’expliquer le fonctionnement de la conversion analogique / numérique. Les temps de réponse et l’intégration effectuée par le convertisseur rendent cette image inintéressante puisque sur cette sinusoïde justement, une résolution supérieure ou un échantillonage supérieur ne changeront pratiquement rien.
Rem 4: Le principe même de la numérisation veut qu’il n’y a ait aucune information audio sur un cd qui soit exploitable au delà de 20 KHz; un résidu d’harmonique qui subsisterait et serait lu serait entaché de distorsions rédhibitoires.
Le choix de la résolution
Le principe de la conversion numérique n’est pas idéal, loin s’en faut. Une production de parasites, appelés bruit de quantification, est inversement proportionnelle à la résolution adoptée. En dehors d’une chambre sourde, on peut considérer qu’un rapport entre la modulation et les bruits résiduels (rapport signal bruit) supérieur à 90 dB produit un signal résultant inaudible et donc n’altère pas la perception des détails. Une quantification sur 16 bits entraînant un bruit de quantification de - 95 dB a donc été retenue.
Il faut comprendre que au final, autant du fait que le convertisseur intègre ses données avec une certaine limite de vitesse afin de régulariser le résultat, que du fait de l’inertie de tous les éléments d’une chaîne audio du microphone aux haut parleurs, une résolution de 16 bits permet une restitution des subtilités d’un message musical au moins identique à toute autre technique. La faculté dynamique de passer en 20 microsecondes du niveau minimal au niveau maximal est inégalée par la plupart des composants mécaniques du système audio. Le rapport signal bruit qui conditionne la perception des détails est supérieur à celui de l’ensemble de l’électronique située en amont et en aval.
Rem 5: Un rapport signal bruit incontournable existe sur un CD audio. Il est au minimum de 95 dB, bruit de quantification du 16 bits
Ces limites étant fixées, Il est alors important de s’interroger sur la linéarité du convertisseur et son comportement en présence d’une horloge de synchronisation incertaine, deux facteurs essentiels au bon résultat sur les signaux faibles si nombreux dans un message musical.
L’horloge principale
Un convertisseur n’est rien d’autre qu’un microprocesseur gérant des informations binaires en flot continu. Il va nécessiter un signal permettant de synchroniser toutes les opérations qu’il effectue, cadencé au minimum en rapport à la plus petite information, soit le bit. Suivant son mode de fonctionnement, et il en existe de nombreux différents les uns des autres, sa fréquence va être multipliée par un facteur lui permettant d’effectuer d’autres opérations. Ce signal est généré par l’horloge principale, qui a donc une fréquence multiple de la fréquence d’échantillonnage multipliée elle même par le nombre de bits. De l’exactitude de sa fréquence dépendra la justesse de la hauteur des sons dont l’importance n’est appréciée que par ceux qui prétendent avoir l’oreille absolue. Ses variations de fréquence minimes mais permanentes auront par contre un effet désastreux sur la conversion et engendreront des distorsions à bas niveaux non négligeables: l’effet “jitter”.
Rem 6: Ce n’est pas l’exactitude de l’horloge qui est importante, mais sa stabilité dans les espaces temps infinitésimaux.
Le convertisseur
Il existe plusieurs techniques de conversion analogique/numérique, dont la description n’est pas le but de ces pages.
Il est regrettable qu’aucune information ne soit donnée à l’utilisateur sur la chaîne de traitement utilisée de l’enregistrement jusqu’à la fabrication du CD. La plupart du temps on ne connaît même pas le nom du preneur de son.
Retenons simplement que des traitements trop nombreux et de plus en plus préjudiciables sont opérés avant la fabrication d'un CD. Cela explique sans doute le pourquoi de la qualité de vieux pressages réalisés à partir d’enregistrements analogiques ou un seul traitement intermédiaire suffisait. Comme il existe aussi d’excellents enregistrements numériques, c’est bien les traitements numériques successifs qu’il faut mettre en cause, s’interroger donc sur leurs limites, et conclure qu'il faut éviter toute “cuisine” numérique soit disant parfaite alors qu’elle serait superflue.
LA LECTURE DU SIGNAL AUDIONUMERIQUE
Le support
Le disque compact s’est largement imposé par ses qualités et son coté pratique. Il n’en demeure pas moins un élément très perfectible. Il ne faut jamais oublier ce qu’il y a dessus, et comment les données sont récupérées et restituées. Contrairement à un traitement informatique, ou un très puissant microcontrôleur peut restaurer à presque 100% des données incomplètes parce qu’il travaille avec des contraintes de temps et d’espace élastiques, la lecture d’un disque CD se fait pratiquement en temps réel, et le support ne contient que 25% d’informations dites redondantes destinées à d’éventuelles corrections. Lorsqu’une information est lue incorrectement, si des informations redondantes ne sont pas immédiatement exploitables, le lecteur va purement et simplement remplacer ce qu’il n’a pas trouvé par un produit de son cru, assez trivial car il n’est pas conçu pour faire mieux. Comme il met un certain temps à analyser l’étendue du problème posé, et définir l’opération à effectuer, pour un chiffre non lu et non immédiatement recouvrable, il remplacera tout un espace temps par une information digitalisée, issue des informations latérales. L’auditeur ne s’apercevra de rien si cela n’arrive pas trop souvent.
Il est facile de penser que si le disque est malpropre ou la mécanique entachée de vibrations même infinitésimales, ce qui est minime deviendra vite intolérable. Le disque compact contenant plus de 5 milliards d’informations binaires, ces phénomènes sont beaucoup plus important qu’on n’aimerait le croire.
Dans le cas d’un DVD ou d’un SACD, on passe de 5 milliards d’informations à 50 milliards, et la surface des informations redondantes est limitée à 15%. Les fenêtres de temps de remplacement sont voisines. Arithmétiquement, les erreurs sont multipliées par 10; que peut on attendre du résultat?
Rem 7: Très souvent les SACD contiennent une piste CD. Il est inquiétant de constater presque toujours que celle ci lue sur un lecteur CD est moins bonne que le CD simple, lorsque son édition existe. Cela implique que la comparaison CD/SACD à l’aide du même disque SACD est absurde. Il en est de même pour celle faite avec des disques distincts sur le même appareil, les machines multi-plateforme ayant de plus en plus un convertisseur unique inapproprié au standard CD.
La lecture
Considérant ce qui précède, il est évident qu’une mécanique de qualité est indissociable de la subtilité du résultat que l’on veut obtenir. Il y aura a peu près la même différence entre un bon lecteur et un médiocre lisant un disque propre qu’entre un disque sale et un disque propre lu sur une bonne machine, le disque sale la rendant médiocre. En dehors de cette faculté d’extraire correctement les information, la conversion numérique / analogique et les étages qui la suivent vont avoir une importance tout aussi fondamentale sur le résultat sonore.
Rem 8: Les lecteurs utilisant des palets presseurs manuels ont en général une meilleure précision de lecture, les appareils à tiroir étant munis de palets dont le centrage est volontairement approximatif pour s’adapter à ce mode de fonctionnement. Les palets lourds ou à mise en place difficile sont à proscrire car ils ruinent rapidement la qualité des paliers du moteur et l’effet inverse de celui espéré est garanti.
Le lecteur, même lorsqu’il est utilisé avec un convertisseur externe (appelé “drive”) possède des étages numériques. Il gère tout le processus de l’analyse du faisceau laser, des erreurs de lecture et transforme le signal issu du CD qui a son standard propre en un signal numérique audio compatible sur 32 bits. L’importance de ces étages, et leur bonne alimentation, ont une part non négligeable sur la qualité du signal de sortie; l’aspect seulement mécanique du drive n’est donc pas l‘élément unique à vérifier.
LA CONVERSION NUMERIQUE / ANALOGIQUE
L’étage d’entrée
Suivant qu’il est extérieur ou non, le convertisseur est précédé ou non d’un microcontrôleur nécessaire pour lui fournir les 4 informations dont il a besoin, parce qu’il est toujours capable de convertir différents standards audionumériques dans lesquels les bits ne sont pas ordonnés de la même manière; ce sont:
-le signal d’horloge permettant de synchroniser ses divers étages
-le signal définissant le départ d’un échantillon correspondant au canal gauche puis droit
-le signal définissant les limites de l’échantillon
-le signal portant les bits de l’échantillon
Ce circuit génère le signal d’horloge à partir du flux numérique reçu. Sa fréquence est donc parfaitement multiple de celle du lecteur. Par contre la variation de cette fréquence est contrôlée par un circuit de régulation (VCR à boucle PPL) qui diminue considérablement l’effet jitter. Il peut aussi être piloté par une horloge externe qui pilote de façon unique tous les éléments numériques séparés, solution qui à l’inconvénient de liaisons délicates, la fréquence de l’horloge étant le plus souvent supérieure à 10 MHz.
Rem 9: La plupart des lecteurs ont une horloge interne ordinaire (un simple quartz sans contrôle annexe).L’adjonction d’un convertisseur externe équipé d’un régénérateur d’horloge soigné améliore la qualité de ce signal vis à vis du convertisseur, d’avantage que si l’horloge primaire était utilisée.
Le sur-échantillonnage et les filtres numériques
A ce niveau se situe l’erreur de compréhension la plus commune.
Comme dit plus haut, la conversion numérique véhicule dans son spectre complet une suite infinie des spectres audio centrés autour de sa fréquence d’échantillonnage puis de ses multiples. Dans le signal issu du CD, il va y avoir le spectre audio de 20Hz à 20 KHz, suivi de sa première image (miroir autour de 44,1KHz) à partir de 24 KHz puis d’une autre image de 44,1K à 64 KHz et ainsi de suite. Il est impératif de les faire disparaître radicalement, ce qui est obtenu assez facilement par la méthode du suréchantillonnage: La durée de chaque bit est réduite dans une proportion de 1 à 8 pour obtenir un échantillon 8 fois plus court; on le reproduit à sa suite identiquement 7 fois, ce qui multiplie par huit la fréquence de l’échantillonnage. Contrairement à ce que cela serait si on avait échantillonné à cette nouvelle fréquence dès l’enregistrement, aucune information nouvelle n’est produite et le convertisseur ne convertira en final qu’un seul échantillon.
Le spectre audio reste le même, ce qui fait que sa première image est décalée en miroir autour de 8 fois 44,1 KHz soit 352,8 KHz, et donc débute à partir de 332,8 KHz. Avant cette fréquence, il n’y a plus rien, ce qui est tout de même plus facile à filtrer.
Rem 10: Le sur-échantillonnage est employé depuis longtemps, la valeur de huit étant généralisée car jugée optimale. Il n’apporte aucune information supplémentaire, et n’a rien à voir avec la fréquence d’échantillonnage ou le
re-échantillonnage étudié plus loin.
Rem 11: Une valeur de sur-échantillonnage de 256 fois souvent rencontrée dans des descriptifs résulte de la confusion grossière entre le facteur de sur-échantillonnage et la fréquence de chaque bit d’échantillon sur-échantillonné (8*32=256)
Les filtres numériques permettent également une optimisation de la bande passante audio au seuil de sa limite et l’incorporation d’une courbe de désaccentuation lorsqu’elle est nécessaire. La qualité de ces filtres est très variable et participe à la qualité et au prix de la puce de conversion. Pratiquement toujours intégrés dans celle ci, les filtres peuvent néanmoins être traités dans un circuit indépendant lorsque des fonctions de filtrage supplémentaire sont souhaitées (circuit DSP).
Après cette étape, le convertisseur va utiliser le signal sur-échantillonné voire sur-sur-échantillonné ou non, en fonction de son architecture. Ainsi une architecture one bit ou delta sigma travaillant bit après bit réclamera un sur-échantillonnage de 32 fois et même 64 fois si la puce est compatible 18 à 24 bits pour convertir au final un seul échantillon (16 bits pour le canal gauche + 16 bits pour le canal droit, le double si la résolution dépasse 16 bits)
Rem 12: Une valeur de sur-échantillonnage de 64 fois souvent rencontrée signifie que l’on est en présence d’une architecture one bit ou sigma delta; et là encore, aucun échantillon autre que l’échantillon initial n’est converti en final.
Le circuit de conversion
Il existe de nombreuses solutions de conversion, mais les performances nécessaires au domaine audio limitent les solutions proposées à deux grandes familles: les “one bit” et les “multi bits”. Il est affligeant de constater que dans l’esprit du public, un one bit pourrait être moins bon qu’un 24 bits, parce que 1 est inférieur à 24. La technologie one bit est ultérieure à celle du multibit et nécessite des vitesses de travail plus élevées, donc longtemps plus difficiles à obtenir. En cela elle est technologiquement plus évoluée, mais ce paramètre ne veut pas dire grand chose. Un one bit ordinaire est par nature supérieur à un multibit médiocre parce qu’ il se réfère à une seule valeur de comparaison identique pour chaque bit. Il aura d’autres défauts liés à son mode de fonctionnement. Un multibit évolué contient des comparateurs calibrés au laser avec une précision diabolique qui rendent cette architecture comparable dans la plage de résolution nécessaire de 16 bits. Les multibits réservés à l’audio high end (qui n’ont rien à voir avec les convertisseurs 24 bits 96 KHz bon marché généralisés dans le multimédia classique) emploient maintenant des architectures mixtes travaillant pour une partie de la résolution avec l’une de ces techniques, puis avec l’autre pour le reste des bits traités.
La résolution
Sauf à employer un calculateur qui serait capable de définir des valeurs supplémentaires intercalables entre les valeurs existantes, le convertisseur qui convertit le signal issu du CD travaille toujours avec une résolution de 16 bits. Et pour cause, on ne lui en donne pas un de plus. On pourrait être tenté, au vu des performances alléchantes de la conversion en mode 24 bits par rapport au mode 16 bits, de multiplier simplement par 2 puissance 8 chaque nombre afin d’obtenir cette résolution tant espérée. Hélas le calcul binaire nous ramène à la dure réalité de façon très visuelle: multiplier par 2 en binaire consiste à rajouter un 0 à la suite du nombre multiplié, multiplier par 2 puissance 8 rajoutera 8 zéros. Le convertisseur 24 bits étant bien ordonné, il lira les 16 bits puis des zéros et donc ne convertira réellement que les 16 premiers bits. La morale est sauve puisque multiplier par n’importe quel chiffre chacune des informations possibles n’en aurait pas donné une de plus. Et n’ayons pas de regret, les performances affichées en 24 bits sont limitées par le bruit de quantification, présent sur le message lu et qui aurait été transformé proportionnellement.
De très rares convertisseurs utilisent le principe du calculateur en amont fournissant à l’aide d’algorithmes plus ou moins efficaces des conversions d’un signal 16 bits 44,1K en signal 24 bits 192 KHz. Connaissant la qualité de résultat que l’on obtient en demandant à un puissant PC, non limité dans le temps, d’effectuer la traduction d’un texte en langue étrangère, on peut à juste titre s’interroger sur l’universalité des résultats obtenus avec cette cuisine, réalisée en temps réel et à l’aide de processeur bien plus rustique. Il importe avant tout de discriminer dans le résultat entendu ce qui incombe à cette technologie ( dont les auteurs ne dévoilent pas grand chose de quantifiable d‘ailleurs ), et ce qui découle des autres moyens mis en œuvre autour de celle ci dans les machines qui les utilisent. En tout état de cause, le signal échantillonné à 44,1 KHZ devrait être re-échantillonné à 176,4 KHz (multiple exact) et non 192 KHz afin de ne pas engendrer une erreur temporelle évidente facile à éviter.
D’autres machines, particulièrement les multi-plateformes, utilisent un principe encore plus rustique de
re-échantillonnage dit asynchrone. Le 44,1 KHz est “transformé” en 96 KHz pour s’adapter au convertisseur mixte, afin de minimiser les modification de commutation. Au lieu d’un échantillon exact, on obtient deux échantillons dont l’approximation est garantie(!), et l’erreur temporelle évidente. Dans ce cas de figure, la résolution n’est pas modifiée et reste de 16 bits bien entendu.
Rem 13: S’il n’est pas précédé d’un calculateur intercalant suivant un algorithme (figé) 8 bits nouveaux, tout convertisseur 24 bits ne fera rien de plus, ni de mieux qu’un convertisseur 16 bits; idem concernant l’échantillonnage dont la fréquence ne peut actuellement jamais excéder 4 fois celle native du CD.
Y a t’il un intérêt à re-échantillonner? Une comparaison simple serait celle d’un texte écrit sans accentuations: dès la première ligne passée, il sera facile de le lire car aucun accent ne sera plus attendu. Bien sur, complet il serait plus plaisant mais si une intelligence artificielle l’accentue, immanquablement elle se trompera de temps en temps et le texte deviendra nettement plus pénible à lire que sans cette opération. Souvent évoqué, le gain que l’on obtiendrait par un filtrage plus doux en multipliant la fréquence d’échantillonnage est une vue de l’esprit, puisque l’opération du sur-échantillonnage par huit, généralisée, a déjà porté la fréquence de filtrage finale nécessaire à plus de 200 KHz. Si on ne cherche pas la revendication de valeurs de rapport signal/bruit inutilement mirobolantes, on peut même parfaitement se passer de filtrage, ce que font discrètement certains. Rappelons enfin que le re-échantillonnage n’a rien à voire avec le sur-échantillonnage qui lui ne se finalise que par la conversion d’un seul échantillon. En effet, multiplier des échantillons identiques et les convertir tous, alors qu’en réalité le message musical change continuellement, cela aboutirait à forcer 7 erreurs sur 8, soit un résultat catastrophique.
Rem 14: Il est utile de savoir que plus la fréquence d’échantillonnage augmente, plus la puce de conversion travaille et monte en température, ce qui entraîne des dispersions de caractéristiques, avec pour corollaire une diminution de ses performances. C’est autour de 50 KHz qu’elles sont toutes toujours les meilleures
Le convertisseur intensité/tension
La conversion numérique analogique se termine par la production d’un signal à intensité variable. Il est nécessaire de le transformer en tension pour l’utiliser ensuite. Seul un amplificateur opérationnel peut effectuer simplement cette fonction. Elle n’est pourtant pas aisée car les impédances et les capacités mises en jeux sont contraires au bon fonctionnement de beaucoup d’entre eux. Si les paramètres de distorsions et de rapport signal sur bruit sont jugés fondamentaux, il sera fait usage d’un composant techniquement bon mais peu musical, ce qui est souvent le cas. Si cet étage est intégré à la puce, cas le plus fréquent, la technique de fabrication de celle-ci limitera naturellement les possibilités de conception de cet étage, d’autant plus que la tension d’alimentation de la puce, généralisée à 5 Volts (voire moins), ne laisse aucune marge de manœuvre pour la réalisation d’un montage réellement audiophile.
Il est intéressant de savoir comment cet étage est traité s’il n’est pas intégré dans la puce de conversion car il participe autant a la sonorité finale -la musicalité- que l‘étage de sortie, sinon plus.
Rem 15: La plupart des puces de conversion intègrent l’étage intensité/tension, et souvent des étages de sorties, traités en amplification opérationnelle dont la technologie doit se plier aux impératifs du substrat, de l’alimentation commune et de la température maximale de la puce, ce qui est très réducteur.
Les étages de sortie
Une puce de conversion intègre ou non les étages de sortie. Il est intéressant de noter que les plus coûteuses n'en ont pas, toute la valeur étant consacrée à l’architecture complexe de l'élément de conversion, les concepteurs étant conscient que l’intégration de cet étage n’est pas la solution optimale.
Il est tentant d’utiliser des amplificateurs opérationnels pour cette fonction, et même malheureusement très courrant de les multiplier à outrance pour obtenir facilement de bons résultats techniques. Une fois posé le fait que toute jonction semi-conductrice devrait être assimilée à la production d’une contre réaction égale à son gain (et donc détériore nécessairement le signal), on doit vite admettre qu’un amplificateur opérationnel qui en utilise un nombre considérable doit être évité absolument en audio musicale. Le signal disponible à ce niveau est élevé (jusqu’à 2 Volts efficaces et plus) et en très basse impédance. On gagnera à employer un circuit simple et dépouillé, le seul problème à gérer étant une tension continue sur ce signal, incompatible au départ avec une liaison directe. Un étage à tube est complètement inapproprié ici, compte tenu de la non nécessité d’une sur-amplification en tension et d’impédances basses tant en sortie qu’en entrée (sauf à se plier à la mode). Dans un même esprit, concevoir un étage de sortie, à tubes, à circuits intégrés ou composants discrets alors que cet étage serait déjà intégré dans la puce parait insensé et c’est pourtant une pratique très courante, la volonté étant alors de “personnaliser” le résultat.
Certaines puces intègrent les circuits en double, permettant à la fois une sortie dite symétrique, et une réduction du bruit et des distorsions en mode asymétrique. Il est intéressant de noter que dans ce mode, les concepteurs préconisent la sommation des deux signaux par ampli opérationnel bien sur, précédemment filtrés chacun par amplificateur opérationnel en sus (sans commentaire!).
EN CONCLUSION
L’aspect mécanique de la lecture d’un signal audionumérique est fondamental et ne doit jamais être occulté.
Un convertisseur extérieur bien conçu peut apporter des bienfaits importants à la restitution par l’amélioration du fonctionnement de l’horloge principale, le choix d’une puce de conversion sans compromis et le traitement non intégré à celle ci de la partie analogique, à savoir le convertisseur intensité/tension et les étages de sortie qui le suivent immédiatement.
Le re-échantillonnage peut être fait par un traitement sommaire (adaptateur de fréquence d’échantillonnage sans modification de résolution, utilisé principalement sur les multi-plateformes car bon marché) ou par un calculateur sérieux programmé par son concepteur (quelques très rares machines destinées au milieu professionnel). Dans les deux cas, il s’agit d’une cuisine discutable qui peut faire autant de mal que de bien et dont il est difficile de définir l’exacte participation au résultat final.
Le suréchantillonnage, pratiqué dans tous les cas de figure, n’apporte aucune information ou résolution supplémentaire.
Le convertisseur travaille alors (99,9999% des cas) en mode natif de la source, soit 16 bits 44,1 KHz, est c’est tant mieux. La fréquence de l’horloge est en général un multiple minimal de 256*44,1 KHz, le choix d’une valeur plus élevée n’ayant aucun intérêt, au contraire.
|