Hier
seien einige Grundlagen zur Datengewinnung und
-speicherung von Audio-Daten in unterschiedlichen
Formaten dargestellt:
Datenspeicherung:
Die Datenspeicherung in PCM
mit 192kHz bei 24Bit ist für Frequenzen unter etwa 20kHz
praktisch perfekt, was die Möglichkeiten angeht, daraus
jemals wieder ein analoges Signal zu machen. Es ist
praktisch nicht möglich, Unterschiede zwischen einem so
gespeicherten Signal und einem höher aufgelösten, z.B.
384kHz PCM oder DSD zu messen. Amplitude und Phase sind
bei ordentlichem Anti-Aliasing-Filter perfekt zu rekonstruieren.
Bei 96kHz und 24Bit gibt es
theoretische und meßtechnisch belegbare kleine Effekte
in den Höhen, die aber definitiv unhörbar sind, wenn man
das Signal gut konditioniert und den AA-Filter
entsprechend steuert und auslegt.
Nur bei 48kHz gibt es (auch
bei 24Bit) meßtechnisch belegbare Effekte, die sich
auch durch perfektes AA-Filterdesign und
Signalvorverarbeitung nicht beheben lassen, vor allem in
den Höhen und bei der Phasenlage. Diese sind
grundsätzlich hörbar, meistens aber nur im AB-Vergleich.
Datenausgabe:
Der Transport der Daten in
Richtung Wandler bringt trotz (oder wegen der PLL) immer
Jitter, insbesondere bei Verbindungen zu externen Geräten
über Kabel, der die Signalqualität nennenswert
einschränkt. Je nach Verbindungsqualität ist das so
massiv, daß die Qualität weit unter dem theoretischen
Limit der Audio CD bit 44,1/16 Bit liegt und damit nicht
einmal an gute, professionelle Tonbandgeräte
heranreicht.
Der Datentransport gelingt
bei guten physikalischen Verbindungen auf höheren
Frequenzen grundsätzlich besser, weil die in den
Endgeräten aktive PLL besser geführt wird und damit eine
bessere Taktrekonstruktion erfolgen kann, sofern das
System dafür ausgelegt und entsprechend konstruiert ist,
wovon man bei Profigeräten ausgehen kann.
Hingegen gelingt der
Datentransport bei schlechten physikalischen
Verbindungen auf höheren Frequenzen wegen
Flannkenverschleifung etc. mitunter sogar schlechter,
weswegen es im Einzelfall günstiger ist, mit 48kHz zu
senden, als mit 96kHz oder höher. Dies ist vor allem bei
älteren und billigen Consumergeräten der Fall.
Datengewinnung:
Für eine reine mathematische
Datenerzeugung, z.B. bei der elektronischen
Klangsynthese reicht eine übliche Rundungsbetrachtung
und ein entsprechend genaues Modell, um die o.g. Güten
zu erreichen und auszulasten. D.h. man kann mit 96kHz
einen praktisch perfekten Sinus erzeugen, der keine
digitalen Fehler aufgrund der Auflösung oder Abtastung
beinhaltet, die eine Größenordnung erreichen, welche von
dem Limit der Rekonstruktion durch Analogtechnik
vorgegeben ist.
In der Regel ist es eher so,
daß typische Analogtechnik in Consumergeräten das Limit
so tief definiert, daß auch eine Klangsynthese mit 48kHz
voll ausreichend ist.
Da
die Randbedingunen "Jitter", "AA-Filter" etc auch bei
der Aufnahme zuschlagen, ist es im Regelfall sinnvoll,
die Aufnahme auf höheren Abtastraten durchzuführen, als
sie später benutzt werden soll. Dabei ist aber zu
berücksichtigen, daß klassische AD-Wandler oft für
mehrere Frequenzen ausgelegt sind und intern Filter und
PLLs umschalten müssen. Vor allem bleibt die faktische
interne Überabtastung in der Regel konstant und es wird
lediglich anders dezimiert. Damit bringt eine höhere
nominelle Abtastfrequenz am Wandler von z.B. 96kHz für
48kHz Audio nicht zwangsläufig eine nennenswerte
Verbesserung.
Datenverarbeitung:
Grundsätzlich gilt für die
Behandlung von digitalen Daten das Nyqistkriterium,
welches besagt, daß alle Frequenzen unterhalb der halben
Abtastfrequenz korrekt repräsentiert sind. Solange digitale Daten in
dieser Domain keine Einschränkung in der Auflösung etc
erfahren, bleibt die Qualität grundsätzlich erhalten.
Bei der Behandlung von Daten
im Zeitbereich treten jedoch regelmäßig bandbegrenzende
Filtereffekte in Erscheinung, die speziell die Höhen
manipulieren wobei ein Kompromiß zwischen Erhalt der
Amplitude und Vermeidung von Alis-Effekten gefunden
werden muß. Maßgeblich ist dabei der
Abstand der behandelten Frequenz zur Abtastfrequenz: Jer
größer dieser ist, desto einfacher und besser lassen
sich Filter definieren, die wie gewünscht arbeiten.
Ein Umwandeln auf höhere
Abtastraten bringt grundsätzlich keinen Qualitätsgewinn.
Es kann jedoch bei digitalen Bearbeitungsschritten
helfen, solche typischen Effekte zu minimieren.
Es
läßt sich mathematisch zeigen, daß es grundsätzlich
möglich ist, einen Datenstrom von z.B. 96kHz
Abtastfrequenz auf jede beliebige Abtastfrequenz
darunter herabzurechnen, ohne nennenswerte
Quantisierungsverluste infolge der krummen Frequenzen zu
erzeugen. Es tritt lediglich die naturgemäße
Bandbegrenzung auf. Dies gilt konkret für z.B. die
Wandlung von 48kHz nach 44,1kHz. Dazu ist eine
entsprechende Analyse des Signals samt Filterung auf die
neue Abtastfrequenz und Dithering auf die Quantisierung
nötig.
In der Praxis gelingt dies
jedoch nur mit offline-Verfahren z.B. in Software
weitgehend perfekt, weil dort ausreichende Filterlängen
und Auflösungen verwendet werden können und Zeit zur
Bearbeitung zur Verfügung steht. Eine aktuelle Software
benötigt derzeit etwa das 15-fache an Rechenzeit im
Vergleich zur Länge des Materials.
Eine Echtzeitkonvertierung
ist auch mit dedizierten Chips nur mit Einschränkungen
und unter einem gewissen Qualitätsverlust möglich. Nur eine Umwandlung mit
ganzzahligen Faktoren z.B. 96kHz auf 48kHz ist in
Echtzeit relativ gut möglich.
|