Die "Trägheit"
des Filters ist für Frequenzen oberhalb der Grenzfrequenz
eben nicht beliebig hoch. Da diese je nach Tonhöhe mehr
oder weniger gut dargestellt sind, werden zu hohe Frequenzanteile
im Datenstrom falsch dargestellt und führen mitunter zu
hörbaren Frequenzen- wenn auch mit sehr geringer Lautstärke!
Ausserdem muss auch eingangsseitig verhindert werden, dass
ein hochfrequenter Anteil oberhalb des Hörbereichs den Messwert
im Moment der Abtastung verfälscht, was ebenfalls durch
ein Tiefpassfilter gelöst werden kann. Das Ziel muss also
sein:
a) Frequenzen
oberhalb der Übertragungsgrenze bei der Aufnahme möglichst
herauszuhalten b) die analog aufgenommene hochfrequenten
Anteile vor der Abtastung zu dämpfen c) die noch enthaltenen
Anteile korrekt zu wandeln d) diese Anteile bei der Bearbeitung
möglichst korrekt beizubehalten e) diese Anteile bei
der Wandlung im Rekonstruktionsfilter korrekt zurückwandeln
Die Anforderung
a) wird z.T. bereits in Mikrofonen und den Vorverstärkern
gelöst, die das Signal analog auf den hörbaren Bereich begrenzen.
Solange die Eckfrequenzen dieser Filter weit genug vom Übetragungsbereich
entfernt sind, liegt keinerlei Deformation in der Klangkurve
vor.
Der Aspekt
b) wird durch das Tiefpassfilter vor dem AD-Wnadler gelöst.
Dieses sogenannte Anit-Alisaingfilter verhindert, daß der
hochfrequente Anteil im Signale leichte Zufallswerte bei
der Wandlung erzeugt. Der aktuelle Analogwert ist ja immer
eine Summe aller Frequenzen und damit durch die unerwünschten
Oberwellen verfälscht. Unterstützt wird dieser Prozess durch
das sogenannte Oversampling (Überabtastung): Jeder Wert
wird mehrfach abgestastet und zu einem Mittelwert verrechnet.
Alles, was sich während des Abtastintervalls (also zu schnell)
ändert, wird so gedämpft.
Beim Punkt
c) wird nun der Anteil an Hochfrequenz betrachtet, der nicht
durch die vorherigen Dämpfungen verschwunden ist. Dieser
wird bei der Abtastung nun falsch erfasst und zwarnach Massgabe
der Interferenz des analogen Signalanteils (jeweilge Oberwelle)
mit der Abtastfrequenz, wo nun die 96kHz erstmalig ins Spiel
kommen.
Wie unter d) erwähnt, ist es auch wichtig,
dass nicht etwa durch eine falsche Bearbeitung, z.B. durch
Resampling, Filtereffekte o.ä. der hochfrequente Signalanteil
nichtlinear deformiert wird, wodurch niederfrequentere und
damit wieder hörbare Signalanteil entstehen könnten. Der
Beibehalt der zeiltichen Auslösung des Signales (unveränderte
Samplingfrequenz) bei der Bearbeitung ist daher wichtig.
Beim Schritt
e) wird durch ein adäquates Tiefpassfilter (dem bereits
erwähnten Rekonstruktionsfilter) aus dem digitale Datenstrom
wieder ein Analogsignal erzeugt. Die hochfrequenten Anteile
oberhalb der Grenzfrequenz werden dabei weiter abgesenkt
und führen sofern noch vorhanden auch im späteren Audiosignal
nur zu analogen Signalanteilen oberhalb des Hörbaren, was
unkritisch ist. ->
Wozu nun 96kHz?
Bei Tiefpassfiltern
hat man immer die Wahl zwischen flachen Filtern, die recht
linear verlaufen und hohe Frequenzen mit z.B. Faktor 2 je
Oktave dämpfen, sowie Filtern, die mit einem Mehrfachen
dämpfen, dafür aber im Bereich der Grenzfrequenz stark verzerren
(also die Lautstärke nicht korrekt erfassen). Es ist also
immer ein Kompromiss gefragt.
Betrachten
wir nun das Antialiasing-Filter: Im Falle eines 44kHz-Systemes
muss die Grenzfrequenz im Bereich 15-16 kHz liegen, und
zudem der Filter recht steil sein. Damit liegen Verzerrungen
im Bereich höherer Frequenzen vor. Ein 96kHz-System kann
es sich dagegen "erlauben", mit einer Grenzfrequenz
deutlich ausser dem Hörbereich zu arbeiten (z.B. 25kHz ->
daher keine Verzerrungen im Hörbereich) und auch ein flacheres
Filter zu nutzen. Zwar sind dann effektiv deutlich mehr
Oberwellen im Bereich 25kHz-40kHz im Mix enthalten, doch
werden diese ja am Ausgang korrekt(er) gewandelt (s.u.)
und stören insgesamt weniger.
Eine ähnliche
Betrachtung gilt für das bereits angesprochene Ausgangsfilter:
In einem 44kHz-System muss dieses Filter recht steil sein,
um die gewünschte Filterträgheit zu erzeugen, was man sich
jedoch durch neue Verzerrungen erkauft. Im 96kHz-System
dagegen hat man es wieder einfacher : Es können Frequenzen
bishin zu 48kHz korrekt dargestellt werden. Daher legt man
die Eckfrequenz weit ausserhalb des Hörbereiches und nutzt
diesmal ein sehr steiles Filter z.B. bei 30-40kHz : Es schneidet
wesentlich besser ab und erfüllt also seine theoretische
Aufgabe viel besser : Es entstehen im Analogsignal weniger
falsche Frequenzanteile, welche auch noch eine Oktave Abstand
zum hörbaren Bereich haben und daher statistisch überwiegend
im Unhörbaren liegen. Der theoretische Nachteil des steilen
Filters wirkts sich aber nicht aus, da die Verzerrungen
auch im unhörbaren Bereich liegen!
Und was ist
die Wirkung:
Die Tatsache,
daß sich
trotz einer praktischen Verdopplung der Datenmenge kein
Quantensprung im Klangerlebnis
ergibt, laesst sich damit begründen, daß der Anteil von
Höhen im Bereich über 10kHz generell recht gering ist und
daher nicht so sehr ins Gewicht fällt. Generell laesst sich
jedoch bilanzieren, daß die Verwendung eines 96kHz-Systemes
einige faule Kompromisse des 44kHz-Systemes beseitigt, welche
im Bereich der korrekten Repräsentation des Oberwellengehaltes
in Audiodaten liegen. Musikalisch gesprochen, werden die
Höhen korrekter dargestellt, was sich z.B. beim gesprochenen "s"
und "t" sowie in mehr Brillianz bei klassischen
Musikinstrumenten aeussert.
Die Exaktheit der Oberwellenrepräsentation
eines Übertragungssystemes hängt direkt mit dem sog. Transientenverhalten
zusammen: Schnelle Impulsänderungen können von einem feiner
abgetasteten System auch exakter übertragen werden. Dies
äussert sich vor allem bei bestimmten Aspekten der Stereofonie:
Die Zeitverschiebung eines Tones an den beiden Ohren, die
mit der Phasenlage (dem zeitlichen Versatz der Wellen durch
mehr Weg) und dem Zeitpunkt der ersten Eintreffen eines
Impulses zusammenhängt, bestimmt die Art und Weise, ob,
und wie genau wir eine Schallquelle lokalisieren können.
Eine direkte technische Betrachtung liefert, daß Ereignisse
bei 44kHz mit etwa 20us aufgelöst werden können, während
96kHz rund 10us Auflösung bieten. Das menschliche Ohr indes
kann (frequenzabhängig) Phasendifferenzen von unter 6us
unterscheiden.
Zwar kann theoretisch betrachtet
auch in einem System niedrigerer Frequenz, die Wellenphase
bedingt durch das Rekonstruktionsfilter am Ausgang der AD-Wandlung,
prinzipiell korrekt wiederhergestellt werden. Jedoch scheitert
dies in der Praxis an den nicht idealen Filtern.
Eine Abtastfrequenz von 96kHz und dafür ausgelegten Filtern
kommt dem Ideal näher und repräsentiert besonders die für
das Stereoempfinden verantwortlichen hohen Frequenzen dem
Prinzip nach deutlich besser. Besonders Schlaginstrumente
und andere steilflankige Schallereignisse, sowie die Exaktheit
und Deutlichkeit von Zisch- und Explosivlauten werden in
96kHz-Systemen oft exakter wiedergegeben.
Ob und
inwieweit diese Klangverbesserung beim Hörer aber auch ankommt,
hängt sehr von der Güte des verwendeten Wiedergabesystemes
ab. Leider können die theoretisch zweifelsfrei bestehenden
Vorteile jedoch von den handelsüblichen Lautsprechern der
heimischen Stereoanlagen in keinster Weise übertragen werden.
Selbst hochwertige Monitorlautsprecher in Tonstudios bilden
das im Signal enthaltene original Impulsverhalten nur sehr
unvollständig ab.
So ist es
verständlich, daß in Hörversuchen selbst von Experten oft
keine oder kaum Unterschiede zwischen 44/48kHz und 96kHz-Systemen
erkannt werden können.
Oft sind erkannte
Unterschiede sogar die Folge von Artefakten wie z.B. die
abweichende Qualität der Wandlersysteme und Mikrofonverstärker,
oder die Verwendung von Querkombinationen wie z.B. das Abpielen
eines 96kHz-Datenstromes durch ein 44kHz-Filter und umgekehrt.
J.S. Stand
August 2001
|