Samstag, 20. April 2024

Archiv

Algorithmen im Alltag (6/12)
Der Datenkomprimierer

MP3 ist heutzutage nicht mehr wegzudenken – Der Algorithmus komprimiert akustische Signale und spart so Speicherplatz. Nach der Erfindung in den Achtzigerjahren hat MP3 die Musikindustrie revolutioniert. Doch Kritiker bemängeln den damit einhergehenden Qualitätsverlust des Audios.

Von Piotr Heller | 11.04.2019
Symbolbild für den Datenkomprimierer
Die Datenreduktion durch MP3-Komprimierung machte es praktikabel, Musik über das Internet zu verschicken (epict.de / Hans-Jörg Brehm)
"Das eine ist, dass es die Zugänglichkeit zur Musik erhöht hat. Da ist natürlich MP3 nur ein Element unter vielen. Aber das ging los damit, dass Leute untereinander Musik ausgetauscht haben. Dass viel nicht autorisierter Vertrieb war, das fand ich nie gut. Aber mit Internet-Radio, Streaming-Services, den neuen Abo-Service, die es gibt - Das ging vorher noch nicht und das hat, denke ich, den möglichen Umgang mit Musik deutlich verändert. Und zwar nicht zum Schlechteren hin."
MP3 hat die Musikindustrie revolutioniert. Und Karlheinz Brandenburger, der heute am Fraunhofer-Institut für Digitale Medientechnologie in Ilmenau forscht, war der Auslöser dieses Umbruchs. Gemeinsam mit Kollegen hat er in den Achtzigern die Algorithmen erfunden, die Audiodateien effizient komprimieren. Und zwar ohne, dass die Qualität von Sprachaufnahmen oder Musikstücken hörbar leidet:
"Ganz klar ein Tonsignal, kann Sprache oder Musik oder was auch immer sein."
Der Algorithmus seziert diese Musik oder Sprache zunächst. Er zerlegt sie dazu in 576 Tonhöhen und schaut, wie viel Signal bei jeder dieser Frequenzen vorhanden ist:
"Dann wird ein grobes Modell gerechnet, von dem, was auch im Innenohr passiert. Ein ‚psychoakustisches Modell’. Dass das Gehör ja nicht perfekt ist, sondern laute Töne leisere Töne verdecken können, das ist die Grundidee da drin."
Tatsächlich können wir, wenn wir einen lauten Ton in einer bestimmten Tonhöhe hören, leisere Töne mit ähnlicher Frequenz nicht mehr wahrnehmen. So verdeckt zum Beispiel das Schreien eines Babys einen Vogel, der irgendwo singt. Diesen Effekt nutzt MP3 aus: Der Algorithmus schaut jetzt das sezierte Tonsignal an und prüft, wo laute Geräusche andere Töne verdecken:
"Aus diesem Signal leite ich mir dann ab: Wie grob darf ich diese Einzelwerte übertragen, so dass der Unterschied nach Möglichkeit nicht hörbar ist?"
MP3 liefert weniger akustische Information
"Grob" übertragen heißt: Mit weniger akustischer Information. Je gröber man etwas überträgt, desto weniger Speicherplatz braucht man, dafür sinkt aber auch die Audioqualität. Aber – und das ist die Grundidee – weil MP3 nur bei jenen Teilen des Signals Information unterschlägt, die sowieso von anderen Tönen verdeckt werden, merkt der Mensch diesen Unterschied nicht.
"Dann wird nochmal geschaut: Kann ich da nicht weitere Tricks anwenden, um das Ganze kompakter darstellen zu können? Und am Schluss bekomme ich einen Bit-Strom, der sozusagen darstellt, wie viel bei diesen verschiedenen Frequenzen übertragen wird. Und das kann dann rekonstruiert werden."
Dieses Rekonstruieren macht dann der MP3-Player. Er wandelt den datenreduzierten Bitstrom wieder in Musik um. Die "weiteren Tricks" sind übrigens teilweise uralte Methoden zur Komprimierung von Daten. Etwa die Huffmann-Kodierung, die ihren Ursprung in den 1950ern hat. Dabei schaut man: Welche Signale kommen besonders häufig vor? Und stellt sie in der fertigen Datei mit besonders kurzen Zahlenfolgen dar. Das spart Speicherplatz:
"MP3 ermöglicht verglichen mit dem Ausgangssignal zum Beispiel von CD eine Datenreduktion um zirka den Faktor acht zu einer doch sehr ordentlichen Qualität, nicht perfekt aber sehr ordentlich."
Diese Datenreduktion war es, die es Ende der Neunziger erst praktikabel machte, Musik über das Internet zu verschicken. Ein vierminütiger Popsong, wie etwa "Strawberry Fields Forever" von den Beatles, der zuvor noch 43 Megabyte groß ist, benötigt komprimiert nur noch 6 Megabyte – und lässt sich damit sieben Mal schneller übertragen. Das ermöglichte zunächst Tauschbörsen im Internet und dann die legalen Möglichkeiten, Musik im Netz zu kaufen - bei Itunes, Spotify und Co.
Qualitätsverlust teilweise hörbar
Der MP3 Algorithmus ist dabei so flexibel, dass er Tondateien noch deutlich stärker komprimieren kann, etwa um den Faktor 80. Doch dann hört sich "Strawberry Fields Forever" nicht mehr so gut an. HiFi-Enthusiasten hören den Qualitätsverlust auch schon bei viel geringerer Komprimierung - und wollen von MP3 bis heute nichts wissen. Und selbst der Erfinder Karlheinz Brandenburg muss ihnen in manchen Fällen Recht geben:
"Es gibt verschiedene Parameter, nach dem Motto: Wie viele Frequenzen sind es? Welche Methoden können noch eingesetzt werden? Wie viel Speicherplatz habe ich zur Verfügung, um die Dinge zu rechnen? Da war MP3 so etwas wie ein Kompromiss. Das heißt, wenn Sie mich heute fragen, dann kann ich Ihnen bestimmte Signale sagen und da höre ich den Unterschied auch heute noch, auch wenn meine Ohren älter geworden sind."
Das gilt zum Beispiel für Kastagnetten, die plötzlich erklingen. Wenn man die mit dem MP3-Verfahren komprimiert und dann genau hinhört, merkt man eine Art Echo, das vor dem eigentlichen Ton kommt. Diese akustischen Artefakte kommen daher, dass der Algorithmus sich gewisse Zeitfenster der Datei vornimmt. Und wenn ein plötzliches Geräusch in einem solchen Zeitfenster auftaucht, dann erzeugt es einen Fehler, der sich beim Auslesen der Datei auf das ganze Fenster ausbreiten kann. Folgeformate, wie etwa das Advanced Audio Coding AAC, bekommen das in den Griff. Aber auch sie basieren letztendlich alle auf der Grundidee von MP3: Die Unzulänglichkeiten des menschlichen Gehörs werden ausgenutzt, um Tondateien so zu schrumpfen, dass wir praktisch nichts davon bemerken.