Top 10 articles

Liste der Krankenhäuser in England
Libysche Armee
Odnoklassniki.ru
Libysche Luftwaffe
nasza-klasa.pl
Justin Biber
Der Blitz und die Sonne
Liste von Farben
Liste Moto Guzzi der Motorräder
Liste der politischen Parteien in Flandern

News:

Audiokompression (Daten)

Für Prozesse, die die Zeitmenge, das verringern es nimmt, um zu zu hören und eine Aufnahme verstehen, sehen Sie Zeit-zusammengedrückte Rede.

Audiokompression ist eine Form von Datenverdichtung entwarf, die Größe von zu verringern Audioakten. Audiokompression Algorithmen werden in der Computer-Software wie eingeführt Audiocodecs. Generisch Datenverdichtung Algorithmen führen schlecht mit den Audiodaten durch und selten viel verringern Akte Größen unter 87% der Vorlage, und sind nicht für Gebrauch in der Realzeit bestimmt. Infolgedessen spezifischer Audio „lossless„und“lossy„Algorithmen sind verursacht worden. Lossy Algorithmen liefern weit grössere Kompression Verhältnisse und werden in den Hauptströmungsverbraucher Audiovorrichtungen verwendet.

Wie mit Bildkompression, werden lossy und lossless Kompression Algorithmen in der Audiokompression, lossy verwendet, das für täglichen Gebrauch das allgemeinste ist. in lossy und in der lossless Kompression wird Informationen Redundanz mit Methoden wie Kodierung verringert, Mustererkennung und linearer Vorhersage, die Menge von Informationen zu verringern verwendet, um die Daten zu beschreiben.

Der Kompromiß der etwas verringerten Audioqualität wird offenbar für die meisten praktischen Audioanwendungen überwogen, in denen Benutzer keinen Unterschied wahrnehmen können und Platzbedarf im wesentlichen verringert werden. Z.B. auf einer CD, kann man eine Stunde von Highfidelitymusik, weniger als 2 Stunden von der Musik losslessly zusammengedrückt passen, oder 7 Stunden Musik zusammengedrückt in MP3 formatieren.

Inhalt

Lossless Audiokompression

Wie Aktenspeicherung und Kommunikationen Bandbreite weniger kostspielig und vorhandener geworden ist, die Popularität von lossless Formaten wie Audio des Affen, FLAC und Verkürzen Sie hat sich scharf erhöht, da Leute beschließen, ein dauerhaftes Archiv ihrer Audioakten beizubehalten. Die wichtigen Benutzer der lossless Kompression sind gewesen Audioingenieure, audiophiles und jene Verbraucher, die eine genaue Kopie ihrer Audioakten konservieren möchten, im Gegensatz zu den irreversiblen änderungen von den lossy Kompression Techniken wie Vorbis und MP3. Kompression Verhältnisse sind denen für lossless Datenverdichtung ähnlich (herum 50-60% der ursprünglichen Größe). Lossless Formate wie DolbyTrueHD werden auch zusammen mit hochauflösendem eingeführt DVD Formate.

Es ist schwierig, alle Daten in einem Audiostrom beizubehalten und erhebliche Kompression zu erzielen. Zuerst sind die beträchtliche Majorität der Tonaufnahmen in hohem Grade kompliziert, notiert vom realistischen. Da eine der Schlüsselmethoden der Kompression, Muster und Wiederholung zu finden ist, drücken sich chaotischere Daten wie Audio nicht gut zusammen. In einer ähnlichen Weise, Fotographien Kompresse kleiner leistungsfähig mit lossless Methoden als einfachere computererzeugte Bilder. Aber interessant, sogar können computererzeugte Töne sehr schwieriges enthalten Wellenformen dieses Geschenk eine Herausforderung zu vielen Kompression Algorithmen. Dieses liegt an der Natur der Audiowellenformen, die im Allgemeinen schwierig, ohne a (notwendigerweise lossy) Umwandlung zu den Frequenzinformationen zu vereinfachen sind, wie durch das menschliche Ohr durchgeführt.

Der zweite Grund ist daß Werte von Audio Proben ändern Sie sehr schnell, so generische Datenverdichtung Algorithmen funktionieren Sie gut nicht für Audio, und Zeichenketten der nachfolgenden Bytes nicht im Allgemeinen erscheinen sehr häufig. Jedoch, Windung mit dem Filter [- 1 1] (das heißt, den ersten Unterschied nehmend) neigt zu etwas werden Sie weiß (decorrelate, bilden Sie Ebene) das Spektrum, dadurch Sielassen Sielassen traditionelle lossless Kompression am Kodierer seine Arbeit erledigen; Integration am Decoder stellt das ursprüngliche Signal wieder her. Codecs wie FLAC, Verkürzen Sie und TTA Gebrauch lineare Vorhersage zu Schätzung das Spektrum des Signals. Am Kodierer wird das Gegenteil des Abschätzers verwendet, um das Signal weiß zu werden, indem man spektrale Spitzen entfernt, während der Abschätzer benutzt wird, um das ursprüngliche Signal am Decoder wieder aufzubauen.

Lossless Audiocodecs haben keine Qualitätsausgaben, also kann die Brauchbarkeit vorbei geschätzt werden

  • Geschwindigkeit der Kompression und der Dekompression
  • Grad Kompression
  • Software- und Kleinteilunterstützung
  • Robustheit und Fehlerkorrektion

Lossy Audiokompression

Lossy Audiokompression wird in einer extrem breiten Benutzungsmöglichkeit verwendet. Zusätzlich zu den direkten Anwendungen (Spieler mp3 oder Computer), werden digital komprimierte Audioströme im meisten videoDVDs benutzt; digitales Fernsehen; strömende Mittel auf Internet; Satellit- und Kabelradio; und in zunehmendem Maße in den terrestrischen Radiosendungen. Lossy Kompression erzielt gewöhnlich weit grössere Kompression als lossless Kompression (Daten von 5 Prozent bis 20 Prozent des ursprünglichen Stromes, anstatt 50 Prozent bis 60 Prozent), indem sie weniger-kritische Daten wegwirft.

Die Innovation lossy der Audiokompression war zu verwenden Psychoakustik erkennen, daß nicht alle Daten in einem Audiostrom durch das menschliche Gehörsystem wahrgenommen werden können. Die meiste lossy Kompression verringert Wahrnehmungsredundanz durch erste kennzeichnende Töne, die als perceptually irrelevant gelten, das heißt, Töne, die sehr hart zu hören sind. Typische Beispiele schließen Hochfrequenzen oder Töne ein, die zur gleichen Zeit wie lautere Töne auftreten. Jene Töne werden mit verringerter Genauigkeit kodiert oder kodiert nicht an allen.

Während das Entfernen oder das Verringern dieser „unhearable“ Töne einen kleinen Prozentsatz der Spitzen erklären können, die in der lossy Kompression gespeichert werden, kommt die realen Sparungen von einem ergänzenden Phänomen: Geräuschformen. Das Verringern der Zahl den Spitzen, die benutzt werden, um ein Signal zu kodieren, erhöht die Menge von Geräuschen in diesem Signal. In Psychoakustik-gegründeter lossy Kompression ist der reale Schlüssel, die Geräusche „zu verstecken“, die durch die Spitze Sparungen in den Bereichen des Audiostromes erzeugt werden, der nicht wahrgenommen werden kann. Dieses wird vorbei zum Beispiel mit sehr eine geringe Anzahl Spitzen, die Hochfrequenzen der meisten Signale zu kodieren getan - nicht weil das Signal wenig Hochfrequenzinformationen (zwar ist dieses auch außerdem häufig zutreffend), hat, aber eher, weil das menschliche Ohr sehr laute Signale in dieser Region nur wahrnehmen kann, damit die weicheren „versteckten“ Töne dort einfach nicht gehört werden.

Wenn erzielt das Verringern von Wahrnehmungsredundanz nicht genügende Kompression für eine bestimmte Anwendung, es kann weitere lossy Kompression erfordern. Abhängig von der Audioquelle kann dieses möglicherweise nicht wahrnehmbare Unterschiede noch produzieren. Rede kann zum Beispiel zusammengedrückt werden weit mehr als Musik. Die meisten lossy Kompression Entwürfe erlauben, daß Kompression Parameter justiert werden, um eine Zielrate von Daten zu erzielen, normalerweise ausgedrückt als a übertragungsgeschwindigkeit. Wieder wird die Datenverdichtung durch irgendein Modell geführt von, wie wichtig der Ton ist, wie durch das menschliche Ohr, mit dem Ziel der Leistungsfähigkeit und der optimierten Qualität für die ZielDatenrate wahrgenommen. (Es gibt viele unterschiedliche Modelle, die für diese Wahrnehmungsanalyse benutzt werden, irgendein besseres entsprochen zu den unterschiedlichen Arten von Audio als andere.), folglich abhängig von den Bandbreite und Speicheranforderungen, kann der Gebrauch von lossy Kompression eine wahrgenommene Verkleinerung der Audioqualität ergeben, die von keinen bis zu strengem reicht, aber im Allgemeinen ist eine offensichtlich hörbare Verringerung der Qualität für Zuhörer nicht annehmbar.

Weil Daten während der lossy Kompression entfernt werden und nicht durch Dekompression zurückgewonnen werden können, können einige Leute möglicherweise nicht lossy Kompression für archivalische Ablage bevorzugen. Folglich, wie gemerkt, glätten Sie die, die lossy Kompression (für bewegliche Audioanwendungen, z.B.) können möchten ein losslessly komprimiertes Archiv für andere Anwendungen halten verwenden. Zusätzlich fährt die Technologie der Kompression fort vorzurücken, und das Erzielen einer state-of-the-art lossy Kompression würde ein erfordern, mit den lossless, ursprünglichen Audiodaten und der Kompresse mit dem neuen lossy Codec wieder anzufangen. Die Natur der lossy Kompression (für Audio und Bilder) ergibt zunehmende Verminderung der Qualität, wenn Daten dekomprimiert werden, dann recompressed mit lossy Kompression.

Geschichte

Eine große Vielzahl der realen, arbeitenden Audiokodierungsysteme wurde in einer Ansammlung im IEEE Journal auf vorgewählten Bereichen in den Kommunikationen (JSAC), Februar 1988 veröffentlicht. Während es etwas Papiere von vorher diesem mal gab, dokumentierte dieses Kompendium der Papiere eine gesamte Vielzahl der fertigen, arbeitenden Audiokodierer, fast alle das Verwenden Wahrnehmungs (d.h. verdecken) Techniken und irgendeine Art Fourier-Analyse und geräuschlose Hinterkodierung.[1] Mehrere dieser Papiere erwähnten auf der Schwierigkeit des Erreichens gut, sauberer digitaler Audio zu den Forschung Zwecken. Die meisten, wenn nicht alle, Autoren in der JSAC Ausgabe auch im Ausschuß des Audio MPEG-1 aktiv waren.

Das Audiosystem kompression erste kommerzielle Automatisierung Sendung der Welt wurde von Oscar Bonello, ein Technikprofessor an entwickelt Universität von Buenos Aires.[2] 1983 mit der psychoacoustic Grundregel der Maskierung der kritischen Bänder zuerst veröffentlicht 1967,[3] er fing an, eine praktische Anwendung zu entwickeln, die auf dem neuentwickelten basierte IBM PC Computer und das Sendung Automatisierung System wurden 1987 unter dem Namen ausgestoßen Audicom. 20 Jahre später, verwendeten fast alle Radiostationen in der Welt die ähnliche Technologie, hergestellt durch eine Anzahl von Firmen.

Kodierungmethoden

Wandeln Sie Gebiet Methoden um

Um festzustellen welche Informationen in einem Audiosignal perceptually irrelevant sind, wandelt der meiste lossy Kompression Algorithmusgebrauch wie um geänderter getrennter Kosinus wandeln um (MDCT) umwandeln Zeitgebiet probierte Wellenformen in ein umwandelngebiet. Sobald umgewandelt, gewöhnlich in Frequenzgebiet, können Teilfrequenzen sein zugeteilte Spitzen entsprechend, wie hörbar sie sind. Vernehmbarkeit der spektralen Bestandteile wird festgestellt, indem man zuerst a errechnet verdeckenschwelle, unter dem es geschätzt wird, klingt das ist über den Begrenzungen auf menschliche Vorstellung hinaus.

Die verdeckenschwelle ist das errechnete Verwenden Hörschwelle der Hörfähigkeit und die Grundregeln von simultane Maskierung - das Phänomen, worin ein Signal durch ein anderes Signal verdeckt wird, das durch Frequenz - und, in einigen Fällen getrennt wird, zeitliche Maskierung - wo ein Signal durch ein anderes Signal verdeckt wird, das bis zum Zeit getrennt wird. Gleich-Lautstärke Formen kann auch verwendet werden, den Wahrnehmungswert der unterschiedlichen Bestandteile zu belasten. Modelle der menschlichen Ohrgehirn Kombination, die solche Effekte enthält, werden häufig benannt psychoacoustic Modelle.

Zeit Gebiet Methoden

Andere Arten lossy Kompressoren, wie lineare vorbestimmte Kodierung (LPC) verwendet mit Rede, seien Sie Quelle-gegründete Kodierer. Diese Kodierer benutzen ein Modell des Klangerzeugers (wie der menschlichen vocal Fläche mit LPC) um das Audiosignal (, drücken Sie sein d.h. Spektrum), vor flach Quantelung weiß zu werden. LPC kann für eine grundlegende Wahrnehmungskodierungtechnik auch gehalten werden; Rekonstruktion eines Audiosignals, das ein lineares Kommandogerät verwendet, formt die Quantelunggeräusche des Kodierers in das Spektrum des Zielsignals und teilweise verdeckt es.

Anwendungen

Wegen der Natur der lossy Algorithmen, Audioqualität leidet, wenn eine Akte dekomprimiert wird und recompressed (Generations-Averluste). Dieses bildet lossy Kompression unpassend für die Speicherung der Zwischenresultate in den professionellen Audiotechnikanwendungen, wie Tonredigieren und Mehrspuraufnahme. Jedoch sind sie mit Endbenutzern sehr populär (besonders MP3), als Megabyte kann einer ungefähr Minute von Musik an der ausreichenden Qualität speichern den Wert.

Brauchbarkeit

Brauchbarkeit von lossy Audiocodecs wird vorbei festgestellt:

  • Wahrgenommene Audioqualität
  • Kompression Faktor
  • Geschwindigkeit der Kompression und der Dekompression
  • Zugehörige Latenz des Algorithmus (kritisch für strömende Anwendungen der Realzeit; sehen Sie unten)
  • Software- und Kleinteilunterstützung

Lossy Formate sind für die Verteilung des strömenden Audio oder die wechselwirkenden Anwendungen häufig benutzt (wie die Kodierung der Rede für digitales Getriebe in den Zelle Telefonnetzen). In solchen Anwendungen müssen die Daten als die Datenflüsse dekomprimiert werden, anstatt, nachdem der gesamte Datenstrom übertragen worden ist. Nicht alle Audiocodecs können für strömende Anwendungen benutzt werden, und für solche Anwendungen wird ein Codec, der entworfen ist, um zu strömen Daten effektiv, normalerweise gewählt.

Latenz resultiert aus den Methoden, die verwendet werden, um die Daten zu kodieren und zu decodieren. Etwas codecs analysieren ein längeres Segment der Daten, um Leistungsfähigkeit zu optimieren und kodieren es dann in gewissem Sinne, das ein größeres Segment von Daten auf einmal erfordert, um zu decodieren. (Häufig verursachen codecs die Segmente, die einen „Rahmen“, um getrennte Datensegmente für die Kodierung und die Decodierung zu verursachen. genannt werden), das zugehörige Latenz von der Kodierung kann der Algorithmus kritisch sein; z.B. wenn es Zweiweg gibt, verzögert Getriebe von Daten, wie mit einem Telefongespräch, bedeutend kann die wahrgenommene Qualität ernsthaft vermindern.

Im Gegensatz zu der Geschwindigkeit der Kompression, die zur Zahl Betrieben proportional ist, erforderte durch den Algorithmus, hier Latenz sich bezieht die auf Zahl Proben, die analysiert werden müssen, bevor ein Block von Audio verarbeitet wird. Im minimalen Fall ist Latenz nullproben 0 (z.B., wenn der Kodierer/der Decoder einfach die Zahl den Spitzen verringert, die quantize das Signal benutzt werden). Zeit Gebiet Algorithmen wie LPC auch haben häufig niedrige Latenz, folglich ihre Popularität in der Redekodierung für Telephonie. In den Algorithmen wie MP3 jedoch müssen viele Proben analysiert werden, um ein psychoacoustic Modell im Frequenzgebiet einzuführen, und Latenz ist auf dem Auftrag von Ms 23 (Ms 46 für Zweiwegkommunikation).

Redekodierung

Redekodierung ist eine wichtige Kategorie Audiodatenverdichtung. Die Wahrnehmungsmodelle, die benutzt werden, um zu schätzen, was ein menschliches Ohr hören kann, sind im Allgemeinen zu denen ein wenig unterschiedlich, die für Musik verwendet werden. Der Bereich der Frequenzen mußte die Töne einer menschlichen Stimme übermitteln sind normalerweise weit schmaler als der, der für Musik benötigt wurde, und der Ton ist normalerweise weniger kompliziert. Infolgedessen kann Rede an der Qualität mit verhältnismäßig niedrigen übertragungsgeschwindigkeiten kodiert werden.

Dieses wird, im allgemeinen durch irgendeine Kombination von zwei Annäherungen vollendet:

  • Nur kodierentöne, die durch eine einzelne menschliche Stimme gebildet werden konnten.
  • Mehr der Daten im Signal weg werfen -- Halten gerade genug, zum einer „verständlichen“ Stimme wieder aufzubauen anstatt der volle Frequenzbereich des Menschen Hörfähigkeit.

Möglicherweise waren die frühesten Algorithmen, die in der Redekodierung verwendet wurden (und in der Audiodatenverdichtung im allgemeinen) Ein-Gesetz Algorithmus und Μgesetz Algorithmus.

Glossar

ABR
Durchschnittliches bitrate
CBR
Konstantes bitrate
VBR
Variables bitrate

Hinweise

Sehen Sie auch

Externe Verbindungen

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence