Top 10 artikelen

Goole
Koreaanse thee
nasza-klasa.pl
Creditcardfraude
Het zingen
Misbruik
Muziek van Indonesië
Tchiluba
De Provincie van Balkh
Provincie van Balkh Thermische straling

News:

Audio compressie (gegevens)

Voor processen die de hoeveelheid tijd verminderen neemt het om te luisteren aan en een opname te begrijpen, ziet tijd-samengeperste toespraak.

Audio compressie is een vorm van gegevens compressie ontworpen om de grootte van te verminderen audio dossiers. Audio compressie algoritmen worden uitgevoerd in computersoftware zoals audio codecs. Generisch gegevens compressie de algoritmen presteren slecht met audiogegevens, zelden verminderend dossiergrootte veel onder 87% van origineel, en niet voor gebruik in echt - tijd ontworpen. Derhalve specifieke audio „lossless„en“verlieslijdendde „algoritmen zijn gecre�ërd. De verlieslijdende algoritmen verstrekken veel grotere compressieverhoudingen en in heersende stromings de audioapparaten van de consument gebruikt.

Zoals met beeld compressie, zowel worden de verlieslijdende als lossless compressiealgoritmen gebruikt in audiocompressie, het verlieslijdende zijn gemeenschappelijkst voor dagelijks gebruik. In zowel verlieslijdende als lossless compressie, wordt de informatieovertolligheid verminderd, gebruikend methodes zoals codage, patroonerkenning en lineaire voorspelling om de hoeveelheid informatie te verminderen die wordt gebruikt om de gegevens te beschrijven.

De inruil van lichtjes verminderde audiokwaliteit wordt duidelijk gecompenseerd voor de meeste praktische audiotoepassingen waar de gebruikers om het even welk verschil niet kunnen waarnemen en de ruimtevereisten wezenlijk worden verminderd. Bijvoorbeeld, op één CD, kan men een uur van hoge trouwmuziek, minder dan 2 losslessly samengeperste uren van muziek, of 7 uren van muziek passen die in MP3 formaat worden samengeperst.

Inhoud

Lossless audiocompressie

Aangezien de dossieropslag en de communicatie bandbreedte minder duur en meer beschikbaar zijn geworden, de populariteit van lossless formaten zoals De Audio van de aap, FLAC en Verkort scherp is gestegen, aangezien de mensen verkiezen om een permanent archief van hun audiodossiers te handhaven. De primaire gebruikers van lossless compressie zijn geweest audio ingenieurs, audiophiles en die consumenten die een nauwkeurig exemplaar van hun audiodossiers, in tegenstelling tot de onomkeerbare veranderingen van verlieslijdende compressietechnieken zoals willen bewaren Vorbis en MP3. De verhoudingen van de compressie zijn gelijkaardig aan die voor lossless gegevenscompressie (rond 50-60% van originele grootte). Lossless formaten zoals Dolby TrueHD ook worden geïntroduceerdb samen met hoge definitie DVD formaten.

Het is moeilijk om alle gegevens in een audiostroom te handhaven en wezenlijke compressie te bereiken. Eerst, is de overgrote meerderheid van correcte opnamen hoogst complex, geregistreerd van de echte wereld. Aangezien één van de belangrijkste methodes van compressie patronen en herhaling moet vinden, goed samen persen de chaotischere gegevens zoals audio niet. Op een gelijkaardige manier, foto's het kompres minder efficiënt met lossless methodes dan eenvoudigere door de computer geproduceerde beelden. Maar interessant, zelfs kunnen de computer geproduceerde geluiden bevatten zeer ingewikkeld golfvormen dat heden een uitdaging aan vele compressiealgoritmen. Dit is toe te schrijven aan de aard van audiogolfvormen, die over het algemeen moeilijk om zonder een (noodzakelijk verlieslijdende) omzetting in frequentieinformatie zijn te vereenvoudigen, zoals gepresteerd door het menselijke oor.

De tweede reden is dat waarden van audio steekproeven verandering zeer snel, zo generische gegevenscompressie algoritmen werk niet goed voor audio, en de koorden van opeenvolgende bytes verschijnen niet over het algemeen zeer vaak. Nochtans, winding met de filter [- 1 1] (namelijk nemend het eerste verschil) neigt lichtjes aan wit (decorrelate, maak) het spectrum vlak, daardoor toestaand traditionele lossless compressie bij de codeur om zijn werk te doen; de integratie bij de decoder herstelt het originele signaal. Codecs zoals FLAC, Verkort en TTA gebruik lineaire voorspelling aan raming het spectrum van het signaal. Bij de codeur, wordt het omgekeerde van de schatter gebruikt om het signaal te witten door spectrale pieken te verwijderen terwijl de schatter wordt gebruikt om het originele signaal bij de decoder opnieuw op te bouwen.

Lossless audiocodecs hebben geen kwaliteitskwesties, zodat kan de bruikbaarheid langs worden geschat

  • Snelheid van compressie en decompressie
  • Graad van compressie
  • De steun van de software en van de hardware
  • De correctie van de robuustheid en van de fout

Verlieslijdende audiocompressie

De verlieslijdende audiocompressie wordt gebruikt in een uiterst brede waaier van toepassingen. Naast de directe toepassingen (mp3 spelers of computers), worden de digitaal samengeperste audiostromen gebruikt in meest videoDVDs; digitale televisie; stromende media op Internet; satelliet en kabelradio; en meer en meer in aardse radiouitzendingen. De verlieslijdende compressie bereikt typisch veel grotere compressie dan lossless compressie (gegevens van 5 percenten aan 20 percent van de originele stroom, eerder dan 50 percenten aan 60 percenten), door minder-kritieke gegevens te verwerpen.

De innovatie van verlieslijdende audiocompressie moest gebruiken psycho-akoestiek om te erkennen dat niet alle gegevens in een audiostroom door het menselijke auditieve systeem kunnen worden waargenomen. De meeste verlieslijdende compressie vermindert op waarneming gebaseerde overtolligheid door eerste identificerende geluiden die perceptually als onbelangrijk worden beschouwd, namelijk klinkt dat is zeer moeilijk te horen. De typische voorbeelden omvatten hoge frequenties, of geluiden die tegelijk met luidere geluiden voorkomen. Die geluiden zijn gecodeerd met verminderde nauwkeurigheid die of niet bij allen wordt gecodeerd.

Terwijl het verwijderen van of het verminderen van deze „unhearable“ geluiden kan van een klein percentage beetjes rekenschap geven bewaard in verlieslijdende compressie, komt de echte besparingen uit een bijkomend fenomeen: lawaai het vormen. Het verminderen van het aantal beetjes die worden gebruikt om een signaal te coderen verhoogt de hoeveelheid lawaai in dat signaal. In op psycho-akoestiek-gebaseerde verlieslijdende compressie, moet de echte sleutel het lawaai „verbergen“ dat door de beetjebesparingen wordt geproduceerd op gebied van de audiostroom die niet kan worden waargenomen. Dit wordt bijvoorbeeld gedaan door, gebruikend zeer kleine aantallen beetjes om de hoge frequenties van de meeste signalen te coderen - niet omdat het signaal weinig hoge frequentieinformatie (hoewel dit ook vaak waar eveneens) is heeft, maar eerder omdat het menselijke oor zeer luide signalen in dit gebied kan slechts waarnemen, zodat de zachtere „verborgen“ geluiden daar eenvoudig niet worden gehoord.

Als het verminderen bereikt de op waarneming gebaseerde overtolligheid geen voldoende compressie voor een bepaalde toepassing, kan het verdere verlieslijdende compressie vereisen. Afhankelijk van de audiobron, kan dit nog waarneembare verschillen niet veroorzaken. De toespraak kan bijvoorbeeld worden samengeperst meer dan ver muziek. De meeste verlieslijdende compressieregelingen laten compressieparameters toe worden aangepast om een doeltarief gegevens, te bereiken dat gewoonlijk als a wordt uitgedrukt beetje tarief. Opnieuw, zal de gegevensvermindering door één of ander model van worden geleid hoe belangrijk het geluid zoals die door het menselijke oor, met het doel van efficiency en geoptimaliseerde kwaliteit voor het tarief van doelgegevens is wordt waargenomen. (Er zijn vele verschillende modellen die voor deze op waarneming gebaseerde analyse, sommige beter geschikte aan verschillende soorten audio worden gebruikt dan anderen.) vandaar, afhankelijk van de bandbreedte en opslagcapaciteiten, kan het gebruik van verlieslijdende compressie in een waargenomen vermindering van de audiokwaliteit resulteren die zich van niets aan streng uitstrekt, maar over het algemeen is een duidelijk hoorbare vermindering van kwaliteit onaanvaardbaar voor luisteraars.

Omdat het gegeven tijdens verlieslijdende compressie wordt verwijderd en door decompressie niet kan worden teruggekregen, kunnen sommige mensen geen verlieslijdende compressie voor archivistische opslag verkiezen. Vandaar, zoals genoteerd, zelfs zij die verlieslijdende compressie gebruiken (voor draagbare audiotoepassingen, bijvoorbeeld) kunnen wensen om een losslessly samengeperst archief voor andere toepassingen te houden. Bovendien blijft de technologie van compressie vooruitgaan, en het bereiken van een overzichts verlieslijdende compressie zou men om opnieuw met de lossless, originele audiogegevens en het kompres met nieuwe verlieslijdende codec vereisen te beginnen. De aard van verlieslijdende compressie (voor zowel audio als beelden) resulteert in stijgende degradatie van kwaliteit als de gegevens worden gedecompresseerd, dan recompressed het gebruiken van verlieslijdende compressie.

Geschiedenis

Een grote verscheidenheid van echte, werkende audiocodagesystemen werd gepubliceerd in een inzameling in het IEEE- Dagboek op Geselecteerde Gebieden in Mededelingen (JSAC), Februari 1988. Terwijl er sommige documenten van vóór die tijd waren, documenteerde dit compendium van documenten een volledige verscheidenheid van gebeëindigde, werkende audiocodeurs, bijna allemaal op waarneming gebaseerd gebruiken (d.w.z. het masking) technieken en één of ander soort frequentieanalyse en achterste deel geruisloze codage.[1] Verscheidene van deze documenten die op de moeilijkheid om goede, schone digitale audio voor onderzoekdoeleinden te verkrijgen worden opgemerkt. De meesten, als niet iedereen, van de auteurs in de uitgave JSAC waren ook actief in de mpeg-1 Audiocommissie.

Het van de de uitzendingsautomatisering van de wereld eerste commerciële audio de compressiesysteem werd ontwikkeld door Oscar Bonello, een professor van de Techniek bij Universiteit van Buenos aires.[2] In 1983, gebruikend het psychoacoustic principe van het maskeren van kritieke banden die eerst in 1967 worden gepubliceerd,[3] hij begon een praktische toepassing te ontwikkelen die op onlangs ontwikkeld wordt gebaseerd PC VAN IBM de computer, en het systeem van de uitzendingsautomatisering werden gelanceerd in 1987 onder de naam Audicom. 20 later jaar, bijna gebruikten alle radioposten in de wereld gelijkaardige technologie, die door een aantal bedrijven wordt vervaardigd.

De methodes van de codage

Het domeinmethodes van de transformatie

om te bepalen welke informatie in een geluidssignaal perceptually onbelangrijk is, gebruiken de meeste verlieslijdende compressiealgoritmen transformaties zoals gewijzigde afzonderlijke cosinustransformatie (MDCT) om om te zetten tijd domein bemonsterde golfvormen in een transformatiedomein. Zodra omgezet, typisch in frequentie domein, kunnen de componentenfrequenties toegewezen beetjes volgens zijn hoe hoorbaar zij zijn. De hoorbaarheid van spectrale componenten wordt bepaald door eerst te berekenen a maskerende drempel, onder wat men schat dat de geluiden voorbij de grenzen van menselijke waarneming zullen zijn.

De maskerende drempel is het berekende gebruiken absolute drempel van hoorzitting en de principes van het gelijktijdige maskeren - het fenomeen waarin een signaal door een ander signaal gemaskeerd wordt dat door frequentie wordt gescheiden - en, in sommige gevallen, het tijdelijke maskeren - waar een signaal door een ander signaal gemaskeerd wordt dat tegen tijd wordt gescheiden. De contouren van de gelijk-luidheid kan ook worden gebruikt om het op waarneming gebaseerde belang van verschillende componenten te wegen. De modellen van menselijke oor-hersenen de combinatie die dergelijke gevolgen opneemt worden vaak geroepen psychoacoustic modellen.

Het domeinmethodes van Time

Andere types van verlieslijdende compressoren, zoals lineaire vooruitlopende codage (LPC) gebruikt met toespraak, zijn op bron-gebaseerde codeurs. Deze codeurs gebruiken een model van de correcte generator (zoals het menselijke aanzetstuk met LPC) om het geluidssignaal (d.w.z., vlak zijn spectrum af) voorafgaand aan kwantificatie te witten. LPC kan ook van als fundamentele op waarneming gebaseerde codagetechniek worden gedacht; de wederopbouw van een geluidssignaal dat een lineaire voorspeller met behulp van geeft het de kwantificatielawaai van de codeur in het spectrum van het doelsignaal gestalte, gedeeltelijk maskerend het.

Toepassingen

wegens de aard van verlieslijdende algoritmen, audio kwaliteit lijdt wanneer een dossier wordt gedecompresseerd en recompressed (generationalverliezen). Dit maakt verlieslijdende compressie ongeschikt voor het opslaan van de tussentijdse resultaten in professionele audiotechniektoepassingen, zoals het correcte uitgeven en multitrack opname. Nochtans, zijn zij zeer populair met eind - gebruikers (in het bijzonder MP3), als megabyte kan over de waarde van een minuut van muziek bij adequate kwaliteit opslaan.

Bruikbaarheid

De bruikbaarheid van verlieslijdende audiocodecs wordt bepaald door:

  • Waargenomen audiokwaliteit
  • De factor van de compressie
  • Snelheid van compressie en decompressie
  • Inherente latentie van kritiek algoritme (voor het stromen toepassingen in real time; zie verder)
  • De steun van de software en van de hardware

De verlieslijdende formaten worden vaak gebruikt voor de verspreiding van het stromen audio, of interactieve toepassingen (zoals de codage van toespraak voor digitale transmissie in de netwerken van de celtelefoon). In dergelijke toepassingen, moeten de gegevens als gegevensstromen, eerder dan worden gedecompresseerd nadat de volledige gegevensstroom is overgebracht. Niet kunnen alle audiocodecs voor het stromen toepassingen worden gebruikt, en voor dergelijke toepassingen zal codec die aan stroomgegevens effectief wordt ontworpen gewoonlijk gekozen worden.

De resultaten van de latentie van de methodes die worden gebruikt om de gegevens te coderen en te decoderen. Sommige codecs zullen een langer segment gegevens analyseren om efficiency te optimaliseren, en dan het te coderen op een manier die een groter segment in één keer gegevens vereist te decoderen. (Codecs cre�ër vaak segmenten genoemd een „kader“ om afzonderlijke gegevenssegmenten tot stand te brengen voor het coderen en het decoderen.) Inherent latentie van de codage kan het algoritme kritiek zijn; bijvoorbeeld, wanneer er bidirectionele transmissie van gegevens, zoals met een telefoongesprek is, kunnen de significante vertragingen de waargenomen kwaliteit ernstig degraderen.

In tegenstelling tot de snelheid van compressie, die aan het aantal verrichtingen die door het algoritme worden vereist evenredig is, hier verwijst de latentie naar het aantal steekproeven dat moet worden geanalyseerd alvorens een blok van audio wordt verwerkt. In het minimumgeval, is de latentie 0 nul steekproeven (b.v., als de codeur/de decoder eenvoudig het aantal beetjes verminderen die worden gebruikt om het signaal) te kwantiseren. De het domeinalgoritmen van Time zoals LPC ook hebben vaak lage latentie, vandaar hun populariteit in toespraakcodage voor telefonie. In algoritmen zoals MP3, echter, moet een groot aantal steekproeven worden geanalyseerd om een psychoacoustic model in het frequentiedomein uit te voeren, en de latentie is op de orde van Mej. 23 (Mej. 46 voor bidirectionele mededeling).

Het coderen van de toespraak

Het coderen van de toespraak is een belangrijke categorie van audiogegevenscompressie. De op waarneming gebaseerde modellen die worden gebruikt om te schatten wat een menselijk oor kan horen zijn over het algemeen enigszins verschillend van die gebruikt voor muziek. De waaier van frequenties nodig om de geluiden van een menselijke stem te vervoeren is normaal veel smaller dan dat nodig voor muziek, en het geluid is normaal minder complex. Dientengevolge, kan de toespraak bij uitstekende kwaliteit worden gecodeerd gebruikend vrij lage beetjetarieven.

Dit wordt verwezenlijkt, in het algemeen, door één of andere combinatie van twee benaderingen:

  • Het coderen slechts geluiden die door één enkele menselijke stem zouden kunnen worden gemaakt.
  • Weg het werpen van meer van de gegevens in het signaal -- het houden enkel genoeg om een „begrijpelijke“ stem eerder dan de volledige frequentiewaaier van mens opnieuw op te bouwen hoorzitting.

Misschien waren de vroegste algoritmen die in toespraak het coderen (en audiogegevenscompressie in het algemeen worden gebruikt) A-wet algoritme en µ-wet algoritme.

Verklarende woordenlijst

ABR
Gemiddelde bitrate
CBR
Constante bitrate
VBR
Veranderlijke bitrate

Verwijzingen

Zie ook

Externe verbindingen

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence