Top 10 artiklarna

Squier '51
Badoo
Fluid dynamik
/ma/enwiki/sv/nasza-klasa.pl
Fransk konjugation
Odnoklassniki.ru
Sora Aoi
Alnico
Kanokkorn Jaicheun
Aggregatibacter actinomycetemcomitans

News:

Ljudsignalkompression (data)

För bearbetar, som förminskar tidsperioden som, det tar för att lyssna till och förstå en inspelning, ser tajma-komprimerat anförande.

Ljudsignalkompression är en bilda av datakompression planlade att förminska storleksanpassa av ljudsignal sparar. Ljudsignalkompression algoritmer genomföras i datorprogramvara som ljudsignalcodecs. Generiskt datakompression algoritmer utför dåligt med ljudsignaldata som sällan är förminskande, spara storleksanpassar mycket nedanför 87% av original och planläggs inte för bruk i real-time. Därför specifik ljudsignal ”,lossless”och”,lossy”har algoritmer skapats. Lossy-algoritmer ger långt mer stor kompressionsförhållanden och används i konventionella konsumentljudsignalapparater.

Som med avbilda kompression, både lossy och lossless kompressionsalgoritmer används i ljudsignalkompression, lossy som är den mest allmänningen för dagligt bruk. I både lossy och lossless kompression förminskas informationsöverflöd, genom att använda metoder liksom att kodifiera, mönstrar erkännande, och den linjära förutsägelsen som förminskar det van vid beloppet av information, beskriver datan.

Kompromissen av litet kvalitets- förminskad ljudsignal vägas mycket än klart för mest praktiska ljudsignalapplikationer var användare kan inte märka någon skillnad och utrymmekrav förminskas väsentligen. Till exempel på en CD, formaterar en canpassform i timmen av kicktrohetmusik, mer mindre än 2 komprimerade timmar av musik losslessly eller 7 komprimerade timmar av musik i MP3.

Tillfredsställer

Lossless ljudsignalkompression

Som sparar lagring och kommunikationer som bandbredden har blivit mindre dyr och mer tillgänglig, formaterar populariteten av lossless liksom Apa ljudsignal, FLAC och Förkorta har ökat skarpt, som folket väljer att underhålla en permanent arkiverar av deras ljudsignal sparar. De primära användarena av lossless kompression har varit ljudsignal iscensätter, kopierar audiophiles och de konsumenter, som önskar till sylten en avkräva, av deras ljudsignal sparar, i kontrast till de irreversible ändringarna från lossy-kompressionstekniker liksom Vorbis och MP3. Kompressionsförhållanden är liknande till de för lossless datakompression (omkring 50-60% av original storleksanpassar). Lossless formaterar liksom Dolby TrueHD introduceras också tillsammans med kickdefinition DVD formaterar.

Det är svårt att underhålla alla data i en ljudsignal strömmer och uppnår verklig kompression. Först är stora majoriteten av solida inspelningar högt komplex, antecknat från verklig värld. Som en av de nyckel- metoderna av kompression är att finna mönstrar och, upprepning, mer kaotisk data liksom ljudsignal inte kompressbrunnen. I ett liknande sätt, fotograferar kompress som mindre med lossless metoder än enklare computer-generated avbildar effektivt. Men interestingly, även låter den frambragda datoren kan innehålla mycket invecklat waveforms den gåva en utmaning till många kompressionsalgoritmer. Denna är naturen av ljudsignalwaveforms, som är allmänt svåra att förenkla utan omvandling för a (nödvändigtvis lossy) till information om frekvens, som utfört av människan gå i ax tack vare.

Understödja resonerar är som värderar av ljudsignal tar prov ändra mycket snabbt, så generisk datakompression algoritmer fungera inte väl för ljudsignal och stränger av byte i rad syns inte allmänt mycket ofta. Emellertid, invecklad sak med filtrera [- 1 1] (som är som tar den första skillnaden) ansar till litet whiten (decorrelategör lägenheten) spectrumen som låter därmed traditionell lossless kompression på kodaren göra dess jobb; integration på avkodaråterställandena som original signalerar. Codecs liksom FLAC, Förkorta och TTA bruk linjär förutsägelse till bedömning spectrumen av signalera. På kodaren värderingsman är omvändning van vid whiten signalera, genom att ta bort som är spektral-, nå en höjdpunkt stunder som värderingsmannen är van vid rekonstruerar original signalerar på avkodaren.

Lossless ljudsignalcodecs har inget kvalitets- utfärdar, så användbarheten kan beräknas by

  • Rusat av kompression och dykarsjuka
  • Grad av kompression
  • Programvaru- och maskinvaruservice
  • Robusthet- och felkorrigering

Lossy-ljudsignalkompression

Lossy-ljudsignalkompression används i extremt en lång räcka av applikationer. Förutom riktaapplikationerna (spelare mp3 eller datorer), strömmer digitalt komprimerad ljudsignal används i mest videopd DVDs; digital television; strömma massmedia på internet; satellit- och kabel radiosände; och mer och mer i terrestrial radiosände TV-sändning. Lossy-kompression uppnår typisk långt mer stor kompression än lossless kompression (data av 5 procent till 20 procent av original strömmer, i stället för 50 procent till 60 procent), genom att kassera mindre-kritiska data.

Innovationen av lossy-ljudsignalkompression var att använda psychoacoustics att känna igen, att inte alla data i en ljudsignal strömmer, kan märkas av det hörsel- systemet för människan. Mest lossy-kompression förminskar perceptuellt överflöd, genom först att identifiera, låter, som är ansett perceptuellt ovidkommande, det är, låter det är mycket hård att höra. Typiska exempel inkluderar kickfrekvenser eller låter som uppstår samtidigt, som högt, låter. De låter kodifieras med minskad exakthet eller kodifieras inte alls.

Den förminskande stunden som tar bort eller dessa ”unhearable”, låter kan redogöra för en liten procentsats av bitar sparade i lossy-kompression, de verkliga besparingarna kommer från ett kompletterande fenomen: stoja att forma. Förminskande kodifierar numrera av van vid bitar förhöjningar för en signalera som beloppet av stojar signalerar däri. I psychoacoustics-baserad lossy-kompression är det verkliga nyckel- ”att dölja” stoja som frambrings av, bet besparingar i områden av ljudsignalen strömmer som kan inte märkas. Detta göras vid, för anföra som exempel, genom att använda mycket litet numrerar av bitar för att kodifiera kickfrekvenserna av mest signalerar - inte därför att signalera har lite information om kickfrekvens (though denna är också ofta riktig som väl), men ganska, därför att människan gå i ax kan endast märka signalerar mycket högt i denna region, så att mer mjuk låter ”dolt” där enkelt inte hörs.

Om förminskande perceptuellt överflöd inte uppnår tillräcklig kompression för en särskild applikation, kan det kräva mer ytterligare lossy-kompression. Beroende av ljudsignalkällan kan denna stillbild inte märkbara skillnader för jordbruksprodukter. Anförande for example kan vara komprimerat långt mer än musik. Mest lossy-kompressionsintriger låter kompressionsparametrar justeras för att uppnå en uppsätta som mål klassar av data, vanligt uttryckt som a bet klassar. Igen ska dataförminskningen vägledas av något modellerar av, hur viktigt det solitt är, som märkt av människan gå i ax, med målet av effektivitet, och optimerat kvalitets- för uppsätta som måldatan klassar. (Det finns många olikt modellerar använt för denna perceptuella analys, något bättre anpassat till olika typer av ljudsignal än andra.), Hence beroende av bandbredd- och lagringskraven, kan bruket av lossy-kompression resultera i en märkt förminskning av den kvalitets- ljudsignalen som spänner från inga till strängt, men allmänt är en självfallet hörbar förminskning i kvalitets- oacceptabel till lyssnare.

Därför att data tas bort under lossy-kompression och kan inte återställas av dykarsjuka, kan något folk inte föredra lossy-kompression för arkivlagring. Even de som använder lossy-kompression (för bärbara ljudsignalapplikationer, till exempel) kan önska till uppehället som, ett losslessly komprimerat arkiverar för andra applikationer, Hence, som noterat. I tillägg fortsätter teknologin av kompression till för-, och uppnå state-of-the-art en skulle lossy-kompression kräv en att börja igen med de lossless original- ljudsignaldatan och kompressen med den nya lossy-codecen. Naturen av resultat för lossy-kompression (för både ljudsignal och avbildar), i ökande degradering av kvalitets-, om data decompresseds, då recompressed genom att använda lossy-kompression.

Historia

En stor variation av verklig funktionsduglig ljudsignal som kodifierar system, publicerades i en samling i IEEEN förar journal över på utvalda områden i kommunikationer (JSAC), Februari 1988. Stunder där var någon legitimationshandlingar från för den tid, detta kompendium av legitimationshandlingar dokumenterade en hel variation av färdiga funktionsdugliga ljudsignalcoders, nästan alla dem att använda som var perceptuellt (dvs. maskera) tekniker och någon sort av frekvensanalys och back-end noiseless kodifiera.[1] Flera av dessa legitimationshandlingar som anmärkas på svårigheten av att erhålla goda, ren digital ljudsignal för forskning, ämnar. Mest, om inte alla, författarna i JSAC-upplagan var också aktivet i kommittén för ljudsignal MPEG-1.

Världens det första systemet för kompression för ljudsignal för automation för reklamfilmTV-sändning framkallades av Oscar Bonello, en iscensätta professor på Universitetar av Buenos Aires.[2] I 1983 genom att använda den psychoacoustic principen av maskera av kritiska musikband som publiceras först i 1967,[3] han startade framkallning en praktisk applikation som baserades på det nyutvecklat IBM PC datoren och TV-sändningautomationsystemet lanserades i 1987 under det känt Audicom. 20 mer sistnämnda år, använde nästan alla radiostationer i världen liknande teknologi som tillverkades av ett nummer av företag.

Kodifiera metoder

Omforma områdesmetoder

För att att bestämma vilken information i en ljudsignal signalerar, är perceptuellt ovidkommande, mest lossy-kompressionsalgoritmer som bruk omformar liksom den ändrade åtskilda cosinen omformar (MDCT) att konvertera tidområde tog prov waveforms in i ett omformningsområde. När omformat, typisk in i frekvensområde, kan del- frekvenser vara tilldelade bitar enligt hur hörbart de är. Audibility av spektral- delar är beslutsam vid första beräkna a maskera ingången, nedanfört, som det beräknas att låter ska, var den det okända begränsar av människaföreställning.

Den maskera ingången är beräknat använda evig sanningingång av utfrågning och principerna av samtidigt maskera - fenomen, där en signalera maskeras av another, signalerar avskilt av frekvens - och, i vissa fall, temporal maskera - var en signalera maskeras av another signalerar avskilt vid tid. Jämlike-loudness drar upp konturernaa av kan också vara van vid väger den perceptuella betydelsen av olika delar. Modellerar av den sådan inkorporeringen för människagå i ax-hjärna kombination verkställer kallas ofta psychoacoustic modellerar.

Time områdesmetoder

Andra typer av lossy-kompressorer, liksom linjärt predictive kodifiera Använt med anförande, var, (LPC) källa-baserade coders. Dessa coders använder en modellera av den sounds generatorn (liksom det röst- området för människan med LPC) för att whiten ljudsignalen signalerar (, släta dvs. dess spectrum ut), före quantization. LPC kan också tänkas av som en grundläggande perceptuell kodifiera teknik; rekonstruktion av en ljudsignal signalerar genom att använda en linjär spåman formar coder'sens quantization stojar in i spectrumen av uppsätta som mål signalerar och delvist att maskera den.

Applikationer

Tack vare naturen av lossy-algoritmer, kvalitets- ljudsignal lider, när en spara decompresseds och recompressed (generational förluster). Detta gör lossy-kompression olämplig för att lagra de mellanliggande resultaten i yrkesmässig ljudsignal som iscensätter applikationer, liksom solitt redigera och multitrack inspelning. Emellertid är de mycket populära med avslutar - användare (bestämt MP3) som en megabyte kan lagra omkring en minuts värd av musik på adekvat kvalitets-.

Användbarhet

Användbarhet av lossy-ljudsignalcodecs är beslutsam by:

  • Kvalitets- märkt ljudsignal
  • Kompression dela upp i faktorer
  • Rusat av kompression och dykarsjuka
  • Naturlig latency av algoritmen (som är kritisk för real-time som strömmer applikationer; se nedanfört),
  • Programvaru- och maskinvaruservice

Lossy formaterar används ofta för fördelningen av att strömma ljudsignal eller växelverkande applikationer (liksom kodifiera av anförande för den digitala överföringen i cell ringa knyter kontakt). I sådan applikationer måste överförts har datan decompresseds som dataflödena, i stället för, efter de hela datan har strömmt. Inte alla ljudsignalcodecs kan användas för att strömma applikationer, och för sådan applikationer väljs en codec som planläggs för att strömma data som effektivt vanligt ska.

Latency resulterar från de van vid metoderna kodar och avkoda datan. Några ska codecs analyserar ett längre segmenterar av datan för att optimera effektivitet och kodifierar därefter den i ett sätt som kräver ett större segmenterar av data på en tid för att avkoda. (Codecs skapar ofta segmenterar kallat ”inramar” för att skapa åtskilda data segmenterar för kodning och avkodning.), det naturligt latency av den kodifiera algoritmen kan vara kritiskt; till exempel när det finns tvåvägs, kan överföringen av data, liksom med en ringakonversation, viktiga fördröjningar allvarligt degradera det märkte kvalitets-.

I kontrast till som rusades av kompression, som är proportionell till numrera av funktioner, krävde vid algoritmen, latency ser här till numrera av tar prov som måste analyseras, för ett kvarter av ljudsignal bearbetas. I det minimum fallet är latency 0 nolla tar prov (, om coderen/avkodaren förminskar enkelt numrera av van vid bitar, quantize e.g. signalera). Time områdesalgoritmer liksom LPC också har ofta låga latencies, hence deras popularitet i anförande som kodifierar för telefoni. I algoritmer liksom MP3 emellertid som är ett stort nummer av tar prov måste att analyseras för att genomföra ett psychoacoustic modellerar i frekvensområdet, och latency är på beställa av 23 ms (46 ms för tvåvägskommunikation).

Anförandeencoding

Anförandeencoding är en viktig kategori av ljudsignaldatakompression. Det perceptuellt modellerar den van vid bedömningen en vilken människa gå i ax kan höra är allmänt något olik från de som används för musik. Spänna av frekvenser som behövs för att framföra, låter av en människa uttrycker är normalt långt mer smal än det som behövs för musik, och det solitt är normalt mindre komplex. Som ett resultat kan anförande kodas på highqualityen som använder bet förhållandevis low, klassar.

Detta är fulländat, i allmänhet, vid någon kombination av två att närma sig:

  • Endast koda låter som kunde göras av en singelmänniska uttrycker.
  • Kasta bort mer av datan i signalera -- att hålla precis nog som rekonstruerar ”ett begripligt”, uttrycker, i stället för den fulla frekvensen spänner av människa utfrågning.

Kanske var de tidigaste algoritmerna som användes i anförandeencoding (och ljudsignaldatakompression i allmänhet) En-lag algoritm och µ-lag algoritm.

Ordlista

ABR
Genomsnittlig bitrate
CBR
Konstant bitrate
VBR
Variabelbitrate

Hänvisar till

Se också

Utsidan anknyter

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence