頂10篇文章

土豆
烏龜
薑黃
Gmail
第二次世界大戰
DirectX
光合作用
菲律賓
第一次世界大戰
板岩

News:

音頻壓縮法(數據)

為減少時間它採取聽對并且瞭解錄音的過程,看見 時間壓縮的講話.

音頻壓縮法 是形式 數據壓縮 設計減少大小 音頻文件. 音頻壓縮法 算法 在計算機軟件被實施 音頻編解碼器. 普通 數據壓縮 算法不足執行以音頻數據,很少減少文件大小在87%原物以下和沒有設計用於真正的時間。 結果,具體音頻「lossless「并且」lossy「算法被創造了。 Lossy算法提供更加巨大的壓縮比和用於主流消費者音頻設備。

和與 圖像壓縮 lossy和無損壓縮算法用於音頻壓縮法, lossy是最共同的為日常使用。 在lossy和無損壓縮,信息多餘減少,運用方法例如編制程序、圖案識別和線性預言減少用於的信息量描述數據。

輕微地減少的音頻質量交易為多數實用音頻應用清楚地勝過,用戶不可能察覺任何區別,并且空間需要極大地減少。 例如,在一CD,你可能適合1小時高保真度的音樂,少於音樂被壓縮的2個小時losslessly,或者在MP3音樂壓縮的7個小時格式化。

內容

Lossless音頻壓縮法

文件存儲和通信帶寬變得較不昂貴和更加可利用, lossless格式大眾化例如 猴子的音頻, FLAC 并且 縮短 因為人們選擇維護他們的音頻文件,一個永久檔案增加了尖銳。 無損壓縮的主要用戶是 音頻工程師想要保存他們的音頻文件的一個確切的拷貝的audiophiles和那些消費者,與從有損壓縮技術的不可逆變化對比例如 Vorbis 并且 MP3. 壓縮比於那些是相似的為lossless數據壓縮(大約50-60%原始尺寸)。 Lossless格式例如 杜比TrueHD 與高定義一起也被介紹 DVD 格式。

維護所有數據在音頻小河和達到堅固壓縮是難的。 首先,大多數錄音是高度複雜的,從真實世界記錄。 因為其中一個壓縮關鍵方法是發現樣式和重複,更加混亂的數據例如音頻不很好壓縮。 以相似的方式, 相片 壓縮較少以lossless方法比更加簡單的計算機造出的圖像高效率地。 但有趣的是,甚而計算機造出的聲音可能包含非常複雜 信號波形 那個禮物一個挑戰到許多壓縮算法。 這歸結於音頻信號波形的本質,沒有a (必要lossy)轉換嚮頻率信息,一般是難簡化,如由人的耳朵執行。

第二個原因是音頻的價值 樣品 改變非常迅速,那麼普通數據壓縮 算法 不要為音頻很好工作,并且連貫字節串經常一般沒出現。 然而, 捲積 用過濾器[- 1 1] (即採取第一個區別)趨向對輕微地 漂白 (decorrelate做艙內甲板)光譜,從而允許傳統無損壓縮在編碼器做它的工作; 綜合化在譯碼器恢復原始的信號。 編解碼器例如 FLAC, 縮短 并且 TTA 用途 線性預言 估計 信號的光譜。 在編碼器,去除鬼峰頂用於估計物的反面漂白信號,當估計物使用重建原始的信號在譯碼器時。

Lossless音頻編解碼器沒有質量問題,因此實用性可以估計

  • 壓縮和解壓的速度
  • 程度壓縮
  • 軟件和硬件支持
  • 強壯和錯誤校正

Lossy音頻壓縮法

Lossy音頻壓縮法用於一個極端寬應用範圍。 除直接應用之外(MP3播放器或計算機),數字式地壓縮的音頻小河用於多數錄影DVDs; 數字式電視; 流出的媒介在 互聯網; 衛星和纜繩收音機; 并且越來越在地球無線電廣播。 有損壓縮通過放棄重要數據比無損壓縮(5%到原始的小河的20%數據,而不是50%到60%)典型地達到更加偉大的壓縮。

lossy音頻壓縮法的創新是使用 心聲學 認為不是所有的數據在音頻小河可以由人的聽覺系統察覺。 多數有損壓縮由感知被考慮毫不相關,即,聲音是非常堅硬聽見的第一辨認聲音減少感知多餘。 典型的例子包括發生,在更加大聲的聲音的同時的高頻率或者聲音。 那些聲音編碼以減少的準確性或根本沒有被編碼。

當去除或減少這些『unhearable』聲音也許佔在有損壓縮時保存的位的小百分比,真正的儲款來自一種補全現象: 噪聲塑造. 減少用於的位的數量編碼信號在那個信號增加相當數量噪聲。 在基於心聲學的有損壓縮,真正的鑰匙是『掩藏』位儲款引起的噪聲在不可能被察覺音頻小河的範圍。 這做,例如,使用非常很小數量的位編碼高頻率多數信號-沒有,因為信號有一點高頻率信息(雖則這也是經常真實的),但寧可,因為人的耳朵在這個區域可能只察覺非常大聲的信號,因此『暗藏的』更軟的聲音那裡沒簡單地聽見。

如果減少感知多餘不達到充足的壓縮為一種特殊應用,它也許要求進一步有損壓縮。 根據音頻來源,這可能不仍然引起可認識區別。 講話比音樂可以例如被壓縮更多。 允許壓縮參量調整多數有損壓縮計劃達到數據的目標率,通常被表示為a 數位速率. 再次,數據減少將由某一模型怎樣引導重要聲音是如由人的耳朵察覺,打算效率和優化質量為目標數據速率。 (比其他有用於這感知分析的許多不同的模型,某一好適合與音頻的不同的類型。)因此,根據帶寬和儲藏需要,對有損壓縮的用途也許導致從無範圍到嚴厲音頻質量的被察覺的減少,但一般明顯地可聽見的減少進入質量對聽眾是不能接受的。

由於數據被取消在有損壓縮期間,并且不可能由解壓恢復,某些人可能不更喜歡有損壓縮為檔案庫存儲器。 因此,如被注意,平衡使用有損壓縮的那些人(例如為便攜式的音頻應用)也許希望保留一個losslessly壓縮的檔案為其他應用。 另外,壓縮技術繼續推進,并且達到科技目前進步水平有損壓縮將要求你從lossless,原始的音頻數據和壓縮再開始以新的lossy編解碼器。 有損壓縮的本質(為音頻和圖像)導致質量的增長的退化,如果數據被解壓,然後使用有損壓縮recompressed。

歷史

真正,運作的音頻編碼制大品種在一件收藏品在卡普坦選區, 1988年2月在IEEE學報在通信(JSAC)被出版了。 當以前有一些紙從那時候時,紙這個綱要提供了整個品種完成的,工作的音頻編碼人,幾乎所有使用感知(即。 掩沒的)技術和頻率分析和後端無聲的編制程序。[1] 幾個這些之中文章關於困難獲得好,乾淨的數字式音頻陳述了為研究目的。 多數,如果不所有,作者在JSAC編輯也是活躍在MPEG-1音頻委員會裡。

世界的第一個商業廣播自動化音頻壓縮法系統由Oscar ・ Bonello,工程學教授開發在 布宜諾斯艾利斯大學 .[2] 1983年,使用掩沒的psychoacoustic原則重要帶1967年首先出版的,[3] 他開始開發根據的一個實際應用最近被開發 IBM個人計算機 計算機1987年和廣播自動化系統被發射了以名義 Audicom. 20年後,幾乎所有電臺在世界使用相似的技術,製造由很多家公司。

編制程序方法

變換領域方法

為了確定什麼信息在音頻信號感知是毫不相關的,多數有損壓縮算法用途變換例如 修改過的分離餘弦變換 (MDCT)轉換 時間界域 被抽樣的信號波形到變換領域裡。 一旦變換,典型地成 頻域組分頻率可以是分配的位根據怎樣可聽見他們是。 鬼組分的成音度取決於首先計算a 掩沒的門限在之下它估計那聽起來將是在人感知之外極限。

掩沒的門限使用被計算 聽力刺激閾 并且原則 同時掩沒 -現象,信號由頻率分離的另一個信號掩沒-和,在某些情況下, 世俗掩沒 -信號由時間以前的地方分離的另一個信號掩沒。 相等大聲等高 可以也使用衡量不同的組分的感知重要性。 合併這樣作用的人的耳朵腦子組合的模型經常叫 psychoacoustic模型.

時間界域方法

lossy壓縮機的其他類型,例如 線性有預測性的編制程序 (LPC)使用以講話,是 基於來源的編碼人. 這些編碼人使用聲波發生器的模型(例如人的聲道與LPC)在量子化之前漂白音頻信號(即,鋪平它的光譜)。 LPC也許也被重視作為一個基本的感知編程技術; 一個音頻信號的重建使用一個線性預報因子塑造編碼人的量子化噪聲在,部份地掩沒它的目標信號的光譜。

應用

由於lossy算法的本質, 音頻質量 遭受,當文件被解壓時并且recompressed (世代損失)。 這使有損壓縮不合適為存放中間結果在專業音頻工程學應用,例如聲音編輯和多聲道錄音。 然而,他們是非常普遍的終端用戶(特別 MP3),作為一兆字節能存放一分鐘的價值音樂在充分質量。

實用性

lossy音頻編解碼器的實用性被確定:

  • 被察覺的音頻質量
  • 壓縮因素
  • 壓縮和解壓的速度
  • 算法固有潛在因素(重要為實時流出的應用; 下面看見)
  • 軟件和硬件支持

Lossy格式為流出的音頻的發行或者相互作用應用是常用的(例如講話編制程序為數字傳輸在手機網絡)。 在這樣應用,在整個數據流被傳送了之後,必須解壓數據作為數據流,而不是。 不是所有的音頻編解碼器可以為流出的應用使用,并且為這樣應用被設計的編解碼器流出數據通常將有效地被選擇。

潛在因素起因於使用的方法輸入和解碼數據。 一些編解碼器將分析數據的更長的段優選效率,有些然後編碼一次要求數據更大的段為了解碼的它。 (編解碼器經常創造稱「框架的」段創造離散信道段為內碼和解碼。)固有 潛在因素 編制程序算法可以是重要的; 例如,當時數據雙向傳輸,例如以電話談話,重大延遲也許嚴重貶低被察覺的質量。

與壓縮對比的速度,與操作的數量是比例由算法,潛在因素要求這裡提到必須分析樣品的數量,在音頻塊被處理之前。 在極小的案件,潛在因素是0零的樣品(即,如果編碼人或譯碼器簡單地減少用於的位的數量量子化信號)。 時間界域算法例如LPC經常也有低潛在因素,因此他們的大眾化在語音編碼為電話。 在算法例如MP3,然而,很大數量的樣品在頻域必須被分析為了實施一個psychoacoustic模型,并且潛在因素是按照23女士(46的指示女士為雙向聯繫)。

講話內碼

講話內碼 是音頻數據壓縮一個重要類別。 用於的感知模型估計什麼一個人的耳朵能聽見一般是有些與用於音樂的那些不同。 頻率的範圍比為音樂需要的那需要表達人的聲音的聲音通常狹窄,并且聲音通常是較不複雜的。 結果,講話可以被輸入在高質量使用相對地低比特率。

這由二種方法的某一組合是成功的,總之:

  • 可能由唯一人的聲音做仅的輸入的聲音。
  • 丟掉更多數據在信號 -- 剛够保持重建「可理解」聲音的而不是人的充分的頻率範圍 聽力.

或許用於講話內碼(和音頻數據壓縮的最早的算法一般)是 法律算法 并且 µ法律算法.

詞彙

ABR
平均數位速率
CBR
恆定數位速率
VBR
易變數位速率

參考

參見

外部鏈接

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence