トップ10の記事

近親相姦
くすぐりの苦悶
Nを法とした原始根
セシウム137
チェスターフィールド(タバコ)
ヨウ素131
Badoo
生物学的半減期
OllyDbg
Zeugma (都市)

News:

オーディオ圧縮(データ)

それがを聞くために取る減らし、録音を理解する時間をプロセスについては、見なさい 時間圧縮されたスピーチ.

オーディオ圧縮 形態はのある データ圧縮 サイズをの減らすように設計した 可聴周波ファイル. オーディオ圧縮 アルゴリズム コンピュータ・ソフトウェアでように実行される 可聴周波符復号器. 一般的 データ圧縮 アルゴリズムは原物の87%の下でファイルサイズを大いに減らす可聴周波データと、ほとんど不完全に行わないし実質の時間の使用のために設計されていない。 その結果、特定の音声「lossless「および」lossy「アルゴリズムは作成された。 Lossyのアルゴリズムはずっとより大きい圧縮比を提供し、主流の消費者音声装置で使用される。

と同じように 画像圧縮、lossyおよび無損失圧縮のアルゴリズムは両方オーディオ圧縮、日常使用のための共通であるlossyで使用される。 lossyおよび無損失圧縮両方ではデータを記述するのに使用される情報量を減らすために、情報重複はコーディング、パターン認識および線形予言のような方法を使用して、減る。

わずかに減らされた可聴周波質のトレードオフはユーザーが相違を感知できない空き容量大幅に減るほとんどの実用的な可聴周波適用のためにはっきり上回られ。 例えば、1 CDで、1はハイファイ音楽、losslessly圧縮される音楽の2時間以下の1時間に合うことができるまたはエムピー・スリーで圧縮される音楽の7時間は書式作成する。

目次

Losslessのオーディオ圧縮

ファイルストレージおよびコミュニケーション帯域幅が比較的安価および利用できるようになったように、losslessフォーマットの人気のような 猿の音声, FLAC そして 短くしなさい 人々が彼らの可聴周波ファイルの永久的なアーカイブを維持することを選んでいるので、はっきりと増加した。 無損失圧縮のプライマリユーザーはあった 可聴周波エンジニア、彼らの可聴周波ファイルの正確なコピーを維持したいと思うそれらの消費者そして損失のある圧縮の技術からの不可逆変化と対照をなすaudiophilesのような Vorbis そして エムピー・スリー. 圧縮比はlosslessデータ圧縮(原寸のおよそ50-60%)のためのそれらに類似している。 Losslessはのような書式作成する ドルビーTrueHD また高い定義と共に導入されている DVD フォーマット。

可聴周波流れのデータすべてを維持し、相当な圧縮を達成することは困難である。 最初に、大部分の録音は非常に複雑、実世界から記録されてである。 圧縮の主方法の1つがパターンおよび繰返しを見つけることであるので音声のような無秩序データはよく圧縮しない。 同じような方法で、 写真 圧縮機械はより簡単なコンピューター生成イメージよりより少し効率的にlossless方法と。 しかし興味深く、コンピューター生成音は非常に複雑含むことができる 波形 その現在多くの圧縮アルゴリズムへの挑戦。 これは一般に頻度情報へのa (必ずしもlossy)の転換なしで簡単にしにくいの可聴周波波形の性質のために人間の耳によって行われるようにそうなったものである。

第2理由はこと音声の価値である サンプル 変更非常にすぐに、そう一般的なデータ圧縮 アルゴリズム 音声のためによく働かせなければ、連続したバイトの一連は頻繁に一般に現われない。 但し、 回旋 フィルター[すなわち、- 1 1] (最初の相違を取る)によってわずかににがちである 白くしなさい (decorrelate、平たい箱に)仕事をするようにそれによりエンコーダーで従来の無損失圧縮がするスペクトルを、しなさい; デコーダーの統合は元の信号を元通りにする。 符復号器のような FLAC, 短くしなさい そして TTA 使用 線形予言見積もり 信号のスペクトル。 エンコーダーで、分光ピークを取除くことによって見積者のinverseが信号を白くするのに使用されている見積者がデコーダーで元の信号を再建するのに使用されている間。

Losslessの可聴周波符復号器に品質の問題がない、従って有用性は推定することができる

  • 圧縮および減圧の速度
  • 圧縮のある程度
  • ソフトウェアおよびハードウェアサポート
  • 強さおよびエラー修正

Lossyのオーディオ圧縮

Lossyのオーディオ圧縮は非常に広い応用範囲で使用される。 直接適用に加えて(MP3プレーヤーかコンピュータ)、デジタル式に圧縮された可聴周波流れはほとんどのビデオDVDsで使用される; デジタルテレビ; の媒体の流出 インターネット; 衛星およびケーブルは無線で送る; そしてますます地球無線放送で。 損失のある圧縮はより少なく重大なデータの放棄によって普通無損失圧縮(5%から50%から60%よりもむしろ元の流れの20%のデータ、)よりずっと大きい圧縮を、達成する。

lossyのオーディオ圧縮の革新は使用することだった psychoacoustics 可聴周波流れのすべてのデータが人間の聴覚システムによって感知することができないことを確認するため。 ほとんどの損失のある圧縮は、聞き非常ににくいすなわち関係がない、音知覚力の上で考慮される最初識別の音によって知覚の重複を減らす。 典型的な例は高周波を、かより騒々しい音と同時に起こる音が含まれている。 それらの音は減らされた正確さとコードされるか、または全然コードされない。

これらの「unhearable」音を取除くか、または減らすことが損失のある圧縮で救われるビットの小さいパーセントを説明するかもしれない間、実質の節約は補足現象から来る: 騒音の形成. 信号をコードするのに使用されるビットの数を減らすことはその信号の騒音の量を高める。 psychoacoustics基づかせていた損失のある圧縮では、実質のキーは感知することができない可聴周波流れの区域のビット節約によって発生する騒音を「隠すこと」である。 これは例えばされほとんどの信号の高周波をコードするのに少数のビットを非常に使用する-」隠れるより柔らかい音が「そこに単に聞かれないようにだけ人間の耳がこの地域の非常に騒々しい信号を感知できるのでない信号に少し高周波情報が(しかしこれはまたまた頻繁に本当である)あるが、むしろので。

知覚の重複を減らすことは特定の適用のための十分な圧縮、それをそれ以上の損失のある圧縮を要求するかもしれない達成しない。 可聴周波源によって、これはまだ目で見える相違を作り出さないかもしれない。 スピーチは例えば音楽よりずっと多く圧縮することができる。 ほとんどの損失のある圧縮の機構は圧縮変数が通常aとして表現されるデータのターゲット率を達成するために調節されるようにする ビット電送速度. 再度、データ削減はモデルによって重要音が、ターゲットデータ転送速度のための効率そして最大限に活用された質の目的の人間の耳によって感知されるようにいかにのあるか導かれる。 (この知覚の分析、異なったタイプの他より音声に適するいくつかに使用する多くの異なったモデルが。ある)それ故に、帯域幅および必要メモリによって、損失のある圧縮のどれもから厳しいまで及ばない、一般に質の明らかに聞こえる減少は傾聴者に受け入れられない可聴周波質の感知された減少で起因する。

データが損失のある圧縮の間に取除かれ、減圧によって回復することができないので何人かの人々は記録保管貯蔵のための損失のある圧縮を好まないかもしれない。 それ故に、注意されるように、損失のある圧縮を(携帯用可聴周波適用のために、例えば)他の適用のためのlosslessly圧縮されたアーカイブを保ちたい場合もある使用する人を均等にしなさい。 さらに、圧縮の技術は進み続け最新式の損失のある圧縮を達成することは1つが新しいlossyの符復号器のlossless、元の可聴周波データそして圧縮機械から再度始まるように要求する。 損失のある圧縮の性質は質の増加する低下で(音声およびイメージ両方のために)データが滅圧されれば起因したり、そして損失のある圧縮を使用してrecompressed。

歴史

実質、働く可聴周波コーディングシステムの大きい変化はコミュニケーション(JSAC)の選択されたエリアのIEEEジャーナルのコレクション、1988年2月で出版された。 その時間から前にあるペーパーの間、ペーパーのこの大要は終了する、働く可聴周波コーダー知覚を使用してほぼすべての、全体の変化を文書化した(すなわち。 周波数分析および後陣の無雑音コーディングの覆う)技術そしてある種。[1] これらのペーパーの複数はよい得る難しさ研究の為にきれいなデジタル音声に気づいた。 JSACの版の著者すべてが、またMPEG-1音声委員会の活発活発でなかったら、ほとんど。

世界の最初商業用放送オートメーションのオーディオ圧縮システムはOscar Bonelloの工学教授によって、開発された ブエノスアイレスの大学.[2] 最初に1967年に出版される重大なバンドの覆うことのpsychoacoustic原則を使用して1983年に、[3] 彼は最近開発されたに基づいて実用化を開発し始めた IBMのPC コンピュータおよび放送オートメーションシステムは1987年にという名で進水した Audicom. 後で20年、世界のほとんどall the無線局は何人かの会社が製造した同じような技術を使用していた。

コーディング方法

範囲方法を変形させなさい

オーディオ信号のどんな情報が知覚力の上で関係がないか定めるためには、ほとんどの損失のある圧縮のアルゴリズムの使用はのような変形する 変更された分離した余弦は変形する (MDCT)変えるため 時間領域 変形の範囲への見本抽出された波形。 、普通に変形させて 周波数領域、構成の頻度はである聞こえるいかにに従ってあるか割振られたビット場合もある。 分光部品の聴度は最初にaを計算することによって定められる 覆う境界、それが推定されるそれは人間の認識の限界を越えてある鳴る。

覆う境界はを使用して計算される ヒアリングの絶対境界 そして原則の 同時に覆うこと -信号が頻度分かれている別の信号によって-および、時として覆われるか現象、 一時的な覆うこと -信号が時間までに分かれている別の信号によって覆われるところ。 等し音の大きさの輪郭 また異なった部品の知覚の重要性を重くするのに使用されるかもしれない。 そのような効果を組み込む頻繁に人間の耳頭脳の組合せのモデルは呼ばれる psychoacousticモデル.

時間領域方法

他のタイプののようなlossyの圧縮機、 線形予言するコーディング (LPC)、ありなさいスピーチと使用されて 源基づかせていたコーダー. これらのコーダーは健全な発電機の量子化前にオーディオ信号を(すなわち、スペクトルを平らにしなさい)白くするのにモデルを(LPCの人間の声道のような)使用する。 LPCはまた基本的な知覚のコーディングテクニックとしてについて考えられるかもしれない; 線形予言者を使用してオーディオ信号の復元は部分的にそれを覆うターゲット信号のスペクトルにコーダーの量子化の騒音を、形づける。

適用

lossyのアルゴリズムの性質のため、 可聴周波質 ファイルが滅圧される苦しみ、recompressedとき(世代の損失)。 これは損失のある圧縮を音の編集およびマルチトラック録音のような専門の可聴周波工学適用で中間結果を、貯えるために不適当にさせる。 但し、それらはエンドユーザーと非常に普及している(特に エムピー・スリー)、メガバイトとして十分な質で約分の音楽の価値を貯えることができる。

有用性

lossyの可聴周波符復号器の有用性は下記によって定められる:

  • 感知された可聴周波質
  • 圧縮の要因
  • 圧縮および減圧の速度
  • アルゴリズムの固有の潜伏(適用を流すリアルタイムの間重大な; 次に見なさい)
  • ソフトウェアおよびハードウェアサポート

Lossyのフォーマットは音声の流出の配分、かインタラクティブ・アプリケーションのために頻繁に使用される(携帯電話ネットワークのデジタル伝送のためのスピーチのコーディングのような)。 そのような適用では、データはデータの流れとして全体のデータ・ストリームが送信された後よりもむしろ滅圧されなければならない。 適用の流出にすべての可聴周波符復号器が使用することができないしそのような適用のためにデータを流すように設計されている符復号器は通常効果的に選ばれる。

潜伏はデータを符号化し、解読するのに使用される方法に起因する。 ある符復号器はデータのより長い効率を最大限に活用するために区分を分析し次に解読するためにデータのより大きい区分がかつて要求するある意味ではコードする。 (頻繁に符号化および解読のための離散データの区分を作成するために符復号器は「フレーム」と呼ばれる区分を。作成する)固有 潜伏 コーディングアルゴリズムは重大である場合もある; 例えば、両方向があるとき通話を用いるのようなデータの伝送は、重要な遅れ真剣に感知された質を低下させるかもしれない。

操作の数に比例している圧縮の速度と対照をなして、アルゴリズム、ここに潜伏によって参照する音声のブロックが処理される前に分析されなければならないサンプルの数を要求した。 最低の場合では、潜伏はコーダーかデコーダーが信号を量子化すればのに使用されるビットの数を単に減らせば) 0ゼロサンプルである(例えば。 LPCのような時間領域のアルゴリズムにまた頻繁に電話のための音声コーディングで低い潜伏、それ故に人気がある。 しかしエムピー・スリーのようなアルゴリズムでは周波数領域のpsychoacousticモデルを実行するために多数のサンプルは分析されなければなり潜伏は23氏の順序にある(双方向通信のための46氏)。

スピーチの符号化

スピーチの符号化 可聴周波データ圧縮の重要な部門はある。 知覚モデルは人間の耳が一般に音楽に使用するそれらと幾分異なっていることができるものを推定する聞くのが常であった。 頻度の範囲は普通音楽のために必要とされたそれよりずっと狭い人間の声の音を運ぶ必要があり音は普通より少なく複雑である。 その結果、スピーチは比較的低いビット・レートを使用して良質で符号化することができる。

これは2つのアプローチの組合せによって堪能、一般に、である:

  • 単一の人間の声によって作ることができる符号化の音だけ。
  • 信号のデータの多くを棒に振ること -- 人間の完全な周波数範囲よりもむしろ「わかりやすい」声を再建するちょうど必要なだけ保存 ヒアリング.

多分スピーチの符号化(および一般に可聴周波データ圧縮で)使用された最も早いアルゴリズムはだった 法律のアルゴリズム そして µ法律のアルゴリズム.

語集

ABR
平均ビット電送速度
CBR
一定したビット電送速度
VBR
可変的なビット電送速度

参照

また見なさい

外部リンク

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence