Top 10 artigosGooleHotmail Lista dos países onde o inglês é uma língua oficial Lista de doenças mentais Gmail Família real britânica Googol Tuenti Tsunami KGB |
News: |
Compressão audio é um formulário de compressão de dados projetou reduzir o tamanho de limas audio. Compressão audio algoritmos são executados no software de computador como codecs audio. Genérico compressão de dados os algoritmos executam mal com os dados audio, reduzindo raramente tamanhos de lima muito abaixo de 87% do original, e não são projetados para o uso em real - tempo. Conseqüentemente, áudio específico “lossless“e”lossyos “algoritmos foram criados. Os algoritmos do lossy fornecem umas relações distante mais grandes da compressão e são usados nos dispositivos mainstream do áudio do consumidor.
Como com compressão da imagem, o lossy e os algoritmos lossless da compressão são usados na compressão audio, lossy que é os mais comuns para o uso diário. No lossy e na compressão lossless, a redundância da informação é reduzida, usando métodos tais como o coding, recognition de teste padrão e a predição linear reduzir a quantidade de informação usada descrever os dados.
O trade-off da qualidade audio ligeiramente reduzida é compensado claramente para a maioria de aplicações audio práticas onde os usuários não podem perceber nenhuma diferença e exigências de espaço é reduzido substancialmente. Por exemplo, em um CD, um pode caber uma hora da música do fidelity elevado, mais menos de 2 horas da música comprimidas losslessly, ou 7 horas da música comprimidas em MP3 formatam.
Índices |
Como o armazenamento de lima e a largura de faixa das comunicações se tornaram mais menos caros e mais disponíveis, a popularidade de formatos lossless como Áudio do macaco, FLAC e Encurte aumentou agudamente, porque os povos estão escolhendo manter um arquivo permanente de suas limas audio. Os usuários preliminares da compressão lossless foram coordenadores audio, audiophiles e aqueles consumidores que querem preservar uma cópia exata de suas limas audio, no contraste às mudanças irreversible das técnicas da compressão do lossy como Vorbis e MP3. As relações da compressão são similares àquelas para a compressão de dados lossless (ao redor 50-60% do tamanho original). Formatos de Lossless como TrueHD Dolby estão sendo introduzidos também junto com a definição elevada DVD formatos.
É difícil de manter todos os dados em um córrego audio e conseguir a compressão substancial. Primeiramente, a maioria vasta de gravações sadias é altamente complexa, gravado do mundo real. Porque um dos métodos chaves da compressão é encontrar testes padrões e repetição, os dados mais chaotic tais como o áudio não comprimem bem. Em uma maneira similar, fotografias a compressa menos eficientemente com métodos lossless do que umas imagens computer-generated mais simples. Mas interessante, mesmo os sons gerados computador podem conter muito complicado waveforms esse presente um desafio a muitos algoritmos da compressão. Isto é devido à natureza dos waveforms audio, que são geralmente difíceis de simplificar sem conversão de a (necessariamente lossy) à informação da freqüência, como executado pela orelha humana.
A segunda razão é que valores do áudio amostras mude muito rapidamente, compressão de dados assim genérica algoritmos não trabalhe bem para o áudio, e as cordas de bytes consecutivos não aparecem geralmente muito frequentemente. Entretanto, convolução com o filtro [- 1 1] (isto é, fazendo exame da primeira diferença) tende a ligeiramente whiten (decorrelate, faça a plano) o spectrum, permitindo desse modo que a compressão lossless tradicional no codificador faça seu trabalho; a integração no decodificador restaura o sinal original. Codecs como FLAC, Encurte e TTA uso predição linear a estimativa o spectrum do sinal. No codificador, o inverse do estimator está usado whiten o sinal removendo os picos spectral quando o estimator for usado reconstruct o sinal original no decodificador.
Os codecs audio de Lossless não têm nenhuma edição da qualidade, assim que a usabilidade pode ser estimada perto
A compressão audio do lossy é usada em uma escala de aplicações extremamente larga. Além às aplicações diretas (jogadores mp3 ou computadores), os córregos audio digital comprimidos são usados em a maioria de DVDs video; televisão digital; meios fluindo no Internet; rádio do satélite e do cabo; e cada vez mais em transmissões de rádio terrestrial. A compressão do lossy consegue tipicamente uma compressão distante mais grande do que a compressão lossless (dados de 5 por cento a 20 por cento do córrego original, melhor que os 50 por cento aos 60 por cento), rejeitando dados menos-críticos.
A inovação da compressão audio do lossy era usar-se psychoacoustics para reconhecer que não todos os dados em um córrego audio podem ser percebidos pelo sistema auditory humano. A maioria de compressão do lossy reduz a redundância perceptual pelos primeiros sons identificando que são considerados perceptually irrelevant, isto é, os sons que são muito duros de se ouvir. Os exemplos típicos incluem altas freqüências, ou sons que ocorrem ao mesmo tempo que uns sons mais altos. Aqueles sons são codificados com a exatidão diminuída ou não codificados em tudo.
Quando remover ou reduzir estes sons “unhearable” puderem esclarecer uma porcentagem pequena dos bocados conservados na compressão do lossy, as economias reais vêm de um fenômeno complementar: dar forma do ruído. Reduzir o número dos bocados usados codificar um sinal aumenta a quantidade de ruído nesse sinal. Na compressão psychoacoustics-baseada do lossy, a chave real é “esconder” o ruído gerado pelas economias do bocado nas áreas do córrego audio que não pode ser percebido. Isto é feito perto, por exemplo, usando muito um pequeno número de bocados codificar as altas freqüências de a maioria de sinais - não porque o sinal tem pouca informação de alta freqüência (though este é também frequentemente verdadeiro também), mas rather porque a orelha humana pode somente perceber sinais muito altos nesta região, de modo que uns sons mais macios “escondidos” não sejam ouvidos lá simplesmente.
Se reduzir a redundância perceptual não consegue a compressão suficiente para uma aplicação particular, ele pode reque uma compressão mais adicional do lossy. Dependendo da fonte audio, isto ainda não pode produzir diferenças perceptíveis. O discurso por exemplo pode ser comprimido distante mais do que a música. A maioria de esquemas da compressão do lossy permitem que os parâmetros da compressão sejam ajustados para conseguir uma taxa do alvo dos dados, expressada geralmente como a taxa de bocado. Outra vez, a redução de dados será guiada por algum modelo de como importante o som é como percebido pela orelha humana, com o objetivo da eficiência e da qualidade optimized para a taxa de dados do alvo. (Há muitos modelos diferentes usados para esta análise perceptual, algum melhor servido aos tipos diferentes de áudio do que outro.) daqui, dependendo das exigências da largura de faixa e de armazenamento, o uso da compressão do lossy pode resultar em uma redução percebida da qualidade audio que varia de nenhuns a severo, mas geralmente uma redução obviamente audível na qualidade é inaceitável aos ouvintes.
Porque os dados são removidos durante a compressão do lossy e não podem ser recuperados pelo decompression, alguns povos não podem preferir a compressão do lossy para o armazenamento archival. Daqui, como notável, nivele aqueles que usam a compressão do lossy (para aplicações audio portáteis, por exemplo) podem desejar manter um arquivo losslessly comprimido para outras aplicações. Além, a tecnologia da compressão continua a avançar, e conseguir uma compressão avançada do lossy requereria um começar outra vez com os dados audio e a compressa lossless, originais com o codec novo do lossy. A natureza da compressão do lossy (para o áudio e as imagens) resulta na degradação crescente da qualidade se os dados decompressed, a seguir recompressed usando a compressão do lossy.
Uma variedade grande de sistemas de coding audio reais, trabalhando foi publicada em uma coleção no jornal de IEEE em áreas selecionadas nas comunicações (JSAC), fevereiro 1988. Quando havia alguns papéis antes dessa vez, este compêndio dos papéis documentou uma variedade inteira de codificadores audio terminados, trabalhando, quase todo usar-se perceptual (isto é. ) técnicas mascarando e algum tipo da análise de freqüência e do coding silencioso back-end.[1] Diversos destes papéis observaram na dificuldade de obter boa, áudio digital limpo para finalidades da pesquisa. A maioria, se não todos os, autores na edição de JSAC forem também ativos no comitê do áudio MPEG-1.
Automatização comercial da transmissão do mundo o sistema audio da compressão da primeira foi desenvolvido por Oscar Bonello, um professor da engenharia no Universidade de Buenos Aires.[2] Em 1983, usando o princípio psychoacoustic de mascarar das faixas críticas publicadas primeiramente em 1967,[3] começou desenvolver uma aplicação prática baseada no desenvolvido recentemente PC DE IBM o computador, e o sistema da automatização da transmissão foram lançados em 1987 sob o nome Audicom. 20 anos mais tarde, quase todas as estações do rádio no mundo usavam a tecnologia similar, manufaturada por um número de companhias.
A fim determinar que informação em um sinal audio seja perceptually irrelevant, a maioria de uso dos algoritmos da compressão do lossy transforma como o cosine discreto modificado transforma (MDCT) para converter-se domínio de tempo waveforms provados em um domínio da transformação. Uma vez que transformado, tipicamente no domínio da freqüência, as freqüências componentes podem ser bocados alocados de acordo com como audível são. O Audibility de componentes spectral é determinado primeiramente calculando a ponto inicial mascarando, abaixo de que se estima isso soa será além dos limites da percepção humana.
O ponto inicial mascarando é usar-se calculado ponto inicial absoluto do hearing e os princípios de mascarar simultâneo - o fenômeno wherein um sinal é mascarado por um outro sinal separado pela freqüência - e, em alguns casos, mascarar temporal - onde um sinal é mascarado por um outro sinal separado pelo tempo. contornos do Igual-loudness pode também ser usado tornar mais pesada a importância perceptual de componentes diferentes. Os modelos da combinação humana do orelha-cérebro que incorpora tais efeitos são chamados frequentemente modelos psychoacoustic.
Outros tipos de compressores do lossy, tais como coding predictive linear (LPC) usado com discurso, seja codificadores fonte-baseados. Estes codificadores usam um modelo do gerador sadio (tal como o intervalo vocal humano com LPC) whiten o sinal audio (isto é, aplaine seu spectrum) antes da quantização. O LPC pode também ser pensado como de um técnica perceptual básica do coding; o reconstruction de um sinal audio que usa um predictor linear dá forma ao ruído da quantização do codificador no spectrum do sinal do alvo, mascarando parcialmente o.
Devido à natureza de algoritmos do lossy, qualidade audio sofre quando uma lima decompressed e recompressed (perdas generational). Isto faz a compressão do lossy unsuitable para armazenar os resultados intermediários em aplicações audio profissionais da engenharia, tais como a edição do som e a gravação multitrack. Entretanto, são muito populares com extremidade - usuários (particularmente MP3), como uma megabyte pode armazenar o valor aproximadamente de um minuto da música na qualidade adequada.
A usabilidade de codecs audio do lossy é determinada perto:
Os formatos do lossy são usados frequentemente para a distribuição do áudio fluindo, ou aplicações interativas (tais como o coding do discurso para a transmissão digital em redes de telefone da pilha). Em tais aplicações, os dados devem decompressed como os fluxos de dados, melhor que depois que o córrego de dados inteiro foi transmitido. Não todos os codecs audio podem ser usados para aplicações fluindo, e para tais aplicações um codec projetado fluir dados será escolhido eficazmente geralmente.
A latência resulta dos métodos usados codificar e descodificar os dados. Alguns codecs analisarão um segmento mais longo dos dados para optimize a eficiência, e codificam-no então em uma maneira que requeira um segmento maior dos dados em uma vez a fim descodificar. (Frequentemente os codecs críam os segmentos chamados um “frame” para criar segmentos de dados discretos para codificar e descodificar.) o inerente latência do coding o algoritmo pode ser crítico; por exemplo, quando há em dois sentidos a transmissão dos dados, como com uma conversação de telefone, significativa atrasa pode seriamente degradar a qualidade percebida.
No contraste à velocidade da compressão, que é proporcional ao número das operações requereu pelo algoritmo, aqui latência consulta ao número das amostras que devem ser analisadas antes que um bloco do áudio esteja processado. No caso mínimo, a latência é as amostras 0 zero (por exemplo, se o codificador/decodificador reduzir simplesmente o número dos bocados usados quantizar o sinal). Os algoritmos do domínio de tempo tais como o LPC também têm frequentemente latências baixas, daqui sua popularidade no coding do discurso para o telephony. Nos algoritmos tais como MP3, entretanto, um grande número amostras têm que ser analisadas a fim executar um modelo psychoacoustic no domínio da freqüência, e a latência está na ordem de 23 ms (46 ms para uma comunicação em dois sentidos).
Encoding do discurso é uma categoria importante de compressão de dados audio. Os modelos perceptual usados estimar o que uma orelha humana pode se ouvir são geralmente um tanto diferentes daqueles usados para a música. A escala das freqüências necessitou fazer saber aos sons de uma voz humana é normalmente distante mais estreita do que aquela necessitada para a música, e o som é normalmente mais menos complexo. Em conseqüência, o discurso pode ser codificado na alta qualidade usando taxas de bocado relativamente baixas.
Isto é realizado, no general, por alguma combinação de duas aproximações:
Talvez os algoritmos os mais adiantados usados no encoding do discurso (e na compressão de dados audio no general) eram algoritmo da Um-lei e algoritmo da µ-lei.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||
|
Custom Search
|
© Copyright 2011 WorldLingo. Todos os direitos reservados.