Top 10 Articles

Zoophilia
Liste de prières et de bénédictions juives
Pastèque
Gmail
Saola
Odnoklassniki.ru
Xeroderma pigmentosum
La maladie de Minamata
Orkut
Liste de missions de maintien de la paix des Nations Unies

News:

Compression audio (données)

Pour les processus qui réduisent la quantité de temps où il prend pour écouter et comprennent un enregistrement, voyez discours temps-comprimé.

Compression audio est une forme de la compression de données a conçu pour réduire la taille de dossiers audio. Compression audio algorithmes sont mis en application dans le logiciel d'ordinateur As codecs audio. Générique la compression de données les algorithmes exécutent mal avec des données audio, réduisant rarement des volumes de fichier beaucoup en-dessous de 87% de l'original, et ne sont pas conçus pour l'usage en temps réel. En conséquence, acoustique spécifique « lossless« et »lossydes « algorithmes ont été créés. Les algorithmes de lossy fournissent des rapports bien plus grands de compression et sont employés dans des dispositifs traditionnels d'acoustique du consommateur.

Comme avec compression d'image, le lossy et les algorithmes lossless de compression sont employés dans la compression audio, lossy étant les plus communs pour l'usage journalier. Dans le lossy et la compression lossless, la redondance de l'information est réduite, en utilisant des méthodes telles que le codage, l'identification de modèle et la prévision linéaire pour réduire la quantité de l'information employée pour décrire les données.

La différence de la qualité audio légèrement réduite est clairement étée supérieure pour la plupart des applications audio pratiques où les utilisateurs ne peuvent percevoir aucune différence et espace requis sont sensiblement réduits. Par exemple, sur un CD, on peut adapter une heure de la musique de fidélité élevée, moins de 2 heures de la musique comprimées losslessly, ou 7 heures de musique comprimées dans MP3 composent.

Table des matières

Compression d'acoustique de Lossless

Comme le stockage de dossier et la largeur de bande de communications sont devenus moins chers et plus disponibles, la popularité des formats lossless comme L'acoustique du singe, FLAC et Raccourcissez a augmenté brusquement, car les gens choisissent de maintenir des archives permanentes de leurs dossiers audio. Les utilisateurs primaires de la compression lossless ont été ingénieurs audio, audiophiles et ces consommateurs qui veulent préserver une copie exacte de leurs dossiers audio, contrairement aux changements irréversibles des techniques de compression de lossy comme Vorbis et MP3. Les rapports de compression sont semblables à ceux pour la compression de données lossless (autour 50-60% du format document). Formats de Lossless comme TrueHD dolby également sont présentés avec à haute définition DVD formats.

Il est difficile de maintenir toutes données dans un jet audio et de réaliser la compression substantielle. D'abord, la grande majorité d'enregistrements sonores sont fortement complexe, enregistré du réel. Car une des méthodes principales de compression est de trouver des modèles et la répétition, des données plus chaotiques telles que l'acoustique ne se compriment pas bien. D'une façon semblable, photographies la compresse moins efficacement avec des méthodes lossless que des images générées par ordinateur plus simples. Mais intéressant, même les bruits générés par ordinateur peuvent contenir très compliqué formes d'onde ce présent un défi à beaucoup d'algorithmes de compression. C'est dû à la nature des formes d'onde audio, il est généralement difficile simplifier que sans conversion d'a (nécessairement lossy) en information de fréquence, comme exécuté par l'oreille humaine.

La deuxième raison est que des valeurs de l'acoustique échantillons changez très rapidement, la compression de données tellement générique algorithmes ne travaillez pas bien pour l'acoustique, et les cordes des bytes consécutifs n'apparaissent pas généralement très souvent. Cependant, convolution avec le filtre [- 1 1] (c'est-à-dire, prenant la première différence) tend à légèrement blanchissez (decorrelate, faites à appartement) le spectre, permettant de ce fait à la compression lossless traditionnelle à l'encodeur de faire son travail ; l'intégration au décodeur reconstitue le signal original. Codecs comme FLAC, Raccourcissez et TTA utilisation prévision linéaire à évaluation le spectre du signal. À l'encodeur, l'inverse de l'estimateur est employé pour blanchir le signal en enlevant les crêtes spectrales tandis que l'estimateur est utilisé pour reconstruire le signal original au décodeur.

Les codecs audio de Lossless n'ont aucune question de qualité, ainsi la rentabilité peut être estimée près

  • Vitesse de compression et de décompression
  • Degré de compression
  • Appui de logiciel et de matériel
  • Correction de robustesse et d'erreurs

Compression d'acoustique de lossy

La compression audio de lossy est employée dans une étendue des applications extrêmement large. En plus des applications directes (joueurs mp3 ou ordinateurs), des jets audio digitalement comprimés sont employés dans la plupart de DVDs visuel ; télévision numérique ; médias coulants sur Internet; radio de satellite et de câble ; et de plus en plus dans des émissions par radio terrestres. La compression de lossy réalise typiquement une compression bien plus grande que la compression lossless (données de 5 pour cent à 20 pour cent du jet original, plutôt que 50 pour cent à 60 pour cent), en jetant des données moins-critiques.

L'innovation de la compression audio de lossy était d'employer psychoacoustique pour identifier que non toutes les données dans un jet audio peuvent être perçues par le système auditif humain. La plupart de compression de lossy réduit la redondance perceptuelle par les premiers bruits de identification qui sont considérés perceptually non pertinents, c'est-à-dire, les bruits il est très difficile d'entendre que. Les exemples typiques incluent des fréquences, ou des bruits qui se produisent pendant que des bruits plus forts. Ces bruits sont codés avec l'exactitude diminuée ou pas codés du tout.

Tandis que l'enlèvement ou la réduction de ces bruits « unhearable » peut expliquer un petit pourcentage du peu sauvé dans la compression de lossy, la vraie épargne vient d'un phénomène complémentaire : formation de bruit. La réduction du nombre de peu employé pour coder un signal augmente la quantité de bruit dans ce signal. Dans la compression psychoacoustique-basée de lossy, la vraie clef est « de cacher » le bruit produit par l'épargne de peu dans les domaines du jet audio qui ne peut pas être perçu. Ceci est fait près, par exemple, en utilisant très un nombre restreint de peu pour coder les fréquences de la plupart des signaux - pas parce que le signal a peu d'information à haute fréquence (cependant c'est également souvent vrai aussi bien), mais plutôt parce que l'oreille humaine peut seulement percevoir les signaux très forts dans cette région, de sorte que des bruits plus mous « cachés » là simplement ne soient pas entendus.

Si la réduction de la redondance perceptuelle ne réalise pas la compression suffisante pour une application particulière, il peut exiger davantage de compression de lossy. Selon la source audio, ceci peut encore ne pas produire des différences perceptibles. La parole par exemple peut être comprimée bien plus que la musique. La plupart des arrangements de compression de lossy permettent à des paramètres de compression d'être ajustés pour réaliser un taux de cible de données, habituellement exprimé comme a débit binaire. Encore, la réduction de données sera guidée par un certain modèle de la façon dont important le bruit est comme perçu par l'oreille humaine, avec le but de l'efficacité et de la qualité optimisée pour le débit de cible. (Il y a beaucoup de différents modèles utilisés pour cette analyse perceptuelle, un certain meilleur convenu à différents types d'acoustique que d'autres.) par conséquent, selon les conditions de largeur de bande et de stockage, l'utilisation de la compression de lossy peut avoir comme conséquence une réduction perçue de la qualité audio qui s'étend d'aucun à grave, mais généralement une réduction évidemment audible de qualité est inacceptable pour des auditeurs.

Puisque des données sont enlevées pendant la compression de lossy et ne peuvent pas être récupérées par la décompression, certains peuvent ne pas préférer la compression de lossy pour l'archivage. Par conséquent, comme remarquable, égalisez ceux qui emploient la compression de lossy (pour des applications audio portatives, par exemple) peuvent souhaiter garder des archives losslessly comprimées pour d'autres applications. En outre, la technologie de la compression continue à avancer, et la réalisation d'une compression du dernier cri de lossy exigerait d'on de commencer encore par les données audio et la compresse lossless et originales avec le nouveau codec de lossy. La nature de la compression de lossy (pour l'acoustique et les images) a comme conséquence la dégradation croissante de la qualité si des données sont décomprimées, puis recompressed en utilisant la compression de lossy.

Histoire

Une grande variété de vrais, fonctionnants systèmes audio de codage ont été éditées dans une collection dans le journal d'IEEE sur des secteurs choisis dans les communications (JSAC), février 1988. Tandis qu'il y avait quelques papiers avant de cette fois, cet abrégé des papiers a documenté une variété entière de codeurs audio finis et travaillants, presque tous employer perceptuel (c.-à-d. ) techniques masquantes et un certain genre d'analyse de fréquence et de codage silencieux principal.[1] Plusieurs de ces articles ont remarqué sur la difficulté d'obtenir bonne, acoustique numérique propre pour des recherches. Les la plupart, sinon tous les, auteurs dans l'édition de JSAC étaient également en activité au sein du comité de l'acoustique MPEG-1.

Le système audio de compression de la première automation commerciale de l'émission du monde a été développé par Oscar Bonello, un professeur de technologie au Université de Buenos Aires.[2] En 1983, en utilisant le principe psychoacoustic de masquer des bandes critiques d'abord éditées en 1967,[3] il a commencé à développer une application pratique basée sur le développé récemment PC D'IBM l'ordinateur, et le système d'automation d'émission ont été lancés en 1987 sous le nom de Audicom. 20 ans après, presque toutes stations de radio dans le monde employaient la technologie semblable, construite par un certain nombre de compagnies.

Méthodes de codage

Transformez les méthodes de domaine

Afin de déterminer quelle information dans un signal audio est perceptually non pertinente, la plupart d'utilisation d'algorithmes de compression de lossy transforme comme le cosinus discret modifié transforment (MDCT) pour convertir domaine de temps formes d'onde prélevées dans un domaine de transformation. Une fois que transformé, typiquement en domaine de fréquence, les fréquences composantes peuvent être peu assigné selon à quel point elles audibles sont. L'audibilité des composants spectraux est déterminée en calculant d'abord a seuil masquant, au-dessous dont on l'estime cela retentit sera au delà des limites de la perception humaine.

Le seuil masquant est employer calculé seuil absolu de l'audition et les principes de masquer simultané - le phénomène où un signal est masqué par un autre signal séparé par la fréquence - et, dans certains cas, masquer temporel - où un signal est masqué par un autre signal séparé par temps. découpes d'Égal-volume peut également être employé pour peser l'importance perceptuelle de différents composants. Des modèles de la combinaison humaine d'oreille-cerveau incorporant de tels effets s'appellent souvent modèles psychoacoustic.

Méthodes de domaine de temps

D'autres types de compresseurs de lossy, tels que codage prédictif linéaire (LPC) utilisé avec la parole, soyez codeurs source-basés. Ces codeurs emploient un modèle du générateur de sons (tel que le tractus humain avec le LPC) pour blanchir le signal audio (c.-à-d., aplatissez son spectre) avant la quantification. Le LPC peut également être considéré comme technique perceptuelle de base de codage ; la reconstruction d'un signal audio employant un facteur prédictif linéaire forme le bruit de la quantification du codeur dans le spectre du signal de cible, le masquant partiellement.

Applications

En raison de la nature des algorithmes de lossy, qualité audio souffre quand un dossier est décomprimé et recompressed (des pertes de generations). Ceci rend la compression de lossy peu convenable pour stocker les résultats intermédiaires dans des applications audio professionnelles de technologie, telles que l'édition de bruit et l'enregistrement multivoie. Cependant, ils sont très populaires avec des utilisateurs (en particulier MP3), comme méga-octet peut stocker environ la valeur d'une minute de la musique à à qualité proportionnée.

Rentabilité

La rentabilité des codecs audio de lossy est déterminée par :

  • Qualité audio perçue
  • Facteur de compression
  • Vitesse de compression et de décompression
  • Latence inhérente de l'algorithme (critique pour des applications coulantes de temps réel ; voir ci-dessous)
  • Appui de logiciel et de matériel

Les formats de lossy sont employés souvent pour la distribution de l'acoustique coulante, ou des applications interactives (telles que le codage du discours pour la transmission numérique dans des réseaux de téléphone portable). Dans de telles applications, les données doivent être décomprimées comme flux de données, plutôt qu'après que le flux de données entier ait été transmis. Non tous les codecs audio peuvent être employés pour des applications coulantes, et pour de telles applications un codec conçu pour couler des données efficacement sera habituellement choisi.

La latence résulte des méthodes employées pour coder et décoder les données. Quelques codecs analyseront un plus long segment des données pour optimiser l'efficacité, et puis le codent en quelque sorte qui exige d'un plus grand segment des données en même temps afin de décoder. (Souvent les codecs créent des segments appelés une « armature » pour créer des segments de données discrets pour coder et décoder.) l'inhérent latence du codage l'algorithme peut être critique ; par exemple, quand il y a bi-directionnel la transmission des données, comme avec une conversation téléphonique, significative retarde peut sérieusement dégrader la qualité perçue.

Contrairement à la vitesse de la compression, qui est proportionnelle au nombre d'opérations a exigé par l'algorithme, ici latence se rapporte au nombre d'échantillons qui doivent être analysés avant qu'un bloc d'acoustique soit traité. Dans le cas minimum, la latence est les échantillons 0 zéro (par exemple, si le codeur/décodeur réduit simplement le nombre de peu employé pour quantifier le signal). Les algorithmes de domaine de temps tels que le LPC ont également souvent de basses latences, par conséquent leur popularité dans le codage de la parole pour la téléphonie. Dans les algorithmes tels que MP3, cependant, un grand nombre d'échantillons doivent être analysés afin de mettre en application un modèle psychoacoustic dans le domaine de fréquence, et la latence est sur l'ordre de la mme. 23 (mme. 46 pour la communication bi-directionnelle).

Codage de la parole

Codage de la parole est une catégorie importante de la compression de données audio. Les modèles perceptuels estimaient ce qu'une oreille humaine peut entendre sont généralement quelque peu différente de ceux utilisées pour la musique. La gamme des fréquences a dû donner les bruits d'une voix humaine sont normalement bien plus étroite que cela requise pour la musique, et le bruit est normalement moins complexe. En conséquence, la parole peut être codée à la qualité en utilisant des débits binaires relativement bas.

Ceci est accompli, généralement par une certaine combinaison de deux approches :

  • Seulement bruits de codage qui pourraient être faits par une voix humaine simple.
  • Gâcher plus des données dans le signal -- garder juste assez pour reconstruire une voix « intelligible » plutôt que la pleine gamme de fréquence de l'humain audition.

Peut-être les algorithmes les plus tôt utilisés dans le codage de la parole (et la compression de données audio en général) étaient algorithme d'Un-loi et algorithme de µ-loi.

Glossaire

ABR
Bitrate moyen
CBR
Bitrate constant
VBR
Bitrate variable

Références

Voyez également

Liens externes

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence