Top 10 de los artículosYouTubeGmail Goole GayRomeo Números chinos Números romanos Orkut Costco Sistema porta hepático El mundo Factbook |
News: |
En informática y teoría de información, compresión de datos o codificación de fuente es el proceso de codificar la información usando menos pedacitos (u otras unidades del información-cojinete) que unencoded la representación utilizaría con el uso del específico codificación esquemas. Un caso popular de la compresión con el cual muchos usuarios de la computadora son familiares es Formato del archivo de CIERRE RELÁMPAGO, que, así como el abastecimiento de la compresión, actúa como archiver, almacenando muchos archivos de fuente en un solo archivo de salida de la destinación.
Como con cualquier comunicación, la comunicación de datos comprimida trabaja solamente cuando ambos remitente y receptor del información entienda el esquema de codificación. Por ejemplo, este texto tiene sentido solamente si el receptor entiende que está pensado para ser interpretado como caracteres que representan la lengua inglesa. Semejantemente, los datos comprimidos pueden ser entendidos solamente si el método el descifrar es sabido por el receptor.
La compresión es útil porque ayuda a reducir la consumición de recursos costosos, por ejemplo disco duro espacio o transmisión anchura de banda (el computar). En la desventaja, los datos comprimidos se deben descomprimir para ser utilizado, y este proceso del suplemento puede ser perjudicial a algunos usos. Por ejemplo, un esquema de la compresión para el vídeo puede requerir el hardware costoso para el vídeo ser descomprimido rápidamente bastante para ser visto como él se está descomprimiendo (la opción de descomprimir el vídeo por completo antes de mirarlo puede ser incómoda, y requiere el espacio de almacenaje para el vídeo descomprimido). El diseño de los esquemas de la compresión de datos por lo tanto implica compensaciones entre varios factores, incluyendo el grado de compresión, la cantidad de distorsión introducida (si usa a esquema de la compresión del lossy), y los recursos de cómputo requeridos para comprimir y uncompress los datos.
Contenido |
Lossless los algoritmos de la compresión explotan generalmente redundancia estadística a fin de representar los datos del remitente más sucinto sin error. La compresión de Lossless es posible porque la mayoría de los datos del mundo real tienen redundancia estadística. Por ejemplo, en texto inglés, la letra “e” es mucho más común que la letra “z”, y la probabilidad que la letra “q” será seguida por la letra “z” es muy pequeña.
Otra clase de compresión, llamada compresión de datos del lossy o codificación perceptiva, es posible si una cierta pérdida de fidelidad es aceptable. Generalmente, una compresión de datos del lossy será dirigida por la investigación sobre cómo la gente percibe los datos en la pregunta. Por ejemplo, el ojo humano es más sensible a las variaciones sutiles adentro luminiscencia que él está a las variaciones en color. JPEG la compresión de la imagen trabaja en parte “redondeando” de algo de esta información menos-importante. La compresión de datos del lossy proporciona una manera de obtener la mejor fidelidad para una cantidad dada de compresión. En algunos casos, transparente se desea la compresión (unnoticeable); en otros casos, la fidelidad se sacrifica para reducir la cantidad de datos tanto cuanto sea posible.
Los esquemas de la compresión de Lossless son reversibles para poder reconstruir los datos originales, mientras que los esquemas del lossy aceptan una cierta pérdida de datos para alcanzar una compresión más alta.
Sin embargo, los algoritmos lossless de la compresión de datos nunca comprimirán algunos archivos; de hecho, cualquier algoritmo de la compresión no podrá necesariamente comprimir ningunos datos que no contienen ningún patrón perceptible. Procura comprimir los datos que se han comprimido ya por lo tanto darán lugar generalmente a una extensión, como las tentativas de comprimir cifrado datos.
En la práctica, la compresión de datos del lossy también vendrá a un punto donde la compresión otra vez no trabaja, aunque un algoritmo del lossy, que por ejemplo quita siempre el octeto pasado de un archivo, comprimirá extremadamente siempre un archivo hasta el punto donde está vacío.
Un ejemplo de lossless contra la compresión del lossy es la secuencia siguiente:
Esta secuencia se puede comprimir como:
Interpretado como, “veinticinco señalan 9 eights”, la secuencia original se reconstruye perfectamente, apenas escrito en una forma más pequeña. En un sistema del lossy, usando
en lugar, los datos originales se pierden, en la ventaja de un tamaño del archivo más pequeño.
El antedicho es un ejemplo muy simple de codificación de la funcionar-longitud, en donde los funcionamientos grandes de los valores idénticos consecutivos de los datos son substituidos por un código simple por el valor de los datos y la longitud del funcionamiento. Éste es un ejemplo de la compresión de datos lossless. Es de uso frecuente optimizar la espacio de disco en las computadoras de la oficina, o un uso mejor la conexión anchura de banda en a red de ordenadores. Para los datos simbólicos tales como hojas de balance, texto, programas ejecutables, el etc., losslessness es esencial porque cambiar incluso un de un solo bit no puede ser tolerada (excepto en algunos casos limitados).
Para los datos visuales y audio, una cierta pérdida de calidad puede ser tolerada sin perder la naturaleza esencial de los datos. Aprovechándose de las limitaciones del sistema sensorial humano, el espacio mucho puede ser ahorrado mientras que produce una salida que sea casi indistinguible de la original. Estos métodos de la compresión de datos del lossy ofrecen típicamente una compensación de tres vías entre la velocidad de la compresión, el tamaño comprimido de los datos y la pérdida de la calidad.
Lossy compresión de la imagen se utiliza adentro cámaras fotográficas digitales, para aumentar memorias con la degradación mínima de la calidad del cuadro. Semejantemente, DVDs utilice el lossy MPEG-2 codec para compresión video.
En el lossy compresión audio, métodos de psychoacoustics se utilizan quitar componentes no-audibles (o menos audibles) del señal. La compresión del discurso humano se realiza a menudo con aún más técnicas especializadas, de modo que “compresión de discurso“o “la codificación de la voz” se distingue a veces como una disciplina separada que “la compresión audio”. Diversos estándares de la compresión del audio y de discurso se enumeran debajo codecs audio. La compresión de la voz se utiliza adentro Telefonía del Internet por ejemplo, mientras que la compresión audio se utiliza para el CD que rasga y es descifrada por los jugadores audio.
El fondo teórico de la compresión se proporciona cerca teoría de información (que está de cerca se relacionó con teoría de información algorítmica) y cerca teoría de la tarifa-distorsión. Estos campos del estudio esencialmente fueron creados cerca Claude Shannon, que publicó los papeles fundamentales en el asunto en los últimos años 40 y los comienzos de los años 50. Criptografía y teoría de la codificación también se relacionan de cerca. La idea de la compresión de datos está conectada profundamente con inferencia estadística.
Muchos sistemas lossless de la compresión de datos se pueden ver en términos de modelo de cuatro pisos. Los sistemas de la compresión de datos del lossy incluyen típicamente aún más etapas, incluyendo, por ejemplo, la predicción, la transformación de la frecuencia, y el quantization.
Los métodos de la compresión de Lempel-Ziv (LZ) están entre los algoritmos más populares para el almacenaje lossless. DESINFLE es una variación en LZ que se optimice para la velocidad de la descompresión y el cociente de la compresión, aunque la compresión puede ser lenta. DESINFLE se utiliza adentro PKZIP, gzip y Png. LZW (Lempel-Ziv-Galés) se utiliza en imágenes del GIF. También significativos son los métodos de LZR (LZ-Renau), que sirven como la base del método del cierre relámpago. Los métodos de LZ utilizan un modelo tabla-basado de la compresión donde las entradas de la tabla se substituyen para las cadenas repetidas de datos. Para la mayoría de los métodos de LZ, esta tabla se genera dinámicamente de datos anteriores en la entrada. La tabla sí mismo está a menudo Huffman codificado (e.g. SHRI, LZX). Un esquema de codificación LZ-basado actual que se realiza bien es LZX, utilizado en Microsoft TAXI formato.
Los compresores muy mejores utilizan los modelos probabilistic que predicciones se juntan a un algoritmo llamado codificación aritmética. Codificación aritmética, inventada cerca Jorma Rissanen, y dado vuelta en un método práctico por Witten, Neal, y Cleary, alcanza la compresión superior al algoritmo mejor-sabido de Huffman, y se presta especialmente bien a las tareas adaptantes de la compresión de datos donde están fuertemente contexto-dependientes las predicciones. La codificación aritmética se utiliza en el estándar con dos niveles de la imagen-compresión JBIG, y el estándar de la documento-compresión DjVu. El texto entrada sistema, Dasher, es un inverso-aritmética-codificador.
Hay una conexión cercana entre aprender de máquina y la compresión: un sistema que predice las probabilidades posteriores de una secuencia dada su historia entera se puede utilizar para la compresión de datos óptima (usando la codificación aritmética en la distribución de salida), mientras que un compresor óptimo se puede utilizar para la predicción (encontrando el símbolo que comprime lo más mejor posible, dado la historia anterior). Esta equivalencia se ha utilizado como justificación para la compresión de datos como prueba patrón para la “inteligencia general” [1].
Colecciones de datos, de uso general para comparar algoritmos de la compresión.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Custom Search
|
© Copyright 2011 WorldLingo. Reservados todos los derechos.