Топ 10 статей

Направляющий выступ Hitchhiker к галактике (игра компьютера)
Pablo Neruda
Zaara (серии TV)
Clownfish
Экстраполяция
Великобританское королевская семья
Римские цифры
Силикат натрия
Декартовая система координат
Типы незанятости

News:

Уплотнений данных

В компьутерные науки и теория информации, уплотнений данных или кодирвоание источника процесс шифровать информацию использующ менее биты (или другие блоки информаци-подшипника) чем unencoded представление использовало бы через пользу специфического зашифрование схемы. Один популярный пример обжатия с много потребителей компьютера знакомы Форма архива ЗАСТЕЖКА-МОЛНИИ, который, также, как обеспечивать обжатие, действует как archiver, много архивов источника в одиночном выходном файле назначения.

Как с любым сообщением, compressed передача данных только работает когда оба прислужник и приемник информация поймите шифруя схему. Например, этот текст делает чувство только если приемник понимает, то что предназначены, что интерпретировано как характеры представляя английский язык. Подобно, compressed данные можно только понять если метод расшифровывать известен приемником.

Обжатие полезно потому что оно помогает уменьшить потребление дорогих ресурсов, such as трудный диск космос или передача ширина полосы частот (вычислять). On the downside, compressed данные необходимо распрессовать быть использованным, и этот обрабатывать экстраего может быть вредн к некоторым применениям. For instance, распрессуется схема обжатия для видеоего может требовать, что дорогее оборудование для видеоего было распрессовано быстро достаточно быть осмотренным как она (вариант распрессовать видеоего полностью перед наблюдать его может быть неудобн, и требует складского помещения для распрессованного видеоего). Конструкция схем уплотнений данных поэтому включает trade-offs среди различных факторов, включая STEPENь обжатия, введенное количество искажения (если использующ a схема обжатия lossy), и вычислительные ресурсы требуемые, что обжать и uncompress данные.

Содержание

Lossless против обжатия lossy

Lossless алгоритмы обжатия обычно эксплуатируют статистически дублирование для того чтобы представить данные по прислужника сжато без ошибки. Обжатие Lossless по возможности потому что большинств real-world данные имеют статистически дублирование. Например, на английском языке текст, письмо «e» очень более общее чем письмо «z», и вероятность что письмо «q» будет последовано за письмом «z» очень мала.

Другое вроде вызванное обжатие, уплотнений данных lossy или perceptual кодирвоание, по возможности если некоторая потеря точность воспроизведения будет приемлемо. Вообще, уплотнений данных lossy будет направлен исследованием на как люди воспринимают данные в вопросе. Например, людской глаз более чувствительн к subtle изменениям внутри luminance чем оно к изменениям в цвете. JPEG обжатие изображения работает в части «округлять с» некоторой из этой менее-важной информации. Уплотнений данных Lossy обеспечивает дорогу получить самую лучшую точность воспроизведения для, котор дали количества обжатия. In some cases, прозрачно (unnoticeable) обжатие пожелано; в другие случаи, точность воспроизведения пожертвована для того чтобы уменьшить количество данных как можно больше.

Схемы обжатия Lossless реверзибельны TAK, CTO первоначально данные можно реконструировать, пока схемы lossy признавают некоторую потерю данных для того чтобы достигнуть более высокого обжатия.

Однако, lossless алгоритмы уплотнений данных нигогда не будут мочь обжать некоторые архивы; деиствительно, любой алгоритм обжатия обязательно не сумеет обжать VSе данные не содержа никакие discernible картины. Пытает обжать данные были обжаты уже поэтому обычно приведут к в расширении, как будьте попытки обжать encrypted данные.

In practice, уплотнений данных lossy также придет к пункту где обжимать снова не работает, хотя весьма алгоритм lossy, который например всегда извлекает последний байт архива, всегда будет обжимать архив до пункта где он пуст.

Пример lossless против обжатием lossy будет following шнур:

25.888888888

Этот шнур можно обжать как:

25.[9]8

Я интерпретированы как, «двадцать пять указывают 9 eights», первоначально шнур совершенно воссозданы, как раз после того как они написаны в более малой форме. В системе lossy, использующ

26

вместо, первоначально данные потеряны, на преимуществе более малого размера архива.

Применения

Вышеуказанное будет очень просто примером зашифрование бежать-длины, при котором большие бега последовательных идентичных значений данных заменены просто Кодим с значением данных и длиной бега. Это будет пример lossless уплотнений данных. Оно часто использовано для того чтобы оптимизировать космос диска на компьютерах офиса, или более лучшую пользу соединение ширина полосы частот в a компьютерная сеть. Для символических данных such as spreadsheets, текст, исполнительные программы, cEtc, losslessness необходимо потому что изменять даже однобитовое нельзя допустить (за исключением в некоторых лимитированных случаев).

Для визуально и тональнозвуковых данных, некоторую потерю качества можно допустить без терять необходимую природу данных. Путем take advantage of ограничения людской сензорной системы, много космос может быть сохранен пока производящ выход который близко indistinguishable от оригинала. Эти методы уплотнений данных lossy типично предлагают трехходовой tradeoff между скоростью обжатия, compressed размером данных и потерей качества.

Lossy обжатие изображения использует внутри цифровые камеры, увеличить объемы хранилища с минимальным ухудшением качества изображения. Подобно, DVDs используйте lossy MPEG-2 кодек для видео- обжатие.

В lossy тональнозвуковое обжатие, методы психоакустика используйте для того чтобы извлечь non-звуковые (или более менее звуковые) компоненты сигнал. Обжатие людской речи часто выполнено с even more специализированными методами, так НОП «обжатие речи«или «кодирвоание голоса» иногда различено по мере того как отдельно дисциплина чем «тональнозвуковое обжатие». По-разному стандарты обжатия аудиоего и речи перечислены вниз тональнозвуковые codecs. Обжатие голоса использовано внутри Телефонирование интернета например, пока тональнозвуковое обжатие использовано для CD рва и расшифровано тональнозвуковыми игроками.

Теория

Теоретическая предпосылка обжатия обеспечена мимо теория информации (близко отнесл к алгоритмическое теория информации) и мимо теория тариф-искажения. Эти поля изучения необходимо были созданы мимо Клод Шеннон, который опубликовало основные бумаги на теме in the late 1940s и предыдущие 1950s. Тайнопись и теория кодирвоания также близко отнесите. Идея уплотнений данных глубоки подключена с статистически подразумеваемым.

Много lossless систем уплотнений данных можно осмотреть in terms of четырехкаскадная модель. Системы уплотнений данных Lossy типично вклюают even more этапы, включая, например, прогноз, преобразование частоты, и квантование.

Методы обжатия Lempel-Ziv (LZ) находятся среди самых популярных алгоритмов для lossless хранения. ВЫКАЧАЙТЕ изменение на LZ оптимизировано для скорости и коэффициента компрессии понижения давления, хотя обжатие может быть медленно. ВЫКАЧАЙТЕ использует внутри PKZIP, gzip и PNG. LZW (Lempel-Ziv-Welch) использует в изображениях GIF. Также достопримечательны методы LZR (LZ-Renau), которые служят за основа метода застежка-молнии. Методы LZ используют таблиц-основанную модель обжатия где входы таблицы заменены для повторных шнуров данных. Для большинств методов LZ, эта таблица произведена dynamically от более предыдущих данных в входном сигнале. Таблица сама часто Huffman зашифровало (например. SHRI, LZX). В настоящее время LZ-основанная схема кодирвоания выполняет наилучшим образом LZX, использовано в Microsoft КАБИНА форма.

Очень самые лучшие компрессоры используют вероятностные модели прогнозы соединены к вызванному алгоритму арифметическое кодирвоание. Арифметическое кодирвоание, изобретенное мимо Jorma Rissanen, и после того как я повернуты в практически метод Witten, Neal, и Cleary, достигают главного обжатия к лучш-известный алгоритму Huffman, и одалживают специально наилучшим образом к приспособительным задачам уплотнений данных где прогнозы сильно смысл-зависимые. Арифметическое кодирвоание использовано в bilevel стандарте изображени-обжатия JBIG, и стандарт документ-обжатия DjVu. Текст вход система, Dasher, обратн-арифметик-кодер.

Будет тесные связи между учить машины и обжатием: систему предсказывает posterior вероятности последовательности, котор дали свою всю историю можно использовать для оптимальный уплотнений данных (путем использование арифметического кодирвоания на распределении выхода), пока оптимальный компрессор можно использовать для прогноза (путем находить символ который обжимает наиболее наилучшим образом, котор дали ранее историю). Эта равнозначность была использована как объяснение для уплотнений данных как отметка уровня для «вообще сведении» [1].

См. также

Темы уплотнений данных

Алгоритмы обжатия

Уплотнений данных Lossless

Уплотнений данных Lossy

Вставкы примера

  • ВЫКАЧАЙТЕ (комбинация кодирвоания LZ77 и Huffman) - используемого мимо ЗАСТЕЖКА-МОЛНИЯ, gzip и PNG архивы
  • LZMA использовано мимо 7-Zip и, to a lesser extent, StuffitX
  • LZO (очень быстрое ориентированные изменение, скорость LZ)
  • LZX (алгоритм обжатия семьи LZ77)
  • Unix обжатие общее назначение (. Форма архива z), и GIF польза LZW
  • Unix пакет общее назначение (форма архива .z) использовало Кодирвоание Huffman
  • bzip2 (комбинация Burrows-Wheeler преобразовывает и кодирвоание Huffman)
  • PAQ (очень высокое обжатие основанное дальше смешивать смысла, но весьма замедляйте; состязаться в верхней части самых высоких конкуренций обжатия)
  • JPEG (обжатие изображения используя дискретный косинус преобразовывает, после этого квантование, после этого кодирвоание Huffman)
  • MPEG (тональнозвуковое и видео- стандартная семья обжатия в широкой пользе, использующ DCT и движени-компенсированный прогноз для видеоего)
    • MP3 (часть MPEG-1 стандарт для обжатия звука и нот, использующ subbanding и MDCT, perceptual моделирование, квантование, и кодирвоание Huffman)
    • AAC (часть MPEG-2 и MPEG-4 тональнозвуковые спецификации кодирвоания, использующ MDCT, perceptual моделирование, квантование, и кодирвоание Huffman)
  • Vorbis (Кодек основанный DCT AAC-alike тональнозвуковой, конструированный с фокусом на избежании encumbrance патента)
  • JPEG 2000 (обжатие изображения использующ wavelets, после этого квантование, после этого кодирвоание энтропии)
  • TTA (пользы линейное предвестниковое кодирвоание для lossless тональнозвукового обжатия)
  • FLAC (линейное предвестниковое кодирвоание для lossless тональнозвукового обжатия)

Corpora

Собрания данных, общ используемые для сравнивать алгоритмы обжатия.

Справки

Внешние соединения


The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence