Топ 10 статей

Направляющий выступ Hitchhiker к галактике (игра компьютера)
Pablo Neruda
Zaara (серии TV)
Clownfish
Экстраполяция
Великобританское королевская семья
Римские цифры
Силикат натрия
Декартовая система координат
Типы незанятости

News:

Тональнозвуковое обжатие (данные)

Для процессов уменьшают количество времени, котор они принимают для того чтобы слушать к и понимают запись, см. врем-обжатая речь.

Тональнозвуковое обжатие форма уплотнений данных конструировал уменьшить размер тональнозвуковые архивы. Тональнозвуковое обжатие алгоритмы снабдите в средстве программирования компьютера как тональнозвуковые codecs. Родово уплотнений данных алгоритмы выполняют плох при тональнозвуковые данные, редко уменьшая размеры архива очень под 87% из оригинала, и не конструированы для пользы в реальное временя. Следовательно, специфически аудиоий «lossless«и»lossy«алгоритмы были созданы. Алгоритмы Lossy обеспечивают значительно большие коэффициенты компрессии и использованы в mainstream приспособлениях аудиоего едока.

Как с обжатие изображения, и lossy и lossless алгоритмы обжатия использованы в тональнозвуковом обжатии, lossy самыми общими для ежедневной пользы. Как в lossy, так и в lossless обжатие, уменьшено дублирование информации, использующ методы such as кодирвоание, распознавания по образцу и линейный прогноз для уменьшения количества информации используемого для того чтобы описать данные.

Trade-off небольш уменьшенного тональнозвукового качества ясно outweighed для большинств практически тональнозвуковых применений где потребители не могут воспринять любую разницу и требования к космос существенн уменьшен. Например, на один CD, один может приспосабливать час точного нот, более менее чем 2 часов нот обжатых losslessly, или 7 часов нот обжатых в MP3 форматировали.

Содержание

Обжатие аудиоего Lossless

По мере того как хранение архива и ширина полосы частот связей были более менее дорогими и более имеющимися, славолюбие lossless форм such as Аудиоий обезьяны, FLAC и Сократите увеличивает остро, по мере того как люди выбирают поддерживать постоянное архивохранилище их тональнозвуковых архивов. Главным образом потребители lossless обжатия тональнозвуковые инженеры, audiophiles и те едоки которые хотят сохранить точно экземпляр их тональнозвуковых архивов, in contrast to irreversible изменения от методов обжатия lossy such as Vorbis и MP3. Коэффициенты компрессии подобны к коэффициент компрессиидля lossless уплотнений данных (вокруг 50-60% из первоначально размера). Формы Lossless such as Dolby TrueHD также вводите вместе с высоким определением DVD формы.

Трудно водить все данные в тональнозвуковом потоке и достигнуть существенное обжатие. Во первых, подавляющее большинство ядровых записей высоки сложно, после того как я записано от реального мира. По мере того как один из ключевых методов обжатия должно находить картины и повторение, более хаотические данные such as аудиоий не обжимают наилучшим образом. Таким же образом, фотоснимки обжатие эффективно с lossless методами чем более просто computer-generated изображения делает. Но interestingly, даже звуки произведенные компьютером могут содержать очень осложненное формы волны тот настоящий момент возможность к много алгоритмов обжатия. Это из-за природы тональнозвуковых форм волны, которые вообще трудны для того чтобы упростить без преобразования a (обязательно lossy) к данным по частоты, как выполнено людским ухом.

Вторая причина что значения аудиоего образцы измените очень быстро, настолько родовой уплотнений данных алгоритмы не работайте наилучшим образом для аудиоего, и шнуры последовательных байт вообще не появляются очень часто. Однако, свертка с фильтром [- 1 1] (that is, принимающ первую разницу) клонит к небольш забелите (decorrelate, сделайте квартирой) спектр, таким образом позволяя традиционное lossless обжатие на шифраторе сделать свою работу; внедрение на дешифраторе восстанавливает первоначально сигнал. Codecs such as FLAC, Сократите и TTA польза линейный прогноз к предварительный подчет спектр сигнала. На шифраторе, inverse оценщика использован для того чтобы забелить сигнал путем извлекать спектральные пики пока оценщик использован для того чтобы реконструировать первоначально сигнал на дешифраторе.

Codecs Lossless тональнозвуковые не имеют никакие вопросы качества, поэтому usability можно оценить мимо

  • Скорость обжатия и понижения давления
  • STEPENь обжатия
  • Поддержка средства программирования и оборудования
  • Робастности и исправления ошибки

Обжатие аудиоего Lossy

Обжатие Lossy тональнозвуковое использовано в весьма широкие ассортименте применений. В дополнение к сразу применениям (игроки mp3 или компьютеры), цифрово compressed тональнозвуковые потоки использованы в большинств видео- DVDs; цифровое телевидение; средства на интернет; радиоий спутника и кабеля; и все больше и больше в земных radio передачах. Обжатие Lossy типично достигает значительно большого обжатия чем lossless обжатие (данные 5 процентов к 20 процентов первоначально потока, rather than 50 процентов к 60 процентов), путем сбрасывать менее-критически данные.

Рационализаторство обжатия lossy тональнозвукового должно было использовать психоакустика узнать что не все данные в тональнозвуковом потоке могут быть восприниманы людской слуховой системой. Большинств обжатие lossy уменьшает perceptual дублирование первыми определяя звуками учтены perceptually нерелевантно, that is, звуки которые очень трудны для того чтобы услышать. Типичные примеры вклюают высокие частоты, или звуки которые происходят в то же самое время как более громкие звуки. Те звуки закодированы с уменьшитой точностью или не закодированы на всех.

Пока извлекать или уменьшение эти «unhearable» звуки могут определить малый процент битов сохраненных в обжатии lossy, реальные сбереженияа приходят от комплементарного явления: формировать шума. Уменьшение числа битов используемых для того чтобы закодировать сигнал увеличивает количество шума в том сигнале. В психоакустик-основанном обжатии lossy, реальный ключ должен «спрятать» шум произведенный сбереженияами бита в зонах тональнозвукового потока который нельзя воспринять. Это сделано мимо, for instance, использующ очень немного битов для того чтобы закодировать высокие частоты большинств сигналов - не потому что сигнал имеет меньшюю высокочастотную информацию (однако это также часто поистине также), но довольно потому что людское ухо может только воспринять очень громкие сигналы в этой зоне, TAK, CTO более мягкие «спрятанные» звуки там просто не будут услышаны.

Если уменьшение perceptual дублирования не достигает достаточно обжатия для определенного применения, его может требовать более дополнительного обжатия lossy. В зависимости от тональнозвукового источника, это все еще не может произвести уловимые разницы. Речь например можно обжать далеко больше чем нот. Большинств схемы обжатия lossy позволяют параметры обжатия быть отрегулированным для того чтобы достигнуть запланированные темпы роста данных, обычно выражаемого как a единица передачи скорости информации. Опять, уменьшение данных будет направлено некоторой моделью как важно звук как воспринимано людским ухом, с целью эффективности и оптимизированного качества для тарифа данным по цели. (Будут много по-разному моделей используемых для этого perceptual анализа, некоторое лучшего одетого к по-разному типам аудиоего чем другие.) следовательно, в зависимости от требований к ширины полосы частот и хранения, польза обжатия lossy может привести к в восприниманном уменьшении тональнозвукового качества которое колебается от никаких к строгому, но вообще очевидно звуковое уменьшение в качестве неприемлемо к операторам на приеме.

Потому что данные извлечутся во время обжатия lossy и не могут быть взяты понижением давления, некоторые людей не могут предпочитать обжатие lossy для archival хранения. Следовательно, как замечено, выровняйте те которые используют обжатие lossy (для портативных тональнозвуковых применений, например) могут пожелать держать losslessly compressed архивохранилище для других применений. In addition, технология обжатия продолжается выдвинуться, и достигать state-of-the-art обжатия lossy требовал бы, что одно начало снова с lossless, первоначально тональнозвуковыми данными и обжатием с новым кодеком lossy. Природа обжатия lossy (как для аудиоего, так и для изображений) приводит к в увеличивая ухудшении качества если данные распрессованы, то, тогда recompressed использующ обжатие lossy.

История

Большое разнообразие реальных, работая тональнозвуковых систем кодирования было опубликовано в собрании в журнале IEEE на выбранных зонах в сообщениях (JSAC), феврале 1988. Пока были некоторые бумаги от раньше того времени, этот план- конспект бумаг документировал все разнообразие законченных, работать тональнозвуковых кодеров, близко all of them использование perceptual (т.е. маскируя) методы и некоторое вроде кодирвоание анализа частоты и back-end безшумное.[1] Несколько из этих бумаг заметили на затруднении получать хорошем, чистом цифровом аудиоем для целей исследования. Большой часть, if not весь, из авторов в варианте JSAC были также активно в комитете аудиоего MPEG-1.

Автоматизации передачи мира система обжатия первой коммерчески тональнозвуковая была начата Оскар Bonello, профессором инженерства на Университет Buenos Aires.[2] В 1983, использующ psychoacoustic принцип маскировать критически сперва опубликованных полос в 1967,[3] он начал начать практическое применение основанное на недавн начатое IBM ПИКОКУЛОН компьютер, и система автоматизации передачи были запущены в 1987 under the name Audicom. 20 лет более поздно, почти все радиостанции в мире использовали подобную технологию, изготовленную несколькими компаниями.

Методы кодирвоания

Преобразуйте методы домена

Для того чтобы обусловить что информация в звуковом сигнале perceptually нерелевантна, большинств польза алгоритмов обжатия lossy преобразовывает such as доработанный дискретный косинус преобразовывает (MDCT) преобразовать временный интервал попробованные формы волны в домен преобразовывать. Как только преобразовано, типично в домен частоты, компонентными частотами могут быть размещанные биты согласно как звуково они. Слышимость спектральных компонентов обусловлена сперва высчитывать a маскируя порог, под которым оценено то звучает будет за пределами людского воспринятия.

Маскируя порог высчитанным использованием совершенно порог слуха и принципы одновременный маскировать - явление при котором сигнал замаскирован другим сигналом отделенным частотой - и, in some cases, височный маскировать - где сигнал замаскирован другим сигналом отделенным к время. контуры Равн-громкости смогите также быть использовано для утяжеления perceptual важности по-разному компонентов. Модели людской комбинации ух-мозга включая такие влияния часто вызваны psychoacoustic модели.

Методы временного интервала

Другие типы компрессоров lossy, such as линейное предвестниковое кодирвоание (LPC) использовано с речью, источник-основанные кодеры. Эти кодеры используют модель ядрового генератора (such as людской вокальный тракт с LPC) для того чтобы забелить звуковой сигнал (т.е., сплющите свой спектр) до квантования. LPC может также быть подуман как основного perceptual метода кодирвоания; реконструкция звукового сигнала используя линейный упредитель формирует шум квантования кодера в спектр сигнала цели, частично маскируя его.

Применения

Из-за природы алгоритмов lossy, тональнозвуковое качество терпит когда архив распрессован и recompressed (потери generational). Это делает обжатие lossy неподобающе для хранить промежуточные результаты в профессиональных тональнозвуковых применениях инженерства, such as редактировать звука и многоколейная запись. Однако, они очень популярны с пользователями (определенно MP3), как megabyte смогите хранить стоимость около минуты нот на подходящем качестве.

Usability

Usability codecs lossy тональнозвуковых обусловлен мимо:

  • Восприниманное тональнозвуковое качество
  • Фактор обжатия
  • Скорость обжатия и понижения давления
  • Своиственная латентность алгоритма (критически для применений real-time -time; см. ниже)
  • Поддержка средства программирования и оборудования

Формы Lossy часто использованы для распределения аудиоего, или взаимодействующих применений (such as кодирвоание речи для цифровой передачи в телефоннаяа сеть клетки). В таких применениях, данные необходимо распрессовать как потоки информации, rather than после того как был передан весь поток данных. Не все тональнозвуковые codecs можно использовать для применений, и для таких применений кодек конструированный для того чтобы течь данные эффективно обычно будет выбран.

Латентность приводит к от методов используемых для того чтобы зашифровать и расшифровать данные. Некоторые codecs проанализируют более длинний этап данных для того чтобы оптимизировать эффективность, и после этого кодируют его in a manner который требует более большого этапа данных в одно время для того чтобы расшифровать. (Часто codecs создают вызванные этапы «рамкой» для того чтобы создать дискретные этапы данных для шифровать и расшифровывать.) своиственное латентность кодирвоания алгоритм может быть критически; например, когда двухсторонне передача данных, such as с телефонный разговор, значительно задерживает может серьезно ухудшить восприниманное качество.

In contrast to скорость обжатия, которое пропорционально к числу деятельностей потребовал алгоритмом, здесь латентностью refer to число образцов которые необходимо проанализировать прежде чем блок аудиоего обработан. В минимальном случае, латентностью будет zero образцы 0 (например, если кодер/дешифратор просто уменьшают число битов используемых для того чтобы проквантовать сигнал). Алгоритмы временного интервала such as LPC также часто имеют низкие латентности, следовательно их славолюбие в кодирвоании речи для телефонирования. В алгоритмах such as MP3, однако, большое количество образцов должны быть проанализированы для того чтобы снабдить psychoacoustic модель в домене частоты, и латентность находится на заказе госпожи 23 (госпожа 46 для двусторонней связи).

Зашифрование речи

Зашифрование речи важная категория тональнозвуковой уплотнений данных. Perceptual модели использовали оценить людское ухо может услышать отличает вообще несколько ухиспользуемое для нот. Ряд частот необходим для того чтобы транспортировать звуки людского голоса нормальн далеко более узок чем ряднеобходим для нот, и звук нормальн более менее сложн. В результате, речь можно зашифровать на highquality использующ относительно низкие единиц передачи скорости информации.

Это выполнено, in general, некоторой комбинацией 2 подходов:

  • Только шифруя звуки смогли быть сделаны одиночным людским голосом.
  • Бросать прочь больше из данных в сигнале -- держать just enough для того чтобы реконструировать «разборчивый» голос rather than полный частотный ряд человека слух.

Возможно самые предыдущие алгоритмы используемые в зашифровании речи (и тональнозвуковом уплотнений данных вообще) были алгоритм -закона и алгоритм µ-закона.

Словарь

ABR
Среднее bitrate
CBR
Постоянн bitrate
VBR
Переменное bitrate

Справки

См. также

Внешние соединения

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence