Top 10 de los artículosYouTubeGmail Goole GayRomeo Números chinos Números romanos Orkut Costco Sistema porta hepático El mundo Factbook |
News: |
Codificación del discurso es el uso de compresión de datos de audio digital el contener de las señales discurso. La codificación del discurso utiliza discurso-específico valoración del parámetro el usar proceso de la audioseñal las técnicas para modelar la señal de discurso, combinada con algoritmos genéricos de la compresión de datos para representar resultar modelaron parámetros en un bitstream compacto.
Los dos usos más importantes de la codificación del discurso son telefonía móvil y IP excesivo de la voz.
Las técnicas usadas en la codificación del discurso son similares a ésa adentro compresión de datos audio y codificación audio donde conocimiento adentro psychoacoustics se utiliza transmitir solamente los datos que son relevantes al sistema auditivo humano. Por ejemplo, adentro banda estrecha se transmite la codificación del discurso, solamente información en la banda de frecuencia 400 hertzios a 3500 hertzios pero la señal reconstruida sigue siendo adecuada para la inteligibilidad.
La codificación del discurso diferencia de otras formas de codificación audio en que el discurso es una señal mucho más simple que la mayoría de las otras audioseñales, y que hay información mucho más estadística disponible sobre las características del discurso. Consecuentemente, una cierta información auditiva que es relevante en la codificación audio puede ser innecesaria en el contexto de la codificación del discurso. En la codificación del discurso, el criterio más importante es preservación de la inteligibilidad y del “agrado” del discurso, con una cantidad obligada de datos transmitidos.
Debe ser acentuado que la inteligibilidad del discurso incluye, además del contenido literal real, también identidad del altavoz, emociones, entonación, timbre etc. eso es todo importante para la inteligibilidad perfecta. El concepto más abstracto del agrado del discurso degradado es una diversa característica que inteligibilidad, puesto que es posible que el discurso degradado es totalmente inteligible, pero subjetivo de molestia al oyente.
Además, la mayoría de los usos del discurso requieren la codificación baja retrasan, pues la codificación larga retrasa interfiere con la interacción del discurso.
De este punto de vista, Uno-ley y algoritmos de la μ-ley utilizado en tradicional PCM telefonía digital se puede ver como precursor muy temprano de la codificación del discurso, requerir solamente 8 pedacitos por muestra pero dar con eficacia 12 pedacitos de la resolución. Aunque esto generaría la distorsión inaceptable en una señal de la música, la naturaleza peaky de las formas de onda del discurso, combinada con la estructura simple de la frecuencia del discurso como forma de onda periódica con una sola frecuencia fundamental con explosiones de ruido agregadas ocasionales, hace estos algoritmos instantáneos muy simples de la compresión aceptables para el discurso.
Una variedad amplia de otros algoritmos fue intentada en ese entonces, sobre todo las variantes encendido modulación del delta, pero después de la consideración cuidadosa, los algoritmos de A-law/μ-law fueron elegidos por los diseñadores de los sistemas digitales tempranos de la telefonía. A la hora de su diseño, su reducción de la anchura de banda del 33% para una complejidad muy baja les hizo un compromiso excelente de la ingeniería. Su funcionamiento audio sigue siendo aceptable, y no ha habido necesidad de substituirlos en la red de teléfono inmóvil.
Mucho del trabajo más último en la compresión de discurso fue motivado por la investigación militar en las comunicaciones digitales para las radios militares seguras, donde las tarifas de datos muy bajas fueron requeridas para permitir la operación eficaz en un ambiente de radio hostil. Al mismo tiempo, lejos más energía de proceso estaba disponible, bajo la forma de circuitos integrados del VLSI, que disponible para técnicas anteriores de la compresión. Consecuentemente, los algoritmos modernos de la compresión de discurso podrían utilizar técnicas lejos más complejas que disponible en los años 60 para alcanzar cocientes lejos más altos de la compresión.
Estas técnicas estaban disponibles a través de la literatura abierta de la investigación que se utilizará para los usos civiles, permitiendo la creación de las redes de teléfono móvil digitales con capacidades de canal substancialmente más altas que los sistemas análogos que los precedieron.
El esquema de codificación más común del discurso es Cifre la predicción linear excitada (CELP) codificación, que se utiliza por ejemplo en G/M estándar. En CELP, el modelar se divide en dos etapas, a profético linear efectúe que los modelos el sobre y el código-libro espectrales basaron el modelo de la residual del modelo profético linear.
Además de la codificación real del discurso de la señal, es a menudo necesario utilizar codificación del canal para la transmisión, evitar las pérdidas debido a los errores de la transmisión. Generalmente, los métodos de la codificación del discurso y de la codificación del canal tienen que ser elegidos en pares, con los pedacitos más importantes en la secuencia de datos del discurso protegida por una codificación más robusta del canal, para conseguir los mejores resultados totales de la codificación.
Speex el proyecto es una tentativa de crear a software libre el codificador del discurso, unencumbered por restricciones de la patente.
Subcampos importantes:
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Custom Search
|
© Copyright 2011 WorldLingo. Reservados todos los derechos.