I 10 articoli

Odnoklassniki.ru
Hotmail
Vkontakte.ru
Musica sui Sopranos
GayRomeo
Goole
Btjunkie
ICD-10
Starbucks
Slum

News:

Il coseno discreto trasforma

A il coseno discreto trasforma (DCT) esprime una sequenza in modo limitato di molti punti di riferimenti in termini di somma di coseno funzioni che oscillano a differente frequenze. DCTs è importante alle applicazioni numerose nella scienza e nell'ingegneria, da compressione del lossy di audio e immagini (dove piccolo i componenti ad alta frequenza possono essere scartati), a metodi spettrali per la soluzione numerica di equazioni differenziali parziali. L'uso del coseno piuttosto che seno le funzioni è critiche in queste applicazioni: per compressione, risulta che le funzioni di coseno sono molto più efficienti (come spiegato sotto, meno sono necessari approssimarsi ad un tipico segnale), mentre per le equazioni differenziali i coseni esprimono una scelta particolare di stati di contorno.

In particolare, un DCT è a Fourier-relativo trasformi simile al trasformata di fourier discreta (DFT), ma usando soltanto numeri reali. DCTs è approssimativamente due volte equivalente a DFTs della lunghezza, funzionante sui dati reali con uniforme simmetria (poiché la trasformata di fourier di un reale e perfino di una funzione è reale e perfino), dove in alcune varianti i dati dell'uscita e/o dell'input sono spostati dalla metà del campione. Ci sono otto varianti standard di DCT, di cui quattro sono comuni.

La variante più comune del coseno discreto trasforma è il tipo-II DCT, che spesso è denominato semplicemente “il DCT„; il relativo inverso, il tipo-III DCT, corrispondentemente spesso è denominato semplicemente “il DCT inverso„ o “il IDCT„. Due riguardanti trasformano sono il seno discreto trasforma (DST), che è equivalente ad un DFT di reale e dispari funzioni e il coseno discreto modificato trasforma (MDCT), di che è basato su un DCT sovrapposizione dati.

Indice

Applicazioni

Il DCT ed in particolare il DCT-II, è usati spesso nell'elaborazione di immagini e del segnale, particolarmente per la compressione di dati del lossy, perché ha “una proprietà forte di consolidamento di energia„ (Rao e Yip, 1990): la maggior parte delle informazioni del segnale tende ad essere concentrata in alcuni componenti a bassa frequenza del DCT, avvicinarsi Karhunen-Loève trasforma (che è ottimale nel senso di decorrelation) per i segnali basati su determinati limiti di Processi del Markov. Come spiegato sotto, questo proviene dagli stati di contorno impliciti nelle funzioni di coseno.

Un relativo trasforma, modificato il coseno discreto trasforma, o MDCT (basato sul DCT-IV), è usato dentro AAC, Vorbis, WMAe MP3 compressione audio.

DCTs inoltre ampiamente è impiegato nel risolvere le equazioni differenziali parziali con i metodi spettrali, dove le varianti differenti del DCT corrispondono a un po'differente persino/stati di contorno dispari alle due conclusioni dell'allineamento.

DCTs inoltre è collegato strettamente a Polinomi di Chebysheve le procedure veloci di DCT (sotto) sono usate dentro Approssimazione di Chebyshev delle funzioni arbitrarie dalla serie di polinomi di Chebyshev, per esempio dentro Quadratura di Clenshaw-Curtis.

JPEG

Il DCT è usato dentro JPEG compressione di immagine, MJPEG, MPEGe DV video compressione. Là, il DCT-II bidimensionale di i blocchi sono computati ed i risultati sono quantized e l'entropia ha codificato. In questo caso, N sono in genere 8 e la formula di DCT-II è applicata ad ogni fila e colonna del blocco. Il risultato è i 8 che il × 8 trasforma l'allineamento di coefficente in cui (0,0) l'elemento (parte-di sinistra) è il componente ed entrate di CC (zero-frequenza) con l'aumento dei valori di indice verticali ed orizzontali rappresenta le più alte frequenze spaziali verticali ed orizzontali.

Descrizione informale

Come affatto Fourier-relativo trasformi, il coseno discreto trasforma (DCTs) esprime una funzione o un segnale in termini di somma di sinusoids con differente frequenze e ampiezze. Come trasformata di fourier discreta (DFT), un DCT funziona sopra una funzione ad un numero limitato di punti di riferimenti discreti. La distinzione evidente fra un DCT e un DFT è che le funzioni di coseno precedenti di usi soltanto, mentre i coseni che i seni posteriori di usi sia (sotto forma di exponentials complessi). Tuttavia, questa differenza visibile è soltanto una conseguenza di una distinzione più profonda: un DCT implica differente stati di contorno che il DFT o altro riguardante trasforma.

Il Fourier-relativo trasforma che funziona sopra una funzione sopra un limitato dominio, quali il DFT o il DCT o la a Serie di Fourier, può pensarsi come implicitamente a definizione estensione di quella funzione fuori del dominio. Cioè una volta che scrivete una funzione f(x) come somma dei sinusoids, potete valutare quella somma a c'è ne x, anche per x dove l'originale f(x) non è stato specificato. Il DFT, come la serie di Fourier, Implica la a periodico estensione della funzione originale. Un DCT, come la a il coseno trasforma, implica uniforme estensione della funzione originale.

Tuttavia, perché DCTs funziona sopra limitato, discreto le sequenze, due edizioni presentano che per il coseno continuo non trasformano. In primo luogo, si deve specificare a se la funzione è uniforme o dispari entrambi i contorni destri e sinistri del dominio (cioè. il minuton e massimon contorni nelle definizioni qui sotto, rispettivamente). In secondo luogo, si deve specificare intorno che punto la funzione è uniforme o dispari. In particolare, consideri una sequenza abcd di quattro punti di riferimenti equidistanti e dica che specifichiamo un uniforme di sinistra contorno. Ci sono due possibilità ragionevoli: il uno o il altro i dati sono anche circa il campione a, nel qual caso l'estensione uniforme è dcbabcd, o i dati sono anche circa il punto a metà strada fra a ed il punto precedente, nel qual caso l'estensione uniforme è dcbaabcd (a è ripetuto).

Queste scelte conducono a tutte le variazioni standard di DCTs ed anche il seno discreto trasforma (DSTs). Ogni contorno può essere uniforme o dispari (2 scelte per il contorno) e può essere simmetrico circa un punto di riferimenti o il punto a metà strada fra due punti di riferimenti (2 scelte per il contorno), per un totale di possibilità. Metà di queste possibilità, quelle dove di sinistra il contorno è uniforme, corrisponde ai 8 tipi di DCT; l'altra metà è i 8 tipi di DST.

Questi stati di contorno differenti interessano fortemente le applicazioni della trasformazione e conducono alle proprietà unicamente utili per i vari tipi di DCT. Il più direttamente quando usando Fourier-relativo trasforma per risolvere equazioni differenziali parziali da metodi spettrali, gli stati di contorno direttamente sono specificati come una parte del problema che è risolto. O, per MDCT (basato sul tipo-IV DCT), gli stati di contorno sono coinvolti intimamente nella proprietà critica del MDCT dell'annullamento di aliasing di tempo-dominio. Ad un modo più sottile, gli stati di contorno sono responsabili “delle proprietà di consolidamento di energia„ che rendono DCTs utile per l'immagine e la compressione audio, perché i contorni interessano il tasso di convergenza di c'è ne Fourier-come la serie.

In particolare, è ben noto che c'è ne discontinuità in una funzione riduca tasso di convergenza della serie di Fourier, Di modo che più sinusoids sono necessari rappresentare la funzione con una data esattezza. Lo stesso principio governa l'utilità del DFT ed altro trasforma per compressione del segnale: la lisciatrice una funzione è, pochi termini nel relativo DFT o DCT sono richiesti per rappresentarli esattamente ed il più possono essere compressi. (Qui, pensiamo al DFT o al DCT come approssimazioni per Serie di Fourier o serie di coseno di una funzione, rispettivamente, per parlare della relativa “scorrevolezza. „) Tuttavia, la periodicità implicita dei mezzi di DFT che le discontinuità si presentano solitamente ai contorni: tutto il segmento casuale di un segnale è improbabile da avere lo stesso valore agli entrambi contorni destri e sinistri. (Il problema simile di A presenta per il DST, in cui lo stato di contorno di sinistra dispari implica una discontinuità per tutta la funzione che non sembra essere zero a quel contorno.) in opposizione, un DCT dove entrambi i contorni sono uniformi sempre rende un'estensione continua ai contorni (anche se pendio è generalmente discontinuo). Ecco perchè DCTs ed in particolare DCTs dei tipi I, II, V e VI (i tipi che hanno due persino contorni) generalmente effettuare più meglio per compressione del segnale che DFTs e DSTs. In pratica, un tipo-II DCT è preferito solitamente per tali applicazioni, in parte in ragione di convenienza di calcolo.

Definizione convenzionale

Formalmente, il coseno discreto trasforma è a lineare, invertibile funzione F : RN -> RN (dove R denota l'insieme di numeri reali), o equivalente un invertibile N × N tabella quadrata. Ci sono parecchie varianti del DCT con le definizioni un po'modificate. N numeri reali x0, ..., xN-1 sono trasformati nel N numeri reali X0, ..., XN-1 secondo una delle formule:

DCT-I

Alcuni autori ulteriori moltiplicano x0 e xN-1 i termini da √2 e moltiplicano corrispondentemente X0 e XN-1 termini da 1/√2. Ciò fa la tabella di DCT-I ortogonale, se uno ulteriore moltiplica da un fattore di scala generale di , ma rompe la corrispondenza diretta con un DFT reale-uniforme.

Il DCT-I è esattamente equivalente (fino ad un fattore di scala generale di 2), ad un DFT di 2N − 2 numeri reali con la simmetria uniforme. Per esempio, un DCT-I di Nnumeri reali =5 abcde è esattamente l'equivalente ad un DFT di otto numeri reali abcdedcb (persino simmetria), divisa per due. (In opposizione, i tipi II-IV di DCT coinvolgono uno spostamento del metà-campione nel DFT equivalente.)

Nota, tuttavia, che il DCT-I non è definito per N più meno di 2. (Tutti i altri tipi di DCT sono definiti per affatto il positive N.)

Quindi, il DCT-I corrisponde agli stati di contorno: xn è uniforme intorno n=0 e perfino intorno n=N-1; similmente per XK.

DCT-II

Il DCT-II è probabilmente la forma più comunemente usata e spesso semplicemente si riferisce a come “il DCT„.

Ciò trasforma è esattamente equivalente (fino ad un fattore di scala generale di 2) ad un DFT di 4N input reali della simmetria uniforme dove gli elementi uniforme-spostati ad incrementi sono zero. Cioè è metà del DFT del 4N input yn, dove y2n = 0, y2n + 1 = xn per e y4Nn = yn per 0 < n < 2N.

Alcuni autori ulteriori moltiplicano X0 termine da 1/√2 (veda sotto per il cambiamento corrispondente in DCT-III). Ciò fa la tabella di DCT-II ortogonale, se uno ulteriore moltiplica da un fattore di scala generale di , ma rompe la corrispondenza diretta con un DFT reale-uniforme di input metà-spostato.

Il DCT-II implica gli stati di contorno: xn è uniforme intorno n=-1/2 e perfino intorno n=N-1/2; XK è uniforme intorno K=0 e dispari intorno K=N.

DCT-III

Poiché è l'inverso di DCT-II (fino ad un fattore di scala, veda sotto), questa forma si riferisce a a volte semplicemente come “il DCT inverso„ (“IDCT„).

Alcuni autori ulteriori moltiplicano x0 il termine da 1/√2 (veda sopra per il cambiamento corrispondente in DCT-II), di modo che i DCT-II e i DCT-III sono traspone di uno un altro. Ciò fa la tabella di DCT-III ortogonale, se uno ulteriore moltiplica da un fattore di scala generale di , ma rompe la corrispondenza diretta con un DFT reale-uniforme di uscita metà-spostata.

Il DCT-III implica gli stati di contorno: xn è uniforme intorno n=0 e dispari intorno n=N; XK è uniforme intorno K=-1/2 e perfino intorno K=N-1/2.

DCT-IV

La tabella di DCT-IV diventa ortogonale se uno ulteriore moltiplica da un fattore di scala generale di .

Una variante del DCT-IV, dove i dati da differente trasformano è coinciso, è denominato il coseno discreto modificato trasforma (MDCT).

Il DCT-IV implica gli stati di contorno: xn è uniforme intorno n=-1/2 e dispari intorno n=N-1/2; similmente per XK.

DCT V-VIII

I tipi I-IV di DCT sono equivalenti a DFTs reale-uniforme di ordine uniforme (senza riguardo a se N è uniforme o dispari), poiché il DFT corrispondente è della lunghezza 2 (N−1) (per DCT-I) o 4N (per DCT-II/III) o 8N (per DCT-VIII). In linea di principio, ci sono realmente quattro tipi supplementari di coseni discreti trasformano (Martucci, 1994), corrispondendo essenzialmente DFTs reale-uniforme di ordine logicamente dispari, di cui abbia fattori nei denominatori delle discussioni di coseno.

Equivalente, DCTs dei tipi I-IV implica i contorni che sono persino/dispari intorno ad un punto di riferimenti per entrambi i contorni o a metà strada fra due punti di riferimenti per entrambi i contorni. DCTs dei tipi V-VIII implica i contorni che livellano/dispari intorno ad un punto di riferimenti per un contorno ed a metà strada fra due punti di riferimenti per l'altro contorno.

Tuttavia, queste varianti sembrano essere usate raramente in pratica. Un motivo, forse, è che le procedure di FFT per la dispari-lunghezza DFTs sono generalmente più complicate delle procedure di FFT per la uniforme-lunghezza DFTs (per esempio. le procedure più semplici radix-2 sono soltanto per le lunghezze uniformi) e questa complessità aumentata rinvia al DCTs come descritto qui sotto.

(L'allineamento reale-uniforme insignificante, una lunghezza-un DFT (lunghezza dispari) di singolo numero a, corrisponde ad un DCT-V della lunghezza N=1.)

L'inverso trasforma

L'inverso di DCT-I è DCT-I moltiplicato da 2 (N-1). L'inverso di DCT-IV è DCT-IV moltiplicato da 2N. L'inverso di DCT-II è DCT-III moltiplicato da 2N (e viceversa).

Come per DFT, il fattore di normalizzazione davanti questi trasforma le definizioni è soltanto una convenzione e differisce da fra i trattamenti. Per esempio, alcuni autori moltiplicano trasforma vicino in modo che l'inverso non richieda alcun fattore moltiplicativo supplementare. Unito con i fattori adatti di √2 (veda sopra), questo può essere usato per fare la tabella di trasformazione ortogonale.

DCTs multidimensionale

Le varianti multidimensionali di vari tipi di DCT seguono semplicemente dalle definizioni unidimensionali: sono semplicemente un prodotto separabile (equivalente, una composizione) di DCTs lungo ogni dimensione.

Per esempio, un DCT-II bidimensionale di un'immagine o di una tabella è semplicemente il DCT-II unidimensionale, da sopra, effettuato lungo le file ed allora lungo le colonne (o viceversa). Cioè il 2d DCT-II è dato dalla formula (omettendo normalizzazione ed altri fattori di scala, come sopra):

Tecnicamente, computando i due (o multi) DCT dimensionali dalle sequenze di DCTs unidimensionale lungo ogni dimensione è conosciuto come a fila-colonna procedura (dopo il caso bidimensionale). Come con procedure multidimensionali di FFT, tuttavia, esiste altri metodi per computare la stessa cosa mentre effettua i calcoli in un ordine differente (cioè. interfogliatura/che unisce le procedure per le dimensioni differenti). ``

L'immagine alla destra mostra la combinazione delle frequenze orizzontali e verticali per i 8 x 8 (N1 = N2 = 8) DCT bidimensionale. Ogni punto da sinistra a destra e la parte superiore alla parte inferiore è un aumento nella frequenza dal ciclo di 1/2. Per esempio, la destra commovente una dal quadrato parte-di sinistra rende un aumento del metà-ciclo nella frequenza orizzontale (va da bianco a nero). Un altro movimento verso la destra rende due metà-cicli (bianchi a nero a bianco). Uno spostamento giù rende orizzontalmente verticalmente due metà-cicli e un metà-ciclo. I dati di fonte (8x8) sono trasformati alla a combinazione lineare di questi quadrato di 64 frequenze.

Calcolo

Anche se l'applicazione diretta di queste formule richiederebbe la O (N2) funzionamenti, è possibile computare la stessa cosa con soltanto la O (N ceppo N) complessità scomponendo il calcolo in fattori similmente al trasformata di fourier veloce (FFT). Uno può anche computare DCTs via FFTs unito con la O (N) punti di post-processing e pre.

Le procedure più efficienti, in linea di principio, sono solitamente quelle che sono specializzati direttamente per il DCT, in contrasto con usando un FFT ordinario più la O (N) funzionamenti supplementari (veda sotto per un'eccezione). Tuttavia, persino “ha specializzato„ le procedure di DCT (tutti i compresi quelli che realizzano i conteggi aritmetici conosciuti più bassi, almeno per alimentazione-di-due i formati) sono collegati in genere strettamente a FFT procedura-dato che DCTs è essenzialmente DFTs dei dati reale-uniformi, uno possono progettare una procedura veloce di DCT prendendo un FFT ed eliminando i funzionamenti ridondanti dovuto questa simmetria. Ciò può persino essere fatta automaticamente (Frigo & Johnson, 2005). Procedure basate sul Procedura di Cooley-Tukey FFT sia il più comune, ma qualunque altra procedura di FFT è inoltre applicabile. Per esempio, la procedura di Winograd FFT conduce alle procedure di minimo-moltiplicazione per il DFT, anche se generalmente al costo di più aggiunte e ad una procedura simile è stato proposto da Feig & da Winograd (1992) per il DCT. Poiché le procedure per DFTs, DCTs e simile trasforma sono tutte collegate così strettamente, tutto il miglioramento nelle procedure per una trasformano teoricamente condurranno ai guadagni immediati per l'altra trasforma pure (Duhamel & Vetterli, 1990).

Mentre le procedure di DCT che impiegano un FFT invariato hanno spesso certe spese generali teoriche confrontate alle procedure di DCT specializzate migliori, il precedenti inoltre presentano un vantaggio distinto: i programmi altamente ottimizzati di FFT sono ampiamente disponibili. Quindi, in pratica, è spesso più facile da ottenere il rendimento elevato per le lunghezze generali N con FFT-ha basato le procedure. (Prestazioni su fissaggi moderni non sono dominate tipicamente semplicemente dai conteggi aritmetici e l'ottimizzazione richiede lo sforzo tecnico notevole.) le procedure specializzate di DCT, d'altra parte, vedono che l'uso molto diffuso per trasforma di piccoli, formati fissi come DCT-II usato dentro JPEG la compressione, o il piccolo DCTs (o MDCTs) hanno usato tipicamente nella compressione audio. (Il formato di codice ridotto può anche essere un motivo usare un DCT specializzato per le applicazioni del incaston-dispositivo.)

Infatti, persino le procedure di DCT che usando un FFT ordinario sono a volte equivalente a potare i funzionamenti ridondanti da un più grande FFT dei dati reale-simmetrici e possono persino essere ottimali dalla prospettiva dei conteggi aritmetici. Per esempio, un tipo-II DCT è equivalente ad un DFT del formato 4N con la simmetria reale-uniforme di cui uniforme-ha spostato ad incrementi gli elementi sono zero. Uno dei metodi più comuni per la computazione del questo via un FFT (per esempio. il metodo impiegato in FFTPACK e FFTW) è dovuto Makhoul (1980) e questo metodo retrospettivamente può essere visto come un punto di una procedura di Cooley-Tukey di decimation-in-tempo radix-4 applicata al DFT reale-uniforme “logico„ che corrisponde al DCT II. (Il punto radix-4 riduce il formato 4N DFT al formato quattroN DFTs dei dati reali, due di cui sono zero e due di cui sia uguale ad uno un altro dalla simmetria uniforme, quindi danti un singolo formatoN FFT dei dati reali più O(N) farfalle.) Poiché gli elementi uniforme-spostati ad incrementi sono zero, questo punto radix-4 è esattamente lo stesso come punto di spacc-base; se il formato successivoN i reale-dati FFT inoltre sono effettuati dai reale-dati procedura di spacc-base (come in Sorensen ed altri., 1987), allora la procedura risultante realmente abbina il conteggio aritmetico pubblicato più basso per il alimentazione-de-due DCT-II (2Nceppo2NN + 2 funzionamenti di reale-aritmetica[1]). Così, ci è niente di intrinsecamente difettoso circa la computazione del DCT via un FFT da un'aritmetica che prospettiva-è a volte soltanto una domanda di se la procedura corrispondente di FFT è ottimale. (Come aspetto pratico, funzione-denomini le spese generali nell'invocazione della procedura separata di FFT potrebbe essere significativo per piccolo N, ma questa è un'esecuzione piuttosto che una domanda algoritmica poiché può essere risolto svolgendosi/che inlining.)

Note

  1. ^ Il conteggio preciso dei funzionamenti aritmetici reali ed in particolare il conteggio delle moltiplicazioni reali, dipende piuttosto dallo scaling della definizione di trasformazione. 2Nceppo2NN + 2 il conteggio è per la definizione di DCT-II indicata qui; due moltiplicazioni possono essere conservate se la trasformazione è regolata da un camice fattore. Le moltiplicazioni supplementari possono essere conservate se una consente le uscite della trasformazione di essere rescaled individualmente, come è stato indicato da Arai ed altri. (1988) per il caso size-8 usato in JPEG.

Riferimenti

  • N. Ahmed, T. Natarajan e K. R. Rao, “coseno discreto trasforma„, Transazione dello IEEE. Calcolatori, 90-93, gen. 1974.
  • Y. Arai, T. Agui e M. Nakajima, “uno schema veloce di DCT-SQ per le immagini,„ Transazione. IEICE 71 (11), 1095-1097 (1988).
  • P. Duhamel e M. Vetterli, “Fourier veloce trasforma: una revisione d'istruzione e una punta del progresso, “ Elaborazione dei segnali 19, 259-299 (1990).
  • E. Feig, S. Winograd. “Le procedure veloci per il coseno discreto trasformano,„ Transazioni dello IEEE sull'elaborazione dei segnali 40 (9), 2174-2193 (1992).
  • Matteo Frigo e Steven G. Johnson: FFTW, http://www.fftw.org/. Un libero (GPL) Biblioteca di C che può computare DCTs veloce (tipi I-IV) in una o più dimensioni, del formato arbitrario. Inoltre M. Frigo e S. G. Johnson, “Il disegno e l'esecuzione di FFTW3," Atti dello IEEE 93 (2), 216-231 (2005).
  • John Makhoul, “un coseno veloce trasforma in una e due dimensioni,„ Transazione dello IEEE. Acoust. Sig di discorso. Proc. 28 (1), 27-34 (1980).
  • S. A. Martucci, “avvolgimento simmetrico ed il seno ed il coseno discreti trasforma,„ Transazione dello IEEE. Sig. Elaborazione SP-42, 1038-1051 (1994).
  • A. V. Oppenheim, R. W. Schafer e J. R. Buck, Elaborazione dei segnali di tempo discreto, seconda edizione (Prentice-Corridoio, New Jersey, 1999).
  • K. R. Rao e P. Yip, Il coseno discreto trasforma: Procedure, vantaggi, applicazioni (Edizione accademica, Boston, 1990).
  • H. V. Sorensen, D. L. Jones, M. T. Heideman e C. S. Burrus, “procedure veloci Real-valued di trasformata di fourier,„ Transazione dello IEEE. Acoust. Sig di discorso. Elaborazione ASSP-35, 849-863 (1987).

Veda inoltre

  • JPEG - Contiene un più facile capire l'esempio di trasformazione di DCT

Collegamenti esterni


The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence