Trasformata di Fourier a Tempo Breve (STFT Short Time Fourier Transform)
La trasformata di Fourier fornisce una misura media del peso delle diverse frequenze nel segnale in esame, in tutta la sua durata. Ad esempio uno sweep di frequenza da 200Hz ad 800Hz, ha una trasformata come in figura: sono presenti tutte le frequenze dello sweep, manca però qualsiasi informazione sull’evoluzione del segnale nel tempo.
Viceversa l’analisi di un segnale non “stazionario” deve fornire informazioni su quando le diverse componenti in frequenza sono attive e con che contenuto energetico. Quindi informazioni sui tempi oltre che sul contenuto in frequenza.
Nell’articolazione del parlato ad esempio diversi segmenti di parlato presentano spettri diversi che vanno caratterizzati per la comprensione del segnale vocale.
Per ovviare a questo problema si può procedere nel modo seguente.
Se noi supponiamo che il segnale, pur essendo non stazionario, abbia tuttavia caratteristiche stazionarie per brevi intervalli di tempo, possiamo in un intervallo di questo durata, calcolare localmente lo spettro; questo darà allora l’idea del contenuto spettrale del segnale in esame relativamente a quell’intervallo di tempo.
Basterà allora, per descrivere l’evoluzione dello spettro del segnale, calcolare questo spettro su segmenti consecutivi del segnale ed ottenere per ogni segmento uno spettro.
Per fare questa operazione si possono isolare segmenti di segnale moltiplicando per una finestra che scorre nel segnale.
Sarà inoltre conveniente procedere per segmenti parzialmente accavallati con un “overlap” pari ad esempio alla metà della durata dell’intervallo elementare, al fine di ottenere una descrizione più graduale e meglio interpolata dello spettro.
La finestra può essere rettangolare ma questa forma altera significativamente lo spettro del segnale.
Ad esempio un segnale sinusoidale, a 400Hz, finestrato come in figura, dà uno spettro alterato rispetto al valore teorico (singola riga): in pratica la singola riga spettrale è diventata una intera banda intorno alla frequenza di 400Hz ; inoltre sono prodotte delle repliche di questa banda in tutto lo spettro, con attenuazione decrescente.
Del resto lo spettro del segnale finestrato, cioè moltiplicato per la finestra rettangolare, per la proprietà del prodotto, è costituito dalla convoluzione dello spettro del segnale con lo spettro della finestra rettangolare.
Le rapide transizioni di questa finestra producono forti ondulazioni nel suo spettro, che, a causa della convoluzione si sovrappongono allo spettro originario.
Si possono allora usare per rimediare a questo inconveniente, delle finestra con dei contorni smussati e con uno spettro meno oscillante.
La finestra può essere rettangolare ma questa forma altera significativamente lo spettro del segnale.
Ad esempio un segnale sinusoidale, a 400Hz, finestrato come in figura, dà uno spettro alterato rispetto al valore teorico (singola riga): in pratica la singola riga spettrale è diventata una intera banda intorno alla frequenza di 400Hz ; inoltre sono prodotte delle repliche di questa banda in tutto lo spettro, con attenuazione decrescente.
Ricordiamo che per tutte le trasformate di Fourier vale la proprietà per cui al prodotto nel dominio dei tempi corrisponda la convoluzione nel dominio delle frequenza e viceversa.
Lo spettro del segnale finestrato, cioè moltiplicato per la finestra rettangolare, quindi, è dato dalla convoluzione dello spettro del segnale con lo spettro della finestra rettangolare.
Le rapide transizioni di questa finestra producono forti ondulazioni nel suo spettro, che, a causa della convoluzione si sovrappongono allo spettro originario.
La finestra può essere rettangolare ma questa forma altera significativamente lo spettro del segnale.
Ad esempio un segnale sinusoidale, a 400Hz, finestrato come in figura, dà uno spettro alterato rispetto al valore teorico (singola riga): in pratica la singola riga spettrale è diventata una intera banda intorno alla frequenza di 400Hz ; inoltre sono prodotte delle repliche di questa banda in tutto lo spettro, con attenuazione decrescente.
Del resto lo spettro del segnale finestrato, cioè moltiplicato per la finestra rettangolare, per la proprietà del prodotto, è costituito dalla convoluzione dello spettro del segnale con lo spettro della finestra rettangolare.
Le rapide transizioni di questa finestra producono forti ondulazioni nel suo spettro, che, a causa della convoluzione si sovrappongono allo spettro originario.
Si possono allora usare, per rimediare a questo inconveniente, delle finestra con dei contorni smussati e con uno spettro meno oscillante.
Se si usa una finestra con bordi smussati come la finestra di Hanning, avremo, nel tempo ed in frequenza i diagrammi in figura.
Analizzando i dettagli si osserva che:
Esistono numerose tipologie di finestre, ognuna delle quali presenta sue specifiche caratteristiche, sempre legate ai parametri visti sopra, e tra cui si può scegliere in rapporto alla specifica applicazione. Tra queste:
Finestrando il segnale con finestre parzialmente sovrapposte si può ottenere lo spettro del segnale per ognuno degli intervalli di tempo considerati (spettrogramma).
Questi spettri si possono rappresentare in 3D mediante la rappresentazione waterfall, mostrata in figura per lo sweep in frequenza già visto. Sul piano di base le coordinate sono tempo e frequenza; sull’asse z rappresentiamo il modulo della trasformata.
Un secondo tipo di rappresentazione grafica associa allo spettrogramma una immagine a colori in cui le coordinate sono tempi e frequenze ed il colore il modulo della trasformata per quell’intervallo e quella frequenza; questo tipo di rappresentazione, è usato soprattutto per l’analisi della voce.
Dallo spettrogramma è possibile ricavare informazioni sula segnale analizzato, distinguendo ad esempio nel caso di segnale vocale segmenti vocali da tratti consonantici.
Nel diagramma a fianco, relativo allo sweep di frequenza visto sopra, è evidente come la rappresentazione descriva l’evoluzione del segnale nel tempo.
Si deve osservare che, usando opportune finestre ed appropriato valore per il numero di punti di cui ci si sposta per fare scorrere la finestra (hop), la STFT risulta essere una trasformazione invertibile. Essa può essere invertita ottenendo precisamente il segnale di partenza, come nel caso delle trasformazioni in frequenza del tipo Fourier.
In tal caso si parla di rappresentazioni tempo-frequenza.
Ingrandendo un porzione dell’immagine si verifica come l’avere guadagnato in termini di risoluzione nel tempo, abbia viceversa diminuito la risoluzione in frequenza.
L’andamento locale definisce un intervallo intero di frequenze attribuibili al segnale in quell’istante di tempo (banda di colore più scuro), mentre la frequenza istantanea “vera” è quella sovrapposta alla figura, in colore nero .
A fianco infine è riportato un esempio di spettrogramma di segnale vocale, per la sequenza a-e-i-o-u .
Sinusoide modulata in frequenza
White Noise (rumore bianco)
1. Introduzione al corso. I segnali a tempo continuo ed a tempo di...
3. Sistemi: tipologie. Sistemi discreti e continui, lineari e non.
5. Equazioni alle differenze finite: sistemi del primo ordine
6. Sistemi del Secondo Ordine. Sistemi di ordine arbitrario
7. Sistemi del secondo ordine: sintesi vocale
8. Sistemi per l'elaborazione numerica dei segnali: implementazion...
9. Quantizzazione: precisione finita di parola
10. Segnali continui: Serie di Fourier e Trasformata di Fourier
11. Analisi di Fourier per sequenze periodiche: DFS
12. Serie Discrete di Fourier: esempi
13. Analisi di Fourier per sequenze finite: la DFT
14. Trasformata di Fourier a Tempo Discreto per segnali di durata a...
15. Trasformata di Fourier a Tempo Discreto: proprietà
16. Trasformata di Fourier a Tempo Breve (STFT short time fourier t...
17. La trasformata Z
18. Il teorema del campionamento: ricostruzione
19. Trasformate bidimensionali