Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D Le Miniguide all'orientamento Gli eBook di Federica La Corte in Rete
 
I corsi di Scienze Matematiche Fisiche e Naturali
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Sergio Cavaliere » 16.Trasformata di Fourier a Tempo Breve (STFT short time fourier transform)


Trasformata di Fourier a Tempo Breve

Trasformata di Fourier a Tempo Breve (STFT Short Time Fourier Transform)

La trasformata di Fourier fornisce una misura media del peso delle diverse frequenze nel segnale in esame, in tutta la sua durata. Ad esempio uno sweep di frequenza da 200Hz ad 800Hz, ha una trasformata come in figura: sono presenti tutte le frequenze dello sweep, manca però qualsiasi informazione sull’evoluzione del segnale nel tempo.

Viceversa l’analisi di un segnale non “stazionario” deve fornire informazioni su quando le diverse componenti in frequenza sono attive e con che contenuto energetico. Quindi informazioni sui tempi oltre che sul contenuto in frequenza.

Nell’articolazione del parlato ad esempio diversi segmenti di parlato presentano spettri diversi che vanno caratterizzati per la comprensione del segnale vocale.

Sweep sinusoidale di frequenza tra 100 e 1000 Hz per 0.2 s.

Sweep sinusoidale di frequenza tra 100 e 1000 Hz per 0.2 s.

Spettro del segnale Sweep.

Spettro del segnale Sweep.


Windowing di un segnale

Per ovviare a questo problema si può procedere nel modo seguente.

Se noi supponiamo che il segnale, pur essendo non stazionario, abbia tuttavia caratteristiche stazionarie per brevi intervalli di tempo, possiamo in un intervallo di questo durata, calcolare localmente lo spettro; questo darà allora l’idea del contenuto spettrale del segnale in esame relativamente a quell’intervallo di tempo.

Basterà allora, per descrivere l’evoluzione dello spettro del segnale, calcolare questo spettro su segmenti consecutivi del segnale ed ottenere per ogni segmento uno spettro.

Per fare questa operazione si possono isolare segmenti di segnale moltiplicando per una finestra che scorre nel segnale.

Sarà inoltre conveniente procedere per segmenti parzialmente accavallati con un “overlap” pari ad esempio alla metà della durata dell’intervallo elementare, al fine di ottenere una descrizione più graduale e meglio interpolata dello spettro.

L’operazione di windowing di un segnale: in rosso la finestra e la relativa porzione di segnale così isolata. Lo spettro di questo segnale a durata limitata rappresenta il contenuto in frequenza del segnale nell’intervallo di tempo selezionato.

L'operazione di windowing di un segnale: in rosso la finestra e la relativa porzione di segnale così isolata. Lo spettro di questo segnale a durata limitata rappresenta il contenuto in frequenza del segnale nell'intervallo di tempo selezionato.


Finestra rettangolare

La finestra può essere rettangolare ma questa forma altera significativamente lo spettro del segnale.

Ad esempio un segnale sinusoidale, a 400Hz, finestrato come in figura, dà uno spettro alterato rispetto al valore teorico (singola riga): in pratica la singola riga spettrale è diventata una intera banda intorno alla frequenza di 400Hz ; inoltre sono prodotte delle repliche di questa banda in tutto lo spettro, con attenuazione decrescente.

Del resto lo spettro del segnale finestrato, cioè moltiplicato per la finestra rettangolare, per la proprietà del prodotto, è costituito dalla convoluzione dello spettro del segnale con lo spettro della finestra rettangolare.

Le rapide transizioni di questa finestra producono forti ondulazioni nel suo spettro, che, a causa della convoluzione si sovrappongono allo spettro originario.

Si possono allora usare per rimediare a questo inconveniente, delle finestra con dei contorni smussati e con uno spettro meno oscillante.

Segnale sinusoidale.

Segnale sinusoidale.

Spettro del segnale sinusoidale con finestra rettangolare.

Spettro del segnale sinusoidale con finestra rettangolare.


Finestra rettangolare (segue)

La finestra può essere rettangolare ma questa forma altera significativamente lo spettro del segnale.

Ad esempio un segnale sinusoidale, a 400Hz, finestrato come in figura, dà uno spettro alterato rispetto al valore teorico (singola riga): in pratica la singola riga spettrale è diventata una intera banda intorno alla frequenza di 400Hz ; inoltre sono prodotte delle repliche di questa banda in tutto lo spettro, con attenuazione decrescente.

Ricordiamo che per tutte le trasformate di Fourier vale la proprietà per cui al prodotto nel dominio dei tempi corrisponda la convoluzione nel dominio delle frequenza e viceversa.
Lo spettro del segnale finestrato, cioè moltiplicato per la finestra rettangolare, quindi, è dato dalla convoluzione dello spettro del segnale con lo spettro della finestra rettangolare.
Le rapide transizioni di questa finestra producono forti ondulazioni nel suo spettro, che, a causa della convoluzione si sovrappongono allo spettro originario.

Segnale sinusoidale.

Segnale sinusoidale.

Spettro del segnale sinusoidale con finestra rettangolare.

Spettro del segnale sinusoidale con finestra rettangolare.


Finestra rettangolare (segue)

La finestra può essere rettangolare ma questa forma altera significativamente lo spettro del segnale.

Ad esempio un segnale sinusoidale, a 400Hz, finestrato come in figura, dà uno spettro alterato rispetto al valore teorico (singola riga): in pratica la singola riga spettrale è diventata una intera banda intorno alla frequenza di 400Hz ; inoltre sono prodotte delle repliche di questa banda in tutto lo spettro, con attenuazione decrescente.

Del resto lo spettro del segnale finestrato, cioè moltiplicato per la finestra rettangolare, per la proprietà del prodotto, è costituito dalla convoluzione dello spettro del segnale con lo spettro della finestra rettangolare.

Le rapide transizioni di questa finestra producono forti ondulazioni nel suo spettro, che, a causa della convoluzione si sovrappongono allo spettro originario.

Segnale sinusoidale.
Spettro del segnale sinusoidale con finestra rettangolare.
Spettro della finestra rettangolare.

Finestra di Hanning

Si possono allora usare, per rimediare a questo inconveniente, delle finestra con dei contorni smussati e con uno spettro meno oscillante.

Se si usa una finestra con bordi smussati come la finestra di Hanning, avremo, nel tempo ed in frequenza i diagrammi in figura.
Analizzando i dettagli si osserva che:

  • La banda intorno alla frequenza centrale è diventata più larga che nel caso della finestra rettangolare. Quindi perdita di risoluzione in frequenza: è impossibile separare due frequenze molto vicine. E’ dunque preferibile usare una finestra rettangolare se lo scopo è quello di discriminare tra frequenze vicine.
  • La reiezione della bande laterali è aumentata rispetto al caso della finestra rettangolare: il primo lobo laterale è a più di 30dB al di sotto della frequenza ‘vera’. Nel caso rettangolare il primo lobo laterale è al di sotto di soltanto 12dB; le righe spettrali adiacenti alla riga in esame sono modificate in meno e lo spettro viene reso in maniera più fedele nel caso di finestra arrotondata. (Leakage)
Finestra Hanning sovrapposta ad un segnale sinusoidale.

Finestra Hanning sovrapposta ad un segnale sinusoidale.

Spettro della sinusoide finestrata.

Spettro della sinusoide finestrata.


Rappresentazione waterfall dello spettrogramma

Esistono numerose tipologie di finestre, ognuna delle quali presenta sue specifiche caratteristiche, sempre legate ai parametri visti sopra, e tra cui si può scegliere in rapporto alla specifica applicazione. Tra queste:

  • Hanning
  • Bartlett
  • Blackman
  • Chebwin
  • Hamming
  • Hann
  • Kaiser
  • ………

Finestrando il segnale con finestre parzialmente sovrapposte si può ottenere lo spettro del segnale per ognuno degli intervalli di tempo considerati (spettrogramma).

Questi spettri si possono rappresentare in 3D mediante la rappresentazione waterfall, mostrata in figura per lo sweep in frequenza già visto. Sul piano di base le coordinate sono tempo e frequenza; sull’asse z rappresentiamo il modulo della trasformata.

Spettrogramma, l’intensità dello spettro è resa mediante opportuni colori.

Spettrogramma, l'intensità dello spettro è resa mediante opportuni colori.


Spettrogramma

Un secondo tipo di rappresentazione grafica associa allo spettrogramma una immagine a colori in cui le coordinate sono tempi e frequenze ed il colore il modulo della trasformata per quell’intervallo e quella frequenza; questo tipo di rappresentazione, è usato soprattutto per l’analisi della voce.

Dallo spettrogramma è possibile ricavare informazioni sula segnale analizzato, distinguendo ad esempio nel caso di segnale vocale segmenti vocali da tratti consonantici.

Nel diagramma a fianco, relativo allo sweep di frequenza visto sopra, è evidente come la rappresentazione descriva l’evoluzione del segnale nel tempo.

Si deve osservare che, usando opportune finestre ed appropriato valore per il numero di punti di cui ci si sposta per fare scorrere la finestra (hop), la STFT risulta essere una trasformazione invertibile. Essa può essere invertita ottenendo precisamente il segnale di partenza, come nel caso delle trasformazioni in frequenza del tipo Fourier.
In tal caso si parla di rappresentazioni tempo-frequenza.

Suono relativo allo spettogramma in figura.

Spettrogramma, l’intensità dello spettro è resa mediante opportuni colori.

Spettrogramma, l'intensità dello spettro è resa mediante opportuni colori.


Esempi di spettrogrammi

Ingrandendo un porzione dell’immagine si verifica come l’avere guadagnato in termini di risoluzione nel tempo, abbia viceversa diminuito la risoluzione in frequenza.

L’andamento locale definisce un intervallo intero di frequenze attribuibili al segnale in quell’istante di tempo (banda di colore più scuro), mentre la frequenza istantanea “vera” è quella sovrapposta alla figura, in colore nero .

A fianco infine è riportato un esempio di spettrogramma di segnale vocale, per la sequenza a-e-i-o-u .

Suono di spettrogramma in figura.

Lo spettrogramma ingrandito: risoluzione.

Lo spettrogramma ingrandito: risoluzione.

Spettrogramma della sequenza di vocali a e i o u.

Spettrogramma della sequenza di vocali a e i o u.


Si propongono qui alcuni spettrogrammi di diversi segnali, con il relativo suono, nell’ordine
Due sweep in frequenza- sinusoide modulata in frequenza – rumore bianco – 
Rumore filtrato con filtro tempo variante – Pianoforte – Chitarra.

Si propongono qui alcuni spettrogrammi di diversi segnali, con il relativo suono, nell'ordine Due sweep in frequenza- sinusoide modulata in frequenza – rumore bianco - Rumore filtrato con filtro tempo variante – Pianoforte - Chitarra.


  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion