Sia f(t) una funzione che esprime una grandezza tempo-variabile;
f(t) si dice periodica con periodo T se e solo se ∀t si ha che f(t)=f(t+T).
Sia f(t) una funzione periodica con periodo T, allora è possibile operare il seguente sviluppo in serie:
detto ‘fase’ e non rilevante per i nostri fini, si ha quindi che:
In pratica una funzione periodica viene scomposta in una somma di sinusoidi le cui frequenze sono tutte multipli della frequenza fondamentale della funzione stessa. I coefficienti ci determinano le ampiezze di ogni sinusoide componente.
Data una generica funzione u(t) che descrive una qualsiasi variazione di una grandezza fisica nel tempo, si definisce F(w), che ha valori nel dominio dei numeri complessi, la sua trasformata di Fourier
Duplicità ed equivalenza della rappresentazione della funzione: nel dominio del tempo e nel dominio della frequenza.
Passaggio da continuo a discreto: dato un segnale digitale x(n) di N campioni, si definisce la sua trasformata discreta di Fourier X(k):
Il calcolo della DFT richiede per ogni campione N moltiplicazioni.
Se si calcola per N campioni il numero di operazioni eseguite sarà dunque N2.
Fast Fourier Transform (FFT) è un algoritmo ottimizzato per il calcolo della DFT:
Si basa sull’approccio divide et impera – divide la computazione di una DFT di dimensione N=N1N2 in due DFT di dimensioni N1 e N2.
Inviluppo spettrale: linea ideale che individua le aree dello spettro con la massima energia.
L’inviluppo determina il timbro del suono, nel caso di vocali, ad esempio, ci aiuta a decidere quale vocale stiamo ascoltando. La frequenza fondamentale del suono può variare indipendentemente dall’inviluppo e determina solo l’altezza melodica della vocale stessa.
Suono A
I segnali vocali posseggono una forte variabilità in funzione del tempo.
La FFT si applica ripetutamente a piccole porzioni di segnale -> segmenti (detti frames o finestre) di lunghezza tipicamente di 20 ms.
Nei frames le caratteristiche del parlato sono relativamente stazionarie nel tempo
di solito si utilizzano finestre sovrapposte.
Per garantire che il riassemblaggio dei risultati del calcolo della FFT in ogni finestra non sia falsato dalla introduzione di eventuali discontinuità si applica una tecnica detta finestraggio:
w(n) è la funzione di Hamming, uno dei possibili di finestrare i segnali audio per l’analisi tempo-variabile.
In questo modo ogni porzione di x(n) viene modificata in modo che ai suoi estremi il segnale sia sempre prossimo a zero.
In pratica l’analisi del segnale vocale si deve effettuare in tre dimensioni: tempo, frequenza ed ampiezza delle componenti in frequenza.
Lo spettrogramma, talvolta denominato anche ’sonagramma’, è uno strumento classico di analisi del segnale vocale.
È composto dalle DFT di frames sovrapposti e pesati tramite una funzione di Hamming.
Ascissa: tempo, ordinata: frequenza, la terza dimensione, indicante l’intensità delle varie componenti spettrali, è rappresentata dal livello di grigio dei vari punti del piano.
Finestra di analisi lunga:
Finestra di analisi breve:
Forma d'onda della parola "millenovecentottantuno" e il suo spettrogramma narrow band corrispondente
1. Introduzione al corso. Le tecnologie vocali: stato dell'arte e la situazione in Italia
2. Cenni di fonetica articolatoria
3. Digital signal processing applicazioni al segnale vocale – parte prima
4. Digital signal processing applicazioni al segnale vocale – parte seconda
5. Digital signal processing applicazioni al segnale vocale – parte terza
6. Analisi spettrografica del segnale vocale
8. Sintesi vocale da testo - parte prima
9. Sintesi vocale da testo - parte seconda
10. Sintesi vocale da testo - parte terza
11. Riconoscimento del parlato - parte prima
1. Introduzione al corso. Le tecnologie vocali: stato dell'arte e la situazione in Italia
2. Cenni di fonetica articolatoria
3. Digital signal processing applicazioni al segnale vocale – parte prima
4. Digital signal processing applicazioni al segnale vocale – parte seconda
5. Digital signal processing applicazioni al segnale vocale – parte terza
6. Analisi spettrografica del segnale vocale
8. Sintesi vocale da testo - parte prima
9. Sintesi vocale da testo - parte seconda
10. Sintesi vocale da testo - parte terza
11. Riconoscimento del parlato - parte prima
12. Riconoscimento del parlato - parte seconda
I podcast del corso sono disponibili anche su iTunesU e tramite Feed RSS.