L’audio è causato da variazioni di pressione dell’aria.
Le frequenze udibili dall’uomo variano nell’intervallo 20 – 20.000 Hz.
I descrittori fondamentali del suono sono:
Ampiezza e Frequenza del suono variano nel tempo.
Le capacità uditive dell’uomo non sono lineari né rispetto all’ampiezza né rispetto alle frequenze.
Le curve isofoniche descrivono quali livelli sonori (misurati in dB) percepiamo essere uguali al variare della frequenza, cioè con ugual ‘volume’ (misurato in phon).
La maggiore sensibilità è tra i 1.000 e i 5.000 Hz (in questa regione ci vogliono meno dB per avere più phon): in questa banda di frequenza è concentrato buona parte del contenuto informativo del parlato e il nostro udito si è adeguato e sviluppato di conseguenza.
Sensibilità uditiva in funzione della frequenza (db). Fonte: immagine modificata da Sensibilità uditiva
Le 3 fasi fondamentali di un processo ADC sono:
La Frequenza di Campionamento è strettamente dipendente dalla frequenza massima del segnale analogico da convertire; infatti il teorema di Nyquist afferma che: se in un segnale analogico c’è una componente con frequenza fino a f Hz allora la frequenza di campionamento dovrebbe essere almeno 2 f Hz.
Campionamento Critico ↔ Freq. Campionamento = 2 f Hz
Nella pratica le freq. di campionamento sono di poco superiori al Campionamento critico.
Errore (o rumore) di quantizzazione: Max {Campione_quantizzatoi – segnale_analogicoi}
Il numero Q dei livelli di quantizzazione determina la quantità b di bit necessaria per rappresentare ciascun campione:
b=log2Q
La qualità del segnale digitale SNR (Signal Noise Ratio) viene misurata in decibel (db)
SNR = 20log10(S/N) = 20blog102 = 6b
(S=max ampiezza segnale; N=Errore di quantizzazione; q=passo di quantizzazione; S=2bq)
Nota
I metodi di compressione possono essere quindi basati su due approcci diversi:
Mediante la tecnica del companding è possibile riprodurre un segnale ad 8-bit con la stessa qualità di un segnale a 12 bit e quindi il compandig può quindi essere visto come una sorta di compressione analogica del segnale.
Con il Predictive Coding, anziché codificare il valore del campione da trasmettere, si codifica la differenza tra la predizione del valore del campione ed il valore del campione attuale (DPCM, differential pulse-coded modulation).
Il valore della predizione si ricava dai valori precedenti assunti dal segnale; tale valore è pertanto noto sia al codificatore che al decodificatore che applicano la medesima strategia.
L’efficacia del Predictive Coding si basa sul fatto che:
Se le differenze dovessero risultare molto grandi, vengono allora introdotte opportuni algoritmi correttivi.
La tecnica di compressione Mpeg Audio è basata sul mascheramento: suoni di maggiore intensità “coprono” i suoni a di bassa intensità che, pertanto, possono essere “ignorati” (compressi) senza influire sulla qualità udibile dal nostro orecchio.
Principali caratteristiche:
Lo standard Mpeg Audio rappresenta una famiglia di 3 schemi di compressione:
Mpeg Layer 1 – Mpeg Layer 2 – Mpeg Layer 3
La complessità dell’algoritmo impiegato è crescente dal Layer 1 al Layer 3.
Compatibilità verso il basso (Layer i è compatibile con Layer i-1)
Con l’acronimo MIDI (Musical Instrument Digital Interface) si indica il protocollo standard per l’interazione degli strumenti musicali elettronici.
Il formato midi non contiene musica pre-registrata ma le direttive e le specifiche per sua riproduzione: uno spartito musicale non contiene la riproduzione del brano musicale ma solo le istruzioni per la riproduzione. (Un libro non contiene la narrazione diretta di una storia, bensì la storia stessa; la narrazione della storia dipende da fattori esterni quale il timbro vocale del narratore,…).
Il file midi contiene quindi informazioni e direttive che vengono interpretate da sistemi speciali (sintetizzatori) Hardware o Software e ne realizzano l’esecuzione.
Le direttive sono del tipo: esegui la nota N con una durata T e con lo strumento S (Possiamo quindi definire un file midi come una sorta di spartito musicale elettronico).
Vantaggi: grandezze dei file molto ridotte (ottimo per essere trasmesso).
Svantaggi: la riproduzione del suono non è univoca (l’esecuzione di uno stesso spartito musicale produce differenti interpretazioni in dipendenza degli strumenti utilizzati).
1. Introduzione
2. Tipologia e formati dei dati MultiMediali. Il testo
3. Tipologia e formati dei dati MultiMediali. L'audio
4. Tipologia e formati dei dati MultiMediali. Grafica e video
5. Progetto di DB Multimediali
6. Indicizzazione e recupero dei documenti di testo
7. Indicizzazione e recupero dell'audio
8. Metodi di classificazione dell'audio
9. Colori
10. Indicizzazione e recupero delle immagini
11. Esempi reali di image retrieval
12. Video
13. Strutture dati efficienti per la ricerca della similarità - pa...
14. Strutture dati efficienti per la ricerca della similarità - pa...
15. Sistemi di supporto e misure di efficacia
17. Geographical Information System - parte prima
18. Geographical Information System -parte seconda
19. Geographical Information System - parte terza