Origini delle immagini digitali: Macchine fotografiche, Scanner, Fotogrammi di filmati, Disegni elettronici, …
Un modello di colore è un modello matematico astratto che permette di rappresentare i i colori delle immagini in forma numerica; esistono diversi modelli:
La rappresentazione delle immagini a colori RGB è simile alla rappresentazione delle immagini a toni di grigio: occorrono 3 valori per rappresentare ogni pixel (3 matrici bi-dimensionali).
Fondamenti della compressione:
I principali schemi di compressione sono:
A causa della ridondanza spaziale (similitudine di pixel vicini), si considerano soltanto “alcuni” pixel; per esempio, si potrebbe considerare solo un pixel ogni due (sottocampionamento).
In fase di decodifica i pixel “mancanti” vengono ricostruiti approssimando i loro valori mediante una interpolazione.
E’ possibile raffinare questo metodo scegliendo di sottocampionare quelle componenti dell’immagine per le quali il nostro occhio è meno sensibile.
Ogni immagine può essere decomposta mediante le componenti luminanza e crominanza.
Il nostro occhio è molto più sensibile alla Luminanza che rispetto la crominanza e quindi per la componente di crominanza è possibile effettuare:
E’ analogo al predictive coding audio.
I valori spazialmente vicini sono fortemente correlati.
Se A e B sono due pixel vicini ed abbiamo già codificato A allora, anziché codificare per intero anche B, è possibile codificare solo la differenza tra i valori A e B. Tale differenza, essendo inferiore al valore di B, è codificabile con un minor numero di bit;
La predizione può essere fatta sia tra le righe sia tra le colonne dell’immagine.
L’idea di base consiste nel considerare indipendenti i pixel dell’immagine convertendo gli elementi correlati dell’immagine in un insieme minimale di coefficienti indipendenti che implicano l’eliminazione della ridondanza.
Una immagine viene suddivisa in sottoimmagini rettangolari su cui si applica una trasformazione unitaria dal dominio spaziale al dominio delle frequenze.
Se nel dominio spaziale i dati sono fortemente correlati, allora i dati risultanti nel dominio delle frequenze sono adatti ad una fase di compressione (Huffman, Run-length,…)
Le trasformazioni maggiormente impiegate sono:
Fourier dimostrò che qualsiasi segnale periodico può essere scomposto in una somma di (infiniti) segnali sinusoidali.
La serie di Fourier rappresenta un segnale periodico x(t) di pulsazione wo mediante una somma pesata di sinusoidi di cui la prima (fondamentale) ha pulsazione ωo e le successive (armoniche) hanno pulsazioni multiple di ωo :
x(t) = a0 + a1 cos(ωo t + θ1) + a2 cos(2ωo t + θ2) +…. + aN cos(Nωo t + θN)
Jean Baptiste Joseph Fourier 1768-1830. Img modificata tratta da: wikipedia
La trasformata di Fourier decompone un segnale nelle diverse frequenze che partecipano a costruirlo, comprese le loro fasi.
Questa decomposizione è unica.
DFT (Discrete Fourier Transform) DCT (Discrete Cosine Transform)
Una semplificazione molto importante ed utilizza della Trasformata di Fourier è la FFT Fast Fourier Transform che è caratterizzata da una complessità di calcolo inferiore rispetto la Trasformata di Fourier.
Trasformata di Fourier, Ff, di una funzione assegnata:
Si riportano di seguito alcuni esempi ed applicazioni software.
Compressione e degrado immagine. Fonte: immagine modificata da Gridflor
Fasi principali del modello jpg.
Schema di codifica jpg. Fonte: "Reproduced by permission from Guojun Lu, Multimedia Database Management Sysyems, Norwood, MA: Artech House, Inc., © 1999 by Artech House, Inc.”
Grafica Vettoriale: tecnica che descrive immagini mediante un insieme di primitive geometriche quali punti, linee, curve, poligoni,… a cui possono essere attribuiti colori e sfumature; è generalmente definita attraverso insiemi di equazioni matematiche.
Vantaggi
Svantaggi
Applicazioni
Le immagini cosiddette frattali per la loro somiglianza ai frattali, rappresentano, in un certo senso, una modo intermedio (tra Raster e Vettoriali) per la memorizzazione di immagini; infatti si cerca di rappresentare la mappa di bit mediante una funzione matematica. Tale tecnica è molto recente ed in evoluzione.
A differenza della compressione jpeg che prende in esame le proprietà di frequenza e cromaticità dell’immagine, il metodo frattale (che è un metodo LOSSY) cerca di decomporre l’immagine in parti elementari che verranno memorizzate insieme alle regole che ne guideranno poi la ricomposizione.
L’idea è basata sulla scomposizione dell’immagine in parti più piccole e cercando poi trasformazioni geometriche elementari (traslazioni, rotazioni, omotetie ,…) che applicate iterativamente alle parti precedentemente decomposte permettano di ricostruire l’immagine originale.
Il metodo è applicabile a qualunque “scala spaziale“: un ingrandimento molto forte di una immagine compressa con questo metodo non produce rilevante “effetto mosaico“; per lo stesso motivo, in molti casi l’immagine compressa “si comporta meglio” della stessa immagine originale.
Esempio di Frattale. Fonte: Wikipedia
Video digitale: sequenza di fotogrammi o immagini visionate a frequenza costante.
Frame rate (velocità di scorrimento):
Il video è un media che richiede una grande quantità di dati per la sua rappresentazione; risulta quindi fondamentale l’applicazione di tecniche di compressione.
Esempio: un video di 10 minuti con fotogrammi 512*512, 24 bit/pixel, 30 Frame/secondo richiede 600*30*515*512*3 = 13.8 GB
Codifica Intraframe
Codifica Interframe
Limite percezione visiva.
Riduzione della ridondanza:
La ridondanza temporale viene trattata mediante la similitudine dei fotogrammi adiacenti:
Determinazione dello spostamento. Fonte: immagine modificata da: Simon Fraser University
Obiettivi del progetto MPEG Motion Picture Expert Group (1988): codifica congiunta audio video.
Componenti MPEG:
(gestione sincronizzazione e multiplexing diflussi di audio video compressi)
SGML
Standard Generalized Markup Language, standard per la descrizione logica dei documenti. L’organizzazione di un documento non è espressa usando la codifica dei sistemi di scrittura, che è finalizzata alla presentazione grafica, ma sono evidenziate le parti in cui è strutturato il documento (paragrafi, capitoli) ed altre particolarità del testo (come note, tabelle, intestazioni).
Informazione è “Marked up“.
Fornisce una sintassi per la definizione del tipo di documento (DTD).
In SGML, un DTD è necessario per la validazione del documento.
L’HTML e l’XML sono sottoinsiemi dell’SGML.
PDF
Il Portable Document Format, comunemente abbreviato PDF, è un formato basato su un linguaggio di descrizione completa di una pagina. E’ stato sviluppato da Adobe Systems nel 1993 per rappresentare documenti in modo indipendente dall’hardware e dal software utilizzati per generarli o per visualizzarli.
Basato sul linguaggio Postscript di descrizione della pagina.
Permette una semplice:
Requisiti di memoria:
Larghezza di banda:
Requisiti di Memoria di alcuni media comuni. Fonte: Reproduced by permission from Guojun Lu, Multimedia Database Management Sysyems, Norwood, MA: Artech House, Inc., © 1999 by Artech House, Inc.
Requisiti di Memoria di alcuni media comuni. Fonte: Reproduced by permission from Guojun Lu, Multimedia Database Management Sysyems, Norwood, MA: Artech House, Inc., © 1999 by Artech House, Inc.
1. Introduzione
2. Tipologia e formati dei dati MultiMediali. Il testo
3. Tipologia e formati dei dati MultiMediali. L'audio
4. Tipologia e formati dei dati MultiMediali. Grafica e video
5. Progetto di DB Multimediali
6. Indicizzazione e recupero dei documenti di testo
7. Indicizzazione e recupero dell'audio
8. Metodi di classificazione dell'audio
9. Colori
10. Indicizzazione e recupero delle immagini
11. Esempi reali di image retrieval
12. Video
13. Strutture dati efficienti per la ricerca della similarità - pa...
14. Strutture dati efficienti per la ricerca della similarità - pa...
15. Sistemi di supporto e misure di efficacia
17. Geographical Information System - parte prima
18. Geographical Information System -parte seconda
19. Geographical Information System - parte terza