Home

Federica EU

1/28

Walter Balzano » 4.Tipologia e formati dei dati MultiMediali. Grafica e video

Tipologia e formati dei dati MultiMediali: grafica e video

Grafica Raster e grafica Vettoriale
Le immagini digitali: definizioni
Cromia delle immagini
Modelli di colore
Compressione delle Immagini
Analisi spettrale
Il video: definizioni
Il video: codifiche
MPEG

Grafica Raster e Grafica Vettoriale

Origini delle immagini digitali: Macchine fotografiche, Scanner, Fotogrammi di filmati, Disegni elettronici, …

Grafica Raster: tecnica che descrive immagini mediante griglie di pixel colorati. Raster (= griglia) definisce la griglia ortogonale di punti (scacchiera) che costituisce un’immagine. Ogni elemento è chiamato pixel a cui è associato un colore secondo uno specifico modello. I modelli di memorizzazione possono essere Lossy o Lossless.

Grafica Vettoriale: tecnica che descrive immagini mediante un insieme di primitive geometriche quali punti, linee, curve e poligoni a cui possono essere attribuiti colori e sfumature. Nella grafica vettoriale un’immagine è descritta mediante un insieme di primitive geometriche che descrivono punti, linee, curve e poligoni ai quali sono associabili svariati attributi: grande qualità ed elevata compressione

Confronto dei formati Raster e Vettoriale.

Immagini GrayScale (scala di grigio)

Rappresentazione spaziale di una immagine.

Le immagini a colori

Un modello di colore è un modello matematico astratto che permette di rappresentare i i colori delle immagini in forma numerica; esistono diversi modelli:

RGB (Red, Green, Blue) (a sintesi additiva, per es. monitor, TV, …);
CMYK (Cyan, Magenta, Yellow, Black) (a sintesi sottrattiva, per es. stampanti, …);
YUV (opera in ambito analogico; nato per la compatibilità tv colori con tv B/N);
YCbCr (l’equivalente digitale della YUV; Y=Luminanza; Cb=CromaBlu; Cr=CromaRed);
HSV (Hue, Saturation, Value).

La rappresentazione delle immagini a colori RGB è simile alla rappresentazione delle immagini a toni di grigio: occorrono 3 valori per rappresentare ogni pixel (3 matrici bi-dimensionali).

Trasformazione YCbCr/RGB.

Le immagini a colori: il modello RGB e YUV

I modelli RGB e YUV.

Compressione immagine

Fondamenti della compressione:

l’occhio umano è limitato poiché non percepisce tutto ciò che è realmente rappresentato;
generalmente, per ogni pixel di immagine, i punti adiacenti sono simili; la similitudine di tali punti ravvicinati costituisce la ridondanza spaziale;
differentemente dai testi, non è particolarmente significativa la perdita di informazioni; la compressione a perdita è quindi ammessa.

I principali schemi di compressione sono:

compressione mediante sottocampionamento;
predictive coding;
codifica mediante trasformazione.

Compressione mediante sottocampionamento

A causa della ridondanza spaziale (similitudine di pixel vicini), si considerano soltanto “alcuni” pixel; per esempio, si potrebbe considerare solo un pixel ogni due (sottocampionamento).
In fase di decodifica i pixel “mancanti” vengono ricostruiti approssimando i loro valori mediante una interpolazione.
E’ possibile raffinare questo metodo scegliendo di sottocampionare quelle componenti dell’immagine per le quali il nostro occhio è meno sensibile.
Ogni immagine può essere decomposta mediante le componenti luminanza e crominanza.
Il nostro occhio è molto più sensibile alla Luminanza che rispetto la crominanza e quindi per la componente di crominanza è possibile effettuare:

un livello di sottocampionamento maggiore;
una quantizzazione meno raffinata.

Sottocampionamento.

Interpolazione.

Predictive Coding

E’ analogo al predictive coding audio.

I valori spazialmente vicini sono fortemente correlati.

Se A e B sono due pixel vicini ed abbiamo già codificato A allora, anziché codificare per intero anche B, è possibile codificare solo la differenza tra i valori A e B. Tale differenza, essendo inferiore al valore di B, è codificabile con un minor numero di bit;

La predizione può essere fatta sia tra le righe sia tra le colonne dell’immagine.

Codifica di pixel A e B “contigui”.

Codifica per differenza di pixel A e B “contigui”.

Codifica mediante trasformazione

L’idea di base consiste nel considerare indipendenti i pixel dell’immagine convertendo gli elementi correlati dell’immagine in un insieme minimale di coefficienti indipendenti che implicano l’eliminazione della ridondanza.

Una immagine viene suddivisa in sottoimmagini rettangolari su cui si applica una trasformazione unitaria dal dominio spaziale al dominio delle frequenze.

Se nel dominio spaziale i dati sono fortemente correlati, allora i dati risultanti nel dominio delle frequenze sono adatti ad una fase di compressione (Huffman, Run-length,…)

Le trasformazioni maggiormente impiegate sono:

DFT (Discrete Fourier Transform);
DCT ( Discrete Cosine Transform).

Implementazione del sistema di codifica.

Serie di Fourier

Fourier dimostrò che qualsiasi segnale periodico può essere scomposto in una somma di (infiniti) segnali sinusoidali.

La serie di Fourier rappresenta un segnale periodico x(t) di pulsazione wo mediante una somma pesata di sinusoidi di cui la prima (fondamentale) ha pulsazione ω_o e le successive (armoniche) hanno pulsazioni multiple di ω_o :

x(t) = a₀ + a₁ cos(ω_o t + θ₁) + a2 cos(2ω_o t + θ₂) +…. + a_N cos(Nω_o t + θ_N)

Funzione sen x + (sen3x)/3.

Jean Baptiste Joseph Fourier 1768-1830. Img modificata tratta da: wikipedia

Approssimazione con serie di Fourier

Approssimazione di funzioni.

Trasformata di Fourier

La trasformata di Fourier decompone un segnale nelle diverse frequenze che partecipano a costruirlo, comprese le loro fasi.

Questa decomposizione è unica.

DFT (Discrete Fourier Transform) DCT (Discrete Cosine Transform)

Una semplificazione molto importante ed utilizza della Trasformata di Fourier è la FFT Fast Fourier Transform che è caratterizzata da una complessità di calcolo inferiore rispetto la Trasformata di Fourier.

Trasformata di Fourier, Ff, di una funzione assegnata:

$(F f) (\omega) = {{\int _ {-\infty} ^{\infty} f(t) e {^{i \omega t }dt}$

Analisi spettrale

Si riportano di seguito alcuni esempi ed applicazioni software.

Analisi spettrale.

Trasformata di Fourier: Passaggio al dominio delle frequenze .

Analisi spettrale (segue)

Decomposizione segnali.

Immagini jpeg

Standard JPEG (Joint Photographic Experts Group)
Immagini a colori 24 bit ed immagini bianco e nero
Modello LOSSY
Modello Open Source
Idee di base:
- limite percezione visiva;
- analisi spettrale (DCT).

Compressione e degrado immagine. Fonte: immagine modificata da Gridflor

Il modello jpeg

Fasi principali del modello jpg.

Preparazione in blocchi: RGB → YUV (matrici di Luminanza, Cromininanza Blu, Crominanza rossa).
Passaggio al dominio frequenziale: si applica la DTC alle 3 matrici Y Cr e Cb. Un’immagine può essere pensata composta dalla somma di tante variazioni di luminosità di forma cosinusoidale, di diversa frequenza (spaziale), fase e intensità. Le alte frequenze definiscono i dettagli dell’immagine mentre quelle basse le ombreggiature più estese.
Quantizzazione: le frequenze della fase 2 vengono quantizzate in modo non lineare: le tabelle di quantizzazione utilizzano opportuni valori per arrotondare con meno precisione i coefficienti delle alte frequenze rispetto a quelle basse.
Codifica: scansione ZIG-ZAG; Eliminazione delle ridondanze mediante codifica RLE e codici di Huffman.

Il modello jpeg

Immagini Vettoriali

Grafica Vettoriale: tecnica che descrive immagini mediante un insieme di primitive geometriche quali punti, linee, curve, poligoni,… a cui possono essere attribuiti colori e sfumature; è generalmente definita attraverso insiemi di equazioni matematiche.

Vantaggi

La sua rappresentazione è indipendente dalla risoluzione; una linea viene memorizzata mediante un’equazione, un punto iniziale ed un punto finale.
Maggiore compressione dei dati → minor occupazione di RAM e HD rispetto una corrispondente immagine raster: è particolarmente adatto per gestire grandi quantità di dati come quelli cartografici;
L’ingrandimento o la riduzione delle misure e proporzioni del soggetto prodotto in vettoriale non incide in maniera significativa sul peso dell’immagine stessa.

Svantaggi

Meno intuitiva rispetto la grafica Raster.
Richiede maggiore capacità di elaborazione e quindi Computer più potenti.

Applicazioni

Editoria, Architettura, Ingegneria, Computer Grafica, …
Altri esempi: Font TT (TrueType).

Immagini Vettoriali

Esempi di immagini vettoriali.

Immagini Vettoriali – mappe

Mappe vettoriali Google MAPS. Fonte: Google Map

Immagini Frattali

Le immagini cosiddette frattali per la loro somiglianza ai frattali, rappresentano, in un certo senso, una modo intermedio (tra Raster e Vettoriali) per la memorizzazione di immagini; infatti si cerca di rappresentare la mappa di bit mediante una funzione matematica. Tale tecnica è molto recente ed in evoluzione.

A differenza della compressione jpeg che prende in esame le proprietà di frequenza e cromaticità dell’immagine, il metodo frattale (che è un metodo LOSSY) cerca di decomporre l’immagine in parti elementari che verranno memorizzate insieme alle regole che ne guideranno poi la ricomposizione.

L’idea è basata sulla scomposizione dell’immagine in parti più piccole e cercando poi trasformazioni geometriche elementari (traslazioni, rotazioni, omotetie ,…) che applicate iterativamente alle parti precedentemente decomposte permettano di ricostruire l’immagine originale.

Il metodo è applicabile a qualunque “scala spaziale“: un ingrandimento molto forte di una immagine compressa con questo metodo non produce rilevante “effetto mosaico“; per lo stesso motivo, in molti casi l’immagine compressa “si comporta meglio” della stessa immagine originale.

Esempio di Frattale. Fonte: Wikipedia

Il Video

Video digitale: sequenza di fotogrammi o immagini visionate a frequenza costante.
Frame rate (velocità di scorrimento):

frame rate elevati → maggiore fluidità del filmato (25 frames al secondo);
frame rate elevati → maggiore banda per la trasmissione;
per evitare il fenomeno del flickering, ogni fotogramma viene ripetuto più volte (refresh) finché diventa disponibile il fotogramma successivo (50 Hz);
con la tecnica dell’interlacciamento l’immagine viene composta a video componendo prima tutte le righe di immagine dispari e poi quelle pari.

Il video è un media che richiede una grande quantità di dati per la sua rappresentazione; risulta quindi fondamentale l’applicazione di tecniche di compressione.

Esempio: un video di 10 minuti con fotogrammi 512*512, 24 bit/pixel, 30 Frame/secondo richiede 600*30*515*512*3 = 13.8 GB

Codifica Intraframe e Interframe

Codifica Intraframe

Codifica e decodifica di un flusso video descrivendo ogni singolo fotogramma che compone la sequenza video, rispettando quindi un approccio tradizionale alla quantizzazione video come sequenza di immagini statiche.
Sequenze video particolarmente movimentate; descrizione dei singoli fotogrammi.
Metodo preferito per la fase di authoring di un filmato.
Semplice accesso diretto ad una scena generica.

Codifica Interframe

Descrizione dei cambiamenti che occorrono tra un fotogramma ed il successivo partendo da un fotogramma iniziale descritto con codifica intraframe.
Sequenze video con pochi elementi che cambiano nella scena.
Metodo preferito per la fase distribuzione di un filmato.
Complesso accesso diretto ad una scena generica; tecnica dei keyframes.

Fotogrammi chiave.

Compressione video

Limite percezione visiva.

Riduzione della ridondanza:
La ridondanza temporale viene trattata mediante la similitudine dei fotogrammi adiacenti:

ogni fotogramma si divide in blocchi e si cerca la migliore corrispondenza tra blocchi di fotogrammi adiacenti. Per ogni coppia di blocchi “simili” si determina:
- lo spostamento del blocco (motion vector);
- la differenza tra i 2 blocchi;
ciò che viene trasmesso è il motion vector e la relativa differenza.

Determinazione dello spostamento. Fonte: immagine modificata da: Simon Fraser University

MPEG

Obiettivi del progetto MPEG Motion Picture Expert Group (1988): codifica congiunta audio video.

Componenti MPEG:

MPEG-Video
MPEG-Audio
MPEG-Systems

(gestione sincronizzazione e multiplexing diflussi di audio video compressi)

L'MPEG definisce le specifiche per gli standards di bitstream.

Documenti multimediali compositi: l’SGML

SGML
Standard Generalized Markup Language, standard per la descrizione logica dei documenti. L’organizzazione di un documento non è espressa usando la codifica dei sistemi di scrittura, che è finalizzata alla presentazione grafica, ma sono evidenziate le parti in cui è strutturato il documento (paragrafi, capitoli) ed altre particolarità del testo (come note, tabelle, intestazioni).

Informazione è “Marked up“.

Fornisce una sintassi per la definizione del tipo di documento (DTD).

In SGML, un DTD è necessario per la validazione del documento.

L’HTML e l’XML sono sottoinsiemi dell’SGML.

Esempio di DTD.

Struttura.

Documenti multimediali compositi: il PDF

PDF
Il Portable Document Format, comunemente abbreviato PDF, è un formato basato su un linguaggio di descrizione completa di una pagina. E’ stato sviluppato da Adobe Systems nel 1993 per rappresentare documenti in modo indipendente dall’hardware e dal software utilizzati per generarli o per visualizzarli.

Basato sul linguaggio Postscript di descrizione della pagina.

Permette una semplice: