Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D Le Miniguide all'orientamento Gli eBook di Federica La Corte in Rete
 
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Walter Balzano » 4.Tipologia e formati dei dati MultiMediali. Grafica e video


Tipologia e formati dei dati MultiMediali: grafica e video

  • Grafica Raster e grafica Vettoriale
  • Le immagini digitali: definizioni
  • Cromia delle immagini
  • Modelli di colore
  • Compressione delle Immagini
  • Analisi spettrale
  • Il video: definizioni
  • Il video: codifiche
  • MPEG

Grafica Raster e Grafica Vettoriale

Origini delle immagini digitali: Macchine fotografiche, Scanner, Fotogrammi di filmati, Disegni elettronici, …

  • Grafica Raster: tecnica che descrive immagini mediante griglie di pixel colorati. Raster (= griglia) definisce la griglia ortogonale di punti (scacchiera) che costituisce un’immagine. Ogni elemento è chiamato pixel a cui è associato un colore secondo uno specifico modello. I modelli di memorizzazione possono essere Lossy o Lossless.
  • Grafica Vettoriale: tecnica che descrive immagini mediante un insieme di primitive geometriche quali punti, linee, curve e poligoni a cui possono essere attribuiti colori e sfumature. Nella grafica vettoriale un’immagine è descritta mediante un insieme di primitive geometriche che descrivono punti, linee, curve e poligoni ai quali sono associabili svariati attributi: grande qualità ed elevata compressione
Confronto dei formati Raster e Vettoriale.

Confronto dei formati Raster e Vettoriale.


Immagini GrayScale (scala di grigio)

Rappresentazione spaziale di una immagine.

Rappresentazione spaziale di una immagine.


Le immagini a colori

Un modello di colore è un modello matematico astratto che permette di rappresentare i i colori delle immagini in forma numerica; esistono diversi modelli:

  • RGB (Red, Green, Blue) (a sintesi additiva, per es. monitor, TV, …);
  • CMYK (Cyan, Magenta, Yellow, Black) (a sintesi sottrattiva, per es. stampanti, …);
  • YUV (opera in ambito analogico; nato per la compatibilità tv colori con tv B/N);
  • YCbCr (l’equivalente digitale della YUV; Y=Luminanza; Cb=CromaBlu; Cr=CromaRed);
  • HSV (Hue, Saturation, Value).

La rappresentazione delle immagini a colori RGB è simile alla rappresentazione delle immagini a toni di grigio: occorrono 3 valori per rappresentare ogni pixel (3 matrici bi-dimensionali).

Trasformazione YCbCr/RGB.

Trasformazione YCbCr/RGB.


Le immagini a colori: il modello RGB e YUV

I modelli RGB e YUV.

I modelli RGB e YUV.


Compressione immagine

Fondamenti della compressione:

  • l’occhio umano è limitato poiché non percepisce tutto ciò che è realmente rappresentato;
  • generalmente, per ogni pixel di immagine, i punti adiacenti sono simili; la similitudine di tali punti ravvicinati costituisce la ridondanza spaziale;
  • differentemente dai testi, non è particolarmente significativa la perdita di informazioni; la compressione a perdita è quindi ammessa.

I principali schemi di compressione sono:

  • compressione mediante sottocampionamento;
  • predictive coding;
  • codifica mediante trasformazione.

Compressione mediante sottocampionamento

A causa della ridondanza spaziale (similitudine di pixel vicini), si considerano soltanto “alcuni” pixel; per esempio, si potrebbe considerare solo un pixel ogni due (sottocampionamento).
In fase di decodifica i pixel “mancanti” vengono ricostruiti approssimando i loro valori mediante una interpolazione.
E’ possibile raffinare questo metodo scegliendo di sottocampionare quelle componenti dell’immagine per le quali il nostro occhio è meno sensibile.
Ogni immagine può essere decomposta mediante le componenti luminanza e crominanza.
Il nostro occhio è molto più sensibile alla Luminanza che rispetto la crominanza e quindi per la componente di crominanza è possibile effettuare:

  • un livello di sottocampionamento maggiore;
  • una quantizzazione meno raffinata.
Sottocampionamento.

Sottocampionamento.

Interpolazione.

Interpolazione.


Predictive Coding

E’ analogo al predictive coding audio.

I valori spazialmente vicini sono fortemente correlati.

Se A e B sono due pixel vicini ed abbiamo già codificato A allora, anziché codificare per intero anche B, è possibile codificare solo la differenza tra i valori A e B. Tale differenza, essendo inferiore al valore di B, è codificabile con un minor numero di bit;

La predizione può essere fatta sia tra le righe sia tra le colonne dell’immagine.

Codifica di pixel A e B “contigui”.

Codifica di pixel A e B “contigui”.

Codifica per differenza di pixel A e B “contigui”.

Codifica per differenza di pixel A e B “contigui”.


Codifica mediante trasformazione

L’idea di base consiste nel considerare indipendenti i pixel dell’immagine convertendo gli elementi correlati dell’immagine in un insieme minimale di coefficienti indipendenti che implicano l’eliminazione della ridondanza.

Una immagine viene suddivisa in sottoimmagini rettangolari su cui si applica una trasformazione unitaria dal dominio spaziale al dominio delle frequenze.

Se nel dominio spaziale i dati sono fortemente correlati, allora i dati risultanti nel dominio delle frequenze sono adatti ad una fase di compressione (Huffman, Run-length,…)

Le trasformazioni maggiormente impiegate sono:

  • DFT (Discrete Fourier Transform);
  • DCT ( Discrete Cosine Transform).
Implementazione del sistema di codifica.

Implementazione del sistema di codifica.


Serie di Fourier

Fourier dimostrò che qualsiasi segnale periodico può essere scomposto in una somma di (infiniti) segnali sinusoidali.

La serie di Fourier rappresenta un segnale periodico x(t) di pulsazione wo mediante una somma pesata di sinusoidi di cui la prima (fondamentale) ha pulsazione ωo e le successive (armoniche) hanno pulsazioni multiple di ωo :

x(t) = a0 + a1 cos(ωo t + θ1) + a2 cos(2ωo t + θ2) +…. + aN cos(Nωo t + θN)

Funzione sen x + (sen3x)/3.

Funzione sen x + (sen3x)/3.

Jean Baptiste Joseph Fourier
1768-1830. Img modificata tratta da: wikipedia

Jean Baptiste Joseph Fourier 1768-1830. Img modificata tratta da: wikipedia


Approssimazione con serie di Fourier

Approssimazione di funzioni.

Approssimazione di funzioni.


Trasformata di Fourier

La trasformata di Fourier decompone un segnale nelle diverse frequenze che partecipano a costruirlo, comprese le loro fasi.

Questa decomposizione è unica.

DFT (Discrete Fourier Transform) DCT (Discrete Cosine Transform)

Una semplificazione molto importante ed utilizza della Trasformata di Fourier è la FFT Fast Fourier Transform che è caratterizzata da una complessità di calcolo inferiore rispetto la Trasformata di Fourier.

Trasformata di Fourier, Ff, di una funzione assegnata:

(F f) (\omega) = {{\int _ {-\infty} ^{\infty}  f(t) e {^{i \omega t }dt}

Analisi spettrale

Si riportano di seguito alcuni esempi ed applicazioni software.

Analisi spettrale.

Analisi spettrale.

Trasformata di Fourier: Passaggio al dominio delle frequenze .

Trasformata di Fourier: Passaggio al dominio delle frequenze .


Analisi spettrale (segue)

Decomposizione segnali.

Decomposizione segnali.


Immagini jpeg

  • Standard JPEG (Joint Photographic Experts Group)
  • Immagini a colori 24 bit ed immagini bianco e nero
  • Modello LOSSY
  • Modello Open Source
  • Idee di base:
    • limite percezione visiva;
    • analisi spettrale (DCT).
Compressione e degrado immagine. Fonte: immagine modificata da  Gridflor

Compressione e degrado immagine. Fonte: immagine modificata da Gridflor


Il modello jpeg

Fasi principali del modello jpg.

  1. Preparazione in blocchi: RGB → YUV (matrici di Luminanza, Cromininanza Blu, Crominanza rossa).
  2. Passaggio al dominio frequenziale: si applica la DTC alle 3 matrici Y Cr e Cb. Un’immagine può essere pensata composta dalla somma di tante variazioni di luminosità di forma cosinusoidale, di diversa frequenza (spaziale), fase e intensità. Le alte frequenze definiscono i dettagli dell’immagine mentre quelle basse le ombreggiature più estese.
  3. Quantizzazione: le frequenze della fase 2 vengono quantizzate in modo non lineare: le tabelle di quantizzazione utilizzano opportuni valori per arrotondare con meno precisione i coefficienti delle alte frequenze rispetto a quelle basse.
  4. Codifica: scansione ZIG-ZAG; Eliminazione delle ridondanze mediante codifica RLE e codici di Huffman.

Il modello jpeg

Schema di codifica jpg. Fonte: “Reproduced by permission from Guojun Lu, 
Multimedia Database Management Sysyems, Norwood, MA: Artech House, Inc., © 1999 by Artech House, Inc.”

Schema di codifica jpg. Fonte: "Reproduced by permission from Guojun Lu, Multimedia Database Management Sysyems, Norwood, MA: Artech House, Inc., © 1999 by Artech House, Inc.”


Immagini Vettoriali

Grafica Vettoriale: tecnica che descrive immagini mediante un insieme di primitive geometriche quali punti, linee, curve, poligoni,… a cui possono essere attribuiti colori e sfumature; è generalmente definita attraverso insiemi di equazioni matematiche.

Vantaggi

  • La sua rappresentazione è indipendente dalla risoluzione; una linea viene memorizzata mediante un’equazione, un punto iniziale ed un punto finale.
  • Maggiore compressione dei dati → minor occupazione di RAM e HD rispetto una corrispondente immagine raster: è particolarmente adatto per gestire grandi quantità di dati come quelli cartografici;
  • L’ingrandimento o la riduzione delle misure e proporzioni del soggetto prodotto in vettoriale non incide in maniera significativa sul peso dell’immagine stessa.

Svantaggi

  • Meno intuitiva rispetto la grafica Raster.
  • Richiede maggiore capacità di elaborazione e quindi Computer più potenti.

Applicazioni

  • Editoria, Architettura, Ingegneria, Computer Grafica, …
  • Altri esempi: Font TT (TrueType).

Immagini Vettoriali

Esempi di immagini vettoriali.

Esempi di immagini vettoriali.


Immagini Vettoriali – mappe

Mappe vettoriali Google MAPS. Fonte:  Google Map

Mappe vettoriali Google MAPS. Fonte: Google Map


Immagini Frattali

Le immagini cosiddette frattali per la loro somiglianza ai frattali, rappresentano, in un certo senso, una modo intermedio (tra Raster e Vettoriali) per la memorizzazione di immagini; infatti si cerca di rappresentare la mappa di bit mediante una funzione matematica. Tale tecnica è molto recente ed in evoluzione.

A differenza della compressione jpeg che prende in esame le proprietà di frequenza e cromaticità dell’immagine, il metodo frattale (che è un metodo LOSSY) cerca di decomporre l’immagine in parti elementari che verranno memorizzate insieme alle regole che ne guideranno poi la ricomposizione.

L’idea è basata sulla scomposizione dell’immagine in parti più piccole e cercando poi trasformazioni geometriche elementari (traslazioni, rotazioni, omotetie ,…) che applicate iterativamente alle parti precedentemente decomposte permettano di ricostruire l’immagine originale.

Il metodo è applicabile a qualunque “scala spaziale“: un ingrandimento molto forte di una immagine compressa con questo metodo non produce rilevante “effetto mosaico“; per lo stesso motivo, in molti casi l’immagine compressa “si comporta meglio” della stessa immagine originale.

Esempio di Frattale. Fonte:  Wikipedia

Esempio di Frattale. Fonte: Wikipedia


Il Video

Video digitale: sequenza di fotogrammi o immagini visionate a frequenza costante.
Frame rate (velocità di scorrimento):

  • frame rate elevati → maggiore fluidità del filmato (25 frames al secondo);
  • frame rate elevati → maggiore banda per la trasmissione;
  • per evitare il fenomeno del flickering, ogni fotogramma viene ripetuto più volte (refresh) finché diventa disponibile il fotogramma successivo (50 Hz);
  • con la tecnica dell’interlacciamento l’immagine viene composta a video componendo prima tutte le righe di immagine dispari e poi quelle pari.

Il video è un media che richiede una grande quantità di dati per la sua rappresentazione; risulta quindi fondamentale l’applicazione di tecniche di compressione.

Esempio: un video di 10 minuti con fotogrammi 512*512, 24 bit/pixel, 30 Frame/secondo richiede 600*30*515*512*3 = 13.8 GB

Codifica Intraframe e Interframe

Codifica Intraframe

  • Codifica e decodifica di un flusso video descrivendo ogni singolo fotogramma che compone la sequenza video, rispettando quindi un approccio tradizionale alla quantizzazione video come sequenza di immagini statiche.
  • Sequenze video particolarmente movimentate; descrizione dei singoli fotogrammi.
  • Metodo preferito per la fase di authoring di un filmato.
  • Semplice accesso diretto ad una scena generica.

Codifica Interframe

  • Descrizione dei cambiamenti che occorrono tra un fotogramma ed il successivo partendo da un fotogramma iniziale descritto con codifica intraframe.
  • Sequenze video con pochi elementi che cambiano nella scena.
  • Metodo preferito per la fase distribuzione di un filmato.
  • Complesso accesso diretto ad una scena generica; tecnica dei keyframes.
Fotogrammi chiave.

Fotogrammi chiave.


Compressione video

Limite percezione visiva.

Riduzione della ridondanza:
La ridondanza temporale viene trattata mediante la similitudine dei fotogrammi adiacenti:

  • ogni fotogramma si divide in blocchi e si cerca la migliore corrispondenza tra blocchi di fotogrammi adiacenti. Per ogni coppia di blocchi “simili” si determina:
    • lo spostamento del blocco (motion vector);
    • la differenza tra i 2 blocchi;
  • ciò che viene trasmesso è il motion vector e la relativa differenza.
Determinazione dello spostamento. Fonte: immagine modificata da: Simon Fraser University

Determinazione dello spostamento. Fonte: immagine modificata da: Simon Fraser University


MPEG

Obiettivi del progetto MPEG Motion Picture Expert Group (1988): codifica congiunta audio video.

Componenti MPEG:

  • MPEG-Video
  • MPEG-Audio
  • MPEG-Systems

(gestione sincronizzazione e multiplexing diflussi di audio video compressi)

L’MPEG definisce le specifiche per gli standards di bitstream.

L'MPEG definisce le specifiche per gli standards di bitstream.


Documenti multimediali compositi: l’SGML

SGML
Standard Generalized Markup Language, standard per la descrizione logica dei documenti. L’organizzazione di un documento non è espressa usando la codifica dei sistemi di scrittura, che è finalizzata alla presentazione grafica, ma sono evidenziate le parti in cui è strutturato il documento (paragrafi, capitoli) ed altre particolarità del testo (come note, tabelle, intestazioni).

Informazione è “Marked up“.

Fornisce una sintassi per la definizione del tipo di documento (DTD).

In SGML, un DTD è necessario per la validazione del documento.

L’HTML e l’XML sono sottoinsiemi dell’SGML.


Esempio di DTD.

Esempio di DTD.

Struttura.

Struttura.


Documenti multimediali compositi: il PDF

PDF
Il Portable Document Format, comunemente abbreviato PDF, è un formato basato su un linguaggio di descrizione completa di una pagina. E’ stato sviluppato da Adobe Systems nel 1993 per rappresentare documenti in modo indipendente dall’hardware e dal software utilizzati per generarli o per visualizzarli.

Basato sul linguaggio Postscript di descrizione della pagina.

Permette una semplice:

  • estrazione dei dati;
  • annotazioni;
  • collegamenti ipertestuali;
  • bookmarks;
  • gestione della sicurezza.

Requisiti di memoria e larghezza di banda

Requisiti di memoria:

  • misurati in termini di bytes o Megabytes;
  • l’unità di base è il byte.

Larghezza di banda:

  • misurata in velocità di bits (bit Rate) o Megabits al secondo;
  • l’unità di base è il bit.
Requisiti di Memoria di alcuni media comuni.
Fonte: Reproduced by permission from Guojun Lu, 
Multimedia Database Management Sysyems, Norwood, MA: Artech House, Inc., © 1999 by Artech House, Inc.

Requisiti di Memoria di alcuni media comuni. Fonte: Reproduced by permission from Guojun Lu, Multimedia Database Management Sysyems, Norwood, MA: Artech House, Inc., © 1999 by Artech House, Inc.

Requisiti di Memoria di alcuni media comuni. Fonte: Reproduced by permission from Guojun Lu, 
Multimedia Database Management Sysyems, Norwood, MA: Artech House, Inc., © 1999 by Artech House, Inc.

Requisiti di Memoria di alcuni media comuni. Fonte: Reproduced by permission from Guojun Lu, Multimedia Database Management Sysyems, Norwood, MA: Artech House, Inc., © 1999 by Artech House, Inc.


  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion