Gli algoritmi di indicizzazione e di ricerca delle immagini devono essere basati su una corretta rappresentazione dei colori.
La luce visibile è una radiazione elettromagnetica con lunghezza d’onda tra 400 e 780 nm.
Differenti lunghezze d’onda producono differenti sensazioni di colore
Le tre proprietà fisiche delle radiazioni di colore sono:
Sintesi additiva
È possibile sperimentare che una opportuna mescolanza di radiazioni di diversa lunghezza d’onda produce la visione del bianco: tale risultato è opposto a quanto accade nella scomposizione della luce bianca solare nei colori dello spettro visibile ad opera di un prisma.
Il verificarsi di tale fenomeno da origine a quella che comunemente viene detta sintesi o mescolanza additiva. Per convenzione si considerano 3 colori primari (una terna “naturale” non esiste) come quella RGB.
Sintesi sottrattiva
Considerando il fenomeno non dalla parte della radiazione riflessa, ma da quella della radiazione assorbita, allora le superfici che ci appaiono colorate (per es. pittura e stampa) sottraggono alla nostra visione una parte dello spettro visibile.
Nella sintesi sottrattiva si analizza l’effetto prodotto sulla visione della combinazione delle proprietà riflettenti dei colori (cioè capacità di assorbimento della luce).
Spazio CIE normalizzato (2D)
Commission Internationale de l’Eclairage – 1931
(Commissione Internazionale per l’Illuminazione)
Spazi ( CIERGB, CIEXYZ, CIELUV, CIELAB )
Caratteristiche spazio CIE:
Rappresentazione SPD (Spectral Power Distribution).
Ogni colore “fisico” può essere rappresentato mediante la distribuzione dell’energia radiante alle varie lunghezze d’onda SPD.
Vantaggi: e’ il modo più accurato per la specifica di un colore.
Svantaggi: non descrive la relazione tra le proprietà fisiche del colore e la sua percezione visiva; complessa rappresentazioni numerica
Ogni strumento fisico di acquisizione o di riproduzione dei colori applica una funzione non lineare alla intensità di luce catturata/emessa in relazione al segnale in volts emesso/applicato
Luminanza = Vγ
Per neutralizzare la non linearità del dispositivo si usa la:
Correzione Gamma = 1/γ
La correzione di gamma è quindi un’operazione non lineare usata per codificare e decodificare la luminanza o i valori tristimolo in un sistema video o fotografico. Nel caso più semplice la correzioni di gamma è definita dalla seguente legge potenziale:
Vout = V in γ
Tale funzione di trasferimento serve per neutralizzare la non linearità del dispositivo; V denota il segnale elettrico analogico (voltaggio) che il dispositivo preleva al proprio ingresso.
Nella ricerca e nella indicizzazione delle immagini basate sul colore è necessario assumere che tutte le immagini siano rappresentate nello stesso spazio di colore e che il valore dei loro pixel rappresentino la stessa cosa.
Data un’immagine nel formato RGB non e’ possibile interpretarla correttamente:
Tutti i formati immagine più usati (GIF, JPEG, TIFF, ecc) non contengono informazioni sulle primitive dello spazio di colore e sulla correzione gamma usata.
Il formato TIFF 6.0 contiene anche queste informazioni.
1. Introduzione
2. Tipologia e formati dei dati MultiMediali. Il testo
3. Tipologia e formati dei dati MultiMediali. L'audio
4. Tipologia e formati dei dati MultiMediali. Grafica e video
5. Progetto di DB Multimediali
6. Indicizzazione e recupero dei documenti di testo
7. Indicizzazione e recupero dell'audio
8. Metodi di classificazione dell'audio
9. Colori
10. Indicizzazione e recupero delle immagini
11. Esempi reali di image retrieval
12. Video
13. Strutture dati efficienti per la ricerca della similarità - pa...
14. Strutture dati efficienti per la ricerca della similarità - pa...
15. Sistemi di supporto e misure di efficacia
17. Geographical Information System - parte prima
18. Geographical Information System -parte seconda
19. Geographical Information System - parte terza