La segmentazione consiste nel suddividere un’immagine in regioni che corrispondono ad unità strutturali o a specifiche proprietà.
Per gli scopi di imaging medico, la segmentazione è usata per estrarre specifici organi, strutture vascolari, tipi di tessuti (es. nel cervello: materia grigia e bianca, ventricoli) o lesioni.
Nel medical imaging, la segmentazione è importante per l’estrazione delle caratteristiche, le misurazioni e il display delle immagini.
La segmentazione può dividere le immagini sia in regioni anatomiche, che patologiche, sistemiche o funzionali.
Nessuna singola tecnica di segmentazione può produrre risultati soddisfacenti per tutte le applicazioni di imaging medico.
La segmentazione può essere manuale, semi-automatica o automatica e dipende dalla complessità dell’argomento.
In generale, il risultato di una operazione di segmentazione sarà una o più immagini, ognuna contenente caratteristiche specifiche dall’immagine originale e sarà esattamente registrata con l’originale.
Le immagini estratte possono avere valori dei pixel corrispondenti all’immagine originale, o possono essere binarie (cioè 1 se il pixel corrisponde alla caratteristica dell’originale o 0 altrimenti).
La segmentazione di una immagine f(x,y) in regioni Ri è una partizione del suo dominio in sottoinsieme Ri, i = 1,…, k
N.B.:
Generalmente gli algoritmi di segmentazione assumono che le immagini siano “perfette”, cioè:
Quindi per le immagini “reali” è necessario un pre-processing, come ad esempio smoothing o sharpening.
I risultati degli algoritmi di segmentazione devono essere verificati:
I metodi comunemente utilizzati per la segmentazione sono:
La forma più semplice di segmentazione usa il thresholding.
Questa è una semplice operazione su pixel nella quale un range di intensità è specificato per ogni struttura che deve essere estratta.
Questo metodo è applicabile se il rapporto contrasto rumore è adeguato.
Il thresholding è spesso usato per gli studi di MR e di CT dove c’è un significante contrasto tra sangue e tessuto, cosi come per l’osso nella radiografia.
Quando è selezionata una sola soglia per l’intera immagine, la tecnica è detta “globale“.
Se la soglia si riferisce ad un particolare valore medio locale, essa è “locale“.
Inoltre, se le soglie locali sono selezionate indipendentemente per ogni pixel (o gruppo di pixel) esso è detto essere una tecnica “dinamica” o “adattiva”.
Il thresholding globale assume che un immagine ha un istogramma “bimodale”.
Perciò, l’oggetto può essere estratto dal fondo con una semplice operazione che confronta valori dell’immagine a un valore di soglia T.
I pixel dell’oggetto e del fondo hanno livelli di grigio raggruppati in due modi dominanti.
Un modo ovvio di estrarre l’oggetto è selezionare una soglia che separa i due valori.
L’immagine di soglia g(x,y) è definita come:
g(x,y) = 1 se f(x,y) > T
g(x,y) = 0 se f(x,y) < T
Il risultato di un tale thresholding è una immagine binaria, dove i pixel con valore di intensità 1 rappresentano l’oggetto e valori di intensità 0 corrispondono al fondo.
Esempio di thresholding globale:
A: Immagine Originale;
B: Istogramma dell’immagine;
C: Immagine di soglia T = 200;
D: Ricerca bordi con un filtro Laplaciano 3×3.
I risultati delle operazioni di thresholding sono usualmente mostrati come mappe di contorni e sovrapposti all’immagine originale.
Se necessario, un operatore può manualmente modificare parte dell’immagine per rispondere ad una specifica applicazione.
In molti casi, un appropriata segmentazione è ottenuta quando l’area o il perimetro degli oggetti è poco sensibile a piccole variazioni del livello di soglia selezionata.
Se una immagine contiene più di due regioni, può ancora essere segmentata applicando diverse soglie individuali, o usando una tecnica multi-thresholding.
Con il crescente numero di soglie, diventa difficile l’utilizzo dell’istogramma e quindi il thresholding non è più ottimale.
Questa tecnica è computazionalmente semplice e veloce ma fallisce quando c’è basso contrasto tra l’oggetto e il fondo, l’immagine è rumorosa, o il fondo varia significativamente attraverso l’immagine.
Il threshold locale può essere determinato:
Queste tecniche sono computazionalmente più pesanti e potrebbero essere usate per immagini con diverse regioni.
Essi lavorano bene anche per l’estrazione di regioni che sono molto piccole.
Il tipico approccio per la rivelazione dei bordi è l’identificazione di discontinuità nei livelli di grigio.
Un bordo è un insieme di pixel connessi che stanno sullo stesso bordo tra due regioni.
Gli approcci standard sono:
L’ordine delle derivate usate dipende dallo spessore del bordo e il contenuto di rumore.
Anche modesti livelli di rumore possono avere un largo impatto sui risultati derivativi usati nella rivelazione del bordo.
Lo smoothing può essere necessario prima dell’uso delle derivate per la rivelazione dei bordi (questo può includere filtri mediani, per esempio).
La segmentazione tramite tessitura generalmente si effettua in quei casi in cui non può essere ottenuta con semplici thresholding come nel caso in cui le regioni dell’immagine hanno differente tessitura, ma hanno tutte la stessa intensità media.
La segmentazione, in questi casi, fallisce anche nello spazio delle frequenze siccome lo spettro di potenza della FFT 2D di queste regioni rivelano solo piccole differenze.
Per questi casi sono stati sviluppati operatori sensibili alla tessitura sull’immagine. Tra questi abbiamo gli algoritmi di:
dove:
N = numero di livelli di grigio
μ, σ = media e deviazione standard rispettivamente delle distribuzioni del valori dei pixel nelle direzioni x e y intorno al pixel centrale.
P(i,j) = matrice immagine.
R = fattore normalizzante uguale al numero totale di coppie di pixel nell’immagine o delle sub-regioni usate per il calcolo.
f1 è la misura dell’omogeneità usando il momento secondo.
Siccome i termini sono al quadrato, grandi differenze daranno un contributo maggiore rispetto a molte piccole.
f2 da una indicazione del contrasto.
f3 è una misura della dipendenza lineare della luminosità determinata dalla correlazione.
Parametri addizionali (f4,…) possono essere definite per la descrizione della varianza e dell’entropia.
Un altro operatore per la tessitura è l’operatore Hurst. Tipicamente si definisce una regione ottogonale (largo 7 pixel, 37 pixel in totale).
Questo intorno è ulteriormente suddiviso in classi di distanza (dal pixel centrale).
Per un contorno a 37 pixel ci saranno 8 classi distanza. I coefficienti di Hurst sono calcolati come un operazione sugli intorni.
Viene ricercato il pixel più brillante e il più scuro in ogni classe di distanza (Δx) e viene calcolata la differenza in intensità (ΔI).
Un fit ai minimi quadrati della relazione log(ΔI) vs log(Δx) fornisce la pendenza che diventa il valore d’uscita per il pixel a centro dell’intorno.
L’algoritmo Frei e Chen applica un insieme di kernel a tutti i punti nell’immagine.
Da ogni kernel si estrae un tipo specifico di comportamento.
L’insieme dei kernel costituisce un insieme delle funzioni di basi ortogonali.
La seguente tabella mostra l’implementazione 3×3 dei kernel.
In questo caso, il kernel 1 e 2 indicano la presenza di bordi.
I risultati dell’applicazione di ogni kernel sono moltiplicati.
La tecnica è un efficiente metodo per la rivelazione di bordi nelle immagini.
2. Digital Imaging Processing: Introduzione
4. Immagini Digitali - parte prima
5. Immagini Digitali - parte seconda
6. Dicom
7. Trasformazioni di Intensità
8. Convoluzione e Correlazione
9. Filtraggio nel Dominio Spaziale - parte prima
10. Filtraggio nel Dominio Spaziale - parte seconda
11. Trasformazioni Geometriche
14. Filtraggio nel Dominio delle Frequenze
16. Region Growing
17. Image Registration - parte prima
18. Image Registration - parte seconda
19. Computed Tomography - parte prima