Sequenziamento di genomi
Prof. Giovanni Paolella
Dott. Leandra Sepe
Maxam e Gilbert articolo originale
Sanger articolo originale
Descrizione del metodo di Sanger
Il metodo di Sanger può essere automatizzato mediante l’utilizzo di dispositivi in grado di valutare la separazione delle specie molecolari durante la corsa elettroforetica, piuttosto che alla fine. Vengono utilizzati in questo caso ddNTPs marcati con fluorocromi. L’uso di fluorocromi diversi per le quattro basi permette di separare i prodotti di elongazione mediante una singola elettroforesi capillare. Misurazioni successive della emissione in fluorescenza producono un elettroferogramma, che può essere interpretato per ottenere la sequenza. Le letture tipiche ottenute in questo modo vanno da 300 fino a circa 1000 basi.
Le tecniche di sequenziamento oggi disponibili riescono ad ottenere di norma sequenze di piccole dimensioni. Per questo motivo, DNA più lunghi richiedono necessariamente il sequenziamento di molti frammenti più piccoli. Il successivo assemblaggio dei frammenti permette di ricostruire la sequenza completa.
Si procede quindi attraverso fasi distinte:
La molecola di DNA da sequenziare deve essere suddivisa in frammenti da sequenziare separatamente. Possono essere usate tecniche diverse, ad esempio:
I frammenti ottenuti possono essere amplificati, inserendoli in vettori plasmidici o fagici.
L’unione dei contig richiede spesso una rifinitura manuale. A tale scopo è necessario disporre di una interfaccia capace di visualizzare i risultati delle fasi di sequenziamento e assemblaggio. Consed è un programma sviluppato per eseguire la fase di finishing durante la quale l’operatore, visualizzando i risultati dell’assemblaggio, potrà eseguire modifiche all’allineamento automatico e valutare la qualità del sequenziamento ed eventualmente decidere la ripetizione di regioni mancanti o di bassa qualità.
La determinazione dell’intera sequenza in esame richiede infine l’unione di tutti i contig ottenuti dall’assemblaggio. La chiusura dei gap tra contig non è però semplice, anche aumentando il numero di sequenze, perchè la probabilità di sequenziare in maniera casuale le regioni mancanti diviene più bassa, man mano che si riduce il numero e l’estensione dei gap. Inoltre alcuni gaps sono dovuti alla differente rappresentazione delle sequenze in libreria: non tutte le sequenze hanno uguali probabilità di essere sede di taglio o di essere amplificate.
Per la chiusura dei gap si usano in genere strategie diverse, tese a identificare con metodiche sperimentali coppie di contig consecutivi e mirate a ottenere sequenze di aree definite. Tipicamente si costruiscono nuove librerie e/o si utilizzano oligonucleotidi con sequenze identiche a quelle delle estremità dei contig. Qualora due oligonucleotidi ibridassero con uno stesso clone, il sequenziamento di questo consentirebbe la chiusura del gap. Se, inoltre, una coppia di oligo genera un prodotto di PCR sul DNA genomico, la sequenza di tale prodotto chiude il gap.
Nel 1995, l’approccio shotgun è stato utilizzato per il sequenziamento del genoma del batterio Haemophilus Influenzae (1830 kb). La strategia utilizzata ha previsto l’esecuzione di 28643 esperimenti di sequenziamento; gli esperimenti andati a buon fine hanno coperto 11631 bp con una ridondanza di circa 6. L’assemblaggio dei frammenti ha prodotto 140 contig non sovrapposti, uniti mediante diverse procedure di riempimento dei gap.
L’utilizzo del metodo shotgun per il sequenziamento di genomi di più grandi dimensioni pone diversi problemi di assemblaggio:
A causa dei limiti descritti, l’applicazione del metodo di sequenziamento shotgun ai genomi eucariotici ha posto problemi notevoli. L’approccio utilizzato è consistito nel generare innanzitutto una mappa genetica da utilizzare come canovaccio. Una volta ottenuta la mappa, il sequenziamento è stato eseguito separatamente su regioni grandi di genoma, poi assemblate facendo riferimento alla mappa. Il metodo shtogun è stato invece ampiamento utilizzato per il sequenziamento delle varie regioni.
Di seguito sono riassunte le principali tappe del sequenziamento del genoma umano. Le prime tappe sono state di mappatura, a risoluzione via via maggiore, poi in pochi anni è stato completato il sequenziamento.
In parallelo con il progetto genoma, nelle ultime fasi, è stato portato avanti un approccio alternativo in ambito industriale da parte di Celera Genomics, basato sul sequenziamento casuale del genoma intero. L’approccio è divenuto possibile grazie alla disponibilità di maggiore potenza di calcolo e di metodi di sequenziamento automatizzati e ha permesso una seconda determinazione della sequenza genomica, in un tempo molto piu breve. E’ da notare però che la sequenza e la mappatura effettuati nell’ambito del progetto genoma erano disponibili ai ricercatori della Celera Genomics.
Tappe principali del sequenziamento del genoma umano
Progetto Genoma – Celera Genomics
La introduzione del metodo shotgun sul genoma completo ha permesso di estendere lo studio ad altri genomi. In questo approccio, la disponibilità della sequenza completa ha favorito notevolmente lo studio di genomi simili a quello umano. Oggi sono disponibili sequenze complete per un gran numero di genomi. Metodiche come il pyrosequencing, di più facile automazione, hanno aperto la strada a altri approcci. Il resequencing, cioè il sequenziamento di molecole molto simili ad altre già sequenziate, comincia oggi ad essere una realtà comune per genomi di dimensioni limitate come quelli batterici.
Pyrosequencing: Il metodo non richiede utilizzo di ddNTPs nè la separazione elettroforetica dei frammenti sintetizzati; la sintesi avviene aggiungendo i dNTPs in ordine uno dopo l’altro: la non incorporazione determina l’immediata degradazione del dNTP, viceversa l’incorporazione di un dNTP nel filamento nascente innesca una reazione che emette chemioluminescenza la quale viene rivelata da un CCD. le letture sono tipicamente di 100-200 basi, ma molti campioni possono essere trattati in parallelo.
Il metodo ha grossi vantaggi perchè puo essere applicato su larga scala e consente quindi il rapido sequenziamento di regioni molto grandi, a fronte di impegno umano comunque limitato.
1. Genomi: organizzazione e complessità
4. Assemblaggio e annotazione di genomi (ENSEMBL)
5. Package e interfacce per la gestione di sequenze
7. Allineamento di sequenze mediante matrici di punti
10. Algoritmi dinamici di allineamento
11. Elettroforesi
13. Algoritmi di allineamento di tipo euristico
14. Preparazione di acidi nucleici
15. Cromatografia
18. Banche dati
20. Vitalità e proliferazione di cellule in coltura
21. Microscopia
Descrizione del metodo di Maxam e Gilbert
Descrizione del metodo di Sanger
Descrizione del pyrosequencing