Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D Le Miniguide all'orientamento Gli eBook di Federica La Corte in Rete
 
I corsi di Scienze Biotecnologiche
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Giovanni Paolella » 3.Sequenziamento di genomi


Biotecnologie cellulari e molecolari

Sequenziamento di genomi

Prof. Giovanni Paolella

Dott. Leandra Sepe

Metodi di sequenziamento

  • Metodo chimico (Maxam e Gilbert): è una tecnica non automatizzabile che prevede la marcatura delle estremità 3′ del DNA con 32P, il taglio e la separazione dei due filamenti marcati. La miscela ottenuta viene suddivisa in quattro parti, ciascuna delle quali produce una miscela di frammenti dopo trattamento chimico capace di modificare e tagliare specificamente una o piu’ basi. I frammenti marcati prodotti hanno dimensioni specifiche e vengono analizzati per elettroforesi per determinare l’ordine dei nucleotidi.
  • Metodo enzimatico di Sanger: sintesi enzimatica parziale di una copia del DNA stampo in presenza di dideossinucleotidi (ddNTPs) che causano la terminazione dell’allungamento. I frammenti ottenuti (fino a 500-1000 bps) vengono separati mediante elettroforesi su gel di poliacrilammide e visualizzati per autoradiografia.

Metodi di sequenziamento

Maxam e Gilbert articolo originale

Sanger articolo originale

Descrizione del metodo di Sanger

Descrizione del metodo di Maxam e Gilbert

Metodo di Sanger

Sequenziamento automatico

Il metodo di Sanger può essere automatizzato mediante l’utilizzo di dispositivi in grado di valutare la separazione delle specie molecolari durante la corsa elettroforetica, piuttosto che alla fine. Vengono utilizzati in questo caso ddNTPs marcati con fluorocromi. L’uso di fluorocromi diversi per le quattro basi permette di separare i prodotti di elongazione mediante una singola elettroforesi capillare. Misurazioni successive della emissione in fluorescenza producono un elettroferogramma, che può essere interpretato per ottenere la sequenza. Le letture tipiche ottenute in questo modo vanno da 300 fino a circa 1000 basi.

Movie sequenziamento automatico

Sequenziamento automatico

Sequenziamento di regioni di DNA

Le tecniche di sequenziamento oggi disponibili riescono ad ottenere di norma sequenze di piccole dimensioni. Per questo motivo, DNA più lunghi richiedono necessariamente il sequenziamento di molti frammenti più piccoli. Il successivo assemblaggio dei frammenti permette di ricostruire la sequenza completa.

Si procede quindi attraverso fasi distinte:

  • La generazione dei frammenti
  • La determinazione della sequenza
  • L’unione dei frammenti sequenziati
  • La chiusura dei gap

La generazione dei frammenti

La molecola di DNA da sequenziare deve essere suddivisa in frammenti da sequenziare separatamente. Possono essere usate tecniche diverse, ad esempio:

  • Digestione enzimatica, anche parziale, con endonucleasi di restrizione.
  • Frammentazione fisica mediante sonicazione.

I frammenti ottenuti possono essere amplificati, inserendoli in vettori plasmidici o fagici.

Article genomes online

Genomesonline

Il sequenziamento dei frammenti

  • I frammenti generati vengono sequenziati, tipicamente mediante sequenziamento automatico, a partire dalle estremità utilizzando primer complementari alla sequenza del vettore.
  • Viene così determinata, a partire da ciascuna estremità, la sequenza di un numero di basi dipendente dalla tecnica utilizzata, tipicamente dell’ordine di alcune centinaia. Per frammenti di dimensioni limitate, questo può corrispondere alla sequenza dell’intero frammento.

Il sequenziamento dei frammenti

  • L’analisi degli elettroferogrammi ottenuti viene eseguita da programmi specificamente sviluppati per verificare la bontà del sequenziamento: Phred è un programma che applica metodi statistici per valutare la qualità di ogni base sequenziata.
  • Sulla base della posizione teorica in cui dovrebbero essere localizzati i picchi nell’elettroferogramma, viene analizzata la posizione di ogni base e l’area di ogni picco. Dal confronto tra le posizioni reali e quelle calcolate, si definisce un valore di affidabilità per ogni base.

Phred articolo originale I

Phred articolo originale II

L’assemblaggio

  • L’assemblaggio della sequenza completa viene eseguito mediante ricerca di sovrapposizioni tra i singoli frammenti. In pratica la presenza di sequenze identiche, o notevolmente simili su diverse decine di basi nelle estremià consente di identificare coppie di frammenti consecutivi. La procedura di assemblaggio deve tenere conto della polarita’ della sequenza e del fatto che il sequenziamento può avvenire in entrambe le direzioni.
  • E’ necessario sequenziare un numero di basi pari a diverse volte la sequenza completa, per arrivare a trovare un numero di sovrapposizioni sufficiente. La ridondanza è tuttavia utile, perchè permette di correggere eventuali errori di sequenziamento.

L’assemblaggio

  • Diversi programmi sono disponibili per l’assemblaggio dei frammenti, tra essi Phrap è uno dei più usati: il programma allinea le sequenze mediante ricerca di “parole” di lunghezza stabilita, come altri programmi di allineamento, e attribuisce un punteggio sulla base della similarità delle basi e della affidabilità delle lettura. L’assemblaggio inizia a partire dagli allineamenti più significativi e procede a mosaico costruendo tratti contigui composti da più letture, definiti contig.
  • Si creano così isole non ordinate di sequenza, che nel complesso definiscono la completa regione da sequenziare.

Phrap

L’unione dei contig

L’unione dei contig richiede spesso una rifinitura manuale. A tale scopo è necessario disporre di una interfaccia capace di visualizzare i risultati delle fasi di sequenziamento e assemblaggio. Consed è un programma sviluppato per eseguire la fase di finishing durante la quale l’operatore, visualizzando i risultati dell’assemblaggio, potrà eseguire modifiche all’allineamento automatico e valutare la qualità del sequenziamento ed eventualmente decidere la ripetizione di regioni mancanti o di bassa qualità.

La chiusura dei gap

La determinazione dell’intera sequenza in esame richiede infine l’unione di tutti i contig ottenuti dall’assemblaggio. La chiusura dei gap tra contig non è però semplice, anche aumentando il numero di sequenze, perchè la probabilità di sequenziare in maniera casuale le regioni mancanti diviene più bassa, man mano che si riduce il numero e l’estensione dei gap. Inoltre alcuni gaps sono dovuti alla differente rappresentazione delle sequenze in libreria: non tutte le sequenze hanno uguali probabilità di essere sede di taglio o di essere amplificate.

La chiusura dei gaps

La chiusura dei gap

Per la chiusura dei gap si usano in genere strategie diverse, tese a identificare con metodiche sperimentali coppie di contig consecutivi e mirate a ottenere sequenze di aree definite. Tipicamente si costruiscono nuove librerie e/o si utilizzano oligonucleotidi con sequenze identiche a quelle delle estremità dei contig. Qualora due oligonucleotidi ibridassero con uno stesso clone, il sequenziamento di questo consentirebbe la chiusura del gap. Se, inoltre, una coppia di oligo genera un prodotto di PCR sul DNA genomico, la sequenza di tale prodotto chiude il gap.

La chiusura dei gaps

Sequenziamento di genomi grandi

Nel 1995, l’approccio shotgun è stato utilizzato per il sequenziamento del genoma del batterio Haemophilus Influenzae (1830 kb). La strategia utilizzata ha previsto l’esecuzione di 28643 esperimenti di sequenziamento; gli esperimenti andati a buon fine hanno coperto 11631 bp con una ridondanza di circa 6. L’assemblaggio dei frammenti ha prodotto 140 contig non sovrapposti, uniti mediante diverse procedure di riempimento dei gap.

Haemophilus (GeneBank)

Haemophilus (NCBI)

Heamophilus (Tigr)

Limiti del metodo shotgun

L’utilizzo del metodo shotgun per il sequenziamento di genomi di più grandi dimensioni pone diversi problemi di assemblaggio:

  • Al crescere del numero dei frammenti aumenta enormemente il numero di overlap possibili (per n frammenti, 2n2-2n overlap), creando problemi di computazione.
  • La presenza di regioni ripetute può determinare errori di assemblaggio con perdita di sequenze o unione erronea di frammenti, appartenenti anche a cromosomi diversi.
  • Il numero di gap finali da chiudere diviene molto alto, e non gestibile facilmente con metodiche sperimentali.

Sequenziamento di genomi grandi

A causa dei limiti descritti, l’applicazione del metodo di sequenziamento shotgun ai genomi eucariotici ha posto problemi notevoli. L’approccio utilizzato è consistito nel generare innanzitutto una mappa genetica da utilizzare come canovaccio. Una volta ottenuta la mappa, il sequenziamento è stato eseguito separatamente su regioni grandi di genoma, poi assemblate facendo riferimento alla mappa. Il metodo shtogun è stato invece ampiamento utilizzato per il sequenziamento delle varie regioni.

Il sequenziamento del genoma umano

Di seguito sono riassunte le principali tappe del sequenziamento del genoma umano. Le prime tappe sono state di mappatura, a risoluzione via via maggiore, poi in pochi anni è stato completato il sequenziamento.

  • 1987 RFLP map (~10 Mb)
  • 1994 SSLP map (~.7 Mb)
  • 1995 STS map (~.1 Mb)
  • 1998 Chromosome 22
  • 1999 Chromosome 21
  • 2001 First draft (90%)
  • 2003 “Complete” sequence

Nature special issue

HGP on DOE

HGP on Sanger

Il sequenziamento del genoma umano

In parallelo con il progetto genoma, nelle ultime fasi, è stato portato avanti un approccio alternativo in ambito industriale da parte di Celera Genomics, basato sul sequenziamento casuale del genoma intero. L’approccio è divenuto possibile grazie alla disponibilità di maggiore potenza di calcolo e di metodi di sequenziamento automatizzati e ha permesso una seconda determinazione della sequenza genomica, in un tempo molto piu breve. E’ da notare però che la sequenza e la mappatura effettuati nell’ambito del progetto genoma erano disponibili ai ricercatori della Celera Genomics.

Il sequenziamento del genoma umano

Tappe principali del sequenziamento del genoma umano

Progetto Genoma – Celera Genomics

  • 1987 RFLP map (~10 Mb)
  • 1994 SSLP map (~.7 Mb)
  • 1995 STS map (~.1 Mb)
  • 1998 Chromosome 22 – 1998 shotgun approach proposed
  • 1999 Chromosome 21
  • 2001 First draft (90%)
  • 2003 “Complete” sequence

Il sequenziamento dei genomi eucariotici

La introduzione del metodo shotgun sul genoma completo ha permesso di estendere lo studio ad altri genomi. In questo approccio, la disponibilità della sequenza completa ha favorito notevolmente lo studio di genomi simili a quello umano. Oggi sono disponibili sequenze complete per un gran numero di genomi. Metodiche come il pyrosequencing, di più facile automazione, hanno aperto la strada a altri approcci. Il resequencing, cioè il sequenziamento di molecole molto simili ad altre già sequenziate, comincia oggi ad essere una realtà comune per genomi di dimensioni limitate come quelli batterici.

Descrizione del pyrosequencing

Pyrosequencing

Multimedia Presentation: Genome Sequencer FLX

Pyrosequencing e automazione

Pyrosequencing: Il metodo non richiede utilizzo di ddNTPs nè la separazione elettroforetica dei frammenti sintetizzati; la sintesi avviene aggiungendo i dNTPs in ordine uno dopo l’altro: la non incorporazione determina l’immediata degradazione del dNTP, viceversa l’incorporazione di un dNTP nel filamento nascente innesca una reazione che emette chemioluminescenza la quale viene rivelata da un CCD. le letture sono tipicamente di 100-200 basi, ma molti campioni possono essere trattati in parallelo.

Il metodo ha grossi vantaggi perchè puo essere applicato su larga scala e consente quindi il rapido sequenziamento di regioni molto grandi, a fronte di impegno umano comunque limitato.

Descrizione del pyrosequencing

Multimedia Presentation: Genome Sequencer FLX

  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion