Mappatura dei genomi
Prof. Giovanni Paolella
Dott. Leandra Sepe
La conoscenza completa della sequenza di un genoma permette di avere informazioni dettagliate su ciascuna regione cromosomica. Anche in assenza di tale informazione, è però possibile ottenere mappe di elementi genomici noti (mappe genomiche), che rappresentano con un grado variabile di risoluzione, la sua organizzazione strutturale.
Una mappa genomica consiste in un elenco di marcatori (marker), per i quali è nota la posizione nel genoma. Le mappe possono essere utilizzate per assegnare regioni genomiche a specifiche aree del genoma completo.
Si può definire marcatore qualunque elemento strutturale che possa essere facilmente identificabile e a cui si possa attribuire una specifica posizione lungo il genoma.
Un gene è tipicamente un marcatore, una specifica sequenza può essere un marcatore, così come una mutazione puntiforme.
Una sequenza ripetuta non è un buon marcatore genomico in quanto è riscontrabile in punti diversi del genoma.
I geni sono stati a lungo utilizzati come marcatori genomici in quanto la loro presenza in forma attiva può essere facilmente verificata attraverso un fenotipo:
I caratteri fenotipici sono stati utilizzati a lungo per determinare mappe di geni più o meno vicini, anche prima di conoscere la natura del materiale genetico e la sua struttura molecolare.
Oltre ai geni, anche altre sequenze di DNA aventi almeno due forme alleliche diverse sono utilizzabili come marcatori; esempi di tali polimorfismi sono:
Gli RFLP (restriction fragment length polymorphism) consistono in polimorfismi a carico di un sito di restrizione, caratterizzati dalla perdita del sito. Possono essere riconosciuti con vari metodi:
Gli SSLP (single sequence length polymorphism) sono sequenze polimorfiche caratterizzate dalla ripetizione, in numero variabile di volte, di un pattern definito come ad esempio specifici di- o tri-nucleotidi.
L’identificazione degli SSLP viene eseguita mediante amplificazione per PCR della regione contenente l’SSLP, seguita da corsa elettroforetica che evidenzia il polimorfismo come differenza di lunghezza.
Gli SNP sono polimorfismi caratterizzati dalla mutazione di singoli nucleotidi.
Essi possono essere riconosciuti mediante ibridazione, usando oligonucleotidi complementari ai diversi alleli e valutando la stabilità degli ibridi formati. In alternativa possono essere riconosciuti attraverso il sequenziamento della regione.
Le mappe genetiche sono rappresentazioni ottenute determinando la distanza tra geni vicini mediante tecniche genetiche. Si utilizzano diversi approcci sperimentali, anche in dipendenza dal tipo di organismi oggetto di studio.
I principi dell’ereditarietà sono stati enunciati da nel 1865 e codificati nelle due leggi di Mendel:
Sulla base di questi principi è possibile predire il risultato degli incroci genetici.
Le leggi di Mendel si applicano correttamente a geni localizzati su cromosomi diversi. Geni localizzati sullo stesso cromosoma tendono invece a essere ereditati insieme: il fenomeno è noto come linkage.
In realtà un linkage completo si osserva solo per geni molto vicini, mentre geni progressivamente più lontani mostrano il fenomeno in grado via via decrescente. Geni localizzati sullo stesso cromosoma, ma molto lontani, possono arrivare a comportarsi come se fossero su cromosomi distinti. Il grado di linkage riflette quindi la distanza fisica di due geni localizzati sullo stesso cromosoma. Il crossing-over durante la meiosi è il principale evento responsabile del fenomeno.
La determinazione di mappe genetiche nell’uomo mediante calcolo delle frequenze di ricombinazione, è ottenuta esaminando i genotipi di membri di generazioni successive di famiglie. Malattie a trasmissione genetica vengono spesso utilizzate come marcatori genetici essendo spesso associate ad una specifica locazione cromosomica. Tipicamente una famiglia oggetto di analisi è composta da almeno tre generazioni, inoltre maggiore è il numero di figli, più affidabile sarà il risultato dell’analisi. Nel pedigree riportato come esempio, lo scopo dell’analisi è quello di mappare la posizione del gene responsabile della malattia studiando il suo linkage ad un microsatellite M i cui quattro alleli M1, M2, M3, M4 sono presenti nei membri viventi della famiglia in esame.
I genomi batterici sono normalmente aploidi. Esistono però diverse modalità di trasferimento di DNA da un batterio ad un altro. Durante la coniugazione il trasferimento produce un organismo transitoriamente e parzialmente diploide che può andare incontro a ricombinazione. Sulla base del tempo trascorso dall’inizio del trasferimento è possibile identificare la posizione di marcatori genetici specifici, come ad esempio geni che conferiscono caratteristiche biochimiche selettive.
La risoluzione di una mappa genetica indica il numero di marker e il grado di precisione con cui è possibile determinarne la posizione sul cromosoma. Essa dipende dal numero di crossing-over che è possibile studiare. Nel caso di organismi di laboratorio, che si riproducono con facilità, è possibile studiare molti incroci ottenendo una mappa genetica anche abbastanza dettagliata. Se però si studiano mammiferi, il numero di meiosi è limitato dal tempo di riproduzione e dalle dimensioni della progenie. Inoltre la probabilità di crossing-over non è uniformememente distribuita lungo il cromosoma.
Il confronto tra la mappa genetica e quella fisica del cromosoma III di S. cerevisiae evidenzia discrepanze sia nell’ordine che nelle posizioni relative dei marcatori.
La corrispondenza tra una mappa genetica e la reale distribuzione dei marker sul cromosoma dipende dalla probabilità di crossing-over, che dovrebbe, in condizioni ideali, essere identica in ciascuna posizione del cromosoma. Di fatto esistono regioni in cui tale frequenza è più bassa e regioni in cui è più elevata, fino ad avere frequenze particolarmente elevate in aree molto piccole, definite hotspot. Un frequenza di crossing-over più elevata porta ad una sovrastima della distanza, viceversa con frequenze ridotte, le distanze possono essere sottostimate. In figura è rappresentata la mappa di una regione di cromosoma contenente i marker A,B,C,D con i relativi eventi di crossing-over, indicati da frecce. Nella parte bassa è riportata la mappa (errata) ottenuta sulla base degli eventi di ricombinazione.
La mappatura fisica dei genomi consiste nel localizzare la posizione relativa di marcatori sul DNA, mediante tecniche in grado di determinarne direttamente la distanza. Il tipo più semplice di mappa fisica è probabilmnte la mappa dei siti di restrizione di un frammento di DNA. Per genomi di grandi dimensioni, possono invece essere usate tecniche che si avvalgono della visualizzazione diretta dei cromosomi in microscopia ottica o tecniche di tipo biochimico. Le prime permettono la localizzazione diretta di marker su specifiche regioni cromosomiche, ma possono raggiungere risoluzioni limitate. Le seconde richiedono uno sforzo sperimentale anche consistente, ma possono essere piu’ facilmente automatizzate e permettono di ottenere risoluzioni molto elevate.
Le mappe di restrizione si ottengono dalla combinazione delle lunghezze dei frammenti generati per digestione totale o parziale di una molecola di DNA con uno o più enzimi di restrizione. L’elettroforesi su gel di agarosio dei frammenti ottenuti consente contarne il numero, valutarne la lunghezza e determinare le posizioni relative dei siti sulla base delle loro distanze. Talvolta è però necessario ricorrere ad una digestione parziale, per ottenere frammenti non completamente digeriti per discriminare tra mappe alternative, egualmente possibili.
Nell’esperimento riportato è rappresentata la determinazione della mappa di una piccola regione genomica con due enzimi di restrizione: è stata eseguita prima una digestione singola con ciascuno degli enzimi selezionati, poi una digestione doppia.
La mappatura dei siti di restrizione è molto utile per genomi di piccole dimensioni, come quelli virali. Per genomi più grandi, l’elevata frequenza di siti di taglio produce molti frammenti di dimensioni simili, difficili da distinguere in agarosio e da organizzare in una mappa corretta.
E’ tuttavia possibile scegliere enzimi con frequenze di taglio molto basse che riconoscono sequenze contenenti motivi rari. In questo caso, poichè la risoluzione di un gel di agarosio diminuisce con il crescere delle dimensioni delle molecole, è necessario ricorrere a tipi speciali di corse elettroforetiche, che utilizzano campi elettrici non lineari (per esempio la OFAGE).
I siti di restrizione possono essere localizzati anche mediante osservazione microscopica. Le molecole di DNA possono infatti essere “distese” su vetrini ricoperti di endonucleasi di restrizione inizialmente mantenute inattive. La sistemazione del DNA sui vetrini può essere eseguita mediante gel stretching o molecular combing. Con l’attivazione della reazione enzimatica e mediante utilizzo di un colorante per DNA (Dapi), i siti di restrizione vengono visualizzati al microscopio a fluorescenza come gap nella molecola di DNA distesa.
La microscopia può essere utilizzata anche per determinare direttamente la posizione di marcatori lungo una molecola di DNA mediante “Fluorescent In Situ Hybridization (FISH)”. Geni o altre sequenze sul cromosoma, possono essere evidenziati mediante ibridazione con probe specifici e successivamente visualizzati al microscopio. La tecnica permette l’assegnazione diretta di tali sequenze a specifiche regioni cromosomiche, ma ha una risoluzione limitata e non è facile da applicare ad un numero eccessivamente elevato di geni.
Un modo alternativo di determinare le distanze consiste nell’uso di metodi di frammentazione del genoma con metodiche fisiche o biochimiche. L’identificazione contemporanea di più marker sullo stesso frammento implica una distanza inferiore alla dimensione del frammento stesso.
Nelle prime fasi del progetto genoma, la frammentazione mediante irradiazione, ha permesso di effettuare una prima mappatura a risoluzione limitata. L’irradiazione è associata alla costruzione di ibridi cellulari contenenti grandi regioni genomiche.
Il principio è però molto più potente, e, se applicato a frammenti di dimensioni più contenute, ottenuti per frammentazione meccanica o enzimatica, permette di ottenere risoluzioni molto più elevate.
L’uso di tecniche di frammentazione piuttosto che genetiche per la mappatura, permette di utilizzare in aggiunta ai marcatori descritti, anche altri di tipo diverso rivelabili con metodologie biochimiche:
Per il sequenziamento del genoma umano sono state identificate una serie di sequenze di facile rilevazione definite STS. Si tratta di piccole sequenze caratterizzate dal solo fatto di essere presenti in singola copia nel genoma, e quindi facilmente rilevabili per ibridazione o PCR. La loro contemporanea identificzione all’interno di specifici frammenti, permette la costruzione di mappe a risoluzione elevata.
La messa a punto di tecniche di clonaggio di frammenti di dimensioni elevate ha permesso di costruire librerie rappresentative dell’intero genoma, da utilizzare sia per la mappatura che per il successivo sequenziamento.
1. Genomi: organizzazione e complessità
4. Assemblaggio e annotazione di genomi (ENSEMBL)
5. Package e interfacce per la gestione di sequenze
7. Allineamento di sequenze mediante matrici di punti
10. Algoritmi dinamici di allineamento
11. Elettroforesi
13. Algoritmi di allineamento di tipo euristico
14. Preparazione di acidi nucleici
15. Cromatografia
18. Banche dati
20. Vitalità e proliferazione di cellule in coltura
21. Microscopia
Descrizione della tecnica: articolo originale
Mappa di restrizione: descrizione del metodo
Radiation hybrids: descrizione della tecnica
Gel stretching o molecular combing