Esercitazione: Allineamenti
Prof. Giovanni Paolella
Dott. Leandra Sepe
In questa esercitazione ti verra’ richiesto di eseguire una comparazione di sequenze allo scopo di ricercare similarita’. A partire da due sequenze di cDNA, procederai effettuando le seguenti operazioni:
Osserverai le differenze nei risultati ottenuti dai due tipi di allineamento
Applicherai nuovamente gli algoritmi di allineamento globale e locale per allineare ciascuno dei due cDNA con un pezzo di DNA genomico.
Riconoscerai anche in questo caso sostanziali differenze nei risultati ottenuti dai due tipi di allineamento.
Scarica le due sequenze di cDNA su cui lavorare e salvale in locale sul tuo computer.
Esegui la comparazione delle due sequenze mediante un dotplot utilizzando il programma dottup del pacchetto EMBOSS. Per farlo vai all’indirizzo http://bioinfo.ceinge.unina.it ed esegui il login come indicato. Segui il link Programs presente sul lato sinistro in alto della Home Page e cerca il programma dottup inserendone il nome nel campo Name e cliccando su Find. Clicca sul link dottup e poi sull’icona a centro pagina (missile). A questo punto hai di fronte l’interfaccia PISE del programma dottup.
Osserva che hai a disposizione due aree nelle quali inserire le sequenze da confrontare e varie opzioni da selezionare. Inserisci nelle due aree assegnate le sequenze in formato FASTA con un copia e incolla, una all’interno dell’area asequence e l’altra nell’area bsequence. Seleziona la word size: ricorda che 1 sta per “confronto base per base”, 2 per “confronto di coppie di basi”, etc. Poiche’ il programma genera un risultato in formato grafico, scegli il formato grafico PNG nella sezione di output, settando i parametri graph e xygraph a “png”. Avvia la ricerca di similarita’ cliccando su Run. Per vedere il risultato seleziona la voce ‘dottup.1.png’.
Esegui i primi confronti facendo variare la word size tra 1 e 10. Cosa cambia? Quando cominci a riconoscere un pattern significativo?
Prova ora a ripetere l’operazione facendo variare word size tra 10 e 30.
Cosa osservi? Come e perche’ cambia il riempimento del grafico?
Prova adesso ad allineare le due sequenze di cDNA utilizzando un programma di allineamento in grado di evidenziarne la similarità. Matcher, del package EMBOSS, è un programma di allineamento locale basato sull’algoritmo di Smith e Waterman
Il programma può essere utilizzato attraverso l’interfaccia PISE del sito http://bioinfo.ceinge.unina.it. Matcher prevede la scelta di alcuni parametri, per esempio: matrice da utilizzare, penalità da assegnare nel calcolo del punteggio finale per la comparsa di nuovi gap nell’allineamento (Gap penalty) e penalità per l’estensione dei gap (Gap length penalty).
Inserisci le due sequenze in esame, in formato FASTA, nelle apposite aree ed esegui il primo allineamento utilizzando i parametri predefiniti.
Cosa osservi? Quanto sono simili i due cDNA?
Prova ora a cambiare i parametri di Gap penalty e Gap length penalty, che, come valori predefiniti, sono impostati rispettivamente a 16 e 4. Puoi per esempio rendere il programma meno tollerante nell’inserire i gap, aumentando i due valori di Gap penalty e Gap length penalty rispettivamente a 32 e 8.
Cosa osservi? Come e perche’ cambiano percentuale di identita’ e punteggio (Score)?
Prova ora ad usare un programma di allineamento di tipo globale, in grado di evidenziare tutte le aree in comune tra le due sequenze. Stretcher è un programma di allineamento globale basato sull’algoritmo di Needleman-Wunsch.
Inserisci nelle due aree le sequenze in formato FASTA con un copia e incolla e utilizza inizialmente i parametri predefiniti.
Cosa osservi? Prova anche qui a rendere il programma meno tollerante nell’inserire i gap, aumentando i due valori di Gap penalty e Gap length penalty rispettivamente a 32 e 8.
Cosa osservi? Come e in cosa e’ cambiato l’allineamento?
Supponiamo che la sequenza cDNA1 sia il trascritto di un gene presente nella sequenza genomica genomic_seq.
Utilizza i programmi dottup, matcher e stretcher per confrontare il cDNA con la sequenza genomica; dovresti essere in grado di :
identificare il numero di esoni che costituiscono il cDNA. Quanti sono?
localizzarli sul DNA genomico. Dove iniziano e finiscono gli esoni?
Perche’ la coda di poliA non si allinea col DNA genomico?
1. Genomi: organizzazione e complessità
4. Assemblaggio e annotazione di genomi (ENSEMBL)
5. Package e interfacce per la gestione di sequenze
7. Allineamento di sequenze mediante matrici di punti
10. Algoritmi dinamici di allineamento
11. Elettroforesi
13. Algoritmi di allineamento di tipo euristico
14. Preparazione di acidi nucleici
15. Cromatografia
18. Banche dati
20. Vitalità e proliferazione di cellule in coltura
21. Microscopia