Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D La Corte in Rete
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Giovanni Paolella » 24.Esercitazione: EMBOSS


Biotecnologie cellulari e molecolari

Esercitazione: Banche dati

Prof. Giovanni Paolella

Dott. Leandra Sepe

Descrizione dell’attività da svolgere

A partire da una sequenza di DNA genomico, procederai alla sua caratterizzazione utilizzando i programmi disponibili nel package di Emboss. Eseguirai:

  • L’analisi della composizione in basi della sequenza
  • La ricerca di isole CpG
  • Una mappa di restrizione della sequenza in esame con lo scopo di estrarre una delle regioni ricche in CG identificate

Alla fine dell’esercitazione dovresti essere in grado di descrivere la composizione in basi del DNA genomico in esame e di predire alcune delle sue caratteristiche, per esempio identificare regioni potenzialmente codificanti.

Analisi della composizione in basi

Scarica la sequenza genomica e conservala salvandola in un file di testo per utilizzarla con i programmi di cui parleremo in seguito.

Per analizzare la sua composizione in basi utilizza il programma compseq del pacchetto EMBOSS, lo trovi all’indirizzo http://bioinfo.ceinge.unina.it eseguendo il login come indicato. Seleziona il link Programs presente sul lato sinistro della Home Page, e cerca il programma compseq inserendo il nome nel campo Name e cliccando su Find. Seleziona il link compseq e clicca sull’icona con il missile per accedere all’interfaccia PISE del programma.

Copia la sequenza da analizzare all’interno dell’area indicata con actual data. Puoi selezionare la word, cioè cercare la frequenza di monomeri, dimeri, trimeri e cosi’ via. Prova a calcolare la frequenza di monomeri. Clicca su Run per avviare il programma e seleziona ‘oufile.out’ per vedere il risultato.

Quale è la base più frequente?

Prova ora a ripetere l’operazione ponendo la word a 2. Qual è la frequenza dei dimeri CG e GC?

Ricerca di isole CpG

La presenza di regioni ricche in CG (isole CpG) in tratti genomici è caratteristica di regioni associate a geni, dove hanno funzione di regolazione.

Il programma cpgplot, del pacchetto EMBOSS, offre la possibilità di identificare regioni ricche in CG all’interno di sequenze di DNA. L’interfaccia PISE del programma è raggiungibile cercandolo come fatto in precedenza. La sequenza da esaminare può essere inserita con un copia & incolla nell’area actual data, mentre è necessario scegliere il formato PNG nella sezione di output per visualizzare agevolmente il risultato in formato grafico. Lancia il programma cliccando sul bottone Run e seleziona il link cpgplot.1.png per vedere il risultato. Vengono visualizzati tre grafici: il rapporto tra numero di CG atteso ed osservato (in alto), la percentuale lungo la sequenza genomica (al centro) e le possibili isole CpG (in basso).

Dove e quante sono le possibili isole CpG?

Esiste però anche un modo per conoscere con precisione la posizione delle isole CpG: il programma cpgreport consente di ottenere questa informazione. Puoi arrivare all’interfaccia PISE del programma cercandolo come fatto in precedenza per gli altri due.

Dov’è l’ isola CpG più grande? Quali sono le sue caratteristiche?

Uso dell’interfaccia Capri

L’esecuzione dei programmi del pacchetto Emboss è possibile, oltre che attraverso una interfaccia web, come PISE, anche a linea di comando. Esistono inoltre anche interfacce alternative che consentono di interagire col programma in modo agevole e semplice. Una di queste è CAPRI che, sebbene si presenti come un comune programma desktop (tipo Word), con menù a tendina che richiamano operazioni specifiche, in realtà è una applicazione web che utilizza un normale browser internet, come Internet Explorer.

Prova a ripetere alcune delle operazioni fatte precedentemente, utilizzando Capri. Il link a CAPRI è presente nella barra di sinistra della home page del sito bioinfo.ceinge.unina.it. Recupera la sequenza di DNA genomico e inseriscila in CAPRI, con un copia e incolla. Per eseguire compseq seleziona Words dal menù “Analyze”, per ottenere il grafico delle isole CpG seleziona CpG Islands (G ) dal menu “Search”. Nota che in CAPRI tutte le operazioni che generano un grafico sono identificate da “(G)”.

Osservando il risultato del programma cpgreport dovresti capire dove inizia e dove finisce l’isola CpG nella sequenza in esame. Prova ad estrarla con CAPRI usando il menù “Extract–>Fragments”. Otterrai la sola sequenza con isole CpG sulla quale potrai calcolare la percentuale di GC utilizzando il menù “Analyze–>GC Content”: se hai fatto tutto correttamente, dovresti ottenere una percentuale di GC di circa 0.7.

Mappa di restrizione

Allo scopo di estrarre l’isola CpG identificata dalla sequenza genomica, seleziona gli enzimi di restrizione adatti allo scopo. Per farlo puoi usare il programma remap. Eseguendo il programma con le opzioni di default otterrai una mappa completa dei siti di restrizione presenti lungo la sequenza. Cambiando, però, in modo opportuno alcuni dei parametri potrai restringere la ricerca agli enzimi che tagliano la sequenza una sola volta (Force single site only cuts), oppure fornire una lista di enzini scrivendoli nella sezione “Comma separated enzyme list” al posto della parola “all“. Per esempio se hai a disposizione la seguente lista di 9 enzimi: HindIII, PstI, BamHI, SmaI, NcoI, TaqII, EcoRI, KpnI, BstI, puoi limitare l’analisi a questi incollando la lista dei 9 enzimi nel campo opportuno. Inoltre puoi colorare una certa regione di interesse indicando nella sezione regions to colour in HTML la posizione della regione di tuo interesse ed il colore (scrivendo, per esempio, “100-300 red”), e selezionare l’opzione Use HTML formatting. Prova ad evidenziare la regione con le isole CpG colorandola in rosso. Utilizzando queste opzioni potrai risolvere problemi come scegliere la coppia di enzimi che taglia ai bordi esterni della regione ricca in CG, il più vicino possibile ad essa. Ricorda di dare il nome “outfile.html” nel campo “Output sequence details to a file”, se hai scelto di vedere regioni colorate. Il risultato può essere visualizzato cliccando su Run e selezionando il link outfile.html.

Nota che molti dei 9 enzimi tagliano nella regione di interesse e pertanto sono da scartare, una coppia di enzimi soddisfa la condizione inziale. Quale?

  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion

Fatal error: Call to undefined function federicaDebug() in /usr/local/apache/htdocs/html/footer.php on line 93