Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D Le Miniguide all'orientamento Gli eBook di Federica La Corte in Rete
 
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Massimo Aria » 6.Introduzione all'utilizzo del software statistico Tanagra


Il software Tanagra

Tanagra è un software gratuito di Data Mining per la didattica e la ricerca scritto dal Prof. R. Rakotomalala, dell’Università di Lione, Francia.

Tanagra è disponibile per il sistema operativo Windows, e in emulazione per sistemi linux, ed è scaricabile gratuitamente.

Tanagra è un progetto “open source”, il codice sorgente è liberamente accessibile a coloro che intendono sviluppare ulteriori routine statistiche.

Il pacchetto di installazione, e le guide all’utilizzo del software, sono scaricabili dal sito  Tanagra.

L’interfaccia di Tanagra

L’interfaccia di Tanagra è costituita da tre parti che identificano la filosofia operativa del software:

  1. Il diagramma di flusso che rappresenta i vari passi delle analisi che si vogliono condurre in Tanagra;
  2. I singoli componenti (widget) ognuno dei quali rappresenta un’operazione eseguibile sui dati. L’insieme di tali operatori è posto nella parte inferiore dell’interfaccia ed è suddiviso in categorie;
  3. Il report in formato html suddiviso in due parti: la descrizione dei parametri di analisi e i risultati.

L’interfaccia di Tanagra (segue)


Importare dati da un file di testo

Tanagra può importare file di testo con dati separati da tabulazione.

L’insieme delle operazioni realizzate su un set di dati può essere salvato in due differenti modalità:

  • nel formato .bdm, che può essere aperto solo da Tanagra e con il quale si salva l’insieme delle operazioni svolte sui dati;
  • nel formato .tdm, con il quale invece tutte le operazioni vengono salvate in un file che può essere aperto da qualsiasi editor di testo.

Importare dati da un file Ms Excel

E’ possibile importare i file in Tanagra anche direttamente da Microsoft Excel.

Per questa operazione ci sono due alternative:

  1. installare il componente aggiuntivo per Excel (sia per la versione del 2003 che per quella del 2007), presente nella cartella di installazione di Tanagra;
  2. nelle versioni più aggiornate di Tanagra il componente per i file in formato xls è già integrato nel kernel del software e non richiede l’installazione di routine esterne.

L’installazione del componente aggiuntivo comporta la creazione di un menu aggiuntivo in excel che consente di importare in Tanagra un’area di lavoro selezionata in excel.

Maschera di importazione da Ms Excel

Una volta aperto il file bisogna selezionare tutte le celle.

Una volta aperto il file bisogna selezionare tutte le celle.


Maschera di importazione da Ms Excel (segue)

Cliccare sulla sottovoce Tanagra, e successivamente su Execute Tanagra (foto in alto).

Na caso in cui vi sia chieto di Attivare i Macro premere su OK.

A questo puntosarà comparsa la finestra (foto in basso) in cui vi è chiesto conferma del range selezionato. Se sono stati selezionati tutti i dati, cliccare su OK.


Maschera di importazione da Ms Excel (segue)

Una volta cliccato su OK Tanagra si dovrebbe aprire automaticamente e dovrebbe fornire il seguente report (vedi foto).

Tanagra legge le informzioni del dataset come variabile discreta. Ovviamente si tratta solo di un artificio computazionale.

Le variabili sono, invece, tutte quanitative continue.


Componente integrato per importazione da Excel

Si deve cliccare sull’immagine in alto a sinistra evidenziata dal cerchio rosso.

PS. Tale applicazione è utilizzabile solo per i file salvati in xls e non in xlxs (cioè i file di Excel di Office 2007).


Componente integrato per importazione da Excel (segue)

Si aprirà la finestra in basso e sarà sufficiente cliccare sulla cartella aperta (cerchiata in rosso) per richiamare il file da caricare in Tanagra (si vedrà infatti che tra le estensioni previste nella voce Dataset c’è anche .xls).


Nella prossima lezione

Nella prossima lezione si affronteranno i seguenti argomenti:

  • Analisi delle Componenti Principali con software TANAGRA;
  • Presentazione di alcuni casi studio.
  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion