Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D La Corte in Rete
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Amalia Caputo » 6.Verso l'analisi dei dati


Introduzione

L’organizzazione dei dati consiste nel trasferire le informazioni in una matrice rettangolare di numeri, la matrice dei dati, detta anche matrice casi per variabili. La matrice ottenuta è il punto di partenza per l’analisi dei dati, cioè elaborazioni statistiche condotte con l’ausilio di un calcolatore.

l’analisi dei dati …

è preceduta da 4 fasi:

  1. costruzione del code-book (codifica);
  2. costruzione della matrice dati;
  3. data entry (immissione dati);
  4. pulizia dei dati.

… è succeduta dalla presentazione dei risultati

1. Costruzione del code book – libro codice

Assegnazione dei valori numerici alle modalità della variabile.

Se la variabile è:

  • categoriale non ordinata: i valori numerici vengono assegnati a caso;
  • categoriale ordinata: i valori numerici devono rispettare il vincolo della monotonicità;
  • cardinali: nessuna assegnazione.

2. La matrice dei dati


La matrice dei dati: esempio

Dato: il numero presente in ciascuna cella, rappresenta il valore convenzionale assegnato allo stato di uno specifico caso su una specifica proprietà sulla base della sua attribuzione a una modalità della corrispondente variabile.

Leggendo per riga si ottengono le informazioni di ciascun caso su tutte le variabili.
Esempio: Filippo è uomo (codice 1=uomo sulla variabile genere), ha 24 anni (24 sulla variabile età), risiede a Napoli (codice 1=Napoli sulla variabile residenza) e ha la licenza media superiore (codice 4=modalità Media superiore sulla variabile titolo di studio).

Leggendo per colonna si otterranno le informazioni della singola variabile per tutti i casi.
Esempio: Nella variabile genere ricadono tre casi nella modalità 1=uomo e due casi che ricadono nella modalità 2=donna.


3. Data Entry (immissione dati)

Il Data Entry è il passaggio dal questionario alla matrice.
Consiste nell’ immissione (per riga) di ciascun dato presente nel questionario nella corrispondente cella della matrice dati.

NB: prima di procedere all’immissione dati è necessario numerare ogni singolo questionario; questa operazione agevola la fase sccessiva, quella della pulizia dei dati.


4. La pulizia dei dati

La pulizia dei dati consiste in un controllo della qualità del dato

I dati sono essenzialmente 3:

  1. Controllo di plausibilità (wild codes check):controllo della presenza di valori selvaggi.
  2. Controllo di congruenza: coincidenza tra n° di casi del campione e n° di casi nella matrice.
  3. Controllo valori missing: non so; non risponde.

L’analisi dei dati

L’analisi dei dati è la procedura attraverso la quale si organizzano i dati rilevati (codifica e registrazione dei dati) mediante interrogazione – questionario standard – per essere analizzati.

L’analisi dei dati si effettua sottoponendo ad elaborazioni matematiche i valori contenuti nelle celle di uno o più vettori della matrice dati.


Tipi di analisi dei dati

Monovariata: Analizza la distribuzione dei dati di un vettore fra le modalità della corrispondente variabile e delle sue caratteristiche.

Bivarata: analizza la distribuzione di due variabili considerate congiuntamente.

Multivariata: analizza la distribuzione di tre o più variabili considerate congiuntamente.

I dati possono essere analizzati mediante

1. Rappresentazioni: descrizioni complete della/e variabile/i

  • Distribuzioni di frequenza.
  • Tabelle di contingenza.
  • Rappresentazioni grafiche/diagrammi.

2. Valori caratteristici

  • Indici numerici sintetici che forniscono informazioni su alcune proprietà di una variabile (analisi monovariata).
  • Misure di tendenza centrale.
  • Misure di variabilità.

3. Coefficienti
Indici numerici sintetici che forniscono informazioni su alcune proprietà di due o più variabili analizzate sincronicamente (analisi bi e multivariata).

N.B.: Si dicono “relativi” i valori caratteristici e i coefficienti che variano tra -1 e 1.

Presentazione dei risultati

L’ultima fase è la presentazione dei risultati (report di ricerca), a cui si arriva tramite un processo di interpretazione delle analisi statistiche condotte nella fase precedente; il ricercatore ritorna alla teoria iniziale tramite un processo di induzione: egli confronta i risultati ottenuti con la teoria di partenza per arrivare a una sua conferma o riformulazione. La presentazione dei risultati prevede la generalizzazione limitata a tempo e spazio.

Rapporto di ricerca.

Rapporto di ricerca.


Glossario

  • Analisi bivariata: lo studio delle relazioni fra due variabili.
  • Analisi monovariata: studio delle variabili prese singolarmente.
  • Analisi multivariata: studio delle relazioni intercorrenti fra più di due variabili.
  • Campione: sotto-insieme della popolazione di riferimento, insieme dei casi che effettivamente entrano nell’indagine; si indica con n
  • Casi: gli esemplari dell’unità d’analisi inclusi nella ricerca, si indica con c.
  • Dato: valore convenzionale assegnato allo stato di uno specifico caso su una specifica proprietà sulla base della sua attribuzione a una modalità della corrispondente variabile.
  • Matrice dei dati: contiene le informazioni raccolte durante un’indagine in forma numerica.
  • Modalità di una variabile: è lo stato sulla proprietà di cui sia stata data una definizione operativa di una variabile.
Glossario.

Glossario.


Glossario

  • Popolazione di riferimento: localizzazione nel tempo e nello spazio dell’unità d’analisi; è l’insieme degli esemplari dell’unità scelta entro l’ambito della ricerca. Si indica con N.
  • Proprietà: insieme delle caratteristiche delle unità studiate.
  • Stati: i differenti modi in cui una proprietà può presentarsi.
  • Unità d’analisi: oggetto sociale studiato, il referente su cui si raccolgono informazioni; può essere costituita dall’individuo, dalla famiglia, dal comune, dall’evento ecc.
  • Valori: simboli assegnati alle modalità.
  • Variabile: proprietà operativizzata, cioè rilevata sui casi attraverso una certa procedura detta “definizione operativa”.
  • Variabili dicotomiche (dicotomìe): variabili con due modalità.
  • Variabili politomiche: variabili a più di due modalità.
  • Vettore: sequenza ordinata di informazioni relative allo stesso referente.

I materiali di supporto della lezione

Marradi A. (1995), L'analisi monovariata, Franco Angeli, Milano.

Corbetta P.G. (1999), Metodologia e tecniche della ricerca sociale, il Mulino, Bologna.

  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion

Fatal error: Call to undefined function federicaDebug() in /usr/local/apache/htdocs/html/footer.php on line 93