Quando si intende descrivere la relazione tra:
si ricorre, come nel caso delle relazioni tra dicotomie, alle tabelle di contingenza.
In questi casi
Ovvero
Come si è detto in precedenza, ogni cella contiene quattro tipi di informazioni:
Si definisce frequenza attesa la frequenza che si otterrebbe in caso di indipendenza tra le variabili.
Essa è data dal prodotto dei marginali (di riga e di colonna) corrispondenti, diviso il numero totale dei casi: (vedi figura).
Dove:
Gli scarti tra le frequenze attese e le frequenze osservate si bilanciano.
Uno scarto di + n tra fe e fo in una cella comporta:
Per stabilire se tra due variabili categoriali c’è associazione è possibile procedere confrontando le frequenze empiriche (cioè le frequenze osservate o fo) con le frequenze attese (fe).
Se fo = fe .
X e Y sono indipendenti
se fo ≠ fe .
X e Y sono associati
fo < fe associazione negativa
fo > fe associazione positiva
In generale: più gli scarti (la differenza tra Fo ed Fe) sono alti più c’è associazione tra le due variabili.
… è possibile:
1. Confrontare le frequenze attese e le frequenze osservate.
2. Confrontare le percentuali di riga di ciascuna cella con i marginali di colonna relativi alla cella considerata (e viceversa) con il metodo dello scarto dall’indipendenza.
È su quanto detto sinora che si basa il test di associazione, ossia il test del χ2 che è il test di significatività che si utilizza per sapere se c’è relazione tra due variabili categoriali.
È uno dei test di verifica delle ipotesi utilizzati in statistica per verificare se l’ipotesi nulla è probabilisticamente compatibile. Lo scopo del test del χ2 è quello di conoscere se le frequenze osservate differiscono significativamente dalle frequenze teoriche.
Per rilevare la significatività statistica …
H0 Ipotesi di indipendenza tra X e Y
H1 Ipotesi di dipendenza tra X e Y
0ssia
Per poter accettare χ2 è necessario calcolare la probabilità (p)che il valore assunto da esso non sia dovuto al caso (errore). χ2 è significativo (c’è relazione, ossia si accetta l’ipotesi H1) se p < 0,05 (5%)
calcolo di p
gl = (n righe -1) (n colonne – 1).
si consulta la tavola del χ2 per controllare la probabilità p
se p < 0,05 …….. H0 si rifiuta ………..dipendenza tra X e Y
se p > 0,05 …….. H0 si accetta…….. indipendenza tra X e Y
Per misurare la forza della relazione esistente tra due variabili categoriali si ricorre ad una serie di coefficienti basati sul X2
Tali coefficienti informano sulla forza dell’associazione ma non dicono nulla sui legami fra le specifiche categorie dai quali tale associazione dipende.
Sono Quattro:
Caratteristiche
Come Chi-quadro, non hanno un range di variazione, il valore minimo è 0 (assenza di relazione).
Riduzione proporzionale dell’errore (PRE) nel predire Y conoscendo X rispetto all’errore che si farebbe se non si conoscesse il valore di X.
Ossia:
Le misure sono due:
Le formule delle due misure di associazione sono abbastanza complesse. Dal momento che solitamente il calcolo viene effettuato dai software di analisi dei dati, qui verrà esposto solo il criterio di interpretazione del valore, tramite un esempio.
Non esistono delle rappresentazioni grafiche adeguate per la relazione di due variabili che non siano ordinate.
La rappresentazione più adatta non è realizzabile con i software attualmente diffusi, in quanto consiste nella trasposizione della tavola di contingenza in uno spazio tridimensionale.
Se invece almeno una delle due variabili è ordinale si può ricorrere a:
2. Metodo scientifico e ricerca sociale
3. Le fasi della ricerca sociale
4. Tipi di proprietà e tipi di variabili
5. Le variabili
7. Esercitazione: le variabili
8. L'autonomia semantica delle categorie di risposta
9. Introduzione all'analisi delle variabili
10. L'analisi dei dati con variabili categoriali non ordinate
11. Introduzione all'analisi delle distribuzioni di dati con variab...
12. L'analisi dei dati con variabili categoriali ordinate
13. Introduzione all'analisi dei dati con variabili cardinali
14. L'analisi dei dati con variabili cardinali
15. Lo studio della concentrazione di una variabile cardinale trasf...
16. La curva normale
17. Trasformazioni delle variabili: standardizzazione e deflazione
18. La trasformazione delle variabili
19. Rapporti statistici, serie storiche e territoriali
22. La relazione tra due variabili dicotomiche
23. La relazione tra due variabili con categorie non ordinate - pri...
24. La relazione tra due variabili con categorie non ordinate - sec...
25. Relazione tra una variabile categoriale e una cardinale
26. Il diagramma di dispersione
27. Introduzione all'analisi della relazione tra due variabili card...
28. La relazione tra due variabili cardinali
29. Introduzione all'analisi trivariata
30. Esercitazione: tipi di variabili
Corbetta P. G., La ricerca sociale: metodologia e tecniche- L'analisi dei dati, Bologna, Il mulino, 2003.
Marradi A., 1997, Linee guida per l'analisi bivariata dei dati nelle scienze sociali, Franco Angeli, Milano.