Due sono i presupposti che devono esserci per applicare l’Analysis of Variation (ANOVA):
Le fasi per valutare se esiste o meno associazione tra due variabili (l’ indipendente categoriale e la dipendente cardinale) sono tre:
Consideriamo
Per valutare l’associazione è necessario:
Vediamo ora nel dettaglio i passaggi che ci consentono di effettuare un’ANOVA.
Riprendendo l’esempio di prima.
Si ipotizza che la residenza (X) influenza il reddito (Y).
Il reddito del caso i residente nella regione j si può esprimere: Scarto del reddito di i dal reddito (figura 1).
Questo scarto è scomponibile in due parti:
Si calcolano i valori (mediana ecc).
Sull’asse delle X (o delle Y) i valori della mediana, di Q1, Q3, ecc.
Il primo e terzo quartile costituiscono gli estremi della scatola del box plot la cui lunghezza è quindi rappresentata dalla differenza interquartile.
La linea orizzontale all’interno della scatola indica la mediana, per cui a seconda di quanto questa sarà posizionata centralmente si individueranno distribuzione più o meno simmetriche.
Le due linee esterne fuori dalla scatola sono anche dette baffi e sono delimitati, rispettivamente, dai valori minimo e massimo della distribuzione. Un baffo eccessivamente lungo indica la presenza di valori anomali.
Dal grafico si evince che solo l’ultima distribuzione presenta maggiore simmetria, per cui la media aritmetica è approssimativamente uguale alla mediana, rappresentata dal triangolino in giallo.
Quantifica, in %, la proporzione di devianza generale che è attribuita alla (cioè spiegata dalla) variabile indipendente (variabile categoriale).
In altri termini: È un coefficiente PRE ovvero consente di calcolare quanto migliora la capacità di predire i punteggi di un qualsiasi caso sulla variabile cardinale quando si conosce l’appartenenza di quel caso all’una o all’altra categoria (gruppo) della variabile categoriale e la media della variabile cardinale di ciascun gruppo.
L’eta quadro si interpreta allo stesso modo di R2
NB: Si considera interessante Eta-quadro ≥ 0,10; raramente Eta quadro ≤ 0,30.
Anche se Eta-quadro ≤ 0,10 non è detto che la relazione non sia interessante; infatti per valutare la foza della relazione è bene sempre far riferimento anche alle differenze fra le medie dei gruppi e ai valori caratteristici della distribuzione di ciascun gruppo.
Per stabilire la significatività statistica della relazione si pongono due ipotesi
L’ANOVA è tra le tecniche di analisi causale più importante.
Il pregio maggiore dell’analisi della varianza è che pone in relazione una variabile cardinale non più con un’altra variabile cardinale (entrambe pensate sempre come rappresentazione di proprietà continue; Ricolfi, 2002), ma con una variabile categoriale.
Fu Fisher (1935) attraverso i disegni sperimentali che introdusse un metodo per spiegare la relazione tra una variabile dipendente cardinale mediante una o più variabili indipendenti categoriali.
Il limite di questa tecnica di analisi risiede nell’età quadro: questo coefficiente misura SOLO l’intensità della relazione e non la direzione.
Per stabilire la direzione è necessario ricorrere alle ipotesi che vanno poi corroborate. Ad esempio: la regione di residenza influenza il reddito.
Inoltre, l’ANOVA non spiega ma riproduce; la spiegazione è, dunque, successiva
2. Metodo scientifico e ricerca sociale
3. Le fasi della ricerca sociale
4. Tipi di proprietà e tipi di variabili
5. Le variabili
7. Esercitazione: le variabili
8. L'autonomia semantica delle categorie di risposta
9. Introduzione all'analisi delle variabili
10. L'analisi dei dati con variabili categoriali non ordinate
11. Introduzione all'analisi delle distribuzioni di dati con variab...
12. L'analisi dei dati con variabili categoriali ordinate
13. Introduzione all'analisi dei dati con variabili cardinali
14. L'analisi dei dati con variabili cardinali
15. Lo studio della concentrazione di una variabile cardinale trasf...
16. La curva normale
17. Trasformazioni delle variabili: standardizzazione e deflazione
18. La trasformazione delle variabili
19. Rapporti statistici, serie storiche e territoriali
22. La relazione tra due variabili dicotomiche
23. La relazione tra due variabili con categorie non ordinate - pri...
24. La relazione tra due variabili con categorie non ordinate - sec...
25. Relazione tra una variabile categoriale e una cardinale
26. Il diagramma di dispersione
27. Introduzione all'analisi della relazione tra due variabili card...
28. La relazione tra due variabili cardinali
29. Introduzione all'analisi trivariata
30. Esercitazione: tipi di variabili
Corbetta P. G., La ricerca sociale: metodologia e tecniche- L'analisi dei dati, Bologna, Il mulino, 2003.
Marradi A., 1997, Linee guida per l'analisi bivariata dei dati nelle scienze sociali, Franco Angeli, Milano.
Iodice C., Compendio di statistica, vol. 43/1, Edizioni Simone 2002.
Tukey J.W., Exploratory Data Analysis, Addison-Wesley, Reading, Massachusetts,USA, 1977