Le singole categorie delle variabili cardinali
non hanno alcuna autonomia semantica
↓
Diviene, quindi rilevante, l’andamento globale dell’intera distribuzione.
È comunque possibile ottenere una distribuzione con un numero molto alto di modalità.
I valori caratteristici delle distribuzioni di dati con variabili cardinali devono tener conto:
Possiamo ritenere che tutti i valori caratteristici che concernono esclusivamente le variabili cardinali sono valori sintetici, in quanto sono determinati sulla base delle frequenze di tutte le modalità e del valore cardinale delle relative etichette numeriche.
I valori caratteristici delle variabili cardinali si distinguono in:
Le misure di tendenza centrale che si possono applicare alle variabili cardinali sono anche quelle che si applicano alle variabili categoriali.
Questo perché – come detto nelle precedenti lezioni – le tecniche d’analisi che si possono applicare alle variabili sono cumulative:
La moda rappresenta la categoria con la frequenza più alta.
Esempio: si voglia calcolare la moda nella distribuzione di frequenza della variabile età di una classe di primo anno del liceo.
La mediana di una distribuzione è la modalità del caso che lascia dietro di sé il 50% della distribuzione.
Se N è dispari c’è un unico caso centrale:
Se N è pari ci sono due casi centrali che potrebbero generare una distribuzione bimodale qualora i due casi ricadessero in due categorie differenti e la formula è la seguente:
Calcolo della mediana a partire dalle frequenze (tabella A)
N = 22 (pari)
mediana = 22/2 = 11°
mediana = 22/2+1 = 12°
La Md è costituita dai casi che occupano l’11° e il 12° posto nella sequenza ordinata delle frequenze, cioè è 15.
Calcolo della mediana a partire dai casi (tabella B)
N = 4 (pari)
mediana = 4/2 = 2°
mediana = 4/2+1 = 3°
La Md è costituita dai casi che occupano il 2° e il 3°posto nella sequenza ordinata dei casi, cioè cade tra Caio e Tizio (15 e 16 anni).
Con lo stesso criterio è possibile individuare anche i QUANTILI.
(decili, quartili e percentili-cfr lezione n.12).
La media è il valore che rappresenta la ripartizione di una variabile cardinale tra le unità del collettivo. Si ottiene sommando i valori di tutte le osservazioni presenti nel collettivo e dividendo il totale così ottenuto per il numero di osservazioni.
Esempio: Si voglia calcolare l’età media di un nucleo familiare composto da 5 membri.
Quando i dati sono organizzati in una distribuzione di frequenza oppure sono raggruppati in classi, ciascuna frequenza rappresenta il “peso” di ciascun valore Xi; in questi casi per individuare la media è necessario ponderare pesare (ponderare) le Xi associate a ciascuna frequenza.
In questi casi si parla di media ponderata
Dove:
n = numero dei valori distinti di Xi
fi = frequenza (peso) di ciascun valore Xi
Esempio 1:
Si voglia calcolare la media ponderata dei voti riportati da 40 studenti all’esame di Tecniche di ricerca sociale (N=40).
Esempio: Si voglia calcolare la media ponderata dei voti riportati all'esame di maturità da alcuni studenti.
Altra misura di tendenza centrale che possiamo applicare alle variabili cardinali è il midrange.
Midrange= (valore minimo + valore massimo)/2
A cosa serve?
Questo valore sintetico ci permette di valutare rapidamente il grado di asimmetria di una distribuzione.
Se la mediana<midrange allora l’asimmetria sarà positiva.
Se la mediana>midrange allora l’asimmetria sarà negativa.
Calcolo del Midrange nella distribuzione A
Valore max= 29;
Valore min = 25
Midrange=(25 + 29)/2=27 anni
Calcolo del Midrange nella distribuzione B
Valore max= 29;
Valore min = 25
Midrange=(25 + 29)/2=27 anni
Esempio: Le due distribuzioni rappresentate di seguito hanno la stessa media ma dispersioni diverse: la prima è certamente meno dispersa rispetto alla seconda.
I valori di dispersione rilevano quanto la distribuzione è dispersa dai valori centrali.
Scarto dalla media
dove xi è una forma contratta per indicare lo scarto dalla media.
Lo scarto, detto anche scostamento o deviation rappresenta la distanza di un valore dalla media aritmetica della distribuzione.
Se Xi > X lo scarto avrà segno positivo
Se Xi < X lo scarto avrà segno negativo.
La somma degli scarti dalla media è sempre UGUALE a 0.
|val.min-val.max|
Calcolo del Range nella distribuzione A (N=5)
Valore max= 29;
Valore min = 25
IV= |25 – 29| = 4 anni
Calcolo del Range nella distribuzione B (N=100)
Valore max= 40;
Valore min = 10
IV= |25-29| = 4 anni
|CV = Valmax – Valmin|
Indica l’intervallo di valori entro cui è raccolta la distribuzione di frequenza.
Calcolo del Range nella distribuzione A
Valore max= 29;
Valore min = 25
Range= 29 – 25 = 4 anni
Calcolo del Range nella distribuzione B
Valore max= 29
Valore min = 25
Range= 29 – 25 = 4 anni
5. Lo Scarto (medio) interquartile (Galton).
Lo scarto interquartile detto anche quartile deviation rappresenta la metà della differenza tra il primo e il terzo quartile.
6. Le Differenze medie assolute (Leti,1983)
dove i=I caso h=II caso
7. Differenza semplice media (Gini, 1955)
Nelle prossime lezioni (Lez. 14) si tratteranno gli indici sintetici.
2. Metodo scientifico e ricerca sociale
3. Le fasi della ricerca sociale
4. Tipi di proprietà e tipi di variabili
5. Le variabili
7. Esercitazione: le variabili
8. L'autonomia semantica delle categorie di risposta
9. Introduzione all'analisi delle variabili
10. L'analisi dei dati con variabili categoriali non ordinate
11. Introduzione all'analisi delle distribuzioni di dati con variab...
12. L'analisi dei dati con variabili categoriali ordinate
13. Introduzione all'analisi dei dati con variabili cardinali
14. L'analisi dei dati con variabili cardinali
15. Lo studio della concentrazione di una variabile cardinale trasf...
16. La curva normale
17. Trasformazioni delle variabili: standardizzazione e deflazione
18. La trasformazione delle variabili
19. Rapporti statistici, serie storiche e territoriali
22. La relazione tra due variabili dicotomiche
23. La relazione tra due variabili con categorie non ordinate - pri...
24. La relazione tra due variabili con categorie non ordinate - sec...
25. Relazione tra una variabile categoriale e una cardinale
26. Il diagramma di dispersione
27. Introduzione all'analisi della relazione tra due variabili card...
28. La relazione tra due variabili cardinali
29. Introduzione all'analisi trivariata
30. Esercitazione: tipi di variabili
Marradi A., L'analisi Monovariata, Milano, Franco Angeli, 1993
Galton F., Statistics by Intercomparison, in "Philos. Mag.", serie IV, 49, pp 33-46, 1875
Leti G., Statistica Descrittiva, Il Mulino, Bologna, 1983