Per analizzare le distribuzioni di dati in categorie non ordinate è possibile ricorrere:
Misure di tendenza centrale → Moda
Misure di dispersione → Indice di Galtung (1967)
Misure di variabilità → Indici di equilibrio/squilibrio
Il valore di tendenza centrale delle distribuzioni di dati in categorie non ordinate è la MODA.
La moda è la categoria con frequenza (o percentuale) più alta ovvero È la modalità prevalente (con la frequenza più alta) nella distribuzione
Una distribuzione può presentare più mode: se ce ne sono due, viene detta bimodale; se ve ne sono più di due viene detta multimodale
Distribuzione unimodale centrale
La moda cade nella categoria centrale, mentre le altre frequenze declinano gradatamente
dall’uno all’altro lato del valore centrale
Distribuzione unimodale
La moda coincide con un valore estremo della distribuzione e le altre frequenze declinano gradatamente fino all’altro estremo
Distribuzione bimodale
Le frequenze declinano da un estremo all’altro fino ai valori centrali e poi tornano a crescere andando verso l’altro estremo
Distribuzione trimodale
Distribuzioni con una moda centrale ed una in ciascuno dei valori estremi
K = numero delle categorie
Pm = proporzione dei casi nella categoria modale
K-1 = Gradi di libertà*
Pm varia da 1 a 1/k
1 = dispersione minima (i casi ricadono nella categoria modale) →I = 0
1/k = dispersione massima (i casi si equidistribuiscono tra tutte le modalità) →I= 1
Svantaggi
Rileva esclusivamente il rapporto tra la frequenza modale ed il totale dei dati, non rileva in alcun modo il grado di equilibrio/squilibrio dei dati fra le categorie non modali.
*i gradi di libertà rappresentano il numero di possibilità che i dati che compongono un campione hanno di variare liberamente. In generale si calcolano togliendo dal numero delle unità del campione il numero delle condizioni cui essi sono vincolati. Es.: dati n numeri positivi e negativi, ciascuno dei quali può assumere un valore qualsiasi ed un vincolo, ad esempio la somma deve essere 100, si può assegnare un valore qualsiasi ai primi n-1 numeri, ma l’ultimo sarà vincolato dal fatto che la somma deve essere 100, quindi in questo caso, i gradi di libertà sono n-1.
Gli indici di equilibrio/squilibrio rilevano l’equilibrio / squilibrio tra le frequenze di tutte le categorie, ovvero come si distribuiscono le frequenze di ciascuna modalità dell’intera distribuzione.
Si basano sulla probabilità (proporzione) che, data una certa distribuzione, gli stati di due casi diversi siano assegnati alla stessa modalità. (Marradi A., 195, P.58).
Pj = Proporzione (probabilità) dei casi che cadono nella categoria j-esima
Assunto di base: La probabilità che due dati di una distribuzione appartengono alla stessa categoria j = alla proporzione tra le frequenze di ciascuna categoria ed il totale dei casi elevata al quadrato.
INTERPRETAZIONE:
Massimo squilibrio Sq=1 i dati appartengono ad una sola modalità
Minimo squilibrio Sq= 1/k i dati si equidistribuiscono tra modalità
L’indice di Equilibrio rileva se e quanto i dati si distribuiscono in modo equilibrato tra le modalità.
Assunto di base: probabilità che due dati di una distribuzione NON appartengono alla stessa categoria j = alla proporzione tra le frequenze di ciascuna categoria ed il totale dei casi elevata al quadrato.
Se il massimo assunto da Sq=1, per poter ricavare Eq è sufficiente calcolare il complemento ad 1 di Sq.
INTERPRETAZIONE:
Massimo squilibrio Eq=1 i dati appartengono ad una sola modalità
Minimo squilibrio Eq= 1/k i dati si equidistribuiscono tra modalità
Gli indici di equilibrio e squilibrio sono caratterizzati da tre elementi principali.
Gli indici di equilibrio/squilibrio sono sensibili al numero delle categorie, specie sul valore minimo. Per annullare l’effetto del numero delle categorie si procede ad una normalizzazione che trasforma gli indici in indici relativi (variano tra 0 ed 1)
OVVERO
Si pone Sq in rapporto con il suo minimo (1/K) ed il suo massimo (1)
INTERPRETAZIONE:
Sqnorm = 1 Massimo Squilibrio i dati appartengono ad una modalità.
Sqnorm = 0 Minimo Squilibrio i dati si equidistribuiscono tra le modalità
Per ricavare l’indice relativo di Equilibrio normalizzato, è sufficiente calcolare il complemento ad 1 dell’indice relativo Sq
OVVERO
Sottrarre ad 1 Sq
INTERPRETAZIONE:
Eqnorm = 1 Massimo Equilibrio (i dati si equidistribuiscono)
Eqnorm = 0 Minimo Equilibrio (i dati si concentrano in una mod.)
INTERPRETAZIONE:
H=0 massimo squilibrio
H=1 minimo squilibrio
se la variabile è dicotomica 0<1
se la variabile non è dicotomica H può assumere anche valori superiori ad 1
M = 1/k massimo equilibrio
M= 1 massimo squilibrio
Note
2. Metodo scientifico e ricerca sociale
3. Le fasi della ricerca sociale
4. Tipi di proprietà e tipi di variabili
5. Le variabili
7. Esercitazione: le variabili
8. L'autonomia semantica delle categorie di risposta
9. Introduzione all'analisi delle variabili
10. L'analisi dei dati con variabili categoriali non ordinate
11. Introduzione all'analisi delle distribuzioni di dati con variab...
12. L'analisi dei dati con variabili categoriali ordinate
13. Introduzione all'analisi dei dati con variabili cardinali
14. L'analisi dei dati con variabili cardinali
15. Lo studio della concentrazione di una variabile cardinale trasf...
16. La curva normale
17. Trasformazioni delle variabili: standardizzazione e deflazione
18. La trasformazione delle variabili
19. Rapporti statistici, serie storiche e territoriali
22. La relazione tra due variabili dicotomiche
23. La relazione tra due variabili con categorie non ordinate - pri...
24. La relazione tra due variabili con categorie non ordinate - sec...
25. Relazione tra una variabile categoriale e una cardinale
26. Il diagramma di dispersione
27. Introduzione all'analisi della relazione tra due variabili card...
28. La relazione tra due variabili cardinali
29. Introduzione all'analisi trivariata
30. Esercitazione: tipi di variabili
Marradi A., L'analisi monovariata, Milano, Franco Angeli, 1995.
Marradi A., Linee guida per l'analisi bivariata dei dati nelle scienze sociali, Milano, Franco Angeli, 1997.
Corbetta P., La ricerca sociale: metodologia e tecniche, vol. IV, Bologna, Il Mulino, 2003.