Quando si intende confrontare distribuzioni di dati di variabili cardinali:
si ricorre alla standardizzazione ovvero all’operazione di trasformazione delle unità di misura (o di conto) delle variabili che si intendono confrontare in un’unità di misura comune.
Attraverso la standardizzazione è possibile rendere confrontabili variabili identiche appartenenti a distribuzioni diverse e variabili diverse, o variabili espresse in unità di misura diverse.
È una doppia normalizzazione:
z = distribuzione dei punti standard calcolati a partire da tutti i punti della variabile x;
xi = caso di cui si vuole calcolare il punto z;
sx = lo scarto tipo della distribuzione del carattere x.
Nota
Le distribuzioni fortemente asimmetriche comportano conseguenze negative in sede di analisi bi e multivariata. È possibile ‘correggere’ l’asimmetria sostituendo ad ogni valore la sua radice quadrata o un suo logaritmo.
Figura 1: Media, scarto-tipo e varianza delle distribuzioni A e P
Figura 2: Rappresentazione grafica delle distribuzioni A e P
Quanto detto sin qui è facilmente dimostrabile facendo ricorso alle rappresentazioni grafiche della distribuzione di una variabile e della corrispettiva distribuzione standardizzata.
Immaginiamo di aver rilevato i voti conseguiti in italiano da sette studenti delle scuole medie superiori di un istituto privato (distribuzione A) e di volerli confrontare con quelli conseguiti nella stessa materia da una classe composta da 12 studenti di una scuola superiore pubblica (distribuzione P).
Procediamo alla standardizzazione:
I Normalizzazione: trasformazione dei dati negli scarti dalla media (traslazione delle distribuzioni, la cui forma rimane identica, da una posizione attorno alla media effettiva di quella distribuzione a una posizione attorno a una media 0).
Si passa così da A ad A’ e da P a P’.
II Normalizzazione: divisione degli scarti dalla media di ogni distribuzione per il suo scarto tipo.
La distribuzione P’ (platicurtica), tenderà a comprimersi trasformandosi nella Z(P), perché il suo scarto tipo sarà minore dello scarto tipo di partenza, come è illustrato.
La distribuzione A’ (leptocurtica), tenderà a dilatarsi trasformandosi in Z (A) poiché il suo scarto tipo sarà maggiore dello scarto tipo di partenza.
Come si è detto, la standardizzazione rende confrontabili dati appartenenti a variabili diverse; per questo motivo essa è un’operazione necessaria per costruire indici con criteri additivi.
Ad esempio, diviene necessaria qualora si intendono costruire degli indici attraverso i punteggi ottenuti su scale di atteggiamento differenti (Likert, Guttman, auto-ancoranti – Lez. 18).
La deflazione è una procedura di trasformazione dei punteggi di ciascun caso che si applica quando vengono utilizzate batterie di domande somministrate con una tecnica autoancorante o autografica. La sua funzione consiste nel mettere in luce il fatto che i soggetti possono percepire il segmento orientato (continuum) su cui si chiede loro di rispondere in modo differente:
→ alcuni tendono ad utilizzare punteggi troppo alti, altri quelli troppo bassi;
→ alcuni tendono ad utilizzare l’arco dei punteggi, altri esclusivamente i punteggi centrali.
Come la standardizzazione, si compone di due normalizzazioni:
I normalizzazione: considera la tendenza di ciascun soggetto ad attribuire punteggi troppo alti o troppo bassi. Se il numero dei punteggi forniti soggetti è sufficientemente ampio e comprendente una gamma di temi differenziata, la media dei punteggi può essere considerata una ragionevole stima della tendenza di ciascun individuo a fornire punteggi alti o bassi; si sottrae quindi a ciascun punteggio di ogni soggetto la media dei suoi punteggi.
II normalizzazione: considera la tendenza dei soggetti ad usare un arco più o meno ampio di punteggi.
Ciò di cui si tiene conto è, cioè, la dispersione dei punteggi di ciascun soggetto dalla sua media, in questo caso lo scarto tipo può essere pensato come il valore che fornisce una indicazione di tale dispersione.
Per questo motivo, si divide l’esito della I normalizzazione per lo scarto tipo dei punteggi del soggetto, in questo modo si assume che le risposte degli intervistati siano riconducibili a “stili” personali differenti e non ad una scelta consapevole, cioè come specifica reazione allo stimolo. Per poter procedere alla II normalizzazione è, però, necessario che il numero e la varietà degli stimoli sia elevato.
Due sono le principali differenze tra standardizzazione e deflazione:
2. Metodo scientifico e ricerca sociale
3. Le fasi della ricerca sociale
4. Tipi di proprietà e tipi di variabili
5. Le variabili
7. Esercitazione: le variabili
8. L'autonomia semantica delle categorie di risposta
9. Introduzione all'analisi delle variabili
10. L'analisi dei dati con variabili categoriali non ordinate
11. Introduzione all'analisi delle distribuzioni di dati con variab...
12. L'analisi dei dati con variabili categoriali ordinate
13. Introduzione all'analisi dei dati con variabili cardinali
14. L'analisi dei dati con variabili cardinali
15. Lo studio della concentrazione di una variabile cardinale trasf...
16. La curva normale
17. Trasformazioni delle variabili: standardizzazione e deflazione
18. La trasformazione delle variabili
19. Rapporti statistici, serie storiche e territoriali
22. La relazione tra due variabili dicotomiche
23. La relazione tra due variabili con categorie non ordinate - pri...
24. La relazione tra due variabili con categorie non ordinate - sec...
25. Relazione tra una variabile categoriale e una cardinale
26. Il diagramma di dispersione
27. Introduzione all'analisi della relazione tra due variabili card...
28. La relazione tra due variabili cardinali
29. Introduzione all'analisi trivariata
30. Esercitazione: tipi di variabili
Gini C., 1912, Variabilità e mutabilità, Ristampato in Memorie di metodologica statistica (Ed. Pizetti E, Salvemini, T), Roma, Libreria Eredi Virgilio Veschi (1955).
Gini C., 1921, Measurement of Inequality and Incomes, The Economic Journal, 31: 124-126.