Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D Le Miniguide all'orientamento Gli eBook di Federica La Corte in Rete
 
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Amalia Caputo » 17.Trasformazioni delle variabili: standardizzazione e deflazione


Perché si standardizza?

Quando si intende confrontare distribuzioni di dati di variabili cardinali:

  • uguali, ma rilevate con unità di misura differenti
  • diverse

si ricorre alla standardizzazione ovvero all’operazione di trasformazione delle unità di misura (o di conto) delle variabili che si intendono confrontare in un’unità di misura comune.

Attraverso la standardizzazione è possibile rendere confrontabili variabili identiche appartenenti a distribuzioni diverse e variabili diverse, o variabili espresse in unità di misura diverse.

Che cosa è la standardizzazione?

È una doppia normalizzazione:

  1. ogni dato è trasformato nel suo scarto dalla media della distribuzione (prima normalizzazione);
  2. il dato viene trasformato dall’unità di misura o di conto di quella variabile in unità del suo scarto-tipo s ovvero viene normalizzato per il miglior coefficiente sintetico (seconda normalizzazione). Si ricorre ad S perché – al pari dello scarto dalla media – è una grandezza lineare.

z = distribuzione dei punti standard calcolati a partire da tutti i punti della variabile x;
xi = caso di cui si vuole calcolare il punto z;
sx = lo scarto tipo della distribuzione del carattere x.

Scarto dalla media
Standard score – Punto standard sulla variabile X.
Distribuzione della variabile x standardizzata

Proprietà della distribuzione di una variabile standardizzata


Distribuzione di una variabile e distribuzione di una variabile standardizzata

Nota
Le distribuzioni fortemente asimmetriche comportano conseguenze negative in sede di analisi bi e multivariata. È possibile ‘correggere’ l’asimmetria sostituendo ad ogni valore la sua radice quadrata o un suo logaritmo.


Distribuzione di una variabile e distribuzione di una variabile standardizzata (segue)

Figura 1: Media, scarto-tipo e varianza delle distribuzioni A e P
Figura 2: Rappresentazione grafica delle distribuzioni A e P
Quanto detto sin qui è facilmente dimostrabile facendo ricorso alle rappresentazioni grafiche della distribuzione di una variabile e della corrispettiva distribuzione standardizzata.

Immaginiamo di aver rilevato i voti conseguiti in italiano da sette studenti delle scuole medie superiori di un istituto privato (distribuzione A) e di volerli confrontare con quelli conseguiti nella stessa materia da una classe composta da 12 studenti di una scuola superiore pubblica (distribuzione P).

  1. Le due distribuzioni hanno media uguale e differente varianza e scarto-tipo (Fig. 1).
  2. La distribuzione P è platicurtica, presenta una considerevole dispersione dei dati intorno alla media.
  3. La distribuzione A è leptocurtica, presenta una dispersione dei dati intorno alla media molto più limitata (Fig. 2).
Figura 1: Media, scarto-tipo e varianza delle distribuzioni A e P

Figura 1: Media, scarto-tipo e varianza delle distribuzioni A e P

Figura 2: Rappresentazione grafica delle distribuzioni A e P

Figura 2: Rappresentazione grafica delle distribuzioni A e P


Distribuzione di una variabile e distribuzione di una variabile standardizzata

(segue)

Procediamo alla standardizzazione:

I Normalizzazione: trasformazione dei dati negli scarti dalla media (traslazione delle distribuzioni, la cui forma rimane identica, da una posizione attorno alla media effettiva di quella distribuzione a una posizione attorno a una media 0).
Si passa così da A ad A’ e da P a P’.

II Normalizzazione: divisione degli scarti dalla media di ogni distribuzione per il suo scarto tipo.
La distribuzione P’ (platicurtica), tenderà a comprimersi trasformandosi nella Z(P), perché il suo scarto tipo sarà minore dello scarto tipo di partenza, come è illustrato.
La distribuzione A’ (leptocurtica), tenderà a dilatarsi trasformandosi in Z (A) poiché il suo scarto tipo sarà maggiore dello scarto tipo di partenza.

Rappresentazione grafica delle distribuzioni A e P I normalizzazione.

Rappresentazione grafica delle distribuzioni A e P I normalizzazione.

Rappresentazione grafica delle distribuzioni A e P II normalizzazione.

Rappresentazione grafica delle distribuzioni A e P II normalizzazione.


Standardizzazione: esempio (Marradi, 1995)


Alcune considerazioni sulla standardizzazione

Come si è detto, la standardizzazione rende confrontabili dati appartenenti a variabili diverse; per questo motivo essa è un’operazione necessaria per costruire indici con criteri additivi.

Ad esempio, diviene necessaria qualora si intendono costruire degli indici attraverso i punteggi ottenuti su scale di atteggiamento differenti (Likert, Guttman, auto-ancoranti – Lez. 18).

Deflazione

La deflazione è una procedura di trasformazione dei punteggi di ciascun caso che si applica quando vengono utilizzate batterie di domande somministrate con una tecnica autoancorante o autografica. La sua funzione consiste nel mettere in luce il fatto che i soggetti possono percepire il segmento orientato (continuum) su cui si chiede loro di rispondere in modo differente:

→ alcuni tendono ad utilizzare punteggi troppo alti, altri quelli troppo bassi;

→ alcuni tendono ad utilizzare l’arco dei punteggi, altri esclusivamente i punteggi centrali.

La procedura di deflazione

Come la standardizzazione, si compone di due normalizzazioni:

I normalizzazione: considera la tendenza di ciascun soggetto ad attribuire punteggi troppo alti o troppo bassi. Se il numero dei punteggi forniti soggetti è sufficientemente ampio e comprendente una gamma di temi differenziata, la media dei punteggi può essere considerata una ragionevole stima della tendenza di ciascun individuo a fornire punteggi alti o bassi; si sottrae quindi a ciascun punteggio di ogni soggetto la media dei suoi punteggi.

II normalizzazione: considera la tendenza dei soggetti ad usare un arco più o meno ampio di punteggi.
Ciò di cui si tiene conto è, cioè, la dispersione dei punteggi di ciascun soggetto dalla sua media, in questo caso lo scarto tipo può essere pensato come il valore che fornisce una indicazione di tale dispersione.
Per questo motivo, si divide l’esito della I normalizzazione per lo scarto tipo dei punteggi del soggetto, in questo modo si assume che le risposte degli intervistati siano riconducibili a “stili” personali differenti e non ad una scelta consapevole, cioè come specifica reazione allo stimolo. Per poter procedere alla II normalizzazione è, però, necessario che il numero e la varietà degli stimoli sia elevato.


Differenze tra standardizzazione e deflazione

Due sono le principali differenze tra standardizzazione e deflazione:

  1. la deflazione opera sulle righe della matrice dati, cioè sui punteggi dello stesso individuo su variabili diverse e trasforma esclusivamente quei valori che appartengono alla stessa batteria;
  2. la standardizzazione opera sulle colonne (variabili) della matrice dati, cioè sui punteggi di individui diversi sulla stessa variabile (colonna) e trasforma tutti i valori relativi a quel vettore, cioè i valori relativi a tutti i casi presenti nella matrice.

I materiali di supporto della lezione

Gini C., 1912, Variabilità e mutabilità, Ristampato in Memorie di metodologica statistica (Ed. Pizetti E, Salvemini, T), Roma, Libreria Eredi Virgilio Veschi (1955).

Gini C., 1921, Measurement of Inequality and Incomes, The Economic Journal, 31: 124-126.

  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion