Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D Le Miniguide all'orientamento Gli eBook di Federica La Corte in Rete
 
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Massimo Aria » 6.Forma di una distribuzione statistica


Standardizzazione di una variabile

Standardizzare una variabile statistica significa trasformare la distribuzione originaria in una distribuzione espressa in una unità di misura standard, che non risenta dell’effetto scala di misura e dell’effetto media.

Variabile standardizzata

Una variabile standardizzata Z si ottiene sottraendo a tutti i valori la media e rapportando gli scarti così ottenuti allo SQM.

Applicazioni:
Quando si vogliono confrontare distribuzioni di variabili misurate con diverse scale di misura
Quando si vogliono confrontare distribuzioni di variabili misurate nella stessa scala di misura ma che hanno diversa intensità media.

Processo di standardizzazione

Variabile standardizzata

X=x_1, x_2, x_3, ..., x_N \Longrightarrow Z=Z(X)

Z(X)=\frac{X-\mu}\sigma

\begin{tabular}{|c|c|} \hline   X & Z=Z(X)\\ \hline $x_1$& $\frac{x_1-\mu}\sigma = z_1$ \\[2ex]\hline $x_2$& $\frac{x_2-\mu}\sigma = z_2$ \\ [2ex]\hline $x_3$& $\frac{x_3-\mu}\sigma = z_3$ \\ [2ex] \hline \end{tabular}

Standardizzazione di una variabile

Proprietà della variabile standardizzata

\mu_z=0\hspace{2cm}\begin{array}{lll}\mu_z=\frac 1 N\sum z_l=\frac 1 N\frac 1{\sigma_X}\sum (x_l-\mu_X)=\\ \\ \frac 0{N\sigma_X}=0\end{array}

\sigma_X^2=1\hspace{2cm}\begin{array}{lll}\sigma_Z^2=\frac 1 N\sum z^2_l=\frac 1 N\sum_l\left({\frac{x_l-\mu_X}{\sigma_X}}\right)^2= \\ \\ \frac 1 N\frac 1{\sigma_X^2}\sum(x_l-\mu_X)^2=\frac 1 {\sigma_X^2}\sigma_X^2=1\end{array}

Interpretazione dell’unità di misura standard

Una volta standardizzata, la variabile sarà espressa in una nuova unità di misura cosiddetta standard.
I valori della Z possono essere interpretati come scostamenti dalla media in termini di «sigmesimi», cioè di uno scostamento dalla media di z volte sigma.

Per cui, ad esempio, se l’i-esima osservazione avrà valore standardizzato pari a 2 ciò significa che il suo valore originario della X è più alto della media di una quantità pari a due volte lo scarto quadratico medio.

Al contrario, se il j-esimo individuo avrà valore z pari a -1,5 allora il valore della X è più basso della media di uno scostamento pari ad una volta e mezzo lo sqm.

Forma di una distribuzione di frequenza

La posizione e la variabilità di una distribuzione di frequenza non esauriscono le informazioni contenute nei dati.

Due variabili statistiche possono avere la stessa posizione e la stessa variabilità ma differire per il peso dei valori che si trovano sulle code, cioè quelli che assumono misure molto distanti dalla media.

Nella statistica descrittiva si definiscono alcune misure concernenti la forma di una distribuzione e che vanno sotto il nome di asimmetria e curtosi.

Esempi di forma


Forma normale di una distribuzione

Molti fenomeni assumono un forma cosiddetta normale.

Normale è una distribuzione che:

  • presenta con una forma campanulare e simmetrica rispetto alla posizione centrale
  • gli indici di posizione assumono uguale valore (Media=Mediana=Moda)

Si dice simmetrica invece una forma che, rispetto alla posizione centrale assume uguale struttura delle frequenze sia nella parte destra che nella sinistra:

f(Me-c)=f(Me+c)

(la frequenza è la stessa sia per la modalità “Mediana meno una costante” sia per quella “Mediana più una costante”, qualunque sia la costante)

NB. Una normale è una particolare distribuzione simmetrica.
Una distribuzione simmetrica potrebbe non essere normale.


Esempi di forme simmetriche


Asimmetria di una distribuzione

Si dice asimmetrica una distribuzione la cui forma non si presenta speculare rispetto alla posizione centrale.

Si parla di:

  • asimmetria positiva quando la forma è caratterizzata da una coda allungata verso destra
  • asimmetria negativa quando la forma è caratterizzata da una coda allungata verso sinistra

Un metodo empirico per individuare la presenza di asimmetria è quello di confrontare gli indici di posizione della distribuzione considerata.


Indice normalizzato di asimmetria

Un semplice indice di asimmetria si ottiene mediante la differenza tra media e mediana rapportata allo SQM che si dimostra essere il massimo di questo scarto.

Esso è un indice normalizzato in quanto, essendo rapportato al proprio massimo, varia in valore assoluto tra 0 e 1 a prescindere dall’unità di misura della variabile originaria.

Indice normalizzato di asimmetria

A=\frac{\mu-M_e}\sigma

\text{poiche}' |\mu-M_e|\leq \sigma\Rightarrow -1\leq A\leq 1

A< 0 \Rightarrow \text{ asimmetria negativa}

A=0\Rightarrow \text{ simmetria}

A> 0\Rightarrow \text{ asimmetria positiva}

Indice di asimmetria di Fisher

Un ulteriore indice di asimmetria, proposto da Fisher, è definito come la media aritmetica delle terze potenze della variabile standardizzata Z.

Questo indice è positivo, negativo o nullo rispettivamente per una distribuzione asimmetrica positiva, negativo o simmetrica.

L’indice di Fisher non è normalizzato, per cui assume valori in tutto l’asse dei numeri reali.

Indice di asimmetria di Fisher

\gamma_1=\frac 1 N\sum\left(\frac{x_l-\mu}\sigma\right)^3

\text{puo}'\text{ assumere valori tra }+\infty \text{ e }-\infty

\gamma < 0 \Rightarrow \text{ asimmetria negativa}

\gamma = 0 \Rightarrow \text{ simmetria}

\gamma > 0 \Rightarrow \text { asimmetria positiva}

Curtosi di una distribuzioni

Un altro aspetto della forma di una distribuzione di frequenza è la curtosi.

Essa riguarda lo studio del maggiore o minore appuntimento, e conseguentemente, il maggiore o minor peso delle code rispetto alla parte centrale della forma.

Indice di curtosi di Pearson

L’indice di curtosi di Pearson misura la curtosi come media aritmetica delle quarte potenze della variabile standardizzata Z.

Questo indice assume valore pari a 3 nel caso in cui la distribuzione assuma una forma normale.

Quando la distribuzione ha una forma maggiormente appuntita rispetto alla normale si parla di forma leptocurtica e l’indice sarà > 3.

Quando la distribuzione ha una forma meno appuntita rispetto alla normale si parla di forma platicurtica e l’indice sarà < 3. Sottraendo la costante 3 all’indice di Pearson si ottiene una versione centrata rispetto alla distribuzione normale:

indice = 0 → forma normale

indice > 0 → forma leptocurtica
indice < 0 → forma platicurtica


Esempio applicativo degli indici di forma


Nella prossima lezione

Nella prossima lezione si affronteranno i seguenti argomenti:

  • distribuzioni doppie di frequenza
  • profili riga e di colonna
  • distribuzioni condizionate
  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion