Home

Federica EU

1/18

Amalia Caputo » 16.La curva normale

Definizione

La curva normale: cenni storici

La curva normale fu concepita da De Moivre nel 1733, come un’approssimazione alla distribuzione binomiale. Nel 1783, Laplace utilizzò per la prima volta la curva normale per descrivere la distribuzione degli errori. Qualche anno più tardi (1809), il matematico tedesco Karl Friedrich Gauss la impiegò nell’analisi di dati astronomici.

Per questi motivi, la curva normale dovrebbe essere citata come distribuzione di Gauss-LaPlace.

La normale è la distribuzione statistica utilizzata, il suo consistente impiego è dovuto a due motivi principali:

si adatta bene alla rappresentazione grafica di molti fenomeni fisici, biologi, sociali;
è fondamentale in inferenza statistica.

Abraham De Moivre

Brunswich 30 Aprile 1777 - Gottinga 23 Febbraio 1855.

Caratteristiche

È un istogramma con infiniti casi;
Comprende casi da -∞ a +∞;
È asinotticamente normale ovvero è asintotica all’asse delle x da entrambi i lati;
Media, moda e mediana coincidono;
È unimodale centrale;
È simmetrica rispetto al valore medio.

La curva Normale: esempio

Data una distribuzione di frequenza la cui media è 34,21, sull’asse delle ascisse (X) vengono collocate le categorie della variabile cardinale, sull’asse delle ordinate (Y) le frequenze corrispondenti a ciascun valore della variabile.
L’ipotetico istogramma individuato per ciascun valore, avrà altezza pari alla frequenza corrispondente.

Nell’esempio riportato, la distribuzione si comporta in modo “normale” infatti la curva cresce fino al valore corrispondente alla media (34,21) e poi decresce fino ad incontrare l’asse delle X.

“Costruzione” di una curva normale.

Le distribuzioni simmetriche e asimmetriche: skew e skewness

“una distribuzione è simmetrica (rispetto alla mediana) se le modalità che sono equidistanti dalla mediana hanno la stessa frequenza”

(Leti, da Marradi, 1993, p.114).

Distribuzione simmetrica (curva rossa) e distribuzione asimmetrica (curva nera)a confronto.

Asimmetria positiva

Si parla di asimmetria positiva se la coda più lunga è a destra della media; in questo caso si notano molti valori con forti scarti positivi e pochi con scarti negativi.

La distribuzione presenta pochi dati con forti scarti positivi bilanciati da molti dati con deboli scarti negativi.

Caratteristiche:

1. In caso di asimmetria positiva l’indice di asimmetria assumerà segno positivo;
2. La moda è spostata verso l’estremo inferiore della distribuzione;
3. Scarti + > Scarti –

$\bar X >Md > Mo$

Asimmetria positiva

Asimmetria negativa

Si parla di asimmetria negativa se la coda più lunga si presenta a sinistra della media; ciò implica che il numero degli scarti negativi è maggiore del numero degli scarti positivi.

La distribuzione presenta pochi dati con forti scarti negativi bilanciati da molti dati con deboli scarti positivi.

Caratteristiche:

1. L’indice di asimmetria assumerà segno negativo;
2. la moda e’ spostata verso l’estremo superiore della distribuzione;
3. Scarti + < Scarti –

$\bar X<Md<Mo$

Asimmetria negativa.

Alcune precisazioni sulla asimmetria: il rapporto tra la media e lo scarto-tipo

Se due distribuzioni hanno lo stesso scarto-tipo (s) ma media differente, le due curve corrispondenti assumeranno una posizione diversa. Infatti, al variare della media, la curva si sposta verso destra o verso sinistra.

Nello specifico, all’aumentare della media, la curva tende a spostarsi verso destra e, di conseguenza, aumentano gli scarti negativi rispetto a quelli positivi, e viceversa.

Date due distribuzioni con s uguale:

La curva 1 ha più scarti – → La curva si sposta verso dx.
La curva 2 ha più scarti + → La curva si sposta verso sx.

Valori sintetici NON basati sulla dispersione intorno alla media

A partire da queste permesse sono stati individuati una serie di valori sintetici che non si basano sulla dispersione intorno alla media, ma sullo scarto tra media, moda, mediana normalizzato per lo scarto tipo o per il numero dei casi.

Indice di asimmetria di Ballatori;
Indice di asimmetria di Pearson;
Indice di asimmetria Blalock;
Indice di asimmetria di Marradi;
Indice di asimmetria di Pearson-Fischer.

1. Indice di asimmetria di Ballatori (1988)

Sottraendo la mediana dalla media, se la distribuzione presenta una coda negativa, i dati con forti scarti negativi provocano una riduzione della media rispetto a quello della mediana; di conseguenza, lo scarto tra i due sarà negativo.
Se la distribuzione ha una coda positiva, i dati con forti scarti positivi fanno si che il valore della media sia maggiore di quello della mediana; l’indice assumerà segno positivo

Asimmetria negativa media < mediana Indice negativo

Asimmetria positiva media > mediana Indice positivo

$\bar X - \text{mediana}$

2. Indice di asimmetria di Pearson

In questo caso si sottrae alla media la moda e poi si normalizza la differenza per lo scarto tipo.

Utilizzare la moda al posto della mediana è poco opportuno soprattutto se la distribuzione non è campanulare.

$\frac{\bar x -\text{moda}}s$

3. Indice di asimmetria di di Blalock (1960)

Per ovviare agli inconvenienti dell’Indice di Pearson, Blalock (1960, 1984) propone un indice che normalizza la differenza tra media e mediana moltiplicata per 3 e lo rapporta allo scarto tipo.

$A_s=\frac {3(\bar x -\text{mediana})}s$

4. Indice di asimmetria di Marradi

Questo indice è dato dallo scarto tra la mediana e il midrange, normalizzato per lo scarto – tipo (s).

Ovvero

lo scarto tra il centro della distribuzione (midrange) se quest’ultima fosse simmetrica e il centro reale della distribuzione (mediana).

Non è sconsigliabile:

La media perché è sempre collocata al centro dell’asimmetria (tra midrange e mediana);
La moda perché se la distribuzione non è campanulare, potrebbe cadere ovunque.

$A_{norm}=\frac{\frac{\text{max+min}} 2 - \text{mediana}}2$

5. Indice di Pearson-Fischer

Rispetto agli altri indici tiene conto dei segni grazie all’elevazione al cubo e quindi pone in evidenza la differenza tra gli scarti negativi e quelli positivi. Inoltre, massimizza (evidenzia) gli scarti più forti.

Non è un indice relativo: può assumere valori superiori a +1 ed inferiori a -1.

$A_s=\frac{\sum(x_i/s)^3}N$

Alcune note sull’asimmetria

Se una distribuzione è asimmetrica la media sarà SEMPRE collocata tra mediana e midrange.

$mediana \rightarrow \bar x \leftarrow midrange$

Curtosi

La curtosi [kurtose] misura il grado di appiattimento, cioè misura la concentrazione/dispersione dei dati attorno al valore centrale, la media aritmetica.

s = 0 distribuzione mesocurtica/normale;

s < 0 distribuzione platicurtica/iponormale: la forma è appiattita con valori maggiormente concentrati nelle code;

s > 0 distribuzione leptocurtica/iponormale: la forma è allungata con un picco accentuato dato dalla concentrazione dei dati intorno al valore massimo.

$\bar X_1 = \bar X_2~~~~~~~~~S_1\neq S_2$