Home

Federica EU

1/17

Massimo Aria » 3.Sintesi tabellare e grafica di una distribuzione statistica

Distribuzione unitaria

Una distribuzione statistica consiste nell’insieme delle risposte assunte da un carattere statistico osservato su un dato collettivo.

Si immagini di aver osservato o rilevato sulle N unità statistiche della popolazione una variabile X le cui modalità sono risultate essere (x₁, x₂,…, x_l,…, x_N).
Tale insieme di dati prende il nome di distribuzione unitaria della variabile X.

Il pedice “l” individua l’unità statistica sulla quale è stata rilevata la variabile X. Ne deriva che con xl si indica la modalità assunta dalla variabile X per l’elle-sima unità statistica (con l=1,2,….,N).

Una distribuzione unitaria, pur essendo un’informazione esaustiva sul fenomeno, non consente una immediata individuazione delle caratteristiche salienti dello stesso: massimo, minimo, modalità più frequente, ecc.
In altre parole non è utile per fornire informazioni di sintesi.

Esempi di distribuzioni unitarie

Distribuzione di quantità

La distribuzione di quantità è una organizzazione dei dati in forma tabellare tale che per ogni modalità della variabile X si fa corrispondere la quantità totale misurata/rilevata sulle N unità della popolazione.

Essa esplicita, quindi, come l’ammontare complessivo del fenomeno si distribuisce tra le modalità del carattere X.

Il pedice “i” indica la generica modalità del carattere (con i=1,2,…,k).

Esempio di distribuzione di quantità

Distribuzione delle quantità prodotte (in numero di pezzi) nel settore degli elementi da costruzione in metallo. Fonte ISTAT, anno 2007

Distribuzione di frequenza

La distribuzione di frequenza è una organizzazione dei dati in forma tabellare tale che ad ogni modalità della variabile X si fa corrispondere la rispettiva frequenza.

In altre parole, la distribuzione di frequenza esplicita quante volte una determinata modalità si presenta nel collettivo oggetto di studio.

Essa è un modo sintetico per rappresentare le unità statistiche che assumono uguale modalità indicandone unicamente la frequenza di risposta.

Distribuzione di frequenza per variabili discrete

Si immagini una popolazione composta da N unità su cui è osservata una variabile X che assume k distinte modalità (variabile discreta). E’ possibile rappresentare le osservazioni in una distribuzione di frequenza in cui:

x_i consiste nella i-esima modalità della X
n_i consiste nella i-esima frequenza assoluta (il numero di volte che la modalità i si presenta nel collettivo osservato)

Frequenze assolute n_i

$\sum_{i=1}^k n_i = N;\hspace{1,5cm} 0\le n_i\leq N$

f_i = n_i /N consiste nella i-esima frequenza relativa (la proporzione con cui la modalità i si presenta nel collettivo osservato)

Frequenze relative f_i = n_i / N

$\sum_{i=1}^k f_i = 1;\hspace{1,5cm} 0\leq f_i \leq 1$

Rappresentazioni grafiche per variabili discrete

Una prima sintesi grafica della distribuzione di una variabile discreta può essere ottenuta attraverso un diagramma a barre (o diagramma cartesiano).

Esso è costruito ponendo sull’asse delle ascisse le modalità della variabile X e sulle ordinate le frequenze (assolute o relative) corrispondenti ad ogni modalità.

Si ottiene così una rappresentazione detta “a barre verticali”.

Alcune osservazioni

L’impiego delle frequenze assolute o relative non cambia la forma della distribuzione
Il ricorso alle frequenze relative è necessario se si vogliono confrontare due diverse distribuzioni (es. distribuzione del numero di figli in Italia e in Francia)

Diagramma a barre

Esempi di distribuzioni per variabili discrete

Rappresentazione tabellare e grafica della distribuzione della nazionalità . Fonte: Risorsa Turismo, 2008

Distribuzione di frequenza per variabili continue

Nel caso di una variabile continua non è possibile far corrispondere ad ogni modalità la rispettiva frequenza, in quanto il carattere potrebbe assumere infinite distinte modalità (ognuna delle quali avrebbe frequenza assoluta pari a 1).

Per fornire una rappresentazione tabellare di una variabile continua si ricorre quindi ad una suddivisione in classi delle modalità di risposta.

Ciò consente di determinare le frequenze assolute e relative delle classi di risposta in luogo delle singole modalità.

La suddivisione in classi

Si definisce una generica classe come:

[x_i-1, x_i]

“in essa sono incluse tutte le modalità di X maggiori di x_i-1 e minori o uguali a x_i”

Si definisce ampiezza di una classe [x_i-1, x_i], la differenza tra l’estremo superiore e l’estremo inferiore della stessa:

a_i=x_i – x_i-1

I criteri di suddivisione delle modalità in classi sono i seguenti:

sulla base della conoscenza del fenomeno: con l’ausilio di esperti si determina la suddivisione che si ritiene maggiormente esplicativa dell’oggetto di studio

sulla base di regole empiriche:

in classi di pari ampiezza (equi-ampie)
in classi di pari frequenza (equi-frequenti)

Distribuzione di frequenza in classi

Costruzione di distribuzioni in classi equi-ampie

Costruzione di distribuzioni in classi equi-frequenti

Densità di frequenza

Per la rappresentazione grafica di una distribuzione in classi, non è possibile utilizzare il grafico a barre in quanto le classi potrebbero avere diversa ampiezza e le frequenze non sarebbero quindi confrontabili.

In luogo delle frequenze si introduce il concetto di densità di frequenza.
Essa si definisce come il rapporto tra la frequenza di una classe e la rispettiva ampiezza:

d_i=n_i/(x_i – x_i-1)

Rappresentazioni grafiche per variabili continue

La rappresentazione grafica di una variabile continua avviene attraverso l’impiego dell’istogramma.

Esso fa corrispondere ad ogni classe un rettangolo la cui base è pari all’ampiezza della classe e la cui altezza è pari alla rispettiva densità di frequenza.

Le barre così ottenute hanno un’area pari alla frequenza assoluta delle corrispondenti classi e forniscono, quindi, una informazione non distorta sulla forma della distribuzione.

Alcune osservazioni:

nei diagrammi a barre l’ampiezza della barra è convenzionale, mentre nell’istogramma indica l’ampiezza della classe
nei diagrammi a barre la frequenza è pari all’altezza della barra, mentre nell’istogramma essa è pari all’area della barra
nel caso di una distribuzione in classi equi-ampie di ampiezza pari a 1, l’istogramma equivale ad un diagramma a barre

Densità di frequenza

Esempio di distribuzione di frequenza in classi

Funzione di ripartizione empirica

La funzione di ripartizione empirica è una funzione che associa ad ogni valore reale x_i la proporzione di unità statistiche che assumono valori uguali o inferiori a x_i.

In pratica, la funzione di ripartizione empirica è ottenuta cumulando progressivamente le frequenze relative al crescere di X.

Il concetto di funzione di ripartizione trova applicazione nel contesto delle variabili quantitative.

Definizione

F_i = frequenza relativa cumulata

$F_i=\sum_{h=1}^i f_h\hspace{1,5cm}F(x_i)=\frac{\# (X\leq x_i)}N$