Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D Le Miniguide all'orientamento Gli eBook di Federica La Corte in Rete
 
I corsi di Economia
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Massimo Aria » 3.Sintesi tabellare e grafica di una distribuzione statistica


Distribuzione unitaria

Una distribuzione statistica consiste nell’insieme delle risposte assunte da un carattere statistico osservato su un dato collettivo.

Si immagini di aver osservato o rilevato sulle N unità statistiche della popolazione una variabile X le cui modalità sono risultate essere (x1, x2,…, xl,…, xN).
Tale insieme di dati prende il nome di distribuzione unitaria della variabile X.

Il pedice “l” individua l’unità statistica sulla quale è stata rilevata la variabile X. Ne deriva che con xl si indica la modalità assunta dalla variabile X per l’elle-sima unità statistica (con l=1,2,….,N).

Una distribuzione unitaria, pur essendo un’informazione esaustiva sul fenomeno, non consente una immediata individuazione delle caratteristiche salienti dello stesso: massimo, minimo, modalità più frequente, ecc.
In altre parole non è utile per fornire informazioni di sintesi.

Esempi di distribuzioni unitarie


Distribuzione di quantità

La distribuzione di quantità è una organizzazione dei dati in forma tabellare tale che per ogni modalità della variabile X si fa corrispondere la quantità totale misurata/rilevata sulle N unità della popolazione.

Essa esplicita, quindi, come l’ammontare complessivo del fenomeno si distribuisce tra le modalità del carattere X.

Il pedice “i” indica la generica modalità del carattere (con i=1,2,…,k).


Esempio di distribuzione di quantità

Distribuzione delle quantità prodotte (in numero di pezzi) nel settore degli elementi da costruzione in metallo. Fonte ISTAT, anno 2007

Distribuzione delle quantità prodotte (in numero di pezzi) nel settore degli elementi da costruzione in metallo. Fonte ISTAT, anno 2007


Distribuzione di frequenza

La distribuzione di frequenza è una organizzazione dei dati in forma tabellare tale che ad ogni modalità della variabile X si fa corrispondere la rispettiva frequenza.

In altre parole, la distribuzione di frequenza esplicita quante volte una determinata modalità si presenta nel collettivo oggetto di studio.

Essa è un modo sintetico per rappresentare le unità statistiche che assumono uguale modalità indicandone unicamente la frequenza di risposta.


Distribuzione di frequenza per variabili discrete

Si immagini una popolazione composta da N unità su cui è osservata una variabile X che assume k distinte modalità (variabile discreta). E’ possibile rappresentare le osservazioni in una distribuzione di frequenza in cui:

  • xi consiste nella i-esima modalità della X
  • ni consiste nella i-esima frequenza assoluta (il numero di volte che la modalità i si presenta nel collettivo osservato)

Frequenze assolute ni

\sum_{i=1}^k n_i = N;\hspace{1,5cm} 0\le n_i\leq N

  • fi = ni /N consiste nella i-esima frequenza relativa (la proporzione con cui la modalità i si presenta nel collettivo osservato)

Frequenze relative fi = ni / N

\sum_{i=1}^k f_i = 1;\hspace{1,5cm} 0\leq f_i \leq 1


Rappresentazioni grafiche per variabili discrete

Una prima sintesi grafica della distribuzione di una variabile discreta può essere ottenuta attraverso un diagramma a barre (o diagramma cartesiano).

Esso è costruito ponendo sull’asse delle ascisse le modalità della variabile X e sulle ordinate le frequenze (assolute o relative) corrispondenti ad ogni modalità.

Si ottiene così una rappresentazione detta “a barre verticali”.

Alcune osservazioni

  • L’impiego delle frequenze assolute o relative non cambia la forma della distribuzione
  • Il ricorso alle frequenze relative è necessario se si vogliono confrontare due diverse distribuzioni (es. distribuzione del numero di figli in Italia e in Francia)
Diagramma a barre

Diagramma a barre


Esempi di distribuzioni per variabili discrete

Rappresentazione tabellare e grafica della distribuzione della nazionalità . Fonte: Risorsa Turismo, 2008

Rappresentazione tabellare e grafica della distribuzione della nazionalità . Fonte: Risorsa Turismo, 2008


Distribuzione di frequenza per variabili continue

Nel caso di una variabile continua non è possibile far corrispondere ad ogni modalità la rispettiva frequenza, in quanto il carattere potrebbe assumere infinite distinte modalità (ognuna delle quali avrebbe frequenza assoluta pari a 1).

Per fornire una rappresentazione tabellare di una variabile continua si ricorre quindi ad una suddivisione in classi delle modalità di risposta.

Ciò consente di determinare le frequenze assolute e relative delle classi di risposta in luogo delle singole modalità.

La suddivisione in classi

Si definisce una generica classe come:

[xi-1, xi]

in essa sono incluse tutte le modalità di X maggiori di xi-1 e minori o uguali a xi

Si definisce ampiezza di una classe [xi-1, xi], la differenza tra l’estremo superiore e l’estremo inferiore della stessa:

ai=xi – xi-1

I criteri di suddivisione delle modalità in classi sono i seguenti:

  • sulla base della conoscenza del fenomeno: con l’ausilio di esperti si determina la suddivisione che si ritiene maggiormente esplicativa dell’oggetto di studio

sulla base di regole empiriche:

  • in classi di pari ampiezza (equi-ampie)
  • in classi di pari frequenza (equi-frequenti)
Distribuzione di frequenza in classi

Distribuzione di frequenza in classi


Costruzione di distribuzioni in classi equi-ampie


Costruzione di distribuzioni in classi equi-frequenti


Densità di frequenza

Per la rappresentazione grafica di una distribuzione in classi, non è possibile utilizzare il grafico a barre in quanto le classi potrebbero avere diversa ampiezza e le frequenze non sarebbero quindi confrontabili.

In luogo delle frequenze si introduce il concetto di densità di frequenza.
Essa si definisce come il rapporto tra la frequenza di una classe e la rispettiva ampiezza:

di=ni/(xi – xi-1)


Rappresentazioni grafiche per variabili continue

La rappresentazione grafica di una variabile continua avviene attraverso l’impiego dell’istogramma.

Esso fa corrispondere ad ogni classe un rettangolo la cui base è pari all’ampiezza della classe e la cui altezza è pari alla rispettiva densità di frequenza.

Le barre così ottenute hanno un’area pari alla frequenza assoluta delle corrispondenti classi e forniscono, quindi, una informazione non distorta sulla forma della distribuzione.

Alcune osservazioni:

  • nei diagrammi a barre l’ampiezza della barra è convenzionale, mentre nell’istogramma indica l’ampiezza della classe
  • nei diagrammi a barre la frequenza è pari all’altezza della barra, mentre nell’istogramma essa è pari all’area della barra
  • nel caso di una distribuzione in classi equi-ampie di ampiezza pari a 1, l’istogramma equivale ad un diagramma a barre
Densità di frequenza

Densità di frequenza


Esempio di distribuzione di frequenza in classi


Funzione di ripartizione empirica

La funzione di ripartizione empirica è una funzione che associa ad ogni valore reale xi la proporzione di unità statistiche che assumono valori uguali o inferiori a xi.

In pratica, la funzione di ripartizione empirica è ottenuta cumulando progressivamente le frequenze relative al crescere di X.

Il concetto di funzione di ripartizione trova applicazione nel contesto delle variabili quantitative.

Definizione

Fi = frequenza relativa cumulata

F_i=\sum_{h=1}^i f_h\hspace{1,5cm}F(x_i)=\frac{\# (X\leq x_i)}N

Proprietà

0 ≤ F(x) ≤ 1

F(x) non è decrescente

F(-∞) = 0  F(+∞) = 1

F(x) è continua da destra

Grafico della funzione di ripartizione empirica

Grafico della funzione di ripartizione empirica


Nella prossima lezione

Nella prossima lezione si affronteranno i seguenti argomenti:

  • concetto di centro di una distribuzione
  • indici statistici di posizione
  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion