Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D Le Miniguide all'orientamento Gli eBook di Federica La Corte in Rete
 
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Massimo Aria » 3.Distribuzioni di frequenza e rappresentazioni grafiche


Distribuzione unitaria

Una distribuzione statistica consiste nell’insieme delle risposte assunte da un carattere statistico osservato su un dato collettivo.

Si immagini di aver osservato o rilevato sulle N unità statistiche della popolazione una variabile X le cui modalità sono risultate essere (x1, x2,…, xl,…, xN).

Tale insieme di dati prende il nome di distribuzione unitaria della variabile X.

Il pedice “l” individua l’unità statistica sul quale è stato rilevata la variabile X. Ne deriva che con xl si indica la modalità assunta dalla variabile X per l’elle-sima unità statistica (con l=1,2,….,N).

Una distribuzione unitaria, pur essendo un’informazione esaustiva sul fenomeno, non consente una immediata individuazione delle caratteristiche salienti dello stesso: massimo, minimo, modalità più frequente, ecc.

In altre parole non è utile per fornire informazioni di sintesi.

Esempi di distribuzioni unitarie

Esempi di distribuzioni unitarie

Esempi di distribuzioni unitarie


Distribuzione di quantità

La distribuzione di quantità è una organizzazione dei dati in forma tabellare tale che per ogni modalità della variabile X si fa corrispondere la quantità totale misurata/rilevata sulle N unità della popolazione.

Essa esplicita, quindi, come l’ammontare complessivo del fenomeno si distribuisce tra le modalità del carattere X.

Il pedice “i” indica la generica modalità del carattere (con i=1,2,…,k).

Distribuzione di quantità

Distribuzione di quantità


Esempio di distribuzione di quantità

Distribuzione delle quantità prodotte (in numero di pezzi) nel settore degli elementi da costruzione in metallo (fonte ISTAT, anno 2007)

Distribuzione delle quantità prodotte (in numero di pezzi) nel settore degli elementi da costruzione in metallo (fonte ISTAT, anno 2007)


Distribuzione di frequenza

La distribuzione di frequenza è una organizzazione dei dati in forma tabellare tale che ad ogni modalità della variabile X si fa corrispondere la rispettiva frequenza.

In altre parole, la distribuzione di frequenza esplicita quante volte una determinata modalità si presenta nel collettivo oggetto di studio.

Essa è un modo sintetico per rappresentare le unità statistiche che assumono uguale modalità indicandone unicamente la frequenza di risposta.

Distribuzione di frequenza

Distribuzione di frequenza


Distribuzione di frequenza per variabili discrete

Si immagini una popolazione composta da N unità su cui è osservata una variabile X che assume k distinte modalità (variabile discreta).

E’ possibile rappresentare le osservazioni in una distribuzione di frequenza in cui:

  • xi consiste nella i-esima modalità della X
  • ni consiste nella i-esima frequenza assoluta (il numero di volte che la modalità i si presenta nel collettivo osservato)
  • fi = ni /N consiste nella i-esima frequenza relativa (la proporzione con cui la modalità i si presenta nel collettivo osservato)
Distribuzione di frequenza per variabili discrete

Distribuzione di frequenza per variabili discrete

Proprietà delle frequenze assolute e relative

Proprietà delle frequenze assolute e relative


Rappresentazioni grafiche per variabili discrete

Una prima sintesi grafica della distribuzione di una variabile discreta può essere ottenuta attraverso un diagramma a barre (o diagramma cartesiano).

Esso è costruito ponendo sull’asse delle ascisse le modalità della variabile X e sulle ordinate le frequenze (assolute o relative) corrispondenti ad ogni modalità.

Si ottiene così una rappresentazione detta “a barre verticali“.

Alcune osservazioni:

  • L’impiego delle frequenze assolute o relative non cambia la forma della distribuzione.
  • Il ricorso alle frequenze relative è necessario se si vogliono confrontare due diverse distribuzioni (es. distribuzione del numero di figli in Italia e in Francia).
Diagramma a barre

Diagramma a barre


Esempi di distribuzioni per variabili discrete

Rappresentazione tabellare e grafica della distribuzione della nazionalità (Fonte: Risorsa Turismo, 2008)

Rappresentazione tabellare e grafica della distribuzione della nazionalità (Fonte: Risorsa Turismo, 2008)


Distribuzione di frequenza per variabili continue

Nel caso di una variabile continua non è possibile far corrispondere ad ogni modalità la rispettiva frequenza, in quanto il carattere potrebbe assumere infinite distinte modalità (ognuna delle quali avrebbe frequenza assoluta pari a 1).

Per fornire una rappresentazione tabellare di una variabile continua si ricorre quindi ad una suddivisione in classi delle modalità di risposta.

Ciò consente di determinare le frequenze assolute e relative delle classi di risposta in luogo delle singole modalità.

La suddivisione in classi

Si definisce una generica classe come:

[xi-1, xi]

“in essa sono incluse tutte le modalità di X maggiori di xi-1 e minori o uguali a xi

Si definisce ampiezza di una classe [xi-1, xi], la differenza tra l’estremo superiore e l’estremo inferiore della stessa:

ai=xi – xi-1

I criteri di suddivisione delle modalità in classi sono i seguenti:

  • Sulla base della conoscenza del fenomeno: con l’ausilio di esperti si determina la suddivisione che si ritiene maggiormente esplicativa dell’oggetto di studio
  • Sulla base di regole empiriche
    • In classi di pari ampiezza (equi-ampie)
    • In classi di pari frequenza (equi-frequenti)
Distribuzione di frequenza in classi

Distribuzione di frequenza in classi


Costruzione di distribuzioni in classi equi-ampie

Classi equi ampie

Classi equi ampie


Costruzione di distribuzioni in classi equi-frequenti

Classi equi frequenti

Classi equi frequenti


Densità di frequenza

Per la rappresentazione grafica di una distribuzione in classi, non è possibile utilizzare il grafico a barre in quanto le classi potrebbero avere diversa ampiezza e le frequenze non sarebbero quindi confrontabili.

In luogo delle frequenze si introduce il concetto di densità di frequenza.

Essa si definisce come il rapporto tra la frequenza di una classe e la rispettiva ampiezza:

di=ni/(xi – xi-1)

Densità di frequenza

Densità di frequenza


Rappresentazioni grafiche per variabili continue

La rappresentazione grafica di una variabile continua avviene attraverso l’impiego dell’istogramma.

Esso fa corrispondere ad ogni classe un rettangolo la cui ampiezza è pari all’ampiezza della classe e la cui altezza è pari alla rispettiva densità di frequenza.

Le barre così ottenute hanno un’area pari alla frequenza assoluta delle corrispondenti classi e forniscono, quindi, una informazione non distorta sulla forma della distribuzione.

Alcune osservazioni:

  • Nei diagrammi a barre l’ampiezza della barra è convenzionale, mentre nell’istogramma indica l’ampiezza della classe.
  • Nei diagrammi a barre la frequenza è pari all’altezza della barra, mentre nell’istogramma essa è pari all’area della barra.
  • Nel caso di una distribuzione in classi equi-ampie di ampiezza pari a 1, l’istogramma equivale ad un diagramma a barre.
Densità di frequenza

Densità di frequenza


Esempio di distribuzione di frequenza in classi

Esempi di distribuzione di frequenza in classi

Esempi di distribuzione di frequenza in classi


Funzione di ripartizione empirica

La funzione di ripartizione empirica è una funzione che associa ad ogni valore reale xi la proporzione di unità statistiche che assumono valori uguali o inferiori a xi.

In pratica, la funzione di ripartizione empirica è ottenuta cumulando progressivamente le frequenze relative al crescere di X.

Il concetto di funzione di ripartizione trova applicazione nel contesto delle variabili quantitative.

Definizione e proprietà della funzione di ripartizione empirica

Definizione e proprietà della funzione di ripartizione empirica

Grafico della funzione di ripartizione empirica

Grafico della funzione di ripartizione empirica


Prossima lezione

Nella prossima lezione si affronteranno i seguenti argomenti:

  • Concetto di centro di una distribuzione
  • Indici statistici di posizione
  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion