Obiettivo di una misura (o indice) di posizione è quello di sintetizzare in un singolo valore numerico l’intera distribuzione di frequenza così da consentire confronti nel tempo, nello spazio o tra situazioni differenti.
In altre parole, si intende individuare un valore che rappresenti la direzione, la tendenza centrale di una variabile statistica.
Nel contesto della statistica descrittiva sono stati proposti numerosi indici di posizione.
Tra questi il concetto di media ha assunto un ruolo preponderante nella rappresentazione del concetto di posizione (o centro) di una distribuzione.
Tra gli indici di posizione maggiormente utilizzati si fa riferimento a:
La media è un concetto primitivo per l’essere umano.
Pur non avendo nozioni di statistica, la moltitudine delle persone fa quotidianamente riferimento alla media per esprimere una sintesi.
La media è un indice di posizione per variabili quantitative.
Criterio della trasferibilità
Scelta una funzione “f”, la media si definisce, secondo Chisini, come quel valore che se sostituito alle osservazioni di una distribuzione non ne muta il valore della funzione.
A seconda del criterio della trasferibilità considerato si distinguono differenti tipologie di media:
Criterio della trasferibilità di Chisini – Medie secondo Chisini
f(x1, x2, … , xn) = f(M, M, … , M)
con
x1 ≤ x2 ≤ … ≤ M ≤ … ≤ xn-1 ≤ xn
È il valore di posizione per eccellenza, a cui spesso si fa riferimento con il semplice termine “media”.
La media aritmetica si definisce come “quel valore che, sostituito alle N osservazioni della distribuzione, non ne muta la somma degli elementi” (Chisini).
A seconda della distribuzione:
Media aritmetica semplice
Consideriamo come criterio f la somma degli elementi
Media aritmetica ponderata
Consideriamo una variabile X nella forma:
la media aritmetica sarà:
La media aritmetica gode delle seguenti proprietà:
1) Internalità. La media è sempre compresa tra il valore minimo e il valore massimo della distribuzione
2) Baricentro. La media è pari a quel valore che rende nulla la somma degli scarti (si definisce scarto la differenza tra un’osservazione e la media)
3) Linearità.
4) Associatività. Se si divide la distribuzione in g gruppi e se ne calcolano le medie, la media generale sarà pari alla media ponderata delle g medie dei gruppi
5) Minimo della somma degli scarti al quadrato. La media è pari a quel valore che rende minima la somma degli scarti al quadrato
In presenza di una distribuzione di frequenza in classi (nel caso di variabili continue), nel calcolo della media è necessario individuare, per ogni classe un valore rappresentativo della stessa.
Si introduce il concetto di valore centrale della classe.
Esso è ottenuto come semi-somma degli estremi di ogni classe.
La media è calcolata come media ponderata dei valori centrali per le rispettive frequenze delle classi.
Media aritmetica per distribuzione in classi
Si considerano i valori centrali di ogni classe
… la media aritmetica sarà
Se si definisce come criterio della trasferibilità il prodotto, la media secondo Chisini prende il nome di media geometrica.
Essa si definisce come la radice (di ragione N) del prodotto dei valori della distribuzione della variabile X.
La media geometrica, coinvolgendo il prodotto delle modalità, va utilizzata in quei casi in cui la variabile varia in ragione proporzionale.
Esempio:
Si pensi alla necessità di calcolare un tasso di interesse medio di un investimento bancario di durata pluriennale.
Essendo il tasso variabile nel tempo allora la media geometrica può consentire di individuare il tasso medio per un dato montante dopo k anni.
Media geometrica semplice (per distribuzione unitarie)
Media geometrica ponderata (per distribuzioni di frequenza)
Se si definisce come criterio della trasferibilità la somma degli inversi, la media secondo Chisini prende il nome di media armonica.
Essa si definisce come la somma degli inversi dei valori della distribuzione della variabile X rapportata al numero di osservazioni.
La media armonica è utile quando occorre sintetizzare un rapporto tra variabili quando la somma dei termini a denominatore è pari ad una costante.
Esempio:
Si pensi al calcolo della velocità media di un automobile che ha percorso spazi diversi in tempi diversi.
La velocità media è la media armonica delle singole velocità ponderate per gli spazi percorsi nei singoli tratti.
Media armonica semplice (per distribuzioni unitarie)
Media armonica ponderata (per distribuzioni di frequenza)
Si definiscono medie lasche (o medie di posizione) quelle che utilizzano alcuni valori particolari della distribuzione di frequenza, per individuare una particolare modalità che ha una collocazione centrale rispetto a tutte le altre.
Tra le medie lasche, sono riconducibili:
La Moda Mo (o norma) di una distribuzione di frequenza è la modalità cui corrisponde la massima frequenza, assoluta o relativa.
Per distribuzioni che presentano due o più modalità con massima frequenza si parla di distribuzioni bimodali o plurimodali.
La moda può essere calcolata per qualunque carattere statistico, sia esso qualitativo che quantitativo.
Nella realtà, essa trova però scarsa applicazione nel caso di variabili continue (distribuzione in classi) in quanto:
La Mediana Me è il valore che bipartisce la distribuzione ordinata delle modalità di una variabile X, in modo tale che la metà delle osservazioni sia inferiore alla mediana e l’altra metà sia invece superiore.
La mediana è quindi quel valore per cui la funzione di ripartizione empirica vale ½: F(Me)=0,5.
Il calcolo della mediana si differenzia a seconda che esso riguardi una distribuzione unitaria o una distribuzione di frequenza.
NB. Prima di calcolare la mediana bisogna sempre ordinare la distribuzione in ordine crescente sulla base delle modalità della variabile X.
Per distribuzioni in classi, la mediana si calcola in due passi.
Innanzitutto si perviene alla identificazione della classe mediana come quella classe la cui funzione di ripartizione F è pari a ½.
Successivamente si identifica, attraverso un calcolo proporzionale, il valore mediano all’interno della classe mediana.
Come già affermato, la mediana è un indice che bipartisce egualmente la distribuzione ordinata.
Estendendo questo concetto a più ripartizioni è possibile definire i quartili.
Dividendo egualmente la distribuzione in quattro parti, si identificano:
Analogamente, ripartendo la distribuzione in dieci o cento parti, si possono definire i decili così come i percentili.
La mediana corrisponderà al quinto decile e al cinquantesimo percentile.
Formulazione dei quartili
Data una distribuzione ordinata della X
Q1 = xi tale che F(Q1) = 0.25
Q2 = xi tale che F(Q2) = F(Me) = 0.50
Q3 = xi tale che F(Q3) = 0.75
Nella prossima lezione si affronteranno i seguenti argomenti:
2. Caratteri statistici e scale di misura
3. Sintesi tabellare e grafica di una distribuzione statistica
6. Forma di una distribuzione statistica
7. Distribuzioni doppie di frequenza
8. Relazioni tra variabili: associazione e dipendenza in media
9. Relazioni tra variabili: Correlazione lineare
10. Interpolazione statistica e Retta di regressione
11. Elementi di calcolo delle probabilità
12. Introduzione alle variabili casuali
13. Modelli per variabili casuali discrete di uso comune
14. Modelli per variabili casuali continue di uso comune
15. Introduzione alle serie storiche
16. Approccio classico: Modello di decomposizione di una serie storica