Obiettivo di una misura di posizione è quello di sintetizzare in un singolo valore numerico l’intera distribuzione di frequenza così da consentire confronti nel tempo, nello spazio o tra situazioni differenti.
In altre parole, si intende individuare un valore che rappresenti la direzione, la tendenza centrale di una variabile statistica.
Nel contesto della statistica descrittiva sono stati proposti numerosi indici di posizione.
Tra questi il concetto di media ha assunto un ruolo preponderante nella rappresentazione del concetto di posizione (o centro) di una distribuzione.
Tra gli indici di posizione maggiormente utilizzati si fa riferimento a:
La media è un concetto primitivo per l’essere umano.
Pur non avendo nozioni di statistica, la moltitudine delle persone fa quotidianamente riferimento alla media per esprimere una sintesi.
La media è un indice di posizione per variabili quantitative.
Criterio della trasferibilità
Scelta una funzione “f”, la media si definisce, secondo Chisini, come quel valore che se sostituito alle osservazioni di una distribuzione non ne muta il valore della funzione.
A seconda del criterio della trasferibilità considerato si distinguono differenti tipologie di media:
È il valore di posizione per eccellenza, a cui spesso si fa riferimento con il semplice termine “media”.
La media aritmetica si definisce come “quel valore che, sostituito alle N osservazioni della distribuzione, non ne muta la somma degli elementi” (Chisini).
A seconda della distribuzione:
La media aritmetica gode delle seguenti proprietà:
In presenza di una distribuzione di frequenza in classi (nel caso di variabili continue), nel calcolo della media è necessario individuare, per ogni classe un valore rappresentativo della stessa.
Si introduce il concetto di valore centrale della classe.
Esso è ottenuto come semi-somma degli estremi di ogni classe.
La media è calcolata come media ponderata dei valori centrali per le rispettive frequenze delle classi.
Se si definisce come criterio della trasferibilità il prodotto, la media secondo Chisini prende il nome di media geometrica.
Essa si definisce come il la radice (di ragione N) del prodotto dei valori della distribuzione della variabile X.
La media geometrica, coinvolgendo il prodotto delle modalità, va utilizzata in quei casi in cui la variabile varia in ragione proporzionale.
Esempio:
Si pensi alla necessità di calcolare un tasso di interesse medio di un investimento bancario di durata pluriennale.
Essendo il tasso variabile nel tempo allora la media geometrica può consentire di individuare il tasso medio per un dato montante dopo k anni.
Se si definisce come criterio della trasferibilità la somma degli inversi, la media secondo Chisini prende il nome di media armonica.
Essa si definisce come il la somma degli inversi dei valori della distribuzione della variabile X rapportata al numero di osservazioni.
La media armonica è utile quando occorre sintetizzare un rapporto tra variabili quando la somma dei termini a denominatore è pari ad una costante.
Esempio:
Si pensi al calcolo della velocità media di un automobile che ha percorso spazi diversi in tempi diversi.
La velocità media è la media armonica delle singole velocità ponderate per gli spazi percorsi nei singoli tratti.
Si definiscono medie lasche (o medie di posizione) quelle che utilizzano alcuni valori particolari della distribuzione di frequenza, per individuare una particolare modalità che ha una collocazione centrale rispetto a tutte le altre.
Tra le medie lasche, sono riconducibili:
La Moda Mo (o norma) di una distribuzione di frequenza è la modalità cui corrisponde la massima frequenza, assoluta o relativa.
Per distribuzioni che presentano due o più modalità con massima frequenza si parla di distribuzioni bimodali o plurimodali.
La moda può essere calcolata per qualunque carattere statistico, sia esso qualitativo che quantitativo.
Nella realtà, essa trova però scarsa applicazione nel caso di variabili continue (distribuzione in classi) in quanto:
La Mediana Me è il valore che bipartisce la distribuzione ordinata delle modalità di una variabile X, in modo tale che la metà delle osservazioni sia inferiore alla mediana e l’altra metà sia invece superiore.
La mediana è quindi quel valore per cui la funzione di ripartizione empirica vale ½: F(Me)=0,5.
Il calcolo della mediana si differenzia a seconda che esso riguardi una distribuzione unitaria o una distribuzione di frequenza.
NB. Prima di calcolare la mediana bisogna sempre ordinare la distribuzione in ordine crescente sulla base delle modalità della variabile X.
Per distribuzioni in classi, la mediana si calcola in due passi.
Innanzi tutto si perviene alla identificazione della classe mediana come quella classe la cui funzione di ripartizione F è pari a ½.
Successivamente si identifica, attraverso un calcolo proporzionale, il valore mediano all’interno della classe mediana.
Come già affermato, la mediana è un indice che bipartisce egualmente la distribuzione ordinata.
Estendendo questo concetto a più ripartizioni è possibile definire i quartili.
Dividendo egualmente la distribuzione in quattro parti, si identificano:
Analogamente, ripartendo la distribuzione in dieci o cento parti, si possono definire i decili così come i percentili.
La mediana corrisponderà al quinto decile e al cinquantesimo percentile.
Nella prossima lezione si affronteranno i seguenti argomenti:
1. Introduzione
3. Distribuzioni di frequenza e rappresentazioni grafiche
4. Indici statistici di posizione
5. Indici statistici di variabilità
6. Forma di una distribuzione statistica
7. Distribuzioni doppie di frequenza
8. Relazioni tra variabili: Associazione e dipendenza in media
9. Relazioni tra variabili: Correlazione lineare
11. Rapporti statistici e numeri indici
12. Introduzione al calcolo delle probabilità