Ipotesi
Sia data una popolazione finita e su di essa sia definita una v.c. X continua o discreta la cui funzione di densità o distribuzione di probabilità dipenda completamente da un parametro “teta” (scalare) appartenente ad uno spazio parametrico prefissato.
Obiettivo
Stimare il valore di “teta” sulla base di un campione di n unità statistiche osservate.
Definire le proprietà auspicabili della stima ottenuta utilizzando piccoli campioni (di numerosità inferiore o uguale a 30).
Definizione
Le osservazioni campionarie sono le realizzazioni delle v.c. associate alle n estrazioni campionarie, ciascuna distribuita come la v.c. X nella popolazione.
E’ la funzione di probabilità congiunta descritta dalle n v.c. che costituiscono il campione, supposte indipendenti, definita nello spazio parametrico dei possibili valori del parametro “teta”.
Data l’indipendenza tra le v.c. per il teorema delle probabilità composte, la probabilità congiunta si esprime come prodotto delle funzioni di probabilità associate alle n v.c. che compongono il campione, caratterizzate dal parametro incognito “teta”.
La funzione di verosimiglianza assume valori diversi al variare del parametro incognito che caratterizza il modello di probabilità teorico definito per la popolazione.
Offre la risposta al seguente quesito:
Qual è la probabilità (o quanto verosimile è) che il campione sia stato estratto da una popolazione caratterizzata dal parametro “teta”?
Statistica campionaria nella teoria della stima:
Stimatore
E’ una v.c. definita quale funzione di un campione casuale che consente di stimare un parametro non noto nella popolazione.
La funzione t(.) che lega le variabili casuali che compongono il campione è detta “funzione di stima”.
Stima
La stima di “teta” é il valore assunto dallo stimatore in corrispondenza di un particolare campione.
Considerando tutte le possibili realizzazioni della v.c. stimatore, ovvero i valori assunti dallo stimatore al variare del campione (ovvero delle v.c. che lo compongono), si ha l’insieme delle possibili “stime” del parametro non noto nella popolazione.
Parametro da stimare: media
Stimatore: media campionaria
La v.c. Media Campionaria è uno stimatore della media nella popolazione.
Il suo valore atteso è pari al parametro incognito.
La sua varianza dipende direttamente dalla varianza della popolazione ed inversamente della numerosità del campione. Nel caso di estrazione campionaria senza ripetizione, la varianza dello stimatore si riduce.
Parametro da stimare: probabilità di successo (modello bernoulliano)
Stimatore: proporzione campionaria
La v.c. Proporzione Campionaria è uno stimatore della probabilità di successo.
Si distribuisce come una binomiale relativa caratterizzata dai parametri “probabilità di successo” e “numerosità campionaria”.
Il suo valore atteso è pari al parametro da stimare e la sua varianza è funzione diretta della varianza della popolazione (distribuita come una bernoulliana) ed inversamente dalla numerosità del campione.
Proprietà auspicabili
Uno stimatore è corretto o non distorto del parametro incognito se fornisce in media, al variare dei campioni, il valore del parametro non noto.
Pertanto, se il valore atteso della v.c. stimatore è pari al parametro non noto, lo stimatore è corretto.
Altrimenti, lo stimatore è distorto (biased), e la sua distorsione è pari alla differenza tra il suo valore atteso ed il parametro incognito.
Media campionaria
La v.c. Media Campionaria è uno stimatore corretto della media di una popolazione.
Proporzione campionaria
La v.c. Proporzione Campionaria è uno stimatore corretto della probabilità di successo.
Problema: stima della varianza
Stimatore: Varianza campionaria corretta
Lo stimatore varianza campionaria è distorto a causa del fattore pari a (n-1) su n, così che definendo lo stimatore “Varianza campionaria corretta” si ottiene uno stimatore corretto.
Stimatore: Varianza campionaria corretta
Lo stimatore corretto della varianza campionaria è per costruzione uno stimatore non distorto: ha media pari al parametro da stimare.
Errore quadratico medio della v.c. stimatore
E’ lo scostamento medio quadratico dello stimatore dal parametro incognito, ovvero è il valore atteso della v.c. scarto dello stimatore dal parametro al quadrato.
Si dimostra che l’EQM è somma della varianza e del quadrato della distorsione.
Pertanto, l’EQM di uno stimatore corretto è pari alla varianza.
Efficienza relativa tra due stimatori
Lo stimatore T1 è più efficiente dello stimatore T2 se l’EQM di T1 è inferiore all’EQM di T2.
Efficienza relativa tra due stimatori corretti
Uno stimatore corretto è più efficiente di un altro stimatore corretto del parametro “teta” non noto se esso presenta una varianza inferiore.
Siano date le n v.c. che compongono il campione, ciascuna con funzione di probabilità (densità o distribuzione) nota e siano soddisfatte le seguenti condizioni di regolarità:
l’insieme di definizione della v.c. X non è dipendente dal parametro “teta” incognito;
la derivata della funzione di probabilità è una funzione continua e differenziabile di “teta”.
La varianza di uno stimatore del parametro “teta” avrà un limite inferiore espresso dalla diseguaglianza di Frechet-Cramer-Rao.
Uno stimatore che ha varianza uguale al limite inferiore di Frechet-Cramer-Rao è efficiente in senso assoluto.
Teorema dell’unicità
Se esiste uno stimatore non distorto ed efficiente (in senso assoluto) questo è unico.
Esempi
Media campionaria e Proporzione campionaria
Popolazione teorica
v.c. Normale (Gauss), caratterizzata da media e varianza
Problema
Media incognita
Stimatore
Media campionaria
Limite inferiore della diseguaglianza di Frechet-Rao-Cramer
E’ dato dal rapporto tra la varianza della popolazione e la numerosità del campione
Nota
Si dimostra che anche la v.c. Proporzione campionaria è uno stimatore efficiente della probabilità di successo che caratterizza il modello bernoulliano.
Teorema di Neyman-Fisher (fattorizzazione della funzione di verosimiglianza)
Siano date le n v.c. che compongono il campione, ciascuna con funzione di probabilità nota (a meno del parametro), uno stimatore è sufficiente per il parametro “teta” se e solo se la funzione di verosimiglianza può essere fattorizzata nel prodotto di due funzioni: una esprime il contenuto informativo dello stimatore con riferimento al parametro incognito e l’altra è la componente informativa residuale che non dipende dal parametro “teta”.
In altre parole, uno stimatore sufficiente ingloba tutta l’informazione che può essere desunta dal campione con riferimento al parametro “teta”.
Teorema di Rao-Blackwell
Dato uno stimatore T1 sufficiente ed uno stimatore T2 non distorto, lo stimatore definito come valore atteso della v.c. condizionata definita dallo stimatore T2 dato lo stimatore T1 è non distorto e con varianza minore o uguale a quella di T2.
2. Campionamento statistico e statistiche campionarie di uso più frequente
3. Stimatore e proprietà per piccoli campioni
4. Proprietà asintotiche degli stimatori, leggi di convergenza e teorema del limite centrale
6. Teoria della stima intervallare
7. Teoria della verifica delle ipotesi: la costruzione del test parametrico