Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D La Corte in Rete
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Roberta Siciliano » 2.Campionamento statistico e statistiche campionarie di uso più frequente


I contenuti

  • Il problema inverso
  • Concetti di base di una procedura inferenziale
  • Il campionamento
  • Definizione di campione casuale semplice con ripetizione
  • Definizione di statistica campionaria e sua distribuzione
  • Le statistiche campionarie di uso più frequente

Il problema inverso

Il problema di risalire alla struttura non nota delle popolazioni – e delle variabili casuali (v.c.) – viene affrontato teoricamente dalla inferenza statistica.

Si passa dalla Deduzione alla Induzione, dal problema diretto al problema Inverso.

L’Inferenza statistica è lo strumento metodologico utile ad affrontare e a risolvere il problema inverso.

Le informazioni sulla struttura della popolazione sono fornite da un campione casuale.

La procedura inferenziale (stima o verifica delle ipotesi) consente di risalire alla conoscenza incognita sulla popolazione.

I risultati e le decisioni comportano un rischio, dovuto alla limitatezza delle informazioni usate.
Il rischio può essere valutato e controllato in termini probabilistici con gli strumenti della inferenza statistica.

Il problema inverso

Il problema inverso


Concetti di base di una procedura inferenziale

Parametri
Valori caratteristici della popolazione.

Modello
L’insieme delle distribuzioni di probabilità definite su un opportuno spazio campionario e caratterizzato da uno o più parametri.

Assunzioni
Informazioni a priori sulla popolazione che consentono di scegliere un modello piuttosto che un altro.

Incertezza
Ritenere più probabile che una data osservazione sia stata generata da alcune distribuzioni di probabilità che da altre appartenenti al modello.

Inferenza
Essere indotti a ritenere più probabile che la popolazione appartenga ad un certo sottoinsieme del modello che ad un altro.

Il campionamento

Campione casuale o probabilistico

Ogni elemento della popolazione ha una probabilità non nulla di entrare a far parte del campione.

Estrazione con ripetizione

La struttura della probabilità non si modifica ad ogni estrazione perché ciascuna unità estratta è inserita nuovamente nella popolazione.

Estrazione senza ripetizione

Si estraggono n unità in blocco dalla popolazione e la struttura di probabilità si modifica ad ogni estrazione.

La popolazione teorica

Al fenomeno oggetto di studio si associa una variabile casuale (v.c.) X descritta da un modello teorico di probabilità che dipende dal parametro “teta”.

Popolazione teorica

Popolazione teorica


Definizione di campione casuale semplice

Si supponga di estrarre un campione casuale semplice con ripetizione, ovvero ciascuna unità statistica nella popolazione ha la stessa probabilità (diversa da zero) di far parte del campione.

Le n estrazioni campionarie sono v.c. indipendenti e identicamente distribuite come la v.c. X che descrive la popolazione teorica.

Il campione casuale semplice (con ripetizione) è una v.c. multipla.

Estrazioni campionarie casuali con ripetizione

Estrazioni campionarie casuali con ripetizione

Campione casuale semplice

Campione casuale semplice


La statistica campionaria e sua distribuzione

La realtà operativa è l’osservazione di un solo campione.

In teoria si studia il “comportamento” di tutti i possibili campioni che si possono estrarre da una popolazione, cioè l’universo campionario.

Statistica campionaria

E’ una v.c. definita quale funzione di un campione casuale, ovvero una qualunque trasformazione delle v.c. che compongono il campione che consente di inferire sui parametri non noti della popolazione.

Distribuzione campionaria

É la distribuzione dei possibili valori della statistica campionaria al variare del campione.
Estraendo tutti i possibili campioni di numerosità n dalla popolazione si ottengono tutti i possibili valori che la statistica campionaria può assumere.

Realtà operativa e teoria

Realtà operativa e teoria

Statistica campionaria

Statistica campionaria


Distribuzione campionaria della media

É la distribuzione delle medie campionarie al variare del campione.

Per una popolazione finita, di numerosità N, si possono estrarre (con ripetizione) N elevato alla n possibili campioni di numerosità n.

Estraendo un solo campione dalla popolazione , si disporrà di un solo valore della media campionaria per fare inferenza.

In teoria, i possibili valori che la media campionaria può assumere, al variare del campione estratto, è descritta da una v.c., ovvero da un modello di probabilità.

Media campionaria

E’ una v.c. definita quale media delle v.c. che compongono il campione e consente di inferire sulla media non nota della popolazione.

Distribuzione campionaria della media

Distribuzione campionaria della media

Media campionaria

Media campionaria


Esempio (1)

Esercizio didattico per la costruzione della distribuzione campionaria della v.c. media campionaria (estrazione con ripetizione)

Consideriamo una popolazione di quattro unità statistiche, e proviamo ad estrarre tutti i possibili campioni di ampiezza 2, generando quindi N=4 elevato a n=2 possibili campioni, cioè 16 possibili campioni.

Calcoliamo la media di ogni campione ed i valori distinti che essa può assumere; deriviamo la frequenza relativa associata a ciascun valore distinto in modo da descrivere empiricamente la distribuzione campionaria della media campionaria.

Essa è nota in quanto abbiamo – per esercizio didattico – ipotizzato di conoscere la popolazione e tutti i possibili campioni.

Quando la popolazione non è nota, è possibile ipotizzare un modello di probabilità per la v.c. media campionaria, caratterizzata da una media e da una varianza.

E’ possibile desumere la media e la varianza della v.c. Media campionaria.

Esempio di universo dei campioni

Esempio di universo dei campioni

Calcolo del valore atteso e della varianza attesa della v.c. media campionaria

Calcolo del valore atteso e della varianza attesa della v.c. media campionaria


Esempio (2)

Calcoliamo la media e la varianza del carattere nella popolazione.

E’ possibile notare che la media della v.c. Media campionaria è equivalente alla media della popolazione, mentre la varianza è inversamente proporzionale alla numerosità del campione.

Pertanto, al crescere della numerosità campionaria si riduce la variabilità dei possibili valori della media campionaria, ovvero la distribuzione della media campionaria si concentra intorno alla media (che è equivalente alla media della popolazione, parametro oggetto di inferenza).

Ai fini inferenziali è fondamentale conoscere il “comportamento” della distribuzione campionaria della v.c. Media campionaria.

Media e varianza del carattere nella popolazione

Media e varianza del carattere nella popolazione

Media e varianza della v.c. Media Campionaria

Media e varianza della v.c. Media Campionaria


Esempio (3)

Esercizio didattico per la costruzione della distribuzione campionaria della v.c. media campionaria (estrazione senza ripetizione)

Consideriamo una popolazione di quattro unità statistiche, e proviamo ad estrarre tutti i possibili campioni di ampiezza 2 (senza reintroduzione), generando quindi 12 possibili campioni.

Deriviamo la distribuzione campionaria della v.c. Media campionaria.

E’ possibile desumere la media e la varianza della v.c. Media campionaria.

Si dimostrerà nella lezione successiva che è possibile derivare la varianza in base alla formula indicata: rispetto al campionamento con ripetizione, nel caso di estrazione senza ripetizione la varianza della distribuzione campionaria si riduce per il fattore evidenziato.

Del resto, l’estrazione senza ripetizione consente di “sfruttare” al meglio l’informazione campionaria in quanto si esclude la ridondanza di informazione (dovuta alla possibilità di estrarre più di una volta la stessa unità nel campionamento con ripetizione).

Esempio (estrazione senza ripetizione)

Esempio (estrazione senza ripetizione)


Distribuzione campionaria della probabilità di successo

Popolazione bernoulliana

Per la descrizione di caratteri dicotomici è possibile ipotizzare il modello di probabilità bernoulliano caratterizzato da un parametro, la probabilità di successo.

Numerosi sono gli esempi di applicazione di tale modello quando si voglia fare inferenza sulla probabilità di successo (i.e., acquista un prodotto, sceglie di pagare bancomat, è maschio, etc.).

Proporzione campionaria

E’ una v.c. definita quale media delle v.c. (bernoulliane) che compongono il campione e consente di inferire sulla probabilità di successo non nota della popolazione.

Si dimostra che la v.c. Proporzione campionaria si distribuisce come una binomiale relativa caratterizzata da due parametri (la numerosità campionaria e la probabilità di successo), ha media pari alla media della v.c. X nella popolazione (probabilità di successo) e varianza pari alla varianza nella popolazione diviso per la numerosità campionaria.

Popolazione bernoulliana

Popolazione bernoulliana

Proporzione campionaria

Proporzione campionaria


  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion

Fatal error: Call to undefined function federicaDebug() in /usr/local/apache/htdocs/html/footer.php on line 93