Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D Le Miniguide all'orientamento Gli eBook di Federica La Corte in Rete
 
I corsi di Economia
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Simona Balbi » 5.Richiami al campionamento statistico


Alcuni richiami e definizioni

Popolazione: è l’insieme finito o infinito di unità, definito nei contenuti, nello spazio e nel tempo, oggetto dell’indagine.

Campione: data una popolazione, è l’insieme delle n unità, selezionate tra le N che compongono la popolazione, al fine di rappresentarla, quanto a caratteri oggetto di studio.

Campione statistico è detto casuale (o probabilistico).

La casualità si ottiene:

  • attribuendo ad ogni unità una probabilità positiva di essere selezionata
  • utilizzando in modo appropriato le tecniche per la selezione casuale del campione

Alcuni richiami e definizioni II

  • Popolazione N unità
  • Campione n unità
  • Probabilità di estrazione pi
  • Probabilità di inclusione nel campione pi
  • Frazione di campionamento f
  • Fattore di correzione per popolazioni finite (1-f)
  • Fattore di riporto all’universo 1/f

Schema di campionamento: probabilità di selezione


Schema di campionamento: regole per la selezione

Tecniche per la selezione casuale

  • Tavole dei numeri casuali
  • Algoritmi di generazione di numeri pseudo-casuali

Tipi di selezione casuale

  • Bernoulliana, o con reinserimento o con ripetizione

N.B. f = 0

  • In blocco, o senza reinserimento o ripetizione

Schema di campionamento: probabilità di inclusione

La probabilità di inclusione πi è la probabilità di includere nel campione l’i-esima unità: πi = npi
Se la probabilità iniziale è costante (pi=1/N), la probabilità totale è:

πi = n/N

Si dimostra che, se la probabilità di selezione è costante, sia nel campionamento bernoulliano,
sia nel campionamento in blocco πi =n/N.

Schema di campionamento: selezione sistematica

Si mettono in sequenza le unità e se ne seleziona una ogni tante, a partire da una, scelta casualmente.

Il passo di campionamento si determina sulla base del rapporto k=N/n.

La posizione dell’unità da cui far partire r è:

1 ≤ r ≤ k

Si includono nel campione le n unità nelle posizioni:

r; r + k; r + 2k; … ; r + (n-1)k

Schema di campionamento: la numerosità campionaria

La numerosità ottima di un campione è quella che permette di ottenere gli obiettivi dell’indagine al minimo costo (e nel minor tempo).

Sarà data, quindi, dal più piccolo numero in base al quale le stime raggiungono il livello di attendibilità desiderato dal ricercatore.

Nel seguito vedremo come determinare la numerosità campionaria all’interno dei diversi tipi di campionamento probabilistico.

Schema di campionamento: struttura del campione

  • Campionamento casuale semplice
  • Campionamento stratificato
  • Campionamento su più stadi
  • Campionamento per aree
  • Campionamento ruotato

La struttura del campione è data dall’insieme delle liste che si adoperano per formarlo.

Se la lista della popolazione è unica, il campione ha una struttura semplice, se sono necessarie più liste ha una struttura complessa.

Campionamento casuale semplice

  • Probabilità di estrazione pi =1/N ∀i {1, …, N}
  • Probabilità di inclusione nel campione πi =n/N
  • Fattore di espansione all’universo: N/n
  • Frazione di campionamento f=n/N
  • Fattore di riporto all’universo (1-f)=(N-n)/N
    • La precisione delle stime dipende da n quando N è molto grande, mentre f è determinante quando N è piccolo

E’ il campione della teoria statistica.

Nella pratica è spesso troppo dispendioso.

Campionamento casuale semplice: determinazione della numerosità campionaria


Campionamento casuale semplice: determinazione della numerosità campionaria II


Campionamento casuale semplice: determinazione della numerosità campionaria III

Nelle indagini di mercato è più frequente il caso in cui si voglia stimare una proporzione di soggetti, piuttosto che una media. In questo caso la teoria statistica consente di semplificare ulteriormente la soluzione di questo problema.

Il problema può essere formalmente rappresentato, per ciascun soggetto, in termini di possesso, o meno dell’attributo di interesse (oppure favorevole, o contrario ad una certa affermazione, ecc.) e, quindi, attraverso una variabile casuale Bernoulliana.

Ricordando le caratteristiche di una distribuzione bernoulliana, è noto che se Y~Ber(p), allora Var(Y)=p(1-p) e poiché p è la probabilità di successo, e varia fra 0 e 1, ha come massimo 0,25, situazione di massima incertezza.

Campionamento casuale semplice: determinazione della numerosità campionaria IV


Campionamento casuale semplice: determinazione della numerosità campionaria V


Campionamento casuale semplice: determinazione della numerosità campionaria VI

Un esempio (Fabbris, 1989)

Viene commissionata una indagine longitudinale su 2000 persone sottoposte a cobalto terapia.

Obiettivo

  1. Rilevare la frazione di sopravvissuti a uno, a due, a cinque anni
  2. A distanza di un anno dalla dimissione dell’ospedale, stimare la media dei giorni di letto nel periodo

Per determinare la numerosità si pone:

  1. Un errore di campionamento delle frazioni di sopravvissuti non superiore al 5% del valore della frazione
  2. Un errore di campionamento per il numero medio dei giorni di letto ≤ 0,5

Campionamento casuale semplice: determinazione della numerosità campionaria – Un esempio (Fabbris, 1989)


Campionamento casuale stratificato

«Stratificare significa ripartire la popolazione in sottopopolazioni dette strati »

Perchè stratificare?

  • Evidenziare insiemi di unità particolari (unità rare, gruppi estremali o devianti, come le grandi imprese)
  • Separare dagli altri, strati fisicamente isolati o con caratteristiche speciali
  • Individuare unità da osservare con tecniche particolari

Introdurre sulla selezione il massimo controllo, pur mantenendo la casualità.

Campionamento casuale stratificato

Individuare sottopopolazioni al massimo omogenee rispetto alla variabile (o alle variabili) da rilevare

Stime più efficienti di quelle ottenibili con un campionamento casuale semplice (di pari numerosità)

Campionamento casuale stratificato


Campionamento casuale stratificato II

Regole per la stratificazione

  • Le caratteristiche per la stratificazione devono essere note prima della selezione
  • Ogni unità statistica deve appartenere ad uno e ad un solo strato
  • Stratificato è un campione estratto da una popolazione Stratificato

Campionamento casuale stratificato III

Selezione di un campione stratificato OTTIMALE

Selezione di un campione stratificato OTTIMALE


Campionamento casuale stratificato IV

Selezione con ALLOCAZIONE OTTIMA secondo Neyman (1934) e Chuprov (1923)

Selezione con ALLOCAZIONE OTTIMA secondo Neyman (1934) e Chuprov (1923)


Campionamento casuale stratificato V

Stima con allocazione ottima

  • Il campione stratificato con allocazione ottima delle unità non è autoponderante
  • Occorre, quindi, introdurre un sistema di pesi wi nel calcolo delle stime per tener conto delle differenti probabilità di inclusione πi delle singole unità (schema di campionamento con probabilità variabili)

Wi = 1/πi

Campionamento casuale stratificato VI

STIMA con ALLOCAZIONE OTTIMA della MEDIA μ della variabile X

STIMA con ALLOCAZIONE OTTIMA della MEDIA μ della variabile X


Campionamento casuale stratificato VII

STIMA con ALLOCAZIONE OTTIMA della MEDIA μ della variabile X

STIMA con ALLOCAZIONE OTTIMA della MEDIA μ della variabile X


Campionamento casuale stratificato VIII

Selezione di un campione stratificato OTTIMALE

Selezione di un campione stratificato OTTIMALE


Campionamento casuale a stadi

«Alla base di un campionamento a stadi c’è una struttura gerarchica della popolazione »: la popolazione finale delle unità è contenuta in un insieme di unità di livello superiore, che possono a loro volta appartenere ad un numero più ridotto di insiemi di dimensione più ampia.

Esempio

Si campiona in un primo stadio fra i comuni italiani. Successivamente al secondo stadio si campionano le famiglie all’interno dei comuni estratti.

Si intervistano, quindi, tutti i componenti delle famiglie estratte (grappolo).

Campionamento casuale a stadi II

Si noti che:

  • La successione gerarchica dei campionamenti può non coincidere con la struttura della popolazione
  • L’estrazione del campione si può effettuare con criteri differenti ad ogni stadio:
    • con probabilità costanti o variabili
    • da liste stratificate o meno
    • la stratificazione si effettua di regola al primo stadio, perché è più economico e si hanno più informazioni
  • Fissata la numerosità campionaria si può decidere come combinare i diversi stadi → AMPIA FLESSIBILITA’

Campionamento casuale a stadi III

Le fasi di un campionamento a stadi sono:

  1. individuare il numero degli stadi
  2. individuare le caratteristiche per stratificare (di solito le unità di primo stadio)
  3. decidere quante unità estrarre ad ogni stadio
  4. decidere come selezionare ad ogni stadio

Il DEFF di un campionamento a stadi è inversamente legato al coefficiente di correlazione interclasse.

Campionamento casuale ruotato

«Quando con l’indagine si vogliono stimare le caratteristiche della popolazione ad intervalli di tempo esistono diverse soluzioni » :

  1. si costruisce un campione permanente, il panel (Vantaggi: consente di studiare flussi e persistenze) (Limiti: rischio di perdita di rappresentatività col tempo)
  2. si selezionano campioni indipendenti ogni volta (Vantaggi: garantisce la rappresentatività nel tempo) (Limiti: consente confronti temporali solo per aggregati)
  3. si sostituiscono a rotazione alcune unità (Vantaggi: presenta il vantaggio della continuità (parziale)) (Limiti: complessità dei processi di stima)

Lo schema di rotazione

«Un campione di dimensione n costante nel tempo può essere visto come composto da n’ unità incluse nella prima rilevazione + n” unità incluse nella seconda e così via »

P=n’/n

è la frazione di sovrapposizione tra due periodi successivi.

Si definiscono g gruppi di rotazione che hanno generalmente uguale dimensione n/g.

Il DEFF di un campionamento ruotato è legato al coefficiente di auto-correlazione e alla frazione di sovrapposizione.

Un semplice schema di rotazione

Consideriamo il caso più semplice con:

P=1/2

SCHEMA PER T RILEVAZIONI

SCHEMA PER T RILEVAZIONI


  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion