Home

Federica EU

1/17

Roberta Siciliano » 8.Test parametrici su probabilità di successo, su varianza, su confronto fra varianze, su confronto fra medie

I contenuti

Richiamo dello schema operativo per l’applicazione del test parametrico
Test sulla probabilità di successo
Test sulla varianza
Test sul confronto fra varianze
Test sul confronto fra medie
Esempi
La decisione nel test in base al p-value

Lo schema per l’applicazione

Considerazioni generali: scelta del modello di probabilità, campionamento, assunzioni.
Ipotesi statistiche: definizione dell’ipotesi nulla e dell’ipotesi alternativa.
Statistica test: si definisce lo stimatore, la sua funzione di stima e distribuzione campionaria (con eventuale stima dei parametri non noti), e si deriva la statistica test.
Regola di decisione e scelta della regione critica ottimale di ampiezza α: sulla base della distribuzione nota della statistica test e quindi della corrispondente tavola statistica, fissato il livello di significatività α, si determina il valore critico (test unidirezionale) o i valori critici (test bidirezionale) per distinguere la regione critica dalla regione di accettazione. Si analizza la funzione potenza del test e si costruisce la regola di decisione.
Estrazione campionaria e decisione: Si determina il valore osservato della statistica test per il campione estratto e, sulla base della regola di decisione, si conclude il test accettando l’ipotesi nulla o rifiutandola.

Schema operativo per l'applicazione del test

Test parametrico sulla probabilità di successo

Considerazioni generali: Sia data una popolazione distribuita come una Bernoulliana caratterizzata dal parametro Π. Si consideri lo schema di campionamento casuale semplice, estrazione con ripetizione di un campione di numerosità superiore a 30.
Ipotesi statistiche: Si consideri un’ipotesi alternativa composta unidirezionale del tipo Π > Π0
Statistica test: Si scelga lo stimatore proporzione campionaria che per n>30 si approssima ad una normale, la cui standardizzata, assumendo vera l’ipotesi nulla, è la statistica test.
Regola di decisione e scelta della regione critica ottimale di ampiezza α: si deriva la Regione Critica Ottimale (RCO) di ampiezza α sulla base del lemma di Neyman-Pearson.
Estrazione campionaria e decisione: Si determini il valore osservato della statistica test per il campione estratto e, sulla base della regola di decisione, si concluda il test accettando l’ipotesi nulla o rifiutandola. Se il valore osservato della proporzione campionaria rientra nella RCO si rifiuta l’ipotesi nulla con un livello di significatività pari ad α.

In figura 1: Regione critica ottimale di ampiezza α nel test parametrico unidirezionale sulla probabilità di successo (campione di numerosità superiore a 30). In figura 2: Regione critica ottimale di ampiezza α utilizzando la standardizzata.

Esempio (a)

Problema
Generalmente l’8% della produzione di scatole di alluminio per la conservazione di prodotti agroalimentari presenta delle imperfezioni e, quindi, è inutilizzabile.

Da un controllo effettuato su un campione di 100 scatole risulta che 12 di esse non sono risultate idonee all’uso.
a) Si può affermare, ammettendo una probabilità di errore del 5%, che la produzione di scatole sia affetta da una maggiore proporzione di pezzi difettosi?

b) Calcolare e disegnare la funzione potenza del test per i seguenti valori ipotizzati per l’ipotesi alternativa: 8%; 10%; 12%; 14%; 16%

Esempio (a)

Soluzione (a)

La popolazione è distribuita come una Bernoulliana caratterizzata da un parametro che è la probabilità di successo. Il campione è di numerosità superiore a 30, così che la v.c. Proporzione campionaria può approssimarsi ad una normale. L’ipotesi nulla, che rappresenta lo status quo dello studio, propone una probabilità di successo (scatola con imperfezioni) pari all’8%, cioè Π0 = 0,08.

Si è interessati a verificare se, alla luce dell’evidenza campionaria (avendo rilevato una proporzione campionaria pari a 0,12), si possa ritenere superiore a quanto affermato dall’esperienza storica la probabilità di produrre una scatola con imperfezioni. Pertanto si opta per un test unidirezionale del tipo Π >Π0.

Si sceglie quale variabile test la standardizzata della Proporzione Campionaria, (vedi formula in figura).

Sostituendo i valori nell’espressione, si rileva il valore empirico della Z pari a 1,48. Per il livello di significatività del test pari al 5%, il valore critico della standardizzata è pari a 1,64.

Dal momento che il valore empirico è inferiore al valore critico, si accetta l’ipotesi nulla.

Esempio (b) I parte

Soluzione (b)
Per costruire la funzione potenza del test, il primo passo da compiere è la determinazione del valore critico (o soglia) della proporzione campionaria tale che la probabilità di ottenere un valore superiore ad esso sia pari al 5%.
Nell’esempio, sostituendo i valori nell’espressione di lato si determina il valore pari a 0,1246.

Al fine di determinare i valori della potenza del test occorre calcolare la massa di probabilità che viene lasciata alla sinistra del valore soglia assumendo vera l’ipotesi alternativa. Naturalmente, è preferibile ricorrere ai valori standardizzati per determinare la probabilità ricorrendo alle tavole statistiche.
Al variare dell’ipotesi alternativa (ovvero 8%; 10%; 12%; 14%; 16%), è possibile sostituire opportunamente i valori nell’espressione a lato per determinare il corrispondente valore della potenza del test.

Esempio (b) II parte

Funzione potenza del test nell'esempio sul test parametrico sulla probabilità di successo (unidirezionale del tipo Π > Π0 )

Test parametrico sulla varianza

Considerazioni generali: Sia data una popolazione distribuita normalmente con media non nota. Si consideri lo schema di campionamento casuale semplice.
Ipotesi statistiche: Si consideri un’ipotesi nulla di tipo semplice e un’ipotesi alternativa composta unidirezionale.
Statistica test: Si scelga lo stimatore varianza campionaria corretta, dopo aver stimato la media non nota della popolazione con la media campionaria. Dopo un’opportuna trasformazione, si determini la statistica test distribuita come una v.c. chi-quadrato con (n-1) gradi di libertà, assumendo vera l’ipotesi nulla.
Regola di decisione e scelta della regione critica ottimale di ampiezza α: si derivi la Regione Critica Ottimale (RCO) di ampiezza α sulla base del lemma di Neyman-Pearson.
Estrazione campionaria e decisione: Si determini il valore osservato della statistica test per il campione estratto e, sulla base della regola di decisione, si conclude il test accettando l’ipotesi nulla o rifiutandola. Se il valore osservato della statistica test rientra nella RCO si rifiuta l’ipotesi nulla con un livello di significatività pari ad α.

Regione critica ottimale di ampiezza α: nel test parametrico unidirezionale sulla varianza

Esempio

Problema
Un’azienda produttrice di sistemi per la sicurezza stradale riscontra una varianza della lunghezza delle barre metalliche di supporto ai Guardrail pari a 250 mm. A seguito della riparazione di un macchinario, viene estratto un campione di 13 barre per verificare se c’è stato un decremento significativo nella varianza del diametro. Di seguito si riportano i dati relativi al campione estratto:

126, 124, 91, 100, 104, 95, 101, 114, 134, 117, 95, 116, 139

Verificare al livello α = 0,05 se il decremento nella varianza dei diametri è significativo supponendo che la popolazione si distribuisca come una normale.

Test parametrico sul confronto fra varianze

Considerazioni generali: Siano date due popolazioni normali con medie non note. Si estraggano, con ripetizione, due campioni indipendenti di numerosità n1 e n2 rispettivamente.
Ipotesi statistiche: Si consideri un’ipotesi nulla di uguaglianza delle varianze nelle due popolazioni ed un’ipotesi alternativa in cui la varianza della prima popolazione è superiore alla varianza della seconda popolazione.
Statistica test: Si dimostra che il rapporto tra le varianze campionarie corrette si distribuisce come una v.c. F di Snedecor Ficher, assumendo vera l’ipotesi nulla.
Regola di decisione e scelta della regione critica ottimale di ampiezza α: si derivi la Regione Critica Ottimale (RCO) di ampiezza α sulla base del lemma di Neyman-Pearson.
Estrazione campionaria e decisione: Si determini il valore osservato della statistica test per il campione estratto e, sulla base della regola di decisione, si concluda il test accettando l’ipotesi nulla o rifiutandola. Se il valore osservato della statistica test rientra nella RCO si rifiuta l’ipotesi nulla con un livello di significatività pari ad α.

In figura: Regione critica ottimale di ampiezza α nel test parametrico unidirezionale sul confronto fra varianze.

Esempio

Problema
Una grande azienda produttrice di termocamini vuole verificare se la variabilità della produzione è diversa relativamente ai prodotti finiti delle due catene di montaggio di cui è dotata.

I dati ottenuti sulla variabilità della produzione relativi a 21 osservazioni campionarie, per ognuna delle due linee di produzione, sono rappresentati dai seguenti valori (vedi figura a lato). Si proceda alla costruzione di un test con un α pari allo 0,025.

Esempio

Soluzione

Si formulano le ipotesi: H₀ : σ²_A = σ²_Bversus H₁ : σ²_A > σ²_B

Per verificare se esiste una differenza significativa tra due varianze, si fa ricorso al test costituito dal rapporto delle varianze campionarie per il quale è nota la distribuzione campionaria. Infatti dati due campioni casuali e indipendenti il rapporto tra le varianze si distribuisce secondo la distribuzione F di Fisher-Snedecor con (n – 1) e (m – 1) gradi di libertà. Il valore empirico della statistica test è pari al rapporto tra le varianze campionarie corrette, ovvero 1,422. Il valore critico della F per α pari allo 0,025, considerando gradi di libertà (20, 20), risulta pari a 2,46. Dal momento che il valore empirico è inferiore al valore critico del test, si accetta l’ipotesi nulla.

Test parametrico sul confronto fra medie (1)

Considerazioni generali: Siano date due popolazioni distribuite come una normale con varianze note. Si estraggano, con ripetizione, due campioni indipendenti di numerosità n1 e n2 rispettivamente.
Ipotesi statistiche: Si consideri un’ipotesi nulla di uguaglianza delle medie nelle due popolazioni ed un’ipotesi alternativa in cui la media della prima popolazione è superiore alla media della seconda popolazione.
Statistica test: Si scelga come stimatore della differenza fra le medie delle due popolazioni, la differenza fra medie campionarie, la cui standardizzata, assumendo vera l’ipotesi nulla, è la statistica test.
Regola di decisione e scelta della regione critica ottimale di ampiezza α: si derivi le Regione Critica Ottimale (RCO) di ampiezza α sulla base del lemma di Neyman-Pearson.
Estrazione campionaria e decisione: Si determina il valore osservato della statistica test per il campione estratto e, sulla base della regola di decisione, si concluda il test accettando l’ipotesi nulla o rifiutandola. Se il valore osservato della statistica test rientra nella RCO si rifiuta l’ipotesi nulla con un livello di significatività pari ad α.

In figura: Regione critica ottimale di ampiezza α nel test parametrico unidirezionale sul confronto fra medie (popolazione normale e varianze note).

Test parametrico sul confronto fra medie (2)

Variante 1 alle considerazioni generali: popolazioni normali con varianze non note

CASO A: Si assume che le varianze non note siano uguali fra loro.

Occorre stimare la varianza comune con lo stimatore corretto costruito “unendo” le osservazioni campionarie dei due campioni e tenendo conto che le medie non note nelle due popolazioni sono stimate dalle rispettive medie campionarie.
La variabile test è costruita standardizzando la v.c. Differenza fra medie campionarie ed ottenendo così una distribuzione t-student con (η1+η2-2) gradi di libertà.

CASO B: Si effettua il pre-test (confronto fra varianze) per verificare se le varianze non note sono uguali fra loro. Se si accetta l’ipotesi nulla si continua il test come nel punto a.

Nota: Valgono, analogamente al test parametrico sulla media, le stesse considerazioni fatte in nota, a riguardo l’approssimazione con la normale e a riguardo la correzione della varianza nel caso di estrazione senza ripetizione.

Stimatore corretto della varianza comune nelle due popolazioni

Statistica test per il confronto fra medie (varianza comune stimata)

Esempio

Problema
Il direttore del Servizio Orientamento di un noto Ateneo è convinto che lo stipendio medio (annuale) di un neolaureato in ingegneria gestionale sia superiore a quello di un neolaureato in economia aziendale. Per avvalorare tale ipotesi sono stati intervistati 15 laureati di ciascun corso di laurea, scelti a caso tra i laureati dell’ultimo a.a. I risultati dell’indagine sono riportati nella tabella in figura.

Assumendo che le varianze campionarie siano corrette, verificare se il direttore ha ragione ad un livello di significatività del 5%?

Esempio (segue)

Soluzione
In primis, occorre verificare se le varianze della popolazione (incognite) sono uguali. In questo caso si fa un pre-test sulla varianza. Alternativamente si ipotizza che le due popolazioni hanno la stessa varianza (ipotesi di omoschedasticità). In quest’ultimo caso, la stima corretta della varianza comune risulta pari a 96,18.
Si assume come ipotesi nulla che non ci sia differenza nello stipendio tra i neolaureati dei due corsi di laurea, mentre come ipotesi alternativa che i neolaureati di ingegneria abbiamo uno stipendio medio superiore a quello dei neolaureati di economia.
Applicando la statistica test distribuita come una t-Student è possibile determinare il valore empirico pari a 11,39. Il valore critico del test, al livello α = 0.05 e con 28 gradi di libertà, è pari a 1,70.
Dal momento che il valore empirico è di gran lunga superiore al valore critico, è possibile concludere il test rifiutando l’ipotesi nulla con il livello di significatività del 5%.

La decisione nel test in base al p-value

Si può definire una regola di decisione alternativa a quella basata sul confronto tra il valore empirico della variabile test ed il valore critico calcolato fissando a-priori il livello α di significatività del test.

Si assume di condurre un test unidirezionale e si associa al valore empirico calcolato sulla base della variabile test (assumendo vera l’ipotesi nulla) il livello di probabilità lasciato nella coda della sua distribuzione. In altre parole, si determina sulle tavole statistiche la probabilità lasciata alla destra o alla sinistra del valore empirico del test (invece di calcolare il valore critico sulla base del livello di significatività del test).

Tale livello di probabilità è detto p-value ed esprime il livello più piccolo di significatività che possa essere fissato per rigettare l’ipotesi nulla. Pertanto, la decisione finale potrà essere basata sul confronto tra il p-value ed il livello di significatività α che si sarebbe voluto scegliere a-priori: se il p-value è inferiore o uguale ad α allora si può rigettare l’ipotesi nulla, altrimenti non si hanno elementi sufficienti per rigettare l’ipotesi nulla.

Un’altra interpretazione utile è la seguente: tenuto conto dell’evidenza campionaria (il valore empirico del test), il p-value esprime la somma che si è disposti a scommettere in favore dell’ipotesi nulla per ottenere in caso di successo (ipotesi vera) una somma pari ad uno. Tale somma esprime la credibilità dell’ipotesi nulla sulla base dell’evidenza empirica, tanto più piccolo è il p-value tanto meno credibile è l’ipotesi nulla per poterla accettare.

Le lezioni del Corso

1. Presentazione del corso

2. Campionamento statistico e statistiche campionarie di uso più frequente

3. Stimatore e proprietà per piccoli campioni

4. Proprietà asintotiche degli stimatori, leggi di convergenza e teorema del limite centrale

5. Metodi di stima puntale

6. Teoria della stima intervallare

7. Teoria della verifica delle ipotesi: la costruzione del test parametrico

8. Test parametrici su probabilità di successo, su varianza, su confronto fra varianze, su confronto fra medie