Una Variabile Casuale (v.c.) è una regola (funzione reale) che associa ad E (evento elementare di Ω) uno ed un solo numero reale.
Spesso una v.c. non è altro che la traduzione numerica immediata degli eventi elementari, ma può essere anche una funzione più complessa definita sugli eventi di Ω.
Si pensi ad esempio alla prova “lancio di un dado”.
Per convezione, attribuiamo un numero ad ognuna delle facce del dado.
Oppure nelle carte da gioco, dove associamo un numero ad ognuna delle carte del mazzo (l’asso vale uno, il re vale 10, ecc.)
Ciò in quanto l’uso di numeri, in luogo della descrizione qualitativa di eventi, permette il ricorso ad una serie di strumenti di ausilio alla descrizione della prova (i.e. il calcolo del risultato atteso del lancio di un dado o di una misura della variabilità dei risultati).
Ad ogni valore assunto dalla variabile casuale è possibile associare una probabilità utilizzando la misura di probabilità definita sui sottoinsiemi dello spazio campionario Ω.
“Si verifica l’evento E con probabilità P(E)”
da cui
“La v.c. X assume il valore x con probabilità P(x)”
La misura di probabilità definita sui valori di X prende il nome di funzione di probabilità della v.c. X.
Si indica invece come supporto della v.c. X l’insieme dei valori che X può assumere con una certa probabilità positiva in una prova specifica.
Una variabile casuale può essere:
Una variabile casuale discreta è un corrispondenza tra gli eventi di Ω ed un insieme discreto (finito o numerabile) di numeri reali.
Una v.c. discreta è nota se si conoscono i valori che può assumere e le rispettive probabilità.
Una sua rappresentazione grafica si ottiene ponendo sull’asse delle ascisse i valori della X e sulle ordinate le probabilità associate alle x.
Sia P(X=xi)=pi
Una v.c. discreta è ben definita se rispetta i postulati della probabilità:
Una variabile casuale continua X è una funzione misurabile e a valori reali che assegna ad ogni evento E, contenuto in Ω di uno spazio di probabilità continuo, un numero reale x appartenente a R.
In altre parole la v.c. continua può assumere tutti i valori compresi in un dato intervallo reale.
Essa presenta una maggiore complessità rispetto alle v.c. discrete in quanto non è possibile elencare tutti i valori che la variabile casuale assume, essendo questi un’infinità.
Per ovviare a ciò si assegna la probabilità, non a singoli valori, ma ad intervalli di valori di R sulla base della natura e della specificità della prova.
Data una v.c. continua X, essa è nota se, per ogni numero reale x, è nota funzione F(x) oppure la funzione f(x).
Le due funzione sono definite dalla seguente relazione:
F(x)=P(-∞≤X≤x)=P(X≤x)=∫x f(w)dw
F(x) è detta funzione di ripartizione della v.c. X
Essa esprime la probabilità che la v.c. X “assuma valori fino a x“.
La conoscenza di F(x) è necessaria e sufficiente per calcolare qualunque probabilità su X (utilizzando i postulati e i teoremi della probabilità).
f(x) è detta funzione di densità della v.c. X
Essa esprima la densità di probabilità in un intervallo infinitesimale.
Così come per la variabili discrete, una v.c continua è ben definita se rispetta i postulati della probabilità:
1) Positività
f(x)≥0
2) Certezza
L’integrale di f(x) nell’intervallo in cui è definita la variabile X è pari a 1.
Così come per le variabili statistiche, anche per le variabili casuali è possibile calcolare alcuni indici di sintesi che ne consentano la descrizione e il confronto.
In particolare si fa riferimento al valor medio e alla varianza di una v.c.
Si definisce valore atteso (momento primo o valor medio) di una v.c. X, la somma dei valori della X ponderati per le rispettive probabilità.
Nel caso di v.c. continue il concetto di somma è da “intendersi nel continuo” per cui l’operatore somma trova suo analogo nell’integrale.
Il valore atteso è indicato con il simbolo E().
Si definisce varianza (momento secondo) di una v.c. X, la somma degli scarti al quadrato tra i valori x e il valor medio, ponderati per le rispettive probabilità.
Nel caso di v.c. continue il concetto di somma è da “intendersi nel continuo” per cui l’operatore somma trova suo analogo nell’integrale.
La disuguaglianza di Cebicev è uno dei risultati più notevoli del calcolo delle probabilità.
La disuguaglianza afferma che, per ogni v.c. X che E(X)=μ e Var(X)=σ2<+∞, si ha:
P(|X- μ|)<κ)≥1-(1/ ε2)
per ogni ε>0.
Ponendo ε σ=k, la disuguaglianza si può esprimere nel seguente modo:
P(|X- μ|)<κ)≥1-(σ2/ κ2)
per ogni k>0.
In altre parole, l’importanza di questo risultato risiede nel fatto che, noti i momenti primo e secondo di una v.c. X, è sempre possibile trovare un limite inferiore alla probabilità che la variabile assuma valori compresi in un intervallo [μ-ε σ; μ+ε σ].
Ciò anche quando è ignota la funzione di probabilità della variabile casuale!!!
Nella prossima lezione si affronteranno i seguenti argomenti:
alcune variabili casuali discrete notevoli
1. Introduzione
3. Distribuzioni di frequenza e rappresentazioni grafiche
4. Indici statistici di posizione
5. Indici statistici di variabilità
6. Forma di una distribuzione statistica
7. Distribuzioni doppie di frequenza
8. Relazioni tra variabili: Associazione e dipendenza in media
9. Relazioni tra variabili: Correlazione lineare
11. Rapporti statistici e numeri indici
12. Introduzione al calcolo delle probabilità