Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D Le Miniguide all'orientamento Gli eBook di Federica La Corte in Rete
 
I corsi di Scienze Politiche
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Carmela Cappelli » 9.Vc multivariate


Vc multivariate – introduzione

Si consideri una prova che genera una collezione di eventi inclusi nello spazio campione \Omega. Se a ciascun evento E di tale spazio campione si associa un’unica k-pla ordinata di numeri reali (x1, x2, …, xk), allora risulta definita una vc multivariata a k dimensioni (x1, x2, …, xk).
La vc multivariata, pertanto, fa corrispondere ad ogni evento un punto dello spazio Rk anche in tale caso la corrispondenza avviene attraverso una funzione misurabile.

Vc mutivariate

Le singole vc X1, X2, …, Xk vengono dette vc componenti mentre ciascun sottoinsieme di p<k vc componenti è detta vc marginale di dimensione p. Quindi ciascuna vc componente è anche una vc marginale di dimensione 1.
Delle vc multivariate interessa soprattutto studiare la distribuzione congiunta ovvero la probabilità del verificarsi contemporaneo delle k-ple di numeri reali e ciò allo scopo di mettere in luce eventuali “legami” che sussistono tra le vc componenti.

Aspetti qualificanti di una vc mutlivariata

In analogia a quanto visto per le vc univariate anche per quelle multivariate, ai fini della loro conoscenza, occorre porsi i seguenti quesiti:

  1. Quando una vc multivariata può dirsi nota?
  2. Sotto quali condizioni la vc multivariata può dirsi ben definita?
  3. Come si può rappresentare graficamente una vc mutivariata?

Nel rispondere a tali quesiti distinguiamo il caso delle vc mutivariate discrete e continue.

Vc multivariate discrete

Data una vc multivariata discreta (X1, X2, …, Xk), essa è nota se sono note le k-ple di numeri reali (x1, x2, …,xk) ∈Rk, che essa può assumere in corrispondenza degli eventi dello spazio campione discreto \Omega e le corrispondenti probabilità:
Pr(X_1=x_1,X_2=x_2,\dots,X_k=x_k), \forall (x_1,x_2,\dots,x_k) \in R^k.

Essa è ben definita se:

  • Pr(X_1=x_1,X_2=x_2,\dots,X_k=x_k) \geq 0 , \forall (x_1,x_2,\dots,x_k) \in R^k;
  • \sum_{x_1,x_2,\dots,x_k \in R^k}Pr(X_1=x_1,X_2=x_2,\dots,X_k=x_k)=1

Vc multivariate discrete (segue)

La funzione di ripartizione di una vc multivariata discreta è definita come:
F_{X_1,X2,\dots,X_k}(x_1,x_2,\dots,x_k)=Pr( X_1\leq x_1, X_2\leq x_2, \dots, X_k\leq x_k)= \sum_{X_1 \leq x_1, X_2 \leq x_2, \dots, X_k\leq x_k} p (x_1,x_2,\dots,x_k)

Le proprietà della funzione di ripartizione sono analoghe a quelle viste nel caso univariato con la necessaria attenzione al fatto che tutte le probabilità che possono essere calcolate a partire da essa mediante unione, intersezione e negazione di intervalli di Rk, devono essere positive.

Indipendenza probabilistica

Nello studio delle vc multivariate assume particolare rilievo il concetto di indipendenza probabilistica che attiene alle vc componenti.
In caso infatti di indipendenza delle componenti la distribuzione di probabilità congiunta si fattorizza nel prodotto delle distribuzioni di probabilità marginali delle componenti.
In termini di funzione di ripartitone si ha: F_{X_1,X2,\dots,X_k}(x_1,x_2,\dots,x_k)= F_{X_1}(x_1) F_{X_2}(x_2)\dots F_{X_k}(x_k)\

Vc condizionate

Data una vc mutivariata, accanto alle vc marginali che escludono dalla considerazione una o più variabili componenti, si definiscono le vc condizionate che invece esprimono la distribuzione di probabilità della vc multivariata avendo fissato i valori di una o più vc componenti.
Considerando il caso della vc doppia discreta (X,Y) , si definiscono le seguenti distribuzioni condizionate:

.

Pr(Y=y\mid X=x_0)=\frac{Pr(X=x_0 ,Y=y)}{Pr( X=x_0)}

.

Pr( X=x\mid Y=y_0)=\frac{Pr( X=x, Y=y_0)}{Pr(Y=y_0)}

I momenti misti

Anche per le vc multivariate si pone il problema della sintesi mediante valori medi.
Si definiscono pertanto i cd momenti misti di ordine r1+r2+….+rk:

E(X_1^{r_1},X2^{r_2},\dots,X_k^{r_k})=\sum_{x_1, x_2, x_k \in R^k} (x_1^{r_1},x2^{r_2},\dots,x_k^{r_k}) pr (x_1,x_2,\dots,x_k)

Come vedremo, nella pratica sono di interesse i momenti misti solo di alcuni ordini che servono sovente a mettere in luce legami esistenti tra le vc componenti.

Vc multivariate continue

La vc multivariata continua definita su Rk è nota se è nota la sua funzione di ripartizione: F_{X_1,X2,\dots,X_k}(x_1,x_2,\dots,x_k)=Pr( X_1\leq x_1, X_2\leq x_2, \dots, X_k\leq x_k)= \int_{- \infty}^{x_1} \int_{- \infty}^{x_2}\dots\int_{- \infty}^{x_k} f (x_1,x_2,\dots,x_k) dx_1dx_2,\dots,dx_k

Dove  f (x_1,x_2,\dots,x_k) prende il nome di funzione di densità della vc continua multivariata la quale è ben definita se:

  • f (x_1,x_2,\dots,x_k)\geq 0
  • \int_{- \infty}^{+\infty} \int_{- \infty}^{+\infty}\dots\int_{- \infty}^{+\infty} f (x_1,x_2,\dots,x_k) dx_1dx_2,\dots,dx_k=1

Vc multivariate continue (segue)

Analogamente a quanto visto per le vc discreta anche per le vc continue si definiscono le vc condizionate ma, siccome la funzione di densità di una vc continua in un punto è nulla, occorre considerare ai fini del condizionamento, un intervallo di valori.
Considerando il caso di vc continua doppia (x,y) le due vc condizionate sono definite come segue:

.
Pr(y\leq Y\leq y+dy \mid x_0 \leq X \leq x_0+dx )=\frac{Pr(y \leq Y \leq y+dy, x_0 \leq X \leq x_0+dx)}{Pr(x_0 \leq X \leq x_0+dx)}

.

Pr(x \leq X \leq x +dx \mid y_0 \leq Y \leq y_0+dy)=\frac{Pr(y\leq Y \leq y+dy, x_0\leq X \leq x_0+dx)}{Pr(y_0 \leq Y \leq y_0+dy)}

Vc multivariate continue (segue)

In analogia al caso discreto anche per le vc continue multivariate si introduce il concetto di indipendenza probabilistica delle vc componenti. Formalmente una vc continua multivariata è a componenti indipendenti se per ogni k-pla di numeri reali (x1, x2, …, xk), si ha:
Pr( X_1\leq x_1, X_2\leq x_2, \dots, X_k\leq x_k)= Pr(X_1 \leq x_1)Pr(X_2 \leq x_2)\dots, Pr(X_k\leq x_k)= \int_{- \infty}^{x_1} f (x_1)dx_1 \int_{- \infty}^{x_2 } f(x_2)dx_2\dots\int_{- \infty}^{x_k} f(x_k) dx_k

E quindi la indipendenza si caratterizza per la fattorizzazione della funzione di densità congiunta nel prodotto delle funzioni di densità delle singole vc componenti.

Indipendenza probabilistica

In caso di indipendenza delle vc componenti una vc mutivariata, la fattorizzazione investe anche i momenti.
Si consideri ad esempio la vc doppia discreta (X,Y) a componenti indipendenti, il momento misto di ordine 1+1 è dato da:
E(XY)=\mu_{1,1}=\sum_{x\in R}\sum_{y\in R}xy p_{X,Y}(x,y)=\sum_{x\in R}x p_{X}(x) \sum_{y\in R}y p_{Y}(y)=\mu_x \mu_y

Quindi il valore atteso del prodotto è dato dal prodotto dei valori attesi delle vc componenti, sempre che tali moneti esistano.

  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion