Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D Le Miniguide all'orientamento Gli eBook di Federica La Corte in Rete
 
I corsi di Sociologia
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Amalia Caputo » 29.Introduzione all'analisi trivariata


Analisi trivariata: introduzione

Si è visto che l’analisi bivariata consente di descrivere una relazione tra due variabili e i formulare una congettura sul tipo di legame che tra esse intercorre. Quello che l’analisi bivariata non permette di fare è controllare la nostra congettura.
In altre parole, non possiamo formulare un giudizio di possibilità sul legame che le due variabili possono avere con una terza variabile, la quale potrebbe influenzare la natura del loro legame.

L’introduzione di una terza variabile richiede, naturalmente, che questa ultima sia una variabile manifesta.
Restando nel modello lineare-standard, introdurre una terza variabile equivale a introdurre una terza colonna alla matrice varianze-covarianze.

Analisi trivariata: matrice varianze-covarianze

La matrice varianze covarianze è una matrice dati che si ricava da una matrice casi per variabili mediante operazioni di calcolo matriciale. In essa sono presenti delle variabili sia in riga che in colonna. Nei dati di cella si trovano – in diagonale principale – le varianze delle diverse variabili, nelle altre celle le covarianze tra coppie di variabili.
L’introduzione della terza variabile inserisce, dunque, le informazioni aggiuntive rxz e ryx

Matrice varianze-covarianze di variabili standardizzate.

Matrice varianze-covarianze di variabili standardizzate.


Tipi di congetture

Che uso possiamo fare di queste due nuove informazioni?
La risposta dipende dal tipo di congettura di partenza. Nell’analisi multivariata le congetture più utilizzate sono di due tipi:

1. Tipo a: modello dell’indipendenza semantica
Le due variabili di partenza devono essere semanticamente indipendenti. Non importa se sono correlate o no. La domanda di partenza è: Y dipende da X? Il modello è strettamente collegato alla problematica dei controlli di genuinità.

2. Tipo b: modello della dipendenza statistica
Non importa l’autonomia semantica delle variabili di partenza. La domanda che è alla base è: X e Y si comportano come se dipendessero da una terza variabile? Tale modello è collegato alla problematica classica della “misurazione”, cioè all’individuazione di variabili latenti.


Congettura A e terze variabili in caso di relazione

Le nostre congetture, a qualsiasi tipo esse appartengano, restano tali se non disponiamo di informazioni.
È l’introduzione di una terza variabile che rende controllabili tali congetture.
La scelta della terza variabile da introdurre dipende molto dal tipo di congettura adottata.
Per la congettura di Tipo A esistono quattro possibili diagrammi che ci possono aiutare a scegliere che tipo di terza variabile introdurre.
La relazione può essere autonoma da Z (I e II caso), mediata da Z (III caso) o dovuta a Z (ultimo caso).
Questo quando esiste una relazione tra X e Y.

Controllo di una congettura di tipo A. Fonte: Ricolfi L., Tre variabili. Un introduzione all’analisi multivariata, Franco Angeli, Milano, 1993, p.72

Controllo di una congettura di tipo A. Fonte: Ricolfi L., Tre variabili. Un introduzione all'analisi multivariata, Franco Angeli, Milano, 1993, p.72


Congettura A e terze variabili in caso di assenza di relazione

Quando la relazione tra X e Y non esiste allora è possibile scegliere tra altri tipi di rappresentazioni grafiche della relazione.
Nei primi due casi è mostrato come l’assenza di relazione tra X e Y permanga nonostante l’introduzione di una terza variabile.
Gli altri due casi mostrano invece, come l’assenza di relazione si riveli il risultato netto di due forze che si elidono (Ricolfi, 1993).

Controllo di una congettura di tipo A in caso di assenza di relazione tra x e y. Fonte: Ricolfi L., Tre variabili. Un introduzione all’analisi multivariata, Franco Angeli, Milano, 1993, p.73.

Controllo di una congettura di tipo A in caso di assenza di relazione tra x e y. Fonte: Ricolfi L., Tre variabili. Un introduzione all'analisi multivariata, Franco Angeli, Milano, 1993, p.73.


Congettura B e terze variabili

Quando la relazione tra X e Y esiste e la congettura è di tipo B allora occorrerà introdurre una terza variabile che sia una variabile manifesta (caso 1). La relazione di quest’ultima con X e Y potrà essere letta nello stesso modo in cui viene interpretata la relazione tra X e Y. Se invece ciò non è possibile (caso 2) si deve pensare all’intervento di una variabile latente che nel nostro caso è una quarta variabile.
Nel caso adottassimo congetture di tipo B non si tratta di scegliere un diagramma, ma di stabilire quale diagramma è compatibile con i nostri dati.

Controllo di una congettura di tipo B. Fonte: Ricolfi L., Tre variabili. Un introduzione all’analisi multivariata, Franco Angeli, Milano, 1993, p.73

Controllo di una congettura di tipo B. Fonte: Ricolfi L., Tre variabili. Un introduzione all'analisi multivariata, Franco Angeli, Milano, 1993, p.73

Controllo di una congettura di tipo B. Fonte: Ricolfi L., Tre variabili. Un introduzione all’analisi multivariata, Franco Angeli, Milano, 1993, p.73

Controllo di una congettura di tipo B. Fonte: Ricolfi L., Tre variabili. Un introduzione all'analisi multivariata, Franco Angeli, Milano, 1993, p.73


Congetture e terze variabili

Ricapitolando quanto detto sinora possiamo dire che la distinzione tra i tipi di congetture possono anche essere ricondotte ad una distinzione delle tecniche di analisi utilizzate (vedi tabella).

In realtà la distinzione è ben più complessa di quella esistente tra i tipi di tecniche di analisi da utilizzare e tra spiegazione e interpretazione.


Congetture e terze variabili (segue)

Molto dipende se facciamo un uso ristretto o un uso lato dei termini “spiegazione” e “interpretazione”. Se facciamo riferimento alla seconda metà dell’800 rintracciamo una contrapposizione tra spiegazione e comprensione che assume varie sfumature. Il ricorso al termine interpretazione è adottato da Ricolfi in sostituzione a quello troppo vago e complesso di spiegazione.

Fonte: Ricolfi L., Tre variabili. Un introduzione all’analisi multivariata, Franco Angeli, 
Milano, 1993, p.80.

Fonte: Ricolfi L., Tre variabili. Un introduzione all'analisi multivariata, Franco Angeli, Milano, 1993, p.80.


I contributi di Lazarsfeld e Rosenberg

La funzione principale della terza variabile è di stabilire quanto genuina sia la relazione tra due variabili e quanto, invece, sia da attribuire a se stessa. Questo rimanda inevitabilmente a Lazarsfeld e ai contributi che lo studioso ha fornito in termini di interpretazione della relazione statistica e ai primi lavori sui modelli causali. In letteratura spesso tale contributo di Lazarsfeld viene tralasciato, ma è stato lui a concentrarsi sull’importanza che nella spiegazione ha la relazione tra le variabili e non le variabili prese in esame singolarmente.
L’introduzione del “controllo” della relazione è da attribuire proprio a Lazarsfeld che ha avuto anche il grande merito di far si che il paradigma della correlazione soppressa potesse farsi strada.

È invece a Rosenberg che si deve un’importante distinzione tra i due modi della spiegazione: egli distingue tra l’analisi delle covariazione e l’analisi delle variazioni. Questo perché la prima analizza la covariazione tra X e Y alla luce di una terza variabile Z, detta variabile di controllo. L’analisi delle variazioni considera la variazione di Y in base X e Z considerate due variabili indipendenti. Tale distinzione è fondamentale in sede di analisi , in quanto un modello può essere soddisfacente dal punto di vista dell’analisi delle variazioni senza esserlo sotto il punto di vista dell’analisi della covariazione.

Tre variabili: tipi di relazione

Prima di affrontare di come occorre procedere per spiegare una relazione, è necessario operare una distinzione teorica tra i tipi di relazione che si possono instaurare tra tre variabili. Infatti, come anticipato all’inizio di questa lezione, l’individuazione della variabile Z non è un problema statistico, ma un problema teorico.

Possono verificarsi tre tipi di relazioni:

  1. relazione spuria;
  2. relazione indiretta;
  3. relazione condizionata.

1. La relazione spuria

È il caso di presenza di covariazione in assenza di causazione.
Il meccanismo causale è il seguente: la covariazione fra le due variabili X e Y è provocata da una terza variabile Z (chiamata variabile di controllo) che agisce casualmente sia su X che su Y; mentre queste due covariano a causa della loro relazione con la Z, (la loro relazione è spuria, apparente, ingannevole, errata).
Se la variabile Z diventa costante, cioè se non varia più, anche la covariazione tra X e Y cessa.
Nel caso della relazione spuria, l’azione di Z può essere eliminata mediante controllo o depurazione.
a) Il controllo si effettua analizzando la relazione tra X e Y in sub-campioni in cui Z è tenuta costante.
b) La depurazione si effettua per via matematica: note le covariazioni tra X,Y e Z si calcola quello che sarebbe il coefficiente di correlazione tra X e Y se non ci fosse l’azione di Z.
Un caso particolare di relazione spuria è quello in cui le variabili sono indicatori di uno stesso concetto: convenzionalismo ed etnocentrismo possono essere indicatori della personalità autoritaria.

Spiegazione (relazione spuria)

Spiegazione (relazione spuria)


2. La relazione indiretta

Abbiamo una relazione indiretta fra due variabili X e Y quando il loro legame causale è mediato da una terza variabile Z; anche in questo caso, la covariazione trovata tra X e Y è in realtà dovuta ad una terza variabile Z, che funge da “ponte” fra X e Y. La terza variabile Z “interviene” quindi nel rapporto tra X e Y per questo viene chiamata interveniente. In questo caso non si può dire che non esista relazione causale fra X e Y: il nesso esiste nella forma di una catena causale fra variabili. La terza variabile è detta anche “variabile mediatrice” o “mediatore”. Per chiarire il significato della mediazione consideriamo il diagramma di path presentato nella figura in basso a destra.

Relazione indiretta.

Relazione indiretta.


2. La relazione indiretta (segue)

Una variabile funziona come mediatore quando si verificano le seguenti condizioni:

  • variazioni nei livelli del predittore si associano in modo significativo a variazioni nel presunto mediatore (path a);
  • variazioni nel mediatore si associano a variazioni significative nella variabile dipendente o criterio (path b);
  • quando i path a e b sono controllati, la relazione tra predittore e criterio da significativa che era diventa non significativa (la dimostrazione più stringente della mediazione si ha quando c diventa uguale a 0).

Poiché molte aree della psicologia trattano fenomeni che hanno cause multiple, uno scopo più realistico può essere quello di ricercare mediatori che diminuiscono in modo significativo la forza (o intensità) del path c piuttosto che cercare mediatori che lo cancellino del tutto.

3. La relazione condizionata

Una relazione condizionata è quella in cui la relazione fra due variabili cambia a seconda del valore assunto da una terza variabile. Ci troviamo di fronte a un fenomeno di interazione fra le variabili implicate.


Spiegare una relazione

Sostanzialmente introdurre una terza variabile equivale a spiegare la relazione o l’assenza della stessa tra due variabili. È proprio per tale motivo che la variabile Z viene definita “variabile di controllo” (controlla l’originalità della relazione esistente tra X e Y).

Per effettuare un “controllo” devono esserci due presupposti:

  1. occorre manipolare una variabile indipendente (X);
  2. bisogna osservare il comportamento della variabile dipendente (Y) a seguito della manipolazione, ossia della variazione di (X).

Manipolazione, Depurazione e stratificazione

Naturalmente una concezione così “pura” e derivante dal controllo sperimentale proprio delle scienze fisiche non è sempre applicabile alle scienze sociali. È per tale motivo che il controllo in tali discipline assume oggi tre diversi significati: Manipolazione (Fischer, 1935; Salomon, 1949), Depurazione e Stratificazione.

Manipolazione: (Fischer, 1935; Salomon, 1949): significato più vicino all’esperimento classico di laboratorio. Prevede la suddivisione dei soggetti in due gruppi simili e la somministrazione dello stimolo (X) a uno dei due gruppi.

Depurazione: Consiste nella detrazione dal fenomeno studiato da quella parte che si suppone – per previe induzioni – essere l’effetto di certi antecedenti; rappresenta il residuo del fenomeno, è l’effetto dei rimanenti antecedenti (Mill J.S., 1843, p. 260). Il suo limite è rappresentato dalla necessità di presupporre una certa linearità.

Stratificazione: impone l’utilizzo di una variabile categoriale come variabile di controllo. Questo procedimento venne messo a punto da Lazarsfeld verso la fine degli anni ‘40. Può essere considerato un procedimento di controllo alternativo.

I materiali di supporto della lezione

Cardano M, Miceli R., 1991, Il linguaggio delle variabili, Rosenberg & Sellier, Torino.

Di Franco G.,2001, EDS: esplorare, descrivere e sintetizzare i dati. Guida pratica all'analisi dei dati nella ricerca sociale, Franco Angeli, Milano.

Ricolfi L., 1993, Tre variabili. Un introduzione all'analisi multivariata, Franco Angeli, Milano.

Rosenberg M., 2003, La logica dell'analisi trivariata, Franco Angeli, Milano.

  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion