Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D Le Miniguide all'orientamento Gli eBook di Federica La Corte in Rete
 
I corsi di Sociologia
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Amalia Caputo » 28.La relazione tra due variabili cardinali


Introduzione

Per poter analizzare la relazione tra due variabili cardinali si ricorre a:

  1. coefficiente di regressione;
  2. coefficiente di correlazione;
  3. coefficiente di determinazione.

Coefficiente di regressione b


Caratteristiche di b

Quattro sono le caratteristiche di b:

  1. è un coefficiente uni-direzionale;
  2. predice il punteggio di I su Y a partire dal punteggio di X;
  3. non informa sulla forza della relazione;
  4. risente delle unità di misura di X e Y: è pertanto poco sensibile alla distanza dei punti alla retta di regressione. Per tale motivo più i punti sono vicini alla retta di regressione più la predizione che possiamo fare è affidabile.

In sintesi
Il coefficiente di regressione (b) risente molto delle unità di misura delle variabili cardinali prese in esame, pertanto non fornisce una giusta stima della distanza dei punti dalla retta.
Tra le altre cose b ci suggerisce l’inclinazione della retta, ma nulla ci dice sulla forza della relazione tra le due variabili. Per questo è opportuno ricorrere ai coefficienti presentati nella lezione 28.

Coefficiente di correlazione r

Il coefficiente di correlazione r misura il grado di associazione fra le due variabili cardinali ovvero informa su quanto le due variabili variano insieme (codevianza) rispetto a quanto (diviso) ciascuna varia per conto proprio (media geometrica delle devianze). R presuppone una relazione bidirezionale (X ed Y sono intercambiabili).

r=\frac{\sum x_iy_i}{\sqrt{\sum x_i^2 \sum y_i^2}}

NB: Essendo r “standardizzato”, non risente dell’unità di misura delle due variabili di partenza.


r=\frac{\text{Covarianza di X eY}}{\text{Prodotto scarti-tipo di X e Y}}=


={Quanto X e Y variano insieme
rispetto a quanto
ciascuna varia per conto suo }
{(cfr. denominatore di b)}


Esempio:
X = anni passati a scuola;
Y = reddito espresso in €;
r = 0,67

Interpretazione del coefficiente di correlazione r

Il coefficiente di correlazione r può assumere valori positivi e valori negativi.

Esso varia tra -1 e +1.

  • Se esiste una relazione positiva perfetta allora il suo valore sarà pari a +1.
  • Se esiste una relazione negativa perfetta assumerà valore pari a -1.
  • In assenza di relazione tra le due variabili, r sarà pari a zero.

Coefficiente di correlazione: caratteristiche

Vantaggi:

  • è un indice relativo: varia quindi tra -1 e + 1 (è normalizzato);
  • non è influenzato dalle unità di misura delle variabili di partenza (è standardizzato);
  • non risente dell’ampiezza del campione;
  • il fatto che r sia standardizzato (non risente delle unità di misura delle variabili) e sia normalizzato (si colloca tra 0 e 1) sono due caratteristiche che incidono positivamente sulle analisi comparate che r ci permette di fare. Comparare i valori di r non è possibile solo tra variabili che hanno unità di misura differenti, ma anche tra variabili che appartengono a campioni diversi.

Svantaggi:

  • risente molto dei valori outliers;
  • sottostima l’intensità delle relazioni curvilinee;pertanto in tali casi il calcolo di r ci suggerirà un’assenza di relazione.
Uno dei limiti di r:effetto degli outliers sulla retta di regressione. Fonte: Corbetta P. G., La ricerca sociale: metodologia e tecniche – L’analisi dei dati, Bologna, Il mulino, 2003, p.237

Uno dei limiti di r:effetto degli outliers sulla retta di regressione. Fonte: Corbetta P. G., La ricerca sociale: metodologia e tecniche - L'analisi dei dati, Bologna, Il mulino, 2003, p.237


Il coefficiente di determinazione R2

Il coefficiente di determinazione quantifica la distanza tra la relazione lineare e la relazione che intercorre tra le variabili X e Y considerate. È la proporzione di variazione di una variabile che è “spiegata” dall’altra. In sostanza esso valuta la distanza tra l’associazione perfettamente lineare e la relazione effettiva.
Gli scarti di Yi dalla media di Y (devianza di Y) si possono esprimere:

\sum(Y_i- \bar Y)^2=~~~ \sum (Y_i - \hat Y)^2 + ~~~~~\sum (\hat Y- \bar Y)^2

Devianza Totale=Devianza Residua+Devianza riprodotta dalla regressione lineare sulla X

Dispersione casuale=Dispersione casuale+Dispersione sistematica

……………………………………………………………….

R^2=\frac{\text{Varianza riprodotta}}{\text{Varianza totale}}= \text{proporzione della varianza di Y}~~\text{riprodotta mettendo X in relazione con Y}

R^2=\frac{\sum\Biggl(\hat Y- \bar Y\Biggr)^2}{\sum\Biggl(Y_i - \bar Y\Biggr)^2}


Caratteristiche del coefficiente di determinazione

R2 esprime quanto migliora la predizione se – invece di considerare solo la media di Y- si considerano i valori predetti dalla retta di regressione:

  • è un coefficiente bi-direzionale (X ed Y sono intercambiabili);
  • varia tra 0 (relazione non lineare) e 1 (relazione lineare);
  • è simile a η2: è possibile confrontare r2 e η2 relativi a relazioni tra coppie di variabili differenti.

Interpretazione di R2


Tavola riassuntiva


Un po’ di storia…..

  • 1662 J. Grount, ‘correlazione’ ß dipendenza reciproca fra rachitismo, occlusione dello stomaco e sollevamento dei polmoni.
  • 1846 A. Bravais (statistico francese): inventa il coefficiente di correlazione.
  • 1869 F. Galton fonda la “Biometria”, la disciplina che mira a quantificare il comportamento umano. Galton fu il primo ad utilizzare la correlazione e ad introdurre il concetto di regressione in uno studio che aveva come scopo porre in relazione altezza dei figli e altezza dei padri. Egli contribuì in maniera determinate all’evoluzione dell’ analisi dei dati
  • K. Pearson, contemporaneo e collega di Galton, pubblica un saggio in cui le soluzioni prospettate sono formalizzate e generalizzate, considerate come svincolate da singoli problemi .

Un pò di storia

Sir Francis Galton (1822-1911) .

Sir Francis Galton (1822-1911) .

Karl Pearson (Londra 1857-Londra 1936) .

Karl Pearson (Londra 1857-Londra 1936) .


I materiali di supporto della lezione

Corbetta P. G., La ricerca sociale: metodologia e tecniche- L'analisi dei dati, Bologna, Il mulino, 2003.

Di Franco G., EDS: Esplorare, descrivere e sintetizzare i dati. Guida pratica all'analisi dei dati nella ricerca sociale, Milano, Franco Angeli, 2001.

Marradi A., 1997, Linee guida per l'analisi bivariata dei dati nelle scienze sociali, Franco Angeli, Milano.

Micheli G.A., Manfredi P., 1996, Correlazione e regressione, Franco Angeli, Milano.

Un pò di storia

  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion