Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D La Corte in Rete
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Amalia Caputo » 14.L'analisi dei dati con variabili cardinali


I valori sintetici delle variabili cardinali

Come si è sottolineato in precedenza (lez. 13), i valori caratteristici della variabili cardinali e quasi-cardinali sono detti sintetici (Marradi, 1999).

Tutti questi valori si basano sulla media; più precisamente, sul quadrato degli scarti dalla media.

\sum xi^2

I valori sintetici delle variabili cardinali – caratteristiche

Secondo Galtung (1967, 207-212), un buon valore sintetico per essere definito tale deve rispondere a sei parameter (requisiti):

  • considerare tutte le informazioni della distribuzione;
  • essere applicabile a tutte le distribuzioni;
  • essere semplice da calcolare;
  • non risentire della “particolarità” dei valori della distribuzione;
  • non risentire delle possibili trasformazioni della distribuzione;
  • variare tra -1 e +1.

Non tutti i requisiti sono applicabili a tutti i valori sintetici.

I valori sintetici delle variabili cardinali

  1. Devianza
  2. Varianza
  3. Scarto tipo
  4. Coefficiente di variazione

Nota: sul concetto di asimmetria vedi lezione 16.

1. Devianza

La devianza è la somma dei quadrati degli scarti dalla media.

Caratteristiche:

  • È influenzata dal numero dei casi; all’aumentare di N la dispersione diminuisce;
  • Si utilizza per confrontare due distribuzioni con un N simile;
  • È una grandezza quadratica solo idealmente, in realtà è una sovrapposizione di quadrati;
  • È espressa in valori assoluti.

dev=\sum xi^2

\Downarrow

xi=(Xi-\bar X)

La devianza: esempio


2. La varianza

La varianza è il rapporto tra devianza e numero dei casi.

Caratteristiche:

  • Si utilizza per confrontare differenti distribuzioni aventi media uguale;
  • Si utilizza per confrontare distribuzioni con un N significativamente diverso;
  • È espressa in valori assoluti;
  • È una grandezza quadratica: idealmente è un quadrato ottenuto dalla media di tutti i quadrati degli scarti.

s^2=\frac {\sum xi}N

3. Lo scarto tipo

Lo scarto tipo – detto anche scarto quadratico o deviazione standard – è la radice quadrata della varianza.

Caratteristiche:

  • Si utilizza per confrontare differenti distribuzioni aventi media uguale;
  • Si utilizza per confrontare distribuzioni con un N significativamente diverso;
  • È espresso in valori assoluti;
  • È una grandezza lineare (graficamente è una linea).

s=\sqrt{\frac {\sum xi^2}N}

4. Il coefficiente di variazione

Un discorso a parte merita il coefficiente di variazione che si utilizza come valore sintetico per confrontare due distribuzioni con medie significativamente differenti.

V=\frac s{\bar x}

Il coefficiente di variazione: esempio

Esempio: analisi monovariata della variabile cardinale “reddito” a partire dai singoli casi.

Esempio: analisi monovariata della variabile cardinale “reddito” a partire dai singoli casi.


Valori sintetici: quale scegliere?


Le rappresentazioni grafiche per variabili cardinali


Istogramma, diagramma a bandiera e diagramma a barre

Abbiamo già visto come si costruiscono queste tre rappresentazioni grafiche.
Qui basti dire che se la variabile è cardinale o quasi cardinale e i valori sono numericamente poco consistenti si ricorre a:

  • istogramma o diagramma a bandiera: Se i valori derivano da aggregazioni di stati e/o categorie (classi), ovvero quando il continuum viene suddiviso in categorie adiacenti;
  • diagramma a barre: Se i valori corrispondono a stati discreti enumerabili (conteggio-stessa distanza).
Istogramma
Diagramma a bandiera
Diagramma a barre

Curva di frequenza

Quando i valori sono molti è opportuno utilizzare la curva di frequenza. In ascissa (X) si collocano i valori delle modalità e in ordinata (Y) il numero dei dati che hanno quel valore corrispondente in ascissa.

La curva di frequenza non è una vera e propria curva continua perché di fatto non è costituita da infiniti punti in quanto
I casi non possono essere infiniti;
I valori assunti dalla variabile su ciascun caso non sono infiniti.

Essa è, in realtà, una serie di segmenti allineati che collegano una serie di punti discontinui, ognuno dei quali rappresenta un valore. In altre parole la curva di frequenza è un insieme di punti LIMITATO E DISCRETO.

La curva di frequenza

La curva di frequenza


Poligono di frequenza

Si ricorre al poligono di frequenza quando, una volta aggregati in classi i valori della variabile cardinale, le classi risultano numerose.

Sull’ascissa (X) si riportano i valori, rispettandone la loro natura cardinale, e si congiungono con segmenti tutti i punti di ordinata corrispondente alla frequenza di ogni valore in ascissa.

I poligoni di frequenza possono anche rappresentare le percentuali o frequenze cumulative.

Il poligono di frequenza

Il poligono di frequenza


Alberello

Il grafico ad alberello fornisce un’informazione grafica sulla dispersione di una distribuzione rappresentata dallo scarto – tipo, normalizzata rapportandola alla sua media. In altre parole, esso è la rappresentazione grafica del coefficiente di variazione (V).
Il tronco dell’alberello rappresenta la media.
Il raggio dell’alberello rappresenta lo scarto – tipo.

L’alberello A presenta una media più alta dello scarto tipo, di conseguenza V assumerà un valore inferiore ad 1. Ciò significa che la variabilità è bassa.

L’alberello B presenta una media più bassa dello scarto tipo, di conseguenza V assumerà un valore superiore ad 1. Ciò significa che la variabilità è alta.

Grafico alberello: coefficiente di variazione.

Grafico alberello: coefficiente di variazione.


Rappresentazioni grafiche delle distribuzioni in variabili cardinali

Fonte: Marradi, 1995, p.158.

Fonte: Marradi, 1995, p.158.


I materiali di supporto della lezione

Galtung J., (1967) Theory and Methods of Social Research, Allen and Unwin, London

Marradi A., L'analisi Monovariata, Milano, Franco Angeli, 1993

Corbetta P.G., Metodologia e tecniche della ricerca sociale, Vol IV, Milano, Franco Angeli, 2003

  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion

Fatal error: Call to undefined function federicaDebug() in /usr/local/apache/htdocs/html/footer.php on line 93