Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D Le Miniguide all'orientamento Gli eBook di Federica La Corte in Rete
 
I corsi di Sociologia
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Amalia Caputo » 9.Introduzione all'analisi delle variabili


L’autonomia semantica delle variabili categoriali non ordinate

Come è stato sottolineato in precedenza (lez. 8), l’autonomia semantica è una proprietà di una categoria e consiste nella maggiore o minore possibilità di interpretarla senza far ricorso al significato dell’etichetta della variabile o delle altre categorie della variabile.

Le variabili categoriali non ordinate presentano un alto grado di autonomia semantica; ovvero ciascuno stato ha un elevata “autonomia semantica” nei confronti degli altri stati e dell’intera proprietà.

Importanza delle distribuzioni equilibrate

L’alto grado di autonomia semantica delle variabili categoriali ordinate impone che la distribuzione di frequenza sia equilibrata ovvero che le frequenze relative a ciascuna categoria della variabile siano distribuite in modo equilibrato.

Per due motivi:

  1. le categorie con frequenze troppo basse danno informazioni distorte, le categorie con frequenze troppo alte danno invece informazioni scarse sull’andamento generale;
  2. quando si vorrà incrociare la variabile considerata con un’altra, se si presenta un numero troppo alto di modalità (distribuzione sensibile) e/o un numero troppo basso di casi, si formerà una tabella a doppia entrata con numerose celle, molte delle quali vuote o con un basso numero di casi; questo stato di cose non consente il ricorso a determinate tecniche di analisi bivariata dei dati (es. il Chi-quadro).

Sensibilità di una classificazione

La sensibilità di una classificazione è il rapporto tra il numero di classi individuate e il numero di forme che l’oggetto che stiamo classificando può assumere in teoria.

In altre parole:

Quando si classificano gli stati sulla proprietà per costruire una variabile categoriale, la sensibilità indica il rapporto tra il numero di modalità individuate (K) e il numero di stati diversi che si suppone siano presenti sulla proprietà (N); quanto più è elevato il numero delle modalità, tanto più la distribuzione è sensibile.

K/N = Sensibilità

K = N° di modalità della variabile
N = N° di possibili stati sulla proprietà
Una distribuzione “troppo” sensibile (un numero troppo elevato di modalità) può comportare una distribuzione squilibrata.

Aggregazione/disaggregazione delle modalità

Per rendere equilibrate le distribuzioni di frequenza è necessario procedere ad un’aggregazione/disaggregazione delle frequenze delle modalità di risposta.
Nella scelta di quali categorie aggregare/disaggregare è necessario seguire due regole.

Aggregazione/disaggregazione delle modalità. Esempio 1

Nel 1970 fu condotto uno studio sui valori dei giovani. Nella tabella sono riportate le frequenze della variabile categoriale non ordinata Tipo di comune di residenza.

E’ una distribuzione squilibrata perché:

  • una modalità raccoglie più del 50% dei casi (urbani);
  • molte modalità sono al di sotto del 10% (quasi urbani, semi urbani, quasi rurali).

Soluzione (esempio 2):

  • fu disaggregata la modalità urbani in urbani centrali e urbani periferici creando due nuove categorie;
  • furono aggregate sulla base dell’affinità semantica le modalità quasi urbani e semi urbani da un lato e quasi rurali e semi rurali dall’altro;
  • fu cambiata la denominazione della variabile.

Aggregazione/disaggregazione del categorie: esempio 1.

Aggregazione/disaggregazione del categorie: esempio 1.


Aggregazione/disaggregazione delle modalità. Esempio 2

Aggregazione/disaggregazione del categorie: esempio 2-Fonte: Marradi,1995,p.49.

Aggregazione/disaggregazione del categorie: esempio 2-Fonte: Marradi,1995,p.49.


Le rappresentazioni grafiche delle distribuzioni in categorie non ordinate

Le rappresentazioni grafiche delle distribuzioni in categorie non ordinate si basano sul principio della proporzionalità tra le frequenze e la lunghezza delle linee o tra le frequenze ed le aree.

Le rappresentazioni si distinguono in due famiglie:

  1. le rappresentazioni ordinano i segni (aree o linee) da destra a sinistra o dall’alto verso il basso;
  2. le rappresentazioni ordinano i segni (aree o linee) con un criterio circolare.

Le rappresentazioni grafiche con ordinamento (aree o linee) da destra a sinistra o dall’alto verso il basso

Per costruire le rappresentazioni grafiche di questa famiglia si utilizza un sistema di riferimento cartesiano ortogonale:

asse delle ascisse (X) = categorie di risposta
asse delle ordinate (Y) = frequenze (assolute 0 %)

Istogramma

Successioni  di colonne aventi base uguale e altezza proporzionale alle frequenze (assolute o relative).

Successioni di colonne aventi base uguale e altezza proporzionale alle frequenze (assolute o relative).


Diagramma a barre – bar chart/line chart

Successione di linee di lunghezza proporzionale alle frequenze.

Successione di linee di lunghezza proporzionale alle frequenze.


Grafico a colonne

È la forma intermedia tra istogramma e diagramma a barre. E’ come un istogramma, ma le colonne sono staccate tra di loro.

È la forma intermedia tra istogramma e diagramma a barre. E' come un istogramma, ma le colonne sono staccate tra di loro.


Grafico a nastri

È un grafico a colonne, ma le colonne sono posizionate orizzontalmente.

È un grafico a colonne, ma le colonne sono posizionate orizzontalmente.


Le rappresentazioni con ordinamento (aree o linee) circolare

Il vantaggio di queste rappresentazioni grafiche risiede nel fatto che riproducono la non ordinabilità delle categorie; hanno, però, lo svantaggio di essere difficili da disegnare e la loro leggibilità non è immediata come per le rappresentazioni lineari.

Aerogramma o diagramma a torta

Divide l’area di un cerchio in settori (componenti) di superficie proporzionale alle frequenze delle rispettive categorie.

Divide l'area di un cerchio in settori (componenti) di superficie proporzionale alle frequenze delle rispettive categorie.


Grafico a raggi o diagramma a raggiera o diagramma a coordinate polari

Divide l’area di un cerchio in settori (componenti) i cui raggi sono  proporzionali alle frequenze delle rispettive categorie.

Divide l'area di un cerchio in settori (componenti) i cui raggi sono proporzionali alle frequenze delle rispettive categorie.


Forme di rappresentazione delle distribuzioni di frequenza in categorie non ordinate


I materiali di supporto della lezione

Marradi A., L'analisi monovariata, Milano, Franco Angeli, 1995.

Marradi A., Linee guida per l'analisi bivariata dei dati nelle scienze sociali, Milano, Franco Angeli, 1997.

Corbetta P., La ricerca sociale: metodologia e tecniche, vol. IV, Bologna, Il Mulino, 2003.

  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion