I dati raccolti attraverso un’indagine sulle unità statistiche di un particolare collettivo (sia esso una popolazione o un campione) rispetto a uno o più fenomeni rappresentano un’informazione statistica.
Questa informazione è codificata attraverso il concetto di carattere, che può essere inteso come il fenomeno oggetto di studio, rilevato sulle unità statistiche della popolazione di riferimento e codificato secondo le esigenze dell’analisi statistica.
Un carattere prende il nome di:
Nel linguaggio moderno, spesso il termine variabile viene usato in maniera indistinta sia per le variabili in senso stretto sia per le mutabili.
In questo caso alla parola variabile si fa seguire l’aggettivo quantitativa o quantitativa per indicare la corretta natura del carattere considerato.
Una scala di misura rappresenta la strumento logico attraverso cui avviene la misurazione di un carattere statistico.
Nel caso di una mutabile si parla di scale di misura per categorie mentre per una variabile si fa riferimento a scale di misura metriche (o dimensionali).
Le diverse tipologie di scale di misura sono:
Un carattere su scala nominale (o carattere sconnesso) è una mutabile le cui modalità sono degli attributi che si caratterizzano per l’assenza di un ordine precostituito.
Ne deriva che non è possibile ordinare le unità statistiche sulla base delle risposte ma solo stabilire se due di esse possiedono o meno lo stesso attributo.
Un particolare carattere di questo tipo è la variabile dicotomica, cioè quella mutabile che assume solo due possibili modalità (vero-falso, si-no, Maschio-Femmina, ecc.)
Un carattere su scala ordinale (o carattere ordinale) è una mutabile le cui modalità sono degli attributi logicamente sequenziali, in ordine crescente o decrescente.
Ne deriva che è possibile ordinare le unità statistiche sulla base delle risposte anche se, essendo le risposte di natura qualitativa, non è possibile misurarne la distanza.
Un carattere su scala ad intervallo (o carattere intervallare) è una variabile che assume valori numerici che consentono confronti solo per differenza tra le modalità che le unità assumono.
Ne deriva che è possibile ordinare le unità statistiche sulla base delle risposte ed inoltre misurare la differenza esistente tra i valori assunti da ognuna di esse.
Le scale ad intervallo sono quelle che assumono un zero arbitrario che rappresenta una convenzione e non l’assoluta assenza del fenomeno.
Temperatura in gradi
La misurazione può avvenire con la scala Celsius oppure con quella Fahrenheit. Lo zero della prima scala è solo una convenzione che equivale nella seconda a 32 gradi. Ciò perché la gradazione F=(9/5)C+32.
In questo caso si possono confrontare le differenze tra temperature ma non i rapporti:
Milano 10°C equivalenti a 50°F
Palermo 20°C equivalenti a 68°F
Non è corretto affermare che a Palermo la temperatura è doppia di Milano in quanto ciò vale solo per la scala Celsius e non per quella Fahereneit dove invece la temperatura sarebbe superiore solo del 36%.
Un carattere su scala di rapporto (o carattere proporzionale) è una variabile che assume valori numerici che consentono confronti sia per differenza che per rapporto tra le modalità che le unità assumono.
Ne deriva che oltre ad ordinare e confrontare le differenze, è possibile rapportare in termini proporzionali i valori assunti dalle diverse unità.
Le scale di rapporto sono quelle che assumono un zero assoluto che indica l’assoluta assenza del fenomeno.
Peso
La misurazione può avvenire con diverse unità di misura (kg, g, quintali, tonnellate) ma comunque se tra due individui il primo pesa il doppio del secondo ciò sarà vero per ognuna delle unità di misura utilizzate.
Tizio peso 80kg equivalente a 0,8 quintali
Caio peso 60kg equivalente a 0,6 quintali
Il peso di tizio sarà superiore a quello di Caio del 33% a prescindere della scala utilizzata!!!
Altri esempi sono:
Sulla base dei valori assunti dalle modalità, le variabili quantitative (ad intervallo o di rapporto) posso distinguersi in:
Variabili discrete
possono assumere un numero discreto (cioè finito) di modalità che possono essere sempre poste in corrispondenza con l’insieme dei numeri naturali.
esempio: numero figli, voto di laurea, punteggio nel lancio di un dado, ecc.
Variabili continue
possono assumere un qualunque valore contenuto in un intervallo reale predefinito.
esempio: età, peso, altezza, temperatura, ecc.
Nella prossima lezione si affronteranno i seguenti argomenti:
1. Introduzione
3. Distribuzioni di frequenza e rappresentazioni grafiche
4. Indici statistici di posizione
5. Indici statistici di variabilità
6. Forma di una distribuzione statistica
7. Distribuzioni doppie di frequenza
8. Relazioni tra variabili: Associazione e dipendenza in media
9. Relazioni tra variabili: Correlazione lineare
11. Rapporti statistici e numeri indici
12. Introduzione al calcolo delle probabilità