Un po’ di storia
- La statistica (statistics) nasce come scienza dello Stato
- La disponibilità di statistiche ufficiali attendibili e non manipolate circa la popolazione, i processi economici, l’istruzione, la giustizia, la sanità, etc. rappresenta un elemento di democrazia.
- per poi diventare uno strumento fondamentale nei processi di costruzione della conoscenza scientifica moderna
- L’osservazione della realtà e i dati possono servire o a verificare la correttezza di ipotesi teoriche, o a generare ipotesi sui meccanismi che regolano i fenomeni osservati.
Necessità dell’analisi statistica
- Le manifestazioni di un fenomeno sono caratterizzate da variabilità non prevedibile.
- Le manifestazioni di un fenomeno possono essere messe in relazione con quelle di altri fenomeni.
- Come conseguenza la conoscenza e le decisioni avvengono in condizione di incertezza.
Un’introduzione alla Statistica
I metodi dell’analisi statistica consentono di:
- analizzare la struttura della variabilità di un fenomeno intorno ad una parte sistematica che tendenzialmente si ripete;
- studiare le relazioni tra fenomeni e come la variabilità di uno influenzerà la variabilità degli altri;
- e quindi prendere le decisioni e formulare ipoetsi teoriche anche in condizioni di incertezza.
Un’introduzione alla Statistica
Più precisamente:
- Gli strumenti della statistica descrittiva permettono di sintetizzare e descrivere un insieme di dati.
- La teoria della probabilità è usata per modellare l’incertezza e la variabilità della realtà, per poi poterla misurare e controllare (non eliminare).
- Le tecniche della statistica inferenziale, sulla base del calcolo delle probabilità che permettono di calcolare la verosimiglianza di osservare o selezionare un particolare campione da una certa popolazione, consentono di trarre inferenze o conclusioni sulla popolazione a partire dal campione.
Relazione tra la probabilità e la statistica inferenziale
Alcuni paradigmi della Ricerca Statistica
- Sintesi dell’informazione.
- Scoperta del nuovo.
- Contenimento dell’errore.
- Dialettica della conoscenza.
Alcuni paradigmi della Ricerca Statistica
Modello per le manifestazioni del fenomeno
Un modello è una semplificazione della realtà utile ai fini conoscitivi che ci si è prefissati:
- Il modello non tiene conto di tutti gli aspetti della realtà ma solo di quelli legati all’oggetto dell’analisi.
- Il modello adatto a un certo studio può divenire inadeguato se l’oggetto dello studio cambia o se si cerca una precisione maggiore.
- La modellizzazione è necessaria per descrivere e analizzare un fenomeno reale complesso che non può essere colto nella sua totalità.
Modello per le manifestazioni del fenomeno
Modello per le manifestazioni del fenomeno
Un’introduzione alla Statistica
- Modello di misura:
- peso = peso effettivo + errore
- Modello relazionale o esplicativo:
- voto di laurea = f(voto diploma, …) + errore
- benessere psicologico = f(ruolo, sesso, …) + errore
Individuazione del modello per “prova ed errore”
- Dal problema reale al problema statistico.
- Raccolta dati.
- Analisi preliminari.
- Costruzione di un modello possibile.
- Diagnosticare e validare.
- Riformulazione del modello.
Raccolta dati:
- da basi di dati;
- da fonti ufficiali.
Dato = osservazione di una caratteristicha su un soggetto
Matrici dei dati = più caratteristiche osservate su più soggetti
Tipi di dati – Tipi di scale
Tipi di Dati ----- Tipi di Scale
Dati Qualitativi e processo di misurazione
I dati qualitativi sono espressi in forma verbale rappresentata:
- da aggettivi (biondo, bruno, castano, …);
- da altre forme (morti per tumore, addetti all’agricoltura, …).
Non possono essere trattati con gli strumenti della matematica (somma, prodotto, …).
Dati Qualitativi e processo di misurazione
- Dati qualitativi nominali semplici:
- Non ammettono un ordine logico (fumatore- non fumatore).
- Dicotomici o Politomici sconnessi.
- Dati qualitativi ordinali:
- Ammettono un ordine logico (diplomato- laureato).
Dati Quantitativi e processo di misurazione
I dati quantitativi sono espressi da numeri.
Semplificando:
- Risultati di un conteggio (discreti): # figli in una famiglia
- Risultati di una misurazione (continui): Peso, temperatura, reddito
Scale di misura per variabili Qualitative
La scala di misura è obbligata (sesso) o decisa dall’analista.
Tipologia
Scale nominali: tipo più semplice di misurazione in cui una variabile è definita mediante una classificazione in categorie non ordinabili (sesso, religione professata, …).
Scale di misura per variabili Qualitative
Scale ordinali: tipo di misurazione che non solo consente di classificare la variabile in categorie ma anche di ordinare le categorie gerarchicamente a seconda del valore che hanno rispetto alla proprietà considerata (titolo i studio, ceto sociale, …).
Scale di misura per variabili Quantitative
Scale ad intervalli: tipo di misurazione che non solo specifica la graduatoria ma anche la distanza tra le categorie di una variabile. Non ha uno zero assoluto (temperatura, quoziente di intelligenza, …);
Scale di rapporti: tipo di misurazione simile alla scala ad intervalli ma qui lo zero è assoluto e corrisponde all’assenza di carattere. Ciò consente di svolgere operazioni di moltiplicazione e divisione tra i valori assunti dalla variabile (peso, altezza, reddito, …).
Scale di misura per variabili Quantitative
- In una scala di rapporti un valore può essere visto come multiplo di un alto (22Kg è il doppio di 11 Kg).
- In una scala ad intervalli un dato non è un multiplo di un altro (Un QI di 140 non è il doppi di un QI di 70).
Prossima lezione
Le variabili: Sintesi e rappresentazioni grafiche
- La variabile statistica
- Distribuzioni di frequenze
- Rappresentazioni grafiche