Vai alla Home Page About me Courseware Federica Living Library Federica Federica Podstudio Virtual Campus 3D Le Miniguide all'orientamento Gli eBook di Federica La Corte in Rete
 
I corsi di Scienze Matematiche Fisiche e Naturali
 
Il Corso Le lezioni del Corso La Cattedra
 
Materiali di approfondimento Risorse Web Il Podcast di questa lezione

Addolorata Marasco » 7.Correlazione non lineare tra variabili. Metodi di linearizzazione. Calcolo dell'errore


Metodi di linearizzazione

Metodi di linearizzazione dei dati sperimentali
Come si è visto in alcuni esempi della Lezione 6, in molti casi i dati sperimentali non evidenziano una correlazione di tipo lineare ma presentano un andamento di tipo esponenziale, polinomiale, etc. In questi casi, anzicchè individuare la curva dei minimi quadrati che meglio approssimi i dati, effettuando un semplice cambiamento di variabili, è possibile ricondursi nuovamente alla ricerca della retta di regressione.
In queste pagine si applica il metodo di linearizzazione ai dati sperimentali che presentano un andamento descritto da una funzione esponenziale o da una funzione potenza.

Metodi di linearizzazione(segue)

Modelli esponenziali
Si ipotizzi che la relazione che intercorre tra i dati (x1,y1), (x2,y2),…, (xn, yn) sia di tipo esponenziale

y=C e^{Ax},~~C>0~~~~~(7.1)

ossia la variabile y cresca in modo proporzionale ad una funzione esponenziale.
Calcolando il logaritmo naturale di entrambi i membri di (7.1) si ottiene

ln y= ln~(C e^{Ax})\Rightarrow ln~ y =Ax+ln ~C

operando il seguente cambiamento di variabili

Y=ln~y,~~~X=x,

si ottiene

Y=AX+B,

dove B=lnC.
Si osservi che quest’ultima equazione esprime un legame lineare tra le nuove variabili X e Y e quindi ci si è ricondotti nuovamente alla determinazione della retta di regressione relativa ai nuovi dati

(X_1,Y_1)\equiv (x_1,ln~y_1), ~~~(X_2,Y_2)\equiv (x_2, ln~y_2),...,~~(X_n, Y_n)\equiv (x_n, ln~y_n).

Metodi di linearizzazione (segue)

Utilizzando il metodo dei minimi quadrati e risolvendo il sistema delle equazioni normali si ricavano i valori dei parametri A e B e quindi della curva di regressione esponenziale in cui C=eB.

Esempio 7.1: Utilizzando il metodo di linearizzazione si vuole determinare la curva del tipo y=Ce Ax che approssima i dati sperimentali in Tabella 7.1.

Operando la trasformazione X=x, Y=ln y, è possibile linearizzare i dati in modo da ricondurre il problema posto alla ricerca della retta di regressione Y=AX+B, dove B=lnC.

Utilizzando la Tabella 7.2, il sistema delle equazioni normali si scrive

\left\{\begin{array}{ll} 45A+5B=1.05101,\\5A+5B=-3.05177,\end{array}\right.

e ammette la seguente soluzione

A=0.102569,~~~B =ln~C=-0.712923\Rightarrow C=e^{-0.712923}=0.490209.

Tabella 7.1

Tabella 7.1

Tabella 7.2

Tabella 7.2


Metodi di linearizzazione (segue)

Allora, la funzione esponenziale che approssima i dati è

y=0.49209~e^{0.102569~x}

ed è rappresentata in Figura 7.1.

Figura 7.1

Figura 7.1


Metodi di linearizzazione (segue)

Modelli mediante funzioni potenza
Si ipotizzi che la relazione che intercorre tra i dati (x1,y1), (x2,y2),…, (xn, yn)  sia descrivibile mediante una funzione potenza

y=Cx^A,~~C>0~~~~(7.2)

Calcolando il logaritmo naturale di entrambi i membri di (7.2) si ottiene

ln~y=ln(Cx^A)\Rightarrow ln~y=A~ln~x+ln~C

operando il seguente cambiamento di variabili

Y=ln~y,~~X=ln~x,

si ottiene Y=AX+B, dove B=lnC.

Si osservi che l’equazione Y=AX+B esprime un legame lineare tra le nuove variabili X e Y e quindi ci si è ricondotti nuovamente alla determinazione della retta di regressione relativa ai nuovi dati

(X_1,Y_1)\equiv (ln~x_1, ln~y_1), ~~~(X_2,Y_2)\equiv (ln~x_2, ln~y_2), ..., (X_n,Y_n)\equiv (ln~x_n, ln~y_n).

Utilizzando il metodo dei minimi quadrati e risolvendo il sistema delle equazioni normali si determinano i valori dei parametri A e B e quindi si individua univocamente la curva interpolante in cui C=eB.

Metodi di linearizzazione (segue)

Esempio 7.2: Utilizzando il metodo di linearizzazione, si vuole determinare la curva del tipo y=CeAx che approssima i seguenti dati sperimentali in Tabella 7.3.

Operando la trasformazione X=ln x, Y=ln y, è possibile linearizzare i dati in modo da ricondurre il problema posto alla ricerca della retta di regressione Y=AX+B, dove B=lnC.

Utilizzando la Tabella 7.4, il sistema delle equazioni normali si scrive

\left\{\begin{array}{rl}2.6706A+3.1B=8.067,\\ 3.1A+5B=10.33,\end{array}

e ammette la seguente soluzione

A=2.22069,~~B=ln~C=0.689179\Rightarrow C=e^B=1.99208.

Allora, la funzione potenza che approssima i dati è

y=1.99208~x^{2.22068}

ed è rappresentata in Figura 7.2.

Tabella 7.3
Tabella 7.4
Figura 7.2

Criterio dei minimi quadrati

In molti casi non è semplice stabilire il modello che meglio descrive l’andamento di un fenomeno di cui si ha a disposizione solo una raccolta di dati sperimentali. Ad esempio, per i dati in Tabella 7.5

Il diagramma di dispersione mostra solo una crescita non lineare dei dati. Tuttavia, “ad occhio” non risulta evidente se l’andamento è di tipo esponenziale o allometrico.

Utilizzando il metodo di linearizzazione su entrambe le ipotesi, si ottengono le due seguenti funzioni

y=0.363~e^{0.747x},

y=0.562~x^{1.866},

che interpolano i dati come mostrato in Figura 7.3.

Nelle applicazioni non è opportuno affidarsi ad una scelta che non abbia alcun fondamento scientifico. Pertanto, è necessario individuare un criterio che ci consenta di valutare esattamente quale tra le due curve “interpola meglio” i dati, cioè li approssima commettendo il più piccolo errore possibile.

Tabella 7.5

Tabella 7.5

Figura 7.3

Figura 7.3


Criterio dei minimi quadrati (segue)

In questo caso il criterio in questione è fornito proprio dal metodo dei minimi quadrati. Infatti, come si è detto, è possibile pervenire alle due funzioni interpolanti utilizzando il metodo di linearizzazione che in entrambi i casi conduce al modello lineare Y=AX+B per il quale è possibile calcolare, in ognuno dei due casi, il valore della funzione errore

E=\sum_{i=1}^n (AX_i+B-Y_i)^2

Così facendo si ottiene che l’errore che si commette nell’approssimare i dati mediante la funzione y1=0.363e0.747x è E1≅0.177, laddove per la funzione interpolante y2=0.562x1.886 si ottiene E2≅0.019.
A questo punto si è in possesso di un dato oggettivo che consente di affermare che il miglior modello per descrivere i dati è fornito dalla funzione potenza

y=0.562~x^{1.886}.

Esercizi di verifica

Esercizio 7.1: Determinare la curva esponenziale che approssima i dati sperimentali in Tabella 7.6.

Esercizio 7.2: Negli organismi di una certa specie, si osservano le misure in Tabella 7.7, calcolate in chilogrammi, relative al peso PC del corpo e a quello dello scheletro PS.
Si ipotizza che i dati seguano un modello di tipo allometrico, individuare la funzione potenza che meglio li approssima.
Esercizio 7.3: Individuare il cambiamento di variabili che riconduce le seguenti funzioni

(1)~y=\frac A x + B,

(2)~y=\frac x {A+Bx},

(3)~y=\frac 1 {1+Ce^{Ax}},

alla forma lineare Y=AX+B.

Tabella 7.6

Tabella 7.6

Tabella 7.7

Tabella 7.7


Approfondimenti

Gli argomenti di questa lezione sono reperibili su qualsiasi testo di Statistica.

Alcuni esercizi di questa lezione sono tratti liberamente dai volumi “Introduzione alla statistica” e “Probabilità e statistica per l’ingegneria e le scienze” di Sheldon M. Ross e da quelli dui J. Stewart.

  • Contenuti protetti da Creative Commons
  • Feed RSS
  • Condividi su FriendFeed
  • Condividi su Facebook
  • Segnala su Twitter
  • Condividi su LinkedIn
Progetto "Campus Virtuale" dell'Università degli Studi di Napoli Federico II, realizzato con il cofinanziamento dell'Unione europea. Asse V - Società dell'informazione - Obiettivo Operativo 5.1 e-Government ed e-Inclusion