Regressione non lineare

La regressione non lineare è una forma di analisi di regressione in cui i dati vengono adattati a un modello e quindi espressi come una funzione matematica. La regressione lineare semplice mette in relazione due variabili (X e Y) con una linea retta (y = mx + b), mentre la regressione non lineare mette in relazione le due variabili in una relazione non lineare (curva).

L'obiettivo del modello è ridurre il più possibile la somma dei quadrati. La somma dei quadrati è una misura che tiene traccia di quanto le osservazioni Y variano dalla funzione non lineare (curva) utilizzata per prevedere Y.

Viene calcolato trovando prima la differenza tra la funzione non lineare adattata e ogni punto Y di dati nell'insieme. Quindi, ciascuna di queste differenze è al quadrato. Infine, tutte le figure quadrate vengono sommate. Minore è la somma di queste cifre quadrate, migliore è la funzione che si adatta ai punti dati nell'insieme. La regressione non lineare utilizza funzioni logaritmiche, funzioni trigonometriche, funzioni esponenziali, funzioni di potenza, curve di Lorenz, funzioni gaussiane e altri metodi di adattamento.

La modellazione di regressione non lineare è simile alla modellazione di regressione lineare in quanto entrambi cercano di tracciare graficamente una particolare risposta da un insieme di variabili. I modelli non lineari sono più complicati da sviluppare dei modelli lineari perché la funzione viene creata attraverso una serie di approssimazioni (iterazioni) che possono derivare da tentativi ed errori. I matematici usano diversi metodi consolidati, come il metodo di Gauss-Newton e il metodo di Levenberg-Marquardt.

Spesso i modelli di regressione che a prima vista appaiono non lineari sono in realtà lineari. La procedura di stima della curva può essere utilizzata per identificare la natura delle relazioni funzionali in gioco nei dati, in modo da poter scegliere il modello di regressione corretto, lineare o non lineare. I modelli di regressione lineare, sebbene in genere formino una linea retta, possono anche formare curve, a seconda della forma dell'equazione di regressione lineare. Allo stesso modo, è possibile utilizzare l'algebra per trasformare un'equazione non lineare in modo che imiti un'equazione lineare: tale equazione non lineare viene definita "intrinsecamente lineare".

La regressione lineare mette in relazione due variabili con una retta; la regressione non lineare mette in relazione le variabili utilizzando una curva.

Esempio di regressione non lineare

Un esempio di come è possibile utilizzare la regressione non lineare è prevedere la crescita della popolazione nel tempo. Un diagramma a dispersione dei dati sulla popolazione che cambiano nel tempo mostra che sembra esserci una relazione tra il tempo e la crescita della popolazione, ma che si tratta di una relazione non lineare, che richiede l'uso di un modello di regressione non lineare. Un modello logistico di crescita della popolazione può fornire stime della popolazione per periodi che non sono stati misurati e previsioni della crescita futura della popolazione.

Le variabili indipendenti e dipendenti utilizzate nella regressione non lineare dovrebbero essere quantitative. Le variabili categoriali, come la regione di residenza o la religione, dovrebbero essere codificate come variabili binarie o altri tipi di variabili quantitative.

Per ottenere risultati accurati dal modello di regressione non lineare, è necessario assicurarsi che la funzione specificata descriva accuratamente la relazione tra le variabili indipendenti e dipendenti. Sono necessari anche buoni valori di partenza. Valori iniziali scadenti possono comportare un modello che non riesce a convergere o una soluzione ottimale solo a livello locale anziché globale, anche se è stata specificata la forma funzionale corretta per il modello.

Mette in risalto

La regressione non lineare può mostrare una previsione della crescita della popolazione nel tempo.
La regressione non lineare è una funzione curva di una o più variabili X utilizzata per prevedere una variabile Y
Sia la regressione lineare che quella non lineare predicono le risposte Y da una variabile (o variabili) X.