Ikke-lineær regression

Ikke-lineær regression er en form for regressionsanalyse, hvor data tilpasses til en model og derefter udtrykkes som en matematisk funktion. Simpel lineær regression relaterer to variable (X og Y) med en lige linje (y = mx + b), mens ikke-lineær regression relaterer de to variable i et ikke-lineært (buet) forhold.

Målet med modellen er at gøre summen af kvadraterne så lille som muligt. Summen af kvadrater er et mål, der sporer, hvor langt Y-observationerne varierer fra den ikke-lineære (buede) funktion, der bruges til at forudsige Y.

Det beregnes ved først at finde forskellen mellem den tilpassede ikke-lineære funktion og hvert Y-punkt af data i sættet. Derefter er hver af disse forskelle kvadreret. Til sidst lægges alle de kvadratiske figurer sammen. Jo mindre summen af disse kvadratiske tal er, jo bedre passer funktionen til datapunkterne i sættet. Ikke-lineær regression bruger logaritmiske funktioner, trigonometriske funktioner, eksponentielle funktioner, potensfunktioner, Lorenz-kurver, Gaussiske funktioner og andre tilpasningsmetoder.

Ikke-lineær regressionsmodellering ligner lineær regressionsmodellering, idet begge søger at spore et bestemt svar fra et sæt variabler grafisk. Ikke-lineære modeller er mere komplicerede end lineære modeller at udvikle, fordi funktionen er skabt gennem en række approksimationer (iterationer), der kan stamme fra trial-and-error. Matematikere bruger flere etablerede metoder, såsom Gauss-Newton-metoden og Levenberg-Marquardt-metoden.

Ofte er regressionsmodeller, der forekommer ikke-lineære ved første øjekast, faktisk lineære. Kurveestimeringsproceduren kan bruges til at identificere karakteren af de funktionelle sammenhænge, der er i spil i dine data, så du kan vælge den korrekte regressionsmodel, uanset om det er lineært eller ikke-lineært. Lineære regressionsmodeller, mens de typisk danner en ret linje, kan også danne kurver, afhængigt af formen af den lineære regressionsligning. Ligeledes er det muligt at bruge algebra til at transformere en ikke-lineær ligning, så den efterligner en lineær ligning - sådan en ikke-lineær ligning omtales som "iboende lineær."

Lineær regression relaterer to variable med en ret linje; ulineær regression relaterer variablerne ved hjælp af en kurve.

Eksempel på ikke-lineær regression

Et eksempel på, hvordan ikke-lineær regression kan bruges, er at forudsige befolkningstilvækst over tid. Et scatterplot af skiftende befolkningsdata over tid viser, at der synes at være en sammenhæng mellem tid og befolkningstilvækst, men at det er et ikke-lineært forhold, der kræver brug af en ikke-lineær regressionsmodel. En logistisk befolkningstilvækstmodel kan give estimater af befolkningen for perioder, der ikke blev målt, og forudsigelser om fremtidig befolkningstilvækst.

Uafhængige og afhængige variabler brugt i ikke-lineær regression bør være kvantitative. Kategoriske variabler, såsom bopælsregion eller religion, bør kodes som binære variable eller andre typer kvantitative variabler.

For at opnå nøjagtige resultater fra den ikke-lineære regressionsmodel, bør du sikre dig, at den funktion, du angiver, beskriver forholdet mellem de uafhængige og afhængige variable nøjagtigt. Gode startværdier er også nødvendige. Dårlige startværdier kan resultere i en model, der ikke konvergerer, eller en løsning, der kun er optimal lokalt i stedet for globalt, selvom du har angivet den rigtige funktionelle form for modellen.

Højdepunkter

Ikke-lineær regression kan vise en forudsigelse af befolkningstilvækst over tid.
Ikke-lineær regression er en kurvet funktion af en X-variabel (eller variabler), der bruges til at forudsige en Y-variabel
Både lineær og ikke-lineær regression forudsiger Y-svar fra en X-variabel (eller variabler).