Investor's wiki

Régression non linéaire

Régression non linéaire

La régression non linéaire est une forme d'analyse de régression dans laquelle les données sont ajustées à un modèle, puis exprimées sous forme de fonction mathématique. La régression linéaire simple relie deux variables (X et Y) avec une ligne droite (y = mx + b), tandis que la régression non linéaire relie les deux variables dans une relation non linéaire (courbe).

Le but du modèle est de rendre la somme des carrés aussi petite que possible. La somme des carrés est une mesure qui permet de déterminer dans quelle mesure les observations Y varient par rapport à la fonction non linéaire (courbe) utilisée pour prédire Y.

Il est calculé en trouvant d'abord la différence entre la fonction non linéaire ajustée et chaque point Y de données dans l'ensemble. Ensuite, chacune de ces différences est mise au carré. Enfin, tous les chiffres au carré sont additionnés. Plus la somme de ces chiffres au carré est petite, mieux la fonction s'adapte aux points de données de l'ensemble. La régression non linéaire utilise des fonctions logarithmiques, des fonctions trigonométriques, des fonctions exponentielles, des fonctions puissance, des courbes de Lorenz, des fonctions gaussiennes et d'autres méthodes d'ajustement.

La modélisation de régression non linéaire est similaire à la modélisation de régression linéaire en ce sens que les deux cherchent à suivre graphiquement une réponse particulière à partir d'un ensemble de variables. Les modèles non linéaires sont plus compliqués à développer que les modèles linéaires car la fonction est créée par une série d'approximations (itérations) qui peuvent provenir d'essais et d'erreurs. Les mathématiciens utilisent plusieurs méthodes établies, telles que la méthode Gauss-Newton et la méthode Levenberg-Marquardt.

Souvent, les modèles de régression qui semblent non linéaires à première vue sont en fait linéaires. La procédure d'estimation de courbe peut être utilisée pour identifier la nature des relations fonctionnelles en jeu dans vos données, afin que vous puissiez choisir le bon modèle de régression, qu'il soit linéaire ou non linéaire. Les modèles de régression linéaire, bien qu'ils forment généralement une ligne droite, peuvent également former des courbes, selon la forme de l'équation de régression linéaire. De même, il est possible d'utiliser l'algèbre pour transformer une équation non linéaire afin qu'elle imite une équation linéaire - une telle équation non linéaire est appelée "linéaire intrinsèquement".

La régression linéaire relie deux variables par une ligne droite ; la régression non linéaire relie les variables à l'aide d'une courbe.

Exemple de régression non linéaire

Un exemple de la façon dont la régression non linéaire peut être utilisée est de prédire la croissance démographique au fil du temps. Un diagramme de dispersion des données démographiques changeantes au fil du temps montre qu'il semble y avoir une relation entre le temps et la croissance démographique, mais qu'il s'agit d'une relation non linéaire, nécessitant l'utilisation d'un modèle de régression non linéaire. Un modèle logistique de croissance démographique peut fournir des estimations de la population pour des périodes qui n'ont pas été mesurées et des prévisions de la croissance démographique future.

Les variables indépendantes et dépendantes utilisées dans la régression non linéaire doivent être quantitatives. Les variables catégorielles, comme la région de résidence ou la religion, doivent être codées comme des variables binaires ou d'autres types de variables quantitatives.

Afin d'obtenir des résultats précis à partir du modèle de régression non linéaire, vous devez vous assurer que la fonction que vous spécifiez décrit avec précision la relation entre les variables indépendantes et dépendantes. De bonnes valeurs de départ sont également nécessaires. Des valeurs de départ médiocres peuvent entraîner un modèle qui ne parvient pas à converger ou une solution qui n'est optimale que localement, plutôt que globalement, même si vous avez spécifié la bonne forme fonctionnelle pour le modèle.

Points forts

  • La régression non linéaire peut montrer une prédiction de la croissance démographique au fil du temps.

  • La régression non linéaire est une fonction courbe d'une variable X (ou de variables) utilisée pour prédire une variable Y

  • Les régressions linéaire et non linéaire prédisent les réponses Y à partir d'une variable X (ou de variables).