Regresión por pasos
驴Qu茅 es la regresi贸n por pasos?
La regresi贸n paso a paso es la construcci贸n iterativa paso a paso de un modelo de regresi贸n que implica la selecci贸n de variables independientes que se utilizar谩n en un modelo final. Implica agregar o eliminar variables explicativas potenciales en sucesi贸n y probar la significaci贸n estad铆stica despu茅s de cada iteraci贸n.
La disponibilidad de paquetes de software estad铆stico hace posible la regresi贸n por pasos, incluso en modelos con cientos de variables.
Tipos de regresi贸n por pasos
El objetivo subyacente de la regresi贸n por pasos es, a trav茅s de una serie de pruebas (p. ej., pruebas F, pruebas t ), encontrar un conjunto de variables independientes que influyan significativamente en la variable dependiente. Esto se hace con computadoras a trav茅s de la iteraci贸n, que es el proceso de llegar a resultados o decisiones pasando por rondas o ciclos repetidos de an谩lisis. La realizaci贸n de pruebas de forma autom谩tica con la ayuda de paquetes de software estad铆stico tiene la ventaja de ahorrar tiempo y limitar los errores.
La regresi贸n por pasos se puede lograr probando una variable independiente a la vez e incluy茅ndola en el modelo de regresi贸n si es estad铆sticamente significativa o incluyendo todas las posibles variables independientes en el modelo y eliminando aquellas que no son estad铆sticamente significativas. Algunos usan una combinaci贸n de ambos m茅todos y, por lo tanto, existen tres enfoques para la regresi贸n por pasos:
La selecci贸n directa comienza sin variables en el modelo, prueba cada variable a medida que se agrega al modelo y luego conserva las que se consideran estad铆sticamente m谩s significativas, repitiendo el proceso hasta que los resultados sean 贸ptimos.
La eliminaci贸n hacia atr谩s comienza con un conjunto de variables independientes, eliminando una a la vez y luego probando para ver si la variable eliminada es estad铆sticamente significativa.
La eliminaci贸n bidireccional es una combinaci贸n de los dos primeros m茅todos que prueban qu茅 variables deben incluirse o excluirse.
Ejemplo
Un ejemplo de una regresi贸n paso a paso utilizando el m茅todo de eliminaci贸n hacia atr谩s ser铆a un intento de comprender el uso de energ铆a en una f谩brica utilizando variables como el tiempo de funcionamiento del equipo, la antig眉edad del equipo, el tama帽o del personal, las temperaturas exteriores y la 茅poca del a帽o. El modelo incluye todas las variables; luego, cada una se elimina, una a la vez, para determinar cu谩l es menos significativa estad铆sticamente. Al final, el modelo podr铆a mostrar que la 茅poca del a帽o y las temperaturas son m谩s importantes, lo que posiblemente sugiera que el consumo m谩ximo de energ铆a en la f谩brica es cuando el uso del aire acondicionado es m谩s alto.
Limitaciones de la regresi贸n paso a paso
El an谩lisis de regresi贸n, tanto lineal como multivariante, se usa ampliamente en el mundo de la econom铆a y las inversiones en la actualidad. A menudo, la idea es encontrar patrones que existieron en el pasado y que tambi茅n podr铆an repetirse en el futuro. Una regresi贸n lineal simple, por ejemplo, podr铆a analizar las relaciones precio/beneficio y los rendimientos de las acciones durante muchos a帽os para determinar si las acciones con relaciones P/E bajas (variable independiente) ofrecen rendimientos m谩s altos (variable dependiente). El problema con este enfoque es que las condiciones del mercado a menudo cambian y las relaciones que se han mantenido en el pasado no necesariamente se mantienen verdaderas en el presente o en el futuro.
Mientras tanto, el proceso de regresi贸n por pasos tiene muchas cr铆ticas e incluso hay llamadas para dejar de usar el m茅todo por completo. Los estad铆sticos se帽alan varios inconvenientes del enfoque, incluidos los resultados incorrectos, un sesgo inherente en el proceso mismo y la necesidad de un poder de c贸mputo significativo para desarrollar modelos de regresi贸n complejos a trav茅s de la iteraci贸n.
Reflejos
Sin embargo, la regresi贸n por pasos tiene sus desventajas, ya que es un enfoque que ajusta los datos en un modelo para lograr el resultado deseado.
El m茅todo de eliminaci贸n hacia atr谩s comienza con un modelo completo cargado con varias variables y luego elimina una variable para probar su importancia en relaci贸n con los resultados generales.
La regresi贸n por pasos es un m茅todo que examina iterativamente la importancia estad铆stica de cada variable independiente en un modelo de regresi贸n lineal.
El enfoque de selecci贸n directa comienza con nada y agrega cada nueva variable de forma incremental, probando la significancia estad铆stica.