Factor de inflación de varianza (VIF)
驴Qu茅 es un factor de inflaci贸n de varianza (VIF)?
El factor de inflaci贸n de varianza (VIF) es una medida de la cantidad de multicolinealidad en un conjunto de variables de regresi贸n m煤ltiple . Matem谩ticamente, el VIF para una variable de modelo de regresi贸n es igual a la relaci贸n entre la varianza general del modelo y la varianza de un modelo que incluye solo esa 煤nica variable independiente. Esta relaci贸n se calcula para cada variable independiente. Un VIF alto indica que la variable independiente asociada es altamente colineal con las otras variables en el modelo.
Comprender un factor de inflaci贸n de varianza (VIF)
Un factor de inflaci贸n de varianza es una herramienta para ayudar a identificar el grado de multicolinealidad. Una regresi贸n m煤ltiple se usa cuando una persona quiere probar el efecto de m煤ltiples variables en un resultado particular. La variable dependiente es el resultado sobre el que act煤an las variables independientes: las entradas del modelo. La multicolinealidad existe cuando existe una relaci贸n lineal, o correlaci贸n, entre una o m谩s de las variables independientes o entradas.
La multicolinealidad crea un problema en la regresi贸n m煤ltiple porque todas las entradas se influyen entre s铆. Por lo tanto, en realidad no son independientes y es dif铆cil probar cu谩nto afecta la combinaci贸n de las variables independientes a la variable dependiente, o resultado, dentro del modelo de regresi贸n.
En t茅rminos estad铆sticos, un modelo de regresi贸n m煤ltiple donde exista una alta multicolinealidad har谩 m谩s dif铆cil estimar la relaci贸n entre cada una de las variables independientes y la variable dependiente. Peque帽os cambios en los datos utilizados o en la estructura de la ecuaci贸n del modelo pueden producir cambios grandes y err谩ticos en los coeficientes estimados de las variables independientes.
Para garantizar que el modelo se especifique correctamente y funcione correctamente, se pueden ejecutar pruebas de multicolinealidad. El factor de inflaci贸n de la varianza es una de esas herramientas de medici贸n. El uso de factores de inflaci贸n de varianza ayuda a identificar la gravedad de cualquier problema de multicolinealidad para que el modelo pueda ajustarse. El factor de inflaci贸n de la varianza mide cu谩nto influye, o infla, el comportamiento (varianza) de una variable independiente por su interacci贸n/correlaci贸n con las otras variables independientes.
Los factores de inflaci贸n de varianza permiten una medida r谩pida de cu谩nto contribuye una variable al error est谩ndar en la regresi贸n. Cuando existen problemas significativos de multicolinealidad, el factor de inflaci贸n de la varianza ser谩 muy grande para las variables involucradas. Despu茅s de identificar estas variables, se pueden usar varios enfoques para eliminar o combinar variables colineales, resolviendo el problema de la multicolinealidad.
Multicolinealidad
Si bien la multicolinealidad no reduce el poder predictivo general de un modelo, puede producir estimaciones de los coeficientes de regresi贸n que no son estad铆sticamente significativas. En cierto sentido, se puede considerar como una especie de doble contabilidad en el modelo.
Cuando dos o m谩s variables independientes est谩n estrechamente relacionadas o miden casi lo mismo, el efecto subyacente que miden se tiene en cuenta dos veces (o m谩s) en todas las variables. Se vuelve dif铆cil o imposible decir qu茅 variable realmente influye en la variable independiente. Esto es un problema porque el objetivo de muchos modelos econom茅tricos es probar exactamente este tipo de relaci贸n estad铆stica entre las variables independientes y la variable dependiente.
Por ejemplo, suponga que un economista quiere probar si existe una relaci贸n estad铆sticamente significativa entre la tasa de desempleo (variable independiente) y la tasa de inflaci贸n (variable dependiente). La inclusi贸n de variables independientes adicionales que est谩n relacionadas con la tasa de desempleo,. como las nuevas solicitudes iniciales de desempleo,. probablemente introducir铆a multicolinealidad en el modelo.
El modelo general puede mostrar un poder explicativo fuerte y estad铆sticamente suficiente, pero no puede identificar si el efecto se debe principalmente a la tasa de desempleo o a las nuevas solicitudes iniciales de desempleo. Esto es lo que detectar铆a el VIF, y sugerir铆a posiblemente eliminar una de las variables del modelo o encontrar alguna forma de consolidarlas para capturar su efecto conjunto seg煤n la hip贸tesis espec铆fica que el investigador est茅 interesado en probar.
Reflejos
Un factor de inflaci贸n de varianza (VIF) proporciona una medida de multicolinealidad entre las variables independientes en un modelo de regresi贸n m煤ltiple.
La detecci贸n de la multicolinealidad es importante porque, si bien la multicolinealidad no reduce el poder explicativo del modelo, s铆 reduce la significancia estad铆stica de las variables independientes.
Un factor de inflaci贸n de varianza grande (VIF) en una variable independiente indica una relaci贸n altamente colineal con las otras variables que se deben considerar o ajustar en la estructura del modelo y la selecci贸n de variables independientes.