Regresión no lineal.

El gráfico mostrado corresponde al producto bruto interno (PBI) por año para un país. ¿Se puede predecir el PIB en función del tiempo? ¿Podemos usar una regresión lineal simple para modelarlo?Regresion no lineal
Si los datos muestran una tendencia curvada, entonces la regresión lineal no producirá un resultado muy preciso, simplemente porque la regresión lineal presume que los datos son lineales. Se parece a una función logística o exponencial. Por lo tanto, se necesita un método especial de cálculo cuando la regresión es no lineal.

Si asumimos que el modelo para este conjunto de datos son funciones exponenciales, como por ejemplo, y = \theta_0 + \theta_1 {\theta_2}^{x}, nuestro trabajo consiste en estimar los parámetros del modelo, es decir, \theta, y utilizar el modelo ajustado para predecir valores de la variable dependiente para casos desconocidos o futuros. De hecho, existen muchas regresiones diferentes que se pueden utilizar para adaptarse a cualquier aspecto del conjunto de datos.

graficas no linealesEn estos gráficos se pueden ver líneas de regresión cuadrática y cúbica, y se puede continuar hasta el grados infinitos. En esencia, podemos llamar a todos estos casos «regresión polinómica», donde la relación entre la variable independiente x y la variable dependiente y se modelan como un polinomio grado n en x. Con muchos los tipos de regresión para elegir, hay una buena probabilidad de que uno se ajuste bien a su conjunto de datos. Es importante elegir una regresión que se adapte mejor a los datos.

Método de cálculo

La regresión polinómica se ajusta a una línea curvada de sus datos. Un ejemplo simple de polinomial, con el grado 3, se muestra como y = \theta_0 + \theta_1 x + {\theta_2 x}^{2} + {\theta_3 x}^{3} donde \theta son parámetros a estimar que hacen que el modelo se ajuste perfectamente a los datos. A pesar de que la relación entre x y y es no lineal, y la regresión polinómica puede ajustarse a ellas, un modelo de regresión polinomial puede ser expresado como regresión lineal realizando cambios en las variables: Dada la ecuación polinómica de tercer grado, si definimos que x_1 = x y x_2 = x^{2} y x_3 = x^{3}, el modelo se convierte en una regresión lineal simple con nuevas variables y = \theta_0 + \theta_1 x_1 + \theta_2 x_2 + \theta_3 x_3.

Esta regresión polinómica se considera un caso especial de regresión lineal múltiple tradicional. Por lo tanto, puede utilizar el mismo mecanismo que la regresión lineal para resolver el problema y utilizar el modelo de mínimos cuadrados. Los mínimos cuadrados es un método para estimar los parámetros desconocidos en una modelo de regresión lineal, minimizando la suma de los cuadrados de las diferencias entre la variable dependiente observada en el conjunto de datos y las predicciones de la función lineal.

Características

Para decir que una regresión es no lineal, debe cumplir que:

  1. Existe una relación no lineal entre la variable dependiente y el conjunto de variables independientes.
  2. Su modelo debe ser una función no lineal de los parámetros \theta, no necesariamente las características x.ecuaciones no lineales

Cuando se trata de la ecuación no lineal, puede ser de forma de exponencial, logarítmica, logística, o muchos otros tipos. En todas estas ecuaciones, el cambio de y depende de los cambios en los parámetros \theta, no necesariamente en x solamente. En contraste con la regresión lineal, no podemos utilizar el método de «mínimos cuadrados» ordinarios para ajustar los datos.

¿Cómo se puede saber si un problema es lineal o no lineal de una manera fácil? Podemos averiguar visualmente si la relación es lineal o no lineal trazando gráficos bivariados de las variables de salida con cada variable de entrada. Además, se puede calcular el coeficiente de correlación entre variables independientes y dependientes, y si para todas las variables es 0.7 o superior hay una tendencia lineal, y, por lo tanto, no es apropiado ajustar una regresión no lineal. También podemos usar una regresión no lineal cuando no podemos modelar con precisión la relación con los parámetros lineales.
¿Cómo debo modelar mis datos, si se muestran no lineales en un diagrama de dispersión? para hacer frente a esto se tiene que usar una regresión polinómica y un modelo de regresión
no lineal, «transformando» sus datos.(VER EJEMPLO EN PYTHON)

Ir al artículo anterior de la serie: Evaluación del modelo de regresión

Ir al artículo siguiente de la serie: Introducción a la clasificación