y=α+βx daría los valores predichos y calculamos los valores de α & β a partir de la fórmula anterior donde β es la pendiente y α es la y-intercepción. El objetivo de la regresión lineal simple es crear un modelo lineal que minimice la suma de los cuadrados de los residuos(error).
Un hecho interesante sobre la Regresión Lineal es que se compone de dos conceptos estadísticos ANOVA & Correlación.
Regresión lineal = Correlación + ANOVA
Volviendo al tema…
¿Cómo se relacionan TSM, TSE & SSE?
SST = SSR + SSE
En la tabla anterior, podemos ver que antes la suma del cuadrado del error era de 120 y después se redujo a 30,075, es decir, disminuimos el valor del error de 120 a 30,075 utilizando la regresión lineal. Anteriormente la línea de mejor ajuste era la media de la pendiente de la variable dependiente que más tarde cambió a la línea óptima de mejor ajuste.
120 =? + 30.075
Por lo tanto el valor de SSR es 89.925
¿Por qué necesitamos la suma de cuadrados?
La respuesta es para determinar la bondad del ajuste. Se puede determinar utilizando el coeficiente de determinación también conocido como R². R² cuantifica la relación como un porcentaje. Además, el R² se confunde a menudo con ‘r’ donde R² es el coeficiente de determinación mientras que r es el coeficiente de correlación. La correlación mide la correlación lineal entre dos variables X e Y. Va de los valores -1 a 1, donde los valores más cercanos a 1 tienen una relación positiva mientras que los valores más cercanos a -1 tienen una relación negativa. Por ejemplo, en la tabla anterior, obtenemos un valor de r como 0,8656 que está más cerca de 1 y por lo tanto representa una relación positiva.
Palabra final
Formulas importantes a tener en cuenta: –
- R² = SSR/SST
- R² = 1-(SSE/SST)
- SSE = Σ(real-predicho)²
- SST= Σ(real-media)²
- SSR= Σ(predicho-media)²
Espero que haya podido ayudarle a resolver dudas relacionadas con este tema. Por favor, no dude en preguntar más en mi id de contacto: – Rahul Pathak.
¡Muchas gracias! 🙂