y=α+βx daria os valores previstos e calculamos os valores de α & β a partir da fórmula acima onde β é o declive e α é o y-interceptar. O objectivo da regressão linear simples é criar um modelo linear que minimize a soma dos quadrados dos resíduos (erro).
Um facto interessante sobre a Regressão Linear é que ela é constituída por dois conceitos estatísticos ANOVA & Correlação.
Regressão Linear = Correlação + ANOVA
Voltando ao tópico…
Como são SST, SSR & SSE ligadas?
SST = SSR + SSE
Na tabela acima, podemos ver anteriormente a soma do quadrado de erro era 120 e mais tarde foi reduzido para 30,075, ou seja, reduzimos o valor de erro de 120 para 30,075 utilizando a regressão linear. Anteriormente, a linha de melhor ajuste era a média da inclinação da variável dependente que mais tarde mudou para a linha de melhor ajuste.
120 =? + 30,075
Por isso o valor de SSR é 89,925
Porquê precisamos da soma dos quadrados?
A resposta é determinar a bondade do ajuste. Pode ser determinado utilizando o coeficiente de determinação também conhecido como R². R² quantifica o rácio como uma percentagem. Além disso, o R² é muitas vezes confundido com ‘r’ onde R² é o coeficiente de determinação enquanto r é a correlação do coeficiente. A correlação mede a correlação linear entre duas variáveis X e Y. Varia entre os valores -1 e 1 onde os valores mais próximos de 1 têm uma relação positiva enquanto que os valores mais próximos de -1 têm uma relação negativa. Por exemplo, na tabela acima, obtemos um valor de r como 0,8656 que está mais próximo de 1 e, portanto, representa uma relação positiva.
Palavra final
Fórmulas importantes a ter em mente: –
- R² = SSR/SST
- R² = 1-(SSE/SST)
- SSE = Σ(real-previsto)²
- SST= Σ(real-mean)²
- SSR= Σ(previd-mean)²
p> Espero poder ajudá-lo a responder a perguntas relacionadas com este assunto. Sinta-se à vontade para saber mais sobre a minha identificação de contacto: – Rahul Pathak.
Muito obrigado! :)