y=α+βx würde die vorhergesagten Werte ergeben und wir berechnen die Werte von α & β aus der obigen Formel, wobei β die Steigung ist und α der y-Achsenabschnitt ist. Das Ziel der einfachen linearen Regression ist es, ein lineares Modell zu erstellen, das die Summe der Quadrate der Residuen (Fehler) minimiert.
Eine interessante Tatsache über die lineare Regression ist, dass sie sich aus zwei statistischen Konzepten zusammensetzt: ANOVA & Korrelation.
Lineare Regression = Korrelation + ANOVA
Zurück zum Thema…
Wie hängen SST, SSR & SSE zusammen?
SST = SSR + SSE
In der obigen Tabelle können wir sehen, dass die Summe des Fehlerquadrats früher 120 war und später auf 30,075 reduziert wurde, d.h. wir haben den Fehlerwert von 120 auf 30,075 mit Hilfe der linearen Regression reduziert. Früher war die beste Anpassungslinie der Mittelwert der Steigung der abhängigen Variable, was sich später zur optimalen Anpassungslinie änderte.
120 =? + 30,075
Daher ist der Wert von SSR 89,925
Warum brauchen wir die Summe der Quadrate?
Die Antwort ist, um die Anpassungsgüte zu bestimmen. Sie kann mit Hilfe des Bestimmtheitsmaßes, auch R² genannt, bestimmt werden. R² quantifiziert das Verhältnis in Prozent. Außerdem wird das R² oft mit „r“ verwechselt, wobei R² das Bestimmtheitsmaß ist, während r der Korrelationskoeffizient ist. Die Korrelation misst den linearen Zusammenhang zwischen zwei Variablen X und Y. Sie reicht von den Werten -1 bis 1, wobei Werte, die näher an 1 liegen, eine positive Beziehung aufweisen, während Werte, die näher an -1 liegen, eine negative Beziehung aufweisen. In der obigen Tabelle erhalten wir zum Beispiel einen Wert von r von 0,8656, der näher an 1 liegt und somit eine positive Beziehung darstellt.
Abschließendes Wort
Wichtige Formeln, die Sie im Hinterkopf behalten sollten: –
- R² = SSR/SST
- R² = 1-(SSE/SST)
- SSE = Σ(actual-predicted)²
- SST= Σ(actual-mean)²
- SSR= Σ(predicted-mean)²
Ich hoffe ich konnte Ihnen bei der Beantwortung von Fragen zu diesem Thema helfen. Bitte zögern Sie nicht, mehr über meine Kontakt-ID zu erfragen: – Rahul Pathak.
Vielen Dank! 🙂