Die lineare Regression in SPSS
Die Forschungsfrage für die lineare Regressionsanalyse lautet wie folgt:
Können wir in unserer Stichprobe von 107 Schülern das standardisierte Testergebnis im Lesen vorhersagen, wenn wir das standardisierte Testergebnis im Schreiben kennen?
In einem ersten Schritt wird überprüft, ob es einen linearen Zusammenhang in den Daten gibt. Dazu überprüfen wir den Scatter Plot (Graphs/Chart Builder…). Der Scatter Plot zeigt einen guten linearen Zusammenhang an, was uns erlaubt, eine lineare Regressionsanalyse durchzuführen. Wir können auch die bivariate Pearson-Korrelation überprüfen (Analysieren/Korrelieren/Bivariat…) und finden, dass beide Variablen stark korreliert sind (r = .645 mit p < 0.001).
Zweitens müssen wir auf multivariate Normalität prüfen. Wir schauen uns die Q-Q-Plots (Analysieren/Deskriptive Statistik/Q-Q-Plots…) für unsere beiden Variablen an und sehen, dass sie nicht perfekt sind, aber es könnte nahe genug sein.
Wir können unseren „Augenschein“-Test mit dem 1-Stichproben-Kolmogorov-Smirnov-Test überprüfen (Analysieren/Nicht-parakontinuierliche Tests/Legacy Dialoge/1-Sample K-S…). Der Test hat die Nullhypothese, dass die Variable sich einer Normalverteilung annähert. Die Ergebnisse bestätigen, dass der Lese-Score als multivariate Normalverteilung angenommen werden kann (p = 0,474), während der Schreibtest dies nicht ist (p = 0,044). Um dieses Problem zu beheben, könnten wir versuchen, die Ergebnisse des Schreibtests mit einer nicht-linearen Transformation (z.B. log) zu transformieren. Allerdings haben wir eine ziemlich große Stichprobe, in der die lineare Regression ziemlich robust gegenüber Verletzungen der Normalität ist. Sie kann zu optimistische T-Werte und F-Werte melden.
Wir können nun die lineare Regressionsanalyse durchführen. Die lineare Regression finden Sie in SPSS unter Analysieren/Regression/Linear…
Um unsere einfache Forschungsfrage zu beantworten, müssen wir nur das Ergebnis des Mathe-Tests als abhängige Variable und das Ergebnis des Schreib-Tests als unabhängige Variable hinzufügen. Im Menü Statistik… können wir zusätzliche Informationen einfügen, die wir benötigen, um die Gültigkeit unserer linearen Regressionsanalyse zu beurteilen. Um die Autokorrelation zu beurteilen (insbesondere bei Zeitreihendaten), fügen wir den Durbin-Watson-Test hinzu, und um auf Multikollinearität zu prüfen, fügen wir die Kollinearitätsdiagnose hinzu.
Zuletzt klicken wir auf das Menü Plots…, um die standardisierten Residuenplots zur Ausgabe hinzuzufügen. Die standardisierten Residuenplots zeigen ZPRED auf der x-Achse und ZRESID auf der y-Achse. Mit dieser standardisierten Darstellung können wir auf Heteroskedastizität prüfen.
Wir belassen alle Optionen in den Menüs Speichern… und Optionen… so wie sie sind und sind nun bereit, den Test durchzuführen.