De lineaire regressie in SPSS
De onderzoeksvraag voor de lineaire regressieanalyse luidt als volgt:
Kunnen we in onze steekproef van 107 leerlingen de gestandaardiseerde testscore voor lezen voorspellen als we de gestandaardiseerde testscore voor schrijven kennen?
De eerste stap is na te gaan of er een lineair verband is in de gegevens. Daarvoor bekijken we de scatter plot (Graphs/Chart Builder…). De scatter plot geeft aan dat er een goed lineair verband is, waardoor we een lineaire regressieanalyse kunnen uitvoeren. We kunnen ook de bivariate correlatie van Pearson controleren (Analyze/Correlate/Bivariate…) en vaststellen dat beide variabelen sterk gecorreleerd zijn (r = .645 met p < 0.001).
Ten tweede moeten we controleren op multivariate normaliteit. We bekijken de Q-Q-Plots (Analyze/Descriptive statistics/Q-Q-Plots…) voor onze beide variabelen en zien dat ze niet perfect zijn, maar misschien wel dicht genoeg in de buurt komen.
We kunnen onze ‘eyeball’-test controleren met de 1-Sample Kolmogorov-Smirnov-test (Analyze/Non Paracontinuous-level Tests/Legacy Dialogs/1-Sample K-S…). De test heeft de nulhypothese dat de variabele een normale verdeling benadert. De resultaten bevestigen dat kan worden aangenomen dat de leesscore multivariaat normaal is (p = 0,474), terwijl de schrijftest dat niet is (p = 0,044). Om dit probleem op te lossen zouden we kunnen proberen de scores van de schrijftest te transformeren met behulp van een niet-lineaire transformatie (bv. log). We hebben echter een vrij grote steekproef en in dat geval is de lineaire regressie vrij robuust tegen schendingen van de normaliteit. Het kan te optimistische T-waarden en F-waarden rapporteren.
We kunnen nu de lineaire regressieanalyse uitvoeren. Lineaire regressie is in SPSS te vinden onder Analyze/Regression/Linear…
Om onze eenvoudige onderzoeksvraag te beantwoorden hoeven we alleen maar de wiskunde-testscore als afhankelijke variabele en de schrijftestscore als onafhankelijke variabele toe te voegen. Via het menu Statistieken… kunnen we extra informatie toevoegen die we nodig hebben om de geldigheid van onze lineaire regressieanalyse te beoordelen. Om autocorrelatie te beoordelen (vooral als we tijdreeksgegevens hebben) voegen we de Durbin-Watson Test toe, en om te controleren op multicollineariteit voegen we de Collineariteitsdiagnostiek toe.
Ten slotte klikken we op het menu Plots… om de gestandaardiseerde residuplots aan de uitvoer toe te voegen. De gestandaardiseerde residuplots tonen ZPRED op de x-as en ZRESID op de y-as. Met deze gestandaardiseerde plot kunnen we controleren op heteroscedasticiteit.
We laten alle opties in de menu’s Opslaan… en Opties… zoals ze zijn en zijn nu klaar om de test uit te voeren.