Regresja liniowa w SPSS
Pytanie badawcze dla analizy regresji liniowej jest następujące:
W naszej próbie 107 studentów czy możemy przewidzieć wynik testu standaryzowanego z czytania, gdy znamy wynik testu standaryzowanego z pisania?
Pierwszym krokiem jest sprawdzenie, czy istnieje liniowa zależność w danych. W tym celu sprawdzamy wykres rozrzutu (Graphs/Chart Builder…). Wykres rozrzutu wskazuje na dobrą zależność liniową, co pozwala nam na przeprowadzenie analizy regresji liniowej. Możemy również sprawdzić korelację dwuwartościową Pearsona (Analyze/Correlate/Bivariate…) i stwierdzamy, że obie zmienne są silnie skorelowane (r = .645 z p < 0.001).
Po drugie, musimy sprawdzić normalność wielowymiarową. Patrzymy na wykresy Q-Q-Plots (Analyze/Descriptive statistics/Q-Q-Plots…) dla obu naszych zmiennych i widzimy, że nie są one idealne, ale mogą być wystarczająco zbliżone.
Możemy sprawdzić nasz test „na oko” za pomocą testu 1-Sample Kolmogorova-Smirnova (Analyze/Non Paracontinuous-level Tests/Legacy Dialogs/1-Sample K-S…). Test ma hipotezę zerową, że zmienna jest zbliżona do rozkładu normalnego. Wyniki potwierdzają, że można przyjąć, iż wynik czytania jest wielowymiarowo normalny (p = 0,474), podczas gdy test pisania nie jest (p = 0,044). Aby rozwiązać ten problem, moglibyśmy spróbować przekształcić wyniki testu pisania za pomocą transformacji nieliniowej (np. logarytmicznej). Jednakże, mamy dość dużą próbę, w którym to przypadku regresja liniowa jest dość odporna na naruszenia normalności. Może ona podawać zbyt optymistyczne wartości T i F.
Możemy teraz przeprowadzić analizę regresji liniowej. Regresję liniową można znaleźć w SPSS w Analyze/Regression/Linear…
Aby odpowiedzieć na nasze proste pytanie badawcze, musimy tylko dodać wynik testu z matematyki jako zmienną zależną i wynik testu z pisania jako zmienną niezależną. Menu Statystyka… pozwala nam na umieszczenie dodatkowych informacji, które są nam potrzebne do oceny poprawności naszej analizy regresji liniowej. W celu oceny autokorelacji (zwłaszcza jeśli mamy dane szeregów czasowych) dodajemy test Durbina-Watsona, a w celu sprawdzenia wieloliniowości dodajemy diagnostykę współliniowości.
Na koniec klikamy na menu Wykresy…, aby dodać do danych wyjściowych wykresy reszt standaryzowanych. Wykresy znormalizowanych reszt przedstawiają wykres ZPRED na osi x oraz ZRESID na osi y. Ten znormalizowany wykres pozwala nam sprawdzić heteroscedastyczność.
Zostawiamy wszystkie opcje w menu Zapisz… i Opcje… bez zmian i jesteśmy gotowi do uruchomienia testu.
Zostawiamy wszystkie opcje w menu Zapisz… i Opcje… bez zmian i jesteśmy gotowi do uruchomienia testu.