Co to jest korelacja dwuwartościowa (Pearsona)?
Korelacja jest terminem szeroko stosowanym w statystyce. W rzeczywistości, termin ten pojawił się w języku angielskim w 1561 roku, 200 lat przed odkryciem większości nowoczesnych testów statystycznych. Wywodzi się od łacińskiego słowa correlation, które oznacza związek. Korelacja ogólnie opisuje efekt, że dwa lub więcej zjawisk występuje razem i dlatego są one ze sobą powiązane. Wiele pytań naukowych i teorii bada te zależności. Czy czas i intensywność ekspozycji na światło słoneczne ma związek z prawdopodobieństwem zachorowania na raka skóry? Czy ludzie są bardziej skłonni do powtórzenia wizyty w muzeum, im bardziej są zadowoleni? Czy starsi ludzie zarabiają więcej pieniędzy? Czy płace są powiązane z inflacją? Czy wyższe ceny ropy zwiększają koszty transportu morskiego? Bardzo ważne jest jednak, aby podkreślić, że korelacja nie oznacza związku przyczynowego.
Korelacja wyraża siłę powiązania lub współwystępowania pomiędzy zmiennymi w pojedynczej wartości pomiędzy -1 i +1. Ta wartość, która mierzy siłę powiązania, jest nazywana współczynnikiem korelacji, który jest zwykle przedstawiany jako litera r.
Współczynnik korelacji między dwiema zmiennymi ciągłymi jest również nazywany współczynnikiem korelacji Pearsona r lub Pearson product-moment. Dodatnia wartość r wyraża pozytywny związek między dwiema zmiennymi (im większe A, tym większe B), podczas gdy ujemna wartość r wskazuje na związek negatywny (im większe A, tym mniejsze B). Współczynnik korelacji równy zero wskazuje na brak związku między zmiennymi w ogóle. Jednakże korelacje są ograniczone do liniowych związków między zmiennymi. Nawet jeśli współczynnik korelacji wynosi zero, może istnieć związek nieliniowy.
Korelacja dwuwartościowa (Pearsona) w SPSS
W tym momencie korzystne byłoby stworzenie wykresu rozrzutu, aby zwizualizować związek pomiędzy naszymi dwoma wynikami testów z czytania i pisania. Celem wykresu rozrzutu jest sprawdzenie, czy zmienne mają liniowy związek. Inne formy relacji (koło, kwadrat) nie zostaną wykryte podczas przeprowadzania analizy korelacji Pearsona. To stworzyłoby błąd typu II, ponieważ nie odrzuciłoby hipotezy zerowej testu niezależności („dwie zmienne są niezależne i nie są skorelowane we wszechświecie”), chociaż zmienne są w rzeczywistości zależne, tylko nie liniowo.
Kreskę rozproszoną można znaleźć w Graphs/Chart Builder… lub w Graphs/Legacy Dialog/Scatter Dot…
W programie Chart Builder wybieramy w zakładce Gallery grupę wykresów Scatter/Dotgroup i przeciągamy wykres 'Simple Scatter' (pierwszy) na kanwę wykresu. Następnie przeciągamy zmienną Test_Score na oś y oraz zmienną Test2_Score na oś x.
SPSS generuje wykres rozrzutu dla dwóch zmiennych. Dwukrotne kliknięcie na wykresie wyjściowym otwiera edytor wykresów, a kliknięcie na „Dodaj linię dopasowania” dodaje liniowo dopasowaną linię, która reprezentuje liniową asocjację, która jest reprezentowana przez dwuwymiarową korelację Pearsona.
Aby obliczyć współczynnik korelacji dwuwartościowej Pearsona w SPSS musimy otworzyć dialog w Analyze/Correlation/Bivariate…
Otwiera to okno dialogowe dla wszystkich korelacji dwuwartościowych (Pearsona, Pearsona, Kendalla, Spearmana). Po prostu wybierz zmienne, dla których chcesz obliczyć korelację dwuwymiarową i dodaj je strzałką.
Wybierz potrzebny współczynnik korelacji dwuwymiarowej, w tym przypadku Pearsona. Dla Testu istotności wybieramy dwuogonkowy test istotności, ponieważ nie mamy założenia, czy korelacja między dwiema zmiennymi Czytanie i Pisanie jest dodatnia czy ujemna. Pozostawiamy również domyślne zaznaczenie przy flag significant correlations, co spowoduje dodanie małej gwiazdki do wszystkich współczynników korelacji z p<0.05 na wyjściu SPSS.
Wyjście, składnia i interpretacja znajdują się w naszym podręczniku do pobrania: Statistical Analysis: A Manual on Dissertation Statistics in SPSS (w naszych zasobach członkowskich). Kliknij tutaj, aby pobrać.
Korelacja wyraża siłę powiązania lub współwystępowania pomiędzy zmiennymi w pojedynczej wartości pomiędzy -1 i +1. Wartość ta, która mierzy siłę powiązania, nazywana jest współczynnikiem korelacji, który zazwyczaj przedstawiany jest jako litera r.
Współczynnik korelacji pomiędzy dwiema zmiennymi ciągłymi nazywany jest również współczynnikiem r Pearsona lub współczynnikiem korelacji iloczynu-momentu Pearsona. Dodatnia wartość r wyraża pozytywny związek między dwiema zmiennymi (im większe A, tym większe B), podczas gdy ujemna wartość r wskazuje na związek negatywny (im większe A, tym mniejsze B). Współczynnik korelacji równy zero wskazuje na brak związku między zmiennymi w ogóle. Jednakże korelacje są ograniczone do liniowych związków między zmiennymi. Nawet jeśli współczynnik korelacji wynosi zero, może istnieć związek nieliniowy.
Korelacja dwuwartościowa (Pearsona) w SPSS
W tym momencie korzystne byłoby stworzenie wykresu rozrzutu, aby zwizualizować związek pomiędzy naszymi dwoma wynikami testów z czytania i pisania. Celem wykresu rozrzutu jest sprawdzenie, czy zmienne mają liniowy związek. Inne formy relacji (koło, kwadrat) nie zostaną wykryte podczas przeprowadzania analizy korelacji Pearsona. To stworzyłoby błąd typu II, ponieważ nie odrzuciłoby hipotezy zerowej testu niezależności („dwie zmienne są niezależne i nie są skorelowane we wszechświecie”), chociaż zmienne są w rzeczywistości zależne, tylko nie liniowo.
Kreskę rozproszoną można znaleźć w Graphs/Chart Builder… lub w Graphs/Legacy Dialog/Scatter Dot…
W programie Chart Builder wybieramy w zakładce Gallery grupę wykresów Scatter/Dotgroup i przeciągamy wykres 'Simple Scatter' (pierwszy) na kanwę wykresu. Następnie przeciągamy zmienną Test_Score na oś y oraz zmienną Test2_Score na oś x.
SPSS generuje wykres rozrzutu dla dwóch zmiennych. Podwójne kliknięcie na wykresie wyjściowym otwiera edytor wykresów, a kliknięcie na „Dodaj linię dopasowania” dodaje liniowo dopasowaną linię, która reprezentuje liniową asocjację, która jest reprezentowana przez korelację dwuwymiarową Pearsona.
Aby obliczyć współczynnik korelacji dwuwartościowej Pearsona w SPSS musimy otworzyć dialog w Analyze/Correlation/Bivariate…
Otwiera to okno dialogowe dla wszystkich korelacji dwuwartościowych (Pearsona, Pearsona, Kendalla, Spearmana). Po prostu wybierz zmienne, dla których chcesz obliczyć korelację dwuwymiarową i dodaj je strzałką.
Wybierz potrzebny współczynnik korelacji dwuwymiarowej, w tym przypadku Pearsona. Dla Testu istotności wybieramy dwuogonkowy test istotności, ponieważ nie mamy założenia, czy korelacja między dwiema zmiennymi Czytanie i Pisanie jest dodatnia czy ujemna. Pozostawiamy również domyślne zaznaczenie przy flag significant correlations, co spowoduje dodanie małej gwiazdki do wszystkich współczynników korelacji z p<0.05 na wyjściu SPSS.