Wat is een bivariate (Pearson) correlatie?
Correlatie is een veelgebruikte term in de statistiek. De term kwam in het Engels voor in 1561, 200 jaar voordat de meeste moderne statistische tests werden ontdekt. Het is afgeleid van het Latijnse woord correlation, dat relatie betekent. Correlatie beschrijft in het algemeen het effect dat twee of meer fenomenen samen voorkomen en daarom met elkaar verbonden zijn. Vele academische vragen en theorieën onderzoeken deze verbanden. Is er een verband tussen het tijdstip en de intensiteit van blootstelling aan zonlicht en de kans op het krijgen van huidkanker? Zijn mensen eerder geneigd een bezoek aan een museum te herhalen naarmate ze meer tevreden zijn? Verdienen oudere mensen meer geld? Houden lonen verband met inflatie? Verhogen hogere olieprijzen de kosten van de scheepvaart? Het is echter van groot belang te benadrukken dat correlatie geen oorzakelijk verband impliceert.
Een correlatie drukt de sterkte van het verband of de gelijktijdigheid tussen twee variabelen uit in een enkele waarde tussen -1 en +1. Deze waarde die de sterkte van het verband meet, wordt correlatiecoëfficiënt genoemd, die meestal wordt weergegeven als de letter r.
De correlatiecoëfficiënt tussen twee variabelen van continu niveau wordt ook Pearson’s r of Pearson product-moment correlatiecoëfficiënt genoemd. Een positieve r-waarde wijst op een positief verband tussen de twee variabelen (hoe groter A, hoe groter B), terwijl een negatieve r-waarde wijst op een negatief verband (hoe groter A, hoe kleiner B). Een correlatiecoëfficiënt van nul wijst op helemaal geen verband tussen de variabelen. Correlaties zijn echter beperkt tot lineaire relaties tussen variabelen. Zelfs als de correlatiecoëfficiënt nul is, kan er een niet-lineaire relatie bestaan.
Bivariate (Pearson) Correlatie in SPSS
Op dit punt zou het nuttig zijn om een spreidingsdiagram te maken om de relatie tussen onze twee testscores voor lezen en schrijven te visualiseren. Het doel van de scatter plot is om te controleren of de variabelen een lineair verband hebben. Andere vormen van relatie (cirkel, vierkant) zullen niet worden gedetecteerd bij het uitvoeren van Pearson’s Correlatie Analyse. Dit zou een type II-fout opleveren omdat de nulhypothese van de onafhankelijkheidstest (“de twee variabelen zijn onafhankelijk en niet gecorreleerd in het universum”) niet wordt verworpen, hoewel de variabelen in werkelijkheid afhankelijk zijn, alleen niet lineair.
De scatter plot kan worden gevonden in Graphs/Chart Builder… of in Graphs/Legacy Dialog/Scatter Dot…
In de Chart Builder kiezen we op het tabblad Gallery de Scatter/Dotgroup of charts en slepen het ‘Simple Scatter’-diagram (het eerste) op het chart canvas. Vervolgens slepen we variabele Test_Score op de y-as en variabele Test2_Score op de x-as.
SPSS genereert de scatter plot voor de twee variabelen. Een dubbelklik op het uitvoerdiagram opent de grafiekeditor en een klik op ‘Add Fit Line’ voegt een lineair passende lijn toe die de lineaire associatie weergeeft die wordt weergegeven door de bivariate correlatie van Pearson.
Om de bivariate correlatiecoëfficiënt van Pearson in SPSS te berekenen, moeten we het dialoogvenster in Analyze/Correlation/Bivariate…
Dit opent het dialoogvenster voor alle bivariate correlaties (Pearson’s, Kendall’s, Spearman). Selecteer gewoon de variabelen waarvoor u de bivariate correlatie wilt berekenen en voeg ze toe met de pijl.
Selecteer de bivariate correlatiecoëfficiënt die u nodig hebt, in dit geval Pearson’s. Voor de significantietest kiezen we de tweestaarttest, omdat we niet weten of er een positieve of negatieve correlatie is tussen de twee variabelen Lezen en Schrijven. We laten ook het standaard vinkje bij flag significant correlations staan, waardoor alle correlatiecoëfficiënten met p<0.05 in de SPSS-uitvoer een sterretje krijgen.
Uitvoer, syntaxis en interpretatie zijn te vinden in onze downloadbare handleiding: Statistische Analyse: A Manual on Dissertation Statistics in SPSS (opgenomen in onze ledenbronnen). Klik hier om te downloaden.
Een correlatie drukt de sterkte van het verband of de co-occurrence tussen twee variabelen uit in een enkele waarde tussen -1 en +1. Deze waarde die de sterkte van het verband meet, wordt correlatiecoëfficiënt genoemd, die meestal wordt weergegeven als de letter r.
De correlatiecoëfficiënt tussen twee variabelen van continu niveau wordt ook Pearson’s r of Pearson product-moment correlatiecoëfficiënt genoemd. Een positieve r-waarde wijst op een positief verband tussen de twee variabelen (hoe groter A, hoe groter B), terwijl een negatieve r-waarde wijst op een negatief verband (hoe groter A, hoe kleiner B). Een correlatiecoëfficiënt van nul wijst op helemaal geen verband tussen de variabelen. Correlaties zijn echter beperkt tot lineaire relaties tussen variabelen. Zelfs als de correlatiecoëfficiënt nul is, kan er een niet-lineaire relatie bestaan.
Bivariate (Pearson) Correlatie in SPSS
Op dit punt zou het nuttig zijn om een spreidingsdiagram te maken om de relatie tussen onze twee testscores voor lezen en schrijven te visualiseren. Het doel van de scatter plot is om te controleren of de variabelen een lineair verband hebben. Andere vormen van relatie (cirkel, vierkant) zullen niet worden gedetecteerd bij het uitvoeren van Pearson’s Correlatie Analyse. Dit zou een type II-fout opleveren, omdat de nulhypothese van de onafhankelijkheidstest (“de twee variabelen zijn onafhankelijk en niet gecorreleerd in het universum”) niet wordt verworpen, hoewel de variabelen in werkelijkheid afhankelijk zijn, alleen niet lineair.
De scatter plot kan worden gevonden in Graphs/Chart Builder… of in Graphs/Legacy Dialog/Scatter Dot…
In de Chart Builder kiezen we op het tabblad Gallery de Scatter/Dotgroup of charts en slepen het ‘Simple Scatter’-diagram (het eerste) op het chart canvas. Vervolgens slepen we variabele Test_Score op de y-as en variabele Test2_Score op de x-as.
SPSS genereert de scatter plot voor de twee variabelen. Een dubbelklik op het uitvoerdiagram opent de grafiekeditor en een klik op ‘Add Fit Line’ voegt een lineair passende lijn toe die de lineaire associatie weergeeft die wordt weergegeven door de bivariate correlatie van Pearson.
Om de bivariate correlatiecoëfficiënt van Pearson in SPSS te berekenen, moeten we het dialoogvenster in Analyze/Correlation/Bivariate…
Dit opent het dialoogvenster voor alle bivariate correlaties (Pearson’s, Kendall’s, Spearman). Selecteer gewoon de variabelen waarvoor u de bivariate correlatie wilt berekenen en voeg ze toe met de pijl.
Selecteer de bivariate correlatiecoëfficiënt die u nodig hebt, in dit geval Pearson’s. Voor de significantietest kiezen we de tweestaarttest, omdat we niet weten of er een positieve of negatieve correlatie is tussen de twee variabelen Lezen en Schrijven. We laten ook het standaard vinkje bij flag significant correlations staan, waardoor alle correlatiecoëfficiënten met p<0.05 in de SPSS-uitvoer een sterretje krijgen.