Qu’est-ce qu’une corrélation bivariée (Pearson) ?
La corrélation est un terme très utilisé en statistique. En fait, il est entré dans la langue anglaise en 1561, 200 ans avant la découverte de la plupart des tests statistiques modernes. Il est dérivé du mot latin correlation, qui signifie relation. La corrélation décrit généralement le fait que deux ou plusieurs phénomènes se produisent ensemble et qu’ils sont donc liés. De nombreuses questions et théories universitaires étudient ces relations. La durée et l’intensité de l’exposition au soleil sont-elles liées à la probabilité de contracter un cancer de la peau ? Les gens sont-ils d’autant plus susceptibles de répéter la visite d’un musée qu’ils en sont satisfaits ? Les personnes âgées gagnent-elles plus d’argent ? Les salaires sont-ils liés à l’inflation ? La hausse des prix du pétrole augmente-t-elle le coût du transport maritime ? Il est toutefois très important de souligner que la corrélation n’implique pas la causalité.
Une corrélation exprime la force du lien ou de la cooccurrence entre à variables dans une valeur unique comprise entre -1 et +1. Cette valeur qui mesure la force du lien est appelée coefficient de corrélation, qui est représenté typiquement par la lettre r.
Le coefficient de corrélation entre deux variables à niveau continu est également appelé r de Pearson ou coefficient de corrélation produit-moment de Pearson. Une valeur r positive exprime une relation positive entre les deux variables (plus A est grand, plus B est grand) tandis qu’une valeur r négative indique une relation négative (plus A est grand, plus B est petit). Un coefficient de corrélation égal à zéro indique l’absence totale de relation entre les variables. Cependant, les corrélations sont limitées aux relations linéaires entre les variables. Même si le coefficient de corrélation est égal à zéro, une relation non linéaire peut exister.
Corrélation bivariée (Pearson) dans SPSS
À ce stade, il serait bénéfique de créer un nuage de points pour visualiser la relation entre nos deux résultats aux tests de lecture et d’écriture. L’objectif du nuage de points est de vérifier que les variables ont une relation linéaire. D’autres formes de relation (cercle, carré) ne seront pas détectées lors de l’analyse de corrélation de Pearson. Cela créerait une erreur de type II car elle ne rejetterait pas l’hypothèse nulle du test d’indépendance ( » les deux variables sont indépendantes et non corrélées dans l’univers « ) bien que les variables soient en réalité dépendantes, simplement pas de manière linéaire.
Le nuage de points se trouve soit dans Graphs/Chart Builder… soit dans Graphs/Legacy Dialog/Scatter Dot…
Dans le générateur de graphiques, il nous suffit de choisir dans l’onglet Galerie le groupe de graphiques Scatter/Dot et de faire glisser le diagramme ‘Simple Scatter’ (le premier) sur le canevas du graphique. Ensuite, nous faisons glisser la variable Test_Score sur l’axe des y et la variable Test2_Score sur l’axe des x.
SPSS génère le diagramme de dispersion pour les deux variables. Un double clic sur le diagramme de sortie ouvre l’éditeur de graphiques et un clic sur ‘Add Fit Line’ ajoute une ligne d’ajustement linéaire qui représente l’association linéaire qui est représentée par la corrélation bivariée de Pearson.
Pour calculer le coefficient de corrélation bivariée de Pearson dans SPSS, nous devons ouvrir la boîte de dialogue dans Analyze/Correlation/Bivariate…
Cela ouvre la boîte de dialogue pour toutes les corrélations bivariées (de Pearson, de Kendall, de Spearman). Il suffit de sélectionner les variables pour lesquelles vous voulez calculer la corrélation bivariée et de les ajouter avec la flèche.
Sélectionnez le coefficient de corrélation bivariée dont vous avez besoin, dans ce cas celui de Pearson. Pour le test de signification, nous sélectionnons le test de signification bilatéral, car nous n’avons pas d’hypothèse sur le fait qu’il s’agisse d’une corrélation positive ou négative entre les deux variables Lecture et Écriture. Nous laissons également la coche par défaut à flag significant correlations qui ajoutera un petit astérisque à tous les coefficients de corrélation avec p<0,05 dans la sortie SPSS.
Les sorties, la syntaxe et l’interprétation peuvent être trouvées dans notre manuel téléchargeable : Analyse statistique : Un manuel sur les statistiques de dissertation dans SPSS (inclus dans nos ressources pour les membres). Cliquez ici pour le télécharger.
Une corrélation exprime la force du lien ou de la cooccurrence entre à variables dans une valeur unique comprise entre -1 et +1. Cette valeur qui mesure la force du lien est appelée coefficient de corrélation, qui est représenté typiquement par la lettre r.
Le coefficient de corrélation entre deux variables à niveau continu est également appelé r de Pearson ou coefficient de corrélation produit-moment de Pearson. Une valeur r positive exprime une relation positive entre les deux variables (plus A est grand, plus B est grand) tandis qu’une valeur r négative indique une relation négative (plus A est grand, plus B est petit). Un coefficient de corrélation égal à zéro indique l’absence totale de relation entre les variables. Cependant, les corrélations sont limitées aux relations linéaires entre les variables. Même si le coefficient de corrélation est égal à zéro, une relation non linéaire peut exister.
Corrélation bivariée (Pearson) dans SPSS
À ce stade, il serait bénéfique de créer un nuage de points pour visualiser la relation entre nos deux résultats aux tests de lecture et d’écriture. L’objectif du nuage de points est de vérifier que les variables ont une relation linéaire. D’autres formes de relation (cercle, carré) ne seront pas détectées lors de l’analyse de corrélation de Pearson. Cela créerait une erreur de type II car elle ne rejetterait pas l’hypothèse nulle du test d’indépendance ( » les deux variables sont indépendantes et non corrélées dans l’univers « ) bien que les variables soient en réalité dépendantes, simplement pas de manière linéaire.
Le nuage de points se trouve soit dans Graphs/Chart Builder… soit dans Graphs/Legacy Dialog/Scatter Dot…
Dans le générateur de graphiques, il nous suffit de choisir dans l’onglet Galerie le groupe de graphiques Scatter/Dot et de faire glisser le diagramme ‘Simple Scatter’ (le premier) sur le canevas du graphique. Ensuite, nous faisons glisser la variable Test_Score sur l’axe des y et la variable Test2_Score sur l’axe des x.
SPSS génère le diagramme de dispersion pour les deux variables. Un double clic sur le diagramme de sortie ouvre l’éditeur de graphiques et un clic sur ‘Add Fit Line’ ajoute une ligne d’ajustement linéaire qui représente l’association linéaire qui est représentée par la corrélation bivariée de Pearson.
Pour calculer le coefficient de corrélation bivariée de Pearson dans SPSS, nous devons ouvrir la boîte de dialogue dans Analyze/Correlation/Bivariate…
Cela ouvre la boîte de dialogue pour toutes les corrélations bivariées (de Pearson, de Kendall, de Spearman). Il suffit de sélectionner les variables pour lesquelles vous voulez calculer la corrélation bivariée et de les ajouter avec la flèche.
Sélectionnez le coefficient de corrélation bivariée dont vous avez besoin, dans ce cas celui de Pearson. Pour le test de signification, nous sélectionnons le test de signification bilatéral, car nous n’avons pas d’hypothèse sur le fait qu’il s’agisse d’une corrélation positive ou négative entre les deux variables Lecture et Écriture. Nous laissons également la coche par défaut à flag significant correlations qui ajoutera un petit astérisque à tous les coefficients de corrélation avec p<0,05 dans la sortie SPSS.