La régression linéaire dans SPSS
La question de recherche pour l’analyse de régression linéaire est la suivante :
Dans notre échantillon de 107 étudiants, pouvons-nous prédire le score au test standardisé de lecture lorsque nous connaissons le score au test standardisé d’écriture ?
La première étape consiste à vérifier s’il existe une relation linéaire dans les données. Pour cela, nous vérifions le nuage de points (Graphes/Chart Builder…). Le nuage de points indique une bonne relation linéaire, ce qui nous permet de réaliser une analyse de régression linéaire. Nous pouvons également vérifier la corrélation bivariée de Pearson (Analyser/Corréler/Bivarier…) et constater que les deux variables sont fortement corrélées (r = 0,645 avec p < 0.001).
Deuxièmement, nous devons vérifier la normalité multivariée. Nous jetons un coup d’œil aux Q-Q-Plots (Analyser/Statistiques descriptives/Q-Q-Plots…) pour nos deux variables et nous voyons qu’ils ne sont pas parfaits, mais que cela pourrait être assez proche.
Nous pouvons vérifier notre test » à l’œil » avec le test de Kolmogorov-Smirnov à 1 échantillon (Analyser/Tests de niveau non paracontinu/Dialogues de légitimité/1-Sample K-S…). Le test a l’hypothèse nulle que la variable se rapproche d’une distribution normale. Les résultats confirment que le score de lecture peut être considéré comme normal à plusieurs variables (p = 0,474) alors que le test d’écriture ne l’est pas (p = 0,044). Pour résoudre ce problème, nous pourrions essayer de transformer les scores du test d’écriture en utilisant une transformation non linéaire (par exemple, le logarithme). Cependant, nous disposons d’un échantillon assez important, auquel cas la régression linéaire est assez robuste contre les violations de la normalité. Elle peut signaler des valeurs T et des valeurs F trop optimistes.
Nous pouvons maintenant effectuer l’analyse de régression linéaire. La régression linéaire se trouve dans SPSS dans Analyser/Régression/Linéaire…
Pour répondre à notre question de recherche simple, il nous suffit d’ajouter la note du test de mathématiques comme variable dépendante et la note du test d’écriture comme variable indépendante. Le menu Statistiques… nous permet d’inclure des informations supplémentaires dont nous avons besoin pour évaluer la validité de notre analyse de régression linéaire. Afin d’évaluer l’autocorrélation (surtout si nous avons des données de séries temporelles), nous ajoutons le test de Durbin-Watson, et pour vérifier la multicollinéarité, nous ajoutons le diagnostic de collinéarité.
En dernier lieu, nous cliquons sur le menu Plots… pour ajouter les tracés de résidus standardisés à la sortie. Les tracés résiduels standardisés représentent ZPRED sur l’axe des abscisses et ZRESID sur l’axe des ordonnées. Ce tracé normalisé nous permet de vérifier l’hétéroscédasticité.
Nous laissons toutes les options des menus Enregistrer… et Options… telles quelles et sommes maintenant prêts à exécuter le test.
.