La regresión lineal en SPSS
La pregunta de investigación para el análisis de regresión lineal es la siguiente:
En nuestra muestra de 107 estudiantes, ¿podemos predecir la puntuación de la prueba estandarizada de lectura cuando conocemos la puntuación de la prueba estandarizada de escritura?
El primer paso es comprobar si existe una relación lineal en los datos. Para ello comprobamos el gráfico de dispersión (Graphs/Chart Builder…). El gráfico de dispersión indica una buena relación lineal, lo que nos permite realizar un análisis de regresión lineal. También podemos comprobar la Correlación Bivariada de Pearson (Analizar/Correlacionar/Bivariar…) y encontramos que ambas variables están fuertemente correlacionadas (r = .645 con p < 0.001).
En segundo lugar, tenemos que comprobar la normalidad multivariante. Echamos un vistazo a los Q-Q-Plots (Analyze/Descriptive statistics/Q-Q-Plots…) para nuestras dos variables y vemos que no son perfectos, pero puede que se acerquen lo suficiente.
Podemos comprobar nuestra prueba «a ojo» con la prueba de Kolmogorov-Smirnov de 1 muestra (Analyze/Non Paracontinuous-level Tests/Legacy Dialogs/1-Sample K-S…). La prueba tiene la hipótesis nula de que la variable se aproxima a una distribución normal. Los resultados confirman que se puede suponer que la puntuación de lectura es normal multivariante (p = 0,474) mientras que la prueba de escritura no lo es (p = 0,044). Para solucionar este problema podríamos intentar transformar las puntuaciones de la prueba de escritura utilizando una transformación no lineal (por ejemplo, log). Sin embargo, tenemos una muestra bastante grande, en cuyo caso la regresión lineal es bastante robusta contra las violaciones de la normalidad. Puede reportar valores T y valores F demasiado optimistas.
Ahora podemos realizar el análisis de regresión lineal. La regresión lineal se encuentra en el SPSS en Analizar/Regresión/Lineal…
Para responder a nuestra sencilla pregunta de investigación sólo tenemos que añadir la Puntuación del Examen de Matemáticas como variable dependiente y la Puntuación del Examen de Escritura como variable independiente. El menú Estadísticas… nos permite incluir información adicional que necesitamos para evaluar la validez de nuestro análisis de regresión lineal. Para evaluar la autocorrelación (especialmente si tenemos datos de series temporales) añadimos la prueba de Durbin-Watson, y para comprobar la multicolinealidad añadimos los diagnósticos de colinealidad.
Por último, hacemos clic en el menú Gráficos… para añadir los gráficos de residuos estandarizados a la salida. Los gráficos de residuos estandarizados grafican ZPRED en el eje x y ZRESID en el eje y. Este gráfico estandarizado nos permite comprobar la heteroscedasticidad.
Dejamos todas las opciones de los menús Guardar… y Opciones… como están y ya estamos listos para ejecutar la prueba.