A Regressão Linear em SPSS
A questão de pesquisa para a Análise de Regressão Linear é a seguinte:
Na nossa amostra de 107 alunos podemos prever a pontuação padronizada da leitura do teste quando conhecemos a pontuação padronizada da escrita no teste?
O primeiro passo é verificar se existe uma relação linear nos dados. Para isso, verificamos o gráfico de dispersão (Gráficos/Construtor de Cartas…). O gráfico de dispersão indica uma boa relação linear, o que nos permite conduzir uma análise de regressão linear. Podemos também verificar a Correlação Bivariada de Pearson (Analyze/Correlate/Bivariate…) e verificar que ambas as variáveis estão fortemente correlacionadas (r = .645 com p < 0.001).
Segundamente, precisamos de verificar a normalidade multivariada. Temos um olhar para os Q-Q-Plots (Analisar/ Estatística descritiva/Q-Q-Plots…) para ambas as nossas variáveis e ver que não são perfeitas, mas podem estar suficientemente próximas.
Podemos verificar o nosso teste de ‘olho’ com o teste de 1 Amostra Kolmogorov-Smirnov (Analyze/Non Paracontinuous-level Tests/Legacy Dialogs/1-Sample K-S…). O teste tem a hipótese nula de que a variável se aproxima de uma distribuição normal. Os resultados confirmam que a pontuação de leitura pode ser considerada normal multivariada (p = 0,474) enquanto que o teste de escrita não é (p = 0,044). Para resolver este problema, poderíamos tentar transformar a pontuação do teste de escrita utilizando uma transformação não linear (por exemplo, log). No entanto, temos uma amostra bastante grande, caso em que a regressão linear é bastante robusta contra violações da normalidade. Pode reportar valores T e F demasiado optimistas.
Agora podemos conduzir a análise de regressão linear. A regressão linear encontra-se no SPSS em Analyze/Regression/Linear…
Para responder à nossa simples pergunta de pesquisa só precisamos de adicionar a Pontuação do Teste de Matemática como variável dependente e a Pontuação do Teste de Escrita como variável independente. O menu Estatísticas… permite-nos incluir informação adicional que precisamos para avaliar a validade da nossa análise de regressão linear. A fim de avaliar a autocorrelação (especialmente se tivermos dados de séries cronológicas) adicionamos o Teste Durbin-Watson, e para verificar a multicolinearidade adicionamos o diagnóstico de Collinearidade.
P>Por último, clicamos no menu Parcelas… para adicionar as parcelas residuais padronizadas à saída. O gráfico de parcelas de resíduos padronizado ZPRED no eixo x e ZRESID no eixo y. Este gráfico padronizado permite-nos verificar a heterocedasticidade.
Deixamos todas as opções nos menus Save… e Options… como estão e estão agora prontas para executar o teste.