Cos’è una correlazione bivariata (Pearson)?
La correlazione è un termine molto usato in statistica. Infatti, è entrato nella lingua inglese nel 1561, 200 anni prima della scoperta della maggior parte dei test statistici moderni. Deriva dalla parola latina correlation, che significa relazione. La correlazione descrive generalmente l’effetto che due o più fenomeni si verificano insieme e quindi sono collegati. Molte domande e teorie accademiche indagano queste relazioni. Il tempo e l’intensità dell’esposizione alla luce del sole sono correlati alla probabilità di ammalarsi di cancro alla pelle? Le persone sono più propense a ripetere una visita a un museo quanto più sono soddisfatte? Le persone anziane guadagnano di più? I salari sono legati all’inflazione? I prezzi del petrolio più alti aumentano il costo delle spedizioni? È molto importante, tuttavia, sottolineare che la correlazione non implica causalità.
Una correlazione esprime la forza del legame o della co-occorrenza tra due variabili in un singolo valore tra -1 e +1. Questo valore che misura la forza del legame è chiamato coefficiente di correlazione, che è rappresentato tipicamente come la lettera r.
Il coefficiente di correlazione tra due variabili a livello continuo è anche chiamato r di Pearson o coefficiente di correlazione prodotto-momento di Pearson. Un valore r positivo esprime una relazione positiva tra le due variabili (più grande A, più grande B) mentre un valore r negativo indica una relazione negativa (più grande A, più piccolo B). Un coefficiente di correlazione pari a zero indica che non esiste alcuna relazione tra le variabili. Tuttavia le correlazioni sono limitate alle relazioni lineari tra le variabili. Anche se il coefficiente di correlazione è zero, potrebbe esistere una relazione non lineare.
Correlazione bivariata (Pearson) in SPSS
A questo punto sarebbe utile creare uno scatter plot per visualizzare la relazione tra i punteggi dei nostri due test di lettura e scrittura. Lo scopo dello scatter plot è quello di verificare che le variabili abbiano una relazione lineare. Altre forme di relazione (cerchio, quadrato) non saranno rilevate quando si esegue l’analisi di correlazione di Pearson. Questo creerebbe un errore di tipo II perché non rifiuterebbe l’ipotesi nulla del test di indipendenza (‘le due variabili sono indipendenti e non correlate nell’universo’) anche se le variabili sono in realtà dipendenti, solo non linearmente.
Il plot di dispersione può essere trovato in Graphs/Chart Builder… o in Graphs/Legacy Dialog/Scatter Dot…
Nel Chart Builder scegliamo semplicemente nella scheda Gallery il gruppo Scatter/Dot dei grafici e trasciniamo il diagramma ‘Simple Scatter’ (il primo) sulla tela del grafico. Poi trasciniamo la variabile Test_Score sull’asse y e la variabile Test2_Score sull’asse x.
SPSS genera lo scatter plot per le due variabili. Un doppio clic sul diagramma di output apre l’editor del grafico e un clic su ‘Add Fit Line’ aggiunge una linea lineare che rappresenta l’associazione lineare rappresentata dalla correlazione bivariata di Pearson.
Per calcolare il coefficiente di correlazione bivariata di Pearson in SPSS dobbiamo aprire la in Analizza/Correlazione/Bivariata…
Questo apre la finestra di dialogo per tutte le correlazioni bivariate (di Pearson, Kendall, Spearman). Selezionate semplicemente le variabili per le quali volete calcolare la correlazione bivariata e aggiungetele con la freccia.
Selezionate il coefficiente di correlazione bivariata che vi serve, in questo caso quello di Pearson. Per il Test di significatività selezioniamo il test di significatività a due code, perché non abbiamo un’ipotesi se si tratta di una correlazione positiva o negativa tra le due variabili Lettura e Scrittura. Lasciamo anche il segno di spunta di default su flag significant correlations che aggiungerà un piccolo asterisco a tutti i coefficienti di correlazione con p<0.05 nell’output di SPSS.
Output, sintassi e interpretazione possono essere trovati nel nostro manuale scaricabile: Analisi statistica: A Manual on Dissertation Statistics in SPSS (incluso nelle nostre risorse per i membri). Clicca qui per scaricare.
Una correlazione esprime la forza di collegamento o co-occorrenza tra due variabili in un singolo valore tra -1 e +1. Questo valore che misura la forza del legame è chiamato coefficiente di correlazione, che è rappresentato tipicamente come la lettera r.
Il coefficiente di correlazione tra due variabili a livello continuo è anche chiamato r di Pearson o coefficiente di correlazione prodotto-momento di Pearson. Un valore r positivo esprime una relazione positiva tra le due variabili (più grande A, più grande B) mentre un valore r negativo indica una relazione negativa (più grande A, più piccolo B). Un coefficiente di correlazione pari a zero indica che non esiste alcuna relazione tra le variabili. Tuttavia le correlazioni sono limitate alle relazioni lineari tra le variabili. Anche se il coefficiente di correlazione è zero, potrebbe esistere una relazione non lineare.
Correlazione bivariata (Pearson) in SPSS
A questo punto sarebbe utile creare uno scatter plot per visualizzare la relazione tra i punteggi dei nostri due test di lettura e scrittura. Lo scopo dello scatter plot è quello di verificare che le variabili abbiano una relazione lineare. Altre forme di relazione (cerchio, quadrato) non saranno rilevate quando si esegue l’analisi di correlazione di Pearson. Questo creerebbe un errore di tipo II perché non rifiuterebbe l’ipotesi nulla del test di indipendenza (‘le due variabili sono indipendenti e non correlate nell’universo’) anche se le variabili sono in realtà dipendenti, solo non linearmente.
Il plot di dispersione può essere trovato in Graphs/Chart Builder… o in Graphs/Legacy Dialog/Scatter Dot…
Nel Chart Builder scegliamo semplicemente nella scheda Gallery il gruppo Scatter/Dot dei grafici e trasciniamo il diagramma ‘Simple Scatter’ (il primo) sulla tela del grafico. Poi trasciniamo la variabile Test_Score sull’asse y e la variabile Test2_Score sull’asse x.
SPSS genera lo scatter plot per le due variabili. Un doppio clic sul diagramma di output apre l’editor del grafico e un clic su ‘Add Fit Line’ aggiunge una linea lineare che rappresenta l’associazione lineare rappresentata dalla correlazione bivariata di Pearson.
Per calcolare il coefficiente di correlazione bivariata di Pearson in SPSS dobbiamo aprire la in Analizza/Correlazione/Bivariata…
Questo apre la finestra di dialogo per tutte le correlazioni bivariate (di Pearson, Kendall, Spearman). Selezionate semplicemente le variabili per le quali volete calcolare la correlazione bivariata e aggiungetele con la freccia.
Selezionate il coefficiente di correlazione bivariata che vi serve, in questo caso quello di Pearson. Per il Test di significatività selezioniamo il test di significatività a due code, perché non abbiamo un’ipotesi se si tratta di una correlazione positiva o negativa tra le due variabili Lettura e Scrittura. Lasciamo anche il segno di spunta di default su flag significant correlations che aggiungerà un piccolo asterisco a tutti i coefficienti di correlazione con p<0.05 nell’output di SPSS.