Più informazioni
Esempio di lavoro
Se un rivenditore vuole stimare la proporzione dei suoi clienti che hanno acquistato un articolo dopo aver visto il suo sito web in un certo giorno con un livello di confidenza del 95% e un margine di errore del 5%, quanti clienti deve monitorare? Dato che il loro sito web ha in media 10.000 visualizzazioni al giorno e non sono sicuri del loro attuale tasso di conversione, allora avrebbero bisogno di campionare 370 clienti. Se invece sanno da studi precedenti che si aspettano un tasso di conversione del 5%, allora una dimensione del campione di 73 sarebbe sufficiente.
Formula
Questa calcolatrice usa la seguente formula per la dimensione del campione n:
n = N*X / (X + N – 1),
dove,
X = Zα/22 *p*(1-p) / MOE2,
e Zα/2 è il valore critico della distribuzione normale ad α/2 (es.per un livello di confidenza del 95%, α è 0,05 e il valore critico è 1,96), MOE è il margine di errore, p è la proporzione del campione e N è la dimensione della popolazione. Si noti che una correzione della popolazione finita è stata applicata alla formula della dimensione del campione.
Il seguente riferimento spiega come il FPC è usato per aggiustare una stima della varianza quando si campiona senza sostituzione (vedi pagine 141-142).
Daniel WW (1999). Biostatistica: A Foundation for Analysis in the Health Sciences. 7a edizione. New York: John Wiley & Figli.
Discussione
Il calcolatore della dimensione del campione di cui sopra vi fornisce il numero raccomandato di campioni richiesto per stimare la vera proporzione media con il margine di errore e il livello di confidenza richiesti.
Potete usare gli Scenari Alternativi per vedere come cambiare i quattro input (il margine di errore, il livello di confidenza, la dimensione della popolazione e la proporzione del campione) influenzano la dimensione del campione. Guardando cosa succede negli scenari alternativi puoi vedere come ogni input è collegato alla dimensione del campione e cosa accadrebbe se non usassi la dimensione del campione raccomandata. Più grande è la dimensione del campione, più si può essere certi che le stime riflettano la popolazione, quindi più stretto è l’intervallo di confidenza. Tuttavia, la relazione non è lineare, ad esempio, raddoppiando la dimensione del campione non si dimezza l’intervallo di confidenza.
Per ulteriori informazioni, vedi il nostro post sul blog L’importanza e l’effetto della dimensione del campione.
Definizioni
Margine di errore
Il margine di errore è il livello di precisione richiesto. È il numero in più o in meno che viene spesso riportato con una proporzione stimata ed è anche chiamato intervallo di confidenza. È l’intervallo in cui è stimata la vera proporzione della popolazione ed è spesso espresso in punti percentuali (ad esempio, ±2%). Si noti che la precisione effettiva raggiunta dopo aver raccolto i dati sarà più o meno di questa quantità target, perché sarà basata sulla proporzione stimata dai dati e non sulla proporzione campionaria prevista.
Livello di confidenza
Il livello di confidenza è la probabilità che il margine di errore contenga la vera proporzione. Se lo studio fosse ripetuto e l’intervallo calcolato ogni volta, ci si aspetterebbe che il vero valore si trovi all’interno di questi intervalli nel 95% delle occasioni. Più alto è il livello di confidenza, più sicuro è che l’intervallo contenga la vera proporzione.
Dimensione della popolazione
Questo è il numero totale di individui distinti nella vostra popolazione. In questa formula usiamo una correzione per la popolazione finita per tenere conto del campionamento da popolazioni che sono piccole. Se la vostra popolazione è grande, ma non sapete quanto grande, potete usare prudentemente 100.000. La dimensione del campione non cambia molto per popolazioni più grandi di 100.000.
Proporzione del campione
La proporzione del campione è ciò che ci si aspetta dai risultati. Questo può spesso essere determinato utilizzando i risultati di un sondaggio precedente, o eseguendo un piccolo studio pilota. Se non sei sicuro, usa il 50%, che è conservativo e dà la dimensione del campione più grande. Si noti che questo calcolo della dimensione del campione utilizza l’approssimazione normale della distribuzione binomiale. Se la proporzione del campione è vicina a 0 o 1, questa approssimazione non è valida e dovete considerare un metodo alternativo di calcolo della dimensione del campione.
Dimensione del campione
Questa è la dimensione minima del campione di cui avete bisogno per stimare la vera proporzione della popolazione con il margine di errore e il livello di confidenza richiesti. Nota che se alcune persone scelgono di non rispondere non possono essere incluse nel tuo campione e quindi se la non risposta è una possibilità la tua dimensione del campione dovrà essere aumentata di conseguenza. In generale, più alto è il tasso di risposta, migliore sarà la stima, poiché le mancate risposte porteranno spesso a distorsioni nella stima.