Plus d’informations
Exemple travaillé
Si un détaillant souhaite estimer la proportion de ses clients qui ont acheté un article après avoir consulté son site Web un certain jour avec un niveau de confiance de 95 % et une marge d’erreur de 5 %, combien de clients doivent-ils surveiller ? Étant donné que son site Web est consulté en moyenne 10 000 fois par jour et qu’il n’est pas certain de son taux de conversion actuel, il doit échantillonner 370 clients. Si, toutefois, ils savent, grâce à des études antérieures, qu’ils s’attendent à un taux de conversion de 5%, alors un échantillon de 73 serait suffisant.
Formule
Ce calculateur utilise la formule suivante pour la taille d’échantillon n :
n = N*X / (X + N – 1),
où,
X = Zα/22 *p*(1-p) / MOE2,
et Zα/2 est la valeur critique de la distribution normale à α/2 (par ex.ex. pour un niveau de confiance de 95%, α est 0,05 et la valeur critique est 1,96), MOE est la marge d’erreur, p est la proportion de l’échantillon et N est la taille de la population. Notez qu’une correction de population finie a été appliquée à la formule de la taille de l’échantillon.
La référence suivante explique comment la CPE est utilisée pour ajuster une estimation de la variance lors d’un échantillonnage sans remplacement (voir pages 141-142).
Daniel WW (1999). Biostatistiques : Une base pour l’analyse dans les sciences de la santé. 7ème édition. New York : John Wiley & Sons.
Discussion
Le calculateur de taille d’échantillon ci-dessus vous fournit le nombre recommandé d’échantillons requis pour estimer la moyenne de la proportion réelle avec la marge d’erreur et le niveau de confiance requis.
Vous pouvez utiliser les scénarios alternatifs pour voir comment la modification des quatre entrées (la marge d’erreur, le niveau de confiance, la taille de la population et la proportion de l’échantillon) affecte la taille de l’échantillon. En observant ce qui se passe dans les scénarios alternatifs, vous pouvez voir comment chaque entrée est liée à la taille de l’échantillon et ce qui se passerait si vous n’utilisiez pas la taille d’échantillon recommandée. Plus la taille de l’échantillon est grande, plus vous pouvez être certain que les estimations reflètent la population, donc plus l’intervalle de confiance est étroit. Cependant, la relation n’est pas linéaire, par exemple, doubler la taille de l’échantillon ne réduit pas de moitié l’intervalle de confiance.
Pour de plus amples informations, consultez notre article de blog sur L’importance et l’effet de la taille de l’échantillon.
Définitions
Marge d’erreur
La marge d’erreur est le niveau de précision dont vous avez besoin. C’est le nombre en plus ou en moins qui est souvent signalé avec une proportion estimée et qui est également appelé intervalle de confiance. Il s’agit de la fourchette dans laquelle la véritable proportion de la population est estimée et elle est souvent exprimée en points de pourcentage (par exemple, ±2 %). Notez que la précision réelle obtenue après la collecte de vos données sera supérieure ou inférieure à ce montant cible, car elle sera basée sur la proportion estimée à partir des données et non sur la proportion attendue de votre échantillon.
Niveau de confiance
Le niveau de confiance est la probabilité que la marge d’erreur contienne la véritable proportion. Si l’étude était répétée et la fourchette calculée à chaque fois, vous vous attendriez à ce que la vraie valeur se situe dans ces fourchettes dans 95 % des occasions. Plus le niveau de confiance est élevé, plus vous pouvez être certain que l’intervalle contient la vraie proportion.
Taille de la population
C’est le nombre total d’individus distincts dans votre population. Dans cette formule, nous utilisons une correction de population finie pour tenir compte de l’échantillonnage à partir de populations qui sont petites. Si votre population est grande, mais que vous ne savez pas quelle est sa taille, vous pouvez utiliser prudemment 100 000. La taille de l’échantillon ne change pas beaucoup pour les populations supérieures à 100 000.
Proportion de l’échantillon
La proportion de l’échantillon est ce que vous attendez des résultats. Cela peut souvent être déterminé en utilisant les résultats d’une enquête précédente, ou en effectuant une petite étude pilote. Si vous n’êtes pas sûr, utilisez 50%, ce qui est conservateur et donne la plus grande taille d’échantillon. Notez que ce calcul de la taille de l’échantillon utilise l’approximation normale de la distribution binomiale. Si, la proportion de l’échantillon est proche de 0 ou 1, alors cette approximation n’est pas valide et vous devez envisager une autre méthode de calcul de la taille de l’échantillon.
Taille de l’échantillon
C’est la taille minimale de l’échantillon dont vous avez besoin pour estimer la véritable proportion de la population avec la marge d’erreur et le niveau de confiance requis. Notez que si certaines personnes choisissent de ne pas répondre, elles ne peuvent pas être incluses dans votre échantillon et donc si la non-réponse est une possibilité, votre taille d’échantillon devra être augmentée en conséquence. En général, plus le taux de réponse est élevé, meilleure est l’estimation, car la non-réponse entraînera souvent des biais dans votre estimation.