Meer informatie
Worked Example
Als een detailhandelaar een schatting wil maken van het deel van hun klanten dat een artikel heeft gekocht na het bekijken van hun website op een bepaalde dag, met een betrouwbaarheidsniveau van 95% en een foutmarge van 5%, hoeveel klanten moeten zij dan monitoren? Aangezien hun website gemiddeld 10.000 keer per dag wordt bekeken en zij niet zeker zijn van hun huidige conversiepercentage, zouden zij een steekproef van 370 klanten moeten nemen. Als zij echter uit eerdere studies weten dat zij een conversiepercentage van 5% verwachten, dan zou een steekproefgrootte van 73 voldoende zijn.
Formule
Deze calculator gebruikt de volgende formule voor de steekproefgrootte n:
n = N*X / (X + N – 1),
waar,
X = Zα/22 *p*(1-p) / MOE2,
en Zα/2 is de kritische waarde van de normale verdeling bij α/2 (bijv.b.v. voor een betrouwbaarheidsniveau van 95% is α 0,05 en de kritische waarde 1,96), MOE de foutenmarge, p de steekproefverhouding en N de populatiegrootte. Merk op dat op de formule voor de steekproefgrootte een Finite Population Correction is toegepast.
In de volgende referentie wordt uitgelegd hoe de FPC wordt gebruikt om een variantieschatting aan te passen bij steekproeftrekking zonder vervanging (zie blz. 141-142).
Daniel WW (1999). Biostatistics: A Foundation for Analysis in the Health Sciences. 7e editie. New York: John Wiley & Sons.
Discussie
De bovenstaande steekproefgroottecalculator geeft u het aanbevolen aantal steekproeven dat nodig is om het ware proportiegemiddelde te schatten met de vereiste foutenmarge en het vereiste betrouwbaarheidsniveau.
U kunt de Alternatieve scenario’s gebruiken om te zien hoe het veranderen van de vier invoergegevens (de foutenmarge, het betrouwbaarheidsniveau, de populatiegrootte en de steekproefproportie) van invloed is op de steekproefgrootte. Door te kijken wat er gebeurt met de alternatieve scenario’s kunt u zien hoe elke invoer is gerelateerd aan de steekproefgrootte en wat er zou gebeuren als u niet de aanbevolen steekproefgrootte zou gebruiken. Hoe groter de steekproefgrootte, hoe zekerder u kunt zijn dat de schattingen de populatie weerspiegelen, dus hoe smaller het betrouwbaarheidsinterval. De relatie is echter niet lineair, bijvoorbeeld, een verdubbeling van de steekproefgrootte halveert het betrouwbaarheidsinterval niet.
Voor meer informatie, zie onze blogpost over Het belang en het effect van de steekproefgrootte.
Definities
Foutmarge
De foutmarge is het precisieniveau dat u nodig hebt. Dit is het plus- of minteken dat vaak bij een geschatte proportie wordt vermeld en dat ook wel het betrouwbaarheidsinterval wordt genoemd. Het is het bereik waarbinnen het werkelijke bevolkingsaandeel wordt geschat en wordt vaak uitgedrukt in procentpunten (bv. ±2%). Merk op dat de werkelijke precisie die wordt bereikt nadat u uw gegevens hebt verzameld, meer of minder zal zijn dan dit streefcijfer, omdat het zal zijn gebaseerd op de proportie die op basis van de gegevens wordt geschat en niet op uw verwachte steekproefproportie.
Betrouwbaarheidsniveau
Het vertrouwensniveau is de kans dat de foutmarge de ware proportie bevat. Als het onderzoek wordt herhaald en het bereik elke keer wordt berekend, verwacht u dat de werkelijke waarde in 95% van de gevallen binnen dit bereik ligt. Hoe hoger het betrouwbaarheidsniveau, hoe zekerder u kunt zijn dat het interval de ware proportie bevat.
Populatiegrootte
Dit is het totale aantal verschillende individuen in uw populatie. In deze formule gebruiken we een eindige populatiecorrectie om rekening te houden met steekproeven uit populaties die klein zijn. Als uw populatie groot is, maar u weet niet hoe groot, kunt u voorzichtig uitgaan van 100.000. De steekproefgrootte verandert niet veel voor populaties groter dan 100.000.
steekproefverhouding
De steekproefverhouding is wat je verwacht dat de resultaten zullen zijn. Dit kan vaak worden bepaald aan de hand van de resultaten van een eerdere enquête, of door een kleine pilotstudie uit te voeren. Als u niet zeker bent, gebruik dan 50%, wat conservatief is en de grootste steekproefomvang geeft. Merk op dat deze berekening van de steekproefgrootte gebruik maakt van de normale benadering van de binomiale verdeling. Als het aandeel van de steekproef dicht bij 0 of 1 ligt, is deze benadering niet geldig en moet u een alternatieve methode overwegen om de steekproefgrootte te berekenen.
Steekproefgrootte
Dit is de minimale steekproefgrootte die u nodig hebt om het ware aandeel van de bevolking te schatten met de vereiste foutenmarge en het vereiste betrouwbaarheidsniveau. Als sommige mensen niet willen antwoorden, kunnen zij niet in uw steekproef worden opgenomen. Als non-respons dus een mogelijkheid is, moet uw steekproefomvang dienovereenkomstig worden vergroot. In het algemeen geldt: hoe hoger het responspercentage, hoe beter de schatting, aangezien non-respons vaak tot vertekeningen in uw schatting zal leiden.