Toepassingen van eenvoudige kansrekeningsexperimenten
Het fundamentele ingrediënt van de kansrekening is een experiment dat, althans hypothetisch, herhaald kan worden onder in wezen identieke omstandigheden en dat bij verschillende proeven tot verschillende uitkomsten kan leiden. De verzameling van alle mogelijke uitkomsten van een experiment wordt een “steekproefruimte” genoemd. Het experiment waarbij een muntstuk eenmaal wordt opgegooid, resulteert in een steekproefruimte met twee mogelijke uitkomsten, “kop” en “munt”. Het opgooien van twee dobbelstenen heeft een steekproefruimte met 36 mogelijke uitkomsten, die elk kunnen worden geïdentificeerd met een geordend paar (i, j), waarbij i en j een van de waarden 1, 2, 3, 4, 5, 6 aannemen en de afgebeelde vlakken op de individuele dobbelstenen aanduiden. Het is belangrijk de dobbelstenen als identificeerbaar te beschouwen (bijvoorbeeld door een kleurverschil), zodat de uitkomst (1, 2) verschillend is van (2, 1). Een “gebeurtenis” is een welbepaalde deelverzameling van de bemonsteringsruimte. Bijvoorbeeld, de gebeurtenis “de som van de ogen van de twee dobbelstenen is gelijk aan zes” bestaat uit de vijf uitkomsten (1, 5), (2, 4), (3, 3), (4, 2), en (5, 1).
Een derde voorbeeld is het trekken van n ballen uit een urn met ballen van verschillende kleuren. Een algemeen resultaat van dit experiment is een n-tupel, waarvan de i-de kleur aangeeft van de bal die bij de i-de trekking is verkregen (i = 1, 2,…, n). Ondanks de eenvoud van dit experiment vormt een goed begrip ervan de theoretische basis voor opiniepeilingen en steekproefenquêtes. Zo kunnen bijvoorbeeld de personen in een populatie die voor een bepaalde kandidaat in een verkiezing zijn, worden geïdentificeerd met bolletjes van een bepaalde kleur, die welke voor een andere kandidaat zijn, kunnen worden geïdentificeerd met een andere kleur, enzovoort. Waarschijnlijkheidstheorie verschaft de basis voor het leren over de inhoud van de urn uit de steekproef van ballen getrokken uit de urn; een toepassing is om te leren over de verkiezingsvoorkeuren van een bevolking op basis van een steekproef getrokken uit die bevolking.
Een andere toepassing van eenvoudige urn-modellen is het gebruik van klinische proeven om te bepalen of een nieuwe behandeling voor een ziekte, een nieuw geneesmiddel, of een nieuwe chirurgische procedure beter is dan een standaardbehandeling. In het eenvoudige geval waarin de behandeling als een succes of een mislukking kan worden beschouwd, is het doel van de klinische proef na te gaan of de nieuwe behandeling vaker tot succes leidt dan de standaardbehandeling. Patiënten met de ziekte kunnen worden geïdentificeerd met ballen in een urn. De rode ballen zijn de patiënten die genezen door de nieuwe behandeling, en de zwarte ballen zijn de niet-genezen patiënten. Gewoonlijk is er een controlegroep, die de standaardbehandeling krijgt. Zij worden vertegenwoordigd door een tweede urn met een mogelijk andere fractie rode bolletjes. Het doel van het experiment, waarbij een aantal ballen uit elke urn wordt getrokken, is om op basis van de steekproef te ontdekken welke urn de grootste fractie rode ballen bevat. Een variant van dit idee kan worden gebruikt om de werkzaamheid van een nieuw vaccin te testen. Misschien wel het grootste en beroemdste voorbeeld was de test van het Salk-vaccin tegen poliomyelitis in 1954. Deze test werd georganiseerd door de U.S. Public Health Service en er waren bijna twee miljoen kinderen bij betrokken. Het succes ervan heeft geleid tot de bijna volledige uitroeiing van polio als gezondheidsprobleem in de geïndustrialiseerde delen van de wereld. Strikt genomen zijn deze toepassingen problemen van de statistiek, waarvoor de basis wordt geleverd door de waarschijnlijkheidstheorie.
In tegenstelling tot de hierboven beschreven experimenten zijn er bij veel experimenten oneindig veel mogelijke uitkomsten. Men kan bijvoorbeeld een muntstuk opgooien totdat het de eerste keer “kop” is. Het aantal mogelijke opgooiingen is n = 1, 2,…. Een ander voorbeeld is het draaien van een spinner. Voor een geïdealiseerde spinner die bestaat uit een recht lijnstuk zonder breedte en in het midden draait, is de verzameling mogelijke uitkomsten de verzameling van alle hoeken die de eindpositie van de spinner maakt met een vaste richting, dus alle reële getallen in [0, 2π]. Veel metingen in de natuur- en sociale wetenschappen, zoals volume, spanning, temperatuur, reactietijd, marginaal inkomen, enzovoort, worden verricht op continue schalen en omvatten, althans in theorie, oneindig veel mogelijke waarden. Als de herhaalde metingen bij verschillende proefpersonen of op verschillende tijdstippen bij dezelfde proefpersoon tot verschillende uitkomsten kunnen leiden, is de kansrekening een mogelijk instrument om deze variabiliteit te bestuderen.
Omwille van hun betrekkelijke eenvoud worden experimenten met eindige steekproefruimten eerst besproken. In de vroege ontwikkeling van de waarschijnlijkheidstheorie bekeken wiskundigen alleen die experimenten waarbij het redelijk leek, op grond van symmetrie-overwegingen, te veronderstellen dat alle uitkomsten van het experiment “even waarschijnlijk” waren. Dan zouden in een groot aantal proeven alle uitkomsten met ongeveer dezelfde frequentie moeten voorkomen. De waarschijnlijkheid van een gebeurtenis wordt gedefinieerd als de verhouding tussen het aantal gevallen dat gunstig is voor de gebeurtenis – d.w.z. het aantal uitkomsten in de deelverzameling van de steekproefruimte die de gebeurtenis definieert – en het totale aantal gevallen. Zo wordt aangenomen dat de 36 mogelijke uitkomsten bij het werpen van twee dobbelstenen even waarschijnlijk zijn, en de kans op “zes” is het aantal gunstige gevallen, 5, gedeeld door 36, of 5/36.
Nu veronderstellen we dat een muntstuk n keer wordt opgegooid, en beschouwen we de kans op de gebeurtenis “kop komt niet voor” bij de n opgooiingen. Een uitkomst van het experiment is een n-tupel, waarvan de k-de ingang het resultaat van de k-de opgooi aangeeft. Aangezien er voor elke worp twee mogelijke uitkomsten zijn, bedraagt het aantal elementen in de steekproefruimte 2n. Hiervan komt slechts één uitkomst overeen met geen kop, dus de vereiste kans is 1/2n.
Het is slechts iets moeilijker om de kans op “ten hoogste één kop” te bepalen. Naast het enkele geval waarin geen kop voorkomt, zijn er n gevallen waarin precies één kop voorkomt, omdat die kan voorkomen bij de eerste, tweede,…, of n-de worp. Er zijn dus n + 1 gevallen die gunstig zijn voor het verkrijgen van ten hoogste één kop, en de gewenste kans is (n + 1)/2n.