Een van de eerste stukjes die ik over poker schreef, heette“How Big is Big Enough?”. Dat artikel ging over de volgendevraag: als een speler na een bepaald aantal toernooien een bepaalde winst heeft gemaakt, hoe zeker weet hij dan dat hij een winnende speler is? Hetwiskundige begrip “betrouwbaarheid” speelt in die vraag eenbelangrijke rol. In het dagelijks leven ben ik natuurkundige, en eerder dezeweek was er een hoop ophef rond natuurkundig nieuws waarin datzelfde begripcentraal staat. Een goede aanleiding om het begrip betrouwbaarheid dus nog eenstoe te lichten.
Een pokervoorbeeld
Laten we beginnen met een pokervoorbeeld. Je speeltregelmatig heads-upmatches, en hebt op het niveau dat je speelt 550 van de 1000matches gewonnen. Het lijkt er dus op dat je op dit niveau een winnende spelerbent. Maar hoe betrouwbaar is die conclusie? Er bestaat altijd nog een kans datje helemaal geen winnende speler bent, maar dat je in de duizend matches die jegespeeld hebt gewoon veel geluk hebt gehad.
Je zou naar een wiskundige toe kunnen gaan en hem kunnenvragen hoe groot de kans nu is dat je op dit niveau een winnende speler bent.Maar die vraag is niet erg goed geformuleerd: er bestaat niet zoiets als de kans dat je een winnende pokerspeler bent. Je bent het, of je bent hetniet. Als je bij roulette 1000 keer je geld op zwart had gezet, en 550 keer hadgewonnen, had je precies dezelfde vraag kunnen stellen. Helaas is en blijft diekans dat je een winnende speler bent in dat geval nul – je hebt gewoon erg veelgeluk gehad.
Laten we dus een betere vraag aan de wiskundige stellen. Alsje géén winnende pokerspeler zou zijn, maar bijvoorbeeld een breakeven-spelerdie op de lange duur precies evenveel wint als verliest, hoe groot is dan dekans dat je tóch deze resultaten zou behalen?
Wat rekenwerk
Die vraag valt wel heel precies te beantwoorden. Wie nietvan rekenwerk houdt, kan deze alinea zonder problemen overslaan, maar voor wiedat wel doet: wat is bijvoorbeeld de kans dat een breakeven-speler twee van dedrie matches wint? Hij kan dat op drie manieren doen: door match 1 en 2 tewinnen, door match 2 en 3 te winnen, of door match 1 en 3 te winnen. Voor elkeafzonderlijke match is de kans om te winnen 1/2 (dus 50%), en de kans om te verliezenook 1/2. De kans om bijvoorbeeld match 1 te winnen, match 2 te verliezen enmatch 3 te winnen, bereken je door de drie kansen voor de afzonderlijke matchesmet elkaar te vermenigvuldigen. Die kans is dus 1/2 maal 1/2 maal 1/2, dus 1/8.Diezelfde kans is er voor de andere twee manieren om twee van de drie matcheste winnen, dus de totale kans op het winnen van twee matches is driemaal 1/8.Dat geeft een einduitkomst van 3/8, oftewel 37,5%.
Op precies dezelfde manier kun je uitrekenen hoe groot de kansis dat een breakeven-speler 550 van de 1000 matches wint. Die kans blijktongeveer 0,01% te zijn. Maar nog steeds is de vraag die we gesteld hebben danniet erg informatief: de kans dat een breakeven-speler precies hetverwachte aantal van vijfhonderd van de duizend matches wint, is ook niet zogroot – zo’n 2,5%, om precies te zijn. De breakeven-speler heeft natuurlijk ookeen forse kans om 499 of 501 toernooien te winnen. Een betere vraag is dus: hoegroot is de kans dat een breakeven-speler 550 toernooien of meer wint?Die kans krijg je door de kansen op 550 overwinningen, 551 overwinningen,enzovoort op te tellen. Na wat rekenwerk (leve de computer!) vind je dan datdie kans ongeveer 0,09 procent is.
Betrouwbaarheid
Daarmee zijn we uitgekomen bij het wiskundige begrip betrouwbaarheid. We kunnen na het zien van de bovenstaande minieme kansgerust zeggen dat de conclusie dat je een winnende speler bent erg betrouwbaaris. Niet omdat we hebben uitgerekend dat de kans dat je een winnende spelerbent erg groot is – zoals gezegd: dat ben je, of dat ben je niet. Maar wehebben uitgerekend dat de kans dat je deze resultaten zou behalen als je geen winnende speler was, extreem klein is. We kunnen er dus veelvertrouwen in hebben dat je wel een winnende speler bent.
Betrouwbaarheid wordt in de wetenschap meestal nietaangegeven in kansen, zoals hierboven, maar in termen van een begrip dat standaardafwijking heet. Het doet er niet heel veel toe hoe dat begripprecies gedefinieerd is, want het valt eenvoudig te vertalen in termen van debovengenoemde kansen. Eén standaardafwijking betekent bijvoorbeeld dat eenbreakeven-speler een kans van 16% heeft om de gevonden resultaten te behalen.Twee standaardafwijkingen betekent dat die kans 2,3% is, enzovoort. De preciezevertaling tussen standaardafwijkingen en kansen zie je in de onderstaande tabel:

In ons voorbeeld, waar de kans op een toevallige winnendereeks van 550 toernooien 0,09% was, is dus sprake van iets meer dan driestandaardafwijkingen.
Bankrollmanagement
Wanneer het gaat om bankrollmanagement speelt het begripbetrouwbaarheid een belangrijke rol. Zie voor een veel gedetailleerdervoorbeeld (waar ik inga op bankrollmanagement voor Sit&Go-spelers)het artikel wat ik hierboven noemde. Maar er zijn nog allerleiandere toepassingen: als je bijvoorbeeld iemand een backing-deal wiltaanbieden, wil je graag de nodige zekerheid hebben dat die persoon een winnendespeler is. Je kunt om die zekerheid te krijgen weer uitrekenen hoe groot dekans is dat de resultaten die hij presenteert gebaseerd zijn op puur toeval. Isdie kans erg klein, dan kun je er veel vertrouwen in hebben dat de speler eenwinnaar is. (Er even van uitgaande dat de speler ook betrouwbaar is in degebruikelijke zin van het woord, en je dus geen verzonnen resultaten voorschotelt…)
Een laatste pokervoorbeeld: er komt een speler bij je aantafel zitten die 4 van de eerste 10 handen raiset. Die speler lijkt dusbehoorlijk agressief, maar het kan natuurlijk best zo zijn dat hij toevalligvier keer een goede hand heeft gekregen. Heeft diezelfde speler echter na 1000handen er 400 geraiset, dan valt toeval bijna uit te sluiten, en kun je erbehoorlijk zeker van zijn dat we hier echt met een maniak van doen hebben. Ookhier kun je de betrouwbaarheid van de conclusie “deze speler is ergagressief” weer berekenen, door uit te rekenen hoe groot de kans is dateen minder actieve speler (bijvoorbeeld iemand die maar 10% van zijn handenraiset) deze statistieken zou vertonen. Is die kans maar een paar procent, dankun je er vertrouwen in hebben dat deze speler echt agressief is, en je eigenspel daarop aanpassen. Is die kans groter, dan kan het verstandiger zijn om nogniet direct met aas-tien offsuit tegen deze tegenstander all in te gaan.

CERN: Large Hedron Collider
Pokertoepassingen te over, dus – en datzelfde geldt voor denatuurkunde. Deze week werd bij het CERN (Centre Européenne pour la RechercheNucléaire) in Genève een grote persconferentie gehouden over de resultaten vande LHC van het afgelopen jaar. LHC staat voor “Large HadronCollider”: een enorme ondergrondse ring van maar liefst 27km in doorsnede,waarin elementaire deeltjes versneld worden tot enorme snelheden, om vervolgensmet gigantische energie op elkaar te botsen. Bij die botsingen worden deoorspronkelijke deeltjes vernietigd, en ontstaan uit de vrijgekomen energieallerlei nieuwe deeltjes met mooie namen als elektronen, neutrino’s, fotonen enmuonen.
De grote vraag die de LHC probeert te beantwoorden, is of erook een mysterieus deeltje bestaat dat het Higgsdeeltje genoemd wordt.Dit deeltje is, in tegenstelling tot alle hierboven genoemde deeltjes, nognooit waargenomen, maar er zijn toch allerlei redenen om aan te nemen dat hetbestaat – bijvoorbeeld omdat we met behulp van dat deeltje kunnen verklarenwaarom allerlei ándere deeltjes een bepaalde massa (een bepaald”gewicht”) hebben.
De energie van de botsingen in de LHC is zó groot dat ookhet zeldzame Higgsdeeltje kan ontstaan, maar helaas kunnen we niet een detectorbouwen die we in de LHC kunnen neerzetten, en die “piep” zegt zodraer een Higgsdeeltje in terecht komt. De reden daarvoor is dat het Higgsdeeltjeerg instabiel is: het valt vrijwel direct nadat het gevormd is weer uiteen inallerlei andere deeltjes, de zogenaamde vervalproducten. Ook dievervalproducten zijn weer elektronen, muonen, enzovoort. Die deeltjes kunnen wewel detecteren, maar we weten natuurlijk niet of die deeltjes dan uit eenHiggsdeeltje zijn ontstaan, of dat het vervalproducten zijn van deoorspronkelijke botsende deeltjes.
Wat we echter wel kunnen doen is tellen hoe vaak webepaalde deeltjes in de detectoren zien. Wat het Higgsdeeltje doet – als hetbestaat – is het volgende: het zal ervoor zorgen dat bepaalde vervalproductennet iets vaker gemeten worden dan als er geen Higgsdeeltje was. Nu gaat hethierbij net als in het bovenstaande pokervoorbeeld om een kansproces: als weverwachten dat een bepaald vervalproduct in de helft van de metingen te zien isals er geen Higgsdeelte is, en in 55% van de metingen als er weleen Higgsdeeltje is, dan weten we na een meting of tien natuurlijk nog heelweinig. Als we na duizend metingen het vervalproduct 550 maal gezien hebben,weten we al een stuk meer: de kans dat we die resultaten gekregen zouden hebbenals er géén Higgsdeeltje was is, net als in het pokervoorbeeld, maar zo’n0,09%. De conclusie dat het Higgsdeeltje bestaat is dan dus redelijkbetrouwbaar.
Nu spreken natuurkundigen niet erg snel van een”ontdekking”. Er is zelfs heel precies afgesproken wanneer er van deontdekking van een bepaald deeltje gesproken mag worden: dat is zodra er sprakeis van een betrouwbaarheid van vijf standaardafwijkingen of meer. Deonderzoekers bij het CERN zullen hun resultaten dus pas als een ontdekkingkunnen publiceren als – zie weer de tabel hierboven – de kans dat dieresultaten op toeval berusten kleiner is dan 0,000029%.
Propbets
Zover is het op dit moment helaas nog niet. De resultatendie deze week gepubliceerd werden, en die al diverse kranten gehaald hebben,lijken inderdaad te bevestigen dat er een Higgsdeeltje bestaat. Maar heelbetrouwbaar zijn die resultaten nog niet: ze hebben standaardafwijkingen vanrond de 2, dus er is nog altijd een goede kans (van een paar procent) dat demetingen puur het gevolg zijn van toeval. Over ongeveer een jaar hopen deexperimentatoren voldoende data verzameld te hebben om – als het Higgsdeeltjeinderdaad bestaat, natuurlijk – de standaardafwijking te hebben opgeschroefdtot rond de 5. Hopelijk weten we dan dus zeker of het deeltje bestaat. Depokerspelers hebben intussen nog een jaar de tijd om hun propbets af tesluiten.










