Marcel Vonk over toernooistructuren: Dutch Open 2012

Voor PokerCity laat Marcel Vonk zijn licht regelmatig schijnen op de wiskunde in poker. Ditmaal schrijft hij over toernooistructuren. Op verzoek van het Holland Casino keek Vonk naar de structuur van de Dutch Open 2012. Marcel Vonk won in 2010 als eerste Nederlander een No Limit Hold’em WSOP bracelet. Zijn overwinning in het $1.000 event (3844 deelnemers) leverde $570.960 op. In het dagelijks leven is Vonk theoretisch natuurkundige, werkzaam aan het Instituto Superior Técnico in Lissabon.

Vorig jaar december ontving ik een mailtje van Norbert Muller, de pokermanager van Holland Casino. Norbert had de stukjes gelezen die ik zo af en toe voor deze website schrijf, en vroeg zich af of ik als wiskundige en pokerspeler een mening had over de opbouw van een goede toernooistructuur. Hij wilde uitzoeken of het mogelijk zou zijn om naast de gebruikelijke tweedaagse Main Events van de HCSOP-toernooien ook zo nu en dan een driedaags event aan te bieden – te beginnen met de Dutch Open van 2012. Kon ik vanuit mijn wiskundige achtergrond advies geven over wat de optimale structuur van zo’n toernooi zou zijn?

Als toernooispeler vind ik het natuurlijk een erg goede zaak als er in Nederland meer meerdaagse toernooien worden georganiseerd, en net als elke andere toernooispeler klaag ik regelmatig over slechte structuren, dus ik ging graag op dit verzoek in. Klein punt was wel dat ik nog nooit echt als wiskundige over toernooistructuren had nagedacht, maar dat kon niet zo’n probleem zijn, leek me – ik beloofde Norbert dat ik er wat grondiger over zou nadenken, en dat ik binnen afzienbare tijd op zijn vraag terug zou komen.

De wiskunde
Die afzienbare tijd werd wat langer dan ik had gedacht, want ik ontdekte al snel dat er achter toernooistructuren veel interessante wiskunde zit. En dat niet alleen, er blijken ook diverse wiskundigen te zijn die hun licht al over dit onderwerp hebben laten schijnen. Zo ontdekte ik bijvoorbeeld het werk van ene Clément Sire, die een aantal wiskundige artikelen over pokertoernooien heeft geschreven. Met name zijn artikel “Universal statistical properties of poker tournaments” (online via deze link te vinden) bleek erg nuttig te zijn.

Wat deze Fransman in zijn artikel wiskundig aantoont, is dat er in toernooistructuren eigenlijk maar één echt belangrijke factor is, namelijk de snelheid waarmee de blinds omhoog gaan. We kunnen die snelheid bijvoorbeeld uitdrukken als een “verdubbelingstijd”: de tijd waarin de kosten per ronde (dus de blinds plus de antes) grofweg tweemaal zo hoog worden. Die tijd kan in minuten (of uren) geteld worden, maar het is nog beter om hem uit te drukken in gedeelde handen – op die manier kunnen we ook online-toernooien vergelijken met live-toernooien, en live-toernooien met schudmachines met live-toernooien waarbij met de hand gedeeld wordt.

Dat de snelheid waarmee de blinds omhoog gaan een bepalende factor is in een toernooistructuur (en in het bijzonder: voor de tijd die het duurt tot een toernooi is afgelopen) zal natuurlijk niemand verbazen. Wat misschien verbazender is, is hoe weinig invloed allerlei andere factoren hebben. Als we de verdubbelingstijd in een toernooi tweemaal zo lang maken – bijvoorbeeld door de levels tweemaal zo lang te maken, of door tussen elke twee levels een nieuw level in te voeren – zal het toernooi zelf ook grofweg tweemaal zo lang duren. Diverse andere factoren hebben een veel kleinere invloed. Wat voorbeelden:

Het aantal spelers: Als aan een toernooi met een bepaalde structuur tweemaal zo veel mensen meedoen, zal dat toernooi in het algemeen maar een paar levels langer duren. Iets preciezer: zo’n toernooi zal (gemiddeld, natuurlijk) vrijwel precies een verdubbelingstijd langer duren. Als de blinds elke drie levels verdubbelen, duurt het toernooi dus naar verwachting zo’n drie levels langer. De reden daarvoor is, zoals Sire aantoont, dat bij elke verdubbelingstijd een bepaalde evenwichtsstack hoort. Dat wil zeggen dat de gemiddelde stack vanaf een gegeven moment een bepaald aantal big blinds is – bijvoorbeeld 25BB – en ook rond die waarde zal blijven schommelen.

Stel nu dat we willen weten wanneer de (tienpersoons) finaletafel van het toernooi begint. Dat zal gemiddeld zijn als er nog tienmaal 25, dus 250 big blinds in het spel zitten. Bij tweemaal zoveel startspelers zijn er ook tweemaal zoveel chips in het spel, en dus duurt het een verdubbelingstijd langer tot er 250 big blinds over zijn. Elke andere fase (nog twee tafels over, heads up, enzovoort) begint ook zo’n drie levels later, en ook het hele toernooi zal dus gemiddeld zo’n drie levels langer duren.

De startstack: Om precies dezelfde reden duurt een toernooi ook maar één verdubbelingstijd langer als we de startstack verdubbelen. Veel zogenaamde deepstacktoernooien zijn daardoor qua structuur nauwelijks beter dan gewone toernooien: als “deepstack” alleen betekent dat de organisator de startstack groter maakt, zal dat alleen de eerste paar levels beïnvloeden. Op een gegeven moment heeft vrijwel elke speler de evenwichtsstack bereikt, en vanaf dat moment verloopt het toernooi precies zoals een niet-deepstacktoernooi.

Met name in Amerikaanse casino’s zie je dit vaak: toernooien waarin de spelers in de eerste levels met honderden big blinds zitten, maar die uiteindelijk uitmonden in een shove-fest waarin iedereen nog vijf big blinds over heeft. De enige manier om een écht deepstacktoernooi te organiseren, is door de levels langer te maken of tussenlevels toe te voegen: op die manier wordt de evenwichtsstack groter, en hebben de spelers dus ook later in het toernooi nog een grotere stack.

De speelstijl van de spelers: Een toernooi met veel tighte spelers zal langer duren dan een toernooi met veel losse spelers. De speelstijl heeft namelijk invloed op de grootte van de evenwichtsstack: losse spelers die veel all in gaan, zullen gemiddeld een grotere stack hebben dan tighte spelers die wachten tot ze hun resterende 3BB met een paar boeren naar het midden kunnen schuiven. Toch heeft ook dat weinig invloed op de duur van het toernooi: als een bepaalde toernooistructuur met tighte spelers een evenwichtsstack van 10BB heeft, en met losse spelers een evenwichtsstack van 20BB, zal het toernooi met de tighte spelers wederom maar één verdubbelingstijd (een paar levels) langer duren – precies de tijd die het duurt tot een stack van 20BB een stack van 10BB is geworden.

Wel of geen antes: Ook het al dan niet invoeren van antes heeft vrijwel geen invloed op de duur van een toernooi. Wel zal de evenwichtsstack iets veranderen – al is het moeilijk precies te zeggen hoe groot die verandering is. Met antes in het spel zal een speler met een stack van 25BB het beduidend minder lang volhouden dan zonder antes, en als gevolg daarvan zal de evenwichtsstack uitgedrukt in big blinds vaak iets groter zijn. Aan de andere kant zijn raises ten opzichte van de potgrootte met antes vaak kleiner, en daardoor zal ook de gemiddelde pot aan het eind van de hand ten opzichte van de kosten voor één ronde kleiner zijn. De evenwichtsstack zal daardoor, in kosten per ronde uitgedrukt (oftewel in termen van de “M” die Dan Harrington beroemd heeft gemaakt), juist wat kleiner zijn dan zonder antes. Hoe dan ook, net zoals voor de factor “speelstijl” geldt ook hier dat de precieze evenwichtsstack weinig invloed heeft op de totale duur van het toernooi. Een toernooi met antes zal dus niet veel langer of korter duren dan een toernooi met dezelfde verdubbelingstijd maar zonder antes.

Natuurlijk heeft het invoeren van antes wel op andere manieren invloed op de kwaliteit van een toernooistructuur. Voor losse, actieve spelers is een toernooi met antes vaak gunstig, aangezien het vaak stelen van kleine potten nu ook elke keer de antes oplevert, en dus relatief gunstiger is dan het zo nu en dan winnen van een grote pot met een monsterhand. Om diezelfde reden is voor tightere spelers een structuur zonder antes gunstiger. Veel goede spelers hebben een actieve stijl, en dus zal een structuur met antes in het algemeen in het voordeel van de sterkere spelers zijn. Bij de Dutch Open zal om die reden geëxperimenteerd worden met een toernooi met iets grotere antes dan gebruikelijk: waar de ante meestal zo’n 10% van de big blind is, zal de gemiddelde ante nu zo’n 13,5% van de big blind zijn.

Een laatste punt waarmee in toernooistructuren met antes rekening moet worden gehouden, is de sprong in de kosten per ronde als de antes worden ingevoerd. Vaak is deze sprong erg groot: er zijn bijvoorbeeld toernooien waarin een level met blinds van 100/200 wordt gevolgd door een level met blinds en antes van 150/300/25. In het eerste level is elke speler 100+200=300 chips per ronde kwijt; in het volgende level (aan een tafel met tien spelers) 150+300+10×25=700 chips per ronde – een toename met een factor van meer dan twee.

In een toernooi waarbij de verdubbelingstijd na de invoering van de antes bijvoorbeeld drie levels is, worden de kosten per ronde dan dus in één klap meer dan verdubbeld, wat ertoe zal leiden dat heel veel spelers opeens shortstacked worden. De vuistregel (zoals ook uit simulaties blijkt – zie hieronder) is dat een toernooi zo gelijkmatig mogelijk verloopt als de kosten per ronde zo gelijkmatig mogelijk toenemen. In het algemeen is het dus voor een regelmatig toernooiverloop veel beter om bij de invoer van de antes de blinds niet te verhogen – in dit voorbeeld dus door een level 100/200/25 toe te voegen.

Een simulatie
Hoewel de achterliggende wiskunde vrij gecompliceerd kan worden, is het resultaat van al die wiskunde vrij eenvoudig te formuleren: zorg ervoor dat de kosten per ronde gelijkmatig en niet te snel toenemen, en er ontstaat vanzelf een goede toernooistructuur. De vraag is dan natuurlijk nog wel: hoe lang duurt zo’n toernooi precies? Aangezien de duur van een toernooi zoals we gezien hebben niet erg gevoelig is voor allerlei factoren, valt dat te achterhalen met behulp van een eenvoudige simulatie. In zo’n simulatie geven we een aantal virtuele spelers een startstack, en laten die spelers een virtueel toernooi spelen. Daarbij zijn de precieze pokerregels niet van belang: we hoeven niet elke speler twee kaarten te geven en precies in te stellen wanneer een speler op elke straat zal raisen, reraisen, callen, enzovoort. Sire laat in zijn artikel zien dat er eigenlijk maar twee aspecten van het pokerspel voor de uiteindelijke toernooiduur van belang zijn:

Spelers spelen voornamelijk kleine potten die om enkele big blinds gaan, en
Zo nu en dan gaan twee spelers all in.

Zolang het simulatiespel die twee aspecten maar in zich heeft, zal de uiteindelijke verdeling van stacks en de uiteindelijke toernooiduur erg lijken op die van daadwerkelijke pokertoernooien – iets wat Sire heeft gecontroleerd door de resultaten uit zijn modellen te vergelijken met de resultaten van een groot aantal online-toernooien en WPT-toernooien.

Ik heb daarom, geïnspireerd door Sire, in het programma Mathematica een simulatie geschreven waarin de virtuele spelers het volgende spel spelen: elke speler krijgt een “kaart” met daarop een willekeurig getal tussen 0 en 1. Als het getal groter is dan een bepaalde grenswaarde x, zet de speler een bepaald aantal van N big blinds in. Is het getal groter dan een grotere grenswaarde, y, dan gaat de speler all in. Als er meer dan twee spelers betten, of meer dan twee spelers all in gaan, wint de speler met de kaart met het grootste getal de pot. Geen erg enerverend spel om daadwerkelijk te spelen, maar eenvoudig te programmeren, en – zoals blijkt uit de wiskunde van Sire – ruim voldoende om een goede indruk te krijgen van het verloop van een echt pokertoernooi.

De precieze waarden van de getallen x, y en N zijn daarbij niet van groot belang; ook die hebben een invloed op de toernooiduur die hooguit enkele verdubbelingstijden is. Om die invloed toch zo klein mogelijk te maken, heb ik de simulatie eerst laten lopen met blindniveaus en startstacks die overeenkomen met die van een 180-persoonstoernooi op Pokerstars, en de waarden zo gekozen dat de toernooiduur in de simulatie overeenkomt met de gemiddelde toernooiduur van die toernooien.

Vervolgens heb ik de simulatie losgelaten op de toernooistructuur die Norbert voorstelde voor de driedaagse toernooien. Die voorgestelde structuur bleek al heel aardig te zijn, maar aan de hand van de simulaties konden we toch nog wat kleine verbeteringen aanbrengen. Laten we de resultaten van de simulatie met de uiteindelijke toernooistructuur eens bekijken. Onderstaande afbeelding toont een grafiek die aangeeft hoeveel levels het toernooi binnen die structuur duurt als er 150 deelnemers zijn.

We zien dat het toernooi in 50% van de gevallen halverwege level 27 (of eerder) is afgelopen, in 75% halverwege level 29, enzovoort. Hieruit blijkt meteen een van de problemen voor organisatoren van meerdaagse toernooien: er zit een forse statistische spreiding in te lengte van zo’n toernooi. Precies hetzelfde toernooi met precies dezelfde structuur en precies dezelfde spelers kan de ene keer 23 levels duren, en de volgende keer 30 levels. Bij een driedaags toernooi kan het verschil tussen een snel en een langzaam toernooi zo al snel oplopen tot een halve dag. Het is dus zaak dat de organisator goed in de gaten houdt hoe het toernooi verloopt, en zo nodig op eerdere dagen al extra levels laat spelen of juist vroeg de dag afsluit – al valt zelfs dan niet te voorkomen dat zo nu en dan het toernooi voor de laatste dinnerbreak al afgelopen zal zijn, of juist dat een gevreesde extra speeldag nodig blijkt.

Aan de hand van de simulaties kunnen we ook mooi zien hoe klein de invloed van alle andere factoren dan de verdubbelingstijd op het toernooi is. Hier is bijvoorbeeld dezelfde grafiek als hierboven, maar nu voor een toernooi met 300 deelnemers:

We zien dat de afstanden tussen de strepen vrijwel hetzelfde is gebleven, maar dat alles ongeveer drie levels naar rechts is geschoven – het toernooi duurt gemiddeld dus drie levels (in dit geval: drie uur) langer dan het toernooi met 150 deelnemers. Precies hetzelfde geldt als we de startstack twee keer zo groot maken.

Tenslotte nog een plaatje van het verloop van de gemiddelde stack (in BB) tijdens het toernooi:

Op de horizontale as staat het aantal handen uitgezet; in een livetoernooi worden zo’n 24 handen per uur gespeeld. De rood-groene strips geven de levels aan. De zwarte lijn geeft de gemiddelde stack in een sample van 1000 gesimuleerde toernooien. De blauwe lijnen geven het zogenaamde 95%-interval aan: 950 van de 1000 toernooien hadden op dat moment een gemiddelde stack tussen de twee blauwe lijnen.

We zien dat de zwarte lijn na zo’n 200 handen min of meer stabiel wordt rond de 50 big blinds. Dit is dus de evenwichtsstack; ook als we het toernooi met meer spelers of een grotere startstack simuleren, zal de gemiddelde stack uiteindelijk rond deze grootte uitkomen. De piek in de blauwe lijn na zo’n 550 handen ontstaat doordat op dat moment de eerste toernooien afgelopen zijn: zodra de winnaar van het toernooi zijn laatste hand wint, wordt de gemiddelde stack natuurlijk in één klap tweemaal zo groot. Gemiddeld over duizend toernooien gebeurt dit redelijk gespreid, en daardoor zien we in de zwarte lijn geen sterke piek. De bovenste blauwe lijn geeft echter aan waar de hoogste gemiddelde stacks uit de 1000 toernooien zich bevinden, en zodra de eerste toernooien afgelopen zijn, zien we daarin dus een scherpe piek.

De “hobbel” rond hand 75 ontstaat door het invoeren van antes. Een dergelijke hobbel is onvermijdelijk, zoals we hierboven al gezien hebben: de gemiddelde stack in big blinds neemt toe, de gemiddelde stack in kosten per ronden juist af, dus welke eenheid we ook gebruiken, er zal altijd een kleine sprong zijn. Waar het om gaat is dat de sprong relatief klein is – dit geeft aan dat de gekozen structuur een goede is. Hetzelfde zou op andere plaatsen in de structuur gelden: als we de blinds te snel of te langzaam laten toenemen ontstaan er hobbels in de grafiek.

Zoals gezegd was de structuur die Norbert aan me voorlegde al heel behoorlijk. Aan de hand van de simulaties kon ik nog wat kleine voorstellen doen om de structuur wat gladder te maken, en al met al denk ik dat er zo een erg goede driedaagse structuur is ontstaan. Wie benieuwd is naar de uiteindelijke structuur, kan deze hier vinden. Ik ben nu natuurlijk ook erg benieuwd naar de praktijk – tijdens de Dutch Open op 25 oktober wordt deze structuur voor het eerst gebruikt, dus ik hoor na afloop graag ieders ervaringen!

LIVE REPORTING POKERNIEUWS

Pokernieuws

POKER NIEUWS

OVERIGE POKER

HANDIGE LINKS

SOCIAL MEDIA

OVER POKERCITY

Leeftijdscheck