Aannames
Agents zijn rationeel
Agents bluffen niet
Agents zullen hun inzet naar hun winkans modelleren
Notatie PWint,A1 is de kans op winnen voor agent 1.
![]()
![]()
De agent krijgt informatie binnen door het handelen van andere spelers en het open komen te liggen van kaarten. Als basis zal een agent weten wat mogelijk is. Zodra er onmogelijkheden tot stand komen, zal de agent dit weten en die werelden schrappen.
Als het bijvoorbeeld voor de agent niet meer mogelijk is om four of a kind heer te krijgen, zal de agent dit als mogelijke wereld wegstrepen.
Als de agent weet wat de kans op winnen is, dan weet het ook wat het moet inzetten. De inzet is gelijk aan de kans op winnen, omhoog afgerond naar een meervoud van vijf. Bij een kans van 42% procent wordt dus 45 ingezet.
Wanneer de ander mee gaat met de inzet van de agent, dan kan de agent hiervan kennis vergaren. Aangezien aangenomen is dat de agents niet bluffen en volledig rationeel zijn, zal hun winkans in de buurt van de lopende inzet liggen.De afwijking van de door de andere agent berekende winkans en de inzet kan niet meer dan 10% omhoog zijn en niet minder dan 5% omlaag.
De andere agent gaat mee:
![]()
![]()
De andere agent verhoogt:
![]()
![]()
We gaan er vanuit dat we tegen een rationele agent spelen en dat deze agent inzet aan de hand van zijn win kansen.
In de bovenstaande regels is de kennis voor agent 1 dat de winkans van agent 2 niet groter is dan een bepaalde waarde, logisch equivalent aan de kennis dat het niet zo kan zijn dat de winkans groter is. Alle situatie die met deze wereld in tegenstelling staan, zullen worden als de agent als onmogelijk worden beschouwd.

Figuur
1: Tabel met alle mogelijke werelden als handen combinaties