Ember és gép, gép és gép versengése a pókerben

Legyőzhetetlen pókerbotok

2016. február 26. 9:00
Egyre eredményesebbek, de egyelőre távolról sem tökéletesek a póker programok. Valószínűleg többet kellene tanulniuk az embertől, még a hibáinkat.

A táblás és kártyajátékok pontosan kidolgozott szabályaikkal, speciális célokkal a mesterségesintelligencia-kutatás kihívásokban bővelkedő, de nagyon izgalmas terepei. Sakk, dáma, go és a többiek mellett a logikailag ugyan egyszerűbb, de stratégiailag komplex póker szintén népszerű.

A hiányos információ problémája

Elsősorban abban különbözik tőlük, hogy nem-determinisztikus játék, mert a véletlen szerepe fontos, valamint hiányos (rejtett) információt is tartalmaz. A sakkban nincs ismeretlen, a pókerben a szabályok és a korlátok ellenére mindig van. Ez azért gond, mert a hézagos vagy nem megbízható információ kezelése, a bizonytalan feltételek közötti döntéshozás a számítástudomány egyik alapproblémája.

Nekünk embereknek ellenfelünk tekintete, arcmozgása árulkodik, egy botnak viszont semmit nem mond, semmiféle pluszadathoz nem jut hozzá. Mi hozzászoktunk a hiányzó információ kezeléséhez, számukra azonban monumentális kihívás. Ugyanez jellemzi az életet is – tárgyalás, alkudozás, aukció: mind, mind „nem teljes” információval folytatott játék.

„A póker csomó olyan helyzet mikrokozmosza, amellyel a valóságban találkozunk” – véli Jonathan Schaeffer, a kanadai Alberta Egyetem sakkprogramokkal foglalkozó kutatója.

A póker matematikája

A számítógépes környezet teljesen megváltoztatta a póker arculatát: bevett stratégiákkal hagytak fel, újak kerültek előtérbe, pörgősebbek, rövidebbek a menetek. Szoftveres szimulációban ideális gyakorolni, mert a stratégiák, nüánszok jobban látszódnak, és a legváltozatosabb lapkombinációkat többezer, akár millió meneten keresztül tesztelhetők.  A programok, az állandóan a biztonságra ügyelőtől az ész nélkül hazardírozóig eltérő, színes játékos-archetípusokat „személyesítenek meg.”

A fejlesztők nagy része azonban nem szimpla gyakorlótársat, hanem több szakterület (MI, gazdaságtan stb.) eredményit alkalmazó valódi ellenfeleket tervez. A póker matematikájának mélységeit ismerő botok a legjobb stratégiákat keresik, a játék szépsége helyett a győzelem lebeg előttük. Többségük fizetős, főként havidíjas, de egyiket-másikat ingyen is letölthetjük. Folyamatosan fejlesztik őket, legjobbjaik blöffölni is tudnak, bár nem az a fő fegyverük: úgy programozzák őket, hogy a szabályoknak és a mindenkori lapleosztásnak megfelelően kiválasszák a legjobb stratégiát, majd annak megfelelően cselekedjenek.

Megmérettetések

Az első hivatalos ember-gép pókercsatára 2005-ben került sor, az ír-amerikai Phil „The Unabomber” Laak győzelmével. 2008 nyarán viszont az Alberta Egyetem és a Stoxpoker edző-honlap közös rendezésű las vegasi tornáján az egyetem által fejlesztett Polaris 3 győzelemmel, 2 vereséggel és 1 döntetlennel nyert.

2015. április-májusban a Carnegie Mellon Egyetem Claudiója a világ top 10 játékosai közül néggyel vívott meg egy sorozatot. 80 ezer leosztás után az emberek nyertek, de győzelmüket statisztikailag „nem-szignifikánsként”, inkább döntetlenként értékelte a szakma.

2006 óta a legkiválóbb botok nyaranta, 2011 óta pedig három pókerfajtában mérik össze tudásukat. Az utóbbi években hárman uralták a versenyeket. Egyikük természetesen az Alberta Egyetem, ahol tucatnyian írják a programokat. A Carnegie Mellon Tartanian botja szintén egyre masszívabb eredményeket ér el, míg a harmadik Eric Jackson független fejlesztésű Slumbotja. A legtöbb boton évekig dolgoznak, többmillió, ha nem milliárd játszmában vesznek részt.

A világverő is hibázik

2015-ben az albertaiak ismertették világverő Cepheusuk működését. Rengeteg gyakorlás után elérte a másodpercenkénti kétezer játszma sebességet, szinte az összes lehetséges lépést végigvette, stratégiájában egyre kevesebb lett a hibafaktor. A sajnálkozást minimalizáló algoritmussal dolgozva, minden játszma után visszatekint: mi történt volna, ha másként tette volna ezt és ezt. Így tanul a hibáiból.

Megmutatta, hogy a legbonyolultabb helyzetekre is található optimális stratégia. A kutatók szerint az algoritmus sok más forgatókönyvre szintén alkalmazható: part menti őrjáratra, orvosi kezelésre stb.

A javuló sakk, dáma, póker stb. programokkal nagy a kísértés, hogy kimondjuk: az ember előbb-utóbb esélytelen. Különösen akkor az, ha úgy próbál eljárni, mint a gépek. Ha például számításokba bonyolódik, amiben egyértelműen jóval lassabb…

Csakhogy a gépek is küszködnek egyes helyzetekben. Minél hosszabb ideig tart egy játszma, annál esélyesebbek, de ha pillanatokon belül kell döntésre vinni a dolgokat, könnyen elbuknak. Túl sok adat kell nekik, míg az ember kevés információból is következtet, hipotézist állít fel stb. Agresszivitásban, ellenféllel szembeni nyomásgyakorlásban szintén jobbak vagyunk. Ha túl nagy a nyomás, a gyakran elkapkodott, hirtelen döntéseket hoz és veszít a másik.

A legyőzhetetlen botnak ezt sem ártana elsajátítania. Minket utánozva tenné, és talán még a hibáinkat is másolná. Biztos okulna belőlük.
 

Összesen 1 komment

Jelenleg csak a hozzászólások egy kis részét látja.
Hozzászóláshoz és a további kommentek megtekintéséhez lépjen be, vagy regisztráljon!

A kommentek nem szerkesztett tartalmak, tartalmuk a szerzőjük álláspontját tükrözi.
Hozzászóláshoz és a további kommentek megtekintéséhez lépjen be, vagy regisztráljon!

Bejelentkezés