Hertil og ikke længere? Poker er et skill game, så selvfølgelig har computernørder kastet sig over poker i den klassiske dyst maskine vs. menneske. Den hidtil bedste pokerbot, Polaris, præsenteres her.
Første gang jeg stødte på navnet Polaris var til en robotfestival i Odense for et par år siden. Der blev vist film i en nærliggende biograf om fremtid, teknologi og så videre i den dur.
En af filmene var en gammel sovjetisk science fiction film ved navn Polaris (1972, i 2002 blev den genindspillet med George Clooney i hovedrollen). Den handler om en rumstation, hvor alle bliver drevet til vanvid af en syret kosmisk kraft. Filmen var monsterkedelig, ikke mindst fordi filmrullen manglede stumper hist og her, og underteksterne ofte svigtede.
Polaris-navnet gav mig indtil for nylig besværlige associationer, men navnet lugter alligevel af fremtid og udforskning af fremmede, komplekse horisonter. Præcis de nævnte positive ting peger hen på pokerbotten Polaris.
Polaris, hjernevindinger og poker
“The patience of a monk or the fierce aggression of a tiger, changing gears in a single heartbeat. Polaris can make a pro’s head spin. Bluff, trap, check-raise bluff, big lay-down – name your poison.” Sådan beskriver Poker Academy computerprogrammet. Det lyder flot og drabeligt.
Programmet Polaris er udviklet af University of Alberta. Projektet var undervejs i 16 år, før Polaris spillede sine første kampe i offentligheden i sommeren 2007. Polaris spiller kun HU fixed limit texas holdem og kræver kun begrænset computermuskelkraft for at køre: Når Polaris har spillet live, har programmet kørt på en bærbar Apple MacBook Pro.
Maskine og menneske har kæmpet før. Da skakcomputeren Deep Blue i 1997 slog verdens dengang bedste skakspiller, Garry Kasparov, var det åbenlyst, at computeren er mennesket overlegen i logisk råstyrke. Og så skulle sagen være afgjort. Skulle man tro. Her lurer en finte, for mens alle oplysninger er tilgængelige i skak og dejlig nemme at regne på for en binær tællemaskine, har poker et uforudsigeligt element.
Kampen menneske vs. maskine kan derfor dårligt siges at være afgjort, før man ved, hvordan computeren reagerer på tilfældigheder genereret af spillekortene tilsat dygtighedskrydderiet bluff.
Kunstig intelligens
Polaris´software byder på såkaldt kunstig intelligens, artificial intelligence, AI. Det betyder, at Polaris kan tilpasse sig og aflure temperament og reaktioner hos sin menneskelige modspiller (i virkeligheden er der tale om kompleks, individuel mønstergenkendelse).
AI er i konkret form kunstige neurale netværk (~ hjernevindinger), der lærer hen ad vejen, og computeren spiller derfor ikke 100 % optimalt i starten. Rammerne er dog givne: Polaris er forprogrammeret med en række pokerstrategier, den må vælge imellem, men efterhånden lærer computeren af sine erfaringer og bliver bedre og bedre til at vælge og kombinere.
Sådan siger teorien i hvert fald. Løsningen på problemet med ufuldstændige viden er problemet ved løsningen. I praksis er det svært at afgøre, hvorvidt en poker match blev vundet udelukkende pga. dygtighed eller om kortfordeling osv. har sit at sige. Samme problem gør sig gældende i backgammon – hvor computerprogrammører også har boltret sig – der har samme elementer af dygtighed/tilfældighed.
Vores søsterside Backgammonforum.dk supplerer med artiklen Computeren spiller backgammon.
Polaris udfordrer
I sommeren 2007 – nærmere bestemt 23. og 24. juli – var det tid til at afprøve Polaris første gang. Stedet var Hyatt Regency Hotel i Vancouver i Canada. Prof-spillerne Phil ”The Unabomber” Laak (der havde vundet over Polaris´ forgænger, Vexbot) og Ali Eslami havde modtaget udfordringen. Ingen af spillerne var i den absolutte topelite, men begge har en udpræget analytisk tilgang til poker, hvorfor det skønnedes, at de var værdige modstandere for Polaris.
Hver af dem spillede imod ”sin egen” Polaris. Konkurrencen bestod af 4 matcher på hver 500 hænder, altså 2 x Laak vs. Polaris og 2 x Polaris vs. Eslami. For at reducere betydningen af held (tilfældighed), blev kortene givet sådan, at hvis Laak havde gode hænder i sin første match, og Polaris dårlige, var det lige omvendt i matchen Polaris vs. Eslami. Spillerne sad i hvert sit rum.
Efter omkring 16 timer spil fordelt på 2 dage var den første match endt uafgjort, Polaris havde vundet den 2. og tabt de 2 sidste. Mennesket havde vundet, men Polaris var heller ikke i topform. Faktisk havde den kun benyttet sit AI potentiale i en enkelt match, som den i øvrigt havde vundet. I de andre 3 havde den så at sige hentet sine træk fra en stor forprogrammeret database.
Computerfolkene fra University of Alberta havde stadig arbejde at gøre. En tilfreds professor Michael Bowling, der ledte holdet af programmører, kunne efter et års fokuseret arbejde fortælle, at Polaris var kommet op et niveau som beskrevet ovenfor. Udviklingen betød, ifølge professor Bowling, at det:
“[C]omplicated the human players ability to compare notes, since Polaris chose a different strategy to use against each of the humans it played.”
Polaris slår til igen
Et år senere – den 3.-6. juli 2008 – var Polaris klar igen. Denne gang havde pokerprogrammet 7 menneskelige modspillere, kamppladen var messen Gaming Life Expo i Las Vegas. De 7 spillere var alle succesrige online spillere anført – og håndplukket – af Nick ”stoxtrader” Grudzien, der står bag en pokercoaching webside.
Der blev spillet 6 matcher á 500 hænder, og man havde forsøgt at eliminere heldfaktoren på samme måde som sidst. Denne gang vandt Polaris 195 big blinds og fik i alt 3 sejre, tabte 2 matcher og en endte uafgjort.
End of the World?
Har maskinen endegyldigt sejret over mennesket? Nej, ikke i poker i hvert fald. Langt fra. Det er der, mindst, 3 gode grunde til. Den første handler om de menneskelige spillere, de 2 sidste om Polaris selv.
Begge resultater – den tabte miniturnering i 2007 og sejren i 2008 – var mudrede, der var i hvert fald ikke tale overbevisende massakrer af modstanderen/ne. De menneskelige spilleres benovelse over at spille mod Polaris – state of the art of programming – kunne have indvirket på deres spil, dagsform er en faktor osv.
Som bekendt spiller Polaris kun HU. Situationen er meget, meget, meget mere kompleks, hvis Polaris befinder sig ved et 10-mands bord. Her får intuitionen et par hak opad i betydning, og når alt kommer til alt, er Polaris stadig en regnemaskine.
Desuden spiller Polaris kun fixed limit. Polaris´ sejrsstatistik ville være til at overse, hvis den spillede no limit. Som det er blevet sagt: ”I Texas hold ’em skyder man til måls, men i Texas hold ’em no limit bliver målet pludselig levende og begynder at skyde tilbage.”
Mennesket kan noget, som selv den mest forvoksede kugleramme aldrig vil kunne.