Künstliche Intelligenz Der Mensch verliert sein Poker-Gesicht

Erst schlug uns die Maschine im Schach, dann beim Go und jetzt beim Pokern. Zum ersten Mal ist nun die Maschine dem Menschen überlegen, wenn es um ein Spiel mit verdeckten Karten geht. Mit Folgen, die weit über das Glücksspiel hinaus gehen: Viele Situationen im Alltag haben Ähnlichkeit mit Poker.

Poker-Tisch mit Chips; eine Hand im Dunkel hält Karten. Bild in Lightbox öffnen.

Bildlegende: Herausforderung Poker: Wichtige Entscheide treffen aufgrund spärlicher Information. Colourbox

Schach- und Go-Meister gelten als Intelligenzbestien. Für Software-Entwickler stellt Poker die grössere Herausforderung dar. Das hängt damit zusammen, dass ein Pokerspieler nur seine eigenen Karten kennt, nicht aber die seiner Konkurrenten.

In der Spieltheorie spricht man von unvollständiger Information. Das fehlende Wissen macht es für Spieler schwierig, den richtigen Entscheid zu treffen. In einem Brettspiel wie Schach oder Go hingegen sind alle Figuren und ihre Positionen immer einsehbar.

Intuition statt Wissen

Gute Pokerspieler analysieren die Spielweise des Gegenübers und erfahren so etwas über deren Denkweise und schliesslich über die Karten, die diese in der Hand halten. Neben einem guten Pokerface sind deshalb Intuition und die Fähigkeit zum Bluffen gefragt – Eigenschaften, die man sich bei einem Computerprogramm nur schwer vorstellen kann.

Doch nun haben Tuomas Sandholm und sein Doktorand Noam Brown von der Universität Carnegie Mellon mit «Libratus» eine Software entwickelt, die auch bluffen kann, wie vier hochqualifizierte Pokerspieler im Januar schmerzlich erfahren mussten. 20 Tage lang spielten die Profis gegen Libratus, bis zu 14 Stunden pro Tag. Nach insgesamt 120'000 Runden ging die Software als eindeutiger Sieger aus dem Turnier hervor.

Da drängt sich die Frage auf: Welche Super-Strategie hatten Brown und Sandholm der Software eingepflanzt?

Die lernende Maschine

Die verblüffende Antwort: Gar keine. Der Computer hatte sich das Pokern selber beigebracht. «Wir gaben der künstlichen Intelligenz lediglich die Regeln des Spiels mit auf den Weg. Dann liessen wird die Maschine gegen sich selbst pokern», erzählt Noam Brown.

Die Software probierte zuerst einfach drauf los. Nach jedem Spiel hielt sie aber inne und rechnete nach, welche negativen Folgen ihre Entscheide jeweils hatten und schrieb sich das hinter die virtuellen Ohren. So lernte die Maschine ständig dazu, bis sie nach Abermilliarden von Spielrunden dem Menschen überlegen war.

«Counterfactual Regret Minimization» heisst dieses Vorgehen in der künstlichen Intelligenzforschung – frei übersetzt: Im Nachhinein überlegen, was man hätte besser machen können.

Das funktioniert so gut, dass selbst die Macher der Software über deren Fähigkeiten ins Staunen geraten, als sie merken, dass sie auch bluffen kann. «Für Libratus ist Bluffen einfach eine Strategie, den Gegner zum Aufgeben zu bewegen», erzählt uns Noam Brown. Mit Emotionen hat das nichts zu tun. Gelernt hat der Computer den Trick ja auch nicht von Menschen, sondern beim Spielen gegen sich selbst.

Alles eine Frage der Zeit

Rino Mathis in einem schwarzen Anzug mit Poker Chips in der Hand. Bild in Lightbox öffnen.

Bildlegende: Rino Mathis Poker Profi aus Zürich. rinomathis.ch

Dass eine Computersoftware nun die besten Pokerspieler der Welt schlägt, überrascht den Schweizer Poker-Profi Rino Mathis nicht. Der ehemalige Schachspieler hat Ende der 90er Jahre bereits erlebt, wie der Computer den Menschen überholt. Erstaunlich findet er lediglich, wie schnell Libratus gelernt hat.

Die lernende Maschine ist ein wichtiger Bestandteil des Erfolgs. «Maschinelles Lernen hat die künstliche Intelligenz in den letzten Jahren revolutioniert» sagt Abraham Bernstein, Professor für Informatik an der Universität Zürich. Nun hat diese Technologie erstmals bei einem Spiel mit verdeckten Karten zum Erfolg geführt – mit Konsequenzen, die weit über Pokertische und Casinos hinausgingen, bestätigt der Professor.

Durchbruch für künstliche Intelligenz

Denn unser Alltag ähnelt viel mehr einem Pokerspiel als Schach oder Go. «Es ist typisch für unsere Entscheidungssituationen, dass wir nicht die ganze Information haben» sagt Abraham Bernstein.

Als Beispiel nennt der Wissenschaftler ganz unterschiedliche Situationen wie die Verhandlungen bei einem Wohnungskauf oder die Wahl der richtigen Krebstherapie. Denkbar, dass ein Arzt in Zukunft von einem Computer unterstützt wird, wenn er eine Therapie verschreibt. Die Strategie dazu eignet sich die Maschine gleich selber an, auf Basis von Patientendaten.

Auch strategische Entscheide zur Wahrung der Sicherheit könnten schon bald von Software getroffen werden, sagt Noam Brown. Bei einem Cyberangriff könnte der Computer einem Administrator Ratschläge geben, wie er mit seinen beschränkten Mitteln das Netzwerk optimal schützen kann.

Wie weiter beim Pokern?

Dass ein Spieler mit Hilfe einer Poker-Software schon bald bei Live-Tournieren mogeln wird, hält Rino Mathis für unwahrscheinlich. Zu komplex das Spiel und die jeweilige Situation, um sie in versteckten Geräten unter den Tischen einzugeben und zu berechnen. Im Online-Poker hingegen wird schon länger mit Pokersoftware betrogen, ein Problem mit dem sich die Branche seit vielen Jahren konfrontiert sieht.

Im Idealfall könnten die Computerprogramme eingesetzt werden, um die menschlichen Spieler zu trainieren. Das Niveau wird auch im Poker immer weiter steigen, so die Einschätzung von Rino Mathis, denn in Zukunft werden auch Menschen versuchen, wie Maschinen immer perfekter zu spielen.