Zocken wie Cicero

Meta bringt KI Strategie und Lügen bei

29.11.2022 von Anirban Ghoshal

Die Facebook-Mutter hat einer KI beigebracht, ein Brettspiel zu spielen, bei dem es darum geht, mit menschlichen Mitspielern zu verhandeln und deren Motive zu erraten. Die Lösung könnte sich laut Meta auch für Chatbots in Unternehmen eignen.

Neuland: Anders als bei Schach oder Go muss die KI bei Diplomacy kooperieren - und betrügen.
Foto: Hasbro

Dass Künstliche Intelligenz in der Lage ist, schwierige Aufgaben zu lösen oder Menschen im Schach oder Go zu schlagen, ist altbekannt. Meta hat nun einen KI-Agenten darauf trainiert, Diplomacy zu spielen. Bei dem - auch online verfügbaren - Strategiespiel kämpfen bis zu sieben Spieler um die Kontrolle über Europa nach dem ersten Weltkrieg. Jede Runde beginnt damit, dass die Spieler miteinander verhandeln, um Unterstützung für ihre Pläne zu erhalten, und endet damit, dass sie gleichzeitig versuchen, ihre Züge auszuführen. Ohne die Unterstützung der anderen Spieler werden viele dieser Züge scheitern.

Weil das Spiel von den Spielern verlangt, die Motivationen und Perspektiven anderer Menschen zu verstehen, komplexe Pläne zu machen und Strategien anzupassen, gilt Diplomacy seit Jahrzehnten als eine fast unmögliche große Herausforderung in der KI, schreibt die Facebook-Mutter in ihrem ausführlichen Blogbeitrag zu Cicero. Außerdem müsste die KI dazu natürliche Sprache verwenden, um Vereinbarungen mit anderen Menschen zu treffen, sie zu überzeugen, Partnerschaften und Bündnisse einzugehen - etwas, das KIs in Spielen wie Schach gegen menschliche Gegner bisher nicht tun mussten. Mehr noch: Um zu gewinnen, musste Cicero verstehen, ob seine Gegner blufften oder eine bestimmte Strategie verfolgten, um das Spiel zu gewinnen.

Die hohe Kunst der Diplomatie

Glaubt man Meta, stellen diese Anforderungen für Cicero kein Problem dar. Im Gegenteil: "Cicero ist so effektiv bei der Verwendung natürlicher Sprache, um mit Menschen diplomatisch zu verhandeln, dass diese häufig lieber mit Cicero als mit anderen menschlichen Teilnehmern kooperieren", heißt es. In einem Forschungsartikel, der im Wissenschaftsmagazin Science veröffentlicht wurde, berichtet Meta, dass seine KI Cicero in einer Online-Liga, in der sie in 40 Diplomacy-Spielen gegen 82 Menschen antrat, zu den besten zehn Prozent der Teilnehmer gehörte.

Wie die Forscher erklären, basiert Cicero auf zwei Haupttechnologien: strategisches Denken und natürliche Sprachverarbeitung (Natural Language Processing, NLP):

Die Engine für strategisches Denken sagt die Züge anderer Spieler vorher und nutzt diese Informationen, um eine eigene Strategie zu entwickeln
Die NLP-Engine generiert Nachrichten und analysiert die Antworten in Gesprächen mit anderen Spielern, um zu verhandeln und eine Einigung zu erzielen.

Um dem KI-Agenten dabei zu helfen, relevante Konversationen zu generieren, begannen die Forscher nach eigenen Angaben mit einem 2,7 Milliarden Parameter umfassenden Modell zur Generierung natürlicher Sprache, das zuvor mit Texten aus dem Internet trainiert worden war, und stimmten es mit Konversationen zwischen menschlichen Spielern in über 40.000 Spielen von webDiplomacy.net ab.

Für Diplomacy mussten der Cicero KI etliche Fähigkeiten antrainiert werden.
Foto: Meta

"Wir haben Techniken entwickelt, um Nachrichten in den Trainingsdaten automatisch mit den entsprechenden geplanten Spielzügen zu verknüpfen, so dass wir die Dialoggenerierung zur Inferenzzeit steuern können, um bestimmte gewünschte Aktionen für den Agenten und seine Gesprächspartner zu besprechen", schreibt Meta.

Die Mutter von Facebook, Instagram und WhatsApp will davon jedoch nicht allein profitieren, sondern hat den Code von Cicero offengelegt, damit andere Forscher auf den Fähigkeiten des KI-Agenten aufbauen können. Darüber hinaus wurde ein Portal eingerichtet, das zur Einreichung von Forschungsvorschlägen auf dem Gebiet der Mensch-KI-Kooperation mittels NLP aufruft.

Langfristige Pläne

Große Technologie-Unternehmen wie Microsoft, Google und Amazon befinden sich in einem Wettlauf um die Entwicklung intelligenterer, autonomer virtueller Assistenten, die eine Vielzahl von Geschäftsanwendungen unterstützen, von Callcentern bis hin zu KI-Agenten, die Stimmungsanalysen durchführen und einer Person neue Fähigkeiten beibringen können. Einem Bericht von Fortune Business Insights zufolge wird der globale Markt für die Verarbeitung natürlicher Sprache, zu dem solche Assistenten gehören, bis 2029 von aktuell 26,4 Milliarden Dollar auf 161,8 Milliarden Dollar anwachsen.

Die Forscher von Meta sind dabei der Ansicht, dass der Erfolg von Cicero in der Diplomatie die Fähigkeiten anderer heute verfügbarer virtueller Assistenten übertrifft: "Aktuelle KI-Assistenten können zum Beispiel einfache Frage-Antwort-Aufgaben erledigen, wie z. B. Ihnen das Wetter sagen - aber was wäre, wenn sie ein langfristiges Gespräch mit dem Ziel führen könnten, Ihnen eine neue Fähigkeit beizubringen?", so die Forscher in Anspielung auf Tools wie Google Duplex, Amazon Alexa, Xiaoice von Microsoft und Siri von Apple.

Allerdings ist Cicero nicht für langfristige Gespräche geeignet, da seine Überlegungen rein kurzfristig sind. Die Meta-Forscher schreiben in der Zeitschrift Science: "Aus einer strategischen Perspektive betrachtet Cicero den Dialog ausschließlich im Hinblick auf die Aktionen der Spieler in der aktuellen Runde. Es hat nicht modelliert, wie sein Dialog die Beziehung zu anderen Spielern über den langfristigen Verlauf eines Spiels beeinflussen könnte."

Dieser Artikel basiert auf einem Beitrag der US-Schwesterpublikation Computerworld.