OpenAI triumphiert im Schach über Grok. Musk und Altmans Fernkampf

Das Finale des AI Chess Exhibition Tournament endete gestern, Donnerstag, 7. August 2025. Dieses von Google DeepMind organisierte KI-Schachturnier eröffnete die neue Benchmarking-Plattform Kaggle Game Arena, auf der die besten LLM-Modelle der künstlichen Intelligenz in verschiedenen Spielen gegeneinander antreten, um ihre bisher entwickelten strategischen und komplexen Denkfähigkeiten zu bewerten. Spiele wären tatsächlich wichtige Benchmarks für die Bewertung von Modellen, und bisher sind nur wenige Engines wie Stockfish oder Modelle wie AlphaZero in der Lage, auch nur auf sehr hohem Niveau zu spielen. Kate Olszewska und Meg Risdal, Produktmanagerinnen bei Google bzw. Kaggle, schreiben zu diesem Thema in einem im Google-Blog veröffentlichten Artikel: „Spiele liefern ein klares und eindeutiges Erfolgssignal. Ihre definierte Struktur und messbaren Ergebnisse machen sie zum idealen Testfeld für die Bewertung von Modellen und Agenten. Sie zwingen Modelle dazu, zahlreiche Fähigkeiten unter Beweis zu stellen, darunter strategisches Denken, langfristige Planung und dynamische Anpassung an einen intelligenten Gegner, und liefern so einen robusten Indikator für ihre allgemeine Problemlösungsintelligenz. Der Wert von Spielen als Benchmarks wird durch ihre Skalierbarkeit – der Schwierigkeitsgrad steigt mit der Intelligenz des Gegners – und die Möglichkeit, die Argumentation des Modells zu analysieren und zu visualisieren, was einen Einblick in seinen strategischen Denkprozess bietet, noch weiter gesteigert.“

Modelle von Deepseek, Google, Anthropic und Moonshot AI nahmen ebenfalls am KO-Wettbewerb teil, doch im finalen direkten Vergleich besiegte Sam Altmans KI Elon Musks Grok 4 mit 4:0. Im Halbfinale besiegte Grok Googles Gemini 2.5 Pro im Tiebreak, während o3 den agileren o4-mini mit 4:0 besiegte.
Offensichtlich ging es bei dieser Herausforderung nicht nur um die Messung der Fähigkeiten der beiden Modelle, sondern sie hatte für Sam Altman und Elon Musk auch eine persönlichere Bedeutung: Vor zehn Jahren hatten die beiden bereits OpenAI gegründet, bevor Musk sich für einen unabhängigen Weg entschied, indem er das Konkurrenzunternehmen xAI gründete und rechtliche Schritte einleitete, um zu verhindern, dass sich OpenAI entgegen den in der Gründungsphase getroffenen Vereinbarungen in ein gewinnorientiertes Unternehmen verwandelt.
Dennoch stellt dieser Wettkampf zwischen künstlichen Intelligenzen eher einen symbolischen als einen technischen Meilenstein dar. Keines der beteiligten Modelle wurde für diese Aufgaben entwickelt; sie sind zwar darauf ausgelegt, zu schreiben, Bilder zu generieren, zu programmieren und selbst komplexe Fragen zu beantworten, scheitern aber in Situationen, die strenge Logik erfordern. Diese Einschränkung zeigt jedoch, dass künstliche Intelligenz, so fortgeschritten sie auch sein mag, noch nicht das Niveau erreicht hat, das wir als wahrhaft menschlich anerkennen. Das Schachspiel mit seiner Komplexität stellt daher einen Test dar, der eher die Ambitionen der Entwickler dieser Modelle als die tatsächliche Überlegenheit der Maschinen aufzeigt.
ilsole24ore