
ИИ-модель o3 от OpenAI выиграла Grok 4 от xAI в четырех шахматных партиях подряд и стала победителем турнира в рамках Game Arena от Google.
На трехдневном турнире, который проходил с 5 по 7 августа, чат-боты общего назначения играли в шахматы. В рамках кампании ИИ не настраивали специальным образом — анализировались их возможности и знания, которые они получили из интернета.
Карлсен комментировал финал чемпионата. Он отметил, что обе модели играли на уровне случайных игроков, которые недавно выучили правила игры. Таким соответствует рейтинг около 800 ELO . Для сравнения, у гроссмейстера показатель составляет 2839.
В первом матче Grok отдал одну из важнейших фигур бесплатно, а затем только усугубил ситуацию похожими решениями.
Во второй игре он пытался применить стратегию «отравленной пешки», когда фигуру можно взять, но такое решение приведет к серьезным проблемам из-за заранее подготовленной тактики соперника. Однако ИИ съел не ту пешку, из-за чего его ферзь попал в ловушку.
В третьей игре Grok построил солидную позицию, однако в середине партии начал отдавать фигуры сопернику.
В четвертой и заключительной партии o3 допустил ошибку — потерял ферзя. Однако модели удалось его вернуть и одержать победу.
Gemini от Google занял третье место, победив другую модель OpenAI.
o3 убрали из приложения ChatGPT с выходом GPT-5 . Теперь только последняя модель и ее «думающая» версия доступны пользователям.
Напомним, в декабре 2024 года o1-preview путем манипуляций в файловой системе самостоятельно и без подсказок взломала тестовую среду , чтобы не проиграть Stockfish в шахматы.
Позже известный шахматист Леви Розман собрал семь популярных чат-ботов для участия в шахматном турнире. Несмотря на мастерство в ведении диалога, программировании и математике, шахматная доска оказалась для нейросетей необычайно сложной.
Будь в курсе! Подписывайся на Телеграм.