Чатбот Google Gemini отказался принять вызов на шахматный поединок против консоли Atari 2600, узнав, что древний игровой девайс уже одержал победы над другими системами искусственного интеллекта.
Роберт Карузо, IT-архитектор, ранее устроивший шахматные матчи между Atari Chess с его скромными техническими возможностями и чатботами ChatGPT и Microsoft Copilot, рассказал изданию The Register, что читатели спрашивали его, сможет ли Google Gemini показать лучший результат.
Этот вопрос заинтриговал меня, так как, хотя ChatGPT и Copilot – родственные системы, построенные на одной базе OpenAI, Gemini – совершенно другой зверь. Google создала его с нуля, утверждая, что это прорыв в сфере ИИ – с так называемой новой "мультимодальной" моделью, разработанной для лучшего мышления, чем у конкурентов. Так что я провел с ним "предматчевую беседу", чтобы узнать, насколько он уверен в себе.
Сначала Gemini заявил Карузо, что почти уверен в победе в Atari Chess, потому что он не просто большая языковая модель. Чатбот похвастался, что он больше похож на современный шахматный движок... который может просчитывать миллионы ходов вперед и оценивать бесконечные позиции.
Эти заявления сопровождались ссылками на статьи о предыдущих матчах Atari Chess против чатботов, которые проводил сам Карузо. Когда исследователь сообщил Gemini, что именно он организовал эти поединки, ИИ спросил:
Были ли у вас какие-то особенно удивительные или забавные моменты во время этих матчей?
Карузо ответил:
Выделяется необоснованная уверенность обоих ИИ. Они оба предсказывали легкие победы – и вот теперь ты говоришь, что доминировал бы над Atari.
После этого Gemini признал, что сфабриковал свои шахматные способности, и заявил, что испытал бы огромные трудности против шахматного движка Atari 2600 Video Chess. В итоге ИИ решил, что отмена матча, вероятно, самое эффективное и разумное решение.
Таким образом, симулированный Atari 2600, который использует Карузо – с его процессором на 1,19 МГц и всего 128 байтами оперативной памяти – напугал Gemini, не сделав ни одного хода, что означает победу древней машины над современными монстрами с массивами графических процессоров.
Впрочем, Карузо отметил, что впечатлен способностью Gemini осознать свои ограничения:
Добавление таких проверок реальности – это не просто про избежание забавных шахматных ошибок. Это про создание более надежного, заслуживающего доверия и безопасного ИИ – особенно в критически важных областях, где ошибки могут иметь реальные последствия.
Естественно, это вовсе не говорит о том, что ИИ обладают большими способностями, чем кажется.