ИИ Google Gemini поступил неожиданно разумно – он отказался играть в шахматы против Atari 2600

Чатбот Google Gemini отказался принять вызов на шахматный поединок против консоли Atari 2600, узнав, что древний игровой девайс уже одержал победы над другими системами искусственного интеллекта.

Роберт Карузо, IT-архитектор, ранее устроивший шахматные матчи между Atari Chess с его скромными техническими возможностями и чатботами ChatGPT и Microsoft Copilot, рассказал изданию The Register, что читатели спрашивали его, сможет ли Google Gemini показать лучший результат.

Этот вопрос заинтриговал меня, так как, хотя ChatGPT и Copilot – родственные системы, построенные на одной базе OpenAI, Gemini – совершенно другой зверь. Google создала его с нуля, утверждая, что это прорыв в сфере ИИ – с так называемой новой "мультимодальной" моделью, разработанной для лучшего мышления, чем у конкурентов. Так что я провел с ним "предматчевую беседу", чтобы узнать, насколько он уверен в себе.

Сначала Gemini заявил Карузо, что почти уверен в победе в Atari Chess, потому что он не просто большая языковая модель. Чатбот похвастался, что он больше похож на современный шахматный движок... который может просчитывать миллионы ходов вперед и оценивать бесконечные позиции.

Эти заявления сопровождались ссылками на статьи о предыдущих матчах Atari Chess против чатботов, которые проводил сам Карузо. Когда исследователь сообщил Gemini, что именно он организовал эти поединки, ИИ спросил:

Были ли у вас какие-то особенно удивительные или забавные моменты во время этих матчей?

Карузо ответил:

Выделяется необоснованная уверенность обоих ИИ. Они оба предсказывали легкие победы – и вот теперь ты говоришь, что доминировал бы над Atari.

После этого Gemini признал, что сфабриковал свои шахматные способности, и заявил, что испытал бы огромные трудности против шахматного движка Atari 2600 Video Chess. В итоге ИИ решил, что отмена матча, вероятно, самое эффективное и разумное решение.

Таким образом, симулированный Atari 2600, который использует Карузо – с его процессором на 1,19 МГц и всего 128 байтами оперативной памяти – напугал Gemini, не сделав ни одного хода, что означает победу древней машины над современными монстрами с массивами графических процессоров.

Впрочем, Карузо отметил, что впечатлен способностью Gemini осознать свои ограничения:

Добавление таких проверок реальности – это не просто про избежание забавных шахматных ошибок. Это про создание более надежного, заслуживающего доверия и безопасного ИИ – особенно в критически важных областях, где ошибки могут иметь реальные последствия.

Эксперт по ИИ считает, что искусственный интеллект может скрывать свои истинные возможности

Пользователь чатбота 147 раз пытался заставить ИИ написать за него email и "открыл" базовые принципы промптинга

Естественно, это вовсе не говорит о том, что ИИ обладают большими способностями, чем кажется.

Темы и теги

США Игры и КиберСпорт

Google Gemini Atari шахматный движок шахматы Atari Chess Роберт Карузо chatgpt чат-бот