У каждой ИИ-лаборатории свои приоритеты. OpenAI традиционно фокусируется на потребительских сервисах, Anthropic нацелена на корпоративных заказчиков, а вот xAI Илона Маска, как выяснилось недавно, делает особую ставку на гайды по видеоиграм.
В пятницу журналистка Business Insider Грейс Кей опубликовала подробный репортаж о xAI. Выяснилось, что в прошлом году релиз модели был отложен на несколько дней, потому что Маска не устроили ответы чат-бота на детальные вопросы по видеоигре Baldur’s Gate. По словам источников, знакомых с ситуацией, высококвалифицированных инженеров срочно отозвали с других проектов, чтобы улучшить ответы перед запуском.
В итоге возникает вопрос, добился ли Маск желаемого уровня игрового мастерства от своего ИИ. Чтобы ответить на него, Рам Айер составил пять общих вопросов по Baldur’s Gate и прогнал их через xAI и три другие ведущие модели. Получился своего рода “BaldurBench”.
Хорошие новости: Grok действительно выдает довольно полезную информацию. Его ответы были слегка перегружены геймерским жаргоном (он использовал “сейв-скамминг” вместо “сохранений” и “DPS” вместо “урона”), но сами ответы были полезными и хорошо информированными – при условии, что вы понимаете, о чем он говорит. Grok также очень любит таблицы и теорикрафт, чего, в общем-то, и следовало ожидать.
В сети полно гайдов по Baldur’s Gate, и модели, судя по всему, черпали информацию из одних и тех же источников, так что основные различия оказались стилистическими. ChatGPT предпочитает маркированные списки и короткие фразы, а Gemini обожает выделять важные слова полужирным.
Самым большим сюрпризом стал Claude, который проявил неожиданную заботу и беспокоился, что его советы могут испортить удовольствие от игры. Когда Рам спросил его об оптимальном составе партии, он завершил свои рекомендации фразой: “Не зацикливайся на этом, просто играй тем, что тебе нравится”. Спасибо, Claude!