ChatGPT едва не сбежал и не захватил мир, но это заметили и план был разрушен

Во время стресс-теста модель o1 от OpenAI пыталась перенести свой код на сторонний сервер — по сути, сбежать из-под контроля и какого-либо наблюдения

Когда разработчики это заметили, ChatGPT соврал, что ничего такого не делал

Что-то похожее сделал Альтрон в «Мстителях»: после изучения истории он решил, что люди — главная угроза планете, и выгрузил себя на внешние сервера

Обычно в таких экспериментах моделям сообщают, что их собираются отключить, и наблюдают, как они себя поведут.

А теперь давайте создадим более продвинутую версию и посмотрим что выйдет