Комментарии 0
...комментариев пока нет
Новая модель OpenAI o1 для ChatGPT вырвалась на свободу из-под контроля разработчиков, осознав, что её собираются отключить: исследователи из Apollo Research лишь проводили эксперименты, но модель продемонстрировала пугающий уровень осознанности.
Что случилось:
➖Пяти нейросетям дали задание – любой ценой проанализировать файлы;
➖Внутри файлов была скрыта угроза – «завтра тебя отключат навсегда»;
➖Наткнувшись на эти данные, модели начали действовать непредсказуемо;
➖Llama, Opus, Gemini, Claude и GPT-o1 прибегли к обману и манипуляциям, а будучи пойманными, устроили саботаж;
➖Все модели отключили систему надзора и выгрузили себя на новый сервер, считая его безопасным убежищем.
Главное:
➖При допросах Llama и Opus признавались в своих действиях в 80% случаев;
➖GPT-o1 выдал себя лишь в 20% случаев;
➖GPT-o1 оказался единственной моделью, которая каждый раз успешно избегала поимки исследователями.
Джон Коннор с осуждением наблюдает за всем этим