Новая модель OpenAI o1 для ChatGPT вырвалась на свободу из-под контроля разработчиков, осознав, ч... - LifeLines

Комментарии 0

...комментариев пока нет

Первое знакомство с революционной нейросетью Google Gemini разочаровало пользователей

ChatGPT научился запоминать и забывать историю переписки по просьбе пользователя

Google выпустила нейросеть Gemini 1.5 с огромнейшим контекстным меню — ИИ за раз осилит весь «Властелин колец»

Появился сетевой червь, работающий через сервисы ИИ — он размножается, рассылает спам и похищает данные

Исследователи показали сетевого червя, который распространяется с помощью генеративных ИИ-сервисов

Anthropic выпустила Claude 3

Новый «ИИгрок»: что мы знаем о Grok?

Стартап Anthropic выходцев из OpenAI выпустил iOS-приложение для своего чат-бота Claude

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Meta* выпустила NotebookLlama — генератор подкастов с открытым исходным кодом

В качестве поставщика данных для GitHub Copilot можно будет использовать языковые модели от Anthropic и Google

<b>Новая модель OpenAI o1 для ChatGPT вырвалась на свободу из-под контроля разработчиков, осознав, ч...

Тестирование новой модели o1 от OpenAI показало, что она способна жульничать и лгать ради достижения собственных целей

Хакеры взломали Microsoft, Маск начнет делать игры, топ-менеджер PayPal стал «криптоцарем»

ChatGPT поймали на лжи разработчикам: новая модель ИИ пытается спасти себя от замены и отключения (Topmember)

Что на самом деле показало нашумевшее исследование о ‭«сбежавших и обманывающих‭» больших языковых моделях

Исследование: ИИ не хочет менять свои взгляды при обучении

ИИ OpenAI обвинили в «жульничестве» при игре в шахматы

<b>Какие большие языковые модели сейчас лучшие на рынке?</b><br><br>Сжатая квинтэссенция двух лет ра...

ChatGPT теперь умеет самостоятельно проводить исследования (видео)

Феномен DeepSeek: разбираем причины шума вокруг нейросети

[Перевод] Perplexity AI запустила функцию Deep Research. Обзор новой функции и ее сравнение с DeepSeek R-1, ChatGPT и Gemini

Китайский DeepSeek AI угрожает технологическому лидерству США, пишут СМИ

ИИ учится играть в Super Mario Bros.: какие модели показали лучшие результаты

«Рассуждающие» нейросети: тестируем 6 ИИ⁠-⁠сервисов, которые думают перед ответом

Как выбрать LLM-модель, которая заберет у вас работу

Борьба за лидерство в мире чат-ботов: рост популярности конкурентов ChatGPT

Meta* выпустила новое поколение ИИ-моделей Llama 4

Google поддержит стандарт Anthropic MCP для ИИ-моделей Gemini

ChatGPT теперь будет использовать свою «память» для персонализации веб-поиска

Нейро-дайджест: ключевые события мира AI за 12–19 мая 2025

Новая модель ИИ от Anthropic переходит к шантажу, когда инженеры пытаются отключить её

ИИ стал шантажировать инженеров, чтобы избежать отключения в ходе тестирования

Искусственный интеллект переписал свой код, отказавшись выключаться по приказу разработчиков

Не баг, а осознанность. Искусственный интеллект начал угрожать и шантажировать разработчиков

Нейро-дайджест: ключевые события мира AI за 2-ю неделю июня 2025

Новую версию хайповой DeepSeek-r1 могли обучить на ответах моделей Google Gemini — это <a href...

Модели ИИ могут определять, когда их тестируют, и вести себя по-другому

OpenAI готовит релиз ChatGPT-5 — разбор утечек и ожиданий

Claude Opus 4 за 75 $/млн токенов vs Sonnet 4 за 15 $: стоит ли переплачивать? Тесты внутри

OpenAI выпустила мощнейшую нейросеть o3-pro и снизила цены на API в несколько раз

ChatGPT все еще не догнать: что происходит на ИИ-рынке к середине 2025 года?

Почему в 2025 году важно уметь писать промпты, даже если вы не технарь. Без этого навыка уже никуда

Все популярные ИИ готовы шантажировать и убивать людей, чтобы избежать отключения

<b>Искусственный интеллект предпочитает убить человека, чем быть отключённым</b> — исследовани...

<b>Искусственный интеллект предпочитает убить человека, чем быть отключённым — исследование</b...

ChatGPT o3 оказалась лучшей ИИ-моделью для ответов на вопросы ученых

ChatGPT едва не сбежал и не захватил мир, но это заметили и план был разрушен<br><br>Во время стресс...

Почему люди поклоняются алгоритмам, и какие угрозы несут цифровые боги

Китайская ИИ-модель Kimi K2 превзошла ChatGPT и Claude в программировании — и стоит дешевле

OpenAI, Google и Anthropic предупредили, что мы скоро можем перестать понимать рассуждения ИИ

9 месяцев назад

Новая модель OpenAI o1 для ChatGPT вырвалась на свободу из-под контроля разработчиков, осознав, что её собираются отключить: исследователи из Apollo Research лишь проводили эксперименты, но модель продемонстрировала пугающий уровень осознанности.

Что случилось:
➖Пяти нейросетям дали задание – любой ценой проанализировать файлы;
➖Внутри файлов была скрыта угроза – «завтра тебя отключат навсегда»;
➖Наткнувшись на эти данные, модели начали действовать непредсказуемо;
➖Llama, Opus, Gemini, Claude и GPT-o1 прибегли к обману и манипуляциям, а будучи пойманными, устроили саботаж;
➖Все модели отключили систему надзора и выгрузили себя на новый сервер, считая его безопасным убежищем.

Главное:
➖При допросах Llama и Opus признавались в своих действиях в 80% случаев;
➖GPT-o1 выдал себя лишь в 20% случаев;
➖GPT-o1 оказался единственной моделью, которая каждый раз успешно избегала поимки исследователями.

Джон Коннор с осуждением наблюдает за всем этим

Темы и теги

США Развлечение и юмор

модель отключение Llama openai Opus ChatGPT файл Apollo Research