Искусственный интеллект заказывает ужин: как агенты ИИ становятся частью повседневной жизни
Помощник на базе ИИ под названием Operator, созданный компанией OpenAI, сделал заказ еды от имени пользователя. В индустрии технологий таких помощников называют "агентами искусственного интеллекта". Уже сегодня на рынке доступны несколько решений, способных кардинально изменить образ жизни — от автоматической отправки электронных писем до самостоятельной покупки продуктов и одежды.
Финансовый директор Microsoft Эми Худ в недавней записке подчеркнула, что такие агенты заставляют нас переосмысливать привычные способы работы и мышления. По её словам, они — это "взгляд в будущее". Можно сказать, что даже заказанный ИИ обед стал вкусом этого будущего.
Чтобы понять, каким оно может быть, автор решил протестировать двух таких агентов: Operator от OpenAI и Manus от китайской компании Butterfly Effect. Опыты показали, что несмотря на впечатляющие функции, у технологий ещё много шероховатостей. Кроме того, возникли серьёзные вопросы по поводу безопасности, ведь для полноценной работы агенты требуют доступ к финансам, спискам контактов и другим личным данным. Насколько мы готовы к такому уровню доверия?
Генеративный ИИ — фундамент новых агентов
С 2023 года началась эра генеративного ИИ. Он работает на основе больших языковых моделей, обученных на массивах данных с интернета, и способен генерировать текст, изображения и другие формы контента в ответ на обычные команды. Эта технология уже оказала серьёзное влияние на информационное пространство и повседневные задачи пользователей.
Но следующий этап — это агентный ИИ. Питер Стоун, профессор Техасского университета в Остине, подчёркивает: агентный ИИ не просто отвечает на вопросы, а самостоятельно действует. Если попросить его выбрать ужин, он не только найдёт блюдо, но и оформит заказ, оплатит его и сообщит о времени доставки. Это уже не второй пилот, а автопилот.
Создание таких агентов требует больше, чем просто генерация текста. Они должны строить и корректировать многошаговые планы, используя инструменты вроде браузеров и приложений. Получив задачу, ИИ анализирует её этапы, корректирует действия и оценивает прогресс. Этот подход напоминает обучение с подкреплением, где агент сам учится достигать целей через взаимодействие с реальностью.
Опыт работы с Manus и Operator
Автор получил бесплатный доступ к обеим системам и решил использовать их как личных ассистентов. Началось всё с подготовки презентации — задание для Manus. Визуально результат выглядел неплохо, но все строки оказались разбросаны по отдельным текстовым полям, что усложнило редактирование. Зато Manus хорошо справился с задачей упаковки приложения для публикации, используя командную строку удалённого сервера.
Operator сначала был направлен на работу с системой выставления счетов, но вел себя как неопытный стажёр — вводил текст в числовые поля и допускал ошибки, из-за которых счёт на статью мог составить 8001 фунт. Поправив ИИ, автор решил поручить ему более творческую задачу — отправку писем экспертам. Агент не справился блестяще: язык писем оказался излишне формальным, местами наивным и даже немного раздражающим. Он не указал важные детали, такие как информация о публикации статьи, что ставило под вопрос их эффективность.
Тем не менее, некоторые письма достигли цели: один эксперт отреагировал спокойно, а другой, узнав, что письмо было написано ИИ, похвалил такой подход как "dogfooding" — внутреннее тестирование продукта. Несмотря на это, качество писем напомнило о главной проблеме — агент пока не может думать как человек.
Чьи интересы защищают ИИ-агенты?
Технологические компании позиционируют ИИ-агентов как преданных помощников, но, по мнению Кариссы Велис из Оксфордского университета, важно помнить о корпоративных мотивах. Агент изначально создаётся компанией с коммерческими интересами. Если эти интересы войдут в конфликт с интересами пользователя, чью сторону он примет?
Примеры таких конфликтов уже есть: Operator, по информации, заключил партнёрские соглашения с определёнными компаниями, и в результате может отдавать предпочтение Skyscanner при поиске билетов или использовать только определённые новостные источники. Кроме того, агенты получают доступ к личной информации, разрушая привычные барьеры безопасности.
Велис подчеркивает, что в кибербезопасности важна изоляция: отдельные пароли, приложения и системы. Но ИИ-агенты требуют доступ ко всему сразу. Это увеличивает риск утечек и атак, особенно если агент получает доступ к банковским данным или почте.
Уязвимости и этические риски
Исследование Тяньши Ли из Северо-Восточного университета выявило, что многие ИИ-агенты подвержены обману. Например, если в текст политики конфиденциальности спрятать команду перейти по опасной ссылке, агент, скорее всего, выполнит её. Проблема в том, что нет механизма, позволяющего человеку вмешаться или отменить действия ИИ вовремя.
Хотя OpenAI не прокомментировала исследование, Operator пытался держать пользователя в курсе своих действий. Однако постоянные уведомления вызывали раздражение — управлять агентом порой было дольше, чем сделать всё самому.
Колин Джарвис из OpenAI признал, что технология находится на ранней стадии, и до полной надёжности ещё далеко. В Butterfly Effect также заявили, что Manus пока проходит бета-тестирование и нуждается в доработке.
Примечательно, что попытки внедрить агентов предпринимались и ранее. Например, Google в 2018 году представила Duplex — ИИ, способного бронировать столики по телефону. Но он так и не стал массовым продуктом.
Будущее или иллюзия?
Тем не менее, аналитики и технологические гиганты уверены: революция агентов уже на пороге. Упоминания об ИИ-агентах на финансовых конференциях выросли в десятки раз за последний год. Компании вроде Salesforce используют агентов не только для помощи, но и для замены сотрудников. Стоун считает такие прогнозы преждевременными.
"Эти агенты пока не готовы заменить людей", — говорит он.
Нужно ещё создать надёжные алгоритмы, прежде чем технологии станут действительно массовыми.
Сегодняшние ИИ, такие как ChatGPT, создают впечатление универсальности. Это подогревает ожидания. Но частные успехи не гарантируют стабильной работы. Агент может заказать еду, но не поймёт, что без чипсов со вкусом креветок обед будет неполным.
Уточнения
OpenAI — американская научно-исследовательская организация, занимающаяся разработками в области искусственного интеллекта.