Комментарии 0

...комментариев пока нет

Новая ИИ-модель Claude 3 компании Anthropic превзошла аналоги Google и OpenAI

Amazon выделила еще 2,75 млрд долларов конкуренту OpenAI на рынке ИИ

Еврокомиссия не нашла ничего предосудительного в отношениях Microsoft и OpenAI

M**a бросила вызов ChatGPT — все сервисы компании получили «самого умного» ИИ-помощника

У искусственного интеллекта обнаружили любимые числа

<b>Создание фейковой ИИ реальности вокруг бигтехов.</b><br><br>Удивительно, но почти никто не касалс...

Alibaba выпустила математические языковые модели Qwen2-Math, которые лучше аналогов от OpenAI и Google

Почему Google Gemini не пользуется популярностью среди разработчиков?

Пользователь больше не нужен — новая ИИ-модель Anthropic сама управляет ПК

Google разрабатывает Джарвиса — ИИ-помощника для Chrome, который облегчит поиск, покупки и другие задачи

Anthropic представил ИИ, который сам способен управлять компьютером

Google представит ИИ, который сам будет управлять компьютерами

В качестве поставщика данных для GitHub Copilot можно будет использовать языковые модели от Anthropic и Google

Amazon инвестирует в Anthropic еще миллиарды долларов

Пузырь ИИ сдувается, пока OpenAI, Google и Anthropic пытаются создать более продвинутый ИИ

OpenAI готовится к запуску ИИ-агента Operator для автоматизации задач

Забудьте о чат-ботах: OpenAI создаёт ИИ-агентов для управления вашим компьютером

OpenAI добавила функции виртуального помощника в ChatGPT

Технологии, которые будут влиять на жизнь в 2025 году, — в прогнозах WSJ

OpenAI может разрабатывать нового ИИ-агента для автономного выполнения сложных задач

FT: Anthropic получит свыше $1 млрд от Google

OpenAI представила Operator — ИИ-помощника для веб-серфинга

«Интернет погрузится во тьму»: новомодные ИИ-агенты имеют шансы заменить привычный интернет

Искусственный интеллект: когда цензура встречает абсурд

Amazon собралась бросить вызов OpenAI, Google и Anthropic, и готовит собственную рассуждающую ИИ-модель

Amazon планирует новую модель рассуждений, чтобы конкурировать с OpenAI и Anthropic

Люди используют новую модель искусственного интеллекта Google для удаления водяных знаков с изображений

Новую ИИ-модель Google используют для удаления водяных знаков с изображений

Amazon представляет Nova Act — агента искусственного интеллекта, способного управлять веб-браузером

Новый ИИ-агент от Amazon может оплатить отель, забронировать билеты на спектакль или сыграть в игру

Новый AI-агент Amazon будет совершать покупки на сторонних сайтах вместо вас

[Перевод] Конец Поиска, Начало Исследования

Google запускает открытый протокол Agent2Agent: теперь ИИ-агенты смогут свободно общаться друг с другом

Claude получил функцию Deep Research и интеграцию с Google Workspace

Grok 3 — ИИ от Илона Маска, 2 месяца спустя

ИИ-агенты: что умеют нейросети, которые выполняют задачи за человека, и какие уже можно опробовать

Исследователи создали ИТ-компанию целиком из ИИ-агентов. Результаты разочаровали

Google AdSense теперь размещает рекламу в чатах с AI-ботами

Gemini 2.5 Pro от Google прошел Pokémon Blue

Пост №6084355

Harvey интегрирует модели от Anthropic и Google: новый этап в развитии юридического ИИ

Весна 2025 в ИИ: OpenAI и Google укрепляют позиции, Anthropic теряет долю рынка

Новая статья: ИИ-агенты: фас, профиль, пароли, явки

Нейро-дайджест: ключевые события мира AI за 12–19 мая 2025

Google похвасталась «революционным» ИИ-поиском. У Яндекса он появился год назад

Ситком с ИИ-агентами: топовые модели <a href="https://theaidigest.org/village/blog/season-recap-agen...

Дистилляция по-китайски: как DeepSeek R1 оказался под прицелом из-за Google Gemini

Модели ИИ могут определять, когда их тестируют, и вести себя по-другому

ChatGPT все еще не догнать: что происходит на ИИ-рынке к середине 2025 года?

Нейро-дайджест: ключевые события мира AI за 2 неделю августа 2025

Anthropic запускает ИИ-агента Claude в виде расширения для браузера Chrome

4 месяца назад

Пост №6084355

Попытка создать офис "сотрудников" состоящий только из нейронок

нейросеть,ИИ,эксперимент

В Carnegie Mellon University (частный исследовательский университет в Питтсбурге) провели занятный эксперимент (https://futurism.com/professors-company-ai-agents): собрали фейковую IT-компанию, где все сотрудники — ИИ-агенты от OpenAI, Google, Meta, Anthropic и Amazon. Назвали всё это TheAgentCompany.

Агентам выдали роли: менеджеры, аналитики, кодеры и кинули реальные задачи: навигация по файловым директориям, виртуальный тур по новому офису, написание отзывов о производительности сотрудников на основе собранной обратной связи, взаимодействие с другими "сотрудниками" через корпоративный чат и т.д.

Результаты -- полный провал. Самый «трудолюбивый» агент (Claude 3.5) справился аж с 24% задач, сжигая по шесть баксов на одну задачу в среднем. Google Gemini сделал 11%. Amazon Nova Pro — 1.7%.

Отдельный занятный момент: нейросети всё ещё плохо борются с самообманом. Например если нейронка пытается найти человека в чате, но не ходит его, то может просто переименовать другого юзер в нужного.

Темы и теги

США Наука и Технологии

занятный Amazon ии-агент futurism Carnegie Mellon University кодер OpenAI Google