Почему роботы еще не скоро догонят ИИ — объяснил эксперт
Чат-боты на базе ИИ, такие как ChatGPT, быстро развиваются и уже используются как личные помощники, консультанты и даже терапевты. Их работа основывается на больших языковых моделях (LLM), обученных на огромных объемах текстовых данных из интернета. Это позволило ИИ овладеть языком на уровне, сопоставимом с человеком.
Некоторые технологические лидеры, включая Илона Маска и генерального директора NVIDIA Дженсена Хуанга, считают, что аналогичный подход скоро даст человечеподобных роботов, способных выполнять операции, заменять рабочих на заводах или служить домашними помощниками.
Однако эксперт по робототехнике Кен Голдберг из Калифорнийского университета в Беркли объяснил в статье, опубликованной в Science Robotics, что так не считает, и вот почему:
«Я думаю об этом как о хайпе, потому что он настолько опережает реальные возможности роботов. В ближайшие 5–10 лет мы не увидим роботов, способных выполнять сложные бытовые или профессиональные задачи.»
Главная причина — ловкость. Роботам крайне сложно манипулировать объектами в реальном мире, например взять бокал или поменять лампочку. Это называется парадоксом Моравека: для человека такие действия просты, а для робота чрезвычайно сложны.
Все прототипы с чувствительными руками и точными захватами — лишь единичные разработки, и внедрять их в массовое производство пока что проблематично. Голдберг вводит понятие «100,000-летнего разрыва в данных». Он объясняет, что чтобы обучить языковую модель, используется огромное количество текстов, и человеку понадобилось бы около 100,000 лет, чтобы их прочитать. Но подобных объемов данных для обучения роботов нет, и даже симуляции или видео с людьми не дают полной информации о точных движениях и взаимодействии с объектами в трехмерном пространстве.
«Обучение робота действиям вроде работы строителя или повара пока невозможно без участия человека», — говорит он.
Роботы собирают такие данные с помощью телеоперации — когда человек управляет роботом напрямую, как марионеткой. Это утомительно: восемь часов работы дают всего восемь часов полезных данных. Поэтому развитие ловких роботов идет гораздо медленнее, чем у ИИ для языка.
В то же время Голдберг отмечает сдвиг парадигмы: в робототехнике растет конкуренция между «старой доброй инженерией» — физикой, математикой и моделями окружающей среды — и подходом, ориентированным исключительно на данные. Он подчеркивает:
«Инженерия и наука важны, потому что они позволяют собрать данные, которые нам нужны для обучения роботов. Компании вроде Waymo и Ambi Robotics используют именно такой подход, где роботы собирают данные в реальных условиях и постепенно становятся лучше»
Что касается будущего рабочих мест, Голдберг уверен, что «синие воротнички» (люди, занятые физическим трудом) останутся в безопасности. Роботы пока не способны выполнять сложные человеческие задачи. Автоматизация больше затрагивает формализованные действия, такие как обработка документов или обслуживание клиентов.
«Компьютер не может сказать: „Я понимаю, что вы чувствуете“», — отмечает эксперт.
Таким образом, разрыв между языковыми способностями ИИ и реальной ловкостью роботов остается огромным, несмотря на быстрый прогресс чат-ботов. Это важно для понимания реальных возможностей робототехники и предотвращения завышенных ожиданий.