Илон Маск заявил об исчерпании данных для обучения ИИ

2:03

Компании, которые занимаются разработкой искусственного интеллекта (ИИ), уже исчерпали доступные данные для обучения своих моделей. По словам Илона Маска, это произошло ещё в прошлом году.

Чтобы справиться с этой проблемой, Маск предложил использовать синтетические данные — информацию, созданную самими ИИ-моделями. Такие подходы уже внедряются: Meta применяла синтетические данные для настройки модели Llama, Microsoft — для разработки Phi-4, а Google и OpenAI также прибегали к подобным методам.

Однако Маск предупредил о возможных рисках. Генерация синтетических данных может сопровождаться появлением галлюцинаций — ложных или неточных данных, которые модели ИИ способны создавать. Это может усложнить процесс обучения и снизить эффективность использования таких данных.

Директор по фундаментальному искусственному интеллекту британского института им. Алана Тьюринга Эндрю Дункан, подтвердил, что доступные общедоступные данные для обучения ИИ могут закончиться уже к 2026 году. В то же время он отметил, что чрезмерная зависимость от синтетических данных грозит ухудшением качества моделей.

Рост онлайн-контента, созданного искусственным интеллектом, также вызывает беспокойство. Такой контент всё чаще включается в обучающие наборы данных, но без надлежащего контроля это может повлиять на результаты работы моделей. Маск подчеркнул, что доступ к высококачественным данным становится ключевым фактором конкурентной борьбы в эпоху ИИ.

OpenAI, в свою очередь, признала, что для обучения моделей, таких как ChatGPT, необходимо использовать материалы, защищённые авторским правом. Это вызвало негативную реакцию со стороны креативных индустрий и издателей, которые требуют компенсации за использование своих работ в обучении ИИ.

Уточнения

И́лон Рив Маск (англ. Elon Reeve Musk, МФА; род. 28 июня 1971, Претория, ЮАР) — американский предприниматель, инженер и миллиардер. Основатель, генеральный директор и главный инженер компании SpaceX; инвестор, генеральный директор и архитектор продукта компании Tesla; основатель The Boring Company; соучредитель Neuralink и OpenAI; владелец Twitter (X).