Илон Маск заявил об исчерпании данных для обучения ИИ
Компании, которые занимаются разработкой искусственного интеллекта (ИИ), уже исчерпали доступные данные для обучения своих моделей. По словам Илона Маска, это произошло ещё в прошлом году.

Чтобы справиться с этой проблемой, Маск предложил использовать синтетические данные — информацию, созданную самими ИИ-моделями. Такие подходы уже внедряются: Meta применяла синтетические данные для настройки модели Llama, Microsoft — для разработки Phi-4, а Google и OpenAI также прибегали к подобным методам.
Однако Маск предупредил о возможных рисках. Генерация синтетических данных может сопровождаться появлением галлюцинаций — ложных или неточных данных, которые модели ИИ способны создавать. Это может усложнить процесс обучения и снизить эффективность использования таких данных.
Директор по фундаментальному искусственному интеллекту британского института им. Алана Тьюринга Эндрю Дункан, подтвердил, что доступные общедоступные данные для обучения ИИ могут закончиться уже к 2026 году. В то же время он отметил, что чрезмерная зависимость от синтетических данных грозит ухудшением качества моделей.
Рост онлайн-контента, созданного искусственным интеллектом, также вызывает беспокойство. Такой контент всё чаще включается в обучающие наборы данных, но без надлежащего контроля это может повлиять на результаты работы моделей. Маск подчеркнул, что доступ к высококачественным данным становится ключевым фактором конкурентной борьбы в эпоху ИИ.
OpenAI, в свою очередь, признала, что для обучения моделей, таких как ChatGPT, необходимо использовать материалы, защищённые авторским правом. Это вызвало негативную реакцию со стороны креативных индустрий и издателей, которые требуют компенсации за использование своих работ в обучении ИИ.
Уточнения
И́лон Рив Маск (англ. Elon Reeve Musk, МФА; род. 28 июня 1971, Претория, ЮАР) — американский предприниматель, инженер и миллиардер. Основатель, генеральный директор и главный инженер компании SpaceX; инвестор, генеральный директор и архитектор продукта компании Tesla; основатель The Boring Company; соучредитель Neuralink и OpenAI; владелец Twitter (X).