Ученые заставили ИИ играть в «змейку», чтобы научить рассуждениям
Ученые нашли неожиданный способ обучить ИИ математическому мышлению. Вместо того чтобы загружать в модель огромные массивы математических данных, они заставили ее играть в простые аркадные игры, похожие на «Змейку» и «Тетрис». Этот новый метод, названный «визуальным игровым обучением» (ViGaL), может изменить подходы к тренировке ИИ. Исследование провели специалисты из Университета Райса, Университета Джонса Хопкинса и компании Nvidia.
Основная проблема традиционных методов обучения ИИ — это необходимость в дорогих и больших наборах данных, часто размеченных вручную. Это трудоемкий и затратный процесс. Решение, предложенное учеными, — использовать синтетические игровые среды для развития у ИИ общих навыков решения проблем. Эти навыки затем могут быть перенесены на другие области, такие как математика. За основу была взята мультимодальная модель Qwen2.5-VL-7B.
Для эксперимента были созданы две специальные игры. В одной, основанной на «Змейке», модель управляла двумя змейками на поле 10×10, которые соревновались, кто соберет больше яблок. Это развивало навыки, связанные с 2D-координатами и поиском пути. Во второй игре, похожей на «Тетрис», модель должна была распознавать 3D-объекты после их поворота на 90 или 180 градусов, что тренировало пространственное мышление. Для обучения было сгенерировано по 36 000 примеров для каждой игры.
Результаты оказались впечатляющими. Обученная на играх модель ViGaL показала точность в математических тестах 50,6% — немного выше, чем у модели MM-Eureka-Qwen-7B (50,1%), которую специально тренировали на математическом датасете. Особенно сильный прирост наблюдался в задачах по геометрии, где производительность нового алгоритма выросла почти вдвое по сравнению с исходной нейросетью. Более того, ViGaL превзошла по точности гораздо более крупную модель GPT-4o на сложных математических задачах.
Ранее исследователи выяснили, что проблемы с процессом токенизации данных снижают математические способности языковых моделей. При этом ИИ хорошо показывает себя в задачах на работу с текстами.