Исследование, проведенное под руководством доцента Питера Скарфа, включало в себя генерацию ответов на экзаменационные вопросы с помощью GPT-4 и представление их как работы 33 фиктивных студентов. Примечательно, что экзаменаторы Школы психологии и клинической лингвистики в Рединге не смогли обнаружить ответы, сгенерированные ИИ, в 94 % случаев, и эти ответы неизменно получали более высокие оценки, чем ответы реальных студентов.
Скарф подчеркнул, что результаты исследования должны послужить "тревожным звонком" для учебных заведений, отметив ограниченность существующих инструментов обнаружения работ ИИ.