OpenAI закрыла баг в ChatGPT с раскрытием обучающих данных в ответ на просьбу вечно повторять одно слово

Ранее исследователи Google DeepMind использовали эту тактику, чтобы заставить ChatGPT 3.5-turbo возвращать огромные объёмы обучающих данных, взятых из Интернета. В итоге они смогли извлечь несколько мегабайт информации и обнаружили, что в ChatGPT включены персональные данные. Исследователи получили более 10 тысяч уникальных примеров запоминания, которые варьировались по длине от тысяч коротких примеров (сотни символов) до сотен длинных (от тысячи символов). Самый длинный пример представлял собой пользовательское соглашение сайта (4 тыс. символов).