Новый детектор поможет различать тексты, созданные человеком и ИИ, сообщают ученые МФТИ
Искусственный интеллект (ИИ) все активнее используется для создания текстов. В некоторых случаях эти материалы трудно отличить от написанных человеком. Однако российские ученые разработали уникальный метод, который помогает не только выявлять, были ли тексты сгенерированы ИИ, но и объяснять, какие признаки побудили систему к такому заключению.
Зачем нужен новый метод
С момента появления больших языковых моделей, таких как ChatGPT и LLaMA, встала острая проблема: как отличить творчество человека от сгенерированных ИИ текстов. Эти системы теперь используются не только для написания вирусных материалов, но и для научных работ, публикующихся в рецензируемых журналах. Такие тексты могут быть использованы для манипуляций или даже мошенничества, поэтому важно уметь их распознавать.
Что отличает новый подход от других
Многие существующие детекторы сгенерированных текстов работают как "черные ящики". Это означает, что они просто выдают вердикт: "человек" или "ИИ", но не объясняют, почему система пришла к такому решению. В случае ошибки трудно понять, что пошло не так и как улучшить работу детектора.
Разрешение проблемы: прозрачный детектор
Команда исследователей из нескольких ведущих российских научных центров, включая "Сколтех" и МФТИ, разработала систему, которая решает эту проблему. Вместо черного ящика они использовали разреженные автокодировщики, которые разбивают процесс распознавания текста на "атомарные" блоки. Эти блоки можно интерпретировать и понять, что именно привело к заключению о происхождении текста.
Как работает новый детектор
С помощью этой технологии ученые исследовали, как языковая модель Gemma-2-2B генерирует тексты. Они обнаружили множество признаков, по которым можно отличить тексты, сгенерированные ИИ. Например, это могут быть перегруженные синтаксические конструкции или многословие в финансовых текстах.
Разрешение на основе признаков
Новый алгоритм позволяет выявить даже те тексты, в которых авторы пытались скрыть факт их генерации, добавляя лишние пробелы или нестандартные символы. В отличие от других методов, этот подход позволяет точно объяснить, почему текст был признан сгенерированным ИИ. Это делает систему более прозрачной и доверяемой.
Будущее технологий и роль новых методов
Метод, разработанный российскими учеными, открывает новые возможности для научного сообщества и бизнеса. Он позволит не только идентифицировать тексты, созданные ИИ, но и понять, что именно в этих текстах привлекло внимание алгоритма. Это может стать важным шагом в борьбе с неэтичным использованием ИИ для создания контента.
Уточнения
Иску́сственный интелле́кт или ИИ (англ. artificial intelligence; AI) в самом широком смысле — это интеллект, демонстрируемый машинами, в частности компьютерными системами.