Искусственный интеллект помог ученым прочесть зачеркнутые слова в рукописях Пушкина
Российские исследователи впервые применили искусственный интеллект для расшифровки зачеркнутых фрагментов в рукописях Александра Пушкина. Команда специалистов в области нейросетевых технологий и филологии разработала алгоритм, способный восстанавливать утерянные в процессе редактирования слова, создавая новые возможности для изучения творчества великого поэта.
Как рассказал заведующий отделом «Зрительные системы» ФИЦ ИУ РАН Дмитрий Николаев в беседе с RTVI, обучение нейросети проходило в два этапа. Сначала алгоритм научили самостоятельно зачеркивать текст, имитируя стиль исправлений Пушкина, а затем — производить обратную операцию, «стирая» созданные им же зачеркивания.
На втором этапе специалисты использовали полученные изображения с искусственно созданными исправлениями для обучения основной нейросети. Это позволило ей корректно распознавать зачеркнутые слова. В результате тестирования и доработки был создан программный комплекс, способный анализировать рукописи и восстанавливать их первоначальное содержание.
По словам Николаева, значительная часть пушкинских текстов, даже в их финальных версиях, содержит исправления, поскольку поэт постоянно совершенствовал свои произведения. Кроме того, имеются документы с редакторскими корректировками, сделанными третьими лицами, в том числе царской цензурой.
Разграничение авторских исправлений и сторонних вмешательств — важная историческая задача, в решении которой может помочь искусственный интеллект.
Ведущий сотрудник Института русского языка РАН Николай Перцов отметил, что компьютерные технологии позволяют детально анализировать черновики, выявляя едва заметные следы чернил и графитового карандаша. Например, удалось с высокой точностью прочитать ранее неразборчивую строку в черновой версии стихотворения «Храни меня, мой талисман…». Это открытие может пролить свет на личные переживания Пушкина в период написания стихотворения.
Чем больше исторических текстов удастся обработать, тем глубже можно будет понять творческий процесс великих авторов, восстановить утраченные фрагменты и приблизиться к подлинному замыслу писателей.