Приложение для оцифровки древних тибетских текстов создала студентка НГУ

Оно способно считывать тибетское слоговое письмо, которое использовали в старопечатных документах. Это позволит перевести раритетные тексты в электронный формат, сохранить их и сделать более доступными.

Лидия Захарова
Лидия Захарова
12:42, 17 июля 2025

Как рассказали в Новосибирском государственном университете, студентка гуманитарного института Анна Мурашкина разработала приложение, которое должно переводить буквы тибетского алфавита в машиночитаемый вид. В этом поможет искусственный интеллект.

«Дообучение модели она реализовала на размеченном корпусе документов, и в результате был создан полный алгоритм оптического распознавания символов, включающий этапы предобработки, сегментации, распознавания и постобработки», — пояснили в пресс-службе НГУ.

Для работы Анна Мурашкина использовала тексты, которые хранятся в архиве Института монголоведения, буддологии и тибетологии СО РАН. 

Со временем бумага, на которой они написаны, разрушается — важные знания могут быть утеряны. Именно это и побудило студентку заняться оцифровкой.⁠

«Старопечатные документы, рукописи и ксилографы содержат уникальные сведения о философии, религии, медицине, истории и искусстве, играя ключевую роль в изучении культурных традиций региона. Один из наиболее надёжных способов сохранения и систематизации исторических документов — их оцифровка», — считает Анна Мурашкина.

Разработку, созданную студенткой НГУ, готовы использовать в Институте монголоведения, буддологии и тибетологии СО РАН. Сейчас Анна обсуждает сотрудничество с Буддистским центром цифровых технологий, который проводит оцифровку архивов храмов и монастырей. Девушка убеждена, что современные технологии позволят многим учёным и исследователям познакомиться с древними текстами, которые раньше были доступны только избранным.