Сервисы «Яндекса» изучили марийский язык

В преддверии 105-летия Марий Эл в Йошкар-Оле прошла презентация проекта «Речевые технологии распознавания и синтеза марийской речи от компании «Яндекс». Площадкой обсуждения возможностей сервисов стал Марийский научно-исследовательский институт языка, литературы и истории им. В.М. Васильева (МарНИИЯЛИ).

Историческое событие

«Яндекс» развивает проект по сохранению языков народов вместе с Домом народов России и Федеральным агентством по делам национальностей. Главным партнером компании по внедрению поддержки марийского языка является МарНИИЯЛИ. Научные сотрудники института давно мечтали цифровизировать национальный язык. Объем работ поражал, но разве истинных энтузиастов это напугает? Еще в 2011 году Андрей Чемышев с коллегами оформил дорожную карту по функционированию языка в электронном информационном пространстве. Спустя время некоторые идеи удалось претворить в жизнь.

В конце прошлого года компания «Яндекс» подписала соглашение с правительством Марий Эл, а в минувшие выходные презентовала проект, благодаря которому нейросети научились понимать марийский язык.  Переводчик практически безошибочно преображает его в русский язык, причем как на уровне текста, так и речи. Один пользователь может говорить на русском, а другой отвечать ему на марийском ‒ приложение все переведет и озвучит. Доступна функция голосового ввода в сервисе «Клавиатура» ‒ нейросеть в считанные секунды преобразует сказанное в текст.

По словам директора по региональному сотрудничеству компании «Яндекс» Антона Москаленкова, проект напрямую влияет на будущее марийского языка.

‒ Я убежден, что живые языки народов России не могут оставаться только объектом академического интереса, поэтому их развитие ‒ важная задача. Если языки не выйдут в повседневную жизнь, то есть на них не заговорит молодежь, область распространения останется маленькой. Благодаря современным технологиям мы исправляем эту ситуацию с помощью носителей национального языка, ‒ отметил он.

Фото Михаила Скобелева

Все в сети!

‒ Если язык не прошел технологический барьер и не стал частью цифрового пространства, то шансы на его утерю со временем возрастают. Оценивая путь, который мы прошли, остается порадоваться, ‒ улыбается директор по работе с органами государственной власти компании «Яндекс» Александр Болховитянов.

Предварительный итог работы нейросетей: 95 процентов правильного распознавания устных фраз, более 85 процентов фраз генерируются без ошибок. А вот фотоперевод пока можно выполнить только на операционной системе Android и в веб-версии. Версию для других платформ нужно подождать примерно три недели, уточнили разработчики. Судя по показателям, сервисы перешли от уровня школьника к уверенному пользователю.

Глава Марий Эл Юрий Зайцев оценил преимущества проекта, отметив его функцию сохранения и популяризации национальной культуры.

‒ Теперь у нас есть сервисы, которые понимают живой марийский язык и могут на него отвечать. Это открывает огромные возможности для образования, общения и сохранения культуры. Такие проекты – мощный вклад в развитие народа мари в цифровую эпоху. Очень символичный и важный подарок к 105-летию нашей республики в рамках проекта по сохранению языков народов России, ‒ подчеркнул Юрий Викторович.

Настоящим прорывом назвал разработку и министр цифрового развития Марий Эл Венедикт Суворов.

‒ Со средневекового уровня мы вышли на цифровой. Даже если носители марийского языка исчезнут (не дай Бог!), он останется в истории и материалах. Теперь можно обсудить использование этого ресурса в культуре и образовании, в практической деятельности, чтобы каждая марийская бабушка в деревне могла включить телевизор с помощью марийскоговорящей колонки, ‒ подчеркнул он. – Благодаря проекту, прорубившему окно возможностей, открываются интересные перспективы.

Работа на этом не заканчивается. Разработчики ведут разговоры о наполнении цифрового пространства культурно-этническими материалами, в том числе изображениями. Фактически проект продолжится, только задача другая ‒ нейросети должны визуально различать особенности национального колорита, чтобы, скажем, отличать марийскую вышивку от татарской и так далее.

Фото Михаила Скобелева

МНЕНИЯ

Николай Любимов, заместитель министра культуры, печати и по делам национальностей Марий Эл:

‒ Мы стали свидетелями нового этапа развития марийского языка, и я думаю, что современные технологии компании «Яндекс» будут востребованы не только учеными, но и журналистами, работниками культуры и образования, госслужащими. Убежден, что это только начало!

Людмила Григорьева, директор МарНИИЯЛИ:

‒ Огромная благодарность всем участникам колоссального по своей сложности проекта цифровизации марийского языка! Распознавание марийской речи играет важнейшую роль в информационном развитии языка. Переводчик «Яндекса» будет помогать общаться на родном языке даже с теми, кто не понимает марийского. Думаю, сервис можно использовать при проведении научных мероприятий, в театрах, во время путешествий и не только. Когда-то такое казалось невозможным.

Эрик Юзыкайн, директор Марийского национального театра драмы имени М. Шкетана:

‒ Нередко я слышал мнение: то, что делают ученые для развития языка, не востребовано. Не было ощущения, что технологии хлынули в массы, не было очереди желающих заниматься изучением марийского языка – а ведь это в первую очередь нужно тем, кто работает с ним. И я хочу отметить, что не всегда спрос рождает предложение, иногда предложение рождает спрос. Мы с Андреем Чемышевым нередко что-то придумывали, а потом замечали: идею-то заметили, дело пошло! Надо просто делать – и будь что будет! Но делать хорошо, как это умеют сотрудники МарНИИЯЛИ. Так получилось и с этим проектом.

 

Фото Михаила Скобелева.