Открылся прием заявок на разработку сервиса по расшифровке текстов для Главархива Москвы

Стартовал прием заявок на хакатон Мэра Москвы «Лидеры цифровой трансформации». В его рамках Главархив Москвы приглашает команды разработчиков, аналитиков и IT-специалистов создать веб-сервис на базе искусственного интеллекта для автоматического извлечения информации из архивных документов.

— Для архивов цифровая трансформация — это не мода, а необходимость. Мы стоим перед вызовом: с одной стороны, колоссальный рост интереса к историческим материалам, особенно тем, которые помогают восстановить историю семьи, и спрос на удобный цифровой доступ к ним, с другой — ограниченные человеческие ресурсы и высокая трудоемкость расшифровки архивных документов. Поэтому мы делаем ставку на технологии и приглашаем участников хакатона помочь нам разработать технологическое решение, которое станет основой нового подхода к ретроконверсии, — подчеркнул руководитель Главархива Москвы Ярослав Онопенко.

Задача, стоящая перед участниками хакатона в Главархиве, — разработка веб-сервиса, который сможет обрабатывать гибридные документы, сочетающие рукописный и печатный текст, с точностью распознавания не менее 95%. Будущий инструмент должен не только «читать» сканы, но и индексировать извлеченные данные, позволять проверять информацию, а также формировать выгрузки по заданным критериям. Все процессы должны осуществляться в закрытом контуре — без доступа к интернету и внешним ресурсам, что критически важно для обеспечения безопасности и целостности архивных данных.

Актуальность задачи обусловлена сразу несколькими факторами. Во-первых, количество бумажных дел, поступающих в архивы Москвы, ежегодно увеличивается, и их ручная обработка становится всё более трудоемкой. Во-вторых, наблюдается дефицит специалистов, способных качественно расшифровывать дореволюционные рукописи. В-третьих, резко возрос общественный интерес к генеалогическим, краеведческим и историческим исследованиям. Современным пользователям необходим оперативный и точный доступ к информации, содержащейся в архивных фондах. Автоматизация процессов ретроконверсии — ключ к тому, чтобы сделать архивное наследие Москвы доступным, структурированным и интегрированным в цифровую среду.

Заявки на участие в хакатоне Мэра Москвы «Лидеры цифровой трансформации» принимаются до 22 сентября. В финал выйдут 200 команд, которые поборются за призовой фонд в размере 40 миллионов рублей. Победители получат по 1 миллиону рублей, а также возможность реализовать и внедрить свои проекты в рамках реальных задач московских ведомств.