Российские ученые научили ИИ отличать пьяных от трезвых по голосу

Российские ученые разработали метод, позволяющий отличать человека в состоянии алкогольного опьянения от трезвого по спектру его голоса. В основе — нейросеть и алгоритмы машинного обучения. Разработкой занимались специалисты Нижегородского государственного университета им. Н.И. Лобачевского (ННГУ) и Томского госуниверситета систем управления и радиоэлектроники. Результаты опубликованы в European Physical Journal Special Topics.

Новая технология может быть полезна для мониторинга сотрудников в сферах, где важна четкая и устойчивая речь — например, в колл-центрах. Метод не зависит от языка общения и устойчив к фоновому шуму.

«Методы определения опьянения по высоте или амплитуде голоса могут стать инструментом речевого контроля сотрудников. Если у кого-то возникли проблемы с коммуникацией, система определит это автоматически, используя записи разговоров с клиентами», — пояснила Валерия Демарева, заведующая лабораторией киберпсихологии ННГУ.

По ее словам, это может повысить общественную безопасность, особенно в ситуациях, когда невозможно проверить выдыхаемый воздух или кровь на алкоголь.

В эксперименте участвовали более 600 человек. Некоторые добровольцы находились в стадии среднего опьянения — около 1,5 промилле алкоголя в крови. Им предлагали читать скороговорки. Аудиозаписи расшифровывали с помощью спектрального анализа, и на этих данных обучали нейросеть. Лучшая из моделей научилась с высокой точностью отличать пьяную речь от трезвой.

Следующий шаг — определение стрессовых состояний по речи.

«Это позволит быстро протестировать стрессоустойчивость соискателя при приеме на работу, а также отслеживать уровень стресса сотрудников, чтобы не допускать критических ситуаций», — добавила Демарева.

Проект по раннему выявлению стресса уже получил грант Российского научного фонда.