Прогноз будущего стал точнее. Новая разработка МГУ меняет правила игры в анализе выживаемости

Когда произойдет отказ оборудования или отток клиентов? Ответы на такие вопросы больше не зависят от предположений и ручной очистки данных — МГУ представил библиотеку, которая делает прогнозы на основе сложных, неполных и нестандартных данных.

На факультете вычислительной математики и кибернетики МГУ создана и представлена библиотека Survivors — инновационный инструмент на Python, предназначенный для анализа событий, происходящих во времени. В отличие от традиционных методов, требующих чистых данных и строгих математических моделей, Survivors справляется с реальностью: данными, в которых есть пробелы, неопределённость и скрытые зависимости.

Особое внимание в разработке уделено области выживаемости — методике анализа вероятности наступления событий, которая особенно актуальна в медицине, технике и бизнесе. Примеры применения варьируются от прогноза выздоровления пациентов до предсказания износа оборудования или ухода клиентов.

В основе Survivors — ансамбли деревьев решений, специально адаптированных для задач выживаемости. Эти модели не требуют жестких допущений и способны учитывать множество факторов сразу — как числовых, так и категориальных, даже если часть данных отсутствует. Поддержка параллельных вычислений позволяет использовать инструмент на больших объёмах информации без потери в производительности.


«Survivors позволяет решать задачи анализа выживаемости без предобработки данных, обеспечивая высокую точность прогнозов. Мы стремились создать инструмент, который поможет исследователям и практикам работать с реальными данными, учитывая их сложность и неопределенность»

– Юлий Васильев, сотрудник лаборатории технологий программирования, ВМК МГУ


Важное преимущество библиотеки — её способность обрабатывать информативное цензурирование, когда данные исчезают не случайно, а, например, из-за вмешательства человека. Это делает Survivors особенно полезной в сложных реалиях клиник и промышленных систем.

Survivors — open-source библиотека, уже протестированная на реальных наборах медицинских и промышленных данных, где она превзошла по точности традиционные модели вроде регрессии Кокса. При этом она не требует глубоких знаний в области машинного обучения, что делает её доступной не только для исследователей, но и для практиков на местах.

Библиотека открыта и легко интегрируется в существующие аналитические решения, позволяя бизнесу, науке и здравоохранению получить доступ к прогнозам, основанным на современной математике и алгоритмах.

Источник: МГУ