С помощью ИИ ученые обнаружили более 160 тыс. новых видов вирусов
С помощью инструмента машинного обучения было обнаружено 161 979 новых видов РНК-вирусов, который, по мнению исследователей, значительно улучшит картирование жизни на Земле и может помочь в идентификации многих миллионов еще не охарактеризованных вирусов.
Исследование, опубликованное в журнале Cell и проведенное международной группой исследователей, является одной из крупнейших когда-либо опубликованных работ по открытию видов вирусов.
«Нам открылось окно в ранее скрытую часть жизни на Земле, открыв удивительное биоразнообразие», — сказал старший автор, профессор Эдвардс Холмс из Школы медицинских наук факультета медицины и здравоохранения Сиднейского университета.
По словам Холмса, это самое большое количество новых видов вирусов, обнаруженных в ходе одного исследования, что значительно расширяет знания о вирусах, живущих среди людей.
«Обнаружить так много новых вирусов одним махом — это просто потрясающе, и это лишь поверхностный взгляд, открывающий мир открытий. Еще миллионы видов должны быть открыты, и мы можем применить этот же подход к идентификации бактерий и паразитов», — добавил он.
Хотя РНК-вирусы обычно ассоциируются с человеческими заболеваниями, они также встречаются в экстремальных условиях по всему миру и даже могут играть ключевую роль в глобальных экосистемах. В этом исследовании они были обнаружены живущими в атмосфере, горячих источниках и гидротермальных источниках.
«То, что экстремальные среды являются переносчиками стольких типов вирусов, является еще одним примером их феноменального разнообразия и стойкости к выживанию в самых суровых условиях, что потенциально дает нам подсказки о том, как появились вирусы и другие элементарные формы жизни», — сказал профессор Холмс.
Исследователи создали алгоритм глубокого обучения LucaProt для обработки огромных массивов данных о генетических последовательностях, включая длинные геномы вирусов длиной до 47250 нуклеотидов и сложную геномную информацию, что позволило обнаружить более 160 тыс. вирусов.
Холмс рассказал, что большинство этих вирусов уже были секвенированы и находились в публичных базах данных, но они были настолько разными, что никто не знал, что это такое.
«Они включали то, что часто называют последовательностью темной материи. Наш метод ИИ смог организовать и классифицировать всю эту разрозненную информацию, впервые проливая свет на значение этой темной материи», — добавил он.
Инструмент искусственного интеллекта был обучен вычислять темную материю и идентифицировать вирусы на основе последовательностей и вторичных структур белка, которые все РНК-вирусы используют для репликации. Ему удалось значительно ускорить обнаружение вирусов, что при использовании традиционных методов заняло бы много времени.
Соавтор исследования из Университета Сунь Ятсена, профессор Манг Ши, сказал, что раньше исследователи полагались на биоинформатические конвейеры для обнаружения вирусов, что ограничивало разнообразие, которое они могли исследовать.
Теперь, по его словам, у них есть гораздо более эффективная модель на основе ИИ, которая обеспечивает исключительную чувствительность и специфичность и в то же время позволяет гораздо глубже изучить вирусное разнообразие. Он также добавил, что они планируют применять эту модель в различных приложениях.
Соавтор доктор Чжао-Жун Ли, который занимается исследованиями в Apsara Lab Alibaba Cloud Intelligence, рассказал, что LucaProt представляет собой значительную интеграцию передовых технологий ИИ и вирусологии, демонстрируя, что ИИ может эффективно выполнять задачи в биологических исследованиях.
По его словам, эта интеграция дает ценные идеи и поддержку для дальнейшего расшифровывания биологических последовательностей и деконструкции биологических систем с новой точки зрения. Он заявил, что исследователи продолжат исследования в области ИИ для вирусологии.
«Очевидным следующим шагом станет обучение нашего метода обнаружению еще большего количества этого удивительного разнообразия, и кто знает, какие еще сюрпризы нас ждут», — заключил Холмс.
Ранее исследователи из группы когнитивной вычислительной нейронауки в FAU акцентировали внимание на способности мозга к предсказательному кодированию. С помощью ИИ и информации от пациентов с эпилепсией они установили, что спонтанные активности мозга играют значительную роль в обработке информации без внешних стимулов.