Константин Северинов: «Глобальная база геномов привела бы к подлинной революции в медицине»
Чтобы попасть в Биотехнологический кампус проекта «100 000 + Я», надо пройти вдоль длинного здания Института биоорганической химии РАН. Если взглянуть на аэрофотосъемку, сверху по форме оно напоминает двойную спираль ДНК. Здесь, в кампусе, семь дней в неделю работают секвенаторы – машины, позволяющие определить последовательность ДНК. Реализация национальной генетической инициативы даст возможность прочитать полные геномы 100 000 россиян. Ее научный руководитель Константин Северинов в интервью «Ведомостям» рассказал, сколько геномов удалось расшифровать и как полученные находки помогли обнаружить характерные именно для жителей России предрасположенности к развитию онкологических заболеваний. Это знание, по его словам, поможет более точно настроить диагностические системы, вовремя выявлять болезнь и начать лечение. На анализ собранных геномов уйдут годы, признает Северинов. Но уже сегодня сотрудники проекта сделали первые открытия: например, смогли найти ранее не зарегистрированное в стране заболевание. Для этого ученые и врачи провели целое генетическое расследование.
– Цели проекта «100 000 + Я» определены соглашением правительства и компании «ПАО «НК «Роснефть». Первая цель – создать базу данных, которая содержит полные геномы 100 000 россиян (т. е. последовательности ДНК каждого человека. – «Ведомости»), вторая – создать биоинформатические инструменты для анализа этих данных. То, что мы недавно достигли целевой отметки, – это скорее психологический рубеж. Мы работаем с образцами, полученными от сотрудников компании «Роснефть» и взрослых членов их семей, а также с образцами пациентов партнерских медицинских организаций. Число образцов должно быть больше, чем необходимое количество геномов, потому что не все образцы удается отсеквенировать (определить последовательность ДНК. – «Ведомости») и не все отсеквенированные образцы проходят биоинформатические контроли качества. Для того чтобы депонировать в базу 100 000 геномов надлежащего качества, потребуется около 105 000 образцов.
Сейчас получены сиквенсы (расшифрованные последовательности ДНК. – «Ведомости») более 80 000 человек, из которых около 75 000 прошли контроль качества. К концу декабря текущего года, а на самом деле за несколько месяцев до этого, будет завершена расшифровка всех оставшихся геномов.
Несмотря на то что по мировым меркам наша база не является такой уж большой, для России наша база, содержащая не только геномную, но и этническую информацию, результаты самоанкетирования волонтеров и некоторые медицинские данные, крупнейшая.
Анализ данных, хранящихся в базе, – извлечение медицинских, эпидемиологических, популяционных смыслов – займет годы. Наш проект, в сущности, пилотный. Мировой опыт показывает, что крупные проекты создания национальных генетических баз не останавливаются на исходно заявленных рубежах, а продолжают расти. Для страны с населением почти 150 млн человек собранные на сегодня геномы – это капля в море. Для получения статистически достоверных данных о генетическом разнообразии россиян – а это очень важно для медицинской генетики – потребуется база, содержащая не менее 1 млн геномов.
Сейчас мы завершаем первую пятилетку сотрудничества с правительством, но партнерство продолжится до 2030 г. В следующие пять лет мы будем вместе с медицинскими и научными партнерами развивать нашу базу.
– В базе хранятся 50 000 геномов волонтеров – работников ПАО «НК «Роснефть». Они собраны по всем регионам присутствия компании, т. е. практически по всей России. Это геномы здоровых людей – в том смысле, что они не обращались к нам из-за какого-то конкретного диагноза. Информация, полученная в результате анализа их геномов, позволяет оценить популяционные частоты носительства определенных генетических вариантов у здоровых россиян.
Ген – это протяженный участок ДНК, фактически текст, кодирующий тот или иной белок, необходимый для организма. В различных положениях этого текста могут быть изменения, опечатки. Каждое такое изменение – это генетический вариант. У конкретного человека количество вариантов, отличающих его от другого человека [не родственника], исчисляется миллионами. Набор таких вариантов – основа нашей индивидуальности. Очень небольшое количество вариантов являются патогенными, т. е. могут приводить к генетическим болезням. Происходит это потому, что патогенный вариант приводит к порче белка, который кодирует ген. Для большей надежности все наши гены задублированы: одну копию мы получаем от мамы, другую – от папы. Если одна копия нормальная, а другая повреждена – человек будет носителем патогенного варианта. В ряде случаев носительство повышает индивидуальный риск заболевания, потому что одна здоровая копия гена все-таки хуже, чем две. Мы видим, что почти 3% сотрудников компании, геномы которых оказались в базе (это 1500 человек. – «Ведомости»), являются носителями вариантов, повышающих риски онкологических и сердечно-сосудистых заболеваний.
О такого рода рисках удобно говорить в терминах нашумевшего случая Анджелины Джоли. Люди даже говорят о «гене Анджелины Джоли». На самом деле этот ген (он называется BRCA1, от breast cancer – рак груди. – «Ведомости») есть у каждого из нас. Просто Джоли и некоторые члены ее семьи являются носителями определенного патогенного варианта в одной из двух имеющихся у них копий гена BRCA1. Статистически у таких людей рак яичников или молочной железы развивается гораздо раньше, чем в среднем в популяции. Анджелина Джоли приняла радикальную меру – сделала мастэктомию и удалила яичники.
Мы знаем, у кого из наших участников есть повышенные риски такого рода. Но большинство из них сейчас еще здоровы, речь идет о будущих рисках. Возникает вопрос: можно ли помочь этим людям? В качестве пилота внутри компании для желающих волонтеров-носителей организовано диспансерное наблюдение у профильных врачей по полису ДМС (добровольное медицинское страхование. – «Ведомости»). В случае если проблема действительно возникнет, ее удастся детектировать на самой ранней стадии и принять меры, которые могут предотвратить развитие болезни, снизить риски и увеличить продолжительность жизни.
Информация о носительстве важна не только для получателя, но и для прямых родственников – родителей и детей. Потому что если у кого-то есть вариант, повышающий риск, например, онкологического заболевания, то с вероятностью 50% он будет передан ребенку, а также почти наверняка присутствует у одного из родителей.
Если мы примем, что частота носительства рисковых вариантов в 3% справедлива для всего населения страны, то в зоне риска оказывается более 4,5 млн человек. И наверное, Минздрав должен начать думать о механизмах выявления носителей таких вариантов и помощи им.
– Частота встречаемости разных генетических вариантов описана в международных базах данных. Мы можем сравнить, насколько частота встречаемости конкретного варианта в России соответствует частотам, описанным в мире. Выяснилось, что целый ряд вариантов, которые повышают риск развития рака и считаются редкими в мире, у нас частые. Для наглядности вернемся к «гену Анджелины Джоли»: в России известно несколько вариантов гена BRCA1, которые гораздо чаще встречаются в славянской или башкиро-татарской популяции, чем в целом по миру. Наши ученые и медики знают об этом и используют эти знания в диагностике. Так как мы анализируем полные геномы, мы выяснили, что список вариантов, характерных именно для нашей популяции, далеко не полный. Этот вывод очень важен с практической точки зрения.
– Большинство диагностических наборов, которые целевым образом проверяют наличие вариантов, повышающих риск развития определенных заболеваний, разрабатывались в Западной Европе и США. Эти наборы построены на основе данных о частоте встречаемости того или другого генетического варианта в соответствующих популяциях. Наши данные показывают, что используемые в России иностранные наборы для диагностики предрасположенности к раку груди и ряду других генетических болезней не дают всей полноты информации. Женщина, получив негативный результат по BRCA1, будет думать, что у нее риска нет. Но на самом деле этот отрицательный результат может быть тривиальным следствием отсутствия в использованном диагностическом наборе пробы на тот патогенный генетический вариант, который есть у этой женщины. Очевидно, что нужно создавать диагностические наборы, которые соотносятся с частотой встречаемости патогенных вариантов в нашей стране, – это позволит спасти тысячи жизней.
Некоторые патогенные генетические варианты имеют особо высокую частоту у конкретных этносов. Поэтому в отдельных национальных республиках целесообразно иметь свои диагностические наборы. Например, с одобрения Минздрава России полученные нами данные будут использоваться для того, чтобы сделать недорогие диагностические наборы для Ингушетии. Они могли бы применяться для планирования беременности по программе «Здоровая семья».
– Этногенез народов Северного Кавказа, Дальнего Востока и Крайнего Севера проходил по следующему принципу: небольшая группа основателей заселяла изолированную территорию – например, горное ущелье или отдаленные районы Крайнего Севера. Потомки основателей жили на этой территории сотни лет с ограниченным контактом с внешним миром. Численность такой изолированной популяции постепенно увеличивалась и могла достигнуть десятков или сотен тысяч человек. Например, ингушей насчитывается около 500 000. С точки зрения генетики такие народы прошли через «бутылочное горлышко» – генетические варианты, которые были у основателей, стали широко распространены во всей популяции. Некоторые из таких вариантов могут быть патогенными и при этом почти не встречаться у других народов.
Есть редкое генетическое заболевание – синдром Роджерса. Он часто приводит к очень тяжелым последствиям (пациенты одновременно имеют мегалобластную анемию, сахарный диабет и нейросенсорную тугоухость. – «Ведомости»), вплоть до смерти в раннем возрасте. Генетическая причина синдрома Роджерса известна. Во всем мире зарегистрировано несколько сотен случаев этого заболевания. В России не было известно ни одного.
В сотрудничестве с Центром детской гематологии, онкологии и иммунологии им. Дмитрия Рогачева нам удалось выявить 10 случаев этого синдрома. Почти все подобные работы – это расследования в духе Шерлока Холмса, которые требуют совместной работы и кооперации. Сначала в геномах пациентов был обнаружен патогенный генетический вариант, потом по фамилиям врач-генетик Центра Рогачева догадалась, что во всех случаях речь идет об ингушах, которые не являются близкими родственниками. Вышла странная ситуация: болезнь очень редкая, а у нас 10 случаев – и все ингуши. Как говорил Винни-Пух, «это ж-ж-ж неспроста».
Мы предположили, что это проявление «эффекта основателя» – повышенной частоты определенной мутации в изолированной популяции. Наш партнер, профессор Евгений Имянитов из Санкт-Петербургского педиатрического медицинского университета, проверил геномы 100 случайно выбранных ингушей и обнаружил, что трое из них являются носителями генетического варианта синдрома Роджерса, т. е. одна копия соответствующего гена у них нормальная, а другая дефектная. Если у обоих партнеров, которые заводят ребенка, есть патогенные генетические варианты в одном и том же гене, то с вероятностью 25% ребенок получит патогенный вариант от каждого родителя и будет больным. Высокая частота носительства объясняет появление больных ингушских детей.
Теперь, зная конкретный вариант, характерный для ингушей, можно организовать генетическое тестирование пар, планирующих детей. Это не потребует полного анализа генома – достаточно проверить наличие конкретного генетического варианта. Если оба партнера окажутся носителями, им стоит получить консультацию врача-генетика и рассмотреть возможность ЭКО (экстракорпоральное оплодотворение. – «Ведомости») с отбором эмбриона перед его имплантацией, чтобы выбрать эмбрион без дефектного варианта гена и родить здорового ребенка.
– Да, собственно, мы и работаем согласно ряду поручений президента. Например, в этом и следующем году мы делаем расширенные выборки представителей разных народов – Северного Кавказа и Крайнего Севера. Задача – определить у них частоты носительства определенных генетических вариантов, чтобы затем разработать практические рекомендации для планирования здоровой семьи. В разных местах варианты будут разные, ведь основатели у этих народов тоже разные.
– В ряде стран это уже реальность. В Израиле ашкеназские евреи, планирующие семью, проверяются на носительство болезни Тея – Сакса (у пациента разрушаются нервные клетки, что постепенно приводит к глухоте, слепоте, а также потере физических и психических функций. – «Ведомости»). Механизм появления больных детей там такой же, как в случае с синдромом Роджерса. Государство берет на себя все расходы, потому что внедрение таких мер резко снижает социальные, медицинские и экономические расходы и в конечном счете позволит полностью искоренить заболевание.
– Частично этот список известен – мы далеко не первые, кто этим занимается. Например, у якутов чаще, чем обычно, встречается врожденная тугоухость, у тувинцев – ломкость костей. Анализ геномов позволит существенно расширить этот список. Для ряда таких заболеваний – они называются орфанные (редкие. – «Ведомости») – есть терапия, но для нее нужны очень дорогостоящие лекарства, и лечение должно начинаться как можно раньше, часто до появления симптомов. У нас в стране работает фонд «Круг добра». За счет увеличенных налоговых отчислений граждан, которые зарабатывают больше, чем другие, фонд закупает за рубежом необходимые лекарства. Но чтобы получить лечение, нужен подтвержденный молекулярный диагноз.
«Круг добра» работает по списку патогенных вариантов, который отобран международным медицинским генетическим сообществом. Но если мы признаем, что в нашей популяции много патогенных вариантов, которые ранее не были описаны, возникает проблема. Ведь если вариант, приводящий к развитию болезни у ребенка, не отражен в списке, то такой пациент не получит помощь. В среднем около 50% больных генетическими заболеваниями оказываются без молекулярного диагноза, а значит, и без надлежащего лечения. Если мы вместе с врачами сможем доказать, что какой-то конкретный, ранее не описанный вариант действительно является причиной болезни, у некоторых пациентов появятся новые возможности для лечения.
Уникальность нашего подхода заключается в том, что мы определяем полный геном не только у ребенка-пробанда (первый человек в семье, у которого выявляется или подозревается генетическое заболевание. – «Ведомости»), но и у родителей. Анализ в формате трио – папа, мама и ребенок – позволяет гораздо точнее выявлять значимость новых, ранее не описанных генетических вариантов. Это увеличивает диагностическую эффективность на 20%, а иногда и больше. Конечно, расходы возрастают втрое. Но мы берем эти расходы на себя. Ведь мы не только с большей эффективностью выходим на молекулярный диагноз, но также можем дать родителям, если оба они окажутся носителями, практические рекомендации для рождения будущих детей.
– Скорее самые маленькие по численности. Генетическая идентичность больших народов размыта. Это объясняется особенностями их этногенеза – они формировались как общества открытого типа. То есть, например, у русских генетическая идентичность, понимаемая как повышенная частота определенного набора генетических вариантов, гораздо менее выражена, чем у малых народов. В этом году мы делаем расширенный анализ представителей семи народов. В 2026 г. мы надеемся довести число народов до 15, потом будем двигаться дальше.
– Ненцев, хакасов, алтайцев, якутов, тувинцев, чеченцев, ингушей, народы Дагестана. Отдельно стоит вопрос доступности этих образцов и логистики их получения. В некоторых случаях мы используем образцы из уже имеющихся архивных коллекций, собранных этнографическими экспедициями. Некоторые образцы мы собираем сами. В мае пятеро наших сотрудников собирали образцы в Грозном в формате трио – там не было отбоя от желающих, семьи понимали, что мы хотим и можем им помочь.
– Конечно. Мы анализируем данные и получаем результаты, которыми важно и нужно делиться. В первую очередь они полезны медицинскому сообществу России. У нас есть механизм, позволяющий по запросу предоставлять квалифицированным внешним пользователям данные о частотах определенных генетических вариантов в анонимизированном, обобщенном виде.
То же самое касается статей: в них публикуются обобщенные данные. Например, сейчас мы готовим работу по вторичным находкам – анализу частоты встречаемости в нашей стране известных генетических вариантов, связанных с определенными заболеваниями. Это будет первое подобное исследование в России, и мы планируем опубликовать его в одном из ведущих международных научных журналов.

Константин Северинов
Аналогичные данные публикуют национальные проекты Великобритании, Дании, Эстонии, США, Катара – это важно для развития науки. Все российские врачи-генетики используют мировые базы данных для сопоставления генетических вариантов своих пациентов с данными, полученными учеными других стран и хранящимися в международных базах. Это основа для постановки диагнозов. Международное сотрудничество в этой сфере строится на взаимовыгодных условиях: чем более открыта база данных, тем она полезнее. Мы можем запрашивать информацию у других, но и они – у нас. Я считаю, что это справедливый и единственно правильный подход. Генетические болезни не знают политических границ.
– Сложности, безусловно, появились, и российские ученые страдают от этого гораздо больше, чем их зарубежные коллеги. Но доступ к ключевым для нас международным базам сохраняется. Если бы его полностью закрыли, работать врачам-генетикам стало бы практически невозможно.
– Половину нашей базы составляют геномы пациентов партнерских медицинских и научных организаций. Схема сотрудничества такая: мы получаем от них образцы, секвенируем геномы и бесплатно передаем их партнерам, но также депонируем их в нашу базу. В конечном счете геномные и медицинские данные накладываются друг на друга, и мы совместно с партнерами ищем причины заболеваний. Мы также ищем в геномах пациентов дополнительную информацию, не связанную с болезнью напрямую, но, например, связанную с тем, как ее лечить. Любое лекарство при определенной дозировке токсично. Попадая в наше тело, оно должно привести к какому-то желаемому эффекту, а потом быть выведено при помощи ферментов, которые сами закодированы в определенных генах. У разных людей такие фармакогены разные, а значит, различается и скорость выведения лекарств из организма.
Мы анализируем фармакогены и даем врачам рекомендации по выбору наиболее эффективных препаратов и их оптимальных дозировок, чтобы минимизировать побочные эффекты для конкретного пациента. Такие исследования идут с врачами из Центра Рогачева, планируем проводить их и с другими организациями.
– В нашем случае это происходит быстро. С точки зрения количества проводимых реакций секвенирования коммерческие компании, занимающиеся секвенированием ДНК, по сравнению с нами очень маленькие. Мы делаем более 1000 полных человеческих геномов в неделю. Это очень много. Секвенатор запускается после того, как набралось достаточное количество образцов. Чтобы нажать на кнопку и запустить машину, нужно не менее 100 образцов. Если вы запускаете ее ради одного образца, то цена будет такая же, как за 100. Запуск машины стоит около 10 млн руб. Наши машины работают семь дней в неделю, поэтому мы можем быстро включить в общий поток образец пациента из партнерской организации и получить результат в течение недели. А большинство компаний коммерческого сектора вынуждены ждать, пока у них наберется пакет в 100 образцов, и только потом запускать секвенатор. Эти же компании, как правило, сильно зависимы от доступности реагентов, здесь часто бывают проблемы. Мы напрямую работаем с производителями реагентов, в данном случае китайских, и никогда не испытываем в них недостатка. Наш рекорд – пять дней от получения образца до полного анализа генома. Такой анализ мы выполнили для новорожденных близняшек из Центра Рогачева. В стандартных случаях для медиков срок возврата данных составляет около двух недель.
Биоинформатический анализ может быть быстрым, если идет поиск стандартных генетических вариантов, а может длиться годами, потому что сложно найти иголку в стоге сена – один из миллиона ответственных за болезнь вариантов в геноме конкретного человека. Для повышения эффективности пытаются использовать методы искусственного интеллекта. Возможно, это когда-нибудь поможет, но пока нужен высококвалифицированный врач-генетик, или интерпретатор. Анализируя клинические проявления и генетические варианты, он пытается установить причину заболевания. Для этого приходится изучать множество научных публикаций, работать с различными базами данных, думать, выдвигать гипотезы, часто на уровне интуиции, и искать им подтверждение. В реальности анализ двух геномов в день одним специалистом – это потолок, работа на износ. В нашей стране таких интерпретаторов всего несколько сотен.
– Сейчас завершается первое пятилетие технологического партнерства между ПАО «НК «Роснефть» и правительством и готовится новое соглашение. Думаю, что за первые пять лет мы доказали, что наша работа полезна и это направление нужно развивать. Если такого рода деятельность нужна стране, то, наверное, должны быть механизмы, которые позволят на возмездной основе использовать нашу уникальную технологическую площадку для проведения исследований, которые нужны пациентам, будущим родителям, врачам, ученым и т. д. Наверное, в конечном счете потребуется изыскание средств для включения полногеномного секвенирования в ОМС, по крайней мере по определенным нозологиям и показаниям. Сейчас в России тот генетический анализ, который выполняем мы, проводится за счет пациента, благотворительных фондов или научных грантов. Других механизмов нет.
– Когда наш проект был на стадии планирования, мы рассматривали идею определения и генома, и микробиома наших добровольцев. Микробиом – горячая научная тема, но на уровне практической медицины, за исключением редких случаев, например болезни Крона (хроническое заболевание желудочно-кишечного тракта. – «Ведомости»), значение микробиома неочевидно, доказательная база, в общем, отсутствует. Микробиом слишком динамичная структура. Мы на уровне геномов далеко не всем можем сказать, в чем причина того или другого генетического заболевания. Найти какие-то корреляции между составом микробиома конкретного человека и его заболеванием, а тем более выбрать на основании этого какую-то медицинскую процедуру, которая изменит жизнь пациента к лучшему, практически невозможно. Исключением является, пожалуй, бактерия Helicobacter pylori, но при изучении микробиома ее не рассматривают. В общем, тратить деньги на изучение микробиома в нашем проекте было бы безответственно.
– Одна программа называется «Геномика и здоровье человека» на биофаке МГУ, а другая – «Алгоритмическая биология» на Физтехе. В мае прошел четвертый выпуск в МГУ, в июне будет первый выпуск Физтеха. Всего у программы «Геномика и здоровье человека» 36 выпускников. Из них 14 работают у нас. Мы сделали им предложение, они его приняли и, насколько мне известно, не жалеют об этом. Остальные работают в других научных организациях и коммерческих структурах. Это нормально. Мы готовим кадры не только для себя, хотя мы полностью оплачиваем образование всех студентов наших корпоративных программ.
– Безусловно. В проектах, подобных нашему, всегда хронически не хватает биоинформатиков. Мы ежегодно набираем по 10 «корпоративных» студентов на каждую программу. На Физтехе у нас сразу появились дополнительные студенты, которые сами оплачивают свое образование. Кроме того, благодаря поддержке ректора Дмитрия Ливанова наша программа увеличилась вдвое за счет бюджетников.
– Начиная с сентября 2025 г.
– Половина платных, половина бюджетных. То есть всего около 25 человек, учитывая тех, кто сам оплачивает свое образование. Для нас формат магистратуры был максимально удобным: мы брали талантливых выпускников бакалавриата из разных вузов и готовили их под себя. Одна из самых успешных выпускниц нашей программы в МГУ заканчивала бакалавриат в МГИМО, на какой-то стадии разочаровалась в международных экономических отношениях и переквалифицировалась в лабораторного биолога. Отдельный вопрос встает в связи с реформой в системе образования. Со следующего года болонская система под крики и улюлюканье народа исчезнет. Но как интегрировать в будущую 5–6-летнюю систему специалитета магистратуру – не ясно. Может, к тому времени, когда это реализуется, опять все поменяется.
– Биоинформатиков всегда не хватает. Медицинский интерпретатор крайне востребованная и, к сожалению, редкая профессия. Было бы правильно готовить их вместе с каким-то медицинским учреждением.
– На мой взгляд, правильная постановка вопроса: захотят ли они сюда приехать? Тот разгром, который сейчас устраивает [американский президент Дональд] Трамп, показывает, что ни в одной стране нельзя быть уверенным в будущем. Ученые, как и любой капитал – все по Марксу, – идут туда, где им лучше. Ухудшение условий труда в США уже привело к небольшому оттоку исследователей в Европу. [Президент Эмманюэль] Макрон заявил, что Франция выделила 100 млн евро для привлечения ученых, бегущих от политики злого Трампа. Это крохотная сумма, которая позволит создать несколько десятков лабораторий, руководимых элитными научными эмигрантами. Отдельная проблема в том, что условия для научной деятельности в Европе в принципе хуже, чем в США. Очень большое количество ученых китайского происхождения, работавших в Штатах, вернулись в Китай, потому что там создали исключительные условия для занятий наукой. Если ученые уезжают откуда-то при ухудшении условий, они будут переезжать куда угодно – включая Россию, лишь бы им обеспечили лучшие условия для работы. Учитывая попытки ужесточения визового режима для иностранных ученых, возвращение некоторых наших ученых зиждется на Трампе, который будет их «отлавливать» и отправлять сюда. Один прецедент уже имеется. Осталось лишь создать условия для работы. Китаю на это потребовалось почти 30 лет.