Российские ученые создали ИИ для анализа «невидимых» мутаций, связанных с болезнями сердца
Ученые Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ (Институт ИИиЦН) представили программу, способную анализировать участки генома человека, которые ранее оставались недоступными для точной интерпретации при генетическом тестировании. Инструмент адаптирует большие генеративные модели (ГенИИ) для задач кардиогенетики, предсказывая, как мутация влияет на работу конкретного гена.
Геном человека можно сравнить с огромной библиотекой. Раньше ученые умели читать только небольшую часть книг — те, в которых записаны инструкции по созданию белков (это около 2% всей ДНК). Именно там обычно искали мутации, ответственные за наследственные болезни сердца. Для таких вариантов существуют отработанные международные критерии, позволяющие оценить их опасность и выявить мутации, ведущие к развитию заболеваний.
Но что делать с остальными 98%? Долгое время считалось, что это просто «пустые страницы» или «генетический мусор». Однако оказалось, что эти участки вовсе не бесполезны: они действуют как выключатели и регуляторы громкости, управляя активностью генов. Если в таких участках происходит поломка, это может серьезно повлиять на работу сердца, сосудов и крови. Проблема заключалась в том, что раньше ученые не могли точно определить, какие из этих «невидимых» мутаций действительно опасны, а какие безвредны. Поэтому многие случаи сердечных заболеваний оставались необъяснимыми именно из-за невозможности проанализировать некодирующие варианты (то есть те, которые не несут прямых инструкций по сборке белков).
Как ИИ учится видеть мутации
Ученые Института ИИиЦН ФКН НИУ ВШЭ представили программное решение, которое впервые позволяет массово и точно анализировать эти «молчащие» участки применительно к здоровью сердца. Программа использует самые современные технологии — генеративные модели (те же, что лежат в основе популярных нейросетей), чтобы предсказывать последствия мутаций в регуляторных участках ДНК и оценивать их влияние на здоровье сердца.
«В основе программы лежат две мощные ИИ-модели, которые можно сравнить с экспертами, прочитавшими миллионы генетических инструкций. Они умеют сравнивать два варианта ДНК: здоровый (эталонный) и тот, где произошла мутация. Затем программа оценивает, изменилась ли после этой мутации “громкость” работы генов, то есть стали они активнее или, наоборот, притихли. Мы сконцентрировались на анализе тканей сердца и сосудов, но можно анализировать любые ткани», — рассказала Мария Попцова, директор Центра биомедицинских исследований и технологий Института ИИиЦН ФКН НИУ ВШЭ.
Точность подтверждена данными UK Biobank
Для повышения точности программа использует коллективный разум: сразу несколько моделей изучают мутацию с разных сторон, а затем объединяют свои выводы с помощью методов искусственного интеллекта. В результате программа выдает простую и понятную оценку — число от 0 до 1. Чем ближе цифра к единице, тем выше вероятность, что обнаруженная мутация опасна и может повлиять на развитие болезней сердца.
Чтобы убедиться в надежности программы, ученые провели строгую проверку. Для этого использовались данные британского проекта UK Biobank — огромной базы генетической информации. Для теста отобрали более 11 тысяч мутаций из тех самых «регуляторных» участков ДНК, которые раньше было сложно анализировать. Среди них были как варианты, уже точно связанные с заболеваниями, так и заведомо безвредные. Каждую подозрительную мутацию сравнивали с девятью безопасными, подобранными по максимальному количеству совпадений: месту в геноме, типу участка, соседству с генами и другим параметрам. Программа успешно справилась с задачей: она безошибочно отличила опасные мутации от безвредных, доказав свою надежность и готовность к практическому использованию.
Программа создана для практического использования разными специалистами: сотрудники медицинских лабораторий и кардиологических центров смогут точнее интерпретировать результаты полногеномного секвенирования и искать генетические причины заболеваний у пациентов. Как отмечают разработчики, для работы с программой не нужно быть программистом — она создана так, чтобы ею могли пользоваться генетики, биоинформатики и медицинские исследователи в своей повседневной практике. В фундаментальных исследованиях программа может помочь понять молекулярные механизмы развития болезней сердца и изучать, как регуляторные участки ДНК влияют на патологии.
В Центре биомедицинских исследований и технологий НИУ ВШЭ благодаря программе ученые уже сделали важное открытие: оказалось, что определенные варианты гена BMPR2, влияющие на его активность, предопределяют то, как пациент будет реагировать на лечение. Сейчас исследователи продолжают работу: они ищут некодирующие участки ДНК, влияющие на работу генов, связанных с риском внезапной сердечной смерти.
Комментарии
0 всего