- Google DeepMind представила AlphaGenome — нейросеть для анализа последовательностей ДНК длиной до 1 миллиона пар оснований.
- Модель способна предсказывать функции некодирующих участков генома по 11 типам биологических сигналов и превосходит существующие инструменты в 25 из 26 задач.
- AlphaGenome уже применяется в медицинских исследованиях для выявления причин генетических заболеваний и оценки мутаций в онкологии, а её исходный код открыт для некоммерческого использования.
Компания Google DeepMind опубликовала статью в журнале Nature, в которой представила новую нейросеть AlphaGenome. Эта модель способна одновременно анализировать последовательности ДНК длиной до миллиона пар оснований — что вдвое превышает возможности предыдущих систем — и предсказывать функциональные характеристики так называемых некодирующих участков, которые составляют около 98% генома. Долгое время считавшиеся «мусорными», эти участки играют ключевую роль в регуляции работы генов.
AlphaGenome использует уникальную архитектуру, основанную на сочетании U-Net и трансформеров. Для обработки очень длинных последовательностей входные данные разбиваются на фрагменты по 131 тысяче пар оснований, которые одновременно обрабатываются на нескольких вычислительных устройствах. Модель способна предсказывать тысячи геномных профилей, учитывая 11 типов биологических сигналов, включая экспрессию генов, доступность участков хроматина, сплайсинг и связывание транскрипционных факторов. В серии тестов AlphaGenome превзошла лучшие специализированные инструменты в 25 из 26 задач по прогнозированию эффектов генетических вариантов.
Практическое значение модели уже подтверждено. Например, в сентябре 2025 года команда исследователей клиники Мэйо провела хакатон, где с помощью AlphaGenome анализировались данные 29 неразгаданных генетических заболеваний. Биологический информатик Эрик Кли отметил, что модель правильно предсказала влияние мутации на экспрессию генов в сердечных клетках, что совпало с результатами лабораторных экспериментов. Кроме того, AlphaGenome помогает онкологам в отборе и ранжировании тысяч мутаций, возникающих при сравнении геномов здоровых и раковых клеток, по степени их функционального эффекта.
С момента публикации препринта в июне 2025 года AlphaGenome уже используется около 3000 учёных из 160 стран, которые ежедневно направляют на платформу около миллиона запросов. DeepMind позиционирует эту разработку как значительный шаг вперёд после своих предыдущих успешных проектов — AlphaFold, удостоенного Нобелевской премии, и AlphaMissense. В отличие от них, которые фокусировались на белках и кодирующих участках ДНК, новая модель охватывает весь геном целиком. Для содействия научному сообществу Google DeepMind открыла исходный код и веса модели на GitHub, разрешая их некоммерческое использование.
