- Разработана языковая модель Protein2PAM, которая предсказывает и перенастраивает PAM-специфичность CRISPR-Cas ферментов без лабораторных экспериментов.
- Protein2PAM позволяет создавать варианты Cas9, способные разрезать участки ДНК, ранее недоступные для редактирования из-за ограничения PAM.
- Модель открыта для исследователей и значительно ускоряет и повышает точность предсказаний, что может расширить возможности персонализированного редактирования генома.
Калифорнийский стартап Profluent представил инновационный подход к решению одной из ключевых проблем технологии CRISPR, связанной с ограничением в виде необходимости наличия PAM (protospacer adjacent motif) — короткой последовательности рядом с участком ДНК, который подлежит редактированию. Без соответствующего PAM редактирование невозможно, что до настоящего момента делало около трёх четвертей человеческого генома недоступным для CRISPR-Cas систем.
В Nature Biotechnology опубликована статья, в которой описана языковая модель белков Protein2PAM. Эта модель обучена на базе свыше 45 000 пар Cas-белков и PAM-последовательностей и способна прогнозировать и перенастраивать PAM-специфичность ферментов CRISPR-Cas без необходимости дорогостоящих и длительных итеративных лабораторных экспериментов. Такой подход принципиально отличается от традиционных методов, использующих направленную эволюцию и ручной белковый инжиниринг.
Protein2PAM работает путём анализа аминокислотной последовательности Cas-белка, что позволяет ей предсказывать распознаваемый ферментом PAM. С помощью виртуального мутагенеза — in silico mutagenesis — модель идентифицирует важные для PAM-распознавания аминокислотные остатки, не требуя при этом 3D-структуры белка. Сформированные варианты белка, например Nme1Cas9, демонстрируют расширенное распознавание PAM, что ведёт к существенному увеличению возможности редактирования ранее недоступных участков ДНК. В лабораторных условиях скорость разрезания таких вариантов достигала прироста до 50 раз по сравнению с природными ферментами.
По заявлениям авторов, Protein2PAM превосходит текущие биоинформатические методы, показывая в четыре раза большую чувствительность и ускорение работы в 500 раз. Результаты были экспериментально подтверждены в Центре геномной медицины Массачусетского госпиталя под руководством профессора Бенджамина Клайнстивера из Гарвардской медицинской школы — одного из ведущих экспертов в области геномного редактирования.
Обучающие данные и веса модели опубликованы в открытом доступе, а исследователям предоставлен бесплатный доступ к Protein2PAM. Несмотря на обнадёживающие результаты in vitro, авторы подчёркивают, что до клинических применений ещё далеко. Однако если технология успешно масштабируется, она может существенно расширить спектр заболеваний, поддающихся лечению с помощью CRISPR, и сделать достаточно рутинным процесс подбора оптимального фермента для каждого пациента с применением ИИ, заменяя сложные лабораторные поиски.
