Российские биоинформатики предложили новую архитектуру нейронной сети, способную оценивать, насколько удачно выбрана направляющая РНК для эксперимента по редактированию генов. Их подход будет способствовать более эффективной модификации ДНК с помощью популярного метода CRISPR/Cas и, следовательно, поможет разработать новые стратегии создания генетически модифицированных организмов и найти способы лечения тяжелых наследственных заболеваний. Исследование, поддержанное грантом Российского научного фонда, было опубликовано в журнале Nucleic Acids Research .
Геномное редактирование, и в частности метод CRISPR/Cas, широко используется в различных областях экспериментальной биологии, а также в сельском хозяйстве и биотехнологии.
CRISPR/Cas — одно из многих орудий, которые бактерии используют для борьбы с вирусами. При заражении ДНК возбудителя проникает в клетку, и, поскольку ее последовательности отличаются от таковых бактерии, белки Cas распознают ее как чужеродный наследственный материал и расщепляют ее. Чтобы бактерия быстрее реагировала на вирус, клетка хранит фрагменты ДНК возбудителя — так же, как компьютерный антивирус хранит коллекцию вирусных сигнатур — и передает их следующим поколениям, чтобы ее Cas мог предотвратить дальнейшие атаки.
В 2011–2013 годах группы из разных лабораторий (Дженнифер Дудна, Эммануэль Шарпантье и Фенг Чжан в США и Вирджиниюс Шикшнис в Литве) независимо друг от друга адаптировали систему CRISPR/Cas к задаче внесения произвольных изменений в последовательности ДНК. в клетках человека и животных, что делает геномное редактирование намного проще и эффективнее. Основными элементами системы являются направляющая РНК, которая «отмечает точку», и белок Cas9, расщепляющий ДНК в этом месте. Затем клетка «залечивает рану», но изменения в генетическом коде уже внесены.
Проблема в том, что нацеливание направляющей РНК не всегда точно и может ввести Cas9 в заблуждение. Превращение технологии CRISPR/Cas в практичный высокоточный инструмент очень важно, особенно когда речь идет о медицинских вмешательствах.
Исследователи Сколтеха под руководством Константина Северинова использовали глубокое обучение, гауссовские процессы и другие методы, чтобы сделать выбор оптимальных направляющих РНК более точным. Команда создала набор нейронных сетей, то есть обучаемых математических моделей, реализованных в виде последовательного умножения матриц — больших массивов чисел со сложной внутренней структурой. Нейронная сеть способна обучаться, потому что у нее есть «память» в виде чисел, которые изменяются определенным образом каждый раз, когда система завершает расчет в режиме обучения. Команда обучала модели на различных наборах данных, содержащих десятки тысяч экспериментально проверенных направляющих РНК, которые продемонстрировали высокую точность в клетках человека и животных .
Исследователи предложили алгоритм, который оценивает вероятность расщепления ДНК для данной направляющей РНК. Полученные баллы могут определять экспериментальный дизайн для любого приложения на основе CRISPR/Cas. Команда использовала свои нейронные сети, чтобы создать набор направляющих РНК для внесения точных изменений в гены 22-й хромосомы человека. Это стало возможным благодаря высокой точности предсказания частоты расщепления и функции оценки неопределенности предсказания, которую не обеспечивал ни один из ранее существовавших методов.