Порядок из хаоса: новый алгоритм позволяет синтезировать «сложные» белки

Ученые разработали новый метод машинного обучения — он позволяет проектировать особый класс молекул — внутренне неупорядоченные белки. Рассказываем о разработке подробнее.
Автор Hi-Tech Mail
Внутренне неупорядоченный белок
Внутренне неупорядоченный белок в представлении художникаИсточник: https://phys.org/

Современные технологии искусственного интеллекта за последние годы совершили революцию в биологии: теперь компьютеры умеют «сворачивать» белки — то есть предсказывать их трехмерную структуру по аминокислотной последовательности.  Специалисты Гарвардской школы инженерных и прикладных наук и Северо-Западного университета разработали новый метод машинного обучения — он позволяет проектировать особый класс белков, которые не поддаются даже самым мощным алгоритмам искусственного интеллекта, включая AlphaFold, принесший своим разработчикам Нобелевскую премию. Результаты исследования опубликованы в Nature.

Речь идет о так называемых «внутренне неупорядоченных белках» (intrinsically disordered proteins, сокращенно IDPs), которые составляют около 30% всех белков человеческого организма. В отличие от обычных белков с фиксированной трехмерной структурой, эти молекулы постоянно меняют свою форму, находясь в непрерывном движении. Несмотря на кажущийся хаос, они выполняют важнейшие биологические функции: связывают молекулы, передают сигналы и являются частью рецепторов.

Трехмерная структура белка
Разные способы изображения трёхмерной структуры белка на примере триозофосфатизомеразы. Слева — «стержневая» модель, с изображением всех атомов и связей между ними; цветами показаны элементы. В середине — мотив укладки. Справа — контактная поверхность белка, построенная с учётом ван-дер-ваальсовых радиусов атомов; цветами показаны особенности активности участковИсточник: https://commons.wikimedia.org/

Кришна Шринивас, бывший научный сотрудник Гарварда, а ныне доцент Северо-Западного университета, отметил, что ученые кровно заинтересованы в изучении внутренне неупорядоченных белков, потому что они находятся вне досягаемости современных методов на основе ИИ, таких как AlphaFold от Google DeepMind.

Важность этих белков трудно переоценить. Мутации в IDPs связаны с серьезными заболеваниями, включая рак и нейродегенеративные расстройства. Классический пример — альфа-синуклеин, белок, который специалисты уже давно связывают с болезнью Паркинсона. Однако нестабильная природа молекул делала невозможным проектирование таких белков с нуля для терапевтических или исследовательских целей.

Команда применила инновационный подход, используя алгоритмы автоматического дифференцирования — технологию, которая широко применяется в глубоком обучении для тренировки нейронных сетей. Майкл Бреннер, профессор прикладной математики и физики в Гарварде, был одним из первых, кто увидел потенциал этой технологии за пределами машинного обучения.

Мы не хотели просто брать кучу данных и обучать модель проектировать случайные белки. Мы использовали существующие, достаточно точные симуляции, чтобы проектировать IDPs на уровне этих симуляций.
Райан Крюгер
соавтор исследования, аспирант Гарварда.

Метод позволяет компьютеру распознавать, как малейшие изменения в белковых последовательностях — даже замена одной аминокислоты — влияют на конечные свойства белков. Исследователи сравнивают свой метод с мощной поисковой системой для аминокислотных цепочек, которая находит именно те комбинации, которые необходимы для выполнения конкретной функции.

Ключевое преимущество нового подхода заключается в том, что IDPs проектируются не по предсказаниям ИИ, а на основе симуляций молекулярной динамики с использованием реальной физики. Такой метод учитывает, как белки действительно ведут себя в природе, а не просто предполагает их структуру.

Разработка ученых обещает в будущем прорывы в лечении заболеваний, связанных с неупорядоченными белками. Метод также может найти применение в синтетической биологии для создания новых материалов и терапевтических агентов с уникальными свойствами.

Конструирование белков
Конструирование белков с помощью алгоритм машинного обученияИсточник: https://commons.wikimedia.org/

Конструирование биомолекул — вовсе не прихоть ученых. Оно в прямом смысле приносит ценные плоды. Недавно мы написали о том, как алгоритм AlphaFold помог картофелю и томатам справиться с беспощадной бурой гнилью.