В статье, опубликованной в журнале Nature Methods, авторы поясняют, что доступ к структурным моделям и динамике биомолекул, созданных на основе экспериментов с флуоресценцией, впервые могут получить другие исследователи, что даст научному сообществу уникальные данные для изучения биомолекулярных процессов. Эти экспериментальные данные могут стать основой для тренировки искусственных нейронных сетей, которые могут моделировать не только статичные структуры, но и динамику молекул.
Биомолекулы, к которым относятся белки и нуклеиновые кислоты, являются ключевыми компонентами живых организмов. Они состоят из множества строительных блоков, например, в белках такими блоками являются аминокислоты. Когда такие блоки собираются в клетках, образуются сложные трехмерные структуры. Для того чтобы понять функции биомолекул, важно учитывать не только их форму, но и различные структурные состояния и динамику их переходов.
До недавнего времени определение трехмерной структуры биомолекул с помощью классических биофизических методов было сложным и трудоемким процессом. Чтобы облегчить эту задачу, в 1971 году была создана «База данных белковых структур» (PDB), которая на сегодняшний день содержит более 220 тысяч структур. Эти данные активно используются в современных ИИ-инструментах, таких как AlphaFold, получивший в этом году Нобелевскую премию по химии за предсказание белковых структур.
Хотя ИИ-системы уже могут предсказывать статичные структуры биомолекул с высокой точностью, им пока не хватает данных для моделирования динамических процессов. Именно здесь на помощь приходят экспериментальные методы, в частности, флуоресцентная спектроскопия, которая позволяет изучать одновременно и структуру, и динамику молекул. В этих экспериментах биомолекулы маркируются специальными красителями, которые начинают светиться при внешнем воздействии, указывая на их положение и поведение.
Автор статьи, доктор Кристиан Ханке, постдокторант Института молекулярной физической химии HHU, отмечает, что эксперименты с флуоресценцией дают детальную информацию, что делает их отличным источником данных для интегративного моделирования. Однако, чтобы эти данные были максимально полезными, они должны быть доступны широкому кругу исследователей.
Исследовательская группа представила стандартное описание данных в виде трех связанных «словарей», организованных в общую библиотеку. Профессор Клаус Зайдель, один из руководителей исследования, поясняет, что такое организационное решение впервые позволяет хранить структурные модели, основанные на данных флуоресценции, вместе с кинетической информацией. Это даёт возможность учитывать не только статичные структуры, но и динамические свойства биомолекул.
Это важно для того, чтобы связать статичные модели с энергетическим ландшафтом молекул — различиями в энергетических состояниях между различными трехмерными конфигурациями биомолекул. По словам профессора Зайделя, такая информация поможет развивать и обучать новые ИИ-программы, которые смогут предсказывать динамические структуры биомолекул. Экспериментальные данные, полученные с помощью флуоресцентных методов, могут внести значительный вклад в этот процесс, делая возможным более точное понимание функционально значимой динамики молекул.
Ранее сообщалось, что исследователи из Гарвардской медицинской школы представили инновационную модель ИИ, предназначенную для диагностики и прогнозировании различных типов рака