Нейросеть нарисовала геномы животных и растений в режиме 3D

Почему ДНК человека и дрожжей «складывается» по-разному? Российская нейросеть нашла неожиданные законы архитектуры генома.
Автор Hi-Tech Mail
Графический экстракт
Графический экстракт исследования в рецензируемом журнале.Источник: Новости РАН

Биоинформатики из России разработали нейросеть Chimaera, которая смогла не только предсказывать трехмерную структуру генома, но и выявлять правила его пространственной организации у самых разных живых существ — от дрожжевых грибов и примитивных растений до человека. Исследование опубликовано в журнале Nucleic Acids Research.

Не просто «запутанный клубок»

ДНК в клетке не лежит хаотично: она формирует сложную трехмерную архитектуру, влияющую на активность генов. Ученые давно знают о существовании характерных структур — петель, полос, «фонтанов» и зон изоляции. Однако оставалось неясным, одинаковы ли механизмы их формирования у разных видов.

Краткое описание Chimaera
Краткое описание Chimaera, сверточной нейронной сети для прогнозирования карт Hi-C с использованием автоэнкодера для представления карт. Каждая серая линия соответствует прямому проходу одного входного сигнала (ДНК или карты Hi-C) через сеть. На схематических изображениях представлена схема обучения (A, B) и три основных способа использования Chimaera в этой работе: высокочастотное предсказание по последовательности ДНК (C, G), поиск и количественная оценка паттернов (D, E) и интерпретация ассоциаций последовательности ДНК/трехмерного генома (F). Источник: https://academic.oup.com/

Команда российских исследователей проанализировала данные различных тканей 22 организмов, включая:

Нейросеть обучали на последовательностях ДНК и картах пространственной организации генома. В результате модель научилась распознавать закономерности сворачивания хроматина и предсказывать структуру генома по одной лишь последовательности ДНК.

Шпорцевая лягушка
Класс земноводных в эксприментах представляла когтистая шпорцевая лягушкаИсточник: https://commons.wikimedia.org/

У каждого вида — своя «упаковка»

Главным выводом работы стало то, что механизмы трехмерной организации генома оказались видоспецифичными. Иначе говоря, похожие структуры у разных организмов могут возникать по совершенно разным биологическим причинам и принимать разные стереометрические формы.

Нейросеть также обнаружила связь между некоторыми паттернами и особенностями ДНК. Например, области генома с высокой изоляцией чаще содержали GC-пары — сочетания нуклеотидов гуанина и цитозина. Кроме того, выяснилось, что на пространственную упаковку влияет не только расположение генов, но и направление их считывания.

На основе найденных закономерностей ученые даже построили своеобразное «эволюционное дерево» трехмерной организации генома — от растений до млекопитающих.

Лабораторные мыши
Млекопитающих представляли люди и лабораторные мышкиИсточник: Unsplash

Современные нейросети все активнее применяются в биологии. В 2024 году Нобелевскую премию по химии получили исследователи, создавшие ИИ-системы для предсказания структуры белков. А в 2026 году ученые Массачусетского технологического института показали, что пространственное сворачивание ДНК напрямую влияет на работу генетических цепей и активность генов.

Еще одна тенденция — развитие так называемого «прозрачного ИИ», когда алгоритмы не просто выдают результат, а позволяют понять, почему модель приняла то или иное решение. Российские исследователи отдельно подчеркивают, что Chimaera можно интерпретировать, а значит — использовать для поиска фундаментальных биологических закономерностей.

Резуховидка Таля
От царства растений участие приняла незаменимая резуховидка ТаляИсточник: Wikimedia

Недавно ученые выяснили, что бактерии умеют синтезировать ДНК-пустышки для обмана вирусов.