
Генетический анализ стал востребованной услугой последних 10−15 лет не только для медицинских целей, но и для изучения собственного происхождения. Исследование ДНК помогает установить этническую принадлежность, проследить маршруты миграции предков и выявить наличие неандертальских генов. Такая доступность стала возможной благодаря прогрессу в технологиях генотипирования, обработке больших объемов данных и снижению цен на услуги. Тем не менее нынешние методики не обеспечивают четкого различия между близкородственными популяциями, жившими на соседних территориях длительное время, говорится на сайте Десятилетия науки и технологий в России.
Специалисты Института ИИ и цифровых наук НИУ ВШЭ создали методику, способную определять происхождение индивидов из близких популяций. Метод основывается на применении графовых нейронных сетей, обрабатывающих не сами последовательности ДНК, а графы взаимосвязей между индивидуумами, имеющими общие участки генома. Эти участки показывают уровень родственной близости между людьми и помогают определить, насколько давно жил общий предок. Большее количество совпадающих участков свидетельствует о большей степени родства. Вершины в модели соответствуют человеку, а ребра отражают степень родственного сходства между ними.

Разработанный метод прошел тестирование на выборках из различных регионов, показав особенно впечатляющие результаты на материалах населения Восточно-Европейской равнины, где уже существует обширная база данных. По словам экспертов, графовая нейросеть успешно выявила популяционные принадлежности даже среди крайне схожих генетически народов.
«Существующие методы генетического анализа решают иную задачу: они определяют принадлежность к крупным изолированным популяциям, например определяют, у кого в роду были французы, у кого немцы, у кого англичане. Наш метод позволяет работать с близкородственными популяциями, что особенно актуально для России, исторически многонациональной страны», — объясняет Алексей Шмелев, один из авторов работы, стажер-исследователь Международной лаборатории статистической и вычислительной геномики Института ИИ и цифровых наук ФКН НИУ ВШЭ.
Команда ученых намерена расширить возможности нейросети, научив ее вычислять долю каждой конкретной популяции в геноме индивида. Перспективная разработка получила название AncestryGNN («Нейросетевое предсказание популяционной принадлежности по общим сегментам генома»)
Ранее мы рассказали, как ИИ перехитрил 30 лучших математиков мира на тайном собрании в США.

