
Вентральная область покрышки (ventral tegmental area, VTA) — это небольшой участок мозга, который считается одним из ключевых звеньев системы мотивации и вознаграждения. Именно здесь вырабатывается дофамин — нейромодулятор, который помогает мозгу предугадывать, какие действия принесут вознаграждение, основываясь на обусловленных контекстом ситуации сигналах. Но новое исследование ученых из Университета Женевы, Гарварда и Университета Макгилла показало, что функции VTA значительно шире. Она не только кодирует факт ожидаемого вознаграждения, но и точно предсказывает момент, когда оно должно наступить.
До 1990-х годов считалось, что VTA напрямую связана с ощущением удовольствия. Однако последующие исследования изменили это представление: оказалось, что она не столько отвечает за само чувство, возникающее из-за награды, сколько кодирует предсказание ее получения. Например, если за световым сигналом регулярно следует вознаграждение, со временем VTA начинает вырабатывать дофамин не в момент его получения, а сразу после сигнала. То есть мозг фиксирует не само событие, а его вероятность — именно на этом основан механизм так называемого «обучения с подкреплением». Этот процесс лежит в основе не только нашего поведения, но и алгоритмов искусственного интеллекта которые тоже совершенствуют свои действия путем проб и ошибок.

Новое исследование продвигает это понимание еще дальше. Ученые обнаружили, что VTA не просто оценивает вероятность получения награды, но кодирует точное время ее получения. Иными словами, каждый ожидаемый «приз» представлен в мозге отдельно, с привязкой к конкретному моменту его появления. Исследователи выявили, что различные нейроны VTA работают на разных временных шкалах: одни фокусируются на ближайшем будущем — в пределах нескольких секунд, другие предсказывают награду через минуту, третьи — в еще более отдаленной перспективе. Такая временная дифференциация позволяет мозгу гибко подстраивать поведение в зависимости от текущих целей: иногда важнее получить что-то немедленно, а иногда стоит подождать ради большего выигрыша в будущем.
Для того чтобы прийти к таким выводам, ученые объединили два подхода: математическое моделирование и анализ нейрофизиологических данных. Команда из Университета Женевы под руководством профессора Александра Пужэ разработала алгоритм, способный учитывать временные параметры ожидания вознаграждения. Специалисты из Гарварда тем временем собирали обширные данные о работе VTA у животных. Сравнение теоретических расчетов с реальной нейрофизиологией показало поразительное совпадение, которое подтвердило верность математической модели.

Открытие ученых не только расширяет наше представление о работе мозга, но и подчеркивает, как мощным инструментом для нейронауки может быть искусственный интеллект. Если раньше специалисты, обучавшие ИИ, опирались на имеющиеся у них знания о работе человеческого мозга, то теперь наступил новый этап — когда алгоритмы искусственного интеллекта помогают нам глубже понять природу человеческого мышления и мотивации.
Ранее ученые объяснили, почему, когда мы занимаемся спортом, время замедляется.