Нейроинтерфейсы: как управлять гаджетами силой мысли уже сегодня

Когда-то казалось, что управлять компьютером или протезом силой мысли можно только в кино. Сегодня это уже реальность. Разбираемся, как устроены нейроинтерфейсы — устройства, которые считывают мозговую активность пользователя — и где они применяются.
Научный сотрудник Сколковского института науки и технологий
Об эксперте: Гурген Согоян — научный сотрудник Сколтеха, приглашенный лектор МГУ, научный координатор проектов очувствления протезов. Рассказывает об интерфейсах «мозг — компьютер», нейрореабилитации, умных протезах с тактильной обратной связью, устройстве мозга.

Нейроинтерфейсы — это системы, которые позволяют человеку взаимодействовать с устройствами через сигналы мозга". Они считывают нервную активность и преобразуют её в команды для управления роботизированными протезами, курсором компьютера или даже инвалидной коляской.

Нейроинтерфейсы необходимы прежде всего людям с нарушениями опорно-двигательного аппарата, речи или других функций, утраченных в результате инсульта, травм спинного или головного мозга, ДЦП и других неврологических заболеваний. Они позволяют таким пациентам частично вернуть контроль над внешним миром. Кроме того, нейроинтерфейсы используются для реабилитации — запускают нарушенные нейрональные цепочки работы мозга и тем самым ускоряют восстановление после повреждений. В перспективе — и частично уже сейчас — такие технологии могут быть полезны и здоровым людям, например для управления устройствами, когда руки заняты.

Как работают нейроинтерфейсы

На практике нейроинтерфейсы устроены значительно сложнее, чем может показаться. Их работа начинается с регистрации сигнала мозга. Например, электрический сигнал можно считать с помощью электроэнцефалографии.

Чаще всего для записи активности мозга используют электроды, которые можно прикладывать к поверхности головы, а можно имплантировать непосредственно в мозг. Оба метода фиксируют электрическую активность мозга, но имеют принципиальные различия. Первый подход относится к неинвазивным технологиям — они безопаснее для пользователя, но дают более зашумлённый сигнал из-за прохождения через кожу, череп и другие ткани. Вторая методика, инвазивная, имеет сугубо медицинское назначение, так как требует операции для помещения датчиков в тело. Такой подход обеспечивает высокое качество и точность сигнала, так как регистрируется активность прямо из нейронных структур.

Врач устанавливает сканирующее устройство на голову пациентки
Врач устанавливает сканирующее устройство на голову пациенткиИсточник: https://ru.freepik.com

Полученные сигналы подчищают, а дальше алгоритмы машинного обучения ищут в них характерные паттерны, которые указывают на определённые ментальные состояния или намерения пользователя — например, попытку пошевелить рукой, ощущение боли или выбор одного из нескольких символов.

Дальше, исходя из распознанного состояния, выбирается команда и передаётся на внешнее устройство. Например, включается программа обезболивания, шевелится протез, компьютер выполняет то или иное действие.

Сегодня учёные и инженеры по всему миру работают над созданием нейроинтерфейсов нового поколения — более точных, быстрых и гибких. Идеальный интерфейс должен улавливать сигналы мозга с максимальной достоверностью, интерпретировать их с минимальной задержкой и выходить за рамки ограниченного набора команд, постепенно переходя к более естественному и непрерывному взаимодействию между человеком и машиной.

От медитации до нейропротезов: где уже работают нейроинтерфейсы

Интерфейсы «мозг — компьютер» звучат как технология будущего, но они уже сегодня находят применение в коммерческих и исследовательских продуктах. Первые коммерческие устройства на основе регистрации мозговой активности появились ещё в начале 2000-х годов. Их возможности были ограничены, но именно они положили начало рынку потребительских нейротехнологий.

Особый интерес к теме подогрел проект Neuralink, основанный Илоном Маском 21 июня 2016 года. Компания заявила о разработке инвазивного интерфейса с гибкими микроэлектродами, вживляемыми прямо в мозг. Такие системы рассчитаны на высокоточное считывание нейронных сигналов и потенциально могут вернуть парализованным пациентам возможность управлять компьютером или роботизированным протезом. До Neuralink нейроинтерфейсы разрабатывались десятилетиями, в том числе в университетских и медицинских центрах, но редко выходили за рамки научного и инженерного сообщества. Пресс-конференции Neuralink, особенно в 2020 и 2022 годах, стали вирусными, попали в заголовки всех крупных мировых СМИ и вызвали всплеск интереса со стороны широкой аудитории.

Тем временем на рынке уже сегодня доступны более простые потребительские неинвазивные интерфейсы, работающие на основе электроэнцефалографии (ЭЭГ). Самым известным паттерном мозговой активности, используемым в таких устройствах, является альфа-ритм — колебания с частотой 8−13 Гц, усиливающиеся в состоянии расслабления. Его впервые описал в 1920-х годах немецкий психиатр Ганс Бергер, основоположник ЭЭГ.

Альфа-ритм используется в таких потребительских устройствах, как повязки на голову для медитации. ЭЭГ-датчики отслеживают изменения альфа-колебаний, интерпретируют их в режиме реального времени как степень расслабления и дают пользователю обратную связь, например в виде звукового фона, который становится тише или гармоничнее по мере расслабления. Это создаёт своего рода «зеркало мозга», позволяющее регулировать своё состояние.

Схожий принцип лежит в основе нейроигры «Майндбол», созданной в Швеции в начале 2000-х. В ней нужно закатить шарик в ворота соперника на противоположном конце стола «силой мысли». Для этого нужно расслабиться больше, чем оппонент. Расслабление в этом случае тоже связывают с изменением альфа-ритма.

В более ранних экспериментах предпринимались попытки создать устройство для коммуникации на основе альфа-ритма — перекодировать расслабление и напряжение в точки и тире по принципу азбуки Морзе. Но идея не сработала, потому что альфа-ритмом не так уж и просто управлять.

Современные интерфейсы пошли дальше: они опираются на более надёжные и быстрые нейросигналы. Один из них — потенциал P300, возникающий через 300 миллисекунд после того, как человек замечает значимый стимул. P300 применяется в управлении устройствами для ввода текста или навигации в меню программы. Допустим, пользователь смотрит на таблицу с кнопками и концентрируется на одной из них. Если эта кнопка внезапно мигнёт, то примерно через 0,3 секунды в мозге возникнет характерный отклик — потенциал P300. «Подмигивая» пользователю разными столбцами и строками таблицы, система довольно быстро находит на их пересечении нужную кнопку. Этот принцип используется в устройстве «Нейрочат» российской компании «Нейротренд», а также в разработках для реабилитации после инсульта моих коллег Николая Сырова и Льва Яковлева из Центра нейробиологии и нейрореабилитации имени Владимира Зельмана Сколтеха.

Существуют также интерфейсы, использующие стимулы с разной частотой. Представим, что в одном ряду расположено три объекта, которые мигают с частотой 6 Гц, 10 Гц и 15 Гц. Если пользователь фокусируется, например, на объекте с частотой 6 Гц, то и в его мозге усиливается активность на этой частоте. Так можно определить, куда направлено внимание. Причём стимулы могут быть не только визуальными, но и звуковыми или тактильными — например, ритмичные вибрации.

Наконец, некоторые нейроинтерфейсы работают на основе мю-ритма, который локализован в центральных областях мозга (лобной и теменной долях) и сильно выражен в состоянии физического покоя. Этот ритм подавляется, когда человек совершает движение или даже просто представляет его. По характеру подавления нейроинтерфейс может «понять», какое именно движение совершает, наблюдает или воображает пользователь, и использовать эту информацию для управления виртуальной конечностью, протезом или экзоскелетом. Такие интерфейсы активно исследуются в Сколтехе и находят применение в нейрореабилитации и управлении сложными роботизированными системами.

Нейропротез руки
Нейропротез рукиИсточник: Сколтех. Фотограф: Павел Жданов

Новые горизонты нейроинтерфейсов

Современные нейроинтерфейсы всё чаще переходят от простого распознавания команд к более тонкой и гибкой интерпретации намерений пользователя. Это означает, что человек не выбирает из заранее заданного набора действий, а формирует произвольный образ, который сопровождается характерным сигналом, и система учится его воспринимать. Это важный сдвиг — от реакции на стимул к декодированию спонтанной активности мозга.

Одним из наиболее перспективных подходов в этой области является использование моторного декодирования. В экспериментах с участием пациентов с электродами, имплантированными в моторную кору головного мозга, удалось продемонстрировать, что по мозговой активности можно различать буквы, которые человек либо реально пишет рукой, либо лишь воображает, что пишет. В результате это может позволить вводить текст «силой мысли», что может стать альтернативой клавиатуре для людей с тяжёлыми двигательными нарушениями.

Похожий принцип используют и для распознавания зрительных образов. Если электроды находятся в зрительной коре, пользователь может, например, представить себе дом — и система по сигналам мозга попробует реконструировать то, что он видит в своём воображении. Такие эксперименты уже проводятся, и хотя качество изображений пока далеко от идеального, в целом уже удаётся передать общее содержание мысленного образа.

Ещё одно быстро развивающееся направление — распознавание речи. Системы учатся интерпретировать нейронную активность, связанную с произношением слов, даже если они озвучиваются не вслух, а лишь «внутренним голосом». В одном из экспериментов с участием пациента с амиотрофическим латеральным склерозом учёные записали десятки часов попыток пациента произнести определённые фразы, а затем обучили нейросеть распознавать предполагаемый текст. Предсказания нейроинтерфейса дополнялись подсчётами большой языковой модели (наподобие ChatGPT), что позволило восстановить связные и грамматически правильные высказывания. Это даёт шанс на коммуникацию людям, утратившим способность говорить.

Есть и попытки распознавать эмоциональное состояние человека по активности мозга. Это особенно интересует маркетологов: они надеются понять, как человек воспринимает продукт, рекламу или фильм. Однако на практике для этих задач эффективнее работает айтрекинг — технология, отслеживающая, куда смотрит пользователь, на чём фокусирует внимание, что его привлекает, а что — нет. Она использует инфракрасные камеры и датчики, которые фиксируют движение глаз и направление взгляда. Мы используем такие системы, чтобы оценивать, насколько эффективно используется протез.

Применение нейроинтерфейсов в медицине может идти и по более классическому сценарию. Например, интерфейсы «мозг — компьютер» могут предсказать приближающийся эпилептический приступ по характерным изменениям мозговой активности. Подобная технология развивается в России. Также интерфейсы помогают исследовать сон: они позволяют точно определять фазы сна и выявлять нарушения, что важно при диагностике бессонницы и других расстройств.

Одно из интересных направлений, которое обсуждается всё более активно, — работа с пациентами в состоянии комы. Сегодня такие состояния оценивают по движениям, рефлексам и данным МРТ, но этого бывает недостаточно. С помощью нейроинтерфейсов можно получить дополнительную информацию: например, оценивать динамику активности коры, в том числе в момент попытки коммуникации с пациентом. Это может стать способом общения с пациентами, которые не могут говорить или двигаться, но сохраняют сознание.

Нейроинтерфейсы перестают быть лабораторными экспериментами и становятся реальными инструментами — для восстановления движений, альтернативной коммуникации и управления устройствами без рук. Следующий этап — сделать эти технологии массовыми, надёжными и интуитивно понятными. И это уже не фантастика, а вопрос ближайших лет.