Команда Вашингтонского университета разработала систему искусственного интеллекта, которая позволяет пользователю в наушниках смотреть на говорящего человека в течение трех-пяти секунд, чтобы «зарегистрировать» его. Система, получившая название «Целевой речевой слух», затем подавляет все остальные звуки в окружающей среде и воспроизводит только голос зарегистрированного говорящего в реальном времени, даже когда слушатель перемещается в шумных местах и больше не смотрит на говорящего. Об этом пишет EurekAlert.
«Сейчас мы склонны думать об искусственном интеллекте как о веб-чат-ботах, которые отвечают на вопросы, — говорит старший автор исследования Шьям Голлакота, профессор Университета Вашингтона в Школе компьютерных наук и инженерии Пола Г. Аллена. — Но в этом проекте мы разрабатываем ИИ, который изменит слуховое восприятие любого, кто носит наушники, с учетом его предпочтений. Благодаря нашим устройствам вы теперь можете четко слышать одного говорящего, даже если находитесь в шумной обстановке, где разговаривает много других людей».
Чтобы воспользоваться системой, человек, носящий готовые наушники с микрофонами, нажимает кнопку, направляя голову на говорящего. Звуковые волны от голоса говорящего должны одновременно достигать микрофонов на обеих сторонах гарнитуры. Погрешность составляет 16 градусов. Наушники отправляют этот сигнал на бортовой встроенный компьютер, где программное обеспечение машинного обучения изучает вокальные образцы желаемого говорящего. Система фиксирует голос говорящего и продолжает воспроизводить его слушателю, даже когда слушатель и спикер перемещаются.
Способность системы концентрироваться на зарегистрированном голосе улучшается по мере того, как спикер продолжает говорить, предоставляя системе больше обучающих данных. Команда протестировала свою систему на 21 испытуемом. Участники испытаний оценили четкость голоса зарегистрированного говорящего и сказали, что слышат его почти в два раза лучше, чем нефильтрованный звук.
Работа основана на предыдущем исследовании команды по «семантическому слуху», которое позволило пользователям выбирать определенные классы звуков — например, голоса птиц или разговор людей — которые они хотели услышать, и глушить другие звуки в окружающей среде. Подробнее об этом исследовании Hi-Tech Mail.ru писал в другом материале.
В настоящее время система ученых может зарегистрировать только одного говорящего и только в том случае, если нет другого громкого голоса, доносящегося с того же направления, что и голос целевого говорящего. Если пользователя не устраивает качество звука, он может провести еще одну регистрацию динамика, чтобы улучшить четкость. Сообщается, что команда работает над расширением системы для легкой интеграции ее в разные наушники и слуховые аппараты в будущем.
Ранее дебютировали наушники Sonos Ace — конкурент AirPods Max. Новинка работает на одном заряде до 30 часов. Подключается по кабелю и по Bluetooth.