Ты узнаешь его из тысячи: компьютер сможет распознавать голоса в толпе

Новый алгоритм распознавания речи работает благодаря комбинации анализа звуков и «чтения по губам». Нейросеть сможет выделять отдельного человека из группы и отслеживать только то, что он говорит.

Специалисты Google создали комбинацию двух алгоритмов: анализа мимики людей и обработки звуковых сигналов. Нейросеть сопоставляет звук с движениями губ человека, и найдя нужный «звуковой канал», работает только с ним, игнорируя все остальные.

Искусственный интеллект умеет не только «читать по губам», но и отличать говорящего человека от смеющегося, а также распознавать мимику, если губы человека частично скрыты. Благодаря этому новая нейросеть Google способна правильно определить речь одного конкретного человека, даже если испытуемые пытаются ее запутать.

Новая разработка нужна не для слежки за людьми. Создатели утверждают, что нейросеть поможет людям с проблемами слуха лучше различать слова собеседника, а также улучшить связь в видеочатах. Помимо этого, новый алгоритм хотят использовать в усовершенствовании систем голосовой защиты.

Это тоже интересно:

ИИ от Google заговорил человеческим голосом. Отличить невозможно