Ты узнаешь его из тысячи: компьютер сможет распознавать голоса в толпе

Новый алгоритм распознавания речи работает благодаря комбинации анализа звуков и «чтения по губам». Нейросеть сможет выделять отдельного человека из группы и отслеживать только то, что он говорит.

Специалисты Google создали комбинацию двух алгоритмов: анализа мимики людей и обработки звуковых сигналов. Нейросеть сопоставляет звук с движениями губ человека, и найдя нужный «звуковой канал», работает только с ним, игнорируя все остальные.

Искусственный интеллект умеет не только «читать по губам», но и отличать говорящего человека от смеющегося, а также распознавать мимику, если губы человека частично скрыты. Благодаря этому новая нейросеть Google способна правильно определить речь одного конкретного человека, даже если испытуемые пытаются ее запутать.

Новая разработка нужна не для слежки за людьми. Создатели утверждают, что нейросеть поможет людям с проблемами слуха лучше различать слова собеседника, а также улучшить связь в видеочатах. Помимо этого, новый алгоритм хотят использовать в усовершенствовании систем голосовой защиты.

Это тоже интересно: