НовостиОбзорыВсе о нейросетяхБытовая техника 2024ГаджетыТехнологииНаукаСоцсетиЛайфхакиFunПромокодыСтранные вопросыЭксперты

Искусственный интеллект научился вычислять главного героя видео

30 июня 2016
Компания Google представила три новых технологии распознавания изображений на конференции, которая прошла в Лас-Вегасе. Самой интересной является технология выделения на видео главного действующего лица, сообщает TechCrunch.

Как это работает

Для выделения главного действующего лица на изображении используется нейронная сеть. Она создает «маску внимания» для каждого кадра видео и определяет релевантность каждого персонажа в течение рассматриваемого отрезка времени.

Работу алгоритма Google продемонстрировала на примере баскетбольного матча. В процессе обучения система искусственного интеллекта смогла определить не только игрока, который готовится сделать бросок из-под кольца, но и того, кто может ему помешать – и именно последний игрок является главным в текущий момент.

Лапы тигра

Системы распознавания образов раньше не умели выделять определенные объекты. К примеру, лапы тигра считались движущимися частями животного, а не отдельными объектами. Новая технология Google позволяет рассматривать их отдельно, определяя положение по отношению к телу. Даже если тигр сменит тип движения, к примеру, начнет взбираться на дерево после бега по лесу, система сможет продолжить отслеживание движений лап.

Выделение объектов нужных типов

Ещё одна технология позволит выделить на изображении объекты определенных типов – например, людей, которые держат в руках телефоны, или велосипеды с корзинками. Используя мощную систему захвата изображений и базовую логику, искусственный интеллект разбирает картинку на объекты и выделяет черты каждого из них.

Искусственный интеллект сможет детально описать изображение и найти на нем нужные объекты

Технология также работает на основе нейронной сети. Применяться она может практически в любых системах – от решений, которые могут найти на фото города пропавший автомобиль, до программ, скрывающих определенные объекты от глаз наблюдателя.

Похоже, операторы, режиссеры и спортивные судьи могут остаться без работы — за них всё сделает компьютер. Расскажите об этом друзьям — кнопки ниже!