Как это работает
Для выделения главного действующего лица на изображении используется нейронная сеть. Она создает «маску внимания» для каждого кадра видео и определяет релевантность каждого персонажа в течение рассматриваемого отрезка времени.
Работу алгоритма Google продемонстрировала на примере баскетбольного матча. В процессе обучения система искусственного интеллекта смогла определить не только игрока, который готовится сделать бросок из-под кольца, но и того, кто может ему помешать – и именно последний игрок является главным в текущий момент.
Лапы тигра
Системы распознавания образов раньше не умели выделять определенные объекты. К примеру, лапы тигра считались движущимися частями животного, а не отдельными объектами. Новая технология Google позволяет рассматривать их отдельно, определяя положение по отношению к телу. Даже если тигр сменит тип движения, к примеру, начнет взбираться на дерево после бега по лесу, система сможет продолжить отслеживание движений лап.
Выделение объектов нужных типов
Ещё одна технология позволит выделить на изображении объекты определенных типов – например, людей, которые держат в руках телефоны, или велосипеды с корзинками. Используя мощную систему захвата изображений и базовую логику, искусственный интеллект разбирает картинку на объекты и выделяет черты каждого из них.
Технология также работает на основе нейронной сети. Применяться она может практически в любых системах – от решений, которые могут найти на фото города пропавший автомобиль, до программ, скрывающих определенные объекты от глаз наблюдателя.
Похоже, операторы, режиссеры и спортивные судьи могут остаться без работы — за них всё сделает компьютер. Расскажите об этом друзьям — кнопки ниже!