Apple раскрыла потенциал будущих ИИ-инструментов экосистемы

Компания опубликовала исследования, демонстрирующие ИИ-модели, которые могут создавать 3D-объекты всего из пары фотографий и анализировать видеопотоки в реальном времени без специальных команд.
Автор новостей
Apple Intelligence логотип
Apple IntelligenceИсточник: Freepik

Исследовательская команда Apple представила два новых инструмента искусственного интеллекта, которые могут существенно расширить возможности экосистемы Apple Intelligence. Модели Matrix3D и StreamBridge, описанные в недавних публикациях на официальном блоге Machine Learning, демонстрируют серьезный прогресс компании в области компьютерного зрения и обработки видео.

Matrix3D представляет собой универсальную модель для фотограмметрии — технологии создания трехмерных объектов из двумерных изображений. В отличие от традиционных методов, требующих сотни снимков, Matrix3D справляется с задачей, используя всего 2−3 фотографии. Это значительно упрощает процесс и открывает новые возможности для пользователей.

Модель Matrix3D особенности
Модель Matrix3DИсточник: Apple

Технология работает по принципу «все в одном», объединяя несколько этапов в единый процесс. Модель одновременно определяет глубину, положение объектов и синтезирует новые ракурсы благодаря унифицированной архитектуре. Такой подход не только ускоряет работу, но и повышает точность результатов.

При обучении Matrix3D разработчики использовали стратегию маскированного обучения. Модель тренировалась на частично заполненных данных о глубине и положении изображений, что заставляло ее самостоятельно восстанавливать недостающую информацию. Этот метод значительно улучшил способность системы работать с ограниченным количеством исходных данных.

Вторая модель, StreamBridge, фокусируется на работе с видео с инструментами, направленными на потоковый контент. StreamBridge анализирует видеопоток в реальном времени, отвечает на вопросы о происходящем и даже предлагает рекомендации без специальных запросов.

Модель StreamBridge особенности
Модель StreamBridgeИсточник: Apple

В демонстрационных примерах Apple показала, как модель отвечает на вопросы о событиях в видео, определяет местоположение и идентифицирует объекты. Более впечатляющая функция — проактивные инструкции. Например, система может давать пошаговые рекомендации во время рисования, не дожидаясь запроса от пользователя.

Хотя компания пока не анонсировала конкретные продукты на базе этих технологий, можно предположить их интеграцию в будущие обновления Apple Intelligence. StreamBridge может усилить возможности Siri или приложения «Камера», а Matrix3D — улучшить функциональность Apple Vision Pro и его преемников.

Также стало известно еще об одной разработке компании — звуковой терапии в Apple Music. Рассказали об этом в статье.