Можно подумать, что корпорация добра заново изобрела Google Объектив — инструмент, при помощи которого можно легко выполнять поиск по фото, распознавать и переводить текст. Тем не менее, это предположение верно лишь отчасти: Project Astra значительно расширяет возможности Объектива, предлагая совершенно новый уровень взаимодействия пользователя с ИИ.
Google Project Astra обрабатывает фотографии и видео в реальном времени, отвечая на любые вопросы пользователя. Система способна распознавать объекты, определять источник звука, проводить аналогии и на лету изучать назначение кода. Аналитические способности Project Astra поражают воображение: в ходе демонстрации модель смогла определить местоположение по виду из окна и даже разгадать загадку с котом Шредингера.
Наконец, Google продемонстрировала возможность работы Project Astra в носимом устройстве наподобие Google Glass — выглядит эта система вполне удобно, особенно если учитывать, что для ее работы достаточно одного лишь голосового запроса, сформулированного в произвольной форме.
Главной особенностью нового ИИ-инструмента, как и в случае с Gemini Live, о которой мы рассказывали ранее, станет полная мультимодальность: система способна работать с разными типами информации и отвечать на запросы пользователя практически мгновенно.
Примечательно, что именно повышение скорости работы, а не уровня интеллекта, становится главным приоритетом компаний в разработке ИИ-инструментов нового поколения. Это и логично, поскольку модели и так знают ответы и умеют рассуждать на большинство тем.