Google представила Genie 3, универсальную «модель мира», которая способна создавать беспрецедентное разнообразие интерактивных сред в режиме реального времени. Для этого нейросети достаточно дать текстовое описание или изображение. Максимальное доступное качество создаваемых миров ограничивается только разрешением — 720p при 24 кадр/с.
Что известно о Google Genie 3
Важным новшеством в Genie 3 стала расширенная память. Если выпущенная всего 7 месяцев назад Genie 2 удерживала визуальную целостность генерированной среды всего 10 секунд, то у Genie 3 этот показатель измеряется уже минутами. То есть предметы и локации не изменяются даже после того, как пропадают из виду пользователя, и к ним можно вернуться.
Вторым ключевым улучшением стала возможность модификации миров в режиме реального времени. С помощью текстовых команд позволяется добавление новых объектов, изменение погодных условий, создание персонажей
Наконец, Genie 3 подросла и в качестве генерируемых локаций. Теперь это не 360p, а полноценное HD-разрешение с частотой 24 кадр/с. Однако ограничения у новой модели имеются, и это невозможность воссоздания реальных мест в виртуальной реальности. Все, что генерирует нейросеть, является уникальным и недетерминированным. Также есть и классические «галлюцинации» в виде некорректно воссоздаваемой походки человека или нечитаемого текста.
Доступность Genie 3
Пока что модель является закрытой. В скором времени Google намерена открыть доступ к нейросети ограниченному числу экспертов и исследователей для ее усовершенствования. Возможно, после апгрейда компания предоставит доступ к разработке более широкому кругу лиц.
Ранее OpenAI выпустила две бесплатные нейромодели с открытым исходным кодом и локальным запуском.

