Анонсирована Google Genie 3: нейросеть для генерации реалистичных 3D-игр (видео)

С Genie 3 компания Google сделала большой вперед в области виртуальных сред: высокое разрешение, модификация мира в реальном времени и расширенная память.
Автор Hi-Tech Mail

Google представила Genie 3, универсальную «модель мира», которая способна создавать беспрецедентное разнообразие интерактивных сред в режиме реального времени. Для этого нейросети достаточно дать текстовое описание или изображение. Максимальное доступное качество создаваемых миров ограничивается только разрешением — 720p при 24 кадр/с.

Что известно о Google Genie 3

Важным новшеством в Genie 3 стала расширенная память. Если выпущенная всего 7 месяцев назад Genie 2 удерживала визуальную целостность генерированной среды всего 10 секунд, то у Genie 3 этот показатель измеряется уже минутами. То есть предметы и локации не изменяются даже после того, как пропадают из виду пользователя, и к ним можно вернуться.

Вторым ключевым улучшением стала возможность модификации миров в режиме реального времени. С помощью текстовых команд позволяется добавление новых объектов, изменение погодных условий, создание персонажей и т. д. Называется эта функция дословно «события, вызываемые запросом». И все это с учетом реальной физики процессов.

Наконец, Genie 3 подросла и в качестве генерируемых локаций. Теперь это не 360p, а полноценное HD-разрешение с частотой 24 кадр/с. Однако ограничения у новой модели имеются, и это невозможность воссоздания реальных мест в виртуальной реальности. Все, что генерирует нейросеть, является уникальным и недетерминированным. Также есть и классические «галлюцинации» в виде некорректно воссоздаваемой походки человека или нечитаемого текста.

Доступность Genie 3

Пока что модель является закрытой. В скором времени Google намерена открыть доступ к нейросети ограниченному числу экспертов и исследователей для ее усовершенствования. Возможно, после апгрейда компания предоставит доступ к разработке более широкому кругу лиц.

Ранее OpenAI выпустила две бесплатные нейромодели с открытым исходным кодом и локальным запуском.