
Технология базируется на совместной работе двух нейросетей Сбера. GigaChat анализирует входящую информацию и создает текстовое содержание, а нейросеть Kandinsky генерирует уникальные изображения по описаниям. Мультимодальная архитектура позволяет системе глубоко понимать контекст запросов и обрабатывать разные типы данных одновременно.
Процесс создания презентации разбит на несколько этапов. Сначала пользователь задает тему и может приложить документы или ссылки на дополнительную информацию. Затем GigaChat анализирует запрос и формирует структуру будущей презентации.

На следующем шаге нейросеть создает заголовки для слайдов — каждый не длиннее четырех слов. После этого система генерирует текстовое содержание для каждого слайда, опираясь на созданные заголовки и исходное описание темы. Параллельно GigaChat формулирует детальные запросы для создания изображений, учитывая контекст всей презентации.
Нейросеть Kandinsky получает эти текстовые описания и рисует подходящие иллюстрации или фоны для слайдов. Финальный этап — сборка всех элементов в единую презентацию с помощью специальных алгоритмов.
Готовую презентацию можно сразу отредактировать в интерфейсе GigaChat или скачать в формате PowerPoint (pptx) и PDF. Система позволяет корректировать как текстовое содержание, так и визуальные элементы прямо в браузере. При необходимости файл можно открыть на компьютере и доработать в привычных программах.

Разработчики активно совершенствуют функцию. В ближайшее время планируется добавить поддержку большего количества форматов файлов и расширить работу с различными источниками информации. Также команда работает над отраслевыми шаблонами для разных сфер бизнеса и интеграцией инструментов визуализации данных, включая создание сложных графиков и диаграмм.
Также ранее корпорация ранее представила новые кольца Sber. Подробности в статье.

