
Российская IT-корпорация запустила в своем чат-боте инструмент для работы с изображениями. Новая функция доступна как в веб-версии сервиса, так и в Telegram-боте.
В основе решения лежит модель Malvina (Multimodal Artificial Language VIsion Neural Assistant), которая редактирует снимки принципиально иначе, чем западные аналоги. Если GPT-4o и Gemini создают картинку заново, то российская разработка изменяет только указанные пользователем области.
Такой подход сохраняет детали оригинала и работает быстрее. Система анализирует изображение попиксельно и вносит коррективы исключительно в нужных местах. По внутренним тестам компании, Malvina превосходит конкурентов по качеству обработки.
Редактор справляется с широким спектром задач. Пользователи могут убирать лишние предметы из кадра, заменять задний план, добавлять новые элементы или изменять внешность людей на фото. Особенно полезна функция для реставрации старых снимков и колоризации архивных кадров.

Интерфейс максимально прост: достаточно загрузить картинку и написать текстовую команду. Например, «убери машину с дороги» или «сделай так, чтобы девушка держала помаду». Система понимает естественный язык и выполняет запросы без дополнительных настроек.
Команда разработчиков планирует расширить функционал редактора в ближайшие месяцы. В планах добавление инструментов для работы с видео, улучшение алгоритмов распознавания объектов и интеграция с другими продуктами экосистемы Сбера.

Особый интерес представляет возможность обучения модели на специфических задачах. Компания рассматривает создание отраслевых версий для медицины, архитектуры и промышленного дизайна. Такой подход позволит адаптировать технологию под конкретные потребности профессиональных сообществ.
Также редактор изображений на этой неделе появился в Google Фото. Обновление приурочено к десятилетию приложения. Рассказали об это в статье.