
Приложение предлагает два варианта модели. E2B — быстрая и лёгкая, достаточно 1,5 ГБ оперативной памяти. E4B — мощнее, требует около 8 ГБ. Буква «E» расшифровывается как Effective: модели активируют только 2 или 4 миллиарда параметров в момент работы, даже если параметров физически больше. Это экономит память и заряд батареи.

В приложении есть чат с ИИ без интернета, анализ фото локально, транскрипция аудио офлайн, и мини-агент с инструментами. Обе модели обрабатывают текст, изображения, видео и голос прямо на устройстве. Контекстное окно — 128 тысяч токенов: модель удержит в памяти целую книгу и продолжит с ней работать без подключения к сети. Такое стало возможным благодаря совместной оптимизации с Qualcomm и MediaTek — Google заточила модели под нейронные блоки этих процессоров.
Помимо мобильных версий, в семейство Gemma 4 вошли старшие модели — 26B и 31B — для ноутбуков и рабочих станций с потребительскими видеокартами. Версия 31B занимает третью строчку в мировом рейтинге открытых моделей на Arena AI, 26B — шестую. При этом 26B построена на архитектуре Mixture of Experts: в работе активируются лишь 3,8 млрд из 26 млрд параметров, что даёт заметный прирост скорости.

Все четыре версии поддерживают 140+ языков, вызов внешних API, структурированный JSON и работу в автономных агентах. Google выпустила Gemma 4 под лицензией Apache 2.0 — без ограничений на коммерческое использование и без роялти.
Протестировать E4B можно через AICore Developer Preview. Для быстрого старта доступны Google AI Studio, Hugging Face, Ollama и LM Studio.
Также недавно Alibaba представила новую модель Qwen3.6-Plus. Подробности в статье.

