Google представила «лучшую в мире» компактную нейросеть

Новая разработка корпорации обещает вывести небольшие нейросети на новый уровень. Компания утверждает, что ее новая модель Gemma 3 не только мощнее, но и эффективнее всех аналогов.
Автор новостей
логотип Google Gemma 3
Gemma 3Источник: Google

Google анонсировала третью версию своей открытой модели Gemma, предназначенную для работы непосредственно на устройствах. Новая нейросеть ориентирована на разработчиков, которые создают локальные решения с ИИ без необходимости обращения к облачным вычислениям. Благодаря высокой скорости работы и низким вычислительным требованиям Gemma 3 превосходит другие компактные модели, оставаясь при этом доступной и гибкой в использовании.

Чем отличается Gemma 3

Главное новшество — улучшенные возможности анализа текста, изображений и видео. В частности, модели от 4B и выше способны не только обрабатывать текст, но и анализировать визуальную информацию. Расширенное контекстное окно в 128 тысяч токенов позволяет модели запоминать и учитывать значительно больше информации, чем предшественники.

Сравнение Gemma 3 с другими моделями
На диаграмме модели ИИ ранжированы по баллам Chatbot Arena Elo; более высокие баллы (верхние цифры) указывают на предпочтения пользователей. Точками показаны предполагаемые требования к GPU NVIDIA H100. Gemma 3 27B занимает высокое место, требуя всего один GPU, в то время как другим требуется до 32.Источник: Google

Кроме того, Gemma 3 поддерживает более 35 языков сразу после установки и способна работать с 140 языками после дополнительной настройки. Это делает ее универсальным инструментом для глобальных приложений.

Производительность на одном ускорителе

Google заявляет, что Gemma 3 — «лучшая в мире модель» среди нейросетей, которые работают на одном графическом процессоре (GPU) или тензорном процессоре (TPU). В тестах она превзошла такие известные модели, как DeepSeek-V3 и o3-mini. Это означает, что разработчики могут запускать мощные ИИ-приложения даже на стандартном оборудовании без дорогостоящих серверов.

Nvidia Hopper H100 GPU Logic Board в руке
Nvidia Hopper H100 GPU Logic BoardИсточник: UJoy

Оптимизация и безопасность

Важное обновление — поддержка квантованных версий моделей, которые снижают нагрузку на вычислительные мощности без потери точности. Это позволяет использовать Gemma 3 даже на устройствах с ограниченными ресурсами.

Кроме того, Google внедрила систему ShieldGemma 2 — инструмент для проверки изображений на наличие запрещенного контента. Она анализирует изображения по трем категориям: опасный контент, сцены насилия и откровенные материалы. Это дополнение делает Gemma 3 не только мощной, но и безопасной для использования в различных средах.

Где можно использовать Gemma 3

Google предлагает несколько способов работы с моделью. Разработчики могут использовать Gemma 3 в облаке через Vertex AI, запускать ее в локальных средах или интегрировать в мобильные и десктопные приложения. Поддержка популярных инструментов, таких как Hugging Face Transformers, PyTorch и Google AI Studio, упрощает ее адаптацию под конкретные задачи.

С выходом Gemma 3 Google делает очередной шаг к распространению мощных, но доступных нейросетей. Высокая производительность, поддержка множества языков, расширенные функции безопасности и удобная интеграция делают ее привлекательным выбором для разработчиков. Теперь перед ИИ-индустрией открываются новые возможности для локального использования нейросетей без необходимости в мощных дата-центрах.

Также компания тестирует новые ИИ-функции в собственном поисковике, рассказали об этом в статье.