LLM переходят от подсказок к собственным стратегиям. Нейроновости недели

Аналитический центр red_mad_robot рассказывает и комментирует главные новости из мира искусственного интеллекта за неделю с 17 по 23 ноября.
Старший стратегический аналитик red_mad_robot

Google анонсировала сразу несколько крупных релизов

Gemini 3
Источник: Google

Google выпустил Gemini 3, платформу для разработки агентов Antigravity, а также Nano Banana Pro на базе Gemini 3, которую интегрировали в NotebookLM.

Такие релизы показывают стратегическую перезагрузку позиций Google в AI-индустрии. Gemini 3 может стать катализатором нового поколения прикладных решений.

Почему это важно: модели OpenAI ещё остаются на фронтире, но их преимущество сокращается, а Gemini 3 может стать катализатором нового поколения прикладных решений. LLM получила высокую оценку даже от конкурентов. Например, Сэм Альтман признал, что релизы Google могут создать трудности для OpenAI.

Новая модель от OpenAI

OpenAI
Источник: Unsplash

OpenAI запустила GPT-5.1-Codex-Max версию GPT-5.1 Thinking. Это модель для разработки, улучшенная для многочасового рефакторинга и сложных IDE-циклов. Она достигла 77,9% в SWE-Bench Verified и почти 80% в SWE-Lancer.

Почему это важно: производительность в кодинге по-прежнему остаётся одной из редких сфер, где Google уступает OpenAI. Рост качества в SWE-бенчмарках и способность поддерживать 24-часовые сессии кодирования говорят о том, что компании смогут автоматизировать существенную часть рутинного и legacy-кода.

Обновленный GigaChat

GigaChat

Сбер представил голосовой режим в GigaChat и открыл доступ к семейству моделей GigaChat и Kandinsky 5.0

Почему это важно: Сбер, как и OpenAI, сделал шаг в сторону open-source-сообществ. Открыв модели, банк включает внешних разработчиков в эволюцию своей AI-экосистемы. Такой подход повышает скорость доработок, расширяет пул реальных сценариев и помогает ускорить конкуренцию внутри российского рынка.

NVIDIA предоставила доступ к семейству моделей

NVIDIA
Источник: NVIDIA

NVIDIA предоставила доступ к семейству моделей для физических симуляций и научных расчетов.

Почему это важно: В научных и промышленных задачах прогресс AI сейчас наиболее ощутим. Анонс NVIDIA подтверждает, что модели готовы приносить ценность в реальных инженерных и производственных процессах.

xAI выпустила Grok 4.1

Grok 4.1
Источник: xAI

xAI выпустила Grok 4.1 — обновленную версию модели на базе Grok 3 с 3 трлн параметров. Компания сфокусировалась на повышении эмоционального интеллекта и снижении галлюцинаций.

Почему это важно: это еще один ход xAI в гонке AI — на этот раз за счет усиления креативности и эмоциональной выразительности. Именно эти качества могут оказывать на пользователей более заметное воздействие, чем просто рост интеллектуальных возможностей или прогресс в кодинге.

MIT рассказал про новый фреймворк

Кампус Массачусетского технологического института выглядит замысловато.
Источник: Соцсети

MIT — Массачусетский технологический институт — рассказал про новый фреймворк, в котором задачи абстрактного мышления пытаются решить не с помощью токенов, а через компьютерное зрение.

Почему это важно: подход MIT фиксирует важный тренд — сложные когнитивные задачи требуют специализированных архитектур, а не только более крупных LLM. Использование CV как основы для абстракции может стать отдельной веткой развития reasoning-моделей.

Microsoft показала AI-слой для корпораций

microsoft
Источник: unsplash

Microsoft показала AI-слой для корпораций, добавил агентные возможности в Office и Teams и представил платформу для управления и регулирования работы агентов.

Почему это важно: Microsoft стремится дать организациям полноценную инфраструктуру для масштабирования AI-агентов без потери контроля. Компания решает ключевые барьеры — безопасность, управление и прозрачность, которые до сих пор сдерживали внедрение таких систем.

ByteDance, Yale, NYU и Tsinghua представили AlphaResearch

Почему искусственный интеллект вызывает споры: возможности, риски и мнение экспертов
Источник: rg_ru

ByteDance, Yale, NYU и Tsinghua представили AI-агента для генерации новых алгоритмов. Он работает в двойной исследовательской среде: формулирует идеи, превращает их в код, оценивает результаты и отсеивает слабые гипотезы на раннем этапе. Агент определяет перспективные идеи с точностью 72% — выше, чем GPT-5 (53%).

Почему это важно: AlphaResearch дает агенту способность оценивать, какие интуитивные догадки действительно стоят системных усилий. Фактически это снижает затраты на вычислительные ресурсы, отсеивая неперспективные направления еще на старте.