
Компания Anthropic выпустила семейство моделей четвертого поколения, которые радикально превосходят предшественников в написании кода и решении многоэтапных задач. Claude Opus 4 и Claude Sonnet 4 демонстрируют беспрецедентные результаты в программировании и могут функционировать автономно на протяжении нескольких часов.
Флагманская модель Opus 4 установила новый мировой рекорд в области кодинга, набрав 72,5% в тесте SWE-bench — это лучший результат среди всех существующих ИИ-систем. Для сравнения: предыдущие лидеры едва преодолевали отметку в 50%. Модель способна выполнять сложные инженерные проекты, требующие тысяч последовательных шагов, сохраняя концентрацию и качество работы на протяжении семи часов непрерывной деятельности.

Младшая модель Sonnet 4 также показывает выдающиеся результаты — 72,7% в SWE-bench, значительно опережая свою предшественницу версии 3.7. При этом она стоит в пять раз дешевле Opus 4 и работает быстрее, что делает ее идеальным выбором для повседневных задач разработки.
Обе модели получили функцию «расширенного мышления» — они могут переключаться между быстрыми ответами и глубоким анализом, используя внешние инструменты вроде поиска в интернете прямо в процессе размышлений. Это позволяет ИИ самостоятельно находить нужную информацию и применять ее для решения задач.
Особого внимания заслуживает улучшенная память моделей. Claude 4 научился создавать и поддерживать «файлы памяти», где сохраняет ключевую информацию для долгосрочных проектов. Такой подход обеспечивает непрерывность работы и накопление знаний, что критически важно для сложных задач по разработке.

Крупные технологические компании уже интегрируют новые модели в свои продукты. GitHub объявил о внедрении Sonnet 4 в обновленную версию Copilot, а Cursor назвал Opus 4 «прорывом в понимании сложных кодовых баз». Компания Rakuten успешно протестировала автономную работу модели над рефакторингом open-source проекта в течение семи часов.
Anthropic также представила обновленную платформу Claude Code, которая теперь интегрируется с VS Code и JetBrains, отображая предлагаемые изменения прямо в файлах. Разработчики получают возможность программировать в паре с ИИ, который понимает контекст всего проекта.
Компания предлагает несколько тарифных планов для доступа к новым моделям: бесплатный план с базовым доступом к Claude 4 Sonnet и ограниченным лимитом около 20 сообщений в день, план Pro за 20 долларов (1600 рублей) в месяц с увеличенными лимитами и доступом к Claude 4 Opus, план Team за 25 долларов (2000 рублей) на пользователя в месяц для командной работы, а также новые планы Max стоимостью 100 и 200 долларов (8000 и 16 000 рублей) в месяц с лимитами в 5 и 20 раз выше Pro-версии соответственно.
Также на этой неделе Google представил новые функции своего ИИ, а также обновленную версию видео-генератора Veo.