
Спустя всего полгода после нашумевшего релиза модели DeepSeek R1, появление еще одной мощной LLM из Китая стало подтверждением того, что это уже не единичный успех, а начало масштабного рывка страны в области ИИ. Kimi K2 демонстрирует выдающиеся результаты в тестах, особенно в задачах, связанных с программированием и написанием текстов, а открытая архитектура делает модель доступной специалистам всего мира.
Разработанная пекинским стартапом Moonshot AI, модель Kimi K2 построена на массивной архитектуре с триллионом параметров, что ставит ее в один ряд с самыми крупными ИИ в мире. Однако благодаря архитектуре «смешанных экспертов», одновременно активируются лишь 32 миллиарда параметров — только те, что необходимы для конкретной задачи. Это позволяет существенно сократить затраты на вычисления и делает модель более доступной для практического применения.
Kimi K2 уже признана лучшей открытой языковой моделью в мире по версии ряда экспертов. Она занимает лидирующие позиции в таких бенчмарках, как LiveCodeBench, ориентированном на решение задач программирования, и Creative Writing v3, оценивающем литературное мастерство ИИ. Особенно отмечается, что стиль письма модели звучит «не как у машины» — ее тексты характеризуются выразительностью, реалистичными персонажами и умением избегать банальностей. Кроме того, Kimi K2 возглавила рейтинг EQ-bench 3, показав высокий уровень «эмоционального интеллекта» при взаимодействии с пользователем.

Несмотря на впечатляющие результаты, Kimi K2 не является универсальной моделью. В тесте SciMuse, который оценивает способность ИИ предсказывать интересные для научного сообщества идеи, она уступила алгоритмам Google Gemini и некоторым моделям OpenAI. Тем не менее, эксперты считают, что потенциал новой LLM огромен, особенно учитывая ее агентную направленность. В отличие от «рассуждающих» ИИ, которые обучены пошаговой логике, Kimi K2 сконцентрирована на выполнении многошаговых задач с помощью различных инструментов, в том числе, веб-поиска или специализированного программного обеспечения. Это делает ее особенно перспективной в контексте автоматизации сложных цифровых процессов.
Как и DeepSeek, Kimi K2 находится в открытом доступе. Пользователи могут свободно загружать модель, дообучать ее и использовать в собственных проектах, не создавая ИИ «с нуля». Такой подход резко контрастирует с политикой западных лидеров индустрии, чьи модели чаще всего закрыты и доступны только через платные API. По мнению аналитиков, открытая публикация столь мощных моделей укрепляет позиции Китая в академической и исследовательской среде, где открытость ценится особенно высоко.

Moonshot AI, основанная в марте 2023 года, ранее была мало известна за пределами Китая. Однако уже к ноябрю 2024 года ее чат-бот Kimi занял третье место по популярности в стране. Среди инвесторов компании — технологические гиганты Alibaba и Tencent. Очевидно, что за запуском Kimi K2 стоит команда первоклассных специалистов с доступом к серьезным вычислительным ресурсам. Эксперты не исключают, что в ближайшие месяцы Китай представит еще больше моделей, способных составить конкуренцию лучшим мировым ИИ.
Тем временем ученые протестировали ведущие языковые модели и обнаружили, что ИИ тоже может быть не уверен в себе.

