НовостиОбзорыВсе о нейросетяхБытовая техника 2024ГаджетыТехнологииНаукаСоцсетиЛайфхакиFunПромокодыСтранные вопросыЭксперты

Мощнее GPT-4o: представлена нейросеть Pixtral Large c поисковиком

19 ноября 2024
Компания Mistral выпустила новую модель, которая одновременно анализирует и текст, и изображения, и поисковые запросы. А точность выше, чем у конкурентов.

Французская компания Mistral представила Pixtral Large — новую мультизадачную модель. Она может работать с текстом и изображениями, а также искать информацию в сети. ИИ доступна бесплатно в обновленной платформе Le Chat и уже продемонстрировала превосходные результаты в тестах с конкурентами.

Что делает Pixtral Large уникальной

Новая ИИ-модель с 124 миллиардами параметров создана на базе Mistral Large 2. Она отличается не только внушительными размерами, но и способностью интегрировать текстовые данные с визуальной информацией. Например, нейросеть уверенно справляется с анализом сложных математических графиков, документов и обычных изображений. Особенностью является расширенное окно контекста на 128 тысяч токенов, что позволяет обрабатывать до 30 изображений в высоком разрешении одновременно.

Модель также оснащена отдельным декодером для мультимодальных задач со 123 миллиардами параметров и специализированным визуальным энкодером, в котором 1 миллиард параметров. Такой подход обеспечивает баланс между скоростью работы и точностью анализа.

Одним из главных направлений использования Pixtral Large стала обновленная версия платформы Le Chat. Теперь пользователи могут:

  • Сканировать и анализировать сложные документы и изображения, включая графики, таблицы и формулы;
  • Генерировать изображения высокого качества благодаря партнерству с Black Forest Labs;
  • Создавать автоматизированные рабочие процессы с помощью «агентов», которые упрощают повторяющиеся задачи, например обработку счетов или составление отчетов.

Le Chat также получил новую функцию Canvas для совместной работы, как в ChatGPT и Calude. Этот инструмент позволяет редактировать текст, код и визуальные элементы в режиме реального времени, что делает платформу особенно удобной для креативных и аналитических задач.

Достижения в тестах

ИИ уже зарекомендовал себя как лидер на таких тестовых платформах, как MathVista, DocVQA и VQAv2. Например, в тесте MathVista, оценивающем математическое мышление, она достигла 69,4%, оставив позади GPT-4o и Gemini-1.5 Pro. В области анализа документов и графиков модель превосходит предыдущие версии, демонстрируя глубокое понимание сложных структур данных.

На тестах MM-MT-Bench, моделирующих реальные сценарии использования, Pixtral Large обогнала Claude-3.5 Sonnet и другие популярные модели. Это делает ее подходящим решением для бизнес-аналитики, обработки документов и научных исследований.

Влияние на рынок

Компания делает продвинутые технологии доступными как для исследователей, так и для бизнеса. Mistral AI подчеркивает, что их миссия — предоставить мощные инструменты пользователям, а не преследовать недостижимые цели искусственного общего интеллекта.

Пока функции Pixtral Large доступны в бесплатном режиме бета-тестирования, но в будущем компания планирует запуск премиальных тарифов с более широкими возможностями и гарантиями.

Также в этом месяце была представлена нейросеть, которая в корне отличается от Pixtral, ChatGPT и других чат-ботов. Ученые создали ИИ для работы с геномами, чтобы предсказывать генетические мутации.

Дарья Арцыбашева