НовостиОбзорыВсе о нейросетяхБытовая техника 2024ГаджетыТехнологииНаукаСоцсетиЛайфхакиFunПромокодыСтранные вопросыЭксперты

Т-Банк выпустил мощнейшую русскоязычную языковую модель T-lite

20 июля 2024
Весовая категория T-lite — 7-8 млрд параметров. Она обогнала зарубежные Chat-GPT 3.5 и Llama-3-8B-Instruct по показателям на индустриальных и внутренних бенчмарках. При этом T-lite создана с использованием всего 3% вычислительных ресурсов, которые обычно требуются для такого типа моделей.

Центр искусственного интеллекта Т-Банка (AI-Центр) открыл доступ к своей большой языковой модели T-lite. Индустриальные и внутренние бенчмарки показали, что T-lite показывает лучшие результаты в решении бизнес-задач на русском языке среди открытых моделей размером 7-8 млрд параметров. Об этом было объявлено на первой конференции Т-Банка по машинному обучению Turbo ML Conf.

Модель T-lite — это инструмент разработки. С ее помощью компании смогут создавать LLM-приложения для собственного использования без передачи данных третьим лицам. Например, ассистентов поддержки, которые могут автоматически обрабатывать запросы клиентов и предоставлять мгновенные ответы, инструменты для анализа и обобщения больших объемов текста, таких как отчеты или исследования, интеллектуальные поисковые системы, которые могут находить нужную информацию с учетом контекста, модели суммаризации текста.

T-lite выпущена в размере 8 миллиардов параметров. Параметры — это числовые значения, которые модель настраивает, чтобы лучше понимать и генерировать текст. Чем больше параметров, тем больше возможностей у модели для выполнения сложных заданий, но с увеличением размера также ухудшается экономическая эффективность модели. T-lite же после дообучения на конкретные бизнес-задачи в области обработки естественного языка (NLP) дает качество, сопоставимое с проприетарными моделями размером от 20 миллиардов параметров. При этом модель в разы дешевле в эксплуатации.

На индустриальных и внутренних бенчмарках модель обогнала по показателям зарубежные Llama-3-8B-Instruct и Chat-GPT 3.5. При этом разработчики отмечают, что T-lite создана с использованием всего 3% вычислительных ресурсов, которые обычно требуются для такого типа моделей.

T-lite входит в Gen-T — это семейство собственных специализированных языковых моделей Т-Банка, которые умеют обучаться под решение конкретных узкоспециализированных задач. В отличие от универсальных моделей, таких как ChatGPT, технология Gen-T ориентирована на конкретные области и предлагает решения с максимальной адаптацией под нужды пользователя.

Разработка собственного семейства языковых моделей — это насущная необходимость по многим причинам. Существующие на рынке решения не закрывают всех задач, которые есть у нас, и не являются оптимальными. Наши модели семейства Gen-T показали свою эффективность в наших сервисах, оптимальны по соотношению используемых мощностей и качеству. И мы готовы поделиться этой разработкой с другими компаниями, с пользователями, с профессиональным сообществом. Это наш вклад в развитие искусственного интеллекта в России.
Артем Бондарьруководитель NLP в Центре искусственного интеллекта Т-Банка

Ранее OpenAI представила GPT-4o mini — самую доступную и компактную ИИ-модель.

Дарья Пашкевич