Группа «Т-Технологии» объявила о релизе T-Pro 2.0 — первой собственной LLM с гибридным режимом рассуждений. Такой гибридный режим позволяет выбирать между быстрыми простыми ответами и глубоким анализом — это помогает оптимизировать расходы на вычисления при внедрении ИИ.
Как говорят в компании, новая модель даёт лучшее качество на русском языке и требует в два раза меньше вычислительных ресурсов по сравнению с аналогами Qwen3 и DeepSeek R1-Distil.
«Если раньше моделям можно было дать автономную задачу, на которую в среднем у человека уходит 30 секунд, то моделям с режимом рассуждений можно поручать задачи, на которые у человека уходит в среднем 8 минут. Решения в таких моделях более прозрачны и воспроизводимы, что делает их технологической базой для агентов нового поколения, которые способны взаимодействовать с внешними интерфейсами и выполнять задачи без контроля человека»— пресс-служба «Т-Банка»
Как пример, в поддержке ИИ-агенты помогают не только генерировать ответы, но и решать вопросы без привлечения оператора.
«T-Pro 2.0 сочетает лучшее качество среди открытых моделей в размере 30 млрд параметров с практичностью при внедрении — более быстрая генерация рассуждений на любом кириллическом языке даёт в среднем двукратную экономию вычислительных ресурсов по сравнению с доступными аналогами. Мы продолжаем делиться своими лучшими разработками с индустрией — под лицензией Apache 2.0 каждая компания может свободно переиспользовать наши вложенные усилия и опыт, дообучить модель на своих данных, создать собственные решения»— Виктор Тарнавский, директор по искусственному интеллекту «Т-Банка»
T-Pro 2.0 на 32 млрд параметров доступна на Hugging Face в открытом доступе под лицензией Apache 2.0 — компании могут свободно скачивать, использовать, адаптировать и дообучать модель на своих данных и интегрировать её в свои решения.
Вместе с моделью опубликованы бенчмарки, а также впервые выложен инструктивный датасет T-Wix, который содержит порядка 500 тысяч параметров.
