Китайская Alibaba объявила о выпуске Qwen 3 — своего нового семейства ИИ-моделей под открытой лицензией. Сообщается, что флагманская Qwen3-235B-A22B сопоставима с DeepSeek-R1, o1, o3-mini, Grok-3 и Gemini-2.5-Pro.
Семейство Qwen 3 представляют гибридный подход к решению проблем. Они поддерживают два режима:
- Режим мышления, в котором нейросеть тратит время на пошаговое обдумывание, прежде чем выдать окончательный ответ. Это подходит для сложных проблем, требующих более глубокого размышления.
- Режим «недумания»: в этом случае модель даёт быстрые, «почти мгновенные ответы», подходящие для простых вопросов, где скорость дачи ответов важнее их глубины.
Некоторые модели семейства построены по архитектуре смешанных экспертов (MoE). MoE повышает вычислительную эффективность за счёт разбивки задач на части и их передачи специализированным подразделениям.
Большинство моделей Qwen 3 уже доступны или скоро появятся для загрузки под открытой лицензией на платформах Hugging Face и GitHub. Их размер: от 600 млн до 235 млрд параметров.
Использовать ИИ-модели Qwen 3 также можно в веб-версии или в новом одноимённом приложении — оно доступно в России, но работает только с иностранным IP-адресом.
