Китайская компания DeepSeek выпустила обновлённую версию флагманской модели — V3.1. Она работает в двух режимах: «базовом» и «рассуждающем» (V3.1-Think). По словам разработчиков, в режиме рассуждений модель отвечает быстрее R1, тратя меньше токенов на поиск решения.
В модели около 685 млрд параметров, контекстное окно составляет 128 000 токенов.
По результатам внутренних тестов, наиболее заметные улучшения проявились в навыках ИИ-агента: поиске информации, работе с браузером и выполнении многошаговых задач.
В исследованиях Artificial Analysis V3.1-Think превзошла Claude 4 Sonnet в научных знаниях, математике и написании кода. В тесте Aider по программированию новинка набрала 71,6%, опередив конкурентов при меньших затратах.
Модель оптимизировали под китайские чипы и выложили на открытую платформу Hugging Face. Она также доступна через API, где с 5 сентября 2025 года работа с ней будет стоить 56 центов за 1 млн входных токенов и 1,68 доллара за 1 млн выходных.
Ещё в DeepSeek рассказали, что API стало совместимо с сервисами Anthropic.


