Андрей Чуяшов 5 720 118

DeepSeek представила обновление флагманской модели V3.1 — теперь она умеет «думать»

Увеличился и объём контекста — до 128 000 токенов.

Китайская компания DeepSeek выпустила обновлённую версию флагманской модели — V3.1. Она работает в двух режимах: «базовом» и «рассуждающем» (V3.1-Think). По словам разработчиков, в режиме рассуждений модель отвечает быстрее R1, тратя меньше токенов на поиск решения.

В модели около 685 млрд параметров, контекстное окно составляет 128 000 токенов.

По результатам внутренних тестов, наиболее заметные улучшения проявились в навыках ИИ-агента: поиске информации, работе с браузером и выполнении многошаговых задач.

В исследованиях Artificial Analysis V3.1-Think превзошла Claude 4 Sonnet в научных знаниях, математике и написании кода. В тесте Aider по программированию новинка набрала 71,6%, опередив конкурентов при меньших затратах.

Модель оптимизировали под китайские чипы и выложили на открытую платформу Hugging Face. Она также доступна через API, где с 5 сентября 2025 года работа с ней будет стоить 56 центов за 1 млн входных токенов и 1,68 доллара за 1 млн выходных.

Ещё в DeepSeek рассказали, что API стало совместимо с сервисами Anthropic.