
В конце декабря китайский стартап DeepSeek выпустил свою самую совершенную языковую модель DeepSeek-V3. А в середине января появилось официальное мобильное приложение для общения с нейросетью в уже привычном формате чата.
Почему мы вдруг решили обратить внимание на DeepSeek? На момент подготовки статьи это одна из самых обсуждаемых моделей: DeepSeek-V3 занимает вторую строчку в рейтинге трендов на ИИ-платформе Hugging Face. И вот почему:
- Модель имеет открытый исходный код: любой желающий может запустить её на своём оборудовании (но не на персональном компьютере, конечно).
- Несмотря на происхождение, DeepSeek-V3 отлично понимает и английский, и русский языки.
- В ряде бенчмарков новинка обходит и GPT-4o от OpenAI, и Claude-3.5 Sonnet от Anthropic, в том числе в тестах математических способностей и задачах по программированию.
- Высокая скорость генерации — ответы появляются заметно быстрее, чем в ChatGPT.
- Доступ к чат-боту полностью бесплатный.
- Чат-бот умеет выходить в интернет — можно заменить классический поиск в Google или «Яндексе».
А для нас есть ещё один бонус: DeepSeek спокойно принимает пользователей с российскими IP-адресами. Приложения тоже доступны в сторах без региональных ограничений.
Как воспользоваться DeepSeek в России
У DeepSeek есть веб-версия и мобильные приложения для iOS и Android. Интерфейс явно слизан у ChatGPT, вплоть до дизайна значков. Поэтому всё понятно и привычно: слева список чатов, внизу поле для ввода запроса. Любой чат или все переписки сразу можно удалить из памяти. В вебе DeepSeek поддерживает только китайский и английский языки интерфейса. Зато мобильное приложение полностью переведено на русский.
Для регистрации подойдёт адрес любой электронной почты, а также аккаунт Google или Apple. Или номер телефона — но только китайский, с префиксом +86.
К слову, сейчас приложение DeepSeek занимает 11-е место в топ-чарте российского App Store.
Что умеет DeepSeek
У DeepSeek, помимо обычного режима, есть два дополнительных: DeepThink и Search. Для активации одного из них достаточно нажать на соответствующую кнопку под полем ввода запроса.
DeepThink. В этом режиме модель решает математические и логические задачи, «рассуждая» пошагово. Процесс может легко занять больше минуты — зато можно наглядно следить за мыслительным алгоритмом.
Проблема в том, что DeepThink не отвечает на русском. Но в следующем сообщении можно попросить перевести итог размышлений на понятный язык.
Вообще у OpenAI тоже есть модели со способностью размышления — o1 и o1 pro. Только для доступа к ним придётся потратиться на недешёвую подписку. А в условиях санкций задача упирается не только в деньги.
Search. При активации этой функции чат-бот поищет информацию в интернете и вернёт готовый ответ. Это способ получить актуальную информацию: DeepSeek обучен на данных на октябрь 2023 года, поэтому в обычном режиме не сможет, например, подсказать прогноз погоды. Зато в поисковом режиме — запросто.
Каждое утверждение снабжается ссылкой на первоисточник. Можно также посмотреть полный список сайтов, который посетила DeepSeek для поиска информации. Например, чтобы узнать погоду в моём городе, нейросеть зачем-то сходила аж на 44 ресурса.
Анализ документов. В DeepSeek можно загрузить один или несколько текстовых файлов общим объёмом до 100 МБ. Картинки тоже принимаются, но понять изображение нейросеть не сможет — разве что распознать текст, если он есть на изображении.
Загружаете документ, задаёте вопрос — и через несколько секунд получаете ответ, исходя из содержимого. Например, таким образом можно быстро понять, о чём идёт речь в очередном российском законопроекте, не продираясь через казённые речевые обороты.
Цензура. Удивительно, но DeepSeek запросто рассказывает о кровавом подавлении протестов на площади Тяньаньмэнь в Пекине в 1989 году. В китайском медиапространстве подробности об этих событиях жёстко цензурируются. Если попросить, нейросеть даже расскажет об оценках числа погибших от независимых источников.
Правда, иногда приходится задавать наводящие вопросы, чтобы получить полную картину.
Выводы
Объективное сравнение возможностей и качества ответов DeepSeek с ChatGPT и другими нейросетями явно не вписывается в формат быстрого обзора, а тянет на полноценное исследование.
Но за пару часов взаимодействия с DeepSeek у меня осталось приятное впечатление: быстрая работа, достаточно подробные ответы, доступ в интернет. И никакой чехарды с подменой IP-адреса. А функция DeepThink в бесплатном режиме — вообще шик!
Конечно, как у любой генеративной модели, у DeepSeek встречаются причуды. Например, чат-бот путает Rozetked с интернет-магазином Rozetka. Что ж, знаем живых людей, которые допускали ту же ошибку!