«Сбер» открыл последнюю версию генеративной модели Kandinsky для всех пользователей

Специалисты дообучили нейросеть на сете эстетичных изображений и добавили функцию улучшения запроса силами GigaChat Pro.

«Сбер» открыл последнюю версию генеративной модели Kandinsky для всех пользователей

«Сбер» открыл доступ к картиночной нейромодели Kandinsky 3.1. С начала апреля она была доступна только дизайнерам, художникам и блогерам, а теперь технологию могут опробовать все желающие.

В Kandinsky 3.1 разработчики привнесли ряд улучшений:

  • Новый датасет для обучения, который включает эстетичные изображения — это позволило повысить качество генерации.
  • Появилась функция улучшения запроса — нейросеть GigaChat Pro возьмёт текстовое описание желаемого результата от пользователя и перепишет его в детальный промт.
  • Значительно улучшена функция inpainting, которая позволяет редактировать отдельные части изображения.
  • Появилась модель Kandinsky 3.1 Flash, которая выдаёт результат более чем в 10 раз быстрее, чем базовая версия нейросети.

Попробовать Kandinsky 3.1 можно в ботах Telegram и VK, а также в мобильном приложении «СберБанк Онлайн» и на платформе fusionbrain.ai.

Вскоре пользователи также смогут генерировать изображения в разрешении 4K, смешивать картинки и тексты, создавать вариации изображения, вносить локальные изменения и генерировать стикерпаки. А ещё «Сбер» готовит к релизу обновление модели генерации видео по тексту — Kandinsky Video 1.1.