«Сбер» обновил датасеты и удвоил размер контекста в ИИ-моделях GigaChat

А также представила новую модель — GigaChat Lite+.

«Сбер» обновил датасеты и удвоил размер контекста в ИИ-моделях GigaChat

«Cбер» представил большое обновление семейства моделей искусственного интеллекта GigaChat. Об этом Rozetked рассказали в пресс-службе компании.

Что изменилось:

  • Обновлены и расширены обучающие датасеты. Это привело к росту качества ответов моделей в сложных областях и результатов работы генератора изображений Kandinsky.
  • Увеличен размер контекста — с 4000 до 8000 токенов. Модели GigaChat Lite и GigaChat Pro теперь могут «запомнить» вдвое больше текста, поэтому нейросети поддерживают более длинные диалоги и способны обработать более развёрнутые запросы.
  • Представлена модель GigaChat Lite+. Она отличается от Lite расширенным до 32 000 токенов размером контекста. Модель GigaChat Pro по-прежнему лучше справляется с комплексными задачами и способна следовать более сложным инструкциям.
  • Появилась возможность формировать векторное представление текстов. Эмбеддинги в GigaChat API используются для оценки смысловой схожести текстов, повышения точности ответов языковой модели и упрощения решения задач поиска и классификации информации.
«С каждым новым этапом развития наших генеративных языковых моделей мы стремимся к тому, чтобы миллионы пользователей получили ещё более совершенный инструмент как для эффективной автоматизации бизнес-процессов, так и повышения собственной производительности», — Денис Филиппов, вице-президент по Цифровым поверхностям «Салют» «Сбербанка».

Моделью GigaChat Pro можно воспользоваться бесплатно через веб-интерфейс и ботов в Telegram и «ВКонтакте». Разработчикам и бизнесу все модели доступны через GigaChat API.