Представлена ruDALL-E: нейронная сеть, которая создаёт изображения по описанию на русском языке
В её основе лежит технология DALL-E от OpenAI.

«Сбер» представил нейронную сеть под названием ruDALL-E. Она умеет создавать изображения по описанию на русском языке. Опробовать технологию в деле может любой желающий по ссылке, правда генерацию изображений придётся подождать несколько десятков минут.
В основе разработки лежит технология DALL-E от OpenAI. Разработчики из SberDevices, Sber AI и SberCloud воспроизвели её код и запустили обучение модели на платформе ML Space на базе суперкомпьютера «Кристофари».
Модель обучалась 37 дней на 512 GPU TESLA V100, и затем ещё 11 дней по 128 GPU — всего 20 352 GPU-дней. В «Сбере» уточнили, что обучение ruDALL-E — самый большой нейросетевой вычислительный проект в России и СНГ.




В компании подчеркнули, что ruDALL-E — это первая нейросеть, которая может генерировать картинки по запросу на русском языке. Алгоритм состоит из трёх нейросетей: первая создаёт заданное число картинок на основе текста, вторая выбирает из них более удачные, а третья — увеличивает изображения в размере без потери качества. Технология может создавать неограниченное число новых картинок по заданному описанию, говорят в «Сбере».
Модель ruDALL-E XL с 1,3 млрд параметров находится в открытом доступе на GitHub. Вторая версия ruDALL-E 12B с 12 млрд параметров в скором времени будет доступна на платформе ML Space.