«Алису» обучили генерации изображений с текстом на русском языке без ошибок

Другие нейросети зачастую делают ошибки в тексте, так так их обучают на открытых датасетах, в которых слабо представлен русский язык.

«Алису» обучили генерации изображений с текстом на русском языке без ошибок

В чате с «Алисой AI» теперь можно создавать изображения с верными и более длинными надписями на русском языке, о чём Rozetked рассказали представители компании.

«При генерации картинок [с текстом на русском] разные нейросети зачастую допускают ошибки, потому что их обучают на открытых датасетах, в которых слабо представлен русский язык. „Алиса AI“ научилась решать эту проблему: для создания изображений она стала использовать обновлённую модель Alice AI ART, которую „Яндекс“ обучил на собственном масштабном датасете»
— пресс-служба «Яндекса»

Благодаря этому пользователи теперь могут создавать постеры, афиши и открытки с надписями на русском языке, а бизнес — рекламные материалы, лендинги, брошюры или презентации в Yandex AI Studio.

Для обучения модели команда «Яндекса» собрала датасет изображений с русскоязычными надписями и детальной разметкой текста, а также изменила архитектуру модели. После обновления нейросеть стала в три раза чаще генерировать картинки с корректным русскоязычным текстом: без ошибок или нечитаемых букв.

«Для [безошибочной генерации] достаточно использовать простые приёмы: заключать текст в кавычки, писать сложные слова заглавными буквами, разбивать длинные надписи на более короткие фразы»
— пресс-служба «Яндекса»