Антон Курилов 21 232 0

Гайд по генераторам изображений: как пользоваться ChatGPT Images, Nano Banana и другими нейросетями

Дизайнеров нейросети пока не заменили. Но для бытовых картинок, постеров, мокапов и мемов они уже стали слишком удобными, чтобы их игнорировать.

За последние пару лет ИИ-модели для генерации изображений прошли путь от откровенно «слопских», неестественных картинок до уровня, едва отличимого от реальной фотографии.

Сервисов для создания картинок очень много — протестировали самые популярные и сравнили их работу на пяти одинаковых промптах:

Фото старого офисного кресла для объявления на продажу: снято на телефон, на фоне ламинат и плинтус, кресло немного потёртое, но не разваливается. Ощущение, что человек просто быстро сфоткал предмет перед продажей.

Реалистичное фото объявления в подъезде хрущёвки: лист бумаги на грязной стене поверх других объявлений, приклеен скотчем. Текст: «Уважаемые жильцы! 1 мая с 10:00 до 16:00 будет отключена горячая вода». Ниже маленькая подпись от руки: «УК ЖилКомМаш». Бумага чуть помята.

Скриншот экрана Макбука. Стандартный интерфейс macOS 26 с Liquid Glass, докбар внизу. По центру окно Safari с открытым сайтом rozetked.me

Реалистичное фото: компания из пяти друзей пытается сфотографироваться на фоне Байкала, но один человек моргнул, второй не успел встать в кадр, собака размазана в движении.

Средневековый рыцарь после тяжёлого боя гладит кота, сидящего на заборе. Доспехи рыцаря помяты. Стиль: акварель плюс пастель поверх.

Проверяем запросами на русском языке, со стандартными настройками (кроме соотношения сторон, если доступно). Промпты намеренно не переусложнённые, будто их писал обычный пользователь, а не ИИ-эксперт. Для моделей, которые генерируют несколько вариантов, выбран субъективно лучший.

Приложения: сайт, iOS, Android, Windows, macOS

Доступно бесплатно: около 2–3 генераций в сутки

В середине апреля OpenAI представила ChatGPT Images 2.0 — флагманскую модель для генерации и редактирования изображений. Основной упор разработчики сделали в работе с текстом и интерфейсами: нейросеть может сгенерировать убедительный дизайн приложения или относительно качественную инфографику. А ещё новинка научилась «думать» перед ответом, то есть планировать генерацию для более качественного результата.

Сейчас ChatGPT Images 2.0 занимает первую строчку рейтинга LMArena, где лучшую модель выбирают пользователи методом слепого тестирования.

Воспользоваться генератором картинок можно через ChatGPT: в веб-версии, мобильных и десктопных приложениях. В России сервис официально не работает, скачать приложения с российских витрин Google Play или App Store не выйдет.

В мобильных аппах и веб-версии есть раздел «Изображения», где можно выбрать желаемый стиль из готовых пресетов. Хотя сгенерировать картинку можно и из основного чата: достаточно сформулировать промпт вроде «Нарисуй изображение…». В панели ввода запроса появится выбор соотношения сторон: от 1:1 (квадрат) до 16:9. Максимальное разрешение результата — 2K. Также модель можно попросить отредактировать ваше или ранее сгенерированное изображение — например, сменить локацию персонажа или поправить макияж.

OpenAI не раскрывает конкретные лимиты, но пользователи сообщают, что по подписке ChatGPT Go (8 долларов или ~600 рублей в месяц) можно генерировать 20–30 изображений в сутки.

У ChatGPT получилось самое удачное кресло — фото действительно будто сделано мимоходом на дешёвый смартфон. И объявление первоклассное — даже текст на фоне логичный и не смазанный. Генерация интерфейса macOS вышла неплохой, хотя не без мелких косяков в иконках и стиле Safari — да и сайт Rozetked выглядит совсем иначе. Зато в авторах указан Максим Хорошев, и заголовки материалов правдоподобные.

В задаче с людьми ChatGPT допустил несколько артефактов, но общий реализм сцены впечатляет: персонажи не пластиковые, с прорисованными деталями. И у всех по пять пальцев! И рыцарь с котом получились удачно, заданный стиль соблюдён.

Приложения: сайт, iOS, Android, macOS

Доступно бесплатно: до 20 генераций в сутки

У Google есть две версии генератора изображений: быстрая Nano Banana 2 (Gemini 3.1 Flash Image) и мощная Nano Banana Pro (Gemini 3 Pro Image). Большинство пользователей работают именно с Nano Banana 2, поскольку Pro-версия остаётся для API и подписчиков тарифов Google AI Pro и Ultra. Впрочем, как заявляет Google, «флэш»-модель сопоставима по качеству работы со старшей версией.

Google также акцентирует внимание на качестве генерации текста: вывесок, постеров, открыток, графиков и диаграмм. Прежде с такими задачами «картиночные» нейросети справлялись плохо. Как и ChatGPT Images 2.0, Nano Banana 2 умеет искать актуальную информацию в сети перед работой, а ещё старается сохранять последовательность: один персонаж в нескольких генерациях подряд будет похож на себя предыдущего.

Попробовать Nano Banana можно в приложении и веб-версии Gemini — ни то, ни другое не работает с российским IP-адресом. За кнопкой «Инструменты» спрятана опция «Создание изображений», после чего открывается выбор пресетов. Пользоваться ими не обязательно, достаточно описать желаемый результат в свободной форме. Максимальное разрешение — 4K (по сообщениям пользователей, это апскейл с 2K). При этом в углу результата размещается знак Gemini — это помогает отличить сгенерированное изображение от реального.

Отредактировать уже готовую картинку тоже можно.

Лимит зависит от нагрузки на инфраструктуру, но бесплатным пользователям положено до 20 генераций ежедневно, платным — до 50, 100 или 1000 генераций (для Google AI Plus, AI Pro или AI Ultra соответственно). Подписка стоит от 8 долларов (~600 рублей) в месяц, оплатить её российской картой нельзя.

Кресло Nano Banana изобразило хорошо: видно, что интерьер не российский, но об этом и не было указано в промпте — это значит, что модель не додумывает контекст исходя из языка запроса. А вот к объявлению есть вопросы: хотя текст изображён без смазов и ошибок, просьба добавить подпись от руки проигнорирована. Да и надписи на фоне получились так себе.

Зато скриншот macOS отличный: опять же, в деталях есть проблемы (обратите внимание на строку меню, да и сайт не похож), но Gemini уловил актуальные новости и даже написал текущую дату — пусть и 29 апреля приходится на среду, а не на вторник. «Фото» на фоне Байкала тоже шикарное: все задачи из промпта учтены, а сзади угадывается скала Шаманка — символ острова Ольхон. Зато рыцарь получился слишком «вылизанным» — слабо похоже на акварель.

Приложения: сайт

Доступно бесплатно: нет

Несколько лет назад ленты СМИ были заполнены новостями в духе «нейросеть представила, как бы выглядели города, если были людьми». Такие картинки чаще всего генерировали именно в Midjourney. Сейчас проект не привлекает столько внимания на фоне актуальных моделей Google и OpenAI, но всё ещё развивается: весной команда выпустила альфа-версию Midjourney V8.1. На момент подготовки материала публично доступна модель Midjourney V7.

Бесплатной версии у Midjourney нет — зато есть четыре тарифа:

	Стоимость в месяц	Месячный лимит
Basic Plan	10 долларов (~750 рублей)	200 медленных генераций
Standard Plan	30 долларов (~2200 рублей)	Безлимит, 15 часов процессорного времени для генерации в быстром режиме
Pro Plan	60 долларов (~4500 рублей)	Безлимит, 30 часов процессорного времени для генерации в быстром режиме
Mega Plan	120 долларов (~9000 рублей)	Безлимит, 60 часов процессорного времени для генерации в быстром режиме

Сервис ориентирован скорее на профессиональных пользователей. При составлении промпта можно загрузить референс, выбрать соотношение сторон, отрегулировать степень стилизации и вариативности. Midjourney генерирует сразу четыре картинки на выбор, а после предлагает редактор, где можно увеличить разрешение или дорисовать участок с одной из четырёх сторон. А конечный результат можно выбрать как стартовый кадр для анимации через модель Midjourney Video.

У Midjourney нет приложения, только сайт — впрочем, он адаптирован для работы со смартфона. Для регистрации понадобится учётная запись Google или Discord. Оплату российскими картами сервис не принимает. Ещё можно генерировать картинки через сервер Midjourney на Discord — там нет редактора, зато есть система команд для тонкой настройки генерации.

Офисное кресло не удалось: получился скорее диван на колесах. С текстом объявления Midjourney тоже не справился — но, по крайней мере, есть попытка изобразить подпись от руки. MacBook получился правдоподобный, но совсем мимо промпта. С задачей про Байкал вышло относительно хорошо — опять же, не то чтобы точно по запросу, но хотя бы близко. И рыцарь неплохой, пусть и не гладит кота, как указано в промпте, и смотрит будто чуть ниже. Общее впечатление такое: Midjourney неплохо создаёт общие планы, но сыпется в деталях.

Приложения: сайт

Доступно бесплатно: 50 генераций

Семейство генеративных моделей разрабатывает стартап Black Forest Labs. Нейросети отличаются от конкурентов открытыми весами — это значит, что их можно запустить на собственном оборудовании (не домашнего уровня, конечно).

Сейчас актуально поколение Flux.2, которое включает модели Klein, Flex, Pro и Max. Максимальное выходное разрешение — 2K, нейросеть выдаёт сразу два результата на выбор.

Для генерации изображений понадобится учётная запись на сайте Flux Playground. Её можно завести при помощи аккаунта Google или GitHub — или адреса электронной почты. Интерфейс полностью на английском. Если нажать на кнопку Get free Images слева, сервис предложит получить 50 бесплатных генераций — правда, стоит учитывать, что это может быть временной акцией. Затем в любом случае придётся потратиться на кредиты: 1000 токенов стоят 10 долларов (~750 рублей). Этого хватит, чтобы сгенерировать 250 картинок моделью Flux.2 Pro.

Бесплатно можно пользоваться быстрой моделью Flux.2 Klein через сервисы-агрегаторы вроде Krea AI. Он даёт 100 кредитов ежедневно, для регистрации достаточно адреса электронной почты. Можно настроить соотношение сторон результата, загрузить картинку-референс и выбрать из пары десятков готовых стилей.

Flux Playground ещё умеет удалять объекты с картинок и увеличивать разрешение — для этого на сайте есть разделы Fill и Expand соответственно. А для регулярных пользователей окажется полезным меню Styles, где можно сохранять текстовые промпты с описанием стилей и переиспользовать их в будущем.

Flux худо-бедно следует поставленной задаче, но общее качество генерации посредственное. Русскоязычный текст у нейросети совсем не получается (хотя общее окружение вышло неплохо), а интерфейс… что это за внебрачный сын macOS и Windows? В предпоследней задаче люди получились ненатуральные. И, кажется, их больше пяти. Хотя бы рыцарь с котом удались.

Приложения: сайт, Telegram-бот, Android

Доступно бесплатно: без ограничений

Модель с говорящим названием разрабатывают в «Сбере». В конце апреля компания представила Kandinsky 6.0 Image. Помимо общего повышения качества и скорости создания новых картинок, нейросеть получила несколько режимов редактирования готовых изображений: она умеет перерисовывать в другом стиле, менять локацию, убирать лишние объекты, «реставрировать» старые снимки. А ещё Kandinsky 6.0 Image может сама найти референс, если не знает, как изобразить запрошенный объект.

Для работы с Kandinsky через веб-интерфейс или мобильное приложение понадобится авторизоваться в учётной записи «Сбер ID». При использовании Telegram-бота же иметь аккаунт «Сбера» не требуется. В интерфейсе создания изображения есть выбор стиля (от акварели до 4K) и размера (квадрат, альбом, портрет), можно загрузить референс или изображение для редактирования.

Максимальное выходное разрешение не изменилось: 1024×1024 (при выборе квадратного соотношения). Полученный кадр легко использовать для создания анимации через модель Kandinsky Video.

Кресло, пусть и не очень похожее на офисное, получилось неплохо. А вот с текстом на русском (у российской-то модели!) вышла проблема. Да и интерфейс macOS уж слишком далёк от реальности. Зато люди на фоне Байкала получились сносно — правда, мимо промпта. Картинка неплохая, хотя признаки ИИ легко угадываются, с фотографией не перепутать. С рыцарем тоже не всё гладко: стиль не совсем тот, что нужен, а кот непропорционально большой.

	Работает в России	Место на LMArena	Бесплатный лимит	Качество генерации
ChatGPT Image	❌	1	2–3 в сутки	⭐⭐⭐⭐⭐
Nano Banana	❌	2	20 в сутки	⭐⭐⭐⭐
Midjourney	❌	–	❌	⭐
Flux	❌	10	50 единоразово	⭐
Kandinsky	✅	–	Безлимит	⭐⭐

искусственный интеллект

ChatGPT Images

Nano Banana

Midjourney

Flux

Kandinsky

Сравнительная таблица