Обзор Midjourney: создавать цифровое искусство никогда не было так просто!

Автор Денис Гурьянов 16:00 21.08.2022
- 2 +  38 131 0
Обзор Midjourney: создавать цифровое искусство никогда не было так просто!

Всем привет. Вы уже, наверное, не раз слышали про Midjourney — нейронную сеть, которая создаёт крутые изображения по текстовому описанию.

Персонажи «Гарри Поттера» в мире киберпанка и зомби-апокалипсиса, альтернативные версии героев «Ведьмака», постеры к фильмам ужасов, 2D-экшен, который был создан на основе изображений, сгенерированных нейронной сетью. За всё это ответственна Midjourney.

Нейронная сеть привлекла к себе столько внимания ещё и потому, что для её использования не нужны особые технические знания, да и попробовать технологию может любой желающий, в отличие от похожих OpenAI DALL-E и Google Imagen, которые доступны лишь ограниченному числу лиц.

Всё, что вам понадобится для работы с Midjourney, — это аккаунт в Discord, немного фантазии и усидчивости (в некоторых случаях ещё немного денег). Всю остальную работу за вас выполнят алгоритмы. Разработчики нейронной сети дают бесплатный доступ к своему детищу, но там есть некоторые ограничения. Тем не менее, бесплатной версии хватит, чтобы попробовать технологию, а если вдруг понравится, можно и подписку оформить.

Как вы уже поняли, этот текст посвящён Midjourney. Расскажу, как её запустить, какие есть команды и базовые настройки. Сильно углубляться не буду, поэтому мой материал будет неинтересен уже опытным пользователям — он для новичков, которые только хотят попробовать нашумевшую технологию.

Как найти и запустить Midjourney?

Найти её очень просто — пройдите вот по этой ссылке или вбейте в поиск «Midjourney» — нейросеть находится по адресу www.midjourney.com. На главной странице увидите четыре основных меню: «Join the beta», «Sign In», «Getting Started» и «Community Showcase».

Нас прежде всего интересует «Join the beta». После клика по кнопке система у вас попросит залогиниться через Discord. Если уже есть аккаунт, то хорошо, можно начинать работу, а если нет — регистрируем. Перед первыми попытками создать картинки советую пройти в «Community Showcase», где представлены примеры крутейших изображений, созданных по запросу других пользователей. Раздел полезный, сразу мотивируешься, возникает желание побольше узнать о всевозможных настройках и командах, чтобы алгоритмы на твой запрос выдавали нечто внятное.

После того, как вы вошли в систему, вас перекинет в Discord. Там нужно будет присоединиться к комнате: в столбике слева выбирайте newbies. Потом пишите в чате с ботом /imagine, дальше появится Prompt, а уже после вбивайте свой запрос. Собственно, уже на этом этапе можно получить какой-никакой результат, но, скорее всего, он будет удручающим, хотя, как повезёт.

Очень важный момент, нейронная сеть понимает запросы на разных языках, включая русский, но наиболее качественные изображения можно получить только в том случае, если вводить запросы на английском языке. Например, если вы введёте в чат «красивая женщина, 25 лет, блондинка», то итог будет не очень, а вот если «beautiful woman, 25 years, blonde haired» — другое дело.

Писать можно всё, что душе угодно, кроме совсем уж откровенной дичи, поэтому словечки вроде pussy и fuck употреблять не стоит, да и не получится, система вас предупредит, если запрос не будет соответствовать нормам морали. Всё, что выходит за рамки PG-13, тут неуместно.

Изначально Midjourney создаёт четыре изображения в формате 1:1 (задать соотношение сторон можно, об этом речь пойдёт ниже по тексту). Писать запросы следует через запятую, например, не «Perfect Russia of the future 2077 --ar 16:9», а «Perfect Russia, future, 2077 --ar 16:9». Так алгоритмы вас лучше поймут, изображения получатся более релевантными. Хотя и без запятой порой нейросеть выдаёт качественные изображения, но, как показала практика, это случается реже.

Примеры того, что у меня получилось за первые 10 минут использования Midjourney:

Процесс создания картинок нейросетью можно увидеть прямо в чате, готовый результат будет доступен там же. Естественно, за красивыми изображениями охотитесь не вы одни. В чат посылаются десятки запросов от других пользователей, вы можете видеть результат генерации и по чужим запросам тоже.

Свои и чужие результаты можно скидывать к себе в личные сообщения, просто нажмите на кнопку «добавить реакцию», которая находится в верхней части сообщения и выберите в открывшемся списке иконку конвертика, кликните по ней. Все созданные вами изображения будут храниться по ссылке www.midjourney.com/app/.

Если вам не понравился готовый результат, можно запустить новый процесс генерации по тому же запросу. Для этого нажмите на синюю кнопку круга с двумя стрелочками. Кнопка U (апскейлинг) увеличивает разрешение изображения (U1 — первое из четырёх изображений, U2 — второе и так далее). По нажатию на кнопку V (вариации) нейронная сеть сгенерирует другие четыре изображения. То есть, если нажать V3, алгоритмы возьмут за основу картинку под номером три и на её основе создадут четыре новых рендера. 

После нажатия на кнопку U, когда появится увеличенное изображение, вам станут доступны ещё четыре варианта дальнейших действий:

  • Make Variations — по нажатию будут созданы четыре новых изображения, а за основу будет взята уже апскейлнутая картинка;
  • Upscale to Max — масштабирует изображение до ещё большего разрешения;
  • Light Upscale Redo — ещё один вариант масштабирования, похуже, чем Upscale to Max;
  • Web — открывает страницу с вашими изображениями на сайте Midjourney;
  • Эмодзи — у них самое прямое назначение, можно оценить свою или чужую работы.

Если у вас с фантазией туго, то есть специальные сервисы, которые помогут составить (или выбрать уже готовый) запрос к нейросети. Из таких сервисов можно отметить Midjourney Promt HelperPromptomania и Noonshot

Какие у Midjourney есть параметры?

Параметров целая россыпь — от возможности задать соотношение сторон для изображений до всяких зумов, зернистости, позиций камеры и прочего такого. Вот несколько настроек:

  • --hd — генерация изображений с более высоким разрешением без необходимости последующего апскейла;
  • --ar (например, --ar 3:4, --ar 9:16 или --ar 16:9) — ставится в конце запроса, задаёт соотношение сторон изображений;
  • --w (например, --w 1250) — настройка, которая задаёт ширину изображения, то есть, --w 1250 — ширина картинки будет 1250 пикселей;
  • --h (например, --h 1700) — высота изображения;
  • --s — используется для стилизации изображения, по умолчанию — --s2000, предельное значение — --s60 000;
  • --q — качество изображения, можно выставить от --q0.25 и до --q2 (по умолчанию стоит --q1);
  • ::  (например, green::10 car::1) — настройка, которая помогает алгоритмам понять приоритет слов, в случае с green::10 car::1 речь идёт о том, что изображение должно быть скорее зелёным, чем на нём должна быть показана машина. Без добавления в запрос двойного двоеточия нейросеть считает все слова равноценными.

Это только самые базовые параметры. У Midjourney есть руководство пользователя, в котором более подробно описано всё, что нужно делать для создания качественных изображений. Если хотите узнать больше о доступных настройках, то вам туда.

Количество бесплатных попыток и цена подписки

У популярности Midjourney есть обратная сторона медали — сервера нужно на что-то содержать. Поэтому, разработчики дают бесплатный доступ с ограничением в 25 действий или попыток, если угодно. В это число входит любая команда, которая заставляет работать нейронную сеть, включая повторную генерацию той же картинки с альтернативным результатом и функцию увеличения изображения.

Мои 25 бесплатных попыток закончились довольно быстро

В общем, когда вы вводите запрос в чат, а потом нажимаете кнопки V, U и круг, знайте, что это расходует ваши попытки. Используйте с умом, ознакомьтесь с инструкцией перед тем, как начинать мучить алгоритмы своими запросами. Посмотреть количество оставшихся попыток можно, введя в чат команду /info.

Что касается платных возможностей Midjourney, вот цены на подписку:

  • Базовый план (200 GPU-минут в месяц) — 10 долларов в месяц (~600 рублей);
  • Стандартный план (15 GPU-часов в месяц) — 30 долларов в месяц (~1800 рублей);
  • Корпоративный план (120 GPU-часов в год) — 600 долларов в год (~35 600 рублей).

В описании тарифов Midjourney можно встретить такое понятие, как «GPU-минуты/часы». Это количество действий, которое есть у пользователя. Например, лимит в 200 GPU-минут в месяц на базовом плане подписки — это те самые 200 сгенерированных изображений. Дополнительные попытки можно докупить — 4 доллара (~240 рублей) за один GPU-час, это примерно 60 команд генерации или масштабирования изображения.

Стандартный план за 30 долларов в месяц даёт пользователю 15 GPU-часов (900 GPU-минут) в месяц — это очень много изображений и попыток их создать! Также стоит упомянуть, что нейронная сеть работает в двух режимах — Relax и Fast. В режиме Relax пользователя ставят в очередь. Проще говоря, генерация изображений занимает больше времени, но доступный ресурс действий истощается не так быстро. В режиме Fast, наоборот, всё происходит быстрее, но GPU-минуты расходуются быстрее.

Midjourney может создавать настоящие шедевры

С корпоративным планом можно получить 120 GPU-часов (7200 GPU-минут) в год, а также «Приватный режим», когда изображения пользователя не отображаются в так называемой «Галерее участников» — другие пользователи не видят ваши картинки. Также «Приватный режим» можно получить на базовом и стандартном планах, доплатив 20 долларов (~1200 рублей) к подписке. Подробнее ознакомиться с условиями тарифов можно по ссылке

***

На этом всё, полученной из этого материала информации вам хватит, чтобы начать первое знакомство с Midjourney. Дерзайте!




Комментарии

14.05.2024
Google I/O 2024
21.05.2024
Microsoft Build 2024
Нет событий
04.04.2025
«Форсаж 11»
Все события





Реклама на сайте