Брусничный блог / Читать

Интересный кейс по работе
с нейросетью Midjourney
и её новым функционалом

21.09.2023
Время прочтения: 5 минут
На сегодняшний день популярность нейросетей возросла настолько, что искусственный интеллект используется во многих сферах бизнеса, в основном, конечно, для продвижения. Многообразие нейросетей удивляет: нейросети по созданию визуала за 1 клик, по написанию текстов за 5 минут, по созданию контент-плана. Причём, разработчики ежедневно трудятся над, так называемым апгрейдом нейросетей, добавляя новые инструменты, обновляя функциональность программ и приложений.

Но можно ли так просто доверить искусственному интеллекту самое важное – коммуникацию со своей аудиторией? Ведь все креативы бренда влияют на его репутацию, потребительскую лояльность и отношение к бренду в целом.

Мы протестировали нейросеть Midjourney, загадав ей задачку не из простых! Давайте посмотрим, что из этого получилось.

Задача, которую мы сформулировали нейросети: получить картинку психотерапевта на приеме, с клиентом.

Формируем запрос, детализируя то, как мы видим эту картинку:
The psychotherapist and the client are sitting on yellow armchairs in a cozy bright office, photo, daylight

Получаем результат. На первый взгляд всё отлично, визуал отвечает заданным критериям: красивые цвета, композиция, с картинки сразу читается происходящее.

Но посмотрев на изображения более внимательно, мы видим, что на всех фото у людей проблемы с руками и ногами, как это, к сожалению, часто бывает у Midjourney.
На единственном фото (фото №3), где руки и ноги более-менее нам подходят, во-первых, две девушки, а нам хочется найти изображение с людьми разного пола, а во-вторых, у девушки справа — искажено лицо, особенно это заметно при увеличении картинки. А ещё, у девушки справа слишком акцентные туфли, что тоже отвлекает внимание от истинного посыла данного визуального элемента.
По атмосфере и персонажам нам откликается больше четвёртая картинка из коллажа.

Выбираем её, потому что мы знаем, что, благодаря новой функции нейросети, теперь можно править только выбранные области. Звучит, интересно, давайте проверим, как это работает.
С чем надо поработать: мы видим проблему с руками у всех участников изображения, 1 нога у мужчины, разная обувь у девушки.

Решение: выбираем области правки, кстати, что интересно, если нажать повторно на картинку и области правки, система показывает твой прошлый выбор, удобно для сравнения результата.
Получаем результат:
На фото 3 и 4 сохраняются проблемы с ногами, теперь нога не одна, их три, на ум сразу приходит знаменитая «одна голова хорошо, а две лучше», только в нашем случае не голова, да и не две, а сразу три, чтобы наверняка.
Ещё одна проблема — вместо второй ноги у мужчины культя, причем женская, что очень чётко заметно, нейросеть здесь «постаралась».
Самая адекватная — вторая картинка, но на ней туфли у женщины разного цвета, что бросается в глаза и выглядит, как минимум странно.
Но теперь мы, наученные опытом, знаем, как это победить, выбираем подходящую фотографию, отмечаем области правки, и правим их.

Ещё нас всё же немного смущают руки, правим и их.
Важно, что мы только выделяем области для правок, а в описании не задаем изменений, запрос каждый раз у нас идентичный. Тем самым мы подсказываем нейросети, на что надо обратить внимание, что необходимо изменить.

Результат: Получаем на выходе 4 варианта картинки, где нас всё устраивает!
Выбираем картинку, которая кажется симпатичней, готово, подходящий визуал для вашего поста готов. Благодаря новой усовершенствованной функциональности нейросети возможно создать подходящее уникальное изображение в пределах 30-40 минут, что явно выгоднее организованной фотосессии.
А мы продолжим тестировать функции нейросети и в следующих статьях усложним задачу, попробовав «подстановку лица».