MidJourney и так был одним из самых впечатляющих генераторов изображений ИИ, а с выходом версии 5.1 он стал намного мощнее. Обновление алгоритма означает, что даже новичкам теперь невероятно легко создавать потрясающие произведения искусства с минимальными усилиями и глубокими подделками. Много-много глубоких подделок.
ИИ-генератор изображений вошел в общественное сознание в прошлом месяце после того, как вирусным образом распространились поддельные изображения Папы Римского Франциска в белом пуховике. Эта полемика вызвала дискуссии об этичности таких генераторов ИИ, как MidJourney, и вскоре после этого компания приняла меры.
Использование слова «Папа» на MidJourney теперь запрещено, но создание подделок других людей, например, президента Джо Байдена, по-прежнему разрешено — вероятно, до тех пор, пока мы не увидим вирусное изображение Байдена в розовом неоновом комбинезоне из спандекса, занимающегося йогой в Овальном кабинете.
Или, может быть, Байден в межгалактическом костюме спартанца, похожем на Железного человека.

Джо Байден в костюме межгалактического спартанца, созданный с помощью MidJourney.
MidJourney также позволяет пользователям создавать высококачественные глубокие подделки, используя фотографии в качестве эталона. Эта функция значительно повысила популярность MidJourney благодаря впечатляющим результатам, которые она обеспечивает, и низкой кривой обучения. На данный момент это самая популярная модель ИИ изображений с точки зрения интереса пользователей, превосходящая Dall-e и Stable Diffusion.
Последнее обновление MidJourney обещает улучшения в том, как алгоритм интерпретирует подсказки пользователей. Версия 5.0 была выпущена всего три месяца назад и значительно отличается от версии 4.
V5.1 теперь доступна! Изображения стали более целостными, четкими и красивыми. Он стал проще в использовании и должен более точно реагировать на инструкции. Мы также добавили режим «RAW» для опытных пользователей, чтобы уменьшить «мнительность» нашей модели и дать вам больше творческого контроля.
— Midjourney (@midjourney) May 3, 2023
По словам MidJourney, эта новая модель обеспечивает более высокую согласованность, более точное соответствие текстовым подсказкам, меньшее количество нежелательных границ или текстовых артефактов (странных случайных вещей, которые иногда появляются на изображениях) и более четкие результаты в целом. Глазурь на торте заключается в том, что новая версия была обучена быть более «мнительной».
Мнение означает, что модель может быть более творческой при интерпретации подсказки пользователя. В результате получаются более качественные изображения с базовыми подсказками — даже с абсурдными командами из одного-двух слов.
Например, простое сравнение результатов для подсказок «Bitcoin Wallet» с использованием версий 5.1 и 5.0 демонстрирует различия и улучшения. Версия 5.1 представляет кожаный кошелек, на котором вышит логотип биткоина и который лежит на столе. Версия 5 просто показывает кошелек с биткоином на обычной поверхности.
Новая версия еще больше подчеркивает сильные стороны, которые привели к взрыву MidJourney, не забывая об опытных пользователях, у которых теперь есть режим RAW, если они хотят получить более точные и менее «мнительные» результаты.
А как насчет многопалых рук? MidJourney v5.1 значительно улучшился. Представления рук теперь успешны в большинстве случаев, хотя генератор все еще выдает некоторые ошибки.
Команда MidJourney утверждает, что в будущем мы можем увидеть версию 5.2, которая еще больше расширит возможности этого инструмента. Если в третий раз все получится, то дни, когда генераторы ИИ путают руки в наших любимых глубоких подделках, наконец-то останутся позади.

Изображение создано с помощью AI (MidJourney V5.1)
*** Переведено с помощью www.DeepL.com/Translator (бесплатная версия) ***