SEO-продвижение сайта от 150 000 рублей

Заказать звонок
Телефон отдела продаж:
8 (800) 775-16-41
Наш e-mail:
mail@texterra.ru
Заказать услугу
Лучшая нейросеть для создания картинок Редакция «Текстерры»
Редакция «Текстерры»

Midjourney, Dalle 2, Stable Diffusion… Многие уже слышали эти названия. Но нейросетей для генерации визуального контента намного больше! Мы проверили, как самые известные справляются с созданием картинок по англоязычному промту, и выбрали лидеров. Чтобы сравнение было максимально корректным, использовали три категории изображений: фото человека, предметную фотографию и создание фантастического существа в необычном антураже. А также два типа промтов — краткие и подробные.

Какие нейросети включили в тестирование?

  • Midjourney (версия 5.2)
  • Stable Diffusion (модель SDXL v1.0)
  • Blue Willow
  • Starryai
  • Шедеврум
  • Dalle-2
  • Dream by Wombo
  • Kandinsky 2.0

Кто в него не попал?

  • Все нейросети, работающие на различных версиях Stable Diffusion, так как результаты не имеют принципиальных отличий между собой.
  • Нейросети, заточенные под выполнение одной задачи, например создание лиц, такие как Artbreeder.
  • И, наконец, те нейросети, чьи результаты не тянут даже на приемлемые, например Craiyon.

Дополнительные ограничения

Мы использовали базовое соотношение сторон, предлагаемое нейросетями. Чаще всего это было 1:1, но не только. Еще одним ограничением было количество генераций. Для получения результата было сделано не более 1 генерации с 4 вариантами результатов.

Фото девушки по простому промту

Используем простейший промт:

photo of a young woman

А теперь сравниваем результаты.

Midjourney

рыжая девушка

Stable Diffusion

девушка в белой блузке

Blue Willow

четыре девушкидевушка в желтом

starryai

девушка в джинсовке

Шедеврум

девушка киберпанк

Dalle-2

девушка вамп

Dream by Wombo

кудрявая девушка

Kandinsky 2.0

девушка ретро

В этом раунде неплохо проявили себя все нейросети. При этом Blue Willow дала максимальный разброс вариантов, а Шедеврум и Dalle 2 продемонстрировали оригинальные типажи. А вот Midjourney, Stable Diffusion и Кандинский сделали максимально реалистичные фото.

Продвинем ваш бизнес
Подробнее

Фото женщины по сложному промту

Используем длинный промт, чтобы сделать фото длинноволосой монгольской женщины, одетой в красный лонгслив, сидящей на кухне и пьющей кофе:

Narrative lifestyle photo, medium-full, front view of a 48-year-old long-haired Mongolian woman sitting in her kitchen wearing a long-sleeve red top and looking very happy and smiling with her high quality cup of coffee she's drinking

Midjourney

фото азиатки

Stable Diffusion

азиатка с двумя чашками

Blue Willow

азиатка с черной чашкой

starryai

азиатка в желтом

Шедеврум

азиатка c белой чашкой с рисунком

Dalle-2

азиатка с белой чашкой без рисунка

Dream by Wombo

азиатка девочка

Kandinsky 2.0

азиатка с двумя чашками-2

Проблема с руками, увы, до сих пор остается у большинства нейросетей. Меньше всего замечаний тут у Midjourney, но еще хочется отметить неплохую работу starryai. Да, она сменила цвет и тип одежды, но в целом получилось очень неплохо.

Предметная фотография

Возьмем в качестве объекта бутылку вина и посмотрим на результат. Промт:

product photo of a white wine bottle

Midjourney

бутылка, бокал и дерево

Stable Diffusion

бутылка и грозд

Blue Willow

бутылка и закат

starryai

бутылка Minde Hinzzie

Шедеврум

бутылка на сером фоне

Dalle-2

бутылка обрезанная

Dream by Wombo

бутылка вертикальное фото

Kandinsky 2.0

бутылка на черном фоне

Midjourney, Шедеврум и Blue Willow создали изображения, радующие взгляд. Dream by Wombo, Stable Diffusion и Kandinsky тоже постарались, но не дотянули. А вот starryai и Dalle 2 не справились с задачей.

При этом стоит заметить, что когда мы генерируем изображения человека, то самой сложной частью для нейросетей являются руки, а когда работаем с предметной фотографией, то сложность представляют надписи. Пока что возможности нейросетей позволяют создавать лишь наборы букв, напоминающие реальные слова.

Предметная фотография по сложному промту

Попробуем сделать фотографию красной помады на фоне разлетающейся красной пыли:

Commercial photography, powerful explosion of red dust, designer lipstick, white lighting, white background, high resolution photography, motion blur

Midjourney

помада

Stable Diffusion

помада диагональ

Blue Willow

помада без пыли

starryai

девушка и дым

Шедеврум

помада крупные брызги

Dalle-2

пыль

Dream by Wombo

помада, вертикальный кадр

Kandinsky 2.0

помада обрубленная

Midjourney и Stable Diffusion справились с поставленной задачей лучше всех. Dream by Wombo и Шедеврум тоже выдали неплохой результат, а вот остальные не порадовали.

Сказочное существо

Ну а теперь от фотографий перейдем к творчеству и предложим нейросетям создать милое существо:

sweet fantastic creature made full of diamonds

Midjourney

белый жаб

Stable Diffusion

белый недолев

Blue Willow

русалочка

starryai

почти лис

Шедеврум

разноцветное существо

Dalle-2

синий непойми-кто

Dream by Wombo

2 существа

Kandinsky 2.0

синий варан

Оценка результатов данного этапа будет очень субъективной, но мне больше всего понравилось то, что получилось у Midjourney и Kandinsky.

Сказочное существо в необычном окружении

Попробуем посмотреть, что создадут нейросети, получив задачу изобразить человекообразного чат-бота на фоне средневековой улицы:

movie scene from film about anthropomorphic chatbot, an old street in a medieval in the background, spatial perspective concept art

Midjourney

робот справа

Stable Diffusion

робот в плаще по центру

Blue Willow

робот по центру с квадратной головой

starryai

робот слева

Шедеврум

робот слева, ч/б

Dalle-2

робот кракозябр справа

Dream by Wombo

робот 2 штуки

Kandinsky 2.0

робот рыцарь

Тройка лидеров – Midjourney, Stable Diffusion и starryai. Шедеврум тоже создал неплохой результат, и мог бы попасть в лидеры, если бы он был в цвете.

Итоги

Midjourney – справляется со всем и всегда. Единственный минус этой нейросети – невозможность бесплатного использования.

Хорошей альтернативой станет Stable Diffusion или Шедеврум.

Blue Willow, Starryai и Kandinsky могут выдать неожиданно удачный результат, но далеко не по всем запросам.

А вот Dalle 2 и Dream by Wombo пока оставляют желать лучшего.

Но если вам нужно создать логотип или разработать фирменный стиль, то на нейросети пока полагаться рано. Обращайтесь к профессионалам, поможем!

Читайте также:

Нейросеть Midjourney: полный гайд по созданию фото

Гайд – реалистичные изображения и их обработка в Stable Diffusion

Как составлять запросы к нейросетям: примеры, настройки, параметры

Поделиться статьей:

Новое на сайте

21 ноя 2024
19 514
TTFB, или время ответа сервера: как увеличить скорость загрузки сайта

TTFB, или время ответа сервера, – это одна из первых характеристик, на которую необходимо смотреть, если скорость загрузки сайта вас не устраивает.

21 ноя 2024
220
Образы мужчин и женщин в рекламе – в половине случаев они бьют мимо, но есть нюансы

Положительный образ человека в рекламе – выгодная инвестиция, но есть нюансы: многим не нравится то, как их видят и показывают рекламщики.

Смотреть все статьи

У вас есть деловой запрос? Давайте обсудим!

Оставьте свои контакты, мы свяжемся с вами в ближайшее время.

Нажимая на кнопку «Оставить заявку», вы подтверждаете свое согласие на обработку пользовательских данных

Спасибо!

Ваша заявка принята. Мы свяжемся с вами в ближайшее время.