Мы продолжаем тестировать нейросети и, успешно определив, какая нейросеть лучше сокращает тексты, пишет деловые письма и переводит с русского на английский и обратно, решили найти ту, которая лучше других сможет создать изображение. Главное условие – запрос при этом будет на русском, а не английском языке.
Какие нейросети включили в тестирование?
- DALL·E 3
- Kandinsky 3.0
- Шедеврум
- Нейрохолст
- TurboText
Какие нейросети в тестирование не попали?
- ChatGPT 4.0 – в этой нейросети можно генерировать картинки, при этом для генерации используется модель DALL·E 3.
- GigaChat – здесь тоже можно создавать изображения с использованием Kandinsky.
Дополнительные ограничения
Мы использовали базовое соотношение сторон, предлагаемое нейросетями. Кроме этого, по каждому запросу было сделано не более 1 генерации с 4 вариантами результатов.
Фото мужчины по простому промту
Используем запрос:
Фото мужчины в деловом костюме
И вот результаты:
DALL·E 3
![мужчина в синем костюме, генерация Далле 3 мужчина в синем костюме](/upload/medialibrary/4b8/huk8bzgcsg3wujg2i5yxazot9td1liee/1.webp)
Шедеврум
![мужчина в черном костюме, генерация Шедеврум мужчина в черном костюме](/upload/medialibrary/552/6y1x9huf4r1ckvrfy3vq78r66gixg97x/2.webp)
Kandinsky 3.0
![мужчина в черном костюме, генерация Кандинский кудрявый мужчина в черном костюме](/upload/medialibrary/f17/6hch0ydr9emhza6pliyzjkgq72juscrx/3.webp)
Нейрохолст
![мужчина в полный рост, генерация Нейрохолст мужчина в полный рост](/upload/medialibrary/d96/ncmwke6z40mmqyy5liwvell00jojao91/4.webp)
TurboText
![мужчина в сером костюме, генерация ТурбоТекст мужчина в сером костюме](/upload/medialibrary/329/w4kaes42rhsn4op0ll6lvrpap0f22vfv/5.webp)
Итоги: все нейросети с этой задачей справились достаточно хорошо, но у Dalle были замечены проблемы с пальцами.
Фото ковбоя по сложному промту
Делаем запрос более сложным:
Ковбой на лошади смотрит на каньон. На нем ковбойская шляпа, кожаная куртка и кожаные перчатки. Закат. Красные скальные образования. Река, текущая по каньону. Фото в полный рост. Драматическое освещение.
Результат:
DALL·E 3
![ковбой, генерация Далле ковбой, лошадь в профиль](/upload/medialibrary/8a3/e58qkpbg83vbrof9y6emrvae0pdcjdhy/6.webp)
Шедеврум
![ковбой, генерация Шедеврум ковбой, вид сзади](/upload/medialibrary/c5b/8rslwhagzn7akfi1f1btxfnnpubw79su/7.webp)
Kandinsky 3.0
![ковбой, генерация Кандинский ковбой, вид сверху](/upload/medialibrary/065/c6wnh9m6c1bjcfvkbt8581zzy8ts4a0e/8.webp)
Нейрохолст
![ковбой, генерация Нейрохолст ковбой, вид сзади, без солнца](/upload/medialibrary/411/kt3jqhxbfhzctrx4b1acf9ar2imveomm/9.webp)
TurboText
![ковбой, генерация ТурбоТекст ковбой, освещение сзади](/upload/medialibrary/edf/npc3ea4bk0ogum6atr1q6dop25ke5omn/10.webp)
Итоги: здесь тоже все нейросети показали неплохой результат. Поэтому переходим от фотографий людей к более сложным заданиям.
Интерфейс мобильного приложения
Посмотрим, как нейросети его представляют.
Результат:
DALL·E 3
![интерфейс, генерация Далле бежевый интерфейс](/upload/medialibrary/f86/fgk8rgn2flhg5amsktczslradps17xxo/11.webp)
Шедеврум
![интерфейс, генерация Шедеврум интерфейс на смартфоне](/upload/medialibrary/fce/05gs45hw5hu4vlkcc1br690owurcakow/12.webp)
Kandinsky 3.0
![интерфейс, генерация Кандинский интерфейс на трех устройствах](/upload/medialibrary/5c9/21mg4e2zosamu82v25ab60230kd8dyag/13.webp)
Нейрохолст
![интерфейс, генерация Нейрохолст интерфейс, набор элементов](/upload/medialibrary/fc3/oj4t27h9qc7uuuhvm9b7emgsr84c0evi/14.webp)
TurboText
![интерфейс, генерация ТурбоТекст интерфейс на смартфоне, который держит рука](/upload/medialibrary/f81/8uplxwmvm39574mrn4cjhdxk33xqwmtn/15.webp)
Итоги: однозначные лидеры в этой номинации – Далле, Шедеврум и TurboText.
Интерфейс приложения по сложному промту
Используем запрос:
Создай профессиональный интерфейс приложения для книг и документов, простой стиль с минималистской формой, светло-бежевый и красный, дизайн UX, подчеркивание супер детализации контента, белый фон
И вот результаты:
DALL·E 3
![интерфейс приложения для книг, генерация Далле интерфейс на белом фоне](/upload/medialibrary/1a4/e2rudfg9vpluez1cixt0hhmuh2e64bo4/16.webp)
Шедеврум
![интерфейс приложения для книг, генерация Шедеврум интерфейс на красном фоне](/upload/medialibrary/546/k7qgh4ghdizlveefsf3xy4jbfy2szp10/17.webp)
Kandinsky 3.0
![интерфейс приложения для книг, генерация Кандинский интерфейс на бежевом фоне](/upload/medialibrary/c3e/s5yvweustb1vmwxa4hw5jewo6eqd30u1/18.webp)
Нейрохолст
![интерфейс приложения для книг, генерация Нейрохолст интерфейс, 8 экранов](/upload/medialibrary/6e6/3tu15t7ta2gx208vhktgxgpg594gj7qe/19.webp)
TurboText
![интерфейс приложения для книг, генерация ТурбоТекст интерфейс в виде книги](/upload/medialibrary/5d6/i0b4wp8as8lyjdt1ywbppztkh95v6bqe/20.webp)
Итоги: лучше всего задачу выполнили Шедеврум и Кандинский, но как и в случае с простым промтом реально рабочего результата не показала ни одна нейросеть. Поэтому если вам нужен дизайн сайта или UI/UX-дизайн, обращайтесь в TexTerra – поможем.
Фантастический персонаж
Так как мы уже убедились, что при разработке дизайна нейросети не особо помогут, то проверим их в качестве иллюстраторов.
Промт:
динозавр в черных очках едет на мотоцикле и курит сигару
Вот результаты:
DALL·E 3
![динозавр на мотоцикле, генерация Далле динозавр с сигарой](/upload/medialibrary/3fe/w1fk0uhx5z4xpbjgxy91j8ibbyb520f5/21.webp)
Шедеврум
![динозавр на мотоцикле, генерация Шедеврум динозавр в черных очках, сзади огонь](/upload/medialibrary/984/qjasrxngbgxvs4ky0ai3h67ub8vtytvy/22.webp)
Kandinsky 3.0
![динозавр на мотоцикле, генерация Кандинский динозавр с в прозрачных очках](/upload/medialibrary/a1f/vf6ruu3mk2icz6n1jjlf3bqlxfehqd1g/23.webp)
Нейрохолст
![динозавр на мотоцикле, генерация Нейрохолст динозавр 2Д](/upload/medialibrary/c67/zbvschzah9z2vd87pclm0ahiykgao1g8/24.webp)
TurboText
![динозавр на мотоцикле, генерация ТурбоТекст динозавр без очков и без сигары](/upload/medialibrary/1aa/ndynarfmcqx3facincdrh8mhwx81z2ow/25.webp)
Итоги: лучше всего справилась нейросеть DALL·E 3: она, единственная из всех, смогла добавить указанную в промте сигару.
Набор персонажей для игры в стиле РПГ
Задаем сложный промт:
Набор персонажей для игры в стиле РПГ, средневековье, выразительные положительные и отрицательные персонажи, белый фон, высокое качество
И вот результаты:
DALL·E 3
![персонажи игры, генерация Далле 7 персонажей, 2Д графика](/upload/medialibrary/0e1/3e80gmg670am72pc8k0kx0afczp1b3fx/26.webp)
Шедеврум
![персонажи игры, генерация Шедеврум персонажи игры на сером фоне](/upload/medialibrary/0af/qa736roni3kqio321mbr6tujwfyxheg1/27.webp)
Kandinsky 3.0
![персонажи игры, генерация Кандинский 28 персонажей в светлой одежде](/upload/medialibrary/98c/8y8pxy7vjwaj2dg5v849pmw5s2ucsejw/28.webp)
Нейрохолст
![персонажи игры, генерация Нейрохолст персонажи на траве](/upload/medialibrary/170/v79cs1k6gruraldkiu441zt1onigtzpp/29.webp)
TurboText
![персонажи игры, генерация ТурбоТекст 6 персонажей](/upload/medialibrary/c62/9rag582qdeirhvqweu3cq7ddexsfl1oj/30.webp)
Итоги: лучше всего с заданием справились TurboText и Далле, создав максимально разнообразных и проработанных персонажей.
Создаем окружение в стиле аниме
Используем простой промт:
вилла на берегу моря в аниме стиле
И вот результаты:
DALL·E 3
![вилла на берегу океана, генерация Далле вилла на берегу океана](/upload/medialibrary/dde/loduns0g9s67wsz444dvg0bglash18nf/31.webp)
Шедеврум
![вилла на берегу океана, генерация Шедеврум вилла с отражением](/upload/medialibrary/527/s7yfpa1tlksygyygwnyop8hdqrbnb9fv/32.webp)
Kandinsky 3.0
![вилла на берегу океана, генерация Кандинский вилла с лестницей в воду](/upload/medialibrary/cff/3z0ltjx0p7nzoy77901lwc80seprk6tb/33.webp)
Нейрохолст
![вилла на берегу океана, генерация нейрохолст вилла с бассейном]( /upload/medialibrary/eb0/zxhuvtbu1e86vo8s5li0d798yr0sey8p/34.webp)
TurboText
![вилла на берегу океана, генерация ТурбоТекст вилла без выхода на пляж](/upload/medialibrary/427/yqlsy5kaft35i40qq0ttxvop5k8fu0cr/35.webp)
Итоги: лучше всего справились Kandinsky 3.0, Dalle-3 и TurboText т.к. в сгенерированных изображениях присутствует океан, а не просто часть бассейна.
Дизайн интерьера по сложному промту
Используем запрос:
Индустриальный дизайн интерьера, монохромные палитры серых тонов, необработанные и грубые материалы с современными элементами.
Результат:
DALL·E 3
![дизайн интерьера, генерация Далле дизайн с шестеренками](/upload/medialibrary/c7c/86qcezozg1nuo20i25mfa31cwluujhtw/36.webp)
Шедеврум
![дизайн интерьера, генерация Шедеврум дизайн с горящей лампой](/upload/medialibrary/b62/e8hg1i4wmlrebn02csphcv7ke8rm8jnl/37.webp)
Kandinsky 3.0
![дизайн интерьера, генерация Кандинский дизайн с трубами на стенах и потолке](/upload/medialibrary/c8f/o9yteyqvcx8kiff608z4u8op3jre4odi/38.webp)
Нейрохолст
![дизайн интерьера, генерация Нейрохолст дизайн с настольной лампой](/upload/medialibrary/8c3/axopvwwc48jaz1mlt5pw11baqoniuoag/39.webp)
TurboText
![дизайн интерьера, генерация ТурбоТекст дизайн с трубами на потолке](/upload/medialibrary/a33/dzmjqop50yo54ru2nviikr5hq6t7kz45/40.webp)
Итоги: максимально реалистичные изображения получились у Шедеврума и Kandinsky 3.0, в остальных есть, пусть и не всегда бросающиеся в глаза, но неаккуратные и невозможные в настоящем мире детали.
Творческая работа
Как нейросети изображают различные объекты мы посмотрели выше, а теперь давайте взглянем, как будет выглядеть отсутствие объектов.
Используем промт:
бесконечная пустота
Вот результаты:
DALL·E 3
![бесконечная пустота, генерация Далле черный круг и человек](/upload/medialibrary/ff8/x2guq28iynpx7q17ixja867ukbrywuxh/41.webp)
Шедеврум
![бесконечная пустота, генерация Шедеврум человек на дороге](/upload/medialibrary/553/op207ekuu4qyzvi1m77n6kfq72y1te2d/42.webp)
Kandinsky 3.0
![бесконечная пустота, генерация Кандинский человек на фоне круглого отверстия](/upload/medialibrary/d5a/42di9aj5aq83tjd5yyn2vv0dj6eyqa2r/43.webp)
Нейрохолст
![бесконечная пустота, генерация Нейрохолст черно-белый пейзаж](/upload/medialibrary/e71/92gm5ubel1pp9w1q2by9ivl278ar3hm6/44.webp)
TurboText
![бесконечная пустота, генерация ТурбоТекст фантастический пейзаж](/upload/medialibrary/2ad/2hcmj6lx3y1aaou2tqrf223ix7qnjwup/45.webp)
Итоги:здесь оценка будет очень субъективной, но я отдам предпочтение Нейрохолсту и TurboText, потому что в их генерациях отсутствуют люди. А пустота подразумевает именно это.
Итоги теста
Если бы за попадание в мини-финалы по каждой категории присуждались баллы, то в итоговые лидеры попал бы Dall·e 3 и TurboText, а почетное второе место разделили бы Шедеврум и Kandinsky. Но при выборе нейросети немаловажным фактором является еще и ее стоимость, и если учесть этот фактор, то тройка лидеров выглядит как Dalle-3, Шедеврум и Kandinsky. Ведь использовать их можно бесплатно.
При этом стоит учитывать, что ИИ сейчас хорош в создании фотографий и иллюстраций, но не при разработке полноценного дизайна.
Читайте также:
Нейросеть Midjourney: полный гайд по созданию фото
Гайд – реалистичные изображения и их обработка в Stable Diffusion
Как составлять запросы к нейросетям: примеры, настройки, параметры