Реклама в ПромоСтраницах – запустим быстро!

Заказать звонок
Телефон отдела продаж:
8 (800) 775-16-41
Наш e-mail:
mail@texterra.ru
Заказать услугу
Китайская нейросеть захватывает мир: она обойдет DALL-E? Редакция «Текстерры»
Редакция «Текстерры»

В последнее время число нейросетей, генерирующих изображения, растет как на дрожжах. Но вот китайский техногигант Baidu заявляет, что его новый алгоритм ERNIE-ViLG ничуть не хуже популярных Stable Diffusion, Midjourney и DALL-E. Что ж, давайте проверим.

Чем примечательна нейросеть от Baidu?

Для начала — о названии. Аббревиатура ERNIE-ViLG расшифровывается как Enhanced Representation through Knowledge Integration — Vision Language Generation («расширенное представление за счет интеграции знаний — языковая генерация изображений»).

Судя по всему, алгоритм генерации ERNIE-ViLG очень похож на ту технологию, что использует Stable Diffusion. Однако отличает их прежде всего набор данных, использованных для обучения.

Примечательна новая китайская нейросеть прежде всего тем, что она бесплатна и никаких ограничений на генерацию изображений у нее нет. Более того, ее можно использовать и по API — прикрутить нейросеть к своему сервису или сайту не составит труда (кстати, у нас вы можете заказать сайт — прим. отдела продаж TexTerra). Протестировать демо-версию нейросети вы можете на сайте Hugging Face.

Но есть одно НО: этот алгоритм создан под китайских пользователей и, соответственно, настроен под генерацию изображений из описаний на китайском языке. В демо-версии вы, однако, можете ввести запрос на английском языке. Но, судя по всему, программа затем переводит его на китайский и из полученного словосочетания генерирует образ. Надеемся, что с английского на китайский программа переводит лучше, чем AliExpress с китайского на русский.

Продвинем ваш бизнес
Подробнее

Как сгенерировать изображение в китайской нейросети

Вы и сами можете бесплатно и без регистрации сгенерировать изображение при помощи ERNIE-ViLG и оценить ее возможности. Для этого надо зайти на сайт проекта и просто набрать запрос на английском в единственной строке. После этого нажимаем Generate Image и ждем. Подождать придется прилично, но зато программа бесплатная и с неограниченным количеством попыток.

Внизу в разделе Examples можно посмотреть примеры фраз, которые можно задать программе, если вам в голову ничего не приходит. Большая часть из них на китайском, но попробовать перевести на русский или английский не составит труда.

Отдельно можно выбрать и стиль рисунка. Это, кстати, отличительная черта китайской нейросети — в большинстве подобных программ стиль вводится в сам запрос и алгоритм не всегда понимает, о чем идет речь. Стили представлены на китайском, но с переводом на английский в скобках. Из выпадающего списка вы можете выбрать нужный.

Наши результаты

Стоит сказать, что протестировать нейросеть мне удалось не сразу — поначалу в ответ на любой запрос программа выдавала ошибку. Позже, судя по всему, этот баг пофиксили и я смог сгенерировать несколько изображений. Один запрос взял из подсказок — «A cat with glasses» — и решил сделать его в стиле аниме. Вот что вышло:

Нейросеть ERNIE-ViLG

По изображению косяков практически не заметно, однако я ведь задавал вопрос сгенерировать именно кота, а не «кошкодевочку». Во втором запросе решил снова попросить нейросеть сделать кота, но на этот раз с мечом и верхом на драконе (на обложке этой статьи вы можете посмотреть, как с этим заданием справилась DALL-E 2) в мультяшном стиле. Вот что показала китайская нейросеть:

Нейросеть ERNIE-ViLG

В общем, вышло неплохо, но вопрос один: где дракон?

Еще один запрос пришел в голову спонтанно — я дал нейросети задачу сгенерировать «большое количество китайцев на Ноевом ковчеге» в стиле киберпанк. Получилось неплохо, но ни китайцев, ни Ноевого ковчега я не заметил:

Нейросеть ERNIE-ViLG

В общем, по итогам теста можно сказать, что особой точностью китайская нейросеть не отличается. Скорее всего, гораздо лучшие результаты алгоритм сможет показать, если изначально задавать ему запросы на китайском — возможно, перевод с английского портит восприятие семантики языка. Не скажу, что ERNIE-ViLG хуже других подобных нейросетей, но уж точно не лучше.

Читайте также:

Есть ли в фотобанках работы нейросетей? Разбираемся

Нейросеть от ​​DeviantArt возмутила художников. Она крадет их работы

Лучшие нейросети-2022 – сгенерят лицо, уберут фон, придумают логотип

Поделиться статьей:

Новое на сайте

29 апр 2025
1 264
SMM в сложной нише: кейс продвижения в социальных сетях медицинского B2B-продукта

Медицина, B2B, контроль дезинфекции и стерилизации — не самая очевидная ниша для продвижения в соцсетях. Но именно здесь мы выстроили эффективную SMM-стратегию для компании «Винар»: в рилс — разборы ГОСТов, вместо блогеров — кот Хеликс. Результат — 30 тысяч подписчиков и 4,5 млн охвата во ВКонтакте.

25 апр 2025
3 706
Трафик в 2,3 раза больше, а выручка падает: как SEO-продвижение выявило сбой в продажах

Компания «Метросервис» пришла в «Текстерру» за SEO и контекстом, а получила еще и аудит отдела продаж. Пока трафик с сайта рос, продажи шли вниз — выяснили, почему так вышло, и помогли исправить.

Смотреть все статьи

У вас есть деловой запрос? Давайте обсудим!

Оставьте свои контакты, мы свяжемся с вами в ближайшее время.

Нажимая на кнопку «Оставить заявку», вы подтверждаете свое согласие на обработку пользовательских данных

Спасибо!

Ваша заявка принята. Мы свяжемся с вами в ближайшее время.