Главная Блог Texterra Тест нейросети YandexART — это прямо уровень DALL-E 2

Тест нейросети YandexART — это прямо уровень DALL-E 2

Она внедрена в сервис «Шедеврум», хорошо понимает промты по-русски и работает на всех устройствах.

Новости Яндекс Нейросети

Дата публикации: 5 апр 2023

Дата обновления: 19 окт 2023

9 минут

7 324

Сервис «Шедеврум» от Яндекса позволяет бесплатно генерировать текст и изображения при помощи нейросети. 18 октября компания внедрила в его работу нейросеть YandexART, а мы протестировали новинку и сравнили её с тем, что было раньше.

Как попасть в Шедеврум

Опробовать приложение одним из первых может каждый — Шедеврум доступен на iOS и Android. Установка проходит очень быстро, а после открытия приложение автоматически входит в ваш Яндекс ID, если вы ранее подключались к аккаунту в Яндексе через браузер на смартфоне.

Интерфейс приложения пока довольно простой — большую часть экрана занимает лента с публикациями других пользователей. Их можно отсортировать по времени и количеству лайков. Также под каждой сгенерированной фотографией можно увидеть запрос, по которому она была сделана.

Смотреть галерею

Чтобы самому сгенерировать картинку, нужно нажать на «плюсик» в правом верхнем углу рядом с иконкой профиля. В ответ приложение скажет вам, что доступно оно не для всех и предложит присоединиться к списку ожидания. Присоединяемся и ждем уведомления (только их надо разрешить). В среднем одобрение занимает от 2 до 10 минут на момент написания статьи.

После получения доступа мы можем воспользоваться всем функционалом приложения. Он традиционный — вводим текстовый запрос, ждем результатов и получаем четыре картинки на выбор. И тут есть три варианта: отредактировать запрос и запустить генерацию по новой, удалить картинку и опубликовать одно из изображений.

Это лишь бета-версия, поэтому никакого апскейлинга (увеличения и дополнительной проработки деталей) или генерации новых вариантов на основе понравившейся картинки в приложении нет. Скорее всего, эти функции появятся в будущем.

Картины Шедеврума

Мы протестировали Шедеврум и вот что можем сказать:

нейросеть хорошо понимает русский (что неудивительно) и английский;
из-за высокой популярности генерация может затягиваться на десятки минут вместо обещанных «менее 1 минуты»;
уровень детализации пока довольно низкий — лица и объекты порой расплываются или сливаются, много артефактов;
уровень «понимания» промта – на уровне первой версии Stable Diffusion: нейросеть понимает отдельные части запроса, но не всегда может собрать их в единое целое.
Шедеврум хорошо генерирует портреты девушек — посмотрите на заставочную картинку этой статьи.

Посмотрите на результаты наших тестов. Мы использовали четыре запроса:

футуристический дизайн пользовательского интерфейса мобильного приложения умный дом ios чистый, ясный, воздушный, легкий, простой, вид спереди, стиль: 4k
кот-пират на паруснике, синий и белый, яркие краски, пейзаж в стиле studio ghibi, качество максимум
cat fight with dog, mortal kombat style, vibrant colors, 4k
утконос делает зарядку

Вот что выдал нам Шедеврум:

Смотреть галерею

Как видно, нейросеть от Яндекса пока обучена недостаточно хорошо — по крайней мере, на изображениях животных и различных стилях.

Шедеврум с YandexART

18 октября «Яндекс» внедрил в сервис модель Yandex AI Rendering Technology — сокращенно YandexART. Это диффузионная модель, чем-то напоминающая Stable Diffusion по методу своей работы. Но, в отличие от SD, в основе YandexART лежит не стабильная, а каскадная диффузия. Вот как описывают метод работы нейросети представители «Яндекса»:

«При обучении модели изображения «портят», добавляя к ним случайный шум, как при диффузии жидкости или газа. Затем их показывают модели, задача которой — «восстановить» изображение».

Неизвестно, какая нейросеть лежала в основе алгоритмов «Шедеврума» ранее, однако с YandexART генерации стали заметно лучше. Судя по всему, инженеры компании смогли собрать достаточно большой объем данных, который позволил качественно обучить новую модель.

Мы решили повторить те же самые промты, что давали первой версии «Шедеврума» и вот что у нас вышло:

Смотреть галерею

Картины стали более детальными, а нейросеть стала лучше понимать промт — теперь она хорошо распознает стили, в которых нужно сгенерировать изображение, и объекты, которые должны быть на нём.

Если сравнивать с существующими аналогами на рынке, творения YandexART можно сравнить с Kandinsky 2.1 (до версии 2.2 нейросеть «Яндекса» еще не дотягивает), DALL-E 2 (DALL-E 3, опять же, находится на уровень выше) и с Stable Diffusion 2.1. Результат очень достойный и многообещающий. Учитывая прогресс других нейросетевых моделей «Яндекса», можно ожидать, что следующая версия YandexART уже будет лучше Kandinsky 2.2 и выйдет на уровень передовой MidJourney 5.2.

В Шедеврум добавили YandexGPT

15 июня «Шедеврум» получил масштабное обновление — в сервис внедрили языковую модель YandexGPT (YaLM 2.0). Это российский аналог ChatGPT, который распознает запрос пользователя и в ответ на него генерирует текст.

Теперь в приложении «Шедеврума» можно сгенерировать не только изображение, но и текст с иллюстрацией. Например, при помощи YandexGPT можно написать короткий рассказ, сочинить слоган, объявление, приглашение на вечеринку или «просто придумать весёлую шутку» — так утверждают разработчики. Готовый текст с картинкой публикуется в общей ленте, где пользователи могут ставить лайки, смотреть популярные работы и подписываться друг на друга.

Чтобы написать текст при помощи YandexGPT, зайдите в приложение «Шедеврум», нажмите на знак «+» в правом верхнем углу и в выпадающем меню нажмите «Текст». Теперь введите текстовый запрос, после чего отправьте его на генерацию.

После обновления нейросеть «Яндекса» стала намного быстрее, поэтому результат — текст с иллюстрацией – вы получите примерно за минуту или даже меньше.

Нейросеть Шедеврум после обновления сочиняет тексты

Смотреть галерею

Мы протестировали эту функцию — попросили нейросеть написать рассказ в детективном жанре про кота и трех поросят. Вот какой текстовый результат выдал нам алгоритм YandexGPT:

«Жил-был кот по имени Василий. Он был очень умным и хитрым котом, который любил проводить время в поисках приключений. Однажды он услышал о трех поросятах, которые жили в лесу и были очень богатыми.

Василий решил отправиться в лес на поиски поросят. Он знал, что у них есть много золота и серебра, и он хотел украсть их богатства. Но поросята были очень умными и знали, что кот может попытаться украсть их золото и серебро. Поэтому они построили крепкую стену вокруг своего дома, чтобы защитить свои богатства.

Но Василий не сдавался. Он решил использовать свою хитрость и ловкость, чтобы проникнуть в дом поросят. Он нашел дыру в стене и начал пробираться внутрь. Но поросята заметили его и начали преследовать его.

Кот был очень ловким и быстрым, он убегал от поросят, прятался за кустами и деревьями. Но поросята не отставали от него. Они были очень злыми и хотели наказать кота за его попытку украсть их богатство.

В конце концов, кот понял, что ему не удастся украсть золото и серебро поросят. Он решил убежать от них и вернуться домой. Но поросята продолжали преследовать его, они были очень злы на него.

Наконец, кот смог убежать от поросят и вернуться домой. Он был очень уставшим и голодным, но он был доволен тем, что смог избежать наказания от поросят».

Что сказать — по стилистике рассказ вполне тянет на произведение 7-8-летнего ребенка. Тем не менее, YandexGPT заметно лучше пишет на русском языке, чем ChatGPT, хотя и допускает много повторов как внутри предложений, так и внутри абзацев. Детектив, конечно, не получился, но тут, скорее всего, дело в алгоритме, который распознает запрос пользователя — после дообучения российская нейросеть станет понимать вас намного лучше. Порадовали иллюстрации, которые «Шедеврум» сгенерировал к этому рассказу. Ежик оказался не к месту, но коты получились красивыми:

В следующем тесте посмотрели, как нейросеть справляется с более серьезным форматом — постами в соцсетях. Попросили YandexGPT в «Шедевруме» написать два поста про интернет-магазины сначала для целевой аудитории из маркетологов, затем — из предпринимателей.

Оказалось, что картинки нейросеть генерирует невпопад — всего одно изображение более-менее подходило на обложку. На остальных были либо животные, либо какие-то апокалиптические пейзажи:

Пост по-началу кажется хорошим, но если сравнить два сгенерированных YandexGPT текста, окажется, что нейросеть просто подставляет в какой-то шаблон разные слова. Например, вот отрывок из поста для маркетологов:

«…Целевая аудитория интернет-магазина – это маркетологи. Они занимаются продвижением товаров и услуг, анализируют рынок и конкурентов, разрабатывают стратегии маркетинга. Маркетологи могут использовать интернет-магазин для тестирования новых продуктов и услуг, а также для анализа эффективности своих маркетинговых кампаний».

А вот из поста для предпринимателей:

«…Целевая аудитория интернет-магазинов – это предприниматели, которые хотят быстро и эффективно решать свои бизнес-задачи. Они ищут качественные товары и услуги по доступным ценам, а также удобный способ оплаты и доставки».

Так что использовать этот сервис для рабочих задач сейчас не получится — создан он скорее для развлечения.

YandexGPT впервые стал доступен 17 мая в новом режиме голосового помощника «Алисы» под названием «Давай придумаем». Мы уже рассказывали о нем, но с тех пор часть недостатков языковой модели исправили — теперь «Алиса» понимает контекст и может поддерживать диалог.

Пока нейросети не могут создать качественный логотип — зато можем мы! У специалистов TexTerra вы можете заказать логотип, а мы отвечаем за качество и оперативность.