Яндекс выложил в открытый доступ бета-версию своей нейросети для генерации картинок под названием Шедеврум. Пока попасть в нее можно только через лист ожидания, но результаты первых тестов впечатляют.
Как попасть в Шедеврум
Опробовать приложение одним из первых может каждый — Шедеврум доступен на iOS и Android. Установка проходит очень быстро, а после открытия приложение автоматически входит в ваш Яндекс ID, если вы ранее подключались к аккаунту в Яндексе через браузер на смартфоне.
Интерфейс приложения пока довольно простой — большую часть экрана занимает лента с публикациями других пользователей. Их можно отсортировать по времени и количеству лайков. Также под каждой сгенерированной фотографией можно увидеть запрос, по которому она была сделана.
Чтобы самому сгенерировать картинку, нужно нажать на «плюсик» в правом верхнем углу рядом с иконкой профиля. В ответ приложение скажет вам, что доступно оно не для всех и предложит присоединиться к списку ожидания. Присоединяемся и ждем уведомления (только их надо разрешить). В среднем одобрение занимает от 2 до 10 минут на момент написания статьи.
После получения доступа мы можем воспользоваться всем функционалом приложения. Он традиционный — вводим текстовый запрос, ждем результатов и получаем четыре картинки на выбор. И тут есть три варианта: отредактировать запрос и запустить генерацию по новой, удалить картинку и опубликовать одно из изображений.
Это лишь бета-версия, поэтому никакого апскейлинга (увеличения и дополнительной проработки деталей) или генерации новых вариантов на основе понравившейся картинки в приложении нет. Скорее всего, эти функции появятся в будущем.
Картины Шедеврума
Мы протестировали Шедеврум и вот что можем сказать:
- нейросеть хорошо понимает русский (что неудивительно) и английский;
- из-за высокой популярности генерация может затягиваться на десятки минут вместо обещанных «менее 1 минуты»;
- уровень детализации пока довольно низкий — лица и объекты порой расплываются или сливаются, много артефактов;
- уровень «понимания» промта – на уровне первой версии Stable Diffusion: нейросеть понимает отдельные части запроса, но не всегда может собрать их в единое целое.
- Шедеврум хорошо генерирует портреты девушек — посмотрите на заставочную картинку этой статьи.
Посмотрите на результаты наших тестов. Мы использовали четыре запроса:
- футуристический дизайн пользовательского интерфейса мобильного приложения умный дом ios чистый, ясный, воздушный, легкий, простой, вид спереди, стиль: 4k
- кот-пират на паруснике, синий и белый, яркие краски, пейзаж в стиле studio ghibi, качество максимум
- cat fight with dog, mortal kombat style, vibrant colors, 4k
- утконос делает зарядку
Вот что выдал нам Шедеврум:
Как видно, нейросеть от Яндекса пока обучена недостаточно хорошо — по крайней мере, на изображениях животных и различных стилях.
В Шедеврум добавили YandexGPT
15 июня «Шедеврум» получил масштабное обновление — в сервис внедрили языковую модель YandexGPT (YaLM 2.0). Это российский аналог ChatGPT, который распознает запрос пользователя и в ответ на него генерирует текст.
Теперь в приложении «Шедеврума» можно сгенерировать не только изображение, но и текст с иллюстрацией. Например, при помощи YandexGPT можно написать короткий рассказ, сочинить слоган, объявление, приглашение на вечеринку или «просто придумать весёлую шутку» — так утверждают разработчики. Готовый текст с картинкой публикуется в общей ленте, где пользователи могут ставить лайки, смотреть популярные работы и подписываться друг на друга.
Чтобы написать текст при помощи YandexGPT, зайдите в приложение «Шедеврум», нажмите на знак «+» в правом верхнем углу и в выпадающем меню нажмите «Текст». Теперь введите текстовый запрос, после чего отправьте его на генерацию.
После обновления нейросеть «Яндекса» стала намного быстрее, поэтому результат — текст с иллюстрацией – вы получите примерно за минуту или даже меньше.
Мы протестировали эту функцию — попросили нейросеть написать рассказ в детективном жанре про кота и трех поросят. Вот какой текстовый результат выдал нам алгоритм YandexGPT:
«Жил-был кот по имени Василий. Он был очень умным и хитрым котом, который любил проводить время в поисках приключений. Однажды он услышал о трех поросятах, которые жили в лесу и были очень богатыми.
Василий решил отправиться в лес на поиски поросят. Он знал, что у них есть много золота и серебра, и он хотел украсть их богатства. Но поросята были очень умными и знали, что кот может попытаться украсть их золото и серебро. Поэтому они построили крепкую стену вокруг своего дома, чтобы защитить свои богатства.
Но Василий не сдавался. Он решил использовать свою хитрость и ловкость, чтобы проникнуть в дом поросят. Он нашел дыру в стене и начал пробираться внутрь. Но поросята заметили его и начали преследовать его.
Кот был очень ловким и быстрым, он убегал от поросят, прятался за кустами и деревьями. Но поросята не отставали от него. Они были очень злыми и хотели наказать кота за его попытку украсть их богатство.
В конце концов, кот понял, что ему не удастся украсть золото и серебро поросят. Он решил убежать от них и вернуться домой. Но поросята продолжали преследовать его, они были очень злы на него.
Наконец, кот смог убежать от поросят и вернуться домой. Он был очень уставшим и голодным, но он был доволен тем, что смог избежать наказания от поросят».
Что сказать — по стилистике рассказ вполне тянет на произведение 7-8-летнего ребенка. Тем не менее, YandexGPT заметно лучше пишет на русском языке, чем ChatGPT, хотя и допускает много повторов как внутри предложений, так и внутри абзацев. Детектив, конечно, не получился, но тут, скорее всего, дело в алгоритме, который распознает запрос пользователя — после дообучения российская нейросеть станет понимать вас намного лучше. Порадовали иллюстрации, которые «Шедеврум» сгенерировал к этому рассказу. Ежик оказался не к месту, но коты получились красивыми:

В следующем тесте посмотрели, как нейросеть справляется с более серьезным форматом — постами в соцсетях. Попросили YandexGPT в «Шедевруме» написать два поста про интернет-магазины сначала для целевой аудитории из маркетологов, затем — из предпринимателей.
Оказалось, что картинки нейросеть генерирует невпопад — всего одно изображение более-менее подходило на обложку. На остальных были либо животные, либо какие-то апокалиптические пейзажи:

Пост по-началу кажется хорошим, но если сравнить два сгенерированных YandexGPT текста, окажется, что нейросеть просто подставляет в какой-то шаблон разные слова. Например, вот отрывок из поста для маркетологов:
«…Целевая аудитория интернет-магазина – это маркетологи. Они занимаются продвижением товаров и услуг, анализируют рынок и конкурентов, разрабатывают стратегии маркетинга. Маркетологи могут использовать интернет-магазин для тестирования новых продуктов и услуг, а также для анализа эффективности своих маркетинговых кампаний».
А вот из поста для предпринимателей:
«…Целевая аудитория интернет-магазинов – это предприниматели, которые хотят быстро и эффективно решать свои бизнес-задачи. Они ищут качественные товары и услуги по доступным ценам, а также удобный способ оплаты и доставки».
Так что использовать этот сервис для рабочих задач сейчас не получится — создан он скорее для развлечения.
YandexGPT впервые стал доступен 17 мая в новом режиме голосового помощника «Алисы» под названием «Давай придумаем». Мы уже рассказывали о нем, но с тех пор часть недостатков языковой модели исправили — теперь «Алиса» понимает контекст и может поддерживать диалог.
Пока нейросети не могут создать качественный логотип — зато можем мы! У специалистов TexTerra вы можете заказать логотип, а мы отвечаем за качество и оперативность.
Читайте также:
Нейросети увольняют дизайнеров (ну, почти): пример Tiffany и Nike
Китайская нейросеть делает из вас персонажа аниме. Бесплатно
Как составлять запросы к нейросетям: примеры, настройки, параметры