Top.Mail.Ru

Наш подход бустит продажи. Вы платите за результат!

Заказать звонок
Телефон отдела продаж:
8 (800) 775-16-41
Наш e-mail:
mail@texterra.ru
Заказать услугу
Новая Stable diffusion XL — возможно, лучше MidJourney [обновлено] Редакция «Текстерры»
Редакция «Текстерры»

Первая версия нейросети Stable diffusion вышла в августе 2022 года. Спустя почти год нейросеть с открытым исходным кодом шагнула далеко вперед: версия Stable diffusion XL, которая стала общедоступной 27 июля, может конкурировать даже с последними версиями конкурента MidJourney.

Что такое нейросеть Stable Diffusion

Эта программа — дело рук разработчиков из компании stability.ai, которая занимается поддержкой и развитием проектов, связанных с искусственным интеллектом. Например, в их резюме — проект CAIAC, миссия которого заключается в борьбе с COVID-19 при помощи алгоритмов искусственного интеллекта, децентрализованное сообщество исследователей ИИ EleutherAI и общественная НКО LAION, цель которой — создать мощный ИИ с открытым исходным кодом.

Stable Diffusion — инструмент с открытым исходным кодом, который, по словам создателей, «позволит миллиардам людей создавать потрясающие произведения искусства за секунды».

Стоит сказать, что Stable Diffusion — не совершенно новая, написанная с нуля нейросеть. В ее основе — лучшие подобные программы, в том числе Dall-E 2 от Open AI и Imagen от Google Brain. Однако эта нейросеть использует модель так называемой скрытой диффузии вместо стандартной диффузионной модели, которая лежит в основе работы большинства современных нейросетей, генерирующих изображения по текстовому описанию. Стандартные модели работают с отдельными пикселями, из-за чего генерация с их помощью картинки в хорошем качестве занимает много времени и вычислительных ресурсов. Модель скрытой диффузии оптимизирует процесс генерации изображений за счет предварительно обученных подпрограмм — это позволяет как сэкономить вычислительные мощности, так и добиться высокого разрешения картинки за короткое время.

Но любая теория проверяется на практике!

Продвинем ваш бизнес
Подробнее

Тест работы Stable Diffusion

Разработчики Stable Diffusion придерживаются принципов открытости, поэтому выложили исходный код нейросети на GitHub. Вы можете скачать файлы программы и попробовать запустить ее на своем устройстве, однако учтите, что просто для того, чтобы нейросеть работала, ей нужно не менее 6,9 Гб видеопамяти.

Если ваш компьютер, как мой MacBook, например, не такой мощный — можно воспользоваться одним из двух онлайн-сервисов:

  • Hugging Face — тут можно генерировать неограниченное количество изображения без регистрации.
  • DreamStudio — здесь понадобится регистрация, но после нее можно также создавать сколь угодно много картинок.

На этих сервисах можно опробовать и самую передовую модель Stable Diffusion XL 1.0. Модель содержит 3,5 млрд параметров и позволяет создавать изображения с разрешением 1 мегапиксель за секунды. Кроме того, она понимает сложные инструкции и короткие подсказки, в отличие от предыдущих версий Stable Diffusion. Помимо этого у новой версии нейросети есть еще несколько новых функций:

  • она может восстанавливать недостающие части изображения;
  • может «расширять» изображение аналогично функции Zoom Out от MidJourney (ну или как у «Кандинского»);
  • понимает запросы в виде картинок.

А теперь просто посмотрите на сравнение результатов генерации Stable Diffusion первой версии и версии XL 1.0:

Stable Diffusion нейросеть

Как видим, модель XL 1.0 стала на несколько порядков лучше справляться с генерацией изображений. Это касается и понимания запроса, и качества изображения, и количества различных артефактов. По сравнению с выпущенной год назад версией, XL 1.0 допускает меньше ошибок при генерации и выдает результаты на уровне MidJourney v. 5. Вот еще несколько примеров работы Stable Diffusion XL 1.0:

Stable Diffusion XL 1.0 Stable Diffusion XL 1.0 Stable Diffusion XL 1.0 Stable Diffusion XL 1.0 Stable Diffusion XL 1.0
Смотреть галерею

Читайте также:

Как смешивать изображения в Midjourney: тест фичи

Как быстро сделать рекламные баннеры при помощи Midjourney

Нейросеть Midjourney: полный гайд по созданию фото

Поделиться статьей:

Новое на сайте

25 апр 2024
1 500
Разработка логотипа и фирменного стиля: кейс Dagstone

До работы с TexTerra эта компания жила только «сарафанкой», а с нашим дизайном начала развивать другие маркетинговые каналы.

25 апр 2024
666 217
Google Таблицы: большой и простой гайд

Даже специалистам будут полезны новые лайфхаки.

Смотреть все статьи

У вас есть деловой запрос? Давайте обсудим!

Оставьте свои контакты, мы свяжемся с вами в ближайшее время.

Нажимая на кнопку «Оставить заявку», вы подтверждаете свое согласие на обработку пользовательских данных

Спасибо!

Ваша заявка принята. Мы свяжемся с вами в ближайшее время.