Разработанная проектом OpenAI нейросеть DALLE 2 произвела фурор сразу после «дебюта» в апреле 2022 года. Однако до сих пор доступ к программе можно было получить по приглашению — OpenAI в итоге отобрала миллионы бета-тестеров. Теперь нейросеть открыли для всех, а мы посмотрели, что же она умеет.
Чем DALLE 2 отличается от других нейросетей
Мы рассказывали про множество нейросетей, способных генерировать изображения по текстовому описанию — это Midjourney, Stable Diffusion и GFP-GAN. Но довольны не были ни одной из них. Midjourney постоянно генерирует мрачные арты в темных тонах, Stable Diffusion часто использует стоковые фото и просто искажает объекты, а GFP-GAN не делает ничего особенного — увеличивает яркость и немного ретуширует.
Картинки, созданные DALLE 2, из того, что мне удавалось видеть до сих пор, на голову превосходили произведения других нейросетей. К тому же подкупало то, что побаловаться нейросетью можно было через отдельный личный кабинет, а не через переполненный народом чат в Discord, как это реализовали разработчики Midjourney.
Также, в отличие от других нейросетей, DALLE 2 может не только генерировать картинки с нуля, но и изменять уже существующие (кстати, у нас вы можете заказать логотип — прим. отдела продаж TexTerra). Эта функция удивила многих, когда нейросеть попросили дорисовать известные картины художников — получилось необычно, но невероятно реалистично!
Возможно, один из секретов DALLE в том, что она очень хорошо анализирует языковые запросы. Для их обработки программа использует другую нейросеть от OpenAI — ранее также нашумевшую GPT-3. Эта программа известна тем, как хорошо она способна распознавать печатный текст и «додумывать» его по своему усмотрению.
Как бы то ни было, DALLE 2 отлично справляется с задачей генерации красивых картинок в разных стилях по вашему желанию.
Картины от DALLE 2
Мы немного поработали с нейросетью DALLE, задав ей несколько запросов. Имейте в виду, что для получения качественной работы мало ввести любой запрос — надо сформулировать его достаточно подробно и понятно для программы.
Что мы поняли после первого запроса — DALLE 2 плохо умеет в текст на изображении. Мы задали нейросети запрос «сотрудник маркетингового агентства в мультяшном стиле». Вот что она нам выдала:

В целом неплохо, но почему на надписях творится что-то странное?
Тогда мы решили включить немного фантазии. Следующий запрос был такой: «кот разрушает город как Годзилла». Тут получилось прекрасное:

Кот-Годзилла разрушает город
Тогда мы пошли дальше и включили больную фантазию: «Зомби-апокалипсис в III веке нашей эры, стиль средневековых картин». Честно говоря, я ожидал большего:

Первый и третий вариант мы решили улучшить — такая функция появляется при нажатии на картинку. Вот что получилось в конечном итоге:


Первая картинка получилась смешной, но в целом это не то, что я планировал увидеть
Чтобы добавить немного абсурда, мы попробовали следующий запрос: «кот в скафандре на Луне верхом на пегасе». Видимо, нейросеть нас не совсем поняла, поэтому вместо кота на пегасе она нарисовала «кота-пегаса» в скафандре:

Кот-пегас на Луне

Соцсети йогуртов EPICA иллюстрирует нейросеть – годный пиар!
В интерфейсе DALLE 2 также есть интересная кнопка «Surprise me» на случай, если вы еще не придумали то, что хотите сгенерировать при помощи нейросети. Нам она подсказала следующий запрос: «картина маслом портрет капибары в средневековых королевских одеждах и богато украшенной короне на темном фоне». Я люблю капибар, и то, что выдала нейросеть, привело меня в восторг:


Капибара в королевских одеждах с короной
Мы также попробовали функцию редактирования изображения нейросетью, но пока, к сожалению, этот инструмент не может предоставить то, что показывала нам демо-версия. То есть, «выходить за границы» и достраивать загруженное фото нейросеть может, однако, например, добавить длинные белые волосы Дмитрию Нагиеву отказалась.
Как зайти в DALLE 2
Вероятно,вы и сами захотите попробовать нейросеть в деле. Увы, тут не все так просто. На сегодняшний день она доступна не во всех странах, и зайти в нее из России также нельзя.
Чтобы зайти в программу, вам придется в любом случае использовать VPN с выходом где-нибудь в Европе или в США. Но это еще не все, ведь для регистрации потребуется ввести номер телефона и сказать код подтверждения. И российские номера, как можно догадаться, программа не распознает.
Но выход есть: при регистрации вы можете использовать виртуальный номер для SMS-подтверждения регистрации. Можно воспользоваться сервисом SMS24 — он предоставляет доступ к виртуальным номерам. Однако многие из них OpenAI распознает как виртуальные и отказывается отправлять код, а с некоторыми уже связаны учетные записи. Мы нашли номер в Финляндии — OpenAI пропустил и отправил код, подождать его придется пару минут в зависимости от страны. Вводим код подтверждения из SMS (VPN должен быть включен) и получаем доступ к DALLE 2 из России. После того, как попали в личный кабинет, VPN можно отключить — из сервиса вас не выкинет, а скорость соединения будет выше, да и трафик расходоваться не будет.
Будьте внимательны при использовании нейросети: в первый месяц вам дается 50 кредитов — это 50 генераций или редактирований изображений. После этого каждый месяц на счет будет зачисляться лишь 15 кредитов. В теории вы можете купить их через карту банка, для которого доступны SWIFT-переводы, однако неясно, принимает ли OpenAI российские банковские карты.

Как нейросети предугадывают нас, и как это используют ретейл, банки и службы такси