Dall е 2 как воспользоваться
Перейти к содержимому

Dall е 2 как воспользоваться

  • автор:

DALL-E 2 — генератор изображений открыт для всех!

evolut

Возможности искусственного интеллекта производят все большее впечатление и вы все больше ощущаете его влияние на нашу жизнь. Стоит отметить, что мы ежедневно используем возможности, предлагаемые различными алгоритмами, например, когда нас направляют через навигацию к месту назначения. Да, современная навигация пытается определить оптимальный маршрут на основе искусственного интеллекта.

Как я упоминал ранее, в последнее время популярность приобрели генераторы изображений AI, которые на основе ранее обработанных данных и зачастую миллионов изображений могут генерировать новую графику. Обычно их устраивает предоставленное пользователем описание, а эффекты действительно впечатляют.

Один из самых популярных инструментов DALL-E 2 теперь доступен каждому пользователю. Следует отметить, что ранее он был доступен в рамках ограниченной бета-версии и для этого необходимо было подписаться на лист ожидания.

Компания OpenAI, разрабатывающая DALL-E 2, в записи в своем официальном блоге похвасталась, что их сервисом уже пользуются 1,5 млн пользователей, которые ежедневно генерируют до 2 млн изображений с помощью искусственного интеллекта.

Надо признать, что цифры довольно внушительные и в ближайшее время они должны заметно увеличиться. Что ж, инструмент теперь может использовать любой желающий — просто зарегистрируйтесь.

Как начать работу с DALL-E 2?

Стоит отметить, что описанный генератор изображений все еще находится в стадии бета-тестирования. Несмотря на это, он уже может обеспечить действительно интересную и красивую графику, способную произвести большое впечатление на каждого из нас.

Если вы хотите проверить возможности DALL-E 2, просто зайдите на сайт OpenAI и создайте учетную запись пользователя. После регистрации можем начинать играть — вводите текст, а генератор создает графику максимально соответствующую описанию.

Стоит отметить, что каждый зарегистрированный пользователь на старте получает 50 кредитов, которые позволяют создавать изображения. Кроме того, каждый последующий месяц бесплатно добавляется 15 новых кредитов. Однако, если мы используем лимит, мы можем купить новые кредиты — цены начинаются от 15 долларов за 115 кредитов.

Как я установил нейросеть DALL·E 2 в России: пошаговый гайд

DALL·E 2 — это система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки из описания на естественном языке. Однако нейросеть на данный момент недоступна для пользователей из России, но я нашёл, как эту проблему обойти. В этом гайде я подробно расскажу, как зарегистрироваться в DALL·E 2 и пользоваться им из России.

Переходим на сайт DALL·E 2 по ссылке и выбираем опцию «Try DALL·E 2» внизу экрана: https://openai.com/product/dall-e-2

Открывается выбор способа авторизации — через email, Google или Microsoft аккаунт.

Чтобы продолжить авторизацию, потребуется установить vpn на устройстве или в браузере. В Интернет-магазине Chrome выбрал подходящее расширение vpn для браузера и запустил его:

После запуска vpn можно продолжить регистрацию. На странице нужно будет указать данные о себе — имя и фамилию:

После откроется раздел с верификацией телефонного номера. Регистрация российских номеров не сработает даже с vpn:

Поэтому иду на хитрость: перехожу по ссылке в сервис sms-activate, чтобы купить зарубежный номер.

Я зарегистрировался на сайте через активный адрес почты, а затем внес на баланс своего аккаунта сумму для покупки номера для OpenAI. Номера для верификации в нейросети будут стоить от 60 до 195 рублей на момент выхода этой статьи.

Выберите номер любого государства и оплатите банковской картой или через Qiwi.

После этого я скопировал номер и вставил его на сайте регистрации OpenAI, запросив смс-подтверждение.

Затем нужно вернуться на страницу sms-activate и выбрать опцию «Ожидает SMS или звонок»:

Я получил код верификации на номер в sms-activate, скопировал его и вставил в окно на сайте OpenAI. Не забываем при этом включить vpn. Сервис будет готов к работе через пару секунд.

После авторизации вы окажетесь на главной странице нейросети. У вас будет 35 кредитов для генерации изображений — 35 попыток создать 4 разные картинки по запросу. Если вы получите предупреждение о сбое в работе, попытка не будет засчитана и кредит не спишут с аккаунта. Используйте попытки до конца текущего месяца, иначе они сгорят. В следующем месяце ваш бесплатный баланс кредитов автоматически пополнится еще на 15 попыток.

Пользователи могут пополнить кредиты в личном кабинете, нажав «Buy credits» в правом верхнем углу. Минимальная покупка — 115 кредитов на сумму $15.

❗ К сожалению, пользователи из России не смогут пополнить баланс из-за санкций. Чтобы обойти эти условия, попробуйте купить готовый аккаунт/подписку на OpenAI на фриланс-биржах или Авито. По отзывам можно найти надежного исполнителя, и это обойдется вам даже дешевле, чем официальная стоимость кредитов:

Итак, интерфейс DALL·E 2. Сделать запрос для генерации изображения нужно на английском языке на главной странице нейросети. Можете пользоваться переводчиком. Функция «Surprise me» самостоятельно сгенерирует необычный запрос, так можно протестировать нейросеть.

К примеру: «плюшевые мишки покупают продукты в Японии, укиё-э». В результате получаются 4 изображения:

Нажмите на одно из изображений и вы сможете:

• Редактировать его — нажмите кнопку Edit. Сотрите часть изображения или добавьте кадр генерации, чтобы расширить картинку. Эта функция пока находится в beta-версии, поэтому полные изображения не будут сохранены.

• Сгенерировать еще варианты изображения — нажмите Variations.

• Сохранить изображение или создать ссылку на него.

Чтобы получить результат, максимально приближенный к задуманному, используйте промпты — специальные подсказки для нейросети длиной не более 400 символов, которые будут конкретно описывать желаемый результат.
Сравним несколько разных запросов с изображением белого медведя, к примеру:
white polar bear

55 mm photo of a white polar bear standing in the middle of the Arctic ice looking for penguins running towards the water

pencil and watercolor art of a white polar bear standing in the middle of the Arctic ice looking for penguins running towards the water

Ваши запросы могут быть разными, но для лучшего результата обязательно указывайте:

Тип изображения — обложка музыкального альбома, витраж, портрет, 3D рендер, цифровой арт, акварельный рисунок или фотография. Варианты не ограничены.

Стиль и освещение — реалистичный стиль, абстрактная живопись, стиль любого известного художника, светлый, темный и т.д.

Контекст, сюжет: опишите, что именно должно быть на рисунке и что происходит — человек плывет на корабле и смотрит вдаль, кошка и собака идут по улице в обнимку и т.п.

Формулируйте запрос по общей схеме и не забудьте перевести его на английский язык:

[Тип изображения] [стиль изображения] [освещение] of [предмет изображения] [сюжет] [дополнительные детали].

Картина маслом в стиле Ван Гога в светлых тонах с изображением алых тюльпанов в синей вазе, стоящих на деревянном столе, позади открытое окно с видом на звездное небо.

An oil painting in the style of Van Gogh in light colors depicting scarlet tulips in a blue vase, standing on a wooden table, behind an open window overlooking the starry sky.

Таким образом, с помощью хитрых манипуляций я смог обойти доступ нейросети и надеюсь, что помог вам. Подпишитесь на мой Телеграм-канал, чтобы получить больше гайдов и промптов для работы в нейросетях!

Регистрация в Dall-e 2 для чайников

Не так давно разработчики из openAI открыли доступ к новой версии нашумевшей нейросети для генерации изображений по текстовому описанию, но не всем удалось догадаться как можно ей пользоваться, не проживая в странах Европы или США, поэтому делюсь коротким гайдом, как это удалось мне.

Сразу скажу, я не проводил тестов и возможно некоторые отступления от гайда сломают вам регистрацию, вы можете попробовать поэкспериментировать сами и отписать фидбек в комменты — я дополню гайд.

Что нам потребуется:

— VPN, желательно со статическим или полу-статическим IP

— Примерно 50 рублей

— Сайт для покупки номеров для активации аккаунтов

  1. Подключаемся в VPN
  2. Регистрируем аккаунт на сайте openAI, я использовал почту gMail
  3. При переходе на страницу подтверждения номера покупаем номер страны, в которой находится VPN-сервер и активируем аккаунт купленным номером телефона
  4. Кайфуем
  1. Первым делом, нужно изменить свое местоположение. Я пользуюсь WireGuard туннелированием на выделенный сервер в Нидерландах, этого достаточно, чтобы сайт перестал думать, что я нахожусь в России.
    Вы можете попробовать иные VPN сервисы, но я не гарантирую, что бесплатные или даже платные, но популярные сервисы дадут нужный результат, поскольку они не предоставляют статический IP адрес
  2. Далее — регистрируем новый аккаунт, я использовал gmail почту, хоть там и стоят все настройки для РФ и номер привязан соответствующий, все сработало как надо и я добрался до окна подтверждения аккаунта по номеру телефона
  3. Самый «запарный» момент, получить номер страны, которой я «нахожусь». В моём случае — Нидерланды. Я перепробовал много «бесплатных» номеров в открытом доступе, но ни один из них не сработал. Некоторые уже были использованы для создания аккаунтов на сайте, другие просто не принимали SMS.

Тогда я воспользовался популярным сервисом по покупке временных номеров для активации аккаунтов (не знаю, можно ли писать здесь название этого сайта, но дам подсказку — он на первой странице гугла, но не первый в списке, примерно в середине). Покупка приватного номера Нидерландов без привязки к сервису регистрации обошлась мне в 57.90₽, пополнение на сайте доступно через множество различных платёжных систем, я выбрал систему с оплатой по СБП, комиссия составила 1,045%, хотя заявлено было 3%.

  • В отличие от MidJourney, здесь видно сколько кредитов на аккаунте — по стандарту их 50 и ровно спустя месяц они обновляются до 15. То есть, неважно сколько у вас кредитов — их станет 15 и дальше каждый месяц будет также.
  • Существуют 3 доступных операции, каждая стоит 1 кредит:
  1. Генерация 4 изображений по одному текстовому запросу
  2. Генерация 4 вариаций по созданному изображению или пользовательскому загруженному изображению
  3. Генерация части изображения (4 вариации) по текстовому запросу (или расширение изображения)

Я попробовал каждую, используя запрос из новости про перегенерацию моделей Fallout в stableDiffusion, поскольку я имею некоторые сложности с формулированием подробных запросов.

Woman in metal armor Mad Max Fallout, modern style, detailed face, beautiful face, by Greg Rutkowski and Alphonse Mucha, D&D character, in front of an urban background, digital painting, concept art, smooth, sharp focus illustration, ArtStation HQ

Как видно, картинки получились неплохие, достаточно проработанные и качественные.

В качестве референсного изображения я выбрал первое из прошлой подборки.

На сайте представлен простой редактор — можно вставить свое изображение, нарисовать простые геометрические фигуры или стереть части изображения. Те части, которые остались стёртыми — нейросеть дорисует. В качестве референса я взял изображение созданное по тому же запросу в stableDiffusion, где нейросеть плохо справилась с лицом. Я стёр лицо и часть плеча слева и в качестве текстового запроса задал описанный выше.

Самое удачное, на мой взгляд — с розовым лицом, поправить цвет можно в фотошопе, а по качеству детализации оно вышло лучше всех.

Как показывает опыт — нейросеть нормально генерирует лица с нуля, но если использовать референсное изображение с плохо сгенерированным лицом, оно будет таким же нереалистичным и кривым, как в исходнике.

Надеюсь, гайд был вам полезен и я не ошибся с подсайтом для публикации. Всем удачных генераций!

MidJorney предлагает за 10 баксов 200 картинок. За месяц наигрался. Сейчас поставил Стабильную Диффузию с веб-интерфейсом и в ней провожу эксперименты. Хотя по ощущениям MidJorney делает более красивые картинки. Даже по одинаковым запросам.

Тоже тыкал все три
— MidJourney пока лучшая, она выдает прям интересные результаты сходу, но функционал скудный. Разрешение выходных картинок задается вручную, плюс есть апскейлер.

— Dall-e лучше справляется с чем то абстрактным и больше следует текстовому описанию. Я там пробовал и пиксель-арт, и 3д графику, и лего человечков, и даже ASCII (не очень успешно) — все выдает исправно, MJ подтупливает на этом. Зато функционал шире, например дорисовка фона изображения или его частей это что-то. Разрешение картинок и детализация из коробки лучшая из всех доступных, вроде 1024*1024.

— Stable Diffusion — крутая штука, ещё и потому, что есть сейчас удобный вариант с GUI для чайников и мультиварок, но он выдает пока самые слабые результаты, особенно на лицах (мид лучше всех, далли — похуже). Для получения более-менее сносного варианта надо сначала сидеть перебирать параметры и запрос, потом генерировать вариантов 100 и потом из них выбирать подходящий тебе и уже с его сидом играться, однако функционал конечно самый широкий из доступных. Ну и плюс нет никаких фильтров (политических, NSFW и прочие) и она стоит у тебя на машине, без привязки к сети и можно делать вообще что угодно с ней.
Разрешение на выходе задаётся, но лучше всего справляется с 512*512, вроде как её обучали на таких изображениях. Есть апскейлер и восстановление лица, но на моей тачке не заводится, видимо, потому что у меня не RTX карта.
Ну и можно её самому до обучать, когда-нибудь доберусь до этого тоже, пока времени нет. Но особо надежд на это не возлагаю, пользовательские модели работают ужасно, либо не работают вообще. Как пример: есть модель "pixel-art", при её подключении картинка не особо похожа на пиксель арт, почти ничего не меняется, но вот если в запрос добавить "pixel art", то сразу все преобразуется как надо, даже без библиотеки. Неясно.

Что такое Dalle (генератор изображений)? Как им пользоваться? Как зайти из России?

Ранее писал про всем надоевший ChatGPT, теперь про Dalle. Это генератор изображений от создателей ChatGPT. В статье пробуем сделать что-то дельное в этом генераторе и разбираемся, как им пользоваться в РФ. OpenAI же не работает в РФ.

Он не ищет картинки в гугле, а именно генерирует их, основываясь на своей наученности.

Учимся правильно задавать запросы для Dalle

Нужно понимать, что это нейросеть. Это означает, что запрос понимается максимально прямо.

Задание нужно давать максимально конкретно в одном предложении.

Что должно быть в запросе:

  • Что
  • В каком стиле
  • Что какого цвета
  • Стиль подписи
  • Лучше писать на английском

Сначала просто поиграемся с картинками

Начнём с самого сложного запроса

Иллюстрация викинга, сидящего на скале, драматическое освещение. Викинг сидел на скалистом выступе с видом на море, его длинные светлые волосы развевались на соленом ветру. Это был массивный мужчина с широкими плечами и мощными мышцами, которые колыхались под его меховым плащом. Его борода была густой и ухоженной, а пронзительные голубые глаза смотрели на океан с яростной решимостью. Он был одет в тяжелую броню из железа и стали, с мечом и щитом на боку. Его шлем украшали рога, а сапоги были сделаны из толстой кожи. Он выглядел свирепым воином, готовым дать бой любому, кто посмеет бросить ему вызов. Викинг сидел, скрестив ноги, положив одну руку на рукоять меча, а другую на рукоять щита. Он был спокоен, но готов ко всему. Океан мог быть безбрежным и неумолимым, но викинг не боялся. Он был хозяином моря и покорял все, что лежало перед ним.

Запрос без конкретики.

Просто дали запрос «Носорог». Ну вот вам и просто носорог. Ужас=)

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *