Поиск по сайту:

Как написать потрясающую стабильную диффузионную подсказку


Stable Diffusion, популярный генератор искусств на основе искусственного интеллекта, требует текстовых подсказок для создания изображения. Иногда он делает потрясающую работу и генерирует именно то, что вы хотите, с расплывчатой подсказкой. В других случаях вы получаете субоптимальные результаты. Вот несколько советов и приемов для достижения идеальных результатов.

Как написать стабильную диффузионную подсказку

Если вы когда-нибудь работали с генераторами изображений с искусственным интеллектом, такими как Stable Diffusion, DALL-E или MidJourney, вы заметили, что хорошо сформулированная подсказка имеет решающее значение. Грамотно сформулированная подсказка — это разница между превращением вашей идеи в отличный образ и получением какого-то чудовища из сверхъестественной долины с слишком большим количеством пальцев, уставившихся на вас.

С момента запуска Stable Diffusion в августе 2022 года люди пытались найти лучшие способы получения идеальных результатов, и в ближайшие годы они будут заниматься «быстрым кузнечным делом» или «быстрым проектированием». Это особенно вероятно, поскольку контрольные точки, информирующие о том, как Stable Diffusion генерирует изображения, будут получать периодические обновления. Идеальная подсказка станет движущейся мишенью в обозримом будущем.

Будьте как можно более конкретными

Stable Diffusion имеет тенденцию процветать на определенных подсказках, особенно по сравнению с чем-то вроде MidJourney. Вам нужно сказать точно, что вы хотите. Вот пример использования любимых животных в Интернете: милые кошки.

Хорошо, они довольно милые, за исключением, может быть, бедняги в верхней середине, который выглядит так, будто провел слишком много времени, глядя в бездну. Но что, если вам нужны серые кошки, а не помесь кошек? Ну, это нужно указать. Вместо этого используйте «Милые серые кошки» в качестве подсказки.

Теперь Stable Diffusion возвращает всех серых кошек. Вы можете продолжать добавлять описания того, что вы хотите, включая аксессуары для кошек на картинках.

Это относится ко всему, что вы хотите создать с помощью Stable Diffusion, включая пейзажи. Будьте описательными, и когда вы пробуете разные комбинации ключевых слов, мысленно отмечайте, как меняется изображение. Некоторые слова и фразы, как правило, более сильно искажают изображение, чем другие слова, поэтому вам может потребоваться соответствующим образом скорректировать подсказку.

Назовите конкретные художественные стили или средства

Потребность в конкретике не заканчивается, когда вы полностью описываете содержание изображения, которое хотите. Вы можете (и должны) также указать желаемый стиль. Для этого мы будем придерживаться нашей подсказки «Милый серый кот». Допустим, нам нужны милые серые коты, но мы также хотим, чтобы они выглядели так, как будто они написаны акриловыми красками. Первое, что вы должны попробовать, это добавить «акриловая живопись» в качестве следующего ключевого слова в приглашение, чтобы оно звучало так: «Милый серый кот, акриловая живопись».

Как правило, лучше всего начать с наименьшего количества ключевых слов, чтобы приблизиться к тому, что вы хотите, а затем добавить больше, чтобы получить эстетику, которую вы ищете.

Стабильная диффузия распознает десятки различных стилей, от карандашных рисунков до глиняных моделей и 3D-рендеринга в Unreal Engine.

Эти примеры подсказок чрезвычайно просты, но вы можете использовать десятки ключевых слов для точной настройки результатов. Если вы хотите, чтобы в магазине Walmart появились странные психоделические модели цыплят из глины, вам нужно указать все эти термины.

Назовите конкретных исполнителей для стабильного распространения

Stable Diffusion способен не только эмулировать определенные стили или среды; он может даже имитировать конкретных исполнителей, если вы хотите это сделать. Этот пример использовал Пабло Пикассо.

Вы обязательно должны попробовать добавить «от (имя исполнителя)» в свои подсказки, если вы еще этого не сделали. Он склонен приводить к драматическим результатам. Не бойтесь объединять исполнителей, которые обычно не сочетаются друг с другом. Часто Stable Diffusion сочетает соответствующие стили захватывающим и непредсказуемым образом.

Вес ваших ключевых слов

Конечно, просто втиснув ключевые слова в приглашение, вы далеко не продвинетесь. Что произойдет, если вы получите все нужные вещи в своей подсказке, но они не будут должным образом пропорциональны?

Stable Diffusion поддерживает взвешивание ключевых слов приглашения. Другими словами, вы можете сказать ему, что ему действительно нужно уделять внимание определенному ключевому слову (или ключевым словам) и уделять меньше внимания другим. Это удобно, если вы получаете результаты, которые вроде того, что вы ищете, но не совсем там.

В версии Stable Diffusion для командной строки вы просто добавляете полное двоеточие, а затем десятичное число к слову, которое хотите выделить. Десятичные числа представляют собой проценты, поэтому в сумме они должны давать 1.

Возвращаясь к нашей подсказке «Симпатичный серый кот», давайте представим, что он правильно воспроизводил милых кошек, но не на многих выходных изображениях были серые кошки. Вместо этого вы можете изменить подсказку на «милый, серый кот: 0,7», и он будет уделять больше внимания серому коту, а затем автоматически применит разницу к «милый». Вы также можете назначить вес каждому слову в подсказке вручную, если хотите более точного управления, например, «Милый: 0,10, Серый кот: 0,60, Рендеринг Unreal Engine: 0,30».

Большинство графических интерфейсов, доступных для стабильной диффузии, обрабатывают взвешивание, не требуя ввода явных процентов. Обычно вы можете добавить круглые скобки вокруг термина в приглашении, чтобы подчеркнуть его, и скобки, чтобы уменьшить важность термина. Таким образом, предыдущее «милый серый кот» может выглядеть как «[милый],((серый кот)».

Найдите вдохновение в другом месте

Стабильная диффузия и другие генераторы искусства с искусственным интеллектом пережили взрывной всплеск популярности. Вы можете найти такое искусство ИИ повсюду. Это означает, что в настоящее время в Интернете циркулирует по крайней мере несколько миллионов изображений, созданных пользователями, и в большинстве случаев люди включают подсказку, которую они использовали для получения своих результатов.

Вот несколько ресурсов, которые помогут вам вдохновиться, если вы не уверены, что хотите создать:

  • Lexica — репозиторий изображений, созданных с помощью Stable Diffusion и соответствующей подсказки. Доступен поиск по ключевому слову.
  • Исследования стиля исполнителей Stable Diffusion – неисчерпывающий список исполнителей, которых Stable Diffusion может распознать, а также общие описания их художественного стиля. Существует рейтинговая система, описывающая, насколько хорошо Stable Diffusion реагирует на имя исполнителя в подсказке.
  • Исследования модификаторов стабильной диффузии — список модификаторов, которые можно использовать со стабильной диффузией, как и на странице исполнителя.
  • Список художественных модификаторов ИИ — фотогалерея, демонстрирующая некоторые из самых сильных модификаторов, которые вы можете использовать в своих подсказках, и то, что они делают. Они отсортированы по типу модификатора.
  • 500 лучших художников, представленных в Stable Diffusion. Мы точно знаем, какие изображения были включены в обучающий набор Stable Diffusion, поэтому можно сказать, какие художники внесли наибольший вклад в обучение ИИ. Вообще говоря, чем больше артист был представлен в обучающих данных, тем лучше Stable Diffusion будет реагировать на его имя как на ключевое слово.
  • Сабреддит Stable Diffusion. В сабреддите Stable Diffusion постоянно появляются новые подсказки и забавные открытия. Если вы ищете вдохновение или идеи, вы не ошибетесь.

Настройте другие важные параметры

Хорошая подсказка — самая сложная часть использования Stable Diffusion, но есть несколько других настроек, которые кардинально изменят результаты.

  • CFG: определяет, насколько строго Stable Diffusion следует вашему запросу. Более высокие числа приводят к большему следованию подсказке, тогда как более низкие числа дают ИИ больше свободы. Сначала попробуйте настроить это.
  • Метод сэмплирования . Способ преобразования изображения из шума в узнаваемые формы. Попробуйте несколько из них. Euler_a, k_LMS и PLMS кажутся популярными вариантами.
  • Этапы выборки.  Сколько раз изображение будет проверено, прежде чем вы получите окончательный результат. Иногда вы получаете хорошие результаты на 30 шагах, иногда вам нужно перейти на 50 или 80. Обычно вы не получаете лучших результатов после 150 шагов. Начните с меньшего количества шагов и поднимайтесь выше.

Некоторые из наших любимых стилизованных подсказок

Это одни из наших любимых подсказок, поскольку они, как правило, работают очень надежно. Просто добавьте предмет по вашему выбору плюс несколько модификаторов. Все остальные настройки стабильной диффузии остались такими же, как и в приведенных выше подсказках.

(Тема), 35 мм, резкий

Выберите тему, и эта подсказка надежно вернет фотореалистичные изображения людей, животных и пейзажей.

(Тема), низкополигональная 3D-рендеринг, яркие пастельные тона, сдвиг наклона, зернистость пленки

Введите предмет, и вы получите его в эстетике «Искусство ралли».

(Тема), (Описание окружения), кинематографичность, драматизм, композиция, солнечное небо, брутализм, гиперреалистичность, эпический масштаб, чувство благоговения, гипермаксимализм, безумный уровень детализации, artstation HQ

Просто введите тему и описание окружающей среды, и эта подсказка предоставит отличные изображения концепт-арта города с эффектом окружающей среды по вашему выбору. Вот пример использования Нью-Йорка в качестве темы и пыльной бури в качестве описания окружающей среды:

Кермит

Stable Diffusion дает отличные результаты с Kermit. Попробуйте где угодно.

Почему именно так Stable Diffusion интерпретирует «Кермит в Мордоре» и кто этот красный злой Кермит, стоящий за нашим стойким героем? Без понятия.

Помните, не бойтесь удалять то, что, по вашему мнению, может быть ключевым термином из вашей подсказки. Некоторые слова, такие как «великолепный», сильно влияют на то, как выглядит изображение, даже если оно не имеет точного значения. По мере того, как вы будете проводить больше времени со Stable Diffusion, вы почувствуете, как он реагирует на определенные слова, и быстро обнаружите, что написание хорошей подсказки — это само по себе искусство.