Stable Diffusion тред X+54 ====================================== Предыдущий тред >>537314 (OP)https://arhivach.top/?tags=13840 ------------------------------------------ схожие тематические треды - технотред >>532447 (OP) - NAI-тред (аниме) >>536691 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Полный функционал в локальной установке (см. ниже)
⚠️ Стандартные модели stable diffusion (v1.4 - v2.1) от Stability AI значительно отстают по качеству от кастомных моделей (см. ниже). Модели SD XL ставятся и запускаются так же как и любые другие модели SD.
Отличается ли картинка, сгенеренная с lowvram, от medvram, и без этого параметра? Сам потестировать не могу, т.к. волею судеб могу генерировать только с lowvram.
>>543295 Чтобы гарантировано - ничего. А вообще - взять хорошую модель и не срать сильно шизопромптами на пол-листа. И кстати, туда ли ты зашёл, онемешник?
>>543296 Пикчу пропусти через препроцессор и суй в контролнет. Например кэнни или опенпоуз, но вообще смотря что за пикча. Это позволит тебе сгенерить то же самое.
В промпте опиши что на пикче, плюс добавь описание стиля (можно вместо этого юзать лору для стиля).
Если у тебя там лицо и ты хочешь его в точности пересадить, используй IP-adapter с face моделью и твоей пикчей для референса. То же самое касается других деталей, но для них возможно ты захочешь юзать обычную модель для IP-Adapter, не plus (plus захватывает кучу деталей и может покорёжить новый стиль)
>>543295 В порядке возрастания сложности и эффективности: - найти нормальный эмбед-негатив - инпеинт на высоком разрешении - найти/обучить и применить no-data лору на руки - openpose контролнет с пальцами - canny контролнет с опорником, отрендеренным в 3Д программе (например через этот риг, специально заточенный под контролнеты https://toyxyz.gumroad.com/l/ciojz ) Всё это не 100% гарантирует того что в необычной позе, которую плохо поддерживает модель, пальцы всё равно не скрутит.
Аноны, вопросик, где ищете рефы с промтами помимо civitai? И как можно починить civit: делаю поиск по имейджам, кручу вниз и почти сразу виснет и бесконечная прогрузка. По итогу хуй, а не рефы.
>>543402 О каких рефах идёт речь, просто пиздинг промптов? Если так, нигде не ищем. Потому что их пишут в основном дебилы, сыплющие мастерписями просто потому что могут, а не потому что это влияет на результат.
>>543402 One Button Prompt is a tool/script for Automatic1111/ComfyUI/RuinedFooocus for beginners who have problems writing a good prompt, or advanced users who want to get inspired. https://github.com/AIrjen/OneButtonPrompt
>>543402 Если тебе мастерписки нужны, то бери от автора модели, хотя они дохуя всего лишнего пишут, особенно в негатив. А если тебе вдохновение нужно, посмотри любой фильм. Если понравится какой-то кадр, просто опиши его кратко своими словами в промпт. В большинстве случаев получится что-то другое, но может оно тебе еще больше понравится, чем изначальный предмет вдохновения.
>Latent Consistency LoRAs Кто уже использует? Я так понимаю в автоматик ещё не завезли, в Комфи работает. Но у меня сам по себе Комфи хуево работает на маке. Поделитесь своим опытом и мнением по этой йобе.
>>543689 А, кстати, Комфи у тебя на маке в принципе работает? Я на Виндоус/амд пытался запускать через директмл, без установки окружения и использование имеющегося, нихрена в итоге не вышло. Вроде запускалось, но падало при любой попытке генерации.
>>543709 Работает на маке, на Винде запускал владматик (ака Некст или как он там). Через директ мл, ебля какая то с этим амд вечная. Комфи не пробовал на Винде. Комфи на маке работает медленнее и тоже не сразу запустилась (генерила черные картинки) >>543708 Спасибо, надо попробовать
>>543764 Так там датасет всё такой же кал говна, с блюром на всех фонах и высоким aesthetic score. Оно даже до васяномиксов не дотянется. Алсо, высокое разрешение - ебучий гиммик, потому что хайрезфикс всегда будет качественнее базовой генерации и её лучше делать в разрешении поменьше чтоб было быстрее. Единственная польза от этого могла бы быть в виде извлечения лоры, но если они не собираются релизить её, то и вообще нахуй.
>>543823 > чё делать то? 1. Скачать https://civitai.com/models/132632?modelVersionId=223670 2. Скопировать параметры (пик 3), вставить в промпт и нажать синюю стрелку (пик4), жмакнуть generate. 3. Если всё работает, изменить промпт под себя. 4. ... 5. Профит.
>>543887 В глаза ебусь братик звиняй, хочу это лого переделать под лавкрафтовский стайл, свою сд снес локальную ибо наигрался, а она такое умела мама родная, а вот онлайновые не оч выкупают
Цель была перевести на реалистик, делал через имг2имг 32 лупбек 0.15 денойз, просто модель поменял с аниме. Дайте ещё способов, этот все же чую хуйня какая то
У меня все заебись. Попробуй сгенерировать тигра из ОП-поста. Не засоряй говном промпты, пока не разберешься что к чему. Выстави Inference Steps - 20, Sampler - DPM++ 2M Karras.
>>543924 > Как ты 1920x1080 делал? Сначала 1344х768, потом апскейл с небольшим денойзом до 1080p, потом 2х апскейл с Ultimate SD Upscale и последующий даунскейл обратно до 1080p. > сколько по времен заняло? Дохуя. Но есть ютубчик, который можно смотреть, пока видюха кряхтит. >>543883 > без потери качества Да если бы. Тут >>543921 1-2 - обычный сэмплер с 24 шагами, 3-4 - LCM с 6 шагами. Пикрелейтед - LCM 5 шагов.
>>543752 название как-бы намекает. может Stability поняли, какую ошибку допустили с SD XL и теперь релизнут дотренированную sd 1.5, которая будет поддерживать текущие лоры и прочее.
>>543957 Далли тебе даст генерить на своем компе и без доступа к интернету?
Что будешь делать, когда на него введут платную подписку?
Понимаешь ли, Майкрософт может спокойно забрать в любой момент этот сервис, как только он выполнит свою задачу по привлечению людей на bing.
А SD уже никто не заберет и не запретит тебе тренировать его на любых концептах, включая и работы будущих художников. А вот будут ли это Майки делать, очень спорно.
>>543972 > Далли тебе даст генерить на своем компе и без доступа к интернету? Речь не об этом, вопрос был в развитии сд моделей, сейчас тупик, все эти оптимизации типа ускорения генерации с помощью lcm, sd 1.6, лоры ничего не дают. Понимание промта и создание пиков от этого не улучшается, это топтание на месте.
>>544086 > 84d76a0328 Нет у меня такой. > без всяких --no-half Без --no-half только квадрат Малевича выдает.
С только --no-half - 2.76it/s, но начинает обсираться уже на чем-то выше 768х768 (3.36s/it), дальше просто хочет. С --medvram --no-half --always-batch-cond-uncond --opt-sub-quad-attention --sub-quad-q-chunk-size 512 --sub-quad-kv-chunk-size 512 --sub-quad-chunk-threshold 80 --skip-version-check --disable-nan-check --disable-safe-unpickle --use-cpu interrogate - 2.60it/s. И 1.22s/it для 768х768.
Хотя хуй знает, может и сам DPM++ 2M Karras двухпроходный. Я пока в них путаюсь. Ну в общем суть в том, чтобы был примерно равен Euler или DPM++ 2M Karras по скорости.
>>544101 Забавно, моя RX6400 гораздо слабее, но никаких чёрных квадратов ни разу не видел, с нохалфом только для попыток инпейнта запускаю, и разрешение могу ставить больше. Попробуй кстати TAESD (настройки - ваэ), если вылетает на последних процентах, этапе декодирования латента. >>544102 Тебе лапшу на уши вешают, нет никаких особых "анимешных" или "реалистичных" сэмплеров.
>>542817 (OP) Анонs, как генерировать пикчи для манги? Позы контролировать умею, лоры с персонажами натренил. И всё работает! Пока не настаёт необходимость сделать заштрихованный бэкграунд. СД жиденико пердит и подыхает от такого обмазывания промптами, контрол нетом и latent composition. Как в одном воркфлове (я юзаю комфи) совместить нескольких персонажей, позы которых контроллируются контрол нетом, а фон максимально упрошён, чтобы его было легче воспроизвести? Мне переключаться на SDXL? Туда контролнет завезли уже?
>2.76it/s Бля, вот в играх RX 5700 выше RTX 3060 и ниже 4060, но стоит при этом копейки. Но SD на амд картах ниже 7000 серии вообще не фурычит. По своим мощностям она должна 6ит/с выдавать, а на деле выдаёт мизер.
>>544167 > в играх RX 5700 выше RTX 3060 Разве? Никогда не смотрел сравнения, но нвидии с линухами не шибко хорошо дружат. > должна 6ит/с выдавать, а на деле выдаёт мизер. Это таки лучше, чем ничего, а так же примерно средняя по треду, если считать, что тут остались 3.5 анонима: с 4090, 1660 и 1050.
>>542817 (OP) Как подключить несколько lora в comfy? Подключил так, но столкнулся с проблемой - то что мне выдаёт нейросеть намного хуже и совсем не похоже на civitai откуда я копировал настройки
>>544160 >УМВР А у меня оно формально работает, но практического значения это не имеет: https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111/issues/93 TAESD конечно несколько хуже при равном разрешении, но позволяет выставить его больше. Падение качества меня не сильно волнует, я вообще ToMe использую, вплоть до 0.5. Ну и, собственно, и то и другое у меня выведено на быстрый доступ для уменьшения/отключения когда надо.
>>544175 >совсем не похоже на civitai откуда я копировал настройки Потому что ты копировал настройки для автоматика, а суёшь их в комфи. Чтобы воспроизвести 1:1, надо основательно поебаться, есть кастомные ноды для этого, надо генерить без xformers (они дают каждый раз новый результат даже на том же сиде), но всё равно результат не гарантирован. Там дохуя различий - интерпретация промпта, генерация шума на CPU вместо GPU для лучшей воспроизводимости, и т.п. Люди получают 100% совпадение, но это заебёшься, сам разбирайся. Для комфи бери схемы с сайтов типа https://comfyworkflows.com/ , схемы самого комфи воспроизводятся нормально.
>>544201 Дело не в 1:1, а в том что качество на много голов хуже. Я не представляю, где я мог допустить ошибку.
>есть кастомные ноды для этого Дай ссылку.
>надо генерить без xformers Автор с civitai не сказал про это.
>>544209 Потому что автор генерировал на автоматике и указал настройки, которые я скопировал точь-в-точь. Возможно, проблема в лорах, в их подключении, но я не знаю как подключить по-другому.
>>544212 С чего ты вообще решил что у автора одна генерация? Может у него там лупбэки, ручные инпеинты, и прочая хуйня. В автоматике воспроизводится? там и свои-то собственные настройки не всегда воспроизводятся
Ну или как вариант у него там шизопромпт, который тютя в тютю подогнан к его установкам тремя миллионами часов и выдаёт хуйню на любом другом сетапе.
>>544270 Отрицательный вес у лоры чем-то отличается от лоры в негативе?
(Кстати я не понимаю, как вообще технически работает лора в негативе? Лора это же патч весов U-Net, какое отношение он имеет к позитивному/негативному кондишионингу?)
Где Comfy публично обосрался и показал себя пидором.
Если коротко, то Комфи спиздил наработки invokeai/compel при создании своего UI. Только он не учел одного - самые опытные и грамотные в теме создания УИ по SD это Автоматик и крутящиеся вокруг него (кроме Хача конечно), которые давно ещё решили проблему пережарки картинок при повышении веса слова в промпте через простое mean normalization.
Когда Комфи указали на то что он обосрался, он ещё сильнее обиделся и не стал ничего менять, типо все так и должно быть.
>>544288 Реальность в том что веса токенов - ненадёжный и тупиковый путь, как и весь "промпт инжиниринг" в целом. Запилят через несколько месяцев следующую мультимодальную хуитку, лучше работающую от бумер промптов, и всё это никому не надо будет. Как кстати и файнтюны. А вот зеро-шот обучение, контролнеты, и прочие не-текстовые методы нужны будут всегда.
>>544288 > решили проблему пережарки картинок при повышении веса слова Ага. А до них другие умные люди еще и безопасные вилки придумали. Но обычно ими перестают пользоваться на каком-то этапе и переходят на вилки для взрослых.
>>544323 Берут автоматик или комфи. Если 3050 поддерживает AIT какой-нибудь, на ней будет быстрее комфи. Если нет - будет быстрее InvokeAI (довольно удобная штука, помимо всего), либо автоматик1111.
>>544330 Не только, но в них тоже. Надо выставить чтобы шум генерился на GPU, как в автоматике, возможно поставить ноды на интерпретацию промпта с операторами как эта https://github.com/asagi4/comfyui-prompt-control/ а вообще ебись сам, меня никогда сильно не морочил импорт промптов из автоматика, так что я хз
>>544339 Опять в миллионный раз одно и тоже. Кто-нибудь уже сказал бы им что хайрезфикс нужен не для того что они делают, генерации без второго прохода не нужны ни в каком виде, на его пиках всё такие же кривые мутанты с тремя ногами и руками узлом. Пользы от этого ровно ноль.
>>544341 >как использовать в них минусовые значения Выставить strength_model на ноде-загрузчике лоры в минус. Можешь strength_clip тоже.
>легче всего учиться модифицируя чужие промпты Не надо так. Все эти гигантские промпты на цивите в основном писаны шизоидами, которые просто высирают три миллиона тегов, которые ни на что не влияют и из-за которых сетка толком не следует указаниям.
Делаешь не так. Берёшь сначала описываешь что тебе надо, простыми словами, как можно меньше. Потом уточняешь промпт по необходимости, тестируя как оно меняется. Если нужно строить XY матрицы, возьми кастомную ноду comfyroll, там есть XY матрицы по произвольным значениям.
>>544339 Есть ещё способ получать одной генерацией хайрезы - HD Helper LoRA. Только сомнительный, наверняка подмешивает в результат и зависит от случая.
>>544345 Почему не нужны, что даёт именно двухпроходная схема? Алсо, почему юзают LDM генерацию с недопроявкой и LCM в виде второго прохода в хайрез фиксе?
>>544339 > Почему не нужны Выглядит как говно. Он просто в середине UNET даунскейлит в два раза внутреннее состояние и потом на выходе апскейлит обратно бикубиком. На выходе получает закономерный пиздец с мутантами. Чем меньше разрешение - тем легче апскейлить и получать нормальное качество. А эти огромные пики с мутантами потом надо либо даунскейлить до 512 и апскейлить по нормальному, либо "апскейлить" в то же разрешение. Оба варианта звучат как бред и будут медленнее нормального хайрезфикса из микропикчи.
>>544288 Вся эта ветка жутко напоминает этот тред, где WAS выступает в роли местного шиза, который горячо убежден, что он д'артаньян. Тот самый, который топил сначала за аналогмаднес и еще что-то, потом за 2.1, потом за сдхл, а теперь за дали, и каждый раз всё остальное (включая предыдущий объект восхищения) становилось кривым говном. И что сука характерно, чем больше ему дают аргументов к обратному, тем сильнее он убеждается в своей правоте, начинает злится, бесконечно повторяет одни и те же уничижительные фразы, переходит на личности и учиняет вендетты.
>>544357 30 минут даже на проце не должно генериться. На мобильной 3050 должно быть 2-3 итерации/сек при 512х512, т.е. где-то 10 сек при 20 итерациях. (SD 1.5)
>>544359 Там все шизы, ты что никогда срача между микроселебрити не видел.
>>544362 спасибо огромное за инфу, накатил автоматик, вот смотрю как с ним будет. пока вот минут пять получается. модельки то накачены, прост перетащил и норм
>>544362 > Там все шизы Ну хуй его знает. Я еще до конца не дочитал может там остальные на шизу перейдут, но вижу аргументы в пользу контроля от комфианона, аргументы в пользу создания кастомной ноды для любителей подхода авто1111 от блендернеко и аргументы в пользу "поразмышляй прежде, чем бездумно копипастить промпт из автоматика в комфи" от лтдрдата. А от ваза в основном повышение градуса повторение хуйни типа "it's bad, it's wrong, it's incorrect, just awful".
>>544346 >Выставить strength_model на ноде-загрузчике лоры в минус Спасибо, помогло! Однако у тян в comfyui всё ещё очень страшный ебальник.
>Делаешь не так. Берёшь сначала описываешь что тебе надо, простыми словами, как можно меньше. Потом уточняешь промпт по необходимости, тестируя как оно меняется. Действенный совет, попробую.
>Если нужно строить XY матрицы, возьми кастомную ноду comfyroll, там есть XY матрицы по произвольным значениям. XY это прародитель LoRA и других модификаций?
Ньюфаг-разраб в треде. Решил поиграться с нероночками вашими.
Поставил атомик, выкачал моделей, лор, эмбеддингов. Могу любой пердеж с цивитаи у себя повторить. Подумал, что че-то оно лагает.
Выкачал комфи. Круто, генерит будто быстрее чем атомик, на дефолтных схемах из экзамплов все работает. Попробовал повторить красивые картинки. Обосрался. Попытался как-то сконверить промты. Обосрался. Возненавидел мир, небо, Аллаха, нашел сайты с комфи-картинками. Каждая картинка тащит за собой ебанутый пайплайн дерьма. Для каждого надо ебать мой хуй говна. Думаю, что дропну этот комфи нахуй - идея прикольная, работает шустро, но без стандартизации промтов, без дефолтных пайплайнов, когда сделал и забыл, нахуй не нужно.
Сейчас настало время инвокаи.
Сука, стандартизация - это жизнь, а в этой залупе даже общего языка промтов пока нет. Модель одна и та же, текст, сиды, вся хуйня, хули ты мне генерируешь разное, а не похожее. Пошла нахуй.
>>544317 >и весь "промпт инжиниринг" А выбора нет. Нейронка обучается на парах "картинка:ключ", потому генерация всегда будет привязана к этим ключам. Если какой-то Ui скроет ключи за какими-нибудь чекбоксами или хуй знает, чем, то это будет значить только то, что разработчик ui пидор ебаный.
качнул фокус, рсспаковал, модельки качнул, запускается уи и по кнопке нихуя не генерит, в сосноли пусто, никакого движения установил с нуля через гитхаб и скачку всего кала - то же самое, в интерфейсе щелкается ро кнопке нихуя не генерится да гитхабе никакой инфы в issues, варианта "запускается, но не работает" нету нахуй такое делать. челу респект канешн, но пиздец жопа горит, аутоматик работает рядом, портативная sdgui работает.
>>544376 >XY это прародитель LoRA и других модификаций? Анон, заебал, чем кормить тебя с ложечки, разберись лучше самостоятельно.
>>544426 >А выбора нет. Нейронка обучается на парах "картинка:ключ", потому генерация всегда будет привязана к этим ключам. Вызываю далле-шизика в тред, где он когда так нужен?
>>544420 >но без стандартизации промтов, без дефолтных пайплайнов, когда сделал и забыл, нахуй не нужно. >а в этой залупе даже общего языка промтов пока нет Чего бля? Оно тебе ВСЮ СХЕМУ сохраняет в метаданные картинки, довен! Промпт это 1/10 того что оно может, что толку сохранять один только промпт? Её "язык промптов" - это схема. Тебе даже сайт блять дали где шарят пикчи из неё со схемами, а у тебя пикрилейтед.
>>544288 >самые опытные и грамотные в теме создания УИ по SD это Автоматик Что-то проиграл блять. А1111 представляет собой набор слайдеров и кнопок, пропущенный через гидравлический пресс для мусора. Это тупо градио, который создавался совсем для другого (простые демки для яйцеголовых), на который наслаивали один слой дерьма за другим, и он постепенно мутировал в тысячеглазого шоггота. Вообще все эти веб-хуйни, автоматик, комфи, инвоук аи - наспех склёпанный мусор. Инвоук чуть более удобный, но всё равно до нормального софта им далеко.
Нужно сгенерить летающий мозг в библиотеке. Вот как пикрелейтед из футурамы. Желательно, не фотореалистично. Подскажите промпт и модель, а то у меня получается в лучшем случае пик2
>>544464 >Анон, заебал, чем кормить тебя с ложечки, разберись лучше самостоятельно. Разобрался с XY, штука сугубо вспомогательная. Скажи, почему у меня получаются тян с лицами даунов при копировании настроек с civitai?
>>544549 Тебе уже 20 раз объяснили - потому что ты копируешь настройки для другого уя. И дали другой сайт где это смотреть для комфи. Ты хочешь копировать или разобраться как делать самому, блять? Пикрил не про тебя случайно?
>>544620 Нет, откуда? Этот плагин позволяет тебе использовать комфи-движок в интерфейсе автоматика, не более. блять, ты бы свою неуёмную энергию давно пустил на изучение того или другого, а не на слизывание чужих промптов
>>544549 >почему у меня получаются тян с лицами даунов при копировании настроек с civitai?
скорее всего у них клоузап вышел и они его опубликовали, а у тебя выходит лицо подальше в картинке вот оно и уродится из-за малого количества пикселей. Тебе остается только инпейнтить лицо.
>>544445 >>544494 Спасибо. Как же заебало ковырятся с ебаными with/height и target_with/target_height для сдхл. Надеюсь в 1.6 эту хуйню уберут, если она вообще сможет что-то, кроме собаки в лесу рисовать.
>>544730 Подключение LCM лоры ко всему этому воркфлоу ускоряет скорость генерации до 6-7 секунд на картинку 1024x1536, но сильно меняет пережаривает? усиляет? стиль (style of Gifford Beal)
>>544722 Найс, охуенно, сам не тестил, только запостил твит от кохи. Потом потестирую обязательно. Вижу что очень хорошо сохраняет композицию, а это один из важнейших параметров. Ну а местные шизы будут и дальше визжать что это мыло, всё это хуйня и т.д.
>>544740 Тестившие челы в основном говорят (и демонстрируют) что LCM лора хороша для второго шага хайрез фикса (первый - недопроявленный LDM), можно ставить меньше деноис и такая схема выдает большую когерентность чем чистый LDM в двух шагах. Я пока не пробовал
>>544753 > Волоски на теле, прыщики Вот он, главный критерий оценки качества пиков, похуй на понимание промта, композицию, главное чтобы была прыщавая целлюлитная текстурка кожи на ебле бабы. сдшиза не излечима.
>>544760 Ты дебил, мы сейчас про скорость/качество говорим. Я в фотошопе за 0,001 сек могу апскелить с потерей прыщиков, но с сохранением твоей композиции.
>>544702 > 4096 Это 4-й вариант тут >>544417. Мои тесты за последние пару месяцев уверяют, что это один из худших вариантов для txt2img, слишком дохуя деформаций, как на беэкграунде, так и на переднем плане. А вот для img2img вроде меньше деформаций дает, зато добавляет четкости, но сука тестировать это пиздец, как хуево, когда даже на 1.4х апскейл с 12 шагами уходит 2-3 минуты.
>>544785 Не знаю, я тестил и локально и в колабе, оооочень долго и много, с различными семплерами, ворками, и т.д. 4096 это был всегда лучший вариант. А деформации на бэкграунде, это уже вопросы к модели, семплеру, кол-ву шагов.
>>544722 В общем, на более высоких разрешениях, разница в скорости особенно не ощущается, скрипт от Кохя начинает генерить даже медленнее чем обычный txt2img + hiresfix (но может из-за того, что у меня память в конце утекает в RAM).
Но может кое-где еще есть разница, к примеру я заметил, что с новой нодой композиция чуть другая и эффект обработки лиц не такой как в обычном хайрезе.
>>544851 Снизил, но походу это просто при одновременном подключении hiresfix от Kohya и LCM лоры начинает сыпать зернистостью, которая искажает картинку на каком-то этапе.
>>544824 Картинка 512 на 768, мобильная 3050 в ноутбуке. Поставил автоматик, кинул промпт, моделька sdxl
Почему так долго? Минут 10-20-30 пыхтит усиленно. Люди как-то умудряются 4к картинки делать на таких карточках, а у меня даже мелочь генерится дольше чем в любом другом виде (привет вебсервисам)
>>544858 >мобильная 3050 >SD XL >пачиму так долго?!! Наркоман чтоле сука? На четырёх гигах иксель вообще работать не должна, это у вас на нвидиях она заводится за счёт обычной, не видео-памяти.
Upscale by для начала ставь на 1.5 вместо 2, но в будущем просто научись апскейлить через tiled diffusion (через него и ты быстро сможешь делать 4k апскейл).
Если после этого захочешь генерить картинки еще быстрее, но с потерей качества, то попробуй использовать LCM лору, но это уже после всего, что я тебе написал.
Этот подход, хорошо идет в купе с этой лорой (ссылка на версию для моделей на 1.5), которая позволяет генерить более-менее норм (но не супер) картинки всего за 4-6 шага (обязательно с CFG между 1.3 и 1.8) https://huggingface.co/latent-consistency/lcm-lora-sdv1-5/tree/main Многие в ComfyUI подключают после нее почему-то ноду ModelSamplingDiscrete.
>>544903 >Многие в ComfyUI подключают после нее почему-то ноду ModelSamplingDiscrete. Ну в общем-то это требуется для полной реализации этой хуйни согласно автору. Не знаю на что это влияет.
>>544881 Да, прогресс тащит. Я сейчас вот такое хайрезфиксом с лцм генерю за пару минут, для моих адмшных 4 гигов это тоже ебать успех. >>544904 Это пиздец. >>544941 Тебя ебёт? Работает и ладно.
>>542817 (OP) Мне нужна нода ComfyUI которая будет принимать настройки и отправлять их в любую другую ноду, поведение которой можно поменять - сэмплер, латент, загрузчик лоры и т.д.. Есть такое?
>>545114 > Есть такое? Нет. Максимум может числовые значения math нода принимать, если ты без спагетти хочешь. А так, на всё примитив есть, хоть и хуевый.
Как в ебучем автоматике поменять путь до директорий с моделями? Они там ебанулись символьные ссылки использовать? Даже в EasyDiffusion ПРОСТО указываешь папку и все.
>>545102 Какую хочешь. Я разные ставил, от 0.3 до 1.0, на полном весе эффект выжигания/переконтраста может быть заметен а мне и так норм. Начни с 0.6, например, мало - прибавь, много - убавь...
Ну в целом неплохо с новым хайрезфиксом в автоматике стало, c LCM 5 секунд на хайрез пикчу. Если скейл подкрутить то даже лучше обычного хайрезфикса. Вроде SDXL размыливается немного, пикрилейтеды вообще с Euler a.
>>543957 Нужно изобрести принципиально новый метод дополнения. Как гипернетворки, но не гипернетворки. Или гипернетворки. Нужно что-то, что не зачёркивает к хренам достижения полторашки, а дополняет их. Что-то, что растёт поверх неё - как слои инпаинтинга.
>>545126 > А так, на всё примитив есть, хоть и хуевый. Как им пользоваться? У него есть только connect to widget input, которая ни к чему не подходит, и сама нода не принимает значения.
>>545250 Его давно изобрели, мультимодальность называется. Попроси сетку и она сама сможет входную пикчу использовать как референс по стилю или опорник типа контролнета, если будет достаточно умной чтобы понять твой запрос, без необходимости тренировать дополнительные адаптеры.
>>545369 Может быть рероут другого типа? Когда соплю вынимаешь из выхода, на кончике висит козявка и на ней указан тип, посмотри. Попробуй например не подключать к рероуту, а вешать новый рероут.
>>545368 Есть Bus в WAS Suite, и pipe в куче других (например Impact Pack).
>>545386 >Есть Bus в WAS Suite, и pipe в куче других (например Impact Pack). А также всякие сендеры-ресиверы, кастомные рероуты, и куча подобных вспомогательных нод.
>>545440 Ну если ты делаешь ресайз а img2img то это фактически апскейл. Он на высоком денойзе ебет композицию. Поэтому либо понижай денойз либо подключай контролнет (к примеру tile можно использовать с денойзом 0.9).
Посоны, а есть в А1111 (экстеншен может какой?) возможность прогнать один и тот же промпт через 10 чекпойнтов? Ну вот у меня есть 10 условных чекпоинтов и я хочу узнать как выглядит один и тот же промпт на каждом из них без переключения чекпоинта каждый раз вручную после генерации
>>545493 >512x512 я думаю, на таком разрешении у большинства анонов тут с Latent Consistency будет меньше секунды на генерацию картинки со скетча.
Это уже новости прошлого - буквально, с прошлого треда >>541504 →
Мне кажется более прикольным вот это >>544881, тут генерация картинки на уже приемлемом разрешении за несколько секунд. При этом на RTX 4090 уже говорят, что генерация мгновенная, даже 10 2k картинок в секунду.
>>545510 Если тебе пойдет новый подход к хайрезфиксу от Kohya, где модель может обрабатывать высокие разрешения сразу, то вот мой barebones воркфлоу, которым я тестировал lcm
>>545502 Ты не понял, суть в интерфейсе. Возюкаешь и видишь изменения в реалтайме. Нейронный рендер, своего рода. Оно как раз и крутится на LCM и A100. В Nvidia Canvas за несколько лет до диффьюжен моделей такое делали. Я пилю такую херню для блендера пока что, чтобы раскладывало на слои и использовало контролнеты, и собирало промпты, и во вьюпорте прямо рендерило на лету, как с обычными рендерами. (естественно нужно что-то помощнее, и прям такого реалтайма не будет, будет прогрессивный рендер)
>>545502 > на RTX 4090 уже говорят, что генерация мгновенная, даже 10 2k картинок в секунду Мыльно без негативов и нормальных семплеров. Лучше использовать частичную LCM на 10 шагах. Хорошие хайрезы на 4090 за 5 секунд отлетают, да. С новым хайрезфиксом даже глаза уже норм на полторахе становятся.
>>545567 > результаты очень хорошие Мыльные. Да и в Комфи оно через жопу работает, нода LCM-семплинга особой роли не играет, всё так же детализация кал, особенно в хайрезах и аниме.
Так чем семплеры практически отличаются? Только без теоретической хрени. Есть быстрые, есть медленные. Есть откровенно хреновые, есть норм. Как вы выбираете из тех, что норм?
>>545571 В любом случае результат лучше, чем при использовании стандартных семплеров. Для генерации с нуля LCM не очень подходит — мыло и мало деталей. Но для использования в качестве семплера для апскейлера — норм.
>>545573 Скоростью на шаг, насколько быстро (на каком минимальном шаге) каша превращается в неплохую картинку, сходимостью (или как там она зовется, чтобы по сиду и другим параметрам можно было воспроизвести исходную картинку).
Мимо диванный с 2GB 1050, мой выбор - DPM++ 2M Karras и иногда Euler
>>545573 >Только без теоретической хрени. Без неё ты обречён на полировку какашки, смирись. Если ты не понимаешь как оно работает, так и будешь сидеть циферки тыркать в надежде на чудо, сдвинешь одно и поедет другое. Шаманство - не выход.
>>545571 >>545589 А еще с ним прикольно быстро делать несколько проходов, начиная с изначальной генерации, а потом img2img по 2-3 раза с высоким денойзом и каждый этап по 5 шагов чтобы быстро.
Comfyui: из 100 картинок я получаю допустим 20 хороших, их я хочу отправить на апскейл, при этом не меняя воркфлоу, и не занимаясь апскейлом всех сразу. Как такое сделать?
аноны, разбираюсь вот с inpaint в автоматике, и вопрос появился -какого хуя вот эта область (я как раз её маской обвёл) настолько темнее и выделяется, как это фиксить?
>>545607 Ну можешь в одном окне один ворклофоу держать, а в другом другой для апскейла.
Если хочешь быстро сразу переключиться с одного воркфлоу на другой, то в этой кастомной ноде https://github.com/pythongosssss/ComfyUI-Custom-Scripts есть возможность сохранения воркфлоу так, чтобы они загружались из ComfyUI Manager. Просто нажимаешь на стрелочку возле Load и выбираешь название своего воркфлоу, как если бы ты переключался между вкладками в Автоматике.
Только вот при переключении на другой ворклфлоу у тебя будет выгружаться модель из видеопамяти и нужно будет подождать пока она снова не загрузится.
>>545607 >>545609 В латенте ставишь батч больше 1, сколько влезет в память. В кастомных нодах есть что-то типа select from batch, которые ждут пока ты выберешь нужную, прежде чем отправлять дальше по сопле. Я хуйнёй типа "выбрать столько-то пикч" не занимаюсь если ты хоть раз изменил сид с 0 на что-то ещё, ты уже что-то делаешь неправильно, поэтому точно ноду не подскажу, тебе придётся самому искать в менеджере.
И есть что-то типа load from folder, можешь с одним воркфлоу генерировать 100 кандидатов в папку одной очередью, удалить говно, потом натравить другой на папку.
Как ещё один вариант - comfyui-job-iterator позволяет делать произвольные итерации по любой переменной, не прибегая к очереди. В Comfyroll и может быть ezXY тоже такое есть.
>при этом не меняя воркфлоу Зачем? ComfyUI-Custom-Scripts например позволяет менять сохранённые воркфлоу двумя кликами, тупо из менюхи.
>>545676 Для последней: G: horror-themed film still from 90s b-movie, mutated potato person creeping in a dark corridor of an abandoned psychiatric ward L: eerie, unsettling, dark, spooky, suspenseful, grim, highly detailed, highly detailed, cinemascope, moody, epic, extremely clear sharp focus, film grain, grainy, mutated potato person creeping in a dark corridor of an abandoned psychiatric ward Negative: cheerful, bright, vibrant, light-hearted, cute, blurry, distorted, glitch juggernautXL_version6Rundiffusion
>>545690 Почти такой же. 2: G: horror-themed film still from 2000s movie, mutated potato person creeping in a dark corridor of an abandoned psychiatric ward L: eerie, unsettling, dark, spooky, suspenseful, grim, highly detailed, highly detailed, high budget, epic, extremely clear sharp focus, film grain, grainy, mutated potato person creeping in a dark corridor of an abandoned psychiatric ward Negative: cheerful, bright, vibrant, light-hearted, cute, blurry, 3d render, glitch
3: G: horror-themed film still from 70s exploitation movie, mutated potato person creeping in a dark corridor of an abandoned psychiatric ward L: eerie, unsettling, dark, spooky, suspenseful, grim, highly detailed, highly detailed, high budget, cinemascope, epic, extremely clear sharp focus, film grain, grainy, mutated potato person creeping in a dark corridor of an abandoned psychiatric ward Negative: cheerful, bright, vibrant, light-hearted, cute, blurry, distorted, glitch
>>545708 G - лучше понимает простой разговорный текст. L - тот, что и в 1.5 - лучше воспринимает мастерписьки через запятую. В sdxl используются сразу оба два.
следующий этап: как себя в аниме превратить? и можно ли этим сиськам пересадить лицо тёлки из инстаграма? с лицом вроде нашёл как, а вот с аниме всё кривое получается. что лучше img2img или controlNet для такого?
>>542817 (OP) В ComfyUI не могу использовать кастомную ноду, несмотря на то что я её установил. Репа was-node-suite-comfyui, установил через менеджер, потом переустановил через git clone, но ноды не появляются в списке, и при загрузке чужого конфига считаются пропущенными. Помогите.
>>545955 > ноды не появляются в списке Все was ноды или только те, что в спизженном конфиге? В консоли при запуске кофми все нормально или ругается, что не смог загрузить was-suite?
>>545960 >Все was ноды или только те, что в спизженном конфиге? Наверное все. Я не увидел новых, а в was их много.
>В консоли при запуске кофми все нормально или ругается, что не смог загрузить was-suite? Ругается на отсутствие numba и что-то ещё. Я до этого пытался запустить install.bat, но не получилось.
Да, с инпеинтом Нет, анцензор не дам (объяснять почему впадлу), хотя писька на 1-й получилась прям супер сочная и аккуратная Да, с лорами Нет, промты не дам
>>546144 >>546145 Все кто грузит свои покакуньки на цивит/cuiwf - шизы со справкой, блять. У одних километровые портянки бессмысленных тегов, которые даже модель не знает, размазывание говна по говну тонким слоем. Другие - ебучие хаоситы с психопатическими схемами, в которых ногу сломишь. В них можно было бы разобраться, если бы эти ебанутые делали группы и хоть как-то их расставляли, но они делают какой-то лавкрафтовский лабиринт из соплей. Уверен что в башке у них такой же лабиринт.
>>546147 > шизы со справкой > если бы эти ебанутые делали группы и хоть как-то их расставляли > не делайте, как мне не нравится, иначе ебнутые классика шизовахтера
>>546149 Погромист батников с салатом из goto, ты? Это сайт для выкладывания схем, чтобы показать как делать то или сё. Нахуй вообще загружать туда, если в нём хуй кто когда разберётся кроме тебя самого? Вот например в 2 раза больше нод, но всё понятно и читается, потому что разбито по кускам. хотя можно было сократить раз в 6, применив банальный плоттер
Аноны, а есть какие-то модели для создания дизайна наклейки (типа 1,2 картинок)? На цивите посмотрел по запросу logo - там какой-то ад (последний скрин). На лого.аи и подобных - делается качественно, но конструктор не позволяет тонко настроить детали.
>>546145 >>546151 >>546157 >>546163 Как вы пользуетесь большими схемами? Летаете туда-сюда, чтобы ввести вручную или увидеть новые данные в ноде на самом краю?
>>546263 Есть лоры на иконки на цивите. Можешь натренить свою. Текст только вручную контролнетами делается.
>>546305 >Как если бы DALLe-3 умел в русский текст. Он ни в какой не умеет, глючит. Только DeepFloyd IF нормально умеет в текст. И может быть Parti, которого никто никогда в глаза не видел. В общем про текст нейронкой без контролнетов можно пока забыть. Хотя если дипфлойд погонять, можно попробовать поизвращаться, но файнтюнить его заебёшься, если вообще возможно.
>>546307 Если схема нормально разложена по функциональным блокам, туда-сюда летать просто нахер не нужно. А так то ли этот пак https://github.com/pythongosssss/ComfyUI-Custom-Scripts , то ли ещё какой добавляет возможность прыгать по хоткеям или через менюхи, и следовать цепочке исполнения по мере рендера.
>>546307 >Летаете туда-сюда, чтобы ввести вручную Все крутилки можно просто вывести примитивами в одно место. Ещё и заметками (Note) снабдить, или надписями видными с минимального зума (картинка, хранимая в самом воркфлоу, в WAS паке лоадер такое умеет)
>>546308 >Только DeepFloyd IF нормально умеет в текст. Вообще, довольно передовая сетка была на тот момент. И трансформер для понимания промпта, и текст, и встроенный зерошот. Вот например пик1 контролнетами ещё можно сделать, а пик2 уже хуй. Жаль не взлетела, и лицензия говно. Хотя почему была, можно качнуть и погонять прямо в комфи/автоматике, если есть 24ГБ под рукой. (может Т5 можно квантизовать посильней и требования будут поменьше, хз).
>>546307 >Летаете туда-сюда, чтобы ввести вручную или увидеть новые данные в ноде на самом краю? Для комфи есть вот такая штука, от собственно самих SAI https://github.com/Stability-AI/StableSwarmUI она пока в альфе считай, но по сути представляет собой обычный интерфейс, куда можно втыкать входы-выходы комфи. И есть ещё такая https://github.com/rvion/CushyStudio , она более готовая, но представляет собой плод сумрачного погромистского гения (читай: кромешный вырвиглаз, и чёрт ногу сломит)
Ни одна из них не юзабельна нормально, в отличие от InvokeAI, в котором и ноды и нормальный интерфейс комбинированы изначально.
>>546382 Если нет многообразия нод, в каждой из которых что-то происходит - нет и никаких сложностей. Согласен. Если бы мне не были важны ноды, я бы на автоматике остался. И ты мне предлагаешь клон автоматика (или я чего-то не увидел на их странице).
>>546413 Там есть собственный нодредактор же. И кастомные ноды у них в дискорде. И канва бесконечная пиздатая, и менеджер ассетов. Главные минусы - они отстают по фичам обычно, и при импорте чекпоинтов происходит конвертация в собственный формат (может и не минус для тех у кого место резиновое)
>>546449 Ну если ты понимаешь что такое контролнет, ты понимаешь и как сделать. Чертишь на чёрном фоне 6 палочек как свечки в нужных местах, скармливаешь контролнету с промптом про свечки, он рисует там свечки. Если тебе надо добавить на уже имеющуюся пикчу - можешь инпеинтом воспользоваться, можно и контролнетом управлять. Если работаешь с комфи, то можно первые столько-то шагов рисовать стол, столько-то шагов книги, столько-то шагов свечки (всё с разными контролнетами), а потом всё сразу. Не знаю как в автоматике, наверно тоже можно.
>>546438 Как вариант, генеришь сначала по промпту, а потом грубо копи-пастишь получившийся предмет нужное количество раз на картинку, потом проходишь img2img или таргетировано ипейнтом.
Есть еще региональный промптинг, где ты указываешь нейронке где она что должна генерить, но эта сложная вещь.
игрался с img2img и аниму-модельками но обычно получается очень грязные штуки. это уже после апскейла и генерации, а я могу как-то сделать именно эту картинку чёткой и красивой, не меняя деталей?
>>546661 > Нахуя вы постите дженерик ебальники, которые уже за несколько лет заебали практически всех? Тут всего несколько сд шизов осталось которые постят, у них несколько промтов за год было: баба в анфас, крыса, овощи, портрет гослинга, замок на горе, портрет клоуна и монстра. Остальные здесь новокеки залётные и пиздаболы которые постоянно обсуждают как сд развивается — эти контент не постят вообще, у них только всё в теории. Тред давно мёртв.
>>546675 И родился таким. Технический навык не подарил никому художественный вкус. Как постили баболица и сиськи, так и будут, даже не пытаясь это как-то обыграть
>>546645 img2img нужно делать до апскейла и желательно на тех разрешениях, на которых умеет нормально генерить нейронка. Если хочешь чтобы изображение не сильно менялось то уменьшай денойз или подруби tile контролнет и повысь денойз.
С чего последнего анон кайфанул в нейронках? Lcm lora, кайф какой то, буст скорости без очевидных минусов (хотя наверное хуже промта слушается из-за пониженного цфг)
>>546695 > в чём собственно проблема Ты один из тех гениев, что в андройдотреде обсуждает яблоки, а в торрентотреде - тонкости оплаты нетфликса из РФ через впн?
>>546696 Новый фикс от Kohya, который позволяет генерить картинки сразу на высоком разрешении. По скорости на совсем высоких разрешениях начинает уступать обычному хайрезфиксу, но при этом сильно бустит композицию.
>>546695 > у вас тут зашквар пользоваться инструментом Канеша зашквар, тру сд юзеры не пользуются мижорнями, далями, и фаташопами. Они годноту генерят с промта на ванильной полторахе. Юзал петушиный мижорни — зашкварился навсегда.
>>546699 В реальности же, большинство пользуется и тем, и другим, а иногда и третьим. И только один долбоеб уже год не может понять, что на доске не спроста более одного треда.
>>546700 > В реальности же, большинство пользуется и тем, и другим, а иногда и третьим. Тру сд юзеры не пользуются мерзким мижорни, и другим онлайн хламом. Они генерят годноту локально. Не трясись, иди на джойреактор и там пости своё мыльцо, никто тут тебя по головке гладить не будет если ты приносишь пики из фотожопа и мижорней.
>>546716 > Аноны, почему тут многие дрочат на ComfyUI, в чем профит? sdxl работает быстрее. Только прикол в том что они генерт всё тоже самое что и на полторахе - портреты баб, при этом на выходе получают кривое мыло.
>>546661 >>546741 Ну ок, дженерик ебальники тебе не нравятся, всратки тоже тоже не заходят, судя по вытекающей иронии. Что тогда нужно? Трапы? Они в /nf.
>>542817 (OP) Я новичок, решил освоить img2img для улучшения качества. Здесь писали, что когда нейросеть работает дважды над одной картинкой, получается лучше, и я сам в этом убедился не раз, ещё когда пользовался hiresfix в автоматике. Img2img той же моделью даёт хорошие результаты, img2img sdxl моделью даёт мусор. Почему? На ютубе я видел как на той же модели, на том же воркфлоу, sdxl выдаёт шедевры.
>>546695 Никакого зашквара, не обращай внимание для шизов. Это и есть нормальное и целевое использование нейросети. Нейросеть - помощник и инструмент, а не религиозный объект поклонения.
>>546839 >Нейросеть - помощник и инструмент, а не религиозный объект поклонения. это особенно заметно по истерикам с атомными подрывами всякий раз, когда вдали треде оказываются картиночки из сд
>>546838 >img2img sdxl моделью даёт мусор сложно понять без используемых тобой параметров, может разрешение картинки не то ставишь, на высоких разрешениях нужно ставить и чуть выше денойз.
>>547063 Вернись обратно в mj/dalle тред. Я лучше послушаю советы преуспевших в генерации анонов, чем твои попытки склонить меня к онлайн говну без кастомизации.
>>547069 > Я лучше послушаю советы преуспевших в генерации анонов Нет, я подожду здесь пару лет когда советы преуспевающих анонов в генерациях бабы в анфас, помогут тебе сделать такие >>547076 → пики в СД локально.
>>547094 > Съеби. Тебе здесь не рады. Не можешь помочь по тематике треда - иди нахуй. Аахахах, вот это тряска у сд шиза. Чел, такие пики в сд невозможно сделать, увы, не расстраивайся, через пару лет сможешь скачать себе на комп sdxl 5.0 и сгенерить локально. А пока тебе остаётся только ждать.
>>547100 > такое мыльное говно Ахахха, у сд шиза один критерий, нет текстурки кожи, значит говно. > А чего-бы не подождать и потренироваться на текущей версии SD. Кто-то нас торопит? Тренируйся, из 1000 сгенереных пиков в СД с правильной анатомией и отрисовкой лица у тебя будет 0 пиков. > Ну так натренирую лору и будет SD тебе генерить что хочешь. no comments
>>547197 Почему этот сайт отдаёт кисти и стопы не как часть openpose, как как глубину, нормаль и контуры? Где можно создать или распознать позу с пальцами?
>>547233 >Используй DWpose preprocessor Error occurred when executing DWPreprocessor:
local variable 'detected_map' referenced before assignment
File "f:\AI\ComfyUI_windows_portable\ComfyUI\execution.py", line 152, in recursive_execute output_data, output_ui = get_output_data(obj, input_data_all) File "f:\AI\ComfyUI_windows_portable\ComfyUI\execution.py", line 82, in get_output_data return_values = map_node_over_list(obj, input_data_all, obj.FUNCTION, allow_interrupt=True) File "f:\AI\ComfyUI_windows_portable\ComfyUI\execution.py", line 75, in map_node_over_list results.append(getattr(obj, func)(slice_dict(input_data_all, i))) File "F:\AI\ComfyUI_windows_portable\ComfyUI\custom_nodes\comfyui_controlnet_aux\node_wrappers\dwpose.py", line 73, in estimate_pose out = common_annotator_call(func, image, include_hand=detect_hand, include_face=detect_face, include_body=detect_body, image_and_json=True, resolution=resolution) File "F:\AI\ComfyUI_windows_portable\ComfyUI\custom_nodes\comfyui_controlnet_aux\utils.py", line 52, in common_annotator_call np_result = model(np_image, output_type="np", detect_resolution=detect_resolution, kwargs) File "F:\AI\ComfyUI_windows_portable\ComfyUI\custom_nodes\comfyui_controlnet_aux\node_wrappers\dwpose.py", line 68, in func result = model(image, kwargs) File "F:\AI\ComfyUI_windows_portable\ComfyUI\custom_nodes\comfyui_controlnet_aux\src\controlnet_aux\dwpose\__init__.py", line 184, in __call__ poses = self.detect_poses(detected_map,input_image, include_hand, include_face)
>>546716 Людям нравятся схемки; нравится их скриншотить, сохранять. Это называется аутизм, и он является разновидностью нормы. Так-то по функционалу тоже самое, только там еще есть всякие непопулярные модели, и автоматически включаются оптимизации по типу lowvram
>>547137 > Что это значит? LCM делает большую часть работы за 5 шагов, потом dpmpp_2m_sde heun karras за ним подчищает за 7 шагов с 0.25 денойзом. > воркфлоу Примерно так.