Генерируя в коллабе на чужом блокноте будьте готовы к тому, что его автору могут отправляться все ваши промты, генерации, данные google-аккаунта, IP-адрес и фингерпринт браузера.
ComfyUI https://github.com/comfyanonymous/ComfyUI Интерфейс, заточенный на построение собственных workflow посредством организации конвееров через редактирование нод с различными действиями и указанием связей между ними.
>>641377 → Попробуй https://civitai.com/models/300398 В этой версии пока хвосты починены не до конца и есть некоторые проблемы, но заметно лучше чем в оригинальной модели вон жопы для примера >>639572 → . Если еще подобрать сочетание стилей ее то крайне интересные результаты получаются, в постах глянь.
>>641446 А какой там промт? На всякие "эффекты" реагирует более остро чем оригинал и в них, обычно, нет нужды. Надо понять что не так выходит если артефачит. Датасет от поней в той версии, именно на хвосты было не так много пикч, ибо в понях нет нужды фиксить это. Но всеравно ухватило, плейсмент более точный дает, особенно в комбинациях.
>>641474 Кстати, наглядно видно меньше поломок в перспективе при странных ракурсах. Плюс как слушается промта "wearing {bikini|closed|school} swimsuit", в первом случае сбивается крайне редко при взаимодействии с вайлдкартами фона, а во втором так и норовит одеть лишнюю футболку, латексный костюм и т.д. По задникам есть нюансы, но при проставлении определенных артистов превосходит оригинал. Сиды просто подряд без черрипика, офк можно набрать таких где какая-то модель будет явно превосходить, или найти сочетания промта, косяков хватает, но в целом для тестовой версии - более чем. Заодно в перспективе оформляется депортация большей части зоопарка странных лор на единичные стили-концепты. Это добро пусть остается для 1.5.
>>641654 Итт постить не хочу, вот поэтому: >Генерируем тяночек! Слово "тяночка" в лексиконе - маркер мудака. Это эмпирическое наблюдение, то есть я не раз в этом убеждался, хоть и не знаю в чем причина. Поссал на ОПа и скрыл говнотред.
>>641474 >А какой там промт? Я на разных пробовал, вот максимально простой, буквально тупо аниме девушка в купальном костюме с кошачьими ушами и хвостом. >на хвосты было не так много пикч >Модель имеет tail в названии >Не тренирована на tail Ну окей. У оригинала светлее цвета, картинка ярче, не отрастают третьи ноги и вторые хвосты. Пятый хвост при этом точно так же втыкает хвосты в спины или отращивает их из ягодицы, случаи, когда он ставит хвост в нужное место очень редкие. При этом сами девочки получаются максимально однотипные, этот тюн в 9 случаев из 10 рисует их с чёрными волосами, тогда как оригинал подбирает рандомные.
Аноны, я хуй с горы, приехал с тупыми вопросами. 1) Используете ли вы controlnet в своих построениях? 2) Можно ли как-то описать персонажа, запихнуть этот образ в нейросеть, так чтобы она выдавала постоянно стабильные результаты? 3) Как дела с анимацией? Если допустим дать картинку с персонажем, и попросить(с помощью того же controlnet) сгенерить слегка новую позу, то будет ли учтена первая фото? или будет полностью новая генерация? 4) Как дела с множеством персонажей? можно ли заставить их как-то взаимодействовать? за руки взяться например? а взаимодействовать с окружающим миром?
>>641759 Спасибо что указал, над кошечками поработаю. В новом датасете их в 7 раз больше, высок шанс что будет хорошо. > У оригинала светлее цвета, картинка ярче Yep, она даже слишком пересвечена а из-за особенностей такого sdxl управлять ею сложно. > случаи, когда он ставит хвост в нужное место очень редкие В зависимости от промта и прочего или также или в разы чаще чем с оригинальной моделью, на тех гридах показал. Но есть к чему стремиться, офк. Алсо похоже у тебя в промте какой-нибудь hdr или нечто подобное стоит, вот оно и дает подобный эффект, сравни с теми что в гридах. Если в анимейджине улучшайзеры лишь пробуждает то что осталось от оригинального SD, то здесь некоторые из них пересекаются с дополнительными тегами при тренировке. Раз такое вызывает проблемы, можно подумать над их сменой. Там промт элементарный {1-5$$ , $$__artists__}, 1girl,cat girl, cat ears, cat tail, wearing bikini swimsuit, side view, view {from above|from below}, scenery, {short|long|medium} hair, __backgrounds/any__, best quality, masterpiece
>>641748 Ля какая! Такое точно нужно проверить. >>641759 > не отрастают третьи ноги Еще как отрастают, вопрос удачности сидов. Кстати насчет хвостов, если 1-3 анимейджин а 2-4 5й, то у первого 2 хвоста из 12, а в второго 5-8 в зависимости как трактовать, так что про редкость зря. Насчет волос надо потестить, такой-то азиатский байас лол. >>641808 cat is fine too
>>641851 > Насчет волос надо потестить Теорема эскобара, без указания промта (1girl, cat girl in swimsuit,best quality, masterpiece) в обоих случаях с вариативностью грустно. С вайлдкартой на рисовак в обоих случаях разнообразия добавляется.
>>641777 Cправедливо. >>641808 >где ошибка. Ну пихал бы в название FOX, а не хвосты, если модель про лисиц. >>641838 >управлять ею сложно. Хуйня. Во-первых, нахуя мне затемнять картинку? Более светлые смотрятся приятнее. Во-вторых, светлое можно затемнить, но осветлить тёмное нельзя, т.к детали из черноты не появятся сами собой. >похоже у тебя в промте какой-нибудь hdr Нет. Это был буквально >anime girl in swiming suit, cat tail, cat ears, Я пробовал докидывать by n0r0 и прочее, добавляет ватермарки и, вроде бы, больше ничего. >>641851 > такой-то азиатский байас Я потому гриды и прикладывал, чтобы было видно, что это не черрипики или разные промпты. Оригинал реально оригинальнее, лол. Причём бывает, что он выбирает тёмные волосы, но докидывает к ним двухцветность, что смотрится более выигрышно.
>>641878 Те же промпты в том же порядке. Везде указана жёлтая палитра, кроме второго пика, где требовались в дополнение синие волосы и синие глаза. Всё без мастерписек, хай бюджетов и детализации, простые промпты максимально.
>>641878 > Cправедливо. Что справедливого? Буквально чистый оригинальный файнтюн модели, коих единицы, и даже из тех большая часть - полумертвые, или чего хуже мердж лор с мертвыми нейронами. > Во-первых, нахуя мне затемнять картинку? Более светлые смотрятся приятнее. Вкусовщина же. > но осветлить тёмное нельзя, т.к детали из черноты не появятся сами собой. Все зависит от того есть они, или действительно просто выглаживаются. Именно падения из-за затемнения не заметил, но надо обратить внимание, спасибо. Вообще крутилка финальной яркости - буквально ползунок в тулзе > Нет. Это был буквально Это странно, почему тогда результаты настолько отличается от остальных, особенно самые первые? Вот те гриды с метадатой, ну нет же ничего такого. Может что-то в негативе, или какие-то настройки накручены. https://files.catbox.moe/unttzt.png https://files.catbox.moe/gu6nwy.png > добавляет ватермарки и, вроде бы, больше ничего Эээ, как раз на стили из наличия оно правильно реагирует, ты точно ту модель тестируешь? Пикрел и она же на кетбоксе с данными https://files.catbox.moe/fl7lrp.png > Я потому гриды и прикладывал, чтобы было видно, что это не черрипики или разные промпты Да не, нисколько не обвиняю в том что выбираешь специально, надо лишь понять причину. Если оно поломанная херня - похуй, там даже в описании прямо указано "эксприментальный" и "бета", но нужно понять причину или воспроизвести условия. > Оригинал реально оригинальнее, лол Спорно, блеклый поккерфейс аппербади на едва прорисованном заднике. Левая часть тоже не всегда удается, но хотябы пытается позировать и чем-то наполнять. На твоих гридах выше там вообще какой-то сюрр, но у 5го хвоста что-то не то с гаммой.
Ну рили, не подумай что спорю или набрасываю, просто пытаюсь понять в чем тут дело. Может ты зашел в ту область, где как раз все косяки проявляются, но такое же не повторяется. >>641884 2-4 четкие прям > Везде указана жёлтая палитра Вут?
>>641884 > Всё без мастерписек, хай бюджетов и детализации Это какбы напрямую указанно и в инструкции к оригинальной модели, и использовалось в датасете, который в том числе содержал не самые красивые, протеганные как не самые красивые. > простые промпты максимально Залей на котокоробку, попробую воспроизвести.
>>641888 >anime girl in swiming suit, cat tail, cat ears, yellow palette, moody, blue hair, glowing eyes, blue eyes, detailed iris, detailed eyes, bright pupils, looking down, low camera angle, clenched teeth, crazy smile, chiaroscuro, dark, По сути, оно меня не послушало на счёт свимсвьюта, но так даже лучше. Если делать описание глаз не одним куском, а разбивать, как тут, то модель может ебануться и нарисовать зрачки в зрачках, например. Но тут прокатило. >>641893 >Это странно, почему тогда результаты настолько отличается от остальных, особенно самые первые? Самые первые гриды? Там промпт на яркие цвета и сказочную атмосферу. Только он одинаковый для обеих моделей, лул. Негатив забит хернёй типа "mutated hands and fingers, bad hands, missing fingers, cropped" >ты точно ту модель тестируешь? 5thTail_v01Beta и animagineXLV3. Честно говоря, второй мне нравится намного больше, как бы ни было у него хуёво с хвостами. Хотя на пике с морем воткнул куда надо. >Вут? Если я хочу, чтобы на пике был жёлтый, я пишу yellow palette. А дальше уже нейронка сама решает, что именно окрасить в жёлтый. И это неплохо работает на самом деле. >>641895 >Это какбы напрямую указанно и в инструкции к оригинальной модели Да я в курсе, просто лень было. Там заливать буквально нечего, смотри в начале сообщения.
>>641912 > Самые первые гриды? Там промпт на яркие цвета и сказочную атмосферу. Да, которые >>641446 их прямо радикально распидарасило, хочу также. > 5thTail_v01Beta и animagineXLV3 Почему тогда > пробовал докидывать by n0r0 и прочее, добавляет ватермарки и, вроде бы, больше ничего при том что реагирует на него очень явно и отчетливо? Ватермарок у него вроде нету, но тут хз, на некоторых артистах они присутствуют (как и в оригинальной модели при выборе некоторых копирайтов). Плюс остальное поведение радикально иное. Оно выглядит стильно и интересно, но сильно ушло в черный и действительно страдает от плоских цветов. > Если я хочу, чтобы на пике был жёлтый, я пишу yellow palette. А дальше уже нейронка сама решает, что именно окрасить в жёлтый. И это неплохо работает на самом деле. Действительно работает, прикрел, ну и котокоробка https://files.catbox.moe/sgoojf.png Кмк вполне знатный шоукейз цветов, детализации и когерентности, и ничего из описанных проблем нет. Как их получить? > Там заливать буквально нечего Остался включенным какой-то костыль, особые параметры k-samplers, поломанные версии или негатив. Если последнее то хотелось бы понять какой именно, чтобы при необходимости починить. Поломанный автоматик легко диагностируется невозможностью воспроизвести сиды даже при rng=CPU и проявляется подобными странностями в некоторых генерациях.
Ну ладно, в любом случае спасибо что время потратил, насчет базовой яркости и гаммы надо подумать, и о кошечках позаботитбся. Пони скоро дотренятся и тогда анимейджин на очереди.
>>641923 >радикально распидарасило, хочу также. by watao, action frame, an anime girl with cat tail , adventurous, magical, vibrant, dynamic, fantastical, enhancing the magical elements of the scene,dawn, with the soft light of the rising sun illuminating, vibrant colors and whimsical characters defining the scene, highly detailed, high budget, moody, epic, gorgeous Negative prompt: watermark, portrait, closeup, censored, deformed, bad anatomy, disfigured, poorly face, mutated, extra limb, ugly, poorly hands, missing limb, floating limbs, disconnected limbs, disconnected head, malformed hands, long neck, mutated hands and fingers, bad hands, missing fingers, cropped, worst quality, low quality, mutation, poorly drawn, huge calf, bad hands, fused hand, missing hand, disappearing arms, disappearing thigh, disappearing calf, disappearing legs, missing fingers, fused fingers, abnormal eye proportion, abnormal hands, abnormal legs, abnormal feet, blur, shallow depth of field,
Это от самых первых. Конкретно с noro были пикчи с большой N в верхнем углу. >Действительно работает В целом, это должно предназначаться для окрашивания всей сцены, типа залить картинку одним цветом при закате и т.д. Но работает только с очень понятливыми моделями таким образом или реалистичными, с остальными только окрашивание элементов. Чего, в целом, достаточно. >легко диагностируется невозможностью воспроизвести сиды А, лол. Ну, видимо я сам виноват, что использовал семплеры, на которые модель не заточена. Не на всех можно сиды воспроизвести. Не повод менять семплер, в любом случае. Тем более, что сама animagine справляется.
Да мышь это, мышь. А не то, что ты подумал, грязный извращенец.
>>641945 Семплеры - сдохля же. Но дело не только в них, с таким промктом действительно пидарасит на любом пикрел. Хотя и выглядит интересно и можно это представить это как супермастерписьятаквижу. С dpm семплерами оно кстати даже более равномерно получается, 1-3 эйлер, 4-6 2м сде Топовый промт, 11/10, надо его попробовать со стилями смешать, или ломающих тегов буквально навалить.
А по воспроизведению - должно работать. Не так давно просто сгорел с того что не могу воспроизвести то что на моей же модели генерят или мастерписи к другим, получается какой-то шлак вместо того же. Решилось сносом обновляемого с давних времен автоматика со старым конфигом и кучей несвежих костылей. Теперь все и воспроизводится, и работает без вопросов, пропали глюки супермерджера укрепилась эрекция
>>641954 >с таким промктом действительно пидарасит Ну сорян, что мой промптинг пидорасит модели, лол. Подозреваю, что всё дело в >enhancing the magical elements of the scene >vibrant colors and whimsical characters defining the scene Олсо, видимо, мастерписи работают слабо без накидывания стилей, но схоронять их или запоминать, очевидно, лениво.
Проверил сиды, работает воспроизведение. Хотя с исходным сидом плюс рандом 0.1 играться интереснее. Грид не из хвостов.
>>641830 у меня все-таки вопрос по поводу анимации для более-менее нормальной анимации нужно научить SD строить новую картинку на основе старой, делая небольшую модификацию изображения. img-to-img в SD встроено, по сути нужен плагин который берет то что нужно поменять из позитивного промта, то что не нужно менять из негативного и строит следующий кадр на основе предыдушего. Не выглядит как супер сложная задача, что-то примерно как controlnet. неужели никто еще не собрал что-то подобное?
>>641822 > 4) Как дела с множеством персонажей? Сложно, на XL иногда получается без костылей. Трогать друг друга - норм. > взаимодействовать с окружающим миром Взаимодействия с переменным успехом, нужна конкретика. Держать кошку на руках или поднимать юбку - с радостью, пихать в себя секс игрушку - ок, показывать жест при этом держа предмет - можно нароллить, сложные действия типа "вытащить платок из чужого кармана" - с пердолингом. > 3) Как дела с анимацией? >>641972 > у меня все-таки вопрос по поводу анимации https://github.com/continue-revolution/sd-webui-animatediff Если заморочиться оно работает хорошо. Когда есть видеосорс, который нужно преобразовать - оно будет даже достаточно плавно и без артефактов.
>>641975 Про анимейтдифф успел прочитать, честно выглядит как хуета, пишешь промт, оно по промту клип. Куда логичней как по мне было бы дать кадр и написать что нужно поменять для следующего кадра. Такого как я понял никто не сделал еще, верно?
>>641959 А у меня тут >>641704 промпт буквально был Two girls with fox ears in lace metal armor, добавил к нему бэкграунд и мастерпись, а в старый исходный только из этого и пары лор и состоял.
Почалось: Стабилити анонсировали Стабильный Каскад из трех моделей на основе Wurstchen! Если XL создает бесподобные результаты, основываясь лишь на двух моделях, то можно представить, каким мощным будет каскад трех отдельных чекпойнтов весом в 10 гигов каждый. А еще инновативные техники, эстетические градиенты и тому подобное. Уже знаю заранее, что реалистичные сэмплы будут правдоподобнее ирл жизни, а рисунки в стиле маня мультов - будут пизже чем у топовых профессиональных иллюстраторов с артстейшона и пиксива !!! Это будет как далле3, но опенсорс, и вдобавок круче и продвинутей чем далле3. Ждем затаив дыхание первых подробностей и примеров генерации, и онлайн демку. Все должно работать из коробки. Индийский мусульманский гуру хуйни не сделает, проверено. XL превосходит 1.5 раза в два минимум, а целый каскад моделей - превзойдет на порядки...
>>641980 В нем "движением" управляют своя нейронка, которую можно файнтюнить на отдельные типы движений. > и написать что нужно поменять для следующего кадра На каждый кадр, или в общем? Нет, такого нет, но добавить трансформерс к имеющейся сетке и обучить это комбо технически возможно. >>642019 https://github.com/adieyal/sd-dynamic-prompts/blob/main/docs/SYNTAX.md#range-of-options >>641704 Правая огонь, а здесь >>642030 на последней garter straps armor? Можно тогда с nightgown еще что-нибудь? >>642034 Кайф. Типа твоего пикрел почти все модели могут, а если нужны "каноничные" - из 1.5 cuteyukimix, на xl лорами-стилями обмазываться. >>642079 Красава, лора или промтом? >>642147 > каскад трех отдельных чекпойнтов весом в 10 гигов каждый Они в сумме же меньше XL весят и проще во взаимодействии/обучении по заявлениям индуса. Перспективы есть.
>>642155 Там последняя версия BLIP. Вся соль новой модели в возможности дальнейшего обучения, где каждый компонент будет finetuned на совместимых данных.
>>642159 Пони умеет oppai loli (грудастая лолька, ребенок с детскими сиськами). Так и надо делать - зашивать всё в модель заранее и не ебать мозг лорами.
>>642181 А как же имг2имг, вот это всё? Мб можно интегрировать готовое лицо или тело в другую сгенеренную пикчу? Просто я пытаюсь запилить для игры, но только начал разбираться в SD
>>642182 Ты не в том треде, друг. Тут анимедауны, иди к взрослым дядям, мы тебе объясним чё к чему.
>>642190 Два принципиально разных подхода к цензуре. У далле пост-цензура, которая не отдаст тебе картинки, а у каскада такого просто в датасете не было, поэтому никаких хуев во рту. Но каскад можно по фиксить, а далле тебя будет с каждым днём все чаще женить на сабаке, но ты двачер и тебе норм.
>>642148 >на последней garter straps armor? Можно тогда с nightgown еще что-нибудь? Я там только два слова к промпту добавил, один, как несложно догадаться, это heterochromia, второй - к "лейс метал армор" дописал "леотард". >>642147 >Ждем затаив дыхание первых подробностей и примеров генерации, и онлайн демку. Демку вчера тыкал, говно какое-то. https://huggingface.co/spaces/multimodalart/stable-cascade Может в неё самую обрезанную модель засунули?
1.5 и 2.1 не могли генерировать рисунки как на pixiv, какой бы промт ты ни использовал. XL 1.0 - может, но хреново. Можно добавить в промпт костыль, слова "by makoto shinkai, at pixiv, anime-manga illustration" но это такое себе. Только после доработки стало норм с pony и animagine3. Cascade делает охуительные artwork иллюстрация сразу из коробки после публикации модели.
Лучшая модель - это такая, которая знает всё на свете, работает без кастомных лор и трейна, работает с промптами любой длины и свободна от биасов, то есть, что напишешь - то и получишь.
>>642229 Чушь, у всех SD моделей стандартизированный размер. Причем он и так гораздо больше, чем требуется: всё это можно впихнуть в два гига, если подойти с умом. Знания нейронок - это как квантовые величины, безграничные и в то же время микроскопические.
>>642247 В этих базовых моделях мне не нравится, что всегда делают трехмерные реалистичные носы с ноздрями, будто в cel-shading или обводка с фотки. А так норм.
>>642247 Уан гёрл ситтинг, это на любой модели можно изобразить.
>попросил девочек с лисьими ушками в лейс метал армор >нет блин, добавьте мне моэ и аниме! >уберите человечьи уши и чтобы броня - леотард >да блин, уберите человечьи уши! и броню запилите как я хочу!
Для генерации развратных аниме лисичек не годится, ну и зачем она нужна?!
>>642229 > чем больше модель умеет, тем больше она будет весить Не про стандартный ответ правильно. Возможности XL еще далеко не полностью использовали, емкости на множество околоанимушных концептов хватит. Главное чтобы не пошло по пути 1.5, где разнообразие разбавилось однотипным дженериком, после чего это тащилось из микса в микс. >>642276 Это модель-троль, она полностью слушается промта, но делает это по-своему
>>642276 А что ты хотел от базовой модели? Прискорбно что обнаженка не генерится, но лорами-файнтьюнами допилят. Меня наоборот порадовало что выдача стабильна и диффузиальна Никаких артефактов и каши без всякого апскейла. Возможно она и нейрошум сможет генерить за счёт одного лишь промпта и количества шагов.
Двачь помоги. Есть две абсолютно одинаковые пеки. Но на одной при первая генерация долгая а последующие раза в 2 быстрее, на второй же все генерации долгие как и первая. Заметил что на первой пеке генерация долгая именно в момент я так понял разбивки изображения на тайлы (пик) для апскейла, а при последующих генерациях вот это создание занимает буквально 2-3с. На второй пеке не так. Настройки вроде все одинаковые. С чем это может быть связано и как решать?
>>642360 Сколько оно врам потребляет при генерации, можешь глянуть? Если ее действительно можно полноценно тренировать на консумерских видеокартах, то обучить можно относительно быстро. >>642366 Выстави дефолтные настройки как при запуске (512х512, эйлер или 2м++ карась семплер, никаких хайрезфиксов), максимальное число шагов, промт 1гирл без негатива, и сгенерируй несколько пикч подряд на обоих. Потом скинь содержимое командной строки, сколько ит/с показывает и там и там.
Братушки, а как называется футболка, которая типа свободная и висит на груди? По факту это обычная футболка, но слегка короткая, виден животик, и она будто бы висит на груди. Я бля хз как нормально объяснить, но срочно нужен промпт на него.
>>642390 Вот примерно их производительность, одна пекарня чуть быстрее. Остальное - разница в параметрах, как минимум очевидно что в одном случае срет tome, в другом этого нет. При срабатывании он может давать ускорение ценой качества.
>>642411 Да, но. Вот генерация с одинаковыми настройками но Sampling steps 30 и включен хайрез фикс (ТоМе отключил). И первая пека генерит 41с а а вторая 1м30с, хотя без хайреза, вторая пека была быстрее на почти 10с. Тут какая-то хуйня с хайрезом. На первой пеке почему-то вот этот момент с тайлами намного быстрее проходит, и я не понимаю почему.
>>642148 >Можно тогда с nightgown еще что-нибудь? С ночнушкой в основном выдавало чисто ночнушку/платье почему-то, даже если вес уменьшить, а броне увеличить. Проапскейлил пару более-менее удачных лисисек. >>642311 Миленько, ещё бы эмоций добавить! >>642351 Ты доской ошибся. >>642360 Допустим, вангёрл она нормально генерит, но большой разницы с икселью я не наблюдаю (хотя я и на том и другом маловато генерил для существенной статистики). То есть получается, две околоравные альтернативы, друг с другом не совместимые, и нахера такое надо?
>>642435 Блять, немного обосрался с разрешением. Вот правильные пики. С хайрезом Пик1 первая пека время - 1.02. Пик2 вторая пека скорость 1.39 Без хайреза Первая пека по времени 1.10. Вторая пека 1.01 То есть по сути должна вторая пека быстрее генерить и с хайрез фиксом, но это почему-то не так
>>642445 У меня на одной и той же пекарне бывает и с вот этим разбиением, и без. Хз от чего зависит. я раньше думал, что от сэмплера, или может контролнет пробрался в настройки включенным, не обращал внимания, как и на скорость. Я всё равно читаю, пока оно там медленногенерится.
>>642598 Спасибо! Выходит они действительно там особой сортировки не устраивали а просто хуяк-хуяк и в продакшн (образно офк, работа всеравно немаленькая). Воспроизведение персонажей - заслуга ебейшего текстового энкодера сдохли, который при правильном подходе способен запомнить даже по несколькому десятку повторений на фоне сотен тысяч-миллионов. Пикрел, сузу мегапопулярна, голденглоу - относительно, амагичан мало. На остальных буквально по 20-40 штук и уже их черты пытается делать, с указанием остальных атрибутов в промте будет даже похоже. Но при этом оверфитится на слишком уж часто мелькающих персонажах, перенимая их костюм, переодевание во что-то похожее по фасону только с негативами. >>642585 Да куда там. Но натренили 2 йоба модели - понидифьюжн для нсфв и анимейджин для сфв. В некоторых случаях они уже могут сравниться с наи3, с дальнейшим развитием быстро ее превзойдут. >>642599 Лучшая подача десерта~
Мало VRAM это приговор для хорошего разрешения? Out of memory заебало. 1280 Х 720 уже забивает все 8 гигабайт. У меня нет 300 тысяч на видеокарту, зато есть 30 на хорошую оперативку DDR5. Покупаю 64 гигабайта, генерю медленно, но в 4к разрешении. Подводные? Или много оперативки не поможет и меня нахуй пошлют? Сколько у вас оперативки жрет когда видеопамять заканчивается?
>>642672 Чекай tiled diffusion, там есть функция tiled vae. Ничего не трогай только включи tiled vae. Мне с 8гб видеопамяти помогает абскейлить чуть больше 2к
>>642672 Делай сравнительно небольшое разрешение, потом апскейль хайрезфиксом и/или и2и. Апскейл в любом случае нужен, никто в своём уме не пытается генерить ультрахайрезы. Я вон на своих жалких 4 амгигах с 12 оперативы делаю овер 4к разрешение >>642439вчера, сука, не проверил апскейл и с небольшим артефактом залил и сюда и на пиксив, и ни там ни здесь не исправить.
>1280 Х 720 уже забивает все 8 гигабайт. У меня на четырёх максимум 1368х768 получается просто хайрезфиксом. Тебе мой способ не подойдёт, но можешь поставить Анкомфи или Форж, если на нвидии или линуксе сидишь.
>>642439 > но большой разницы с икселью я не наблюдаю Ты сравниваешь апскейл икселя с лоурезом каскада. Вот тебе типичный лоурез XL пик 2 для сравнения. Разница небольшая, но она есть. Лоурез каскада можно сразу выкладывать как готовый пик, а лоурез иксельки нуждается в исправляющем апскейле в 9/10 случаев. Для меня это принципиальная разница.
Есть у кого лоры на: 1) Панталоны. Чтоб как у девочек из тохоты. 2)Детские трусы. Широкие, чтоб доходили до пупка и какие-нибудь рисунки с сердечками или зверушками. Ой, как будто вы сами не знаете о чем я, полтреда лоликонщиков сидит Просто промтами у меня не получается, генерит обычные трусы, но всратые и с артифактами. Тут весь тред генерит труханы, так что уверен у вас есть лорачки!
>>642683 На небольшую разницу я согласен. Просто мне другое принципиально, картинки-то фиксить я уже привык: промпта каскад слушается по ощущениям примерно так же. Сдохлю я бтв апскейлил полторашкой, напоминаю о своих 4 амдгигах, так что большого опыта с ней у меня тоже нет.
Вопрос не имеющих отношения к Каскаду: как белые поля убрать, что в негатив пихнуть? У меня пара стилелор их любить делать.
>>642761 > Они вроде бы с архитектурой сдхл что-то своё сделали Интересно что именно и как это выражается. Если поверхностно судить по результатам - расширили датасет, добавив то чего не было в наи1, в том числе кумерские пикчи, ослабив для них и классификацию по качеству-эстетике, и поставили запекаться. Скорее всего там много граблей можно насобирать как на этапе тренировки базовой модели, так и дальнейшем допиливании, но когда > кластер H100 делает брррр это лишь вопрос времени, даже странно что так долго. Когда из-за развития открытых моделей упадет их популярность - просто подтянут эстетику, добавят концептов/натуртекста, и выйдет наи4 что будет более красивая и лучше уметь в более сложно описанные взаимодействия.
https://blog.novelai.net/introducing-novelai-diffusion-anime-v3-6d00d1c118c3 > Они вроде бы с архитектурой сдхл что-то своё сделали > Our newest model is based on StabilityAI’s SDXL model, but, as usual, we threw in a good amount of our own secret sauce, pushing it further. For example, you will find it much easier to generate dark scenes than on stock SDXL. Судя по их блогу, там просто файнтьюн SDXL и добавили "секретный ингредиент", который позволяет, например, генерировать более тёмные сцены, чем на стоковой сдохле. Кто сказал впред?
https://www.coreweave.com/ > их кластер H100 > Of course, as you will be able to tell from the model’s name, we have also done our usual in-depth anime-styled training, powered by our high-performance H100 GPU cluster Shoggy hosted by CoreWeave, which allowed us to iterate rapidly since releasing our V2 model. Из того что я вижу, "своим" кластером они называют арендованное железо на CoreWeave. И в это верится больше, поскольку NovelAI - это всё же мелкий стартап, которому и пяти лет нет. Было бы странно сравнивать их с условными OpenAI, которых просто закидывают бабками.
Те же слитые на форч ключи для NovelAI они просто моментально ревокнули, в то время как OpenAI ультрапохуй на сливы; правда в случае OpenAI, слитые ключи это проблема того, кто их купил; а для NovelAI сливали же безлимитные ключи с самого дорогого тарифа, насколько помню. Когда я сам лично нашёл API Token чела, который случайно его в свою репу пушнул (и потом затёр, но гит всё помнит), то его моментально заблокировали, как я его попытался использовать: { "statusCode": 401, "message": "Your account has been restricted due to unusual activity. Free generations are unavailable." }
https://anlatan.ai/about тут инфа о составе материнской компании проекта NovelAI В составе их команды всего два датасаентиста (и один из них же по совместительству бекендер), два фронтендера (и один же из них - CTO), и только один чистый бекендер.
Я не в курсе, на чём они сейчас производят inference моделей, но для текстовых нейронок я знаю, что они долгое время использовали GPT-3 для своего самого дорогого тарифа - то есть это была не более чем прокся с удобной вебмордой (у которой всё ещё много фишек, недоступных в той же таверне).
При таких входных данных не думаю, что они могут реализовать что-то, что комьюнити не сможет позднее допилить само (если интерес к теме не угаснет и будет достаточно отбитых челов, собирающих суперкомпьютер под кроватью или готовых разоряться на аренду кластера). Это не с StabilityAI/OpenAI тягаться всё же, масштаб не тот.
>>642806 > В составе их команды всего два датасаентиста (и один из них же по совместительству бекендер) А, не, я даже преувеличил, там два чела: AI & Backend Developer Datasetting
Первый это аи + бекенд разработчик, а второй, судя по названию должности, просто говно из датасета вилкой чистит.
Скорее всего. Ещё мне кажется, что у них с инпеинт моделью что-то хитрое. Она неожиданно неплохо работает.
> использовали GPT-3 для своего самого дорогого тарифа
Не, у них всегда были файнтьюны опен сорс моделей до того, как они стали с нуля свои ллм обучать.
> "своим" кластером они называют арендованное железо на CoreWeave
У них как я понимаю какой-то более-менее постоянный контракт на 256 штук H100 для тренировки моделей, плюс судя по косвенным признакам они что-то более дешевое для инференса используют. Понятное дело, что свой датацентр они строить не будут.
>>642806 > you will find it much easier to generate dark scenes than on stock SDXL Интересно. Тут может быть как базированный оффсет в крайних слоях, обучение с протегированием яркости, так и действительно впред. А может просто доп микросетка, которая крутит оффсет налету в зависимости от промта. Оно может сгенерировать впред-лайк пикчи, не пробовал кто? > слитые на форч ключи для NovelAI они просто моментально ревокнули Там случаем нет возможности по ним получить доступ к истории генераций? Если да то очень серьезных повод их хорошо хранить. Опенам же ключи ревокать вообще никакого резона нет, чем больше нагенерят - тем больше покупатель заплатит, с их гигантизмом никто не будет заботиться о неумехах. > При таких входных данных не думаю, что они могут реализовать что-то, что комьюнити не сможет позднее допилить само Полностью согласен, потому удивляет их превознесение. >>642839 > По слухам они собираются наи4 вообще с нуля делать, но посмотрим что выйдет в итоге. Интересно, конечно, но выйдет гораздо дороже, стоит ли оно того? В хорошее время живем раз за таким можно наблюдать.
>>642897 > Там случаем нет возможности по ним получить доступ к истории генераций? Если да то очень серьезных повод их хорошо хранить.
Картинки у них вообще не хранятся. А истории при работе с LLM хранятся только в зашифрованном виде и без ключей. Они расшифровываются чисто на клиенте, поэтому без пароля пользователя из браузера ничего с ними не сделать.
И я даже не уверен, что АПИ ключ дает возможность текстовые истории вообще получить.
>>642900 То больше про генерации пикч. С историями ллм тут стулья вместо вариантов, если не хранить - пользователь лишен нормального кросс-платформенного веб интерфейса а только свой софт. Если хранить - вопросы по приватности. > АПИ ключ дает возможность текстовые истории вообще получить Если нельзя то ладно, а если можно то охрана ключей оправдана.
Раз генеришь у них, можешь попробовать запросить девочку с серебряными глазами, бледной кожей, белыми волосами в ярко белом платье на белом фоне? Ну и подобное для черного, чтобы задача для впреда была.
Историю пикч вообще не посмотреть, они чисто локально хранятся. Закрываешь открытую вкладку браузера - теряешь всю историю генераций пикч.
> можешь попробовать запросить девочку с серебряными глазами, бледной кожей, белыми волосами в ярко белом платье на белом фоне? Ну и подобное для черного, чтобы задача для впреда была.
>>642920 > Типа такого? Да. Сложно сказать, такое похоже на впред (1-2), но по гистограмме не так сильно смещено и тот может в более радикальные. Просто по промту на сдохле получить подобное - затруднительно, только оффсет крутить (3), значит что-то там действительно есть.
Мужики, как апскейлить x2 до 3000/4000 пикселей, чтоб сохранить оригинал картинки и её детальность?
Короче, генерирую свою дефолт картинку сразу с хайрезфиксом 512x768 - 1024x1536. 0.55 денойз AnimeSharp или UltraSharp, DPM++ 2M Карась 25 шагов, 15 шагов в хайрезе. Мне результат нравится, где-то классная детальная/зернистость, все балдеж. Кое-что фотошоп-фикшу и инпейнчу по мелочи. Не использую эмбеды, только одна лора на персонажа. Картинка достаточно детальная, не прям лайнарт аниме.
Ну и блять, когда апскейлю - теряется приличная часть этой зернистости\детальности. Пробовал 0.35-0.4 денойз и tile resample controlnet 0.4 мощь с ultimate sd upscale. И tiled diffusion. И просто Img2img одим тайлом, выставив размеры 2048x3072...Все-равно как-то "не то".
Короче, если есть знатоки, подскажите плез, как один раз хорошечно апскейлить x2 один раз уже готовый стандартный хайрезфикснутый портрет. Что вы выставляете и какой метод юзаете.
>>642962 Гайды в шапке. + сто раз писали уже. За 1 шаг не получишь. У меня - обычно комбинация увеличений 1.25-1.5, 1-2-3 раза, потом SD_upscale, потом инверсия шума.
>>642962 P.S. Видел 3 туториала в шапке, но мне бы знать, что именно пробовать. Например, во втором, где кошкодевочка, там вообще множественный апскейл и набор детальности из размытого нечто. Такое не походит.
>>642964 А, блять, опередил. Твой метод написан в туториалах из шапки? Если нет и не сложно - опиши какие-где ползунки ставишь, плез или скрин ползунков. Я, например, вообще не шарю за инверс шума (это вроде в tiled diffusion, верно?)
>>642962 Если 1.5 - мультидифьюжн с размером латента ~160x160, перекрытие 80, х2 и любым ганом, контролнет тайл с весом 0.8, денойз ~0.5, семплер эйлер. Потом параметры поварьируй, можно использовать другой контролнет. Из негатива всякий мусор типа "кропед, клозап" выкинуть предварительно.
>>642968 > мультидифьюжн Режим mixture of diffusers, галочку noise inverse вообще не трогай. Чтобы влезло в врам возможно придется еще включить tiled vae, в нем все оставляй по дефолту но галочки "быстрый энкодер/декодер" сними.
>>642965 Попробуй начать с простого SD_upscale и одноименного гайда, если тебе именно бритвенно резко надо. tl;dr можно не особо парясь ставить небольшие размеры тайла вроде 1088х1088, небольшой денойс 0.25-0.35 и умножать размеры на 2. Раз в фотошопом знаком - дальше править, и повторять. Можно в процессе уменьшить в 1.5 раз, увеличить х2, уменьшить 1.5, увеличить х2 - дофига деталей наберется хотя это нафиг не надо - пришёл к этой мысли, слишком аи-шный вид у картинки становится.
>>643076 Прямо pov когда не убрал еду и поймал кошку за ее поеданием, а она нагло смотрит с выражением > да, и что ты мне сделаешь? >>643104 Как текстурку сделал?
Начал подозревать, что мои промпты реально слишком поломанные, когда столкнулся с тем, что добавление "ковбой шот" заставляет модель отрезать голову. На animagineXLV3
Вы так и не объяснили, SDXL всё такой же неюзабельный кал?
Я вот смотрю на картинки, и вообще не вижу не могу понять, что на сдохле сделано, а что на полторашке. По-моему ноль прироста.
Алсо, по пиксиву заметил, что японцы какие-то свои модели и лоры имеют, о которых кайдзины не знают, да и знать не положено. Оно как бы и понятно, civitai анально огорожен повесточкой, а у японцев куча своих форумов и сайтов, где жизнь бурлит и активно тренятся лоры и модели, но которые одним только япохам известны.
> нагенерил литералли КАЛ > 410 лайков на пиксиве > сгенерил адекватную картинку с нормальным лайном, без артефактов, с красивым фоном и стилизацией > буквально 0 лайков Да как это, блядь, работает?
Ещё более парадоксальная ситуация: > эта самая каловая пикча: 536 просмотров, 415 лайков > те же самые пикчи, с той же стилизацией и позами, но с меньшим количеством артефактов, и с более адекватными и интересными задниками: 572 просмотра, 93 лайка
Где тут логика нахуй? Японию умом не понять похоже.
Хотя есть подозрение, что всё дело в кошачьих ушках и хвосте...
У меня 730 лор на 1.5, около сотки из них я сам делал. Вот какой нахуй мне SDXL?) Переделать лоры под него, чтобы ещё через полгода вышла XXL и давай всё по новой? Модели по 7 гигабайт качать, а ради чего?
>>643139 Наевшись маковых цветов, девочки-барашки дуреют окончательно, сбиваются в стадо и идут драть попку мальчикам-волчкам. А потом трезвеют и вынуждены просить прощения.
>>643173 >и вообще не вижу не могу понять, что на сдохле сделано Если видишь дефолтный дженерик кал - это иксель потому что лораф и моделей нет Если видишь оригинальный стиль и всратые руки - это полторашка.
>>643211 Лоры на 1.5 слишком тупые для хл. Там нечего конвертировать.
>>643212 >лораф и моделей нет Неосилятор-побирушка по коллабам детектед. Просто берешь и делаешь лоры сам. Модель тоже уже давно есть, название сто раз писали на п начинается, на и заканчивается
>>643253 Крапивой. Не агитирую тебя записываться в барашки-мальчиков, но у хорошей девочки всегда в рюкзаке должно быть запасное двуручное дилдо и запас расходных материалов к нему.
>>643243 с коробки может и не особо, но лора как писал анон выше, точно улучшит ситуацию. Думаю, ради сочных крупных планов и интересных ракурсов стоит заморочиться
>>643177 иной раз тоже задаюсь этим вопросом. Кажется, просто есть куча любителей пережаренных картинок с кучей визуального мусора. Рисовак с "грязным" стилем тоже хватает. Для себя решил, что не буду особо ориентироваться на эти циферки
>>642673 >>642676 Да, апскейлы все дела, всё это я знаю. Но мой вопрос был именно про оперативку. Она поможет или нет? Типа когда заканчивается видеопамять, начинается жраться оперативка, а значит увеличение её количества может генерить в лучшем разрешении. В чём я не прав?
>>643281 Оперативка хуйня идея. Будет очень сильно медленно, медленней чем на амд наверное даже. Вообще не знаю что тебя не устраивает, мне 8гб хватает даже на sdxl.
>>643285 Лучше медленно, чем out of memory. Ну будет генерить по 15 картинок вместо 25, пока я за чаем отошел. Всё равно я генерю в фоновом режиме, а сам занимаюсь другими делами.
>мне 8гб хватает Вероятно моя модель и сэмплер жрут больше
>>643167 > заставляет модель отрезать голову Голова дай денег! Модель просто не в состоянии вывести уровень твоих промптов >>643173 Взор искажен специфичными предпочтениями и девиациями >>643209 Что за лоры? Концепты, позы и прочее - это есть в модели из коробки. Стили, персонажи - аналогично. Только какие-то редкие-специфичные, их можно обучить самостоятельно. >>643318 Yep, они очень разные, возможностей 1.5 очень не хватает. И даже хз с какой стороны к этому подступиться чтобы исправить, не обмазываться же дедовскими пикчами.
>>643326 > готовь 30Гб VRAM для тренеровки одной лоры Они сами указали в ключевых преимуществах возможность тренировки на консумерском железе и размер в 1.5 раза меньше чем сдохля на графиках. Индус любит напиздеть, но в таком врядли будет.
>>643325 >Модель просто не в состоянии вывести уровень твоих промптов Вспоминая, какие я полотна хуярил на полторашке, то даже хуй знает. Возможно, полторашку спасало то, что она половину не понимала, а xl слишком умная.
>И даже хз с какой стороны к этому подступиться Ну хуй знает, из того, что я вижу, главная проблема всех анимешных чекпоинтов XL - они тренированы поверх реалистичных. Отсюда блюр бэкграундов и прочие неприятные вещи. При этом глядя на любимые 1.5 модели, это мержи рисованных стилей с 3d, которое дарило им 2.5d, экстремально чёткие линии, возможность делать как реалистичное освещение, так и упрощённое и многое другое. В конце-концов, они весили как XL модели, при этом будучи 1.5, лол, а я что-то пока что не видел XL на 15 гигов. И сколько же много протекает рисунка красками, охуеть просто.
>>643376 > они весили как XL модели, при этом будучи 1.5, лол, а я что-то пока что не видел XL на 15 гигов Держите норкомана. 2гб фп16 их вес и 4гб в фп32. Больше могло быть только если EMA забыли от обучения, но тебе это точно не грозило
>>643385 Так 15 это про Xl. >EMA-мусор Есть модель на цивитае 5++ гб с 400к загрузок, там меньше пяти гигов только инпеинт версии. Сомневаюсь, что челик забыл что-то вырезать.
>>643341 Ну чето странно, может без оптимизаций запускал. Через несколько дней попробую если до этого не появится информация, врядли стали бы так пиздеть > Stable Cascade is exceptionally easy to train and finetune on consumer hardware thanks to its three-stage approach. хотя там возможно речь про тренировку кусков поочередно. >>643376 > на полторашке Да, она прям могет. Хотя, частично, это срабатывает из-за меньшей чувствительности к промтам. Для получения нужного эффекта там нужно наспамить и задрать веса, а сдохля от мелкого упоминания гораздо интенсивнее триггерится. > они тренированы поверх реалистичных Глянь стоковую наи1, она тоже довольно печальна, и тоже по дефолту тренена поверх реалистичного. Субъективно, буст задников был уже после весны. До этого они достаточно интересные на мейне получалсь, но с когерентностью беда. > мержи рисованных стилей с 3d, которое дарило им 2.5d, экстремально чёткие линии, возможность делать как реалистичное освещение, так и упрощённое и многое другое Думаешь стоит тренить на 3д рендерах и околореалистичных а потом подмешивать? Вполне вариант. > ни весили как XL модели Это потому что там было данных тренировки больше чем самих весов и/или сохранено в фп32, лишний вес который никак не использовался. > что-то пока что не видел XL на 15 гигов Можно специально залить, или поискать на циве, оно 1 в 1 по сидам с 6 гиговой моделью.
>>643440 У тебя пикча примерно сколько генерит? И хайрес норм работает? В каком разрешении генеришь? К марту хочу железо брать, мечусь между 4060 8гб врам и 3060 12 врам. Думаю всё же стоит 2 брать, всё равно видеопамять сейчас нужно как можно больше.
>>643463 Раньше парился, теперь просто включаю галкой когда надо, отдельно промт не пишу ему, пусть обычный использует. Иногда ещё отдельно кропаю лицо и ему вставляю, и уже отдельно вклеиваю в готовый пик - почему-то так он лучше справляется часто.
>>643463 Есть у меня несколько лор, превращающих руки в кашу, но зато дающих упоротые выражения лица. Иногда юзаю их в Адитейлере в формате: face, <lora:VsratoeEbalo:0.8> Получается неплохо.
>>643536 > новое А-ха, ещё печ не остыла даже. > Делись Лорой что ли? Надо если - пожалуйста. Под поней хл. Но чёт неудачная, мне не понравилась. Прошлая была даже на больше персонажей, а работала лучше этой.
>>643428 >это срабатывает из-за меньшей чувствительности к промтам Меня при первых попытках в XL наоборот насторожило, что XL глубоко поебать промпты и приходится спамить кейворды. Уже думаю забить куда-то в пресеты все синонимы full body, а то пиздец. >Думаешь стоит тренить на 3д рендерах Да я в душе не ебу, просто вижу, что то, что мне нравится по чёткости и детальности - как раз из такого разлива. >сохранено в фп32 Не факт, что это каким-то боком плохо.
>>643430 >Качни да открой в Merge Toolkit Качнул да открыл. В целом, ожидаемо, no junk.
>>643483 Красава, сделал мой вечер! >>643507 Какой-то нетипичный пупс, неправильный цвет волос и пол четко определен >>643514 Боженька, контролнет или чистый промт? >>643581 > Надо если - пожалуйста Надо! >>643598 Too good to be true. Пробовал промтом получить двух сильно разных персонажей и их взаимодействие, но без регионального промта это просто крутить рулетку на десятки пикч. хотя у тебя они тут не настолько и разные
>>643611 > наоборот насторожило, что XL глубоко поебать промпты и приходится спамить кейворды Это потому что в тренировке не было на них соответствия и искалось что-то отдаленно похожее. В тех что тренировались по буру тегам иногда даже чрезмерная реакция и игнорирования промта как в 1.5 нехватает. Например, в понях при указывании нескольких противоречащих друг другу концептов очень высокий риск поломки. Причем, если асбтрагироваться от бадихоррора, технически модель выполнила поставленную задачу. Также и с остальными концепциями что знает, спам приводит к следованию инструкциям и поломкам уже другого рода. > Да я в душе не ебу Если будут идеи - велкам, это ведь реально проблема имеющихся XL. > no junk > wastes 3.15gb Как раз если вычесть - получится 2 гига дефолтной 1.5. >>643613 >>643633 Чето хтонь уровня 1.5 на неудачном промте.
>Надо! pixeldrain com/u/E1nydAHC p: hksu, тэги в комплекте, дополнительно можно тэгнуть score_9, source_anime. Но оче плохая лора, совсем неудачная, много не жди.
>>643433 Смотря насколько сильно включишь флаги оптимизации. Если зажать на всём, грузить в fp8 и сжимать vae, то 8 гигов это реально почти достаточно. Но это уже такой себе вариант, особенно vae, я когда так делал, на каждой генерации приходилось делать инпеинт половины картинки, т.к всираются лица в первую очередь. Если не зажимать, то тебе нужны карты на 24 гига для фулл hd. И вот между этими двумя точками можно танцевать. Что хорошо, есть подсос RAM, если не хватило VRAM. Если ты не из тех самых шизов.
>>643614 >Только у тебя Я когда об этом писал хуй знает когда, мне ответили типа всегда так было и это норма. Беда не в том, что оно не понимает промпт, беда в том, что оно игнорирует его, только поэтому мои промпты с полотен сократились до минимальных - XL похуй, что ты там пишешь. Причём те же скобочки стали намного меньше влиять и помогает только спам. >в двойном слепом тесте отличишь Не факт на самом деле, но если гонять модель какое-то время, то что-то может и вылезти.
>>643637 >Это потому что в тренировке не было на них соответствия и искалось что-то отдаленно похожее. Лол. Первое, с чем я так боролся - это клозапы. Потом DOF. Но не будем о грустном. >Например, в понях Так и не потыкал их, промпт стартовать с каких-то заклинаний, кто это придумал вообще. > это ведь реально проблема имеющихся XL. Как ты уже мог понять, я не специалист, я каску на стройке нашёл. Нужно прочекать наших китаеязычных друзей, у них были отличные миксы на 1.5, может, что-то для xl наварили, а на цивитай ещё не отнесли. Опять же, про китайцев, мне очень нравятся некоторые их миксы, а там натрамбовано по десять моделей.
>>643654 Это XL или каскад? Есть на циве? >>643706 > ервое, с чем я так боролся - это клозапы. Напоминает старые первые файнтюны xl "под аниме" прошлым летом. > Потом DOF Сдохля as is, в анимейджине более мнее, но до 1.5 еще далеко. Но это действительно проблемы тренировки базовой модели. > промпт стартовать с каких-то заклинаний, кто это придумал вообще Так тренили, толи их всратый классифаер, толи оценки напрямую с бур. > что-то для xl наварили, а на цивитай ещё не отнесли Если найдешь - скидывай, интересно.
>>643742 Все зависит от конкретного случая. Для поней клипскип2 - плохо, т.к. она изначально полностью тренилась с 1, 3д - слишком агрессивно работает не только в ней. В случае 1.5 на базе наи - клипскип 2 может быть более чем уместнен и давать результат лучше, а 3д - зависит от чекпоинта. >>643751 > 4090 и 3090 Пара?
>>643754 >Не совсем понял эту часть Что 1-3 ХЛ пикчи влезут в 12 гиг легко с хайресом. А выше потом всё равно по одной штуке апскейлить уже.
>И на сколько медленно? Более минуты? Зависит же от сэмплера, шагов, разрешения. Задушенная в 70ПЛ 4090 с моими настройками делает 8 1,5мегапиксельных шакала за минуту где-то. 3060 где-то в 4-5 раз была медленнее примерно.
>>643759 Для поней если я хорошо понял, 30-20 шагов самый норм будет. Если я захочу генерит на 12 гб врам в разрешений 1024 на 1024 и так далее с дальнейшем хай ресом, он потянет?
>>643757 Открываешь циву, вводишь поней и наблюдаешь каждый первый пик юзергенераций без клипскипа, и только в редкой хтони стоит 2. >>643759 Случаем не вплотную стоящие? > Жаль, что не dat feel поменял бы кучку гпу на настоящую личную кошкодевочку
>>643715 >старые первые файнтюны xl Так я и говорю, "первое". В целом, реалистичные модели до сих пор от этого особо не избавились. >это действительно проблемы тренировки базовой модели Вроде, с этого и начали. >Если найдешь - скидывай, интересно. Из самого интересного что находил до сих пор - это пятнадцатигиговый лол XL moe и конвертация лор 1.5 под XL, но второе без кода, чисто видос пруф оф концепт. Вряд ли результаты хорошие. А первое, по понятным причинам, не будет дружить с разными веб юи без допила напильником. У них там требуется "магия" для доступа на цивитай, но модели всё равно несут туда, так что если что и найдётся, чего там нет, то в стадии запиливания. >>643719 Фулл ашди это чуть больше двух миллионов пикселей, ты генерируешь чуть меньше шестисот тысяч. Я стандартно генерирую чуть больше 800к и это требует 16 гигов + кешированные данные, что в сумме доходит до 22gb. Опять же, цифры будут очень отличаться в зависимости от оптимизаций, о чём я сразу писал. Так что твои 10 гигов это всё ещё "от 8gb".
>>643775 > Фулл ашди это чуть больше двух миллионов пикселей, ты генерируешь чуть меньше шестисот тысяч О чём ты? Конечное разрешение - даже больше ФХД специально выставлено.
Пробую фуукусу через коллаб, вроде всё нормально, девочек генерит, скорость норм, только не даёт использовать фейсвоп и вообще image promts в 9 из 10 случаев выдаёт ошибку и выкидывает. Это у всех так и можно ли это фиксить? Мб на бесплатной версии коллаба ограничение?
>>643775 > конвертация лор 1.5 под XL Контролнет-адаптер который? > первое, по понятным причинам, не будет дружить с разными веб юи без допила напильником Почему? Если там не что-то странное-необычное, то просто потратишь лишнее время и место на загрузку данных и сработает из коробки. Сразу же можно будет костылями перегнать в нормальный 6-гиговый формат чтобы не занимало и довольно урчать. > стандартно генерирую чуть больше 800к Базовое разрешение sdxl - 1М, при отклонениях от него, в том числе и в меньшую сторону, можно словить деградацию. То что требует так много памяти - или оптимизации не включены, или какой-то странный конфиг. При генерации с батчсайзом потребляется около 9-10 гигов. Главный всплеск до 17гб - когда декодирует VAE на паре 3мегапиксельных пикч.
>>643787 >Контролнет-адаптер который? Нет. У челика какие-то кастомные костыли были. >Если там не что-то странное-необычное МOE это и есть странное-необычное, по крайней мере, для SD. Его нельзя перегнать в 6 гигов, потому что это композиция экспертов, т.е несколько чекпоинтов, которые работают в кооперативе. Конкретно тот это четыре спаренные модели. Ещё там были х2 xl и x4 1.5 moe. Но это не что-то готовое, опять же. >Базовое разрешение sdxl - 1М Да я в курсе, просто для нормального соотношения сторон с апскейлом без кропа подогнал. Если потом дорисовывать боковушки, то часто ломаешь базовую концепцию. Про оптимизации да, там выключено много, я взбугуртнул после TAESD немного. Хотя он даёт хорошую экономию по памяти, но, скажем так, имеет свои минусы.
>>643817 > МOE это Хуясе ебать? Тут обычную XL не могут нормально подебить, а там уже эксперты подъехали. Учитывая сложность всего этого и отсутствие крупных новостей - скорее всего просто POC чем реально рабочая тема. Есть линк, а то вдруг революцию пропускаем? > просто для нормального соотношения сторон с апскейлом Кром десятка пикселя ценнее чем отклонения от базового параметра, который в XL довольно важен? Ну, если так удобнее офк. > там выключено много xformers или sdp хоть есть? Taesd - не, ощутимые потери.
>>643823 >всего просто POC чем реально рабочая тема. Так я и говорю, что это не что-то рабочее. Но тема интересная, как минимум. https://huggingface.co/segmind/SegMoE-4x2-v0 >который в XL довольно важен? Да XL, в целом, гораздо легче это переносит, чем 1.5, у меня проблемы бывают только с разного вида не-горизонтальными pov'aми. Если генерировать 1024х1024, то нужно апскейлить в 1.875 раз до 1920, а это значит, что по высоте нужно обрезать 840 пикселей. Многовато. Так что методом проб и ошибок подобрал адекватное соотношение и коэффициент апскейла. >xformers Тестировал его, когда тыкал tensor rt ускорение, оно с икформерами не работает. В целом, на уровне погрешности что-то было, что они есть, что их нет.
>>643830 > на уровне погрешности что-то было, что они есть, что их нет. >>xformers >что они есть, что их нет Летсо невозможно сгенерировать, падаем из-ха ООМ.
>>643838 Лол, так это любой может проверить за 10 секунд. > A: 11.13 GB, R: 17.95 > A: 13.42 GB, R: 19.38 GB
Итого разница по общей памяти 1,43Gb, что составило 7.3% процента. Это с fp8, но без сжатия vae. Я понимаю, что ты сектант, который себе вбил хуйню в голову и не можешь даже её проверить, но я-то не такой.
>>643830 > Так я и говорю, что это не что-то рабочее Блин, возможно не так понял, но изначально прозвучало как > крутая йоба модель которая может и еще весит 15 гигов Чтож посмотрим сможет ли оно развиться. > Да XL, в целом, гораздо легче это переносит Ну как, пони в большей вероятностью сфейлит при генерации если размер не кратен а сильно отстоит от мегапикселя, это заметнее чем на 1.5, где можно просто на глаз ползунки ставить. Так ли вообще нужно это попадение в 1920? > Если генерировать 1024х1024 > а это значит, что по высоте нужно обрезать 840 пикселей Что? Соотношение сторон может быть условно любым, но общее число пикселей стоит (примерно) сохранить, а не уменьшать/увеличивать. Ставь что-то типа 1376x768 начальным. > В целом, на уровне погрешности что-то было, что они есть, что их нет Потребление врам в 1.5 раза и выше скорость - на уровне погрешности? Однако. >>643842 > Это с fp8, но без сжатия vae > 19.38 GB Что-то неладное творится там
>>643843 >изначально прозвучало как Не, это либо посыл был хуёвый, либо ты так прочитал. Имелось ввиду другое. >Но это не что-то готовое, опять же. Буквально цитата. >не кратен а сильно отстоит от мегапикселя Опять же, это проверялось, когда я гонял trt. Там нужно ставить разрешение кратное 64 по обеим осям. Получалось, что генерации ломаются в тех случаях, когда я далеко ухожу от базового разрешения модели по любой из осей, независимо от соотношения сторон и общего количества пикселей. То есть если я втоплю шизу и сделаю 2048х512, то сохраню миллион пикселей, но с очень высоким шансом получу артефакты. Хотя для ландскейпов часто срабатывает ок. Потому что далеко от 1024 уходить опасно. При этом 1.5 к этому была намного более чувствительная и чем дальше я уходил от условных 768, тем хуже всё было. Причём эти 768 даже не по обеим осям работали, но это уже мелочи. >Что-то неладное творится там Ceмплер @ апскейлер. У меня все настройки под фотореалистичные модели стоят. Возьму euler a и esrgan, получу >A: 8.50 GB, R: 10.59 GB Но общий вклад иксформеров всё ещё будет болтаться около 10%
>>643859 Вот этого на самом деле даже не пробовал, хотя одно время хуярил фулл ашди до апскейла. Как по детализации, окейно в целом?
>>643816 А ты знаешь толк в извращениях. Я тоже держу крякнутую прогу для этого с миллионом вирусов на экранированной виртуалке из-за книжных пидарасов.
>>643816 Чем-то готовым такую обфускацию делаешь, или самописное? >>643861 > генерации ломаются в тех случаях, когда я далеко ухожу от базового разрешения модели по любой из осей, независимо от соотношения сторон и общего количества пикселей Такого быть не должно, причина в чем-то еще. > если я втоплю шизу и сделаю 2048х512, то сохраню миллион пикселей, но с очень высоким шансом получу артефакты Если промтить что-то соответствующее этому соотношению - будет все ок, а если запросить 1гирл соло клозап портрет - даже на развитой 1.5 можно словить фейлы, стоит соизмерять окно и содержимое. > При этом 1.5 к этому была намного более чувствительная и чем дальше я уходил от условных 768, тем хуже всё было Современная 1.5 без проблем переварит как квадраты, там и ульравайд/нэрроу типа 3 к 1, офк с адекватным этому ар промту. Главное от общего разрешения при генерации сильно не уходить. > Ceмплер @ апскейлер Семплер и апскейлер заставляют сжирать 19 гигов на фп8 с одной пикчей? Хотя древнем злом типа lsdr технически еще возможно воспользоваться.
Ну, каждый дрочит как хочет, раз привычка и сделанные заключения в приоритете - почему бы и нет.
>>643868 >Если промтить что-то соответствующее этому соотношению - будет все ок Из того, что помню, был ярко выраженный тайлинг с удвоением контента. Типа двух-трёх фигур вместо одной, трёх-четырёх ног, конечностей в самых неожиданных местах и т.д. >1гирл соло клозап На XL ты не выбираешь клозап, клозап выбирает тебя. Проверил, в целом, работает, но детализация идёт нахуй и много кропается. Ну и без тайлинга не обошлось. Ближе к базовому разрешению повеселее будет, но справляется и правда лучше, чем раньше. >Современная 1.5 У меня самой новой 1.5 почти год, наверное. Они вообще ещё обновляются? >Семплер и апскейлер заставляют сжирать 19 гигов на фп8 с одной пикчей? Вот такая вот хуйня. Я потому проценты и считаю, что абсолютные величины всегда будут у всех разные - оптимизаторы, апскейлеры, семплеры, разрешение и прочая. LDSR скрыл из выбора, он ебать медленный. Если не ошибаюсь, там хардкод на сотню шагов. Привычки же не пустом месте образовываются, начинал я всё это курить без привычек и крутил всё по тем же рекомендациям из интернета и смотрел, что ломается да как, если сделать что-то по-другому. >>643875 Да так-то заебись пикча, чего бы не устраивало.
>>643875 Больше не меньше у кошек вон частое явление вообще >>643880 > был ярко выраженный тайлинг с удвоением контента Подобное прежде всего если взять повышенное начальное разрешение, типа 2000х512 вместо каких-нибудь 1360х384, тогда по вангерлу стендинг будет чаще лезть типа твоего пик2 вместо пик 4. > На XL ты не выбираешь клозап, клозап выбирает тебя. В стоке не ее релизе > самой новой 1.5 почти год, наверное. Они вообще ещё обновляются? Стоит качать замесы с новым натреном а не ицестомиксы все того же. И даже в миксах может быть некоторый прогресс из-за большее удачной подборки. Ну а насчет привычек - дело персональное, чем больше в них погрязаешь и укрепляешься в вере - тем сильнее отдаляешься от прогресса. >>643892 Почему эта киса такая недовольная? >>644004 Годно
>>643774 > Открываешь циву, вводишь поней и наблюдаешь каждый первый пик юзергенераций без клипскипа, и только в редкой хтони стоит 2. На странице понимодели автор написал второй юзать, только вот смысла от этого нету на XL моделях в автоматике или фордже, картинки абсолютно одинаковые на 1 и 2 клипах, короче настолько же достоверная инфа как и до этого.
Анон привет, с лета особо не следил за SD, поэтому есть несколько вопросов, а то въехать не могу: 1) Что с 1.5 ? она ещё будет жить? или на неё забивают постепенно и все идут в XL и каскад?(тоже новое что-то?) И как обстоят дела с НСФВ на новых моделях, вижу как то в пони умудрились запихнуть... Или она одна такая? 2) Если я делаю упор на фш+инпейнт+контролнеты, мне 1.5 будет достаточно? или всё же надо переходить на ПониXL ? 3)Как вкатиться в Pixiv ? может есть какие-то нюансы, чтобы не быть шаблонным или ещё что-то? 4) Смотрю на далли 3 и думаю ну писец, там уже из коробки годнота, даже в фш и инпейнтить не надо обрабатывать. И как-то думаю будет ли у стейбла развитие хоть какое? А то меня чтото в депресняк вгоняет что может вся наша локальная нсфв братия всё более проигрывать по качеству.. И все наши примочки, которыми славится сд не будут актуальны.. 5) Не могу вьехать что за moe и fp16 32... 6) Подскажите аналоги цивита, где вы берёте крутые китайские миксы\лоры? 7)ктонить пользовался Instant_ID и для чего его можно применить? 8) стоит ли брать 3090 сейчас или они подорожают? у меня 3070ti, но боюсь для будущего не хватит 8гигов, оттого и про XL не пробую.
>>644066 Видимо не так давно добавил в оправдание хтони и поломок, вместе с прямой рекомендацией юзать лору-заплатку, которая, внезано, натренена с первым клипскипом. > настолько же достоверная инфа как и до этого Абсолютно
>>644079 > 1) Что с 1.5 ? она ещё будет жить Она просто так пахнет
>2) Если я делаю упор на фш+инпейнт+контролнеты >контролнеты Их считай нет пока на хл. Но есть способы обойтись.
>3)Как вкатиться в Pixiv ? Регаешься, постишь, получаешь полтора просмотра. Сейчас с аи вкатываться уже поздновато, только если у тебя нет какой-то убер-фичи
>4) Смотрю на далли 3 Сапок барена в заднице мне не нравится
5) Не могу вьехать что за moe и fp16 32... Мое - какой-то франкенштейн из нескольких моделей. Хз как пользоваться. Фп16 и фп32 - формат сохранения моделей. Фп16 хватит всем.
>6) Подскажите аналоги цивита, где вы берёте крутые китайские миксы\лоры? ХЗ, не беру. Всё крутое утекает с других борд.
>Instant_ID Вообще хз
>) стоит ли брать 3090 сейчас или они подорожают? Зависит от твоей удачливости и толерантности к бу. В идеале лучше 4090 - она в 2 раза быстрее минимум. Потом идет 3090ти, надёжнее чем 3090, но стоит не адекватно для своей скорости + их очень мало. Ну и остаётся простая 3090 - самые дешёвые 24гига, не считая P40, могут быть уже ужарены парой лет майнинга. Но выбор большой, можно поискать. 8 гигов малов любом случае. Или подкопи хотя бы до 16гиговых 4ххх
>>644135 >>3)Как вкатиться в Pixiv ? >Регаешься, постишь, получаешь полтора просмотра. Сейчас с аи вкатываться уже поздновато, только если у тебя нет какой-то убер-фичи
У меня работы стабильно 500+ лайков и тысячи просмотров набирают. Если че то хайповое 1к лайков и пару тысячь просмотров. Самая популярная работа сейчас движется к 4к лайков. Так что если постараться то можно втянуться в пиксив. Изначально аудиторию набирал на койкатцу. Где то 20к фаллорев за год.
>>644225 С начала января (2024) начал. До этого 1.5 года ничего не постил. Последние работы были по койкатцу. Изначально постил калл, но потом нашёл норм модели и втянулся.
>>644248 У тебя бывала такое, что работа над которой ты старался и пыхтел набирает очень мало фидбека, в то время как хуйня которая сделана за час или меньше залетает в топы? Моя самая популярная работа примерная такая, сделал на полный отъебись в итоге почти 4к лайков набрало.
>>644252 >У тебя бывала такое, что работа над которой ты старался и пыхтел набирает очень мало фидбека это база. просто в погоне за циферками не начинай срать шлаком, а делай что делается. картинки, которые набрали 8к лайков даже на двач стыдно лить
>>644162 >>644169 Красивые >>644191 11/10 >>644256 > это база. Двачую. Оно ведь реально для души а не эксплуатации/монетизации. Вообще часто скроля можно наткнуться на множество недооцененных работ даже до-нейронной эпохи.
>>644252 Тебе уже много раз сказали, если народу хочется дерьма и обосраные жопы, они будут лайкать их несмотря на качество, при этом та же публика тебе даже ебало обоссыт, если ты нарисуешь мону лизу 2.0 и выставишь ее в лувре, потому что это "никому не нужная хуйня" а обосранные памперсы это святое. Ты вообще не обращаешь внимания что твои арты с интегральными схемами интересны только конкретной аудитории где большая часть аудитории - извращенцы, им просто похуй что ты делаешь, если это не соответствует их фетишам.
>>644252 >>644465 Обосранные памперсы тоже можно нарисовать плохо или хорошо.
Зритель сначала видит превью, а превью может выглядеть лучше у пикчи, которую ты не час делал, а сегенрил за 5 минут. Дальше, алгоритмы видят, что на пикчу кликают и начинает показывать её больше. Добавь сюда ещё фактор того, что на просмотры твоей пикчи, влияют пикчи, которые показываются рядом с ней, твои теги, продвигаемые платформой теги и т.п.
Это сплошной рандом, который никак не отражает качество той или иной работы.
Аноны, помогите пж Вот допустим есть спрайт персонажа в единственном экземпляре. Можно ли используя только это поменять ему позу, но чтобы одежда и лицо остались такими же? Например, вот я хочу чтобы она руками держалась за голову, типа голова болит. Всё перерыл, через фейссвап не работает, он вообще анимешных персонажей почему-то руинит на всех моделях. (я щас по совету анона выше юзаю fooocus)
>>644731 То как ты хочешь, чтобы в один клик, нельзя. Всё придётся доделывать. И с таким спрайтом уж лучше персонажа заново сгенерировать. В контрол нете, если все позы на одной генерации сделать, он тебе плюс минус одинокого персонажа выдаст.
>>644735 Бля, анон, тогда подскажи пж, как у меня получилось создать абсолютно того же перса, за исключением нюансов в одежде (погоны, значок), на четвёртом пике? Вот рили, я сам не понял как это получилось, потому что дохуя всего перепробовал и пришёл к выводу, что могу максимум смогу поменять выражение лица через инпейнтинг, потому что оно статичное. А вот повернуть немного тело, поднять руку и т.п. - это только если заново перса генерить (чего я не хочу, потому что этот чардиз мне кажется идеальным для перса, которого я придумал). Но потом, читая кучу гайдов, у меня как-то получился пик 4, и я вообще не знаю как этого добился.
>>644745 Да тебе наоборот не нужен регионал, суть в том, что нейронка сама одинаковых персов рисует.
>>644758 Прифотошопь руку и прогони через i2i. Просто прям свою 4 пикчу оправляй в i2i с тем же промптом, про руку только допиши, что она там делает, хотя мб и без этого распознает, на весе 0.4-0.6 Я руку со стока взял, ты можешь просто ещё этого же перса в разных в позах нагенерить и из этих генераций руки повырезать и фотошопить.
Я так делал, результат в целом хороший получается.
>>644761 Спасибо за наводку, прогнал через pyracanny и CPDS, ток получается совсем другой перс и в другом стиле. Я не знаю как воспроизвести такой же стиль, как на моём пике. >можешь просто ещё этого же перса в разных в позах нагенерить и из этих генераций руки повырезать и фотошопить Так у меня же персы каждый раз разные получаются. Или я что-то не так делаю? Cуть в том, что мне нужно поменять позу с сохранением перса и рисовки, как на пике 3 и 4, но я так понимаю это нереально, только самому рисовать?
>>644778 > что мне нужно поменять позу с сохранением перса и рисовки Если модель и лоры не менять то стиль, в целом, должен один быть, или ты там какие-то теги на художников ещё используешь? i2i стиль может поменять конечно, но никто не мешает исходные пикчи тоже через него прогнать. Плюс ты можешь лица/головы вырезать и склеивать с телами. Короче не вижу проблемы, подбери стабильный промпт просто и на одной модели всё генерь.
>>644773 Зачем, если и так одинаково перса рисует?
>>644052 >если взять повышенное начальное разрешение, типа 2000х512 Так я это и проверял. Испорченное разрешение, но сохранённый миллион пикселей. Вангёрла в промпте не было, была группа персонажей, клозапы в негативе. По итогу, "сохранять миллион" нет смысла, если ты уходишь далеко от оригинального разрешения, пикчу всё равно разъебёт. >В стоке не ее релизе Да даже сейчас, каждая вторая XL хуярит лица во весь фрейм. Я уже забил клозапы в негатив по умолчанию, и то иногда пролезают. >тем сильнее отдаляешься от прогресса Спорно, как минимум. И речь не о вере, речь о том, что это полезная привычка, как только её польза перестанет быть очевидной, она отвалится и будет заменена новой.
Есть ли сейчас нейросети или lora или модели какие нибудь чтобы уже на готовых артах раздеть тян можно было, с сохранением стиля художника? Еще чтобы нейросетка не перерисовывала картинку с нуля а только часть картинки где одежда. Как фотошопный Generative Fill но без цензуры и для аниме артов
Первое - оригинальный арт художника, второе - персонаж переодетый в мейду через инпеинт модель. Есть ещё вариант - обычный инпеинт с обычной моделью + IP-Adapter - с ним больше контроля, но и работы чуть больше.
Правда хорошая анимешная инпеинт модель только у новелов есть и у неё свои приколы, для ряда кейсов ручной инпеинт и ip-adapter будет предпочтительнее.
Анончики, подскажите в какую сторону копать чтобы улучшить картинки после первичной генерации?Допустим я хочу поменять выражение лица, при этом не меняя саму картинку.Или добавить какую-то одежду.В какую сторону воевать?