♫ Локальные модели ♫ Ждём и надеемся... В прошлом треде какой-то анон написал про AudioCraft и MusicGen, можете прочекать, что это
🎙️ Открытый бета-тест Udio В открытую бету вышла нейросеть Udio, которая, по словам множества пользователей, превосходит Suno V3 в генерации музыкальных композиций. Пока идёт бета-тест, доступно 1200 генераций в месяц с одного аккаунта.
Udio и Suno поддерживают множество языков для вокала (включая русский) и большое разнообразие жанров.
Почаны, как получить такой стиль струнных? Перебирал инструменты, перебирал вайбы, всякие asian, orient, oud и т.п., на удио добавлял исполнителя, получил один трек +/- в его стиле, но с дудкой, другие вообще не то. Неужели можно только случайно наткнуться или всё-таки есть точное название?
Справедливости ради, всё это я делал и всё это имеет ценность только из-за голоса Высоцкого ну и в самом начале немного Майкла Джексона. Будем считать, что он продюсер
А можно ли ваши чудо сетки заставить генерировать что-то в определенной тональности? Или в определенном бпм? Ну например задать какое-то ТЗ в духе "сгенерируй мне трек с прямой бочкой в 160 бпм и тональности до диез минор"? Или может я вообще хочу не трек, а какую-то отдельную партию сгенерировать, чтобы потом ее сохранить и засемплить в аблетоне? Или пока ещё никакого инструментария под такое пригодного нет?
Как в udio указать на то что в данном отрезке должна быть кульминация? Это в тегах писать или в тексте в скобочках? Или это не поддерживается и надо просто роллить?
>>719860 Я вообще не понимаю как эта хрень работает, то все идеально с первого раза в 1% случаев, то он не то что тон не поддерживает, а вообще забивает на все что ты там ему написал и просто сам выдумывает кашу из звуков.
>>719860 В мануал моде сменой тегов может сработать. Но если ты со своим текстом пилишь, то может и в тексте тоже сработает. Во всяком случае некоторые штуки срабатывают вроде.
Вообще я заметил что у разных голосов разная база данных видимо, потому что некоторые вообще никак невозможно заставить петь то что надо, а некоторые без запинок что угодно произносят.
>>719879 >>719880 Просто вот я один раз вписал [Solo], в надежде что будет инструментальный фрагмент, но с соляком, без разницы каким интсрументом. Вместо этого получилась шебм. Само пение мне понравилось, и я решил +/- повторить, только уже со своим текстом. Тут-то и выпадает кишка, потому что даже близко не выходит.
>>719883 Даже вот для примера трек из этого поста >>719879 я крутил раз 50 но даже второй куплет записать не смог ну вообще никак, просто кашу из букв выдает и все. А пик с первого раза все спел, вообще перекручивать не пришлось. Тоже кашу в текст добавлял, но на кончиках так что их хоть отрезать можно и получится хоть что-то. Теги одинаковые, текст одинаковый, ну кроме того что я исправил где вместо ё е было, а разница в сложности просто поражает.
>>720938 Искал чем качественно выдирать вокал из дорожки, наткнулся на fadr, работой остался доволен. Помимо кучи остальных функций с которыми я ещё не разобрался, там даёт скачать midi и mp3 ~250 kbps бесплатно.
>>721928 Ролить, пока нормально не будет. По ощущениям, он пытается упихать всё что ты написал в 33 секунды и если мало или много текста такое происходит.
Имею в виду то, что лучшая музыка - это официальные файлы и винил от исполнителя. Именно в них каждый синусы звука идут от композитора, не искаженные эквалайзерами и тем более сжатием MP3. Если по пути от оригинального трека до уха слушателя идёт не тот звук, что слушал сам исполнитель, пока записывал, то это значит, что с твоей аудиосистемой или носителем звука что-то не так.
>>723124 > Имею в виду то, что лучшая музыка - это официальные файлы и винил от исполнителя
Всегда проигрываю с людей, которые не варились в среде звукозаписи годами, но при этом высказывают мнения, будто они чем-то подкреплены, кроме их собственного идеализированного представления
>>723124 >Если по пути от оригинального трека до уха слушателя идёт не тот звук, что слушал сам исполнитель, пока записывал, то это значит,
Что звукарь обосрался, потому что его первостепенная задача сделать так чтобы дорожка звучала максимально одинаково независимо от устройства воспроизведения
>FLAC с бендкемпа исполнителя будет лучше mp3 с рутрекера
Чем?
Че-то вспомнилось, как я в конце нулевых годов на городской локальный торрент трекер закидывал мп3 с дисков конверченные через прогу во флак, так все в комментах ссались кипятком говоря насколько же круче и объемнее стало звучание, но самое смешное что я сам думал что именно так флак и делается, тупо в проге конвертнуть и слушал типа качественнее стало
>>723157 > Что звукарь обосрался, потому что его первостепенная задача сделать так чтобы дорожка звучала максимально одинаково независимо Это физически невозможно. Если у слушателя дешманские наушники, в которых даже бассов нет, то тут ничего не поделаешь, это не артист виноват.
>>723304 Чел, концертный зал ≠ вокальная будка. Там совершенно другой звук будет даже если в зале ни одного человека кроме исполнителей не будет. А учитывая, что концертные записи - это записи посетителей с мыльниц 2008 года...
>>724735 Что значит "первый ИИ-клип"? Первый клип автора? Или что? Чем он отличается от сотен видео, сгенереных ии и уже сто раз наложеных на музыку? Почему они не клипы? Тем, что имитирует отдельный жанр с проездкой камеры? Или что блядь?
udio просто параша какая то, я потратил 60 генераций, но так и не смог сделать нормальный отрезок. Он просто игнорирует первый куплет или несколько первых строк. Я просто не понимаю почему? на отказ игнорирует текст. начинает с рандомного места.
>>724979 Udio нужен для создания качественной инструментальной музыки. В отличии от Suno, Udio может создать действительно чувственные мелодии и гармонии, использовать нескучные музыкальные ходы.
Если тебе нужен джазз, эмбиент метал, синтвейв, лоуфай-хипхоп (фо стади энд чилл ту), мемфис реп, фьюжен, и многое другое - тебе к udio, суно только что-то невнятно генерировать. Треки от Suno слушать можно, но эмоций они не вызывают.
Так что udio на данный момент лучший инструмент, чтобы создать саундтрек для игры, если ты не музыкант.
>>724979 Я почти неделю генерировал один трёхминутный трек, в конце потратил около 200 генераций на интро, и всё равно не смог заставить его заткнуться и не вставлять вокал, пришлось смириться и резать ручками. Зато за это время я набрал кучу охуенных сэмплов, так что не считаю время потраченным впустую. Гораздо сложнее сгенерировать пиздатую заготовку ящитаю.
Ахуеть да вы гоните, явно что-то делаете не так как все остальные
Во-первых вокал нужно вставлять кусками желательно максимум 4 строчки, 8 это самый край
Во-вторых если не знали, то промпт можно менять прямо на ходу для разных отрезков и в нем можно написать но вокалс или инструментал, короче я ебал если ты за 200 генераций ИНТРО даже не попробовал экспериментировать
>>725455 Я в курсе, только это не работает, умник. Никакие промты, даже ПОЛНОЕ УДАЛЕНИЕ ВСЕХ ТЕГОВ КРОМЕ ИНСТРУМЕНТАЛ, ВКЛЮЧЕНИЕ ГАЛОЧКИ, ВПИСЫВАНИЕ В КВАДРАТНЫЕ СКОБОЧКИ И ЛЮБАЯ КОМБИНАЦИЯ ВЫШЕОПИСАННОГО не убирало вокал.
>>730181 я не особо шарю но там вроде с помощью одной нейросети на ижорожки рабиваешь. гитара отдельно, барабаны отдельно, эмбиент отдельно и самое главное вокал отдельно берется, затем аудиофайл с помощью неронки меняют. ну или автор сам поет и меняет свой голос с помощью нейронки. в треде про изменение голоса подробно это описывали
Как же я заебался с udio. Постоянно то отсебятину пытается въебать то слова глотает, но саунд один хуй много лучше чем у suno. Алсо, цензурочка цензура. Мать вашу везде это говно. Ладно хоть обходится, ПОКА относительно легко заменой букв на латинские.
Алсо, а чо это все тут такие скучные вещи пишут? Какая то политота, да про говно. Во, найткор порно. Мега хит, название сами думайте какое сделать.
>>732044 как тебе сказать, английский язык уже просто настоебенил. Он везьде, во всей музыке, в каждой жопе зхатычка. Где фарнцузкие итальянские и другие языки? Почему чтобы найти на них музыку нужно УСИЛИЕ?
>>732071 Ну делай на итальянском и других. Думаю, даже если с ним у удио не очень, русскоязычному уху ничего слух резать не будет, ибо всё равно не знаем как там правильно. >Почему чтобы найти на них музыку нужно УСИЛИЕ? Потому что мировой мейнстрим - только англ. Ну и нынче кейпоп может какой-то, но кто его вообще слушает? Даже фанатки его скорее смотрят.
А до этого были WhatsApp, Viber, Evernote. Да и Google, если вдуматься.
Есть талантливые мозги, только реализовываться они могут в странах с защитой частной собственности и работающими законами, а не в стране, где все работает по принципу мексиканского наркокартеля.
>>732639 Ну это ты их считаешь нашими, а они себе намутили новых паспортов и фамилий, и вряд ли слышать про нас хотят. В том же Удио русский хуже, чем в Суно. Ну и кто сделает страну нормальной для новых Дуровых, если старый Дуров - приспособленец и самовлюбленный маньяк.
>>732639 > с защитой частной собственности И будет кокпетализм. Не, спасибо. Лучше бы вообще всю информацию объявили общественной собственностью и легализовали пиратство. Если бы Путин подписал такой закон - голосовал бы не думая.
Это место объявляется точкой обмена информацией. Копируй и распространяй!
>>718382 (OP) Блин, мужики, щас решил попробовать что то кроме чат ботов дрочённых, накидал буквально за минуту текст из головы в udio и просто указал жанры музыки. Я даже не представлял себе что будет настолько ахуенно! Вот ради этого, я реально готов пойти и видеокарту куртки купить!
>>734867 Зоо фурри порно head-to-head сравнение udio и suno показало, что как полноценный генератор udio пока сосёт. Но основа (голос и музыка) у udio поинтереснее.
>>734883 проблема на самом деле не в нейросетях. Проблема в писателях промтов. Вы постоянно пытаетесь скормить нейронке зубодробительный текст, даже не попытавшись пропеть его хотя бы в голове. Ритм рифма, да похую. Потом удивляются хуле так плохо. Видрил, я раз 30 переписывал стих чтобы звучало по человечески. По мере генерации добавляя и изменяя. Это не один раз закинул и нейронка поправила твоё косноязычие и отсуствие воображения.
Короче как обычно, нет кнопки - сделать заебись, и не будет.
>>735005 >Проблема в писателях промтов. Вы постоянно пытаетесь скормить нейронке зубодробительный текст, даже не попытавшись пропеть его хотя бы в голове. Конкретно в этом случае текст генерировался самими нейросетями по запросу "песня о ебливой лисе".
По готовому стиху поют более-менее. Но и тут udio посасывает, начиная петь с середины, пропуская половину слов или выдавая тарабарщину. У suno третьей версии проблемы с ударениями, безударным оканием и рандомной заменой е на ё, хотя никто её не просил этого делать.
>>735005 Не говоря уже о том, что они в 90% случаев делают не инструменталы и не текст на инглише, а петросянские частушки про письки и какашки на своем колхозном нахрюке.
>>732284 главное, что анону нравится. К тому же у него неплохой копипаст Летова вышел, хотя сама песня унылая, конечно. Но это нормальны - я свои песенки до дыр заслушиваю, а итт на них mehкают
>>735409 Да, я буквально первым словом в промпте прописал Joy Division (лол), она выдала, что мол "Artist Replaced, We do not generate artist likeness without permission, Replacing Arist Name with:", выдала вместо этого какой-то набор тегов, но все равно скопировала стиль, пусть и не Джой Дивижн, а Цоя
>>735486 Ну хуй его знает, в релейтед видео у чела получилось скопировать стиль группы Powerwolf, включая голос и манеру пения вокалиста. В оригинале поется на английском, так что дело походу не в ограниченности библиотеки обучения песен https://www.youtube.com/watch?v=r-X3jbIy2Dw
>>735409 Исполнителей вписывать можно, просто очень популярные распадаются на теги. Грубо говоря, Katatonia распадётся, а Alcest останется и даст правильный звук без ебли. Можешь ещё писать имя вокалиста/гитариста/и т.д., чтобы получить соответствующий тембр и ходы.
>>735005 >Вы постоянно пытаетесь скормить нейронке зубодробительный текст, даже не попытавшись пропеть его хотя бы в голове. >Ритм рифма, да похую. Потом удивляются хуле так плохо. лол, доёб анона, случайно открывшего 2-3 песенки итт. Многие на стихи известных поэтов сочиняли и сочиняют. Или ты зумер, у которого и Есенин - говно?
каких еще русских исполнителей udio хорошо копирует? Горшка - по промпту Russian horror punk rock в manual mode, например выше писали про промпт Joy Division, лол. а как у вас получался Летов, например?
>>736974 есть у меня пара знакомых музыканта. Один просто пошёл в полный отказ - типа нейронка звучи как говно. Другой в депряснеке, навалял свои стихи на юдио, нейронка спела лучше и жирнее чем он сам бы мог + аккомпанемент + хор, и полный набор инструментов. Чел пытается в аффторскую песню. На самом деле нейронке надо дикинуть больше рычагов управления, специфических для музыки. По своему опыту генерации - сделать то что тебе надо, это как на верхом бешеной свинье пытаться въехать в ворота. Ну и ещё один момент, творческая интеллигенция кинула Россиюшку через хуй с патриотизмом на этой войне. Так что скатертью по жопе. Будем генерить контент без дохуя о себе возомнивших торговцев ебалом.
>>737009 можно пробелами запятыми и новой строкой подправлять интонации и паузы между словами. Так то норм, но ритм сильно от оригинала уехал.
>>737080 чукча не читатель, чукча писатель? Ну ёбаны в рот, ну почитай ты классику! Просто почитай блять, если в шкилке забил хуй то сейчас самое время. Есть же мастера изящной письмености, Пушкин, Лермонтов вот это вот всё. С хуя ли вы думаете что в голове что то родится если там ничего не было изначально.
Как вы блядь собираетесь железную нейронку тренировать если своя мясная нейронка пустая?
Удио смогла скопировать стиль Powerwolf, сделал в нем песню "Изумрудный Хуй". Вроде бы получше вышло, чем Цой-скуф
>>735905 Я Джой Дивижн случайно сделал без manual mode, один раз туда примешался тег noise rock, в итоге получилась Гражданская Оборона
>>737080 Пробовал генерировать стихи в Google Gemini, получалась какая-то примитивная хуйня, но для генерации нейро-песен сойдет. Во втором mp4-релейтед как раз песня из Suno на такой нейро-стих
>>737080 Не нужно какого-то супер ума́, Об этом однако ты помни: Вода не течёт под тот камень сама, Что ты никогда и не по́днял.
Погуглить "школу поэзии", немного изучить размеры по примерам (в моём случае простой амфибрахий), чтобы гармонично ритм смотрелся, а не как ёбаный речитатив, словари рифм тоже в подмогу
Надеюсь, что появится особенный ИИ, который будет не создавать музыку, как Удио или Суно, а досконально обрабатывать треки, которые ты всунул ему, чтобы он анализировал мелодику, тембр, длину, аранжировку, вокал, и выдавал максимально схожие треки или те, которые тебе гарантированно понравятся.
Просто те варианты, что есть на рынке полный кал пизды, который выбирает, исключительно по жанрам, написанным на дискографии, притом, что треки могут разительно отличаться.
Промпт взят с Ютуба: "Power metal, Male vocals, Powerful vocals, Organ, Occult, Church, Religion, Crusaders, Energetic, Opera metal, Vocal distortion, Theatrical metal, Organ synthezator"
>>738445 на одну композицию с Высоцким ушло больше 50 генераций. Это поиск пододящего стиля настроение игра с промтами, потом уже борьба с бубнежом и нейрошумом. >>738951 дожру бетатестерский аванс и буду искать другие нейронки.
текст для генерации [Verse 1] Свинное тело моё, положили В деревянный лаковый гроб. Хороводы вокруг меня вы водили Ёлку ставили мне на лоб, Праздник, веселье, смерти твердили "Забирай, Тараса - это твой холоп" [Chorus] (Блинокачка-а-а-а!) Родные меня в гроб положили. (Блинокачка-а-а-а!), Я стану мясным кубом! (Блинокачка-а-а-а!), Весело мы послужили! [Verse 2] Моё сознание ушло в другие миры. Моя память останется на двачах. а бренное тело сожмут в мясной куб. На площади, забытым в снегах. [Chorus] (Блинокачка-а-а-а!) Родные меня в гроб положили. (Блинокачка-а-а-а!), Я стану мясным кубом! (Блинокачка-а-а-а!), Весело мы послужили! [Verse 3] Моё телов нашли в Азов Стали Гдя я жрал собачий корм. Сожмут в мясной куб. И отправят домой. А мать в твиттере утешали: (Гордись своим кубом) [Chorus] (Блинокачка-а-а-а!) Родные меня в гроб положили. (Блинокачка-а-а-а!), Я стану мясным кубом! (Блинокачка-а-а-а!), Весело мы послужили!
>>732639 >странах с защитой частной собственности и работающими законами, а не в стране, где все работает по принципу мексиканского наркокартеля Но почему-то всегда этой страной является США (и иногда Канада или Израиль, что один хуй). В Испании нет защиты частной собственности и работающих законов? А во Франции, Германии и Португалии или Юкэй? А то оттуда только нохчи-ММАшники, семьи которых от штурма Грозного убежали и там осели. Все просто - инвестиции легче получить, находясь в финансово-технологических центрах самой большой империи в истории человечества. И уровень жизни там выше, поэтому туда и валят. Уже много раз читал АНАЛитику (в т.ч. из FT и The Economist), почему Европа отстаёт от Америки по всем этим показателям (ИТ, ИИ и т.д.). Ничего вразумительного не получил в ответ, кроме как "неповоротливая бюрократия", "отсутствие инвестиций" бла бла бла.
>>739322 >Ничего вразумительного не получил в ответ, кроме как "неповоротливая бюрократия", "отсутствие инвестиций" бла бла бла. Так и есть - бюрократия и патернализм это обратные стороны социального государства. В ЕС проще всего ничего не делать.
>>739544 знаешь, я в принципе не нацист и к жидам отношусь почти положительно, потому что в основном только евреи способны заниматся таким кропотливым, сложным и откровенно говоря дико скучным делом как математические изыскания и теорфизика, и другие науки требующие глубочайшего погружения в тему. Но, сука, за такую хуцпу тебе надо разбить ебало. Евреи это специи.
>>740214 Не, просто выдуманный через жпт генерировал что-то на "эльфийском" и потом корректировал результат, указывая что поменять, чтобы помягче звучало. Но мне кажется чатжпт все равно ориентировался на Толкина, так как в текстах всякие Silmaril. Латынь тоже можно запросить у чатжпт текст нагенерить и дальше уже смотреть как он звучит в разных жанрах. Но на латыни и так каверы ещё до нейронок делали, звучит так себе, только гимны хорошо. Надо будет ещё попробовать для дроу, в стиле dvar поделать.
>>739322 > самой большой империи в истории человечества Римская Империя и Российская Империя. Если воспринимать слово «империя» не буквально, то ещё и СССР.
Юдио аж корёжило пока этот проэкт клепал. Сначала обозвал композицию Content violated, пото м i can't play this song. Но я его дожал. Правда нахуя. на что я трачу свою жизнь и рабочее время...