Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Создать тред Создать тред

Тред закрыт.

Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 119 35 50
AI голоса AI voice Elevenlabs AI 11.ai thread Аноним 05/02/23 Вск 20:34:19 102542 1
image.png 156Кб, 320x320
320x320
Аноним 05/02/23 Вск 20:45:25 102556 2
2023-02-0401-32.png 211Кб, 1337x694
1337x694
1675450548121456.gif 4048Кб, 640x498
640x498
Аноним 05/02/23 Вск 20:48:53 102563 3
Аноним 05/02/23 Вск 20:49:53 102565 4
Аноним 05/02/23 Вск 20:53:50 102569 5
dfbe56a11640a1d[...].jpg 77Кб, 640x640
640x640
Аноним 05/02/23 Вск 20:57:41 102574 6
>>102563
Значит нужно быстрее тот тред до бамлимита довести, чтобы перекатить с ссылками актуальными
Аноним 05/02/23 Вск 21:00:12 102578 7
>>102542 (OP)
блин я раньше думал это какая-то переговорная труба а теперь понял это микрофон и поп фильтр

жаль такого арта мало...
Аноним 05/02/23 Вск 21:21:24 102620 8
>>102574
Да тот тред сдох, ответов на вопросы нет. А этот по сути ни чего нового не предлагает. Пока не будет адекватной нейросети на русском в открытом доступе, я не думаю что тема будет актульна. Нам нужны специалисты в лингвистике, кто хотябы с фонемами разбирается.
Аноним 05/02/23 Вск 21:33:13 102646 9
>>102578
Ну ты пиздец, первый на очередь для замены нейросетями
Аноним 05/02/23 Вск 21:52:07 102686 10
image.png 195Кб, 1271x562
1271x562
>>102542 (OP)
Я уже нихуя не понимаю, какая перспектива на этом арте? Пикрил, что ли?
Аноним 05/02/23 Вск 22:53:41 102768 11
>>102686
это кстати не нейроарт

а перспектива нормальная анимешная тебя скорее всего сбивает поп фильтр, он немного наискосок от ююдачи
Аноним 05/02/23 Вск 23:34:02 102843 12
>>102768
>сбивает
Меня сбивает моя криворукость, т.к. рисовать я совсем не умею. Просвети пж, как точки схода определять на уже нарисованном арте
Аноним 06/02/23 Пнд 00:21:58 102968 13
>>102843
линия горизонта нужна толко, если у тебя фигуры можно поместить в gараллелепипед и все они стоят на одной плоскости. Или же у тебя есть парадейные полу линии, типо стыка стены и потолка. А для органике они используются как вспомогательный элимент и ты не сможешьь их повторить.
Аноним 06/02/23 Пнд 02:10:29 103079 14
>>102620
Больше дохлых тредов! Надо моче написать, чтобы слила. Но кажись такой функции на имиджбордах нет, поэтому этот тред должен умереть.

Ах да, я бы и от англояпонского голоса не отказался бы, лишь бы можно было нормально без ебли у себя запускать.
Аноним 06/02/23 Пнд 02:21:40 103103 15
Аноним 06/02/23 Пнд 02:25:12 103108 16
cornel.jpg 105Кб, 828x1200
828x1200
Аноним 06/02/23 Пнд 02:31:41 103115 17
>>103103
>Перекат
>177 сообщений
Аноним 06/02/23 Пнд 02:56:47 103146 18
Аноним 06/02/23 Пнд 03:12:36 103185 19
изображение.png 33Кб, 1469x304
1469x304
>>103146
Я бы удивился, если бы оно сработало с первого раза без ошибок.
Аноним 06/02/23 Пнд 04:01:04 103276 20
>>103185
У тебя была проблема во время выполнения строки `pip install -r requirements.txt`? Кинь скрин лога побольше, чтобы было видно последние строки.
Аноним 06/02/23 Пнд 04:03:20 103281 21
изображение.png 59Кб, 1268x502
1268x502
>>103276
Там в середине мой логин. Но ошибка максимум долбоёбская, вряд ли с ней можно что-то сделать, кроме как снести мою старую как говно мамонта ЛГБТ шинду и накатить что-то поновее.
Аноним 06/02/23 Пнд 04:11:50 103309 22
>>103281
Эта ошибка уже встречалось у двух человек. Просто следуй дальше по инструкции. И да у тебя не такой уж уникальный ник чтобы переживать об том что по нему можно задеанонить, но ты можешь просто его замазывать в следующий раз
Аноним 06/02/23 Пнд 04:42:39 103389 23
изображение.png 8Кб, 619x72
619x72
>>103309
>Просто следуй дальше по инструкции
Результат немного предсказуем.
Аноним 06/02/23 Пнд 15:14:01 103842 24
>>103389
Советую, сначало читать инструкции, а потом им следовать. Потому что там дальше по инструкции на 57 строчке написанно:
"Если у вас ошибки, то смотрите в повершел, и смотрите что пишут, если там ModuleNotFoundError: или AttributeError: То это значит что у вас не все модули скачались. Их можно докачать с помощью команды pip install "название модуля"..." В твоём случае надо написать `pip install librosa` если и это не поможет, то скачать через ссылку которая есть дальше по инструкции.
Аноним 07/02/23 Втр 13:15:06 105186 25
>>103842
>Советую, сначало читать инструкции, а потом им следовать.
Я программист до мозга костей, поэтому исполняю всё построчно. Скачивание директории помогло, спасибо. Хотя интересно конечно, что ему там не нравилось. Судя по попытке что-то сбилдить, ему нужны билдтулы из вижуалстудии...
Аноним 07/02/23 Втр 13:32:26 105205 26
а чего они у меня все тараторят? Есть какие-нибудь опции, чтобы успокоить их и замедлить, менять интонацию в предложениях и фразах.
Аноним 07/02/23 Втр 13:54:14 105232 27
>>105205
>замедлить
Duration
>>105205
>менять интонацию в предложениях
Phoneme Input и там вводи всякие ↑↓
Аноним 07/02/23 Втр 14:36:59 105270 28
>>105205
Модель для японского? Если да, то всё нормально, японцы всегда тараторят.
Аноним 07/02/23 Втр 14:38:43 105273 29
photo2023-02-07[...].jpg 74Кб, 512x768
512x768
Бля, как вы генерите? У меня без впн не открывает, а с впн банят якобы за абуз фри версии.
Сгенерьте Джинкс, вот аудио
https://vocaroo.com/14gcLSyK7ecY
Аноним 07/02/23 Втр 15:46:51 105332 30
image.png 115Кб, 540x585
540x585
Добрый день, уважаемые господа. Пожалуйста, подскажите можно ли, и если да то как:
1. Генерировать русский голос (мужской, женский, детский)
2. Генерировать японский голос (мужской, женский, детский)
Аноним 07/02/23 Втр 16:15:35 105364 31
>>105332
>1. Генерировать русский голос (мужской, женский, детский)
Пока нету, нужно тренировать.
>>105332
>2. Генерировать японский голос (мужской, женский, детский)
Как говна в проруби, особенно женских.
Аноним 07/02/23 Втр 16:34:56 105383 32
>>105186
Сори, это мой первый гайд, поэтому там есть проблема со структурой. А пакет скорее всего не скачивался из-за проблем с виндой. У меня она 11.
Аноним 07/02/23 Втр 16:36:55 105386 33
Аноним 07/02/23 Втр 17:50:55 105487 34
image.png 104Кб, 540x585
540x585
image.png 59Кб, 886x566
886x566
image.png 35Кб, 670x704
670x704
2023-02-07 19-1[...].mp4 1950Кб, 1440x900, 00:00:06
1440x900
Оно работает! Немного напильника.

Я тоже столкнулся с ошибкой >>103281 "Не удается найти указанный файл" если делать череp pip установку зависимостей командой pip install -r requirements.txt общим списком

Пошел посмотреть список модулей, которые по зависимостям требует VITS-Umamusume-voice-synthesizer, всего 22 пакета, на установке 12 пакета - pyopenjtalk - через pip (установщик пакетов Питона) как раз эта ошибка "Не удается найти указанный файл".

Остальные модули при установке по одному с конца списка ручным копированием названия в powershell поставились через pip без ошибок.

Пришлось скачать готовые папки с модулями pyopenjtalk через https://drive.google.com/drive/folders/1WY5kumfugiwYk-CJEU9eU2sEVAIOCqpr?usp=share_link и поместить их оба как в папку с виртуальной средой (venv) в Lib\site-packages так и в сам клонированный через git репозиторий VITS-Umamusume-voice-synthesizer.

Для получения ссылки на локальную интернет-морду в powershell
1. Запустил powershell от администратора
2. Перешел к папке с виртуальной средой через cd
3. Активировал скрипты командой .\название папки для виртуальной среды\Scripts\activate
4. Перешел к папке с VITS-Umamusume-voice-synthesizer через cd
5. Для её запуска использовал python3.exe .\app.py (у меня есть как и обычный старый 2-ой питон, если пробовать искать его через python.exe, так и python3.10.exe - поставленный из магазина Майкрософт, так и отдельный обычный Питон 3, который находится через python3.exe. У меня под Windows 10 работает и через обычный скачанный с сайта Питон 3 (python3.exe) и через Майкрософтовский (python3.10.exe).

Powershell еще сказала надо поставить через pip модуль tqdm, при выполнении pip install tqdm вижу:
WARNING: The script tqdm.exe is installed in 'C:\Users\bk\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\Scripts' which is not on PATH.
Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location

Пошел к доп. настройкам Windows, без задней мысли добавил везде где можно директорию со Скриптами в PATH.

Если не добавлять в PATH и пробовать запустить локальную вебморду в браузере и нажать Generate, получаю Error. Но после добавления в PATH и активации скриптов запускаю
python3.10.exe .\app.py
или
python3.exe .\app.py
получаю локальную вебморду http://127.0.0.1:7860/ - жму Generate и слышу заветное konnichi wa! (Каждый раз разное при генерации).

Записи лежат в wav в папке, про которую написано в гайде - да, надо открыть app.py и прописать в трех местах с 27 строки в параметрах dir=self.temp_dir вместо self.temp_dir название директории (папки), которую вы сами создаете и называете для хранения аудиозаписей, причем обратный слэш в конце названия может быть не обязателен, на своей машине я проверял запуск с названием этой папки со слэшом в конце и без него, замену названий проводил через Notepad++
Аноним 07/02/23 Втр 17:52:56 105490 35
>>105487
аватарку убери, чмо
Аноним 07/02/23 Втр 18:14:33 105522 36
>>105487
Я думаю я просто соберу контейнер без ненужной хуйни и просто залью, чтобы не ебаться с этим.
Аноним 07/02/23 Втр 18:17:38 105523 37
Что же, теперь когда VITS-Umamusume-voice-synthesizer работает и генерирует, возникает резонный вопрос: как ее настроить или натренировать на кастомном аудиопотоке чтобы получить собственного японского персонажа?
Аноним 07/02/23 Втр 20:37:34 105639 38
Аноним 07/02/23 Втр 23:07:08 105887 39
> Luke, did I ever tell you about Ahsoka Tano? She was your father’s exotic teenage alien apprentice, a fine piece of jailbait from a more civilized age. She had the tightest body and the perkiest little breasts in the galaxy; barely legal in most systems.

> Anakin and I used to doubleteam her at the end of every successful campaign during the Clone Wars, and once in a while we’d even have the entire 501st run a train over her, part of official Jedi “training” of course. In time, she learned how to handle a meatsaber better than anyone in the Jedi Temple. She wore a miniskirt every day so we told her there were no panties in space, and since she was constantly doing acrobatics you’d get a glimpse of her orange pussy mid fight as she’d do a flip while slicing a B2 Super Battledroid in half. It was surreal.

> We taught her to grip her weapon backwards like a dildo and she constantly got captured by pirates and slavers almost every other day. It was ridiculous, like a constant porno Luke, you have no idea. And she was a good friend.
Аноним 08/02/23 Срд 00:22:21 106056 40
image.png 24Кб, 733x168
733x168
>>105639
В общем, как я понимаю, "Советский учебник по алхимии 3.0" не для слабых духом, да и только для видеокарт, и натренировать даже один голос на моем двухгиговом старом видеоведре, уже не говоря про CPU, невозможно в принципе.
Аноним 08/02/23 Срд 00:54:44 106088 41
>>106056
Почему ты так решил? Если что, потрейнить мог бы и я, у меня 3080Ti, должно хватить для голоса.
Аноним 08/02/23 Срд 01:15:12 106112 42
image.png 10Кб, 633x95
633x95
>>106088
>Почему ты так решил?
Потому что внутри train.py английским по черному написано:
"CPU training is not allowed." и рядом всякие assert torch.cuda.is_available() для Nvidia.

А из статьи на китайском ясно, что для моего AMDшного видеоведра никакой ROCm не светит, да и крепкий волос мудрый вождь нефритовый стержень запретил колдовать на процессоре.
Аноним 08/02/23 Срд 02:37:04 106168 43
>>106112
Ох нифига, ты читаешь код перед запуском?
Ладно, попробую у себя. Главное чтобы под шиндой работало.
Формат тренировочных данных кто-нибудь знает?
Аноним 08/02/23 Срд 07:44:05 106223 44
>>105273
Удали куки по сайту. Заходи в настройки браузера и ищи вкладку с куки, потом ищешь имя сайта в списке и жмёшь удалить, всё.
На самом деле это ещё задроченный вариант, может просто другой аккаунт зарегать можно.
Аноним 08/02/23 Срд 07:53:35 106224 45
image.png 7Кб, 267x316
267x316
image.png 25Кб, 840x482
840x482
>>106168
В датасете LJSpeech-1.1, например, идет метадата - csv таблица с названием wav и текстом рядом, и сами wav в папке.

А для собственного датасета должно быть wav конвертированное в 32kHz через питоний скрипт, положенное в папке dataset_raw

https://github.com/innnky/so-vits-svc/blob/32k/Eng_docs.md
Аноним 08/02/23 Срд 13:37:01 106410 46
image.png 52Кб, 537x552
537x552
Обмазался пакетами питона, удалил обычный parselmouth, поставил praat-parselmouth и все равно в итоге вся эта ебала so-vits-svc и не дизайнилась под тренировку своей модели на кастомном датасете wav через ЦПУ. Не видать мне заветного голоса покуда CUDA не пришла в мой дом.
Аноним 08/02/23 Срд 15:19:25 106543 47
>>102542 (OP)
Блин, что за ебаная шапка? Где мануал? Как вкатиться? Что делать?

Сделать им семпл голоса мечты? Как это работает?
Аноним 08/02/23 Срд 15:37:20 106561 48
Аноним 08/02/23 Срд 15:38:06 106563 49
Аноним 08/02/23 Срд 17:24:59 106704 50
image.png 17Кб, 603x205
603x205
image.png 31Кб, 767x631
767x631
image.png 53Кб, 385x298
385x298
>>106223
Куки легко чистятся, но эта хуйня не помогает. После первой попытки что либо сгенерить на сайте вылезает третий пик. Еще не пробовал другие впн.
Аноним 08/02/23 Срд 19:21:22 106919 51
>>106543
Да всё, закрыли лавочку. Три дня назад можно было до 5 кастомных голосов создать, а теперь нельзя.
Аноним 08/02/23 Срд 19:28:47 106945 52
>>106919
Хммммм, со старого аккаунта ещё можно создавать, значит либо смотрит на гугловскую привязку к телефону либо новые аккаунты теперь кастрированы, теперь только за деньгу.
Аноним 08/02/23 Срд 19:33:37 106957 53
Всё пиздец
Voice Lab is only available on paid tiers. Please subscribe, a free trial is available for Starter tier.
Аноним 08/02/23 Срд 19:42:28 106976 54
>>106957
Ну и прекрасно. Платная параша же. А теперь пошли трейнить на колабе с открытым кодом.
Аноним 09/02/23 Чтв 09:17:35 107665 55
>>106945
БЛЯЯЯЯЯЯЯЯЯЯЯЯЯЯ. У меня даже одного текстового запроса не вышло сделать. Сука.
Аноним 09/02/23 Чтв 23:46:06 108423 56
Чо так все сложна, нихуя не понимаю, когда запилят webui для голоса?
Аноним 10/02/23 Птн 00:28:19 108459 57
Аноним 10/02/23 Птн 23:31:57 109889 58
>>102542 (OP)
Дикторы-то хуй с ними, а вот голосовым актёрам и всяким там сэйю стоит пристрематься.
Аноним 11/02/23 Суб 02:02:17 110222 59
>>109889
До уровня сейю этим программам ещё срать и срать.
Аноним 11/02/23 Суб 07:51:16 110412 60
1675135197846029.jpg 55Кб, 542x616
542x616
Аноним 11/02/23 Суб 13:58:14 110678 61
BgCDO-UcAEEkmY.png 204Кб, 489x445
489x445
Аноним 11/02/23 Суб 14:34:15 110733 62
>>110678
Для глухих
>иди нахуй, сука, я твою маму ебал, ах.
Аноним 12/02/23 Вск 04:52:13 111839 63
j.webm 1690Кб, 800x800, 00:01:37
800x800
Аноним 12/02/23 Вск 17:29:08 112683 64
>>111839
Так, вторая ссылка выглядит более перспективно. Спасибо!
Аноним 12/02/23 Вск 18:50:19 112901 65
>>111839
>https://rentry.org/AI-Voice-Cloning
Я так понял образец нада в утилиты кидать? Пишет файл без методанных иди нахуй. В основном окне только запись с микрофона.
Аноним 13/02/23 Пнд 04:21:20 114169 66
изображение.png 263Кб, 2504x1541
2504x1541
>>112901
Не угадал. Нужно закиинуть подготовленные wav (через скрипт в convert) в подкаталог в voices (назови сам).
Но это какая-то стрёмная хуйня, которая жуёт входные файлы каждый раз, поэтому генерация занимает больше 10ГБ врамы и идёт по 5 минут, лол. Качество... Ну явно не для русского, хотя оно пыталось, да. Впрочем, может это я засрал настройки. Вот короче результат на паре файлов из моего предыдущего набора с русским голосом из песни Саи.
https://voca.ro/1mZD3KEUH7ML
Аноним 13/02/23 Пнд 11:33:55 114403 67
>>114169
Бля, ну это кал. Даже FreeVc лучше.
Аноним 13/02/23 Пнд 12:48:33 114472 68
>>114169
Пара файлов это что, тренировка на датасете ровно из двух wav файлов?
Аноним 13/02/23 Пнд 13:59:33 114551 69
изображение.png 21Кб, 484x301
484x301
>>114403
На английском оно лучше. С русским да, пока везде беда.
>>114472
Пяти, если быть точным, где-то на минуту.
Аноним 13/02/23 Пнд 15:17:51 114702 70
>>114551
>Пяти, если быть точным
Этого хватает для полноценного датасета и получения годных результатов?
Аноним 13/02/23 Пнд 18:05:57 114955 71
>>114702
Там по сути нет датасета. И голос так себе. Ищем другие, более удобные варианты.
Аноним 16/02/23 Чтв 09:20:34 119127 72
>>105487
Голос он сожет подделать или только готовый?
Аноним 16/02/23 Чтв 10:47:01 119157 73
>>119127
То, что я заставил работать - это уже тренированные готовые модели для голоса.

В треде есть ссылки на проекты гитхаба, которые позволяют создать датасет (набор wav) и натренировать собственную модель. Для этого нужна CUDA и хорошая GPU от зеленых. Насчет AMD не знаю.
Аноним 16/02/23 Чтв 18:49:13 119710 74
>>119157
>натренировать собственную модель
См. выше, оно не тренирует, а жуёт каждый раз. Но да, типа подделывает. Но на русском получается УГ.
Про другие методы с тренировкой модели пока аноны не запускали.
Аноним 17/02/23 Птн 07:30:25 120689 75
>>119710
Если китайцы смогли, то и у нас получится
Аноним 18/02/23 Суб 02:11:06 122113 76
>>120689
Китайцев 1,5 лярда, нас в 10 раз меньше. Соответственно в 10 раз меьше мозгов, чтобы фонемы под русский починить да моделей натрейнить.
Аноним 23/02/23 Чтв 20:52:22 129455 77
>>105364
>Пока нету, нужно тренировать.
Можно подробнее? Какие мощности нужны, сколько данных для треннировки?
Аноним 24/02/23 Птн 04:50:01 129862 78
Аноним 26/02/23 Вск 00:28:06 131785 79
>>108459
она японская, другие языки не поддерживает.
Аноним 26/02/23 Вск 00:37:25 131799 80
>>131785
А стонать и визжать она умеет?
мимо
Аноним 26/02/23 Вск 00:44:13 131804 81
>>131799
А нарезать этих стонов с хентая и вставить в озвучку нельзя?
Тожемимо
Аноним 26/02/23 Вск 07:50:43 131949 82
изображение.png 48Кб, 1164x448
1164x448
>>131785
>другие языки не поддерживает
Да что ты говоришь...
Аноним 26/02/23 Вск 19:45:51 132679 83
>>131804
Для этого нужно просматривать тонны хентая в поисках нужного стона, и подгонять голоса разных актеров друг под друга.
Аноним 27/02/23 Пнд 21:38:05 134063 84
>>111839
А можно делиться итогами? Моделью голоса? Не каждому же с нуля ту же Эмму тренить?
Аноним 28/02/23 Втр 04:51:19 134480 85
Аноним 01/03/23 Срд 09:19:52 135793 86
>>134063
конешн, для этого и тред создан
Аноним 02/03/23 Чтв 19:50:33 137167 87
1677775833472.mp4 56Кб, 334x358, 00:00:05
334x358
>>114551
> С русским да, пока везде беда.
Аноним 02/03/23 Чтв 21:47:13 137337 88
>>137167
Спасибо конечно, что последовал моему "гайду" и запустил Ксению, но я про обучение своим голосам. Плюс тут надо научится играть с эмоциями и прочим (вроде как возможно, но пока не тестил). И да, может, всё таки в TTS тред? А то два треда с одним предназначением.
Аноним 11/03/23 Суб 19:53:39 150974 89
В Эвеленлабс получаетсяя надо брать Стартовый пак для клонирования голоса?
11/03/23 Суб 23:08:18 151315 90
>>150974
Нет, и бесплатного хватает для небольших тестов (по состоянию на январь, сейчас ХЗ).
А вообще, лучше в единый TTS тред >>88212 (OP)
Аноним 14/03/23 Втр 10:02:51 155101 91
>>102542 (OP)
А голос обэмы и бидона есть?
Аноним 14/03/23 Втр 16:38:54 155465 92
Аноним 26/03/23 Вск 20:38:46 184961 93
>>151315
Сейчас беслптано только вмроеннве голоса, клонирование только платно
Аноним 18/04/23 Втр 03:09:51 235725 94
>>137167
А детские есть голоса? У майкрософта в наборе онлайн ттс английские есть, русских пока не находил.
Аноним 18/04/23 Втр 03:28:02 235737 95
image.png 199Кб, 401x500
401x500
>>235725
Есть, адрес пиши свой, анончик. Или телегу.
Аноним 18/04/23 Втр 09:28:32 236004 96
>>235737
И че ты возбудился? Включи озвучку в эдже, на инглише девочки угарно читают, отправляй микросам пативен
Аноним 23/04/23 Вск 21:07:19 251694 97
>>137337
> что последовал моему "гайду" и запустил Ксению
Какую блядь Ксению? Каким гайдам? Ты ебанутый?
Аноним 23/04/23 Вск 21:14:03 251722 98
1682273643456.mp4 711Кб, 170x200, 00:00:39
170x200
>>235725
> А детские есть голоса?
Да хоть MLP.
Аноним 26/04/23 Срд 03:35:40 259414 99
>>251722
А что у неё с акцентом?
Аноним 26/04/23 Срд 14:22:29 260164 100
Аноним 26/04/23 Срд 15:57:27 260330 101
>>102542 (OP)
судя по оп-пику, звуки там однотипные. ну, знаете: ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ!
Аноним 26/04/23 Срд 16:44:25 260448 102
>>251722
У неё нет букв Р, потому что она испекла из них капкейки?
Аноним 26/04/23 Срд 17:12:23 260532 103
Аноним 26/04/23 Срд 23:39:23 261548 104
>>260448
Слышь, сука, ты на детей наезжать вздумал, педофил? Небось тилибонькаешь на детсадовцев? Картавят они ему, суке.
Аноним 26/04/23 Срд 23:53:46 261606 105
>>260448
Да небось их жапонки голос сделали, у них с Р плоблема.
>>261480
Так то всё что угодно оскорбляет кого-нибудь, красивые девушки оскорбляют жирух. Что теперь, дрочить на жирух?
Аноним 27/04/23 Чтв 09:54:55 262506 106
Так-то я бы тоже от детских голосов не отказался.
Аноним 27/04/23 Чтв 10:56:29 262593 107
a4c921f2bb421b6[...].jpg 96Кб, 720x890
720x890
Аноним 29/05/23 Пнд 21:15:10 329121 108
VID202305292113[...].mp4 10602Кб, 960x540, 00:01:30
960x540
С помщью какой нейросети пикрил сделали?
Аноним 29/05/23 Пнд 23:00:49 329434 109
>>329121
Эта нейросеть называется рандомное приложение в плеймаркете с эффектиками
Аноним 29/05/23 Пнд 23:02:51 329442 110
>>329121
>>329434
Бля, название треда не прочитал. Насчет звука без понятия
Аноним 01/07/23 Суб 22:54:26 381206 111
Двач КАК сгенерировать звуковую дорогу на основе загруженного голоса? Я точно знаю, что такое есть. Помню где-то в телеге видел мол грузите голос, желательно пол часа и нейронка озвучит им любой текст.

Я даже нашел какую-то статью на дзене где есть ссылка на колаб, но там какие-то беды с тензерфлоу-гпу, разбираться в падлу. Дайте ссылочбку бога ради.
Аноним 01/07/23 Суб 23:15:42 381286 112
>>381206
Уточню. Надо чтобы я загрузил голос, потом написал текст и она загруженным голосом озвучила этот текст.
Аноним 01/07/23 Суб 23:24:02 381315 113
>>381206
>ссылка на колаб
Оказывается репозиторий не обновлялся уже 4 года. Если 4 года назад такое могли делать, то щас то почему хуй найдешь???
Аноним 01/07/23 Суб 23:32:29 381340 114
Нужна простейшая нейронка для распознавания даже не речи, а звуковых паттернов, которые я вручную ассоциирую с текстом. В результате должно получиться что-то вроде караоке, но с дообучением распознавания озвучиваемого текста (поскольку этот текст будет озвучиваться неоднократно). Кроме пистона есть советы?
Аноним 16/08/23 Срд 09:27:40 457954 115
Облазил тырнеты, результаты меня нихуя не устроили.

Задача: на основе мужского голоса (.mp3 запись) преобразовать его в женский.
Нахуя: хочу аудиокнижки позаписывать, но, как положенно любому хикке, без привлечения иных лиц.

У меня впечатление, что ебучие чатики есть, генерация изображений есть, генерация музыки есть, а вот банальное преобразование одного голоса в другой -- хуй, да нихуя, особенно, на русском языке. Либо английский, либо японщина. И либо сосать хуй, либо как 15-20 лет назад Change Pitch и скорость менять в audacity, получая на выходе поеботу.
Аноним 16/08/23 Срд 17:50:39 458413 116
image.png 51Кб, 502x487
502x487
Аноним 17/08/23 Чтв 04:07:10 459020 117
>>458413
В том-то и дело, что мне нужно не realtime, а на основе заготовленных записей.
Такого, я так понимаю, в принципе нет.

И да, моделей там дохера только для английского и японского, русского почти нихера нет.
Аноним 17/08/23 Чтв 18:23:43 459527 118
>>459020
>Такого, я так понимаю, в принципе нет.
RVC и SVC могут работать как в режиме реального времени, так и с отдельными файлами.
>русского почти нихера нет.
Обучи свои модель — будет.
21/08/23 Пнд 05:59:42 462337 119
Создать тред Создать тред

Check this out!

Настройки X
Стикеры X
Избранное / Топ тредов