/ai/ - AI голоса AI voice Elevenlabs AI 11.ai thread

AI голоса AI voice Elevenlabs AI 11.ai thread Аноним 05/02/23 Вск 20:34:19 № 102542 1

Дикторы всё, но пока только американские
https://beta.elevenlabs.io/speech-synthesis

примеры
https://www.youtube.com/watch?v=9Xqw11NPC40
https://www.youtube.com/watch?v=kMPHsCn4RtA
https://www.youtube.com/watch?v=XYWh4gTs3tY

Аноним 05/02/23 Вск 20:45:25 № 102556 2

>>102542 (OP)
https://vocaroo.com/14JW4THw4mIc

Аноним 05/02/23 Вск 20:48:53 № 102563 3

>>102542 (OP) (OP)
японские тоже
>>88212 (OP) (OP)

Аноним 05/02/23 Вск 20:49:53 № 102565 4

https://vocaroo.com/1aXsLiOIx7rI

Аноним 05/02/23 Вск 20:53:50 № 102569 5

>>102556
>>102565

Аноним 05/02/23 Вск 20:57:41 № 102574 6

>>102563
Значит нужно быстрее тот тред до бамлимита довести, чтобы перекатить с ссылками актуальными

Аноним 05/02/23 Вск 21:00:12 № 102578 7

>>102542 (OP)
блин я раньше думал это какая-то переговорная труба а теперь понял это микрофон и поп фильтр

жаль такого арта мало...

Аноним 05/02/23 Вск 21:21:24 № 102620 8

>>102574
Да тот тред сдох, ответов на вопросы нет. А этот по сути ни чего нового не предлагает. Пока не будет адекватной нейросети на русском в открытом доступе, я не думаю что тема будет актульна. Нам нужны специалисты в лингвистике, кто хотябы с фонемами разбирается.

Аноним 05/02/23 Вск 21:33:13 № 102646 9

>>102578
Ну ты пиздец, первый на очередь для замены нейросетями

Аноним 05/02/23 Вск 21:52:07 № 102686 10

>>102542 (OP)
Я уже нихуя не понимаю, какая перспектива на этом арте? Пикрил, что ли?

Аноним 05/02/23 Вск 22:53:41 № 102768 11

>>102686
это кстати не нейроарт

а перспектива нормальная анимешная тебя скорее всего сбивает поп фильтр, он немного наискосок от ююдачи

Аноним 05/02/23 Вск 23:34:02 № 102843 12

>>102768
>сбивает
Меня сбивает моя криворукость, т.к. рисовать я совсем не умею. Просвети пж, как точки схода определять на уже нарисованном арте

Аноним 06/02/23 Пнд 00:21:58 № 102968 13

>>102843
линия горизонта нужна толко, если у тебя фигуры можно поместить в gараллелепипед и все они стоят на одной плоскости. Или же у тебя есть парадейные полу линии, типо стыка стены и потолка. А для органике они используются как вспомогательный элимент и ты не сможешьь их повторить.

Аноним 06/02/23 Пнд 02:10:29 № 103079 14

>>102620
Больше дохлых тредов! Надо моче написать, чтобы слила. Но кажись такой функции на имиджбордах нет, поэтому этот тред должен умереть.

Ах да, я бы и от англояпонского голоса не отказался бы, лишь бы можно было нормально без ебли у себя запускать.

Аноним 06/02/23 Пнд 02:21:40 № 103103 15

>>102620
>>103079
Перекат нормальный делаете и всё.

Аноним 06/02/23 Пнд 02:25:12 № 103108 16

ТРАХАТЬ УБОРЩИКОВ
https://vocaroo.com/1YE0eLvSzO4w

Аноним 06/02/23 Пнд 02:31:41 № 103115 17

>>103103
>Перекат
>177 сообщений

Аноним 06/02/23 Пнд 02:56:47 № 103146 18

>>103079
вот гайд по японскому ттс, если будут вопросы спрашивай.
https://textbin.net/kfylbjdmz9

Аноним 06/02/23 Пнд 03:12:36 № 103185 19

изображение.png 33Кб, 1469x304

>>103146
Я бы удивился, если бы оно сработало с первого раза без ошибок.

Аноним 06/02/23 Пнд 04:01:04 № 103276 20

>>103185
У тебя была проблема во время выполнения строки `pip install -r requirements.txt`? Кинь скрин лога побольше, чтобы было видно последние строки.

Аноним 06/02/23 Пнд 04:03:20 № 103281 21

>>103276
Там в середине мой логин. Но ошибка максимум долбоёбская, вряд ли с ней можно что-то сделать, кроме как снести мою старую как говно мамонта ЛГБТ шинду и накатить что-то поновее.

Аноним 06/02/23 Пнд 04:11:50 № 103309 22

>>103281
Эта ошибка уже встречалось у двух человек. Просто следуй дальше по инструкции. И да у тебя не такой уж уникальный ник чтобы переживать об том что по нему можно задеанонить, но ты можешь просто его замазывать в следующий раз

Аноним 06/02/23 Пнд 04:42:39 № 103389 23

изображение.png 8Кб, 619x72

>>103309
>Просто следуй дальше по инструкции
Результат немного предсказуем.

Аноним 06/02/23 Пнд 15:14:01 № 103842 24

>>103389
Советую, сначало читать инструкции, а потом им следовать. Потому что там дальше по инструкции на 57 строчке написанно:
"Если у вас ошибки, то смотрите в повершел, и смотрите что пишут, если там ModuleNotFoundError: или AttributeError: То это значит что у вас не все модули скачались. Их можно докачать с помощью команды pip install "название модуля"..." В твоём случае надо написать `pip install librosa` если и это не поможет, то скачать через ссылку которая есть дальше по инструкции.

Аноним 07/02/23 Втр 13:15:06 № 105186 25

>>103842
>Советую, сначало читать инструкции, а потом им следовать.
Я программист до мозга костей, поэтому исполняю всё построчно. Скачивание директории помогло, спасибо. Хотя интересно конечно, что ему там не нравилось. Судя по попытке что-то сбилдить, ему нужны билдтулы из вижуалстудии...

Аноним 07/02/23 Втр 13:32:26 № 105205 26

а чего они у меня все тараторят? Есть какие-нибудь опции, чтобы успокоить их и замедлить, менять интонацию в предложениях и фразах.

Аноним 07/02/23 Втр 13:54:14 № 105232 27

>>105205
>замедлить
Duration
>>105205
>менять интонацию в предложениях
Phoneme Input и там вводи всякие ↑↓

Аноним 07/02/23 Втр 14:36:59 № 105270 28

>>105205
Модель для японского? Если да, то всё нормально, японцы всегда тараторят.

Аноним 07/02/23 Втр 14:38:43 № 105273 29

Бля, как вы генерите? У меня без впн не открывает, а с впн банят якобы за абуз фри версии.
Сгенерьте Джинкс, вот аудио
https://vocaroo.com/14gcLSyK7ecY

Аноним 07/02/23 Втр 15:46:51 № 105332 30

Добрый день, уважаемые господа. Пожалуйста, подскажите можно ли, и если да то как:
1. Генерировать русский голос (мужской, женский, детский)
2. Генерировать японский голос (мужской, женский, детский)

Аноним 07/02/23 Втр 16:15:35 № 105364 31

>>105332
>1. Генерировать русский голос (мужской, женский, детский)
Пока нету, нужно тренировать.
>>105332
>2. Генерировать японский голос (мужской, женский, детский)
Как говна в проруби, особенно женских.

Аноним 07/02/23 Втр 16:34:56 № 105383 32

>>105186
Сори, это мой первый гайд, поэтому там есть проблема со структурой. А пакет скорее всего не скачивался из-за проблем с виндой. У меня она 11.

Аноним 07/02/23 Втр 16:36:55 № 105386 33

>>105332
https://colab.research.google.com/github/snakers4/silero-models/blob/master/examples_tts.ipynb#scrollTo=0c29189f

Аноним 07/02/23 Втр 17:50:55 № 105487 34

2023-02-07 19-1[...].mp4 1950Кб, 1440x900, 00:00:06

Оно работает! Немного напильника.

Я тоже столкнулся с ошибкой >>103281 "Не удается найти указанный файл" если делать череp pip установку зависимостей командой pip install -r requirements.txt общим списком

Пошел посмотреть список модулей, которые по зависимостям требует VITS-Umamusume-voice-synthesizer, всего 22 пакета, на установке 12 пакета - pyopenjtalk - через pip (установщик пакетов Питона) как раз эта ошибка "Не удается найти указанный файл".

Остальные модули при установке по одному с конца списка ручным копированием названия в powershell поставились через pip без ошибок.

Пришлось скачать готовые папки с модулями pyopenjtalk через https://drive.google.com/drive/folders/1WY5kumfugiwYk-CJEU9eU2sEVAIOCqpr?usp=share_link и поместить их оба как в папку с виртуальной средой (venv) в Lib\site-packages так и в сам клонированный через git репозиторий VITS-Umamusume-voice-synthesizer.

Для получения ссылки на локальную интернет-морду в powershell
1. Запустил powershell от администратора
2. Перешел к папке с виртуальной средой через cd
3. Активировал скрипты командой .\название папки для виртуальной среды\Scripts\activate
4. Перешел к папке с VITS-Umamusume-voice-synthesizer через cd
5. Для её запуска использовал python3.exe .\app.py (у меня есть как и обычный старый 2-ой питон, если пробовать искать его через python.exe, так и python3.10.exe - поставленный из магазина Майкрософт, так и отдельный обычный Питон 3, который находится через python3.exe. У меня под Windows 10 работает и через обычный скачанный с сайта Питон 3 (python3.exe) и через Майкрософтовский (python3.10.exe).

Powershell еще сказала надо поставить через pip модуль tqdm, при выполнении pip install tqdm вижу:
WARNING: The script tqdm.exe is installed in 'C:\Users\bk\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\Scripts' which is not on PATH.
Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location

Пошел к доп. настройкам Windows, без задней мысли добавил везде где можно директорию со Скриптами в PATH.

Если не добавлять в PATH и пробовать запустить локальную вебморду в браузере и нажать Generate, получаю Error. Но после добавления в PATH и активации скриптов запускаю
python3.10.exe .\app.py
или
python3.exe .\app.py
получаю локальную вебморду http://127.0.0.1:7860/ - жму Generate и слышу заветное konnichi wa! (Каждый раз разное при генерации).

Записи лежат в wav в папке, про которую написано в гайде - да, надо открыть app.py и прописать в трех местах с 27 строки в параметрах dir=self.temp_dir вместо self.temp_dir название директории (папки), которую вы сами создаете и называете для хранения аудиозаписей, причем обратный слэш в конце названия может быть не обязателен, на своей машине я проверял запуск с названием этой папки со слэшом в конце и без него, замену названий проводил через Notepad++

Аноним 07/02/23 Втр 17:52:56 № 105490 35

>>105487
аватарку убери, чмо

Аноним 07/02/23 Втр 18:14:33 № 105522 36

>>105487
Я думаю я просто соберу контейнер без ненужной хуйни и просто залью, чтобы не ебаться с этим.

Аноним 07/02/23 Втр 18:17:38 № 105523 37

Что же, теперь когда VITS-Umamusume-voice-synthesizer работает и генерирует, возникает резонный вопрос: как ее настроить или натренировать на кастомном аудиопотоке чтобы получить собственного японского персонажа?

Аноним 07/02/23 Втр 20:37:34 № 105639 38

>>105523
Вот тут есть некоторая информация (а так же около 3000 готовых голосов)
https://huggingface.co/spaces/skytnt/moe-tts/discussions/17

Аноним 07/02/23 Втр 23:07:08 № 105887 39

> Luke, did I ever tell you about Ahsoka Tano? She was your father’s exotic teenage alien apprentice, a fine piece of jailbait from a more civilized age. She had the tightest body and the perkiest little breasts in the galaxy; barely legal in most systems.

> Anakin and I used to doubleteam her at the end of every successful campaign during the Clone Wars, and once in a while we’d even have the entire 501st run a train over her, part of official Jedi “training” of course. In time, she learned how to handle a meatsaber better than anyone in the Jedi Temple. She wore a miniskirt every day so we told her there were no panties in space, and since she was constantly doing acrobatics you’d get a glimpse of her orange pussy mid fight as she’d do a flip while slicing a B2 Super Battledroid in half. It was surreal.

> We taught her to grip her weapon backwards like a dildo and she constantly got captured by pirates and slavers almost every other day. It was ridiculous, like a constant porno Luke, you have no idea. And she was a good friend.

Аноним 08/02/23 Срд 00:22:21 № 106056 40

image.png 24Кб, 733x168

>>105639
В общем, как я понимаю, "Советский учебник по алхимии 3.0" не для слабых духом, да и только для видеокарт, и натренировать даже один голос на моем двухгиговом старом видеоведре, уже не говоря про CPU, невозможно в принципе.

Аноним 08/02/23 Срд 00:54:44 № 106088 41

>>106056
Почему ты так решил? Если что, потрейнить мог бы и я, у меня 3080Ti, должно хватить для голоса.

Аноним 08/02/23 Срд 01:15:12 № 106112 42

image.png 10Кб, 633x95

>>106088
>Почему ты так решил?
Потому что внутри train.py английским по черному написано:
"CPU training is not allowed." и рядом всякие assert torch.cuda.is_available() для Nvidia.

А из статьи на китайском ясно, что для моего AMDшного видеоведра никакой ROCm не светит, да и крепкий волос мудрый вождь нефритовый стержень запретил колдовать на процессоре.

Аноним 08/02/23 Срд 02:37:04 № 106168 43

>>106112
Ох нифига, ты читаешь код перед запуском?
Ладно, попробую у себя. Главное чтобы под шиндой работало.
Формат тренировочных данных кто-нибудь знает?

Аноним 08/02/23 Срд 07:44:05 № 106223 44

>>105273
Удали куки по сайту. Заходи в настройки браузера и ищи вкладку с куки, потом ищешь имя сайта в списке и жмёшь удалить, всё.
На самом деле это ещё задроченный вариант, может просто другой аккаунт зарегать можно.

Аноним 08/02/23 Срд 07:53:35 № 106224 45

>>106168
В датасете LJSpeech-1.1, например, идет метадата - csv таблица с названием wav и текстом рядом, и сами wav в папке.

А для собственного датасета должно быть wav конвертированное в 32kHz через питоний скрипт, положенное в папке dataset_raw

https://github.com/innnky/so-vits-svc/blob/32k/Eng_docs.md

Аноним 08/02/23 Срд 13:37:01 № 106410 46

Обмазался пакетами питона, удалил обычный parselmouth, поставил praat-parselmouth и все равно в итоге вся эта ебала so-vits-svc и не дизайнилась под тренировку своей модели на кастомном датасете wav через ЦПУ. Не видать мне заветного голоса покуда CUDA не пришла в мой дом.

Аноним 08/02/23 Срд 15:19:25 № 106543 47

>>102542 (OP)
Блин, что за ебаная шапка? Где мануал? Как вкатиться? Что делать?

Сделать им семпл голоса мечты? Как это работает?

Аноним 08/02/23 Срд 15:37:20 № 106561 48

>>106543
Шапка тут
>88212

Аноним 08/02/23 Срд 15:38:06 № 106563 49

>>106561
>>88212 (OP)
Фикс

Аноним 08/02/23 Срд 17:24:59 № 106704 50

image.png 17Кб, 603x205

>>106223
Куки легко чистятся, но эта хуйня не помогает. После первой попытки что либо сгенерить на сайте вылезает третий пик. Еще не пробовал другие впн.

Аноним 08/02/23 Срд 19:21:22 № 106919 51

>>106543
Да всё, закрыли лавочку. Три дня назад можно было до 5 кастомных голосов создать, а теперь нельзя.

Аноним 08/02/23 Срд 19:28:47 № 106945 52

>>106919
Хммммм, со старого аккаунта ещё можно создавать, значит либо смотрит на гугловскую привязку к телефону либо новые аккаунты теперь кастрированы, теперь только за деньгу.

Аноним 08/02/23 Срд 19:33:37 № 106957 53

Всё пиздец
Voice Lab is only available on paid tiers. Please subscribe, a free trial is available for Starter tier.

Аноним 08/02/23 Срд 19:42:28 № 106976 54

>>106957
Ну и прекрасно. Платная параша же. А теперь пошли трейнить на колабе с открытым кодом.

Аноним 09/02/23 Чтв 09:17:35 № 107665 55

>>106945
БЛЯЯЯЯЯЯЯЯЯЯЯЯЯЯ. У меня даже одного текстового запроса не вышло сделать. Сука.

Аноним 09/02/23 Чтв 23:46:06 № 108423 56

Чо так все сложна, нихуя не понимаю, когда запилят webui для голоса?

Аноним 10/02/23 Птн 00:28:19 № 108459 57

>>108423
Вебморда здеся - https://huggingface.co/spaces/skytnt/moe-tts
Проблема в том, что ее пишут азиаты (ебаные гуки, спасибо им за всё), судя по наполнению.

Аноним 10/02/23 Птн 23:31:57 № 109889 58

>>102542 (OP)
Дикторы-то хуй с ними, а вот голосовым актёрам и всяким там сэйю стоит пристрематься.

Аноним 11/02/23 Суб 02:02:17 № 110222 59

>>109889
До уровня сейю этим программам ещё срать и срать.

Аноним 11/02/23 Суб 07:51:16 № 110412 60

https://files.catbox.moe/e7dw81.mp4

Аноним 11/02/23 Суб 13:58:14 № 110678 61

https://vocaroo.com/1lMnkDDIEAvM

Аноним 11/02/23 Суб 14:34:15 № 110733 62

>>110678
Для глухих
>иди нахуй, сука, я твою маму ебал, ах.

Аноним 12/02/23 Вск 04:52:13 № 111839 63

https://rentry.org/AIVoiceStuff
https://rentry.org/AI-Voice-Cloning

Аноним 12/02/23 Вск 17:29:08 № 112683 64

>>111839
Так, вторая ссылка выглядит более перспективно. Спасибо!

Аноним 12/02/23 Вск 18:50:19 № 112901 65

>>111839
>https://rentry.org/AI-Voice-Cloning
Я так понял образец нада в утилиты кидать? Пишет файл без методанных иди нахуй. В основном окне только запись с микрофона.

Аноним 13/02/23 Пнд 04:21:20 № 114169 66

>>112901
Не угадал. Нужно закиинуть подготовленные wav (через скрипт в convert) в подкаталог в voices (назови сам).
Но это какая-то стрёмная хуйня, которая жуёт входные файлы каждый раз, поэтому генерация занимает больше 10ГБ врамы и идёт по 5 минут, лол. Качество... Ну явно не для русского, хотя оно пыталось, да. Впрочем, может это я засрал настройки. Вот короче результат на паре файлов из моего предыдущего набора с русским голосом из песни Саи.
https://voca.ro/1mZD3KEUH7ML

Аноним 13/02/23 Пнд 11:33:55 № 114403 67

>>114169
Бля, ну это кал. Даже FreeVc лучше.

Аноним 13/02/23 Пнд 12:48:33 № 114472 68

>>114169
Пара файлов это что, тренировка на датасете ровно из двух wav файлов?

Аноним 13/02/23 Пнд 13:59:33 № 114551 69

>>114403
На английском оно лучше. С русским да, пока везде беда.
>>114472
Пяти, если быть точным, где-то на минуту.

Аноним 13/02/23 Пнд 15:17:51 № 114702 70

>>114551
>Пяти, если быть точным
Этого хватает для полноценного датасета и получения годных результатов?

Аноним 13/02/23 Пнд 18:05:57 № 114955 71

>>114702
Там по сути нет датасета. И голос так себе. Ищем другие, более удобные варианты.

Аноним 16/02/23 Чтв 09:20:34 № 119127 72

>>105487
Голос он сожет подделать или только готовый?

Аноним 16/02/23 Чтв 10:47:01 № 119157 73

>>119127
То, что я заставил работать - это уже тренированные готовые модели для голоса.

В треде есть ссылки на проекты гитхаба, которые позволяют создать датасет (набор wav) и натренировать собственную модель. Для этого нужна CUDA и хорошая GPU от зеленых. Насчет AMD не знаю.

Аноним 16/02/23 Чтв 18:49:13 № 119710 74

>>119157
>натренировать собственную модель
См. выше, оно не тренирует, а жуёт каждый раз. Но да, типа подделывает. Но на русском получается УГ.
Про другие методы с тренировкой модели пока аноны не запускали.

Аноним 17/02/23 Птн 07:30:25 № 120689 75

>>119710
Если китайцы смогли, то и у нас получится

Аноним 18/02/23 Суб 02:11:06 № 122113 76

>>120689
Китайцев 1,5 лярда, нас в 10 раз меньше. Соответственно в 10 раз меьше мозгов, чтобы фонемы под русский починить да моделей натрейнить.

Аноним 23/02/23 Чтв 20:52:22 № 129455 77

>>105364
>Пока нету, нужно тренировать.
Можно подробнее? Какие мощности нужны, сколько данных для треннировки?

Аноним 24/02/23 Птн 04:50:01 № 129862 78

>>129455
В шапке ТТS треда должна быть инфа.
>>88212 (OP)

Аноним 26/02/23 Вск 00:28:06 № 131785 79

>>108459
она японская, другие языки не поддерживает.

Аноним 26/02/23 Вск 00:37:25 № 131799 80

>>131785
А стонать и визжать она умеет?
мимо

Аноним 26/02/23 Вск 00:44:13 № 131804 81

>>131799
А нарезать этих стонов с хентая и вставить в озвучку нельзя?
Тожемимо

Аноним 26/02/23 Вск 07:50:43 № 131949 82

>>131785
>другие языки не поддерживает
Да что ты говоришь...

Аноним 26/02/23 Вск 19:45:51 № 132679 83

>>131804
Для этого нужно просматривать тонны хентая в поисках нужного стона, и подгонять голоса разных актеров друг под друга.

Аноним 27/02/23 Пнд 21:38:05 № 134063 84

>>111839
А можно делиться итогами? Моделью голоса? Не каждому же с нуля ту же Эмму тренить?

Аноним 28/02/23 Втр 04:51:19 № 134480 85

>>132679
Каторжный труд

Аноним 01/03/23 Срд 09:19:52 № 135793 86

>>134063
конешн, для этого и тред создан

Аноним 02/03/23 Чтв 19:50:33 № 137167 87

1677775833472.mp4 56Кб, 334x358, 00:00:05

>>114551
> С русским да, пока везде беда.

Аноним 02/03/23 Чтв 21:47:13 № 137337 88

>>137167
Спасибо конечно, что последовал моему "гайду" и запустил Ксению, но я про обучение своим голосам. Плюс тут надо научится играть с эмоциями и прочим (вроде как возможно, но пока не тестил). И да, может, всё таки в TTS тред? А то два треда с одним предназначением.

Аноним 11/03/23 Суб 19:53:39 № 150974 89

В Эвеленлабс получаетсяя надо брать Стартовый пак для клонирования голоса?

Аноним 11/03/23 Суб 23:08:18 № 151315 90

>>150974
Нет, и бесплатного хватает для небольших тестов (по состоянию на январь, сейчас ХЗ).
А вообще, лучше в единый TTS тред >>88212 (OP)

Аноним 14/03/23 Втр 10:02:51 № 155101 91

>>102542 (OP)
А голос обэмы и бидона есть?

Аноним 14/03/23 Втр 16:38:54 № 155465 92

>>102542 (OP)
Кидайте контент

Аноним 26/03/23 Вск 20:38:46 № 184961 93

>>151315
Сейчас беслптано только вмроеннве голоса, клонирование только платно

Аноним 18/04/23 Втр 03:09:51 № 235725 94

>>137167
А детские есть голоса? У майкрософта в наборе онлайн ттс английские есть, русских пока не находил.

Аноним 18/04/23 Втр 03:28:02 № 235737 95

>>235725
Есть, адрес пиши свой, анончик. Или телегу.

Аноним 18/04/23 Втр 09:28:32 № 236004 96

>>235737
И че ты возбудился? Включи озвучку в эдже, на инглише девочки угарно читают, отправляй микросам пативен

Аноним 23/04/23 Вск 21:07:19 № 251694 97

>>137337
> что последовал моему "гайду" и запустил Ксению
Какую блядь Ксению? Каким гайдам? Ты ебанутый?

Аноним 23/04/23 Вск 21:14:03 № 251722 98

1682273643456.mp4 711Кб, 170x200, 00:00:39

>>235725
> А детские есть голоса?
Да хоть MLP.

Аноним 26/04/23 Срд 03:35:40 № 259414 99

>>251722
А что у неё с акцентом?

Аноним 26/04/23 Срд 14:22:29 № 260164 100

>>251722

Ракосель, уходи.

Аноним 26/04/23 Срд 15:57:27 № 260330 101

>>102542 (OP)
судя по оп-пику, звуки там однотипные. ну, знаете: ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ! ПОИ!

Аноним 26/04/23 Срд 16:44:25 № 260448 102

>>251722
У неё нет букв Р, потому что она испекла из них капкейки?

Аноним 26/04/23 Срд 17:12:23 № 260532 103

>>260448
тоутики

Аноним 26/04/23 Срд 23:39:23 № 261548 104

>>260448
Слышь, сука, ты на детей наезжать вздумал, педофил? Небось тилибонькаешь на детсадовцев? Картавят они ему, суке.

Аноним 26/04/23 Срд 23:53:46 № 261606 105

>>260448
Да небось их жапонки голос сделали, у них с Р плоблема.
>>261480
Так то всё что угодно оскорбляет кого-нибудь, красивые девушки оскорбляют жирух. Что теперь, дрочить на жирух?

Аноним 27/04/23 Чтв 09:54:55 № 262506 106

Так-то я бы тоже от детских голосов не отказался.

Аноним 27/04/23 Чтв 10:56:29 № 262593 107

>>262506
+++

Аноним 29/05/23 Пнд 21:15:10 № 329121 108

VID202305292113[...].mp4 10602Кб, 960x540, 00:01:30

С помщью какой нейросети пикрил сделали?

Аноним 29/05/23 Пнд 23:00:49 № 329434 109

>>329121
Эта нейросеть называется рандомное приложение в плеймаркете с эффектиками

Аноним 29/05/23 Пнд 23:02:51 № 329442 110

>>329121
>>329434
Бля, название треда не прочитал. Насчет звука без понятия

Аноним 01/07/23 Суб 22:54:26 № 381206 111

Двач КАК сгенерировать звуковую дорогу на основе загруженного голоса? Я точно знаю, что такое есть. Помню где-то в телеге видел мол грузите голос, желательно пол часа и нейронка озвучит им любой текст.

Я даже нашел какую-то статью на дзене где есть ссылка на колаб, но там какие-то беды с тензерфлоу-гпу, разбираться в падлу. Дайте ссылочбку бога ради.

Аноним 01/07/23 Суб 23:15:42 № 381286 112

>>381206
Уточню. Надо чтобы я загрузил голос, потом написал текст и она загруженным голосом озвучила этот текст.

Аноним 01/07/23 Суб 23:24:02 № 381315 113

>>381206
>ссылка на колаб
Оказывается репозиторий не обновлялся уже 4 года. Если 4 года назад такое могли делать, то щас то почему хуй найдешь???

Аноним 01/07/23 Суб 23:32:29 № 381340 114

Нужна простейшая нейронка для распознавания даже не речи, а звуковых паттернов, которые я вручную ассоциирую с текстом. В результате должно получиться что-то вроде караоке, но с дообучением распознавания озвучиваемого текста (поскольку этот текст будет озвучиваться неоднократно). Кроме пистона есть советы?

Аноним 16/08/23 Срд 09:27:40 № 457954 115

Облазил тырнеты, результаты меня нихуя не устроили.

Задача: на основе мужского голоса (.mp3 запись) преобразовать его в женский.
Нахуя: хочу аудиокнижки позаписывать, но, как положенно любому хикке, без привлечения иных лиц.

У меня впечатление, что ебучие чатики есть, генерация изображений есть, генерация музыки есть, а вот банальное преобразование одного голоса в другой -- хуй, да нихуя, особенно, на русском языке. Либо английский, либо японщина. И либо сосать хуй, либо как 15-20 лет назад Change Pitch и скорость менять в audacity, получая на выходе поеботу.

Аноним 16/08/23 Срд 17:50:39 № 458413 116

>>457954
Посмотри rvc из треда https://2ch.hk/ai/res/314948.html
Там дохера моделей.

Аноним 17/08/23 Чтв 04:07:10 № 459020 117

>>458413
В том-то и дело, что мне нужно не realtime, а на основе заготовленных записей.
Такого, я так понимаю, в принципе нет.

И да, моделей там дохера только для английского и японского, русского почти нихера нет.

Аноним 17/08/23 Чтв 18:23:43 № 459527 118

>>459020
>Такого, я так понимаю, в принципе нет.
RVC и SVC могут работать как в режиме реального времени, так и с отдельными файлами.
>русского почти нихера нет.
Обучи свои модель — будет.

Аноним 21/08/23 Пнд 05:59:42 № 462337 119

>>461500 (OP)
>>461500 (OP)
>>461500 (OP)

Назад Вверх Каталог Обновить

Искусственный интеллект

Тред закрыт.