!extend:checked:vvvvv:1000:512
Retrieval-based-Voice-Conversion──RVCについての情報交換とかのスレ
既存のボイスチェンジャーでは自然な萌ボイスには変換できなかった素人のおっさんの声を
このソフトなら簡単に変換できるといった物では有りません 自然な女声を産み出すには既存のボイスチェンジャーと同じくボイトレが必要です
wiki
https://seesaawiki.jp/rvc_ch/
※前スレ
なんJRVC部 2
https://fate.5ch.net/test/read.cgi/liveuranus/1684768900/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
なんJRVC部 3
■ このスレッドは過去ログ倉庫に格納されています
1今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ bf16-c/5M)
2023/08/09(水) 12:23:31.97ID:ZZLkq2YG0238今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 2388-bdWa)
2023/09/14(木) 23:55:59.14ID:hdTFHm4+0 colabの規約で禁止されていることに remote control such as SSH shells, remote desktops, remote UIsってあるからWebUI形式だと無料はアウトなんちゃうか
239今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 9a03-6jLp)
2023/09/15(金) 00:08:05.13ID:YzdNycHu0 ワイは最近whisper様が書き起こしたテキストを人力で全部聞きながら修正する仕事をずっとしとる
240今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 5a91-LPP2)
2023/09/15(金) 00:29:40.09ID:3MOyod1k0 >>235
長尺のwavをそのままRVCに放り込んでも無音部分で適度な長さに自動でカットしてくれる
自分で頑張って小分けにした音声とそのままお任せで処理してもらった音声で、学習結果に違いは感じなかったよ
長尺のwavをそのままRVCに放り込んでも無音部分で適度な長さに自動でカットしてくれる
自分で頑張って小分けにした音声とそのままお任せで処理してもらった音声で、学習結果に違いは感じなかったよ
241今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 2b44-Rd1d)
2023/09/15(金) 01:33:47.88ID:nPXZ8+z20 無音部分を削除するとクオリティが上がるとか散々言われてた気がするけどあれ嘘だったの?
242今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ b609-AD4a)
2023/09/15(金) 01:34:15.77ID:AacFhNjG0 笑い声ちゃんと変換できるモデルって作れた人いる?
243今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 2388-V02s)
2023/09/15(金) 05:05:12.96ID:YKGbqrcJ0 ワイも歌用でいろいろモデル作ったけど明らかな間奏部分とかは削ってるけど細かい部分は放置したまま学習させてもそんなに問題は感じないな
244今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 9a03-6jLp)
2023/09/15(金) 08:34:35.09ID:YzdNycHu0 無音部分削除で質向上は嘘かプラシーボ効果やと思うで
あまりに長尺をそのまま突っ込むと負荷が上がった気がするから適当に切るのはええと思うけど
あまりに長尺をそのまま突っ込むと負荷が上がった気がするから適当に切るのはええと思うけど
245今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 2b44-Rd1d)
2023/09/15(金) 08:39:31.22ID:nPXZ8+z20 誰も比較検証はしてないってことかな、ありがとう
246今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 5a91-LPP2)
2023/09/15(金) 11:18:17.68ID:3MOyod1k0 >>245
オレは数セット検証したぞ
で、オレの耳では違いは感じなかったんだよ
なので今は長めの無音だけ軽く切り詰めて、あとは丸ごと一本のまま放り込んでる
問題点があるとすれば、CPUの性能が低いと下処理にやや時間がかかるってぐらいか
正直、音声小分けセットを作るのに時間かけるより、用意する音声パターンの吟味とかに時間かけるほうが有意義だとは思う
そのぶん何トライも出来るしな
オレは数セット検証したぞ
で、オレの耳では違いは感じなかったんだよ
なので今は長めの無音だけ軽く切り詰めて、あとは丸ごと一本のまま放り込んでる
問題点があるとすれば、CPUの性能が低いと下処理にやや時間がかかるってぐらいか
正直、音声小分けセットを作るのに時間かけるより、用意する音声パターンの吟味とかに時間かけるほうが有意義だとは思う
そのぶん何トライも出来るしな
247今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (オイコラミネオ MM63-BMcJ)
2023/09/15(金) 12:33:36.14ID:yqxK/vrdM ワイも最初だけだな神経質に加工してたのは
違いがわかるような差があるように聞こえなかった
違いがわかるような差があるように聞こえなかった
248今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 9a03-6jLp)
2023/09/15(金) 14:07:35.62ID:YzdNycHu0 https://rentry.co/z6baa
テキストからの合成音声の学習colab(結果をVOICEVOX的なGUIアプリで使える)を共有するで。
完全に自己責任で頼む。9エポックとか回して試してみたけどそれなりの質になった。やがcolab無料枠の制限がきつくてあんま試行錯誤できてない。
誰かローカルで動いたら教えてくれ。
テキストからの合成音声の学習colab(結果をVOICEVOX的なGUIアプリで使える)を共有するで。
完全に自己責任で頼む。9エポックとか回して試してみたけどそれなりの質になった。やがcolab無料枠の制限がきつくてあんま試行錯誤できてない。
誰かローカルで動いたら教えてくれ。
249今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 0b54-SjEv)
2023/09/15(金) 14:20:05.74ID:q5hY8CF30 笑い声は本当に難しい
というか納得のできるものができるのだろうか
というか納得のできるものができるのだろうか
250今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 5a91-LPP2)
2023/09/15(金) 20:38:38.36ID:3MOyod1k0 あと巻き舌も
ぶぅるるるるるぁぁあ!が
ぶぅぅぁぁあああああ!にしかならん
ぶぅるるるるるぁぁあ!が
ぶぅぅぁぁあああああ!にしかならん
251今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 1a88-erq7)
2023/09/15(金) 21:02:52.60ID:hDnGBzNu0 >>249
リアタイでもSP404に笑い声入れておくとかそっちの方で良いのではと思っちゃった
リアタイでもSP404に笑い声入れておくとかそっちの方で良いのではと思っちゃった
252今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f91-ISqr)
2023/09/16(土) 01:12:45.13ID:2ygErz3I0 それは解決にはなってねーんだよなー
253今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f03-9C00)
2023/09/16(土) 09:42:02.95ID:hhVIHxWH0 TTS舐めてたけどすごいな。
RVCじゃ学習不可能な、喋り方の癖とかイントネーションも学習してしゃべってくれる。
RVCじゃ学習不可能な、喋り方の癖とかイントネーションも学習してしゃべってくれる。
254今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ff38-A5lE)
2023/09/16(土) 19:17:31.84ID:mXPpJsX80 最近はじめたんですが RVCで学習したデータをTTSで読み上げさせたいのですが
ローカルでやる方法とか解説してるサイトないでしょうか?
google colab使うVG WebUIの解説しか見つからなくて・・・
ローカルでやる方法とか解説してるサイトないでしょうか?
google colab使うVG WebUIの解説しか見つからなくて・・・
255今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f03-9C00)
2023/09/16(土) 19:48:08.61ID:hhVIHxWH0256今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ff38-A5lE)
2023/09/16(土) 20:18:58.09ID:mXPpJsX80257今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f03-9C00)
2023/09/16(土) 20:45:34.35ID:hhVIHxWH0 >>256
それについてはとりあえずREADMEを読んでとしか言えんな
別にRVCでTTS結果を変換しただけなら、VOICEVOXなりCOEIROINKなりボイロなりで読み上げさせた音声を保存して、それをRVCで自分のモデルに変換すればええだけやから、
それでええんとちゃう?
それについてはとりあえずREADMEを読んでとしか言えんな
別にRVCでTTS結果を変換しただけなら、VOICEVOXなりCOEIROINKなりボイロなりで読み上げさせた音声を保存して、それをRVCで自分のモデルに変換すればええだけやから、
それでええんとちゃう?
258今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ff38-ome1)
2023/09/16(土) 21:04:56.25ID:mXPpJsX80259今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f91-ISqr)
2023/09/16(土) 21:05:08.86ID:2ygErz3I0 >>256
RVCのモデルを直接TTSで話させることは現状できない
基本的にはTTSで作った音声ファイルをRVCで読ませる、もしくはTTSソフトと連結させて変換という流れになる
上のRVC_TTSはgitとPython必要だし若干敷居高いよ
RVCのモデルを直接TTSで話させることは現状できない
基本的にはTTSで作った音声ファイルをRVCで読ませる、もしくはTTSソフトと連結させて変換という流れになる
上のRVC_TTSはgitとPython必要だし若干敷居高いよ
260今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3ffb-YZsW)
2023/09/17(日) 01:46:56.39ID:m7Dz76CB0 VOICEVOXをYamaha SYNCROOM Driverに出力させてVCClientで受け取って変換する
このやり方で普通に失敗した
このやり方で普通に失敗した
261今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f03-9C00)
2023/09/17(日) 09:50:05.32ID:LXvHKz6n0 ESPNetで学習した好きなTTSモデルをVOICEVOXで使えるようにするやつあったんやな
https://github.com/voicevox-bridge/bridge-plugin
ただアクセント調整はできても、ボイボみたいな細かい音高調整はできないっぽいけど
https://github.com/voicevox-bridge/bridge-plugin
ただアクセント調整はできても、ボイボみたいな細かい音高調整はできないっぽいけど
262今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f28-7CbB)
2023/09/17(日) 13:33:26.09ID:hxylQhpu0 >>255
これをwsl2のdockerで動くようにできたよ
これをwsl2のdockerで動くようにできたよ
263今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3fa9-9EYQ)
2023/09/17(日) 15:34:16.17ID:cKBmffle0 他の人の声を削除するのめんどくせーよ
264今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f28-7CbB)
2023/09/17(日) 16:48:21.93ID:hxylQhpu0265今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f88-YZsW)
2023/09/17(日) 17:40:22.59ID:ovb9DOCb0 いまいち全貌を理解してないんだが G_xx.pthとD_xx.pthがあれば再学習できるの?
266今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f03-9C00)
2023/09/17(日) 18:22:40.76ID:LXvHKz6n0267今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f88-YZsW)
2023/09/17(日) 18:46:59.01ID:ovb9DOCb0268今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f03-9C00)
2023/09/18(月) 13:21:26.66ID:z6ukpkqF0 TTS学習のノウハウがあまり見つからない上に、日本のオープンソースの技術者たちは悪用を禁止するために意図的に秘匿してる感じがあって、なかなか分からん
269今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 8fef-BW/R)
2023/09/18(月) 14:19:40.68ID:A7oCqUUh0 ジャップのOSSコミュニティーは昔から閉鎖的なんや
270今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f28-7CbB)
2023/09/18(月) 21:01:23.13ID:TXpN1mUx0 >>144のVALL-E-Xの奴もwsl2用のdockerにできたよ
試してみたけど、アクセントの付き方がランダムになってガチャ感が増しているように感じる
モデルも作れるしちょっと動かすのは結構面白いかもしれない
試してみたけど、アクセントの付き方がランダムになってガチャ感が増しているように感じる
モデルも作れるしちょっと動かすのは結構面白いかもしれない
271今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f28-7CbB)
2023/09/18(月) 21:28:42.72ID:TXpN1mUx0272今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 8fc3-l3so)
2023/09/19(火) 02:33:52.94ID:Jb9cE9eC0 w( ̄Д ̄;)wワオッ!!
273今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (JP 0Hcf-I0G1)
2023/09/19(火) 07:02:09.35ID:7tuUHeJOH SteamのDegital Mateってアプリがワークショップから例の声優4000人分のデータセット落とせて、かつchatGPTやpoeとも連携できるから生成させた文章を好きな声優に読ませることができる。発音はアレやが。
poeで作ったエロ文章読ませるの捗るで。
poeで作ったエロ文章読ませるの捗るで。
274今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f03-9C00)
2023/09/19(火) 07:55:48.68ID:TIorJQmS0 >>273
データセットだけ欲しいんやけど落とせんの?
データセットだけ欲しいんやけど落とせんの?
275今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (オッペケ Sr23-hKjy)
2023/09/19(火) 16:56:46.57ID:5kBiNpI0r RVCの学習てワイの1660tiでもできるんか?
リアルタイム変換とかは興味無い
リアルタイム変換とかは興味無い
276今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 0f54-ISqr)
2023/09/19(火) 18:50:47.32ID:EQNMhHc20277今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (オッペケ Sr23-hKjy)
2023/09/19(火) 20:07:23.09ID:qiWu/7dcr278今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (オッペケ Sr23-hKjy)
2023/09/19(火) 20:07:52.51ID:qiWu/7dcr279今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (オッペケ Sr23-hKjy)
2023/09/19(火) 20:09:34.33ID:qiWu/7dcr なんか連投なったわ
280今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 0f5b-Z5H/)
2023/09/19(火) 21:52:50.74ID:ul1qToFJ0 こういう学習系ってVRAMの容量が正義なんだよな?
4060tiは16GBモデルがあるけど、この分野に関して言えば12GBの4070tiよりも優れてるってことでいいの?
4060tiは16GBモデルがあるけど、この分野に関して言えば12GBの4070tiよりも優れてるってことでいいの?
281今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 8f2d-POt3)
2023/09/19(火) 22:00:53.09ID:hDP/IhpI0 はい
282今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 0f5e-Mp0W)
2023/09/20(水) 01:36:06.11ID:9IZ9WXSb0 金払うならGoogleに金払ってcolab使えばいいんじゃねと思うけど
283今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (アウアウアー Sa8f-ip4Y)
2023/09/20(水) 02:21:48.16ID:ARS3HhhRa 自作のをVCで試したらダウナー系は良い感じだけど明るいキャラのはなんか変って言われたけど、自分の喋り方が暗いだけなのか出来が悪いのかこれもう分かんねぇな
284今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 7fe9-Z5H/)
2023/09/20(水) 07:21:22.49ID:7Wl+xFdR0285今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3fe8-dG/o)
2023/09/20(水) 07:29:40.21ID:Q+H8Bfsh0 例えば流行りのanimatediffで解像度大きくしようとしたら12GBとか簡単に溢れるしsdxlの学習なんかもギリいけるってだけで微妙だし物理的に大きい方が正義って事じゃない?
最近のドライバは溢れた分をメインメモリで補うようになってるけどクッソ遅くなるし
最近のドライバは溢れた分をメインメモリで補うようになってるけどクッソ遅くなるし
286今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3fe8-dG/o)
2023/09/20(水) 07:32:05.35ID:Q+H8Bfsh0 あ、すまんRVCのスレだったわ
バッチサイズ増やせるだろうけど差は埋まるんやろか
バッチサイズ増やせるだろうけど差は埋まるんやろか
287今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 0f7b-YZsW)
2023/09/20(水) 08:16:57.93ID:PLUunn5S0 なんかRVCの学習ってバッチサイズで速度の差をあまり感じないんやけど気のせいやろか
288今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 7f54-ISqr)
2023/09/20(水) 16:46:47.87ID:NHgDorxD0289今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (テテンテンテン MM4f-6al4)
2023/09/20(水) 21:36:06.14ID:o+lFK5YRM その情報はほんと欲しいけど見つからない
8GBの3070と16GBの4060
目標30-108epくらいとしてcuda量が早いのかメモリ量でバッチ盛るのが早いのか
8GBの3070と16GBの4060
目標30-108epくらいとしてcuda量が早いのかメモリ量でバッチ盛るのが早いのか
290今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ササクッテロ Sp23-06IJ)
2023/09/20(水) 22:29:25.57ID:OH4cso4Mp rmvpeの学習って0813のアプデから使えるようになったのか?
誰か試した人いる?
誰か試した人いる?
291今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f88-YZsW)
2023/09/21(木) 02:28:25.30ID:Yhjayyuk0 RVC系って音声ファイル作る方が時間かかりすぎてトレーニング速度は別に気にならんなぁ
まぁ早けりゃ越したことはないけど
まぁ早けりゃ越したことはないけど
292今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f91-9C00)
2023/09/21(木) 08:24:25.58ID:a4uxVi7Z0 >>290
いつも使っとるで。
正直比較丁寧にしたわけじゃないからあんま分からんけど、すくなくとも推論だとrmvpeのほうがharvestより質が良いから、
まあ質悪くはならんやろって気持ちで学習でもrmvpe使っとる
いつも使っとるで。
正直比較丁寧にしたわけじゃないからあんま分からんけど、すくなくとも推論だとrmvpeのほうがharvestより質が良いから、
まあ質悪くはならんやろって気持ちで学習でもrmvpe使っとる
293今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f88-YZsW)
2023/09/21(木) 09:06:36.88ID:Yhjayyuk0294今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ササクッテロ Sp23-06IJ)
2023/09/21(木) 10:36:12.78ID:eTsH8dPFp >>292
さんがつ 劇的な変化はない感じか とりあえず試してみる
さんがつ 劇的な変化はない感じか とりあえず試してみる
295今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f91-ISqr)
2023/09/21(木) 12:50:59.69ID:UiTVt1Ey0296今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 0f54-06IJ)
2023/09/21(木) 17:05:15.47ID:dWLQkDWa0 学習の時のrmvpe_gpuとrmvpeってどう違うんや?
297今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 0f69-Mp0W)
2023/09/21(木) 18:54:25.07ID:65H+hmnf0 gpuの方細かい設定できた気がするけどよくわからん
298今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3f91-9C00)
2023/09/22(金) 19:49:43.02ID:GzF5zbDN0 現状オープンな日本語TTSで一番質高いのは、vitsで44.1khzでpyopenjtalk_prosodyなんかなあ。
VOICEVOXとかもオープンソース開発やっとるなら、モデル構造や学習方法込みでオープンにしてもらいたいもんや。
VOICEVOXとかもオープンソース開発やっとるなら、モデル構造や学習方法込みでオープンにしてもらいたいもんや。
299今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 4a91-PB4I)
2023/09/24(日) 09:40:43.65ID:p01/8MUj0 ddpnさんのRVC、ddpnさん自身が「もう飽きてメンテナンスしません」って言ってて草だった
まあ更新頻度とか見るとそうよな
まあ更新頻度とか見るとそうよな
300今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 6ae9-3l4J)
2023/09/24(日) 12:21:56.34ID:xymq6w1F0 草ァ!
301今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワントンキン MMfa-6HmK)
2023/09/24(日) 17:21:50.87ID:jLjDk9UKM 面白そうなスレ
302今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 4a91-Qv+N)
2023/09/25(月) 00:30:42.22ID:EG7we7n10 v3全然来ないし飽きたわ
続報ないとダレるよね
続報ないとダレるよね
303今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 4a91-y4e6)
2023/09/25(月) 09:34:32.37ID:3id40K340 TTS学習やろうぜ
304今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ e3d4-NsvJ)
2023/09/25(月) 11:49:40.21ID:osXyX5Zv0 >>303
いま主流のTTSって何なんや
いま主流のTTSって何なんや
305今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ e37c-GA9g)
2023/09/25(月) 14:31:59.68ID:yYHhOdR80 TTSやってる人ってどういう楽しみ方してるの?歌とかと違っていまいちどういう楽しみ方があるのかわかんねえ
306今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 4aa9-R73r)
2023/09/25(月) 14:54:35.99ID:tb0bjiGv0 TTSは台詞データも作る必要あるのがめんどい
307今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 8ebe-j351)
2023/09/25(月) 15:49:19.02ID:xcdqqY6c0 RVC WebUIをColabで使っとるんやが、rmvpeのボタンがあらへんねん、どうやったらええんかの
308今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ffba-zgip)
2023/09/25(月) 16:12:01.59ID:oeR3M6fh0 まだまだ学習させたいデータが山ほどあるからしばらくはRVC飽きずに続けられる
309今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ffba-zgip)
2023/09/25(月) 16:15:06.54ID:oeR3M6fh0 TTSは今更やがちんちん亭イズナおもろいで
https://nico.ms/sm42549303?ref=other_cap_off
https://nico.ms/sm42549303?ref=other_cap_off
310今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 4aa9-R73r)
2023/09/25(月) 16:15:27.51ID:tb0bjiGv0 音が出なくなるの改善してほしいね
311今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 4aa9-R73r)
2023/09/25(月) 17:57:17.34ID:tb0bjiGv0312今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 23cf-VEVW)
2023/09/25(月) 18:40:28.68ID:PVJw8Vb10 >>311
なにこれ便利やん
なにこれ便利やん
313今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 4a3f-cELs)
2023/09/25(月) 19:12:50.22ID:mEaf+zvE0314今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ c7cb-em0E)
2023/09/25(月) 19:57:49.68ID:ACs5hCrm0 飽きるってほどまだぜんぜん人工いないけどな。。。
まぁある程度の技術必要なのが参入障壁になっているな。
まぁある程度の技術必要なのが参入障壁になっているな。
315今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ c7cb-em0E)
2023/09/25(月) 19:57:57.55ID:ACs5hCrm0 人口、な。
316今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 8e36-6znh)
2023/09/25(月) 20:39:11.27ID:hZGBi6OG0 >>313 有料や rmvpe自体は落とせたんやけど、インターフェースにボタン付ける方法がわからんねん、ローカル版にはボタン付いとるけん、できるはずや思うんやけどなー。
317今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 8e36-6znh)
2023/09/25(月) 20:48:41.25ID:hZGBi6OG0 思うんやけどな、学習用wavの「無音部分」てのはデータ的に0dbてことちゃうやろか?データ0やない限りどんな微細な信号も学習してしまうんやないやろか?ソフトのほうでゲート処理とかしとらん思うんやけどな、せやさかい「無音」ちゅうたら具体的にゼロデシ書き込むことちゃうんやろか?
318今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 4a91-Qv+N)
2023/09/25(月) 21:01:45.69ID:EG7we7n10319今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (アウアウアー Sa96-fO5Z)
2023/09/25(月) 22:04:49.33ID:v4BS+qWBa V3はより少ないデータで精度が高くなれば良いな
ゲームのサブキャラの声とか素材が少なすぎてキツイ
ゲームのサブキャラの声とか素材が少なすぎてキツイ
320今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 2b86-/va4)
2023/09/26(火) 04:01:06.87ID:mQZ6tTvd0 というかTTSに関してはなんもわからん
ここまでで出てきたの248のMYCOEIROINKのやつぐらいじゃね
ここまでで出てきたの248のMYCOEIROINKのやつぐらいじゃね
321今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ a718-6znh)
2023/09/26(火) 07:57:07.42ID:Ik92ufEk0 思うんやけどな、学習用wavの「無音部分」てのはデータ的に0dbてことちゃうやろか?データ0やない限りどんな微細な信号も学習してしまうんやないやろか?ソフトのほうでゲート処理とかしとらん思うんやけどな、せやさかい「無音」ちゅうたら具体的にゼロデシ書き込むことちゃうんやろか?
322今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 8a03-PB4I)
2023/09/26(火) 08:20:45.59ID:2yjcuj100 TTS、とりあえずCOEIROINKがVITS(音素分解がpyopenjtalk_prosody)で、
かなりのユーザーが(MYCOEIROINKとして)自分で学習してて質もそれなりによさそうなので、まずはそれでいろいろ実験しとる
やけどVITS自体2年前のやつやから、VITS2やら新しいのはいろいろありそうや:
https://github.com/tonnetonne814/unofficial-vits2-44100-Ja
https://github.com/tonnetonne814/SiFi-VITS2-44100-Ja
https://github.com/fishaudio/Bert-VITS2
かなりのユーザーが(MYCOEIROINKとして)自分で学習してて質もそれなりによさそうなので、まずはそれでいろいろ実験しとる
やけどVITS自体2年前のやつやから、VITS2やら新しいのはいろいろありそうや:
https://github.com/tonnetonne814/unofficial-vits2-44100-Ja
https://github.com/tonnetonne814/SiFi-VITS2-44100-Ja
https://github.com/fishaudio/Bert-VITS2
323今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 2e54-Qv+N)
2023/09/26(火) 09:11:05.13ID:WfcSH9x+0 翻訳すると「ピョペンジトーク」にされてしまうpyopenjtalk(Python open J talk)
でもオレもピョペンて呼んでる
でもオレもピョペンて呼んでる
324今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 2b86-/va4)
2023/09/26(火) 10:49:29.77ID:mQZ6tTvd0325今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (スフッ Sdaa-LetX)
2023/09/26(火) 11:18:32.59ID:cJHO4IZrd 音声を文字起こしするの面倒なんだが、音声データ読み込ませたら自動でやってくれるものとかってある?
326今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 27b8-MWZN)
2023/09/26(火) 13:33:07.42ID:tR7vNqG30 亜種的ないろんな技術があるみたいだけど、音質がいいやつがどれなのかわからんなあ
327今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (JP 0Hb6-j351)
2023/09/26(火) 13:49:45.74ID:CHHSt44uH 文字起こしはwhisper使えばええ
とりあえず上のVITS2日本語の改良版webuiみたいなのを作ろうとしとるから期待せんで待っといてや
とりあえず上のVITS2日本語の改良版webuiみたいなのを作ろうとしとるから期待せんで待っといてや
328今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 5354-2/Ti)
2023/09/26(火) 23:04:23.87ID:vsGatttY0 RVCで歌わせるとロングトーンで必ず歯医者のドリルみたいな高音が鳴ってるんだけどなぜだろう ロングトーン以外はならん
329今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 5354-2/Ti)
2023/09/26(火) 23:20:45.37ID:vsGatttY0 そもそも変換前のボーカル音源に音入ってたわ ボーカル抜く時に楽器の音が一緒にくっ付いてきとるのかね
330今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 8ee8-DCGx)
2023/09/27(水) 00:53:19.77ID:sgFae/wi0 初心者なんですが、ニュースZEROでやってた様な生成って何を導入すると良いのでしょうか?
331今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 4a91-Qv+N)
2023/09/27(水) 01:28:09.02ID:mNuARxLX0 誰もがその番組を見てるわけではない
せめて『ある番組で○○を○○するような特集をやっていて』みたいに最低限番組内容を説明したまえよ
せめて『ある番組で○○を○○するような特集をやっていて』みたいに最低限番組内容を説明したまえよ
332今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 6a4b-MGWr)
2023/09/27(水) 05:14:31.94ID:/L2p+vjs0333今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (アウアウアー Sa96-fO5Z)
2023/09/27(水) 11:51:57.68ID:UiuP1x4ea こういう癖強思想の物にRVC使われると規制呼びそうで嫌だな
334今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 4aa9-R73r)
2023/09/27(水) 12:13:45.22ID:Zm9b4xYe0 >AIについて、「日本俳優連合」(東京)は6月、「表現の模倣・盗用を安易に促し、職域を侵害する恐れがある」とした提言を発表。30条の4の運用を見直し、AIが学習するデータは著作者が許可したものだけにすることなどを求めた。
いやどす
いやどす
335今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ e39e-GA9g)
2023/09/27(水) 15:06:54.57ID:VdC++Qjl0 モノマネ芸人と何が違うんだよとはちょっと思うわ
336今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (スップ Sdaa-ImxL)
2023/09/27(水) 15:17:58.10ID:vW6MrXRgd いや顔出しして明らかにモノマネと分かるのは違うだろうし、素人のドヘタクソな演技で出まわられるのも迷惑だしな
337今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 9354-Qv+N)
2023/09/27(水) 15:22:35.56ID:rAVLMmyI0 誰しもが簡単に出来てしまう時点で特殊能力であるモノマネとは違う
そして各国でなりすまし犯罪による被害も出ている
そのうえ現在判別方法がない
なんらかの対策を練る必要があるのは当たり前のこと
そして各国でなりすまし犯罪による被害も出ている
そのうえ現在判別方法がない
なんらかの対策を練る必要があるのは当たり前のこと
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 中国、新たなパンダ貸与に前向き 日本との共同保護「歓迎」 [蚤の市★]
- 【ラジオ】永野芽郁、田中圭との不倫疑惑後初の『ANNX』で謝罪「誤解を招くような行動…反省」「本当にごめんなさい」★10 [Ailuropoda melanoleuca★]
- 【競馬】3冠牝馬・リバティアイランドの安楽死 処置が施される直前の川田騎手との絆を示す写真に悲痛 「胸が張り裂けそうだ」 [冬月記者★]
- 【ラジオ】永野芽郁、田中圭との不倫疑惑後初の『ANNX』で謝罪「誤解を招くような行動…反省」「本当にごめんなさい」★9 [Ailuropoda melanoleuca★]
- 「水道水で食中毒」14人が下痢や腹痛などの症状を訴え 「カンピロバクター」を検出 群馬・神流町 [少考さん★]
- 昭和が始まって100年 幸福度が高かった・低かった年代は… [少考さん★]
- 大阪万博のシャトルバス(自動運転)、運転手が停止ボタンを押したのに急に前進、接触事故 [931948549]
- るびーちゃーん!はーい!なにが好き?チョコミントよりお🏡♡
- コンマで転生先を選んでね→
- 国民「1人4万円の給付より食料品の消費税をゼロにしろ!」 識者「その場合食料品を年200万円買ってないと給付より損だが?」 国民「ぐぬぬ」 [597533159]
- 首を吊って3日経ってるけど未だに死ねない😭
- 【石破正論】消費税減税をした国で実際に効果はあったか?→物価はむしろ上がりかえって貧困率が高まる可能性 [709039863]