!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
スレ立てのときは↑の!extend::vvvvv:1000:512を3行ぐらいに増やしてな
RVCとTTSとかの情報交換とかのスレ
ボイスチェンジャーで誰でも完璧に別人になりきることはできません。ボイストレーニングが必要です。
wiki: https://seesaawiki.jp/rvc_ch/
前スレ
なんJRVC部★7
https://fate.5ch.net/test/read.cgi/liveuranus/1711873736/
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
探検
なんJRVC部★8
レス数が1000を超えています。これ以上書き込みはできません。
1今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 762d-nMe1)
2024/07/04(木) 19:15:09.86ID:pO0RXlJX0952今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ f77d-yioi)
2024/09/18(水) 15:11:43.02ID:Jj1Vq5j60953今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ f77d-yioi)
2024/09/18(水) 15:13:25.33ID:Jj1Vq5j60 サブスク嫌いだから買い切りがいいな
954今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ bf25-y7MN)
2024/09/18(水) 18:10:16.21ID:ACaPmGzV0 金払ってもよくてとりあえずボイチェンで喋りたいってだけならたしかにスーパートーンでええな
ただ使い分けってやつやろ。どちらが正解ってもんでもないような
ただ使い分けってやつやろ。どちらが正解ってもんでもないような
955 警備員[Lv.4][新芽] (ワッチョイ bff8-18DD)
2024/09/18(水) 18:31:50.59ID:tsInOEjC0 スーパートーンって金課金しても使える声が増えるだけでしょ?
無課金で十分じゃないか?
そんなに課金ボイスだけクオリティ違うの?
無課金で十分じゃないか?
そんなに課金ボイスだけクオリティ違うの?
956今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 7f93-q3Ad)
2024/09/18(水) 18:41:22.66ID:DgOAudHN0 スーパートーンめちゃくちゃ機械的な音になるんだけど
二昔前のボイチェンみたいな
クオリティではRVCの足元にも及ばないと感じたけど、みんなの褒め方を見るにこれは環境か設定の問題なのかな
二昔前のボイチェンみたいな
クオリティではRVCの足元にも及ばないと感じたけど、みんなの褒め方を見るにこれは環境か設定の問題なのかな
957今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ b730-YZzR)
2024/09/19(木) 07:11:07.36ID:YXV02Opr0 ここで質問する限りはスーパートーンがおすすめ
958今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 7788-tqxq)
2024/09/19(木) 10:56:52.31ID:3dQl3rQm0 韓国ではどうか知らないが日本ではステマは違法だぞ
959今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ブーイモ MM8f-q3Ad)
2024/09/19(木) 12:04:26.34ID:WMK8v9vSM こんな過疎界隈でそんな排他的にならんでもとは思う
960今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 7f81-i9xh)
2024/09/19(木) 12:56:50.41ID:bON1LQu60 RVC部だっつってんのに
学習も出来ないゴミのステマが並んでたらそら気持ち悪いと思うやろ
学習も出来ないゴミのステマが並んでたらそら気持ち悪いと思うやろ
スーパートーンやたら推すレス製作者のステマだろ
いい加減しつこい
いい加減しつこい
よく考えたら製作者じゃないな、信者か
信者にしてもしつこいしスレタイ読めないのには変わりない
信者にしてもしつこいしスレタイ読めないのには変わりない
963今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ff8f-y7MN)
2024/09/19(木) 20:03:00.21ID:5zzSiVEw0 結局、リモートデスクトップでtensorflowがおかしくなるので、Deep Speakerを使うのをあきらめた。
tensorflowはだめだ。PyTorchで同等のものを探すことにする。
tensorflowはだめだ。PyTorchで同等のものを探すことにする。
964今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 9f91-4p2y)
2024/09/19(木) 20:07:47.77ID:Tz329eWM0 柔らかく構ってあげてはいるけどさすがにそろそろうざい、スーパートーン信者
965今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ b713-i9xh)
2024/09/20(金) 03:06:07.65ID:9FRYvsu50 好きな声学習できない時点でここの人からしたら論外でしょ
966 警備員[Lv.31] (ワッチョイ f717-3vlU)
2024/09/20(金) 05:15:52.11ID:h0DGpgX10 スーパートーンスレを立ててあげよう
967今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 9f7f-Vg1L)
2024/09/20(金) 05:33:43.34ID:AdY8uF/E0 >>965
サブスクどうこう以前にホントそれに尽きるよ
サブスクどうこう以前にホントそれに尽きるよ
968今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ d71e-lmmT)
2024/09/21(土) 10:31:51.82ID:fwkPqPp30 GPT-SoVITSとかBert-VITSの話もここでいいのかな
Bert-VITSはわかりやすいけど、GPT-SoVITSのモデル→リファレンス音源→合成音声の仕組みがわかったようでわからない
モデル自体を特定の話者で学習してもリファレンス音源の話者にかなり引っ張られるというか…でもここを揃えるとせっかく学習した話者に同じような内容しか喋らせられない…みたいにならない?
そもそもモデルは特定の話者というよりは、喋り方のトーンを学ばせて、話者の個性はリファレンス音源で調整するということなのかな?
Bert-VITSはわかりやすいけど、GPT-SoVITSのモデル→リファレンス音源→合成音声の仕組みがわかったようでわからない
モデル自体を特定の話者で学習してもリファレンス音源の話者にかなり引っ張られるというか…でもここを揃えるとせっかく学習した話者に同じような内容しか喋らせられない…みたいにならない?
そもそもモデルは特定の話者というよりは、喋り方のトーンを学ばせて、話者の個性はリファレンス音源で調整するということなのかな?
969今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ d71e-lmmT)
2024/09/21(土) 12:21:33.31ID:fwkPqPp30 あと、どのリファレンス音源が推論したいテキストにうまくハマるかの予想ができないのも辛い…
970今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 177d-yioi)
2024/09/21(土) 12:36:43.10ID:rT18SZBV0 頭でっかちな机上の空論
971今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 1728-gFYT)
2024/09/21(土) 13:19:06.61ID:+zGhZWzF0 >>968
リファレンス音声でやりたいことはsbv2のスタイル指定に近い
基本的には学習データと同じ話者で、出力音声を寄せたい特徴的な感情表現・話し方(冷静に, 怒ってる声で, ささやいて等々)をした音声を入力する
リファレンス音声でやりたいことはsbv2のスタイル指定に近い
基本的には学習データと同じ話者で、出力音声を寄せたい特徴的な感情表現・話し方(冷静に, 怒ってる声で, ささやいて等々)をした音声を入力する
972今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (オッペケ Srcb-lmmT)
2024/09/21(土) 14:18:31.39ID:PbSX+OyTr >>971
でも例えばGPT-SoVITS-v2-240821で提供されている事前学習モデルを使って、男性女性のリファレンス音声でそれぞれ推論するとちゃんと性別の違う声が出力されない?でも、自分で学習させた女性モデルで男性声を出そうとすると無理があるんだよな。これって元々の事前学習は男女含めた遥かに多いデータで学習しているからってことなのかな?
でも例えばGPT-SoVITS-v2-240821で提供されている事前学習モデルを使って、男性女性のリファレンス音声でそれぞれ推論するとちゃんと性別の違う声が出力されない?でも、自分で学習させた女性モデルで男性声を出そうとすると無理があるんだよな。これって元々の事前学習は男女含めた遥かに多いデータで学習しているからってことなのかな?
973今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ff8f-y7MN)
2024/09/21(土) 16:32:38.21ID:rx5lVO5c0 tensorflowとかPyTorchとかNCCLとかGlooとか、よくみんな話についていけるな
もう疲れて来たよ。みんなすごいね
もう疲れて来たよ。みんなすごいね
974今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ b7cf-yWop)
2024/09/21(土) 17:56:30.60ID:zxVsFsHu0 全部用意してもらってこっちはユーザーとして利用だけしたいならスーパートーン使うのが正解
975今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 7fcb-i9xh)
2024/09/21(土) 18:30:43.45ID:JeEquJWz0 全部ってアニメゲームキャラや有名人とかが用意されてんのかよ、無いだろ
つまりスーパートーン=無
使ってる人間も無
つまりスーパートーン=無
使ってる人間も無
976今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 777b-3vlU)
2024/09/21(土) 18:39:02.18ID:yUHY2OQK0 GPT-SoVITS学習させたことあるけどリファレンス音源設定すんのめんどくさくてな
SBVITSしか勝たん
SBVITSしか勝たん
977今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ff8f-y7MN)
2024/09/21(土) 18:41:43.14ID:rx5lVO5c0 ボイチェン、テキストスピーチ以外に音声識別のAIの話もしてほしいです。
素材を集めるのにとても重要です。
素材を集めるのにとても重要です。
978今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 9f28-4abM)
2024/09/21(土) 19:31:59.73ID:+FG6rwXv0 GPT-SoVITSはボイスチェンジャー機能がどんなものになるのか気になってる
今年中にリリースしたいって話だったから期待してる
今年中にリリースしたいって話だったから期待してる
979今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 7788-u1VN)
2024/09/21(土) 19:35:01.93ID:Uue7hM+P0 Applioがハッキングされたらしい
980今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 9f03-i9xh)
2024/09/21(土) 20:10:24.69ID:1PUtBtUe0 話者識別、話者埋め込みモデルがいくらでもあるからそれで埋め込み作って人力でsklearnでクラスタリングするのがたぶんいちばんはやいで
昔作ったやつがとりあえず参考になるはず
https://github.com/litagin02/voice-clustering-notebook
あとSBV2のスタイル分けのところが実質話者分けやからそこらへん参考にして自分で試行錯誤してもろて
昔作ったやつがとりあえず参考になるはず
https://github.com/litagin02/voice-clustering-notebook
あとSBV2のスタイル分けのところが実質話者分けやからそこらへん参考にして自分で試行錯誤してもろて
981今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 5f54-v2Yj)
2024/09/22(日) 08:01:41.04ID:rvEFx82e0 RVC webUIでたまにインデックスパスの自動検出が
出来ないライブラリになってしまう事があるんだけど
なぜなの
出来ないライブラリになってしまう事があるんだけど
なぜなの
982今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 168f-7cnK)
2024/09/22(日) 08:02:07.21ID:JBf9qIhv0 あざす。話者識別は必要だから調べてるけど、日本語の情報ってほとんどなくて、ChatGPTとレスバするしかなかった。
もっと情報がほしい
リモートデスクトップの仮想GPUはtensorflowだけでなくPyTorch(NCCL)でも誤認識しちゃうみたい
ヤレヤレ。
もっと情報がほしい
リモートデスクトップの仮想GPUはtensorflowだけでなくPyTorch(NCCL)でも誤認識しちゃうみたい
ヤレヤレ。
983今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (オッペケ Sr47-5eDV)
2024/09/22(日) 10:37:17.28ID:VZ4dghw5r >>976
V2だとテキストを設定しなくても良いようだけど設定した方が良い結果が出る気がする。
先駆者たちのhuggingのspaceのようにリファレンス音源と読み起こしテキストを紐づけて同時に読み込ませるUIのほうが使いやすい時もあるので参考にしている。学習させているならリストも生成されているしね。
ただどういうリファレンス音源だとうまく行くのか不明。やはりボイチェンのためのプロジェクトってことなのかな。
V2だとテキストを設定しなくても良いようだけど設定した方が良い結果が出る気がする。
先駆者たちのhuggingのspaceのようにリファレンス音源と読み起こしテキストを紐づけて同時に読み込ませるUIのほうが使いやすい時もあるので参考にしている。学習させているならリストも生成されているしね。
ただどういうリファレンス音源だとうまく行くのか不明。やはりボイチェンのためのプロジェクトってことなのかな。
984今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 5f54-wdwF)
2024/09/22(日) 13:49:07.42ID:v0uncM4G0 SBV2はキャラ複数枠でかつスタイル分けもしたい
985今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ c6b7-HF3Z)
2024/09/23(月) 06:49:07.83ID:fFwTaW7Y0 一番盛り上がるのが違うボイチェンソフト叩いてるときってのも悲しいね
それもこれもv3こねぇからだぞ
それもこれもv3こねぇからだぞ
986今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (オッペケ Sr47-5eDV)
2024/09/23(月) 12:44:28.78ID:rUCYF2Wvr いうほど女の声出したいかね?
この辺のコード触ってると中国語も覚えられるよね
この辺のコード触ってると中国語も覚えられるよね
987 警備員[Lv.22] (ワッチョイ 12cf-4sAz)
2024/09/23(月) 13:12:48.02ID:UuRJgcoS0 下載しかわからん
988今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ d291-d6Dm)
2024/09/23(月) 16:35:33.10ID:PBYthBBc0989今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ef28-TDyV)
2024/09/23(月) 16:36:29.70ID:Oh9yaxSy0 また髪の話してる…
990今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 1e25-7cnK)
2024/09/23(月) 19:03:51.69ID:TL5RwI/B0 誰か次スレお願いします
991今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 5f54-wdwF)
2024/09/23(月) 21:17:46.73ID:y0RQsV1p0 スクリプト今は消えたけどどうすんのかな
992今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 6f28-XjGR)
2024/09/23(月) 21:39:49.18ID:GfouimuN0 無難などんぐりスターターセットの1/3で立てて貰えるとありがたい
ここ見てる人なら固定回線だろうしレベル制限高くてもいいだろうけど、いかんせん990過ぎとなると話し合ってる時間が無い
ここ見てる人なら固定回線だろうしレベル制限高くてもいいだろうけど、いかんせん990過ぎとなると話し合ってる時間が無い
993 警備員[Lv.31] (ワッチョイ 9228-zyFg)
2024/09/24(火) 05:35:56.00ID:bXgZ2h8/0994今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ d291-d6Dm)
2024/09/24(火) 17:46:30.01ID:mjxpyw490 スレ立ておつ
だが次スレ書き込めん
みんなサラバや
だが次スレ書き込めん
みんなサラバや
995今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 6f28-XjGR)
2024/09/24(火) 17:52:37.24ID:VadTnZiK0996今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ d291-d6Dm)
2024/09/24(火) 19:44:20.03ID:mjxpyw490997今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ a7a6-rNKn)
2024/09/25(水) 04:54:52.75ID:kan9hIGW0 新しい板たったし埋めるぜ
998今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ a7a6-rNKn)
2024/09/25(水) 04:55:13.26ID:kan9hIGW0 うめ
999今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ a7a6-rNKn)
2024/09/25(水) 04:55:27.22ID:kan9hIGW0 うめ
1000今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ a7a6-rNKn)
2024/09/25(水) 04:55:48.43ID:kan9hIGW0 埋まった
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 82日 9時間 40分 40秒
新しいスレッドを立ててください。
life time: 82日 9時間 40分 40秒
10021002
Over 1000Thread 5ちゃんねるの運営はUPLIFT会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《UPLIFT会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
4 USD/mon. から匿名でご購入いただけます。
▼ UPLIFT会員登録はこちら ▼
https://uplift.5ch.net/
▼ UPLIFTログインはこちら ▼
https://uplift.5ch.net/login
運営にご協力お願いいたします。
───────────────────
《UPLIFT会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
4 USD/mon. から匿名でご購入いただけます。
▼ UPLIFT会員登録はこちら ▼
https://uplift.5ch.net/
▼ UPLIFTログインはこちら ▼
https://uplift.5ch.net/login
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 中国、新たなパンダ貸与に前向き 日本との共同保護「歓迎」 [蚤の市★]
- 【ラジオ】永野芽郁、田中圭との不倫疑惑後初の『ANNX』で謝罪「誤解を招くような行動…反省」「本当にごめんなさい」★10 [Ailuropoda melanoleuca★]
- 【競馬】3冠牝馬・リバティアイランドの安楽死 処置が施される直前の川田騎手との絆を示す写真に悲痛 「胸が張り裂けそうだ」 [冬月記者★]
- 昭和が始まって100年 幸福度が高かった・低かった年代は… [少考さん★]
- 「水道水で食中毒」14人が下痢や腹痛などの症状を訴え 「カンピロバクター」を検出 群馬・神流町 [少考さん★]
- 頼みの新米に異変 干上がる田んぼに…枯れ始める苗 コメ農家悲鳴「心折れそう」 ★2 [ぐれ★]
- 【悲報】アジア主義唱えるネトウヨってなんで存在しないの🤔 [616817505]
- 吉村知事「目の前のがあまりに太くて…実際にナマで太かったらね、思わず人間だもの」と政治家引退してからの話を暴露 [245325974]
- ジャップ、警察👮‍♂が制服のままマックでハンバーガー買ってただけで騒動になるwwwwwwwwwwwwww [271912485]
- 【真相】スペインの大停電、国内の電力が何らかの原因で一挙に不足し、フランスから大容量の電流供給を察知し送電が自動停止か? [219241683]
- コンマで転生先を選んでね→
- (´;ω;`)イカサマ!イカサマ!!うわああああああああん!!!!