X



なんJRVC部★7
0001今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ fb89-GH/h)
垢版 |
2024/03/31(日) 17:28:56.06ID:JmKQV2uf0
!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
スレ立てのときは↑の!extend::vvvvv:1000:512を3行ぐらいに増やしてな

RVCとTTSとかの情報交換とかのスレ
ボイスチェンジャーで誰でも完璧に別人になりきることはできません。ボイストレーニングが必要です。

wiki: https://seesaawiki.jp/rvc_ch/
※前スレ
【ボイスチェンジャー】なんJRVC部 6
https://fate.5ch.net/test/read.cgi/liveuranus/1707472445/
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
0414 警備員[Lv.16][初] (ワッチョイ 674a-b946)
垢版 |
2024/05/01(水) 20:16:09.06ID:lnMkbUv30
データセットとしてノベルゲー音声はやっぱり一番やな
RVCだと逆に演技音声だと、こちらがちゃんと演技をしないと性能引き出せないって点で、素の雑談配信のほうがいいみたいなのはあるっぽいが
0418今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ bfa4-D7W2)
垢版 |
2024/05/02(木) 03:14:42.95ID:p3Gy0MEL0
RVCのgo-webで、自分の声録音mp3に対して適当なモデル(pth)の声を少しだけブレンドしたいのですが、
簡単にできそうな方法はありませんか?
ちゃんと自分の声のモデルを作成して、ckptファイルの処理からAモデルBモデルとして
混ぜるしかないでしょうか
0419今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ e7c3-y8PE)
垢版 |
2024/05/02(木) 07:07:08.99ID:cNfs1e4c0
手持ちの発声部分が1時間くらいのデータを学習するとき4000〜2万ステップくらいまでは殆ど差がなかった
そこからずっと続けて5万ステップ超えてくるとほんの少しずつ学習元にないセリフの結果も改善していく
中国語なまりがきつ過ぎる人は素材の不足か学習時間の不足があるかも知れない
0421 警備員[Lv.18][苗] (ワッチョイ df28-nVjz)
垢版 |
2024/05/03(金) 14:42:54.69ID:Qvaw3HFv0
>>420
おもしろいでちゅね
0424 警備員[Lv.18][苗] (ワッチョイ df28-nVjz)
垢版 |
2024/05/03(金) 15:35:17.42ID:Qvaw3HFv0
>>420
それにしても発音とか凄い自然に聞こえるね、データの時間はどれくらいで何stepくらい学習してるの?
0427今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ a78c-Z2u0)
垢版 |
2024/05/03(金) 20:00:43.62ID:b0ZAvWwZ0
>>420
草 大成功やろこれ
0428今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ df66-4yme)
垢版 |
2024/05/03(金) 20:03:27.11ID:E1jFyd+K0
久々にワロタ
0431 警備員[Lv.9][初] (ワッチョイ 077b-R43V)
垢版 |
2024/05/04(土) 00:39:11.68ID:a95p8zf60
>>424
データセット:30分くらい
スライス後:282ファイル
バッチサイズ;4
38000ステップ (rtx3060で12時間) のウェイトを使った
https://files.catbox.moe/hpy6td.jpg
書き起こしはWhisper large v2でやってみたけどエッチなセリフもなにもかもマジで全部書いてくれてビビるわ
ちなみに通常のトーンまで汚染してほしくなかったから「んんっ♥」とか「~でちゅね♥」とか♥つくようにプロンプトで指示して書き起こしして記号に紐づかないかと実験してみたけどマジでなんも意味なかった
0432 警備員[Lv.23][初] (ワッチョイ 878d-b946)
垢版 |
2024/05/04(土) 05:38:54.70ID:0e8Vp08X0
つまりある程度特徴的語尾なんかもサンプル次第で学習可能ってことだよな
0435 警備員[Lv.17][初] (ワッチョイ 674a-b946)
垢版 |
2024/05/04(土) 09:27:16.06ID:wFpLoYFG0
学習データによって「私」を「あたし」や「わたくし」と読んだり、「えっと」「あの」たたまに自動的に挿入されるようになったりもするけど、
ここまでピンポイントに発音曲げられるもんなんやな
0437 警備員[Lv.20][初] (ワッチョイ a77b-y8PE)
垢版 |
2024/05/04(土) 11:03:19.48ID:SEM9YhfT0
>>433
VITS2なんてものは無い
Style-Bert-VITSが2ってだけ
Style-Bert-VITS2はlitaginさんが日本人向けに使いやすくしてくれてるから日本人は使いやすいけど
RVCチームが作ったGPT-SoVITSとか上に出てるFish Speechとかがあるから主流がどれってのは無い
0439 警備員[Lv.19][苗] (ワッチョイ df28-nVjz)
垢版 |
2024/05/04(土) 11:35:22.00ID:DdXMzBTz0
>>431
あざます、参考になります。
0441今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ e7c3-y8PE)
垢版 |
2024/05/04(土) 12:14:19.86ID:ImI9axCi0
Ninjaで俺も前のセッション残ってる?ってバグに遭遇したわ
koboldCppでちゃんとセッションクリアしてるのに前の履歴を引きずったみたいな挙動をして
何度も繰り返してるうちに日本語崩壊して普通に会話しようとするだけで↓みたいなことしか言わなくなる
「 甘いMAXネガスむらんだ出帽子予約をすっかるサマを即座席から選手市からアパレクティラティ」
0442 警備員[Lv.17][初] (ワッチョイ 674a-b946)
垢版 |
2024/05/04(土) 13:09:29.41ID:wFpLoYFG0
一応やけどVITS2というものはあるで(アーキテクチャの名前)
VITSの改善版がVITS2で、それの実装にBERT(言語モデル)を組み合わせた実装がBert-VITS2(Bert-VITSがあってその2番目、というわけではない)
Style-Bert-VITS2はBert-VITS2にスタイル入れたやつ(なのでStyle-Bert-VITSがあってその2番目ではない)
0457今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ea08-w0ma)
垢版 |
2024/05/06(月) 15:54:47.91ID:ZqkrOXVY0
円安落ち着いたらゲーミングPC買ってRVC+エペしたいと思ってるんだが、好きなキャラクターの声になれるってことでいいんだよな?
0460今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ea08-w0ma)
垢版 |
2024/05/06(月) 16:29:32.63ID:ZqkrOXVY0
>>458
え、
金積めばなれるもんだと思ってたよ…
0463今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 2e6e-QwiI)
垢版 |
2024/05/06(月) 16:38:32.23ID:VcJTo3/q0
自分と相性のいいモデルを使って、かつ話し方も工夫すれば男が女のふりをすることは可能
ただボイチェン特有の声の歪みを100%無くすのは難しいからそのうちボロが出る
あとボイチェンの知識がある相手にはバレやすい
0466今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ea08-w0ma)
垢版 |
2024/05/06(月) 17:03:36.98ID:ZqkrOXVY0
声を瞬時に変換する画期的な技術だと思ってたんだが違うんだな
結局その声に寄せないと行けないと…
0469今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 2aa9-6Sbd)
垢版 |
2024/05/06(月) 17:44:33.13ID:W3x18+ZY0
moisesの支払い出来なくなったから代用できるサイトないかな
0470 警備員[Lv.18][初] (ワッチョイ 2e7b-T7LG)
垢版 |
2024/05/06(月) 21:39:53.98ID:JzK0Bq/o0
>>467
凄いけど商用利用不可によりyoutubeの動画には活かせず
殆どの人が望むであろう特定のキャラの声になりたいって要望にも応えられないから日本では流行らんだろうな
0471 警備員[Lv.4][新初] (ワッチョイ a67b-2piB)
垢版 |
2024/05/07(火) 13:32:45.61ID:wfefEkKC0
それこそ声優学校に行って量産型の発声できるようになったらええんやな
0472今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 9f7b-U3JB)
垢版 |
2024/05/07(火) 15:26:28.38ID:rALPDVTJ0
https://files.catbox.moe/vll6f7.png
AI愛好家(?)の一部のなかでPortalに出てくるGLaDOSを現実に実装するのが流行っているような気がして自分も天井からロボットアームとか生やしてGLaDOSちゃん稼働させてぇなと思ったので、とりあえずTTSモデルを学習させてみてモデルをhuggingfaceにおいてみた
Style-Bert_VITS2(英語のみ)とGPT-SoVITS(日英中)の2つがある サンプルはリポジトリ見てくれるとたすかる
https://huggingface.co/WarriorMama777/GLaDOS_TTS
0473 警備員[Lv.10(前23)][苗] (ワッチョイ 8b5e-w0ma)
垢版 |
2024/05/07(火) 19:07:50.03ID:D74Y3fmW0
>>472
ゲームのキャラを現実にするみたいのかっこいいね
0474今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ d37b-yCec)
垢版 |
2024/05/07(火) 19:39:16.38ID:qh366Y1S0
昔ニコ動にその手の動画があった記憶
0475今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ea83-w0ma)
垢版 |
2024/05/07(火) 21:58:59.01ID:ZA0OdBUI0
>>467
これボーボボいえる?
0476今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 4ac4-0+0w)
垢版 |
2024/05/07(火) 22:26:15.93ID:sQrXkjeZ0
すいません質問なんですがVITSのデータセット作成で
文字起こしが終わらずひたすらタイマーだけが進むのですが
初心者が陥りやすいミスとかあるのでしょうか
0477今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 4ac4-0+0w)
垢版 |
2024/05/07(火) 22:55:25.72ID:sQrXkjeZ0
自決しました
お騒がせしました
0478今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 7e63-auFI)
垢版 |
2024/05/07(火) 23:53:29.16ID:dxL6iI+/0
ディスコ鯖っていまない?あったら招待欲しい
0480今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ea38-Fjdi)
垢版 |
2024/05/08(水) 12:32:08.11ID:YnthydPL0
歌枠の音源でstyle-bert-vits2の学習させるとミクさんっぽい喋り方になるね
通常の喋り声と合わせるか悩むところ
0481 ころころ (ワッチョイ 2ef8-T7LG)
垢版 |
2024/05/08(水) 21:21:22.60ID:uBTRDzXi0
声づくりっていつもの反AIがどうこうとか法律がどうこうとか同じ事ずっと喋ってる人がいる感じなん?
AI関連のDiscordはあの人等が常駐してるから怖くて参加でけへんねんな
0484 警備員[Lv.20][苗] (ワッチョイ 2ef8-T7LG)
垢版 |
2024/05/08(水) 22:20:18.82ID:uBTRDzXi0
>>483みたいにRVCその他ボイチェンと何の関係もなく
聞いてもいないのに突然自分の結論ありきで語りだす人間の集団やで?
興味本位で少しでも見たら頭おかしくなるで
0487 警備員[Lv.21][苗] (ワッチョイ 2ef8-T7LG)
垢版 |
2024/05/09(木) 14:02:04.00ID:ok/sNlhx0
stabilltyAIの日本公式discordサーバStable Community Japanがあるのに
一切話題にならない時点でどんなのがいるのかなんて見なくても分かるやろ
それでも見たいなら音声AIチャンネルもあるしどうぞ
0489今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 2354-UJeo)
垢版 |
2024/05/10(金) 16:57:22.59ID:cyldXuv50
UVR5でハモリだけ抜く方法はありますか?
0492今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 2aa9-6Sbd)
垢版 |
2024/05/10(金) 20:15:16.50ID:QH2f1NA30
colabのUVRは複雑すぎ
RVCについてるやつみたいにもうちょっとわかりやすいのはないの
0493今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 2354-UJeo)
垢版 |
2024/05/10(金) 21:30:44.19ID:cyldXuv50
>>490
UVR5のmdx-netのinst mainを使ってるんですが、そもそもinstにハモリが入らないんですよね 他のを使えば入るんですかね・・・
0494今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 4a05-Ybxd)
垢版 |
2024/05/10(金) 23:37:03.21ID:tDwgtRzi0
音声の学習ってファイル数多いと逆に微妙っすねこれ……
あと音程が上がるとロボっぽくなるのは仕様でしょうか
0497今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ササクッテロラ Sp9f-W38A)
垢版 |
2024/05/12(日) 12:17:28.01ID:JBjZaLe9p
皆んな曲のボーカルとかBGM+喋り声から喋り声を抽出する時は、何使ってるんや?ワイはUVRのKimvocal2か5_hpkaraokeなんやがこれより精度いいやつある?
0498 警備員[Lv.12(前23)][苗] (ワッチョイ 7b31-W+jA)
垢版 |
2024/05/12(日) 12:34:03.94ID:iUlUgQ8/0
reactのフロントをcomfyuiみたいにしてみたいな
0499 警備員[Lv.12(前23)][苗] (スッップ Sdd7-W+jA)
垢版 |
2024/05/12(日) 13:45:00.58ID:D/KIH81qd
と思ったがメリットが思いつかなかった
0500今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ e73f-Hnix)
垢版 |
2024/05/12(日) 16:52:27.04ID:MfxIFQkZ0
エロ声ならStyle-Bert_VITS2が一番やろか?
0502今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ cba9-PwS8)
垢版 |
2024/05/13(月) 19:55:55.72ID:FCZwt3+x0
5100ステップしかないのかよ
0505今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 117b-tLhM)
垢版 |
2024/05/14(火) 13:04:44.06ID:ySnRYqcV0
Text to Speachじゃないからか笑い声とか無声音部分が自然よね
ピッチ変換とかも無いからケロケロしないし
0506今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 37bc-mzvd)
垢版 |
2024/05/14(火) 15:13:48.22ID:NCO+dKhW0
>>503
上手な人がやると男が女声してても自然でバレにくいよ
RVCを使ってるって教えてもらった後でも、本物の女が話してるとしか思えないレベルの人がVRChatにはたまにいる
0507 警備員[Lv.25][苗] (ワッチョイ 0bb0-Hnix)
垢版 |
2024/05/14(火) 15:30:23.28ID:N3VIhRbt0
綺麗に学習させたモデルで適切な声の出し方(高さは調整できるから違う)をすればRVCでも自然なTSボイスになるはず
違和感があるのはモデルの質か声の出し方が原因
0510今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ eb46-I30v)
垢版 |
2024/05/14(火) 17:24:11.17ID:m6P7hPSN0
BGM付き音声から声だけ抜き取りたくてMVSEP使ってみたけど
0%から動かなくて草
合計17時間あるからこれでどうにかするのは無理か…
0511今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ bf1e-Hnix)
垢版 |
2024/05/14(火) 18:06:29.77ID:J+8R8/wg0
既出な質問だったら申し訳ないのですが…
svc fork使っています。
例えばエポック100まで回してクオリティが微妙だなってなったときに素材を足そうと思ったら
素材を足してもう一回はじめからやったほうがいいか
足して(もしくはたさずに)継続したほうがいいかってわかりますか?
それと素材が200個程度ならエポック1200まで回したほうがいい。みたいな意見もあったんですけどみなさんはどのくらいで見切りつけてますか?
レスを投稿する


ニューススポーツなんでも実況