なんJRVC部★7

0001今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ fb89-GH/h)2024/03/31(日) 17:28:56.06ID:JmKQV2uf0
!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
スレ立てのときは↑の!extend::vvvvv:1000:512を3行ぐらいに増やしてな

RVCとTTSとかの情報交換とかのスレ
ボイスチェンジャーで誰でも完璧に別人になりきることはできません。ボイストレーニングが必要です。

wiki: https://seesaawiki.jp/rvc_ch/
※前スレ
【ボイスチェンジャー】なんJRVC部 6
https://fate.5ch.net/test/read.cgi/liveuranus/1707472445/
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0543今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ cba9-PwS8)2024/05/17(金) 21:54:01.26ID:bZsCsK/r0
原因がわからない

0544 警備員[Lv.28][苗] (ワッチョイ 0b09-Hnix)2024/05/18(土) 00:39:25.07ID:wkywH7K90
他の人が同じ不具合の報告をしてない=おま環または自分の行動が原因

0545今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 85fd-e7L/)2024/05/18(土) 01:08:03.23ID:ZzcfFAC40
>>543
自分はローカル勢なんで参考になるか分からないけど同じエラーが出たから一応報告しとくね
起動するときにいつからかgradioを4.29.0にアップグレードしてね、みたいな催促が出るようになったから更新してみたけどそしたら同じエラーが出てモデルチェンジとか出来なくなった
4.23.0に戻したら動くようになったけど相変わらずアップグレードの記述は出る

0546今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ cba9-PwS8)2024/05/18(土) 07:04:19.86ID:veDtLflk0
>>545
出来ました、ありがとうございます

0547今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ cba9-PwS8)2024/05/18(土) 08:31:05.82ID:veDtLflk0
gradioをアップデートしてもエラー出さないように出来ますか

0548 警備員[Lv.9][芽初] (ワッチョイ ab4a-739I)2024/05/18(土) 19:13:57.50ID:c1M4h63g0
https://huggingface.co/spaces/litagin/make_everything_chupa
全ての音をチュパ音に変換するやつ公開した
まだ精度とかアレやし、学習コードとかもいろいろ整備してからちゃんと公開するわ

0549 警備員[Lv.29][芽] (ワッチョイ 3e09-lB5S)2024/05/19(日) 00:38:11.22ID:gh3D5cOA0
>>548
今はまだ何言ってるかは分からなくなっちゃうけど雰囲気は完璧
精度上がったらヤバいなこれ

0550 警備員[Lv.10][初] (ワッチョイ 334a-ZWkU)2024/05/19(日) 18:33:44.96ID:Iyl+nAnn0
上で出とるgradioのPath serialize errorのやつ、こっちでも普通に出たんで修正した
最近あんま確認やバグ修正する時間が無くてすまんな

0551今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ff13-IFz/)2024/05/19(日) 18:51:50.04ID:xVlyrwDR0
>>550
gradioを更新してもerrorなく推論出来ました
いつもありがとうございます

0552今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 5aa9-3RIi)2024/05/19(日) 19:24:23.79ID:+BrTqbLZ0
>>550
ありがとうございます!

0553今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 3e88-MEqr)2024/05/19(日) 22:21:14.72ID:VSbH9csn0
>>548
面白い

0554 警備員[Lv.13] (ワッチョイ b30f-zGH+)2024/05/20(月) 00:27:39.27ID:XNhdfT8I0
>>548
すげえや、これで勝つる!

0555今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ aa63-lB5S)2024/05/20(月) 01:29:51.38ID:BhCCFQLa0
>>548
使ったらエラーばっかりでちゃう
なんでだろ

初歩的な質問で申し訳ないのですが
皆さんが書いている「ステップ数」というのは、どうやって計算するのでしょうか?
ファイル数*エポック数とは違いますよね

0557今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ aacf-4PJT)2024/05/21(火) 02:25:12.18ID:TI7gCUZ00
Style-Bert-VITS2を久しぶりに使ったらエラー出ました

Running app.py...
Traceback (most recent call last):
File "C:\Users\User\Downloads\sbv2\sbv2\Style-Bert-VITS2\app.py", line 4, in <module>
import gradio as gr
ModuleNotFoundError: No module named 'gradio'
Press any key to continue . . .

前は動いてたのに何ででしょう

0558今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ aacf-4PJT)2024/05/21(火) 02:25:30.06ID:TI7gCUZ00
>>557の続きですが

pip install gradioでgradioを入れてみましたが
何も変わらないです

0559今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 5aa9-3RIi)2024/05/21(火) 15:47:42.94ID:NXNNWWeW0
>>550
スタイル生成の「代表音声の取得」でも同様のエラーが出たんで修正お願いします

>>556
そのステップ数はどのステップ数のことでしょうか?

言葉足らずですみません。
>>404-408>>431に出ている「ステップ」になります。
RVCでいうどこでその数値を出しているのかわからずでして。

音声ファイル数×エポック数=ステップ数でいいんじゃないか?
あらためて聞かれるとなんかわからんくなるけど
WebUIの「Tensorboardを起動」みたいなボタンあったと思うからそれで学習のログをグラフで見るのが一番わかりやすいと思う

バッチサイズによってステップ数は変わるで
1エポック(音声ファイル全て一周)の学習が、音声ファイル数 / バッチサイズだけのステップ数がかかる

なんや規制かかっとって書き込めんかったけど解除されとったんか
上のチュパ音の生成アプリをアップデート、音声ファイルいれなくても自動でチュパ音を作れるようにしたで
ttps://huggingface.co/spaces/litagin/chupa_generator
間に言語モデル挟んでるからちょっと遅いけどな

0565今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 1a8b-ghyY)2024/05/24(金) 08:05:15.74ID:Ax5CYiLS0
どんなレベルで音声ファイルが必要なの?
例えば、ラジオちょうど1時間のファイル一つじゃ足りない?

長さは20~30分あれば足りる
それよりBGMやノイズ入ってないとか全体的な音質とか他の人の声混ざってないかとかのが重要

やっぱ中国語なまりがStyle-Bert-VITS2の日本語版でもきついな
誰かレベルの高いモデル作るのに成功した人いないのかな

0568 警備員[Lv.16] (ワッチョイ 334a-ZWkU)2024/05/24(金) 18:48:03.09ID:FekZcs+E0
みんな中国語なまり言うけど別に中国語は関係ないで
ただアクセントやイントネーションの高さがどうしてもズレるだけや
正確なアクセントを重視して棒読みになるか、アクセント制御を多少犠牲にして感情豊かにするか、のトレードオフなんやと思う

和製TTSでも訛りは出るけど、「これ中国製なんですよ」って言われたら中国訛りに聞こえるもんだ
人間の聴覚ってその辺は相当にいい加減なもんよ

あーなるほどね
中国製だからって先入観で判断してるところもあるわな

ある声優の声を学習させて喋らせたらイントネーションが神楽になったんだよな(学習データには成分なし)
おもわず「アル」つけたよ

0572 警備員[Lv.3][芽] (ワッチョイ 3e55-4PJT)2024/05/25(土) 00:20:56.78ID:A0e7/q9L0
銀魂の神楽は明らかに日本人が考えたカタコトなので中国訛りではないような…
ただそのデータ羨ましいわ
>>420といい可能性が無限にあるな

>>571
神楽って銀魂の?
あれが中国のアクセントとはならんやろw

>>568
ずっと思ってたこと言ってくれた
なんだろ…みんな期待値が高すぎるのかな
文章から感情表現が出てくるだけでめちゃくちゃ難しい話なのに、微調整無しで完璧なアクセントで出るわけないだろう

そりゃ自然会話を求めてる人と、聞き取れればいい人では求めてる世界が違うわな

vtuberの棒読み配信みたいのはある程度再現できる
本職声優の感情乗せた演技はまだまだ無理ゲー
声優って思ったより凄かったんやなってなってるわ…

出力がどうしても気に入らなかったらボーカル補正ソフトで手動補正したってええんやで
さらに円安が進んで買い辛くなるかもしれないだろぉ・・・たまにセールもやってるからさぁ・・・(沼に引きずり込もうとする手)

0578 警備員[Lv.6][芽] (ワッチョイ 3e55-4PJT)2024/05/25(土) 10:06:27.68ID:A0e7/q9L0
https://www.izotope.jp/jp/news/2024-sos-neutron-free/
izotopeとwaveの一式買ったけど
素人にはなにやっても全部同じに聞こえてゲシュタルト崩壊するかもやで
買うならまず明らかに変わるリバーブからがお勧めや

今ならNeutron Elements(v4)が無料配布中やからとりあえず触ってみるのがええで
ボーカル補正なら本来はRX11を使うべきやろうけど

0579今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 5aa9-3RIi)2024/05/25(土) 10:33:46.86ID:mnJA5nQh0
>>578
届いたメールにライセンスナンバーが載ってない

>>579
メールのリンクから買えるだよ

AI技術で生成した音声データを使ってアイドルマスターの水瀬伊織に粛聖!! ロリ神レクイエム☆を歌わせてみた。
ttps://youtu.be/IatLBMJ7Fw4

0582今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 917b-UdpP)2024/05/26(日) 22:40:31.83ID:KV+Ix27B0
全然似てない

AIで歌わせてみたとか言ってる動画の殆どはオリジナルの歌をボイチェン変換してるだけだからしょうもないんだよな
リスナーにAI音声の知識がないのに付け込んだ詐欺に近い
今の音声合成AIは楽譜と歌詞から歌うような能力はないけどどリスナーの殆どはAIがゼロから歌ってると騙されてる

0584今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 13a9-/cnv)2024/05/27(月) 11:41:27.20ID:ds0CLuQv0
UTAUを進化させた感じのやつはないのかな

そこら辺のはNEUTRINOから進化してないイメージ

spaceにStyle-Bert-VITS2の古いバージョンをアップしてもビルドで失敗するようになった。なんでなん?
新しいのは音声合成以外の不要なものが付いてるので、古いものを上げたいのですが

あああああああああああああああああああああ前のイベントのボックスガチャ100回分引くの忘れたあああああああああああああああああああああ!

オワッタ…オワッタ…orz

スレチだったすまん

0589今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ササクッテロラ Sp8d-AG73)2024/05/28(火) 19:02:08.99ID:jZT3txBgp
rvcでボイスモデルを作る時に、学習素材の音量は大きい方がいいとかありますか?また音量が小さいのと大きいのでが混ざっても問題無いですか?

0590 警備員[Lv.16] (ワッチョイ a14a-O2Se)2024/05/29(水) 05:12:42.92ID:1Ocbf/9Q0
>>586
一応colabやローカルでの学習まではチェックしとるけど、さすがにspacesやしかも古いバージョンでの動作はチェックしとらんしする気もない
自分でエラーをChatGPTで調べてソースコードを見てやってくれ

0591 警備員[Lv.17] (ワッチョイ a14a-O2Se)2024/05/29(水) 06:55:49.65ID:1Ocbf/9Q0
歌声なら学習はできんけどいますごいはSynthesizer Vなんやないの、知らんけど

0592今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 13a9-/cnv)2024/05/29(水) 08:39:00.04ID:CNgX1dNo0
moe-speechの再申請ってできませんか

0593 警備員[Lv.18] (ワッチョイ a14a-O2Se)2024/05/29(水) 08:53:01.10ID:1Ocbf/9Q0
>>592
別垢作ってそこから申請

新着レスの表示
レスを投稿する