Retrieval-based-Voice-Conversion──RVCについての情報交換とかのスレ
*これを使えばおっさんが誰でも自然な女性ボイスを出せるようになるわけではありません。
このソフトは特定のキャラや人物の声を出せるようになるためのソフトです
このソフトにしろ既存のボイスチェンジャーにしろ同様ですが、女性ボイスを出すためにはまずボイストレーニングが必要です。
wiki
https://seesaawiki.jp/rvc_ch/
※前スレ
なんJRVC部 4
https://fate.5ch.net/test/read.cgi/liveuranus/1699700267/
探検
【ボイスチェンジャー】なんJRVC部 5
■ このスレッドは過去ログ倉庫に格納されています
2023/12/05(火) 17:00:39.54ID:NtbcvmEK
2024/01/05(金) 00:24:01.70ID:HIjkdKWD
>>337
分かったで👌😊
分かったで👌😊
2024/01/05(金) 00:30:39.14ID:HIjkdKWD
2024/01/05(金) 03:52:05.74ID:UowDd/LY
>>336
なるほど~
まあ考えてみれば喘ぎ声や吐息って感情表現や抑揚だけじゃないもんな
喘ぎ声や吐息を構成する要素をマージするにはその構成キーを探し出してnsfwマージ専用のコマンドにしなきゃならんのかもな…
なるほど~
まあ考えてみれば喘ぎ声や吐息って感情表現や抑揚だけじゃないもんな
喘ぎ声や吐息を構成する要素をマージするにはその構成キーを探し出してnsfwマージ専用のコマンドにしなきゃならんのかもな…
2024/01/05(金) 20:31:10.48ID:1xWEF8RC
(Style-)Bert-VITS2の日本語から音素記号に変換するところに重大なバグがあったのに気づいて修正したから報告や
細かいことは置いておいて、今までは「車両を見つける」という文が、学習でも音声合成でも、本来は「シャリョオオ ミツケル」なのが、「シャリ「ヨ」オオ ミ「ッ」ケル」になっとったんや
そのせいでアクセントの学習もぶっ壊れるところがあったっぽい。
https://github.com/litagin02/Style-Bert-VITS2/blob/master/text/japanese.py
本家の人でもStyleの方でもダウンロードしてtext/japanese.pyに置き換えればそこが修正されるはずや(StyleならUpdate.batでもたぶんいける)。
ちょっと試したけどアクセント等が自然になった気がする(少なくとも悪くはならん)。
(また全部学習し直しや……)
細かいことは置いておいて、今までは「車両を見つける」という文が、学習でも音声合成でも、本来は「シャリョオオ ミツケル」なのが、「シャリ「ヨ」オオ ミ「ッ」ケル」になっとったんや
そのせいでアクセントの学習もぶっ壊れるところがあったっぽい。
https://github.com/litagin02/Style-Bert-VITS2/blob/master/text/japanese.py
本家の人でもStyleの方でもダウンロードしてtext/japanese.pyに置き換えればそこが修正されるはずや(StyleならUpdate.batでもたぶんいける)。
ちょっと試したけどアクセント等が自然になった気がする(少なくとも悪くはならん)。
(また全部学習し直しや……)
2024/01/05(金) 20:38:57.41ID:hJnkAA/y
マジかー
まあデータセット全部貯めとるから回し直すだけやけども
まあデータセット全部貯めとるから回し直すだけやけども
343今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/05(金) 20:44:34.72ID:NX9VsWAy おkー
344今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/05(金) 22:03:59.47ID:XzxS6qFB >>341
学習中に残り時間とか表示してほしくて進捗をエポックごとじゃなくて全体を表示するように改造して使ってるんやがdevブランチにPRしてええかな?
それと書き起こしに「ヴ」があるとエラー出たから報告や
学習中に残り時間とか表示してほしくて進捗をエポックごとじゃなくて全体を表示するように改造して使ってるんやがdevブランチにPRしてええかな?
それと書き起こしに「ヴ」があるとエラー出たから報告や
2024/01/05(金) 22:29:20.39ID:1xWEF8RC
346今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/05(金) 22:39:35.64ID:XzxS6qFB347今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/05(金) 23:06:56.62ID:bkDayODq Style-Bert-VITS2なのですが Install-Style-Bert-VITS2-CPU.batで色々とセットアップとダウンロード後に
zipfile.ZipFile.__init__(self, filename)
File "zipfile.py", line 1269, in __init__
File "zipfile.py", line 1336, in _RealGetContents
zipfile.BadZipFile: File is not a zip file
Press any key to continue . . .
みたいな感じでエラーが出て起動せず困っております…
あまりにも初心者すぎて申し訳ないのですがいったい何が原因でしょうか
zipfile.ZipFile.__init__(self, filename)
File "zipfile.py", line 1269, in __init__
File "zipfile.py", line 1336, in _RealGetContents
zipfile.BadZipFile: File is not a zip file
Press any key to continue . . .
みたいな感じでエラーが出て起動せず困っております…
あまりにも初心者すぎて申し訳ないのですがいったい何が原因でしょうか
2024/01/05(金) 23:22:06.11ID:OBrhAtQv
2024/01/05(金) 23:28:13.39ID:1xWEF8RC
一応やけど、学習をし直さなくても一応アプデしても前のモデルは使えるは使えて、それだけでも少しは改善される可能性はあるで。
(特に「車両を見つける」とかはアプデ前はめっちゃ「みっける」って発音してたのが直ったりする)
(特に「車両を見つける」とかはアプデ前はめっちゃ「みっける」って発音してたのが直ったりする)
2024/01/06(土) 01:00:38.74ID:skpYDIZj
>>348
韓国系の男性アイドルとかモンゴル人力士みたいな上手いけどなんか違和感ある日本語かな?そもそもそれ自体どうしてそうなるのかよく分かんないんだよね
韓国系の男性アイドルとかモンゴル人力士みたいな上手いけどなんか違和感ある日本語かな?そもそもそれ自体どうしてそうなるのかよく分かんないんだよね
2024/01/06(土) 05:10:33.74ID:xI4/qOQT
どうしてもなにも、画像生成で指が増えたり減ったりするようなもんやろ
文章から感情や文脈を判断して自然な文章を読み上げるなんて少し前なら考えられんほどのオーバーテクノロジーやし、ポン出しでネイティブにも全く違和感のないものが出ると期待するのは無理がある
細かな違和感は今のところ手動調整していくしかないやろな
文章から感情や文脈を判断して自然な文章を読み上げるなんて少し前なら考えられんほどのオーバーテクノロジーやし、ポン出しでネイティブにも全く違和感のないものが出ると期待するのは無理がある
細かな違和感は今のところ手動調整していくしかないやろな
2024/01/06(土) 08:41:17.54ID:AUJnrt+K
ポン出しで出たのを上に出てたVolcalShifterで微修正とかいう感覚やろか
出てきたものを微調整するのが今はちょっと音は敷居が高い感じはあるから、やっぱそこどうにかしたいな
出てきたものを微調整するのが今はちょっと音は敷居が高い感じはあるから、やっぱそこどうにかしたいな
2024/01/06(土) 10:42:15.55ID:xI4/qOQT
>>352
自分は違和感ある単語を置き換えたり句読点を挟んだりしてイントネーション調節してるな
コツを掴めば5分の小説朗読なら30分くらい調教すればほぼ違和感なくなる
どうしても言わせたい単語をどうしても違和感なく言ってくれなかったときは困ったけど…
自分は違和感ある単語を置き換えたり句読点を挟んだりしてイントネーション調節してるな
コツを掴めば5分の小説朗読なら30分くらい調教すればほぼ違和感なくなる
どうしても言わせたい単語をどうしても違和感なく言ってくれなかったときは困ったけど…
2024/01/06(土) 12:32:40.92ID:xw9yupwG
漢字を置き換る
前後を感情語(嬉しい! びっくり!など)で挟む
改行する
とかで欲しいアクセントや情感探しとるな自分は 雑感では
一発で欲しいセリフが出る 20~30%
テキスト微調整の繰り返しででる 60% ってとこやろか
残りはどうしても出んからコマ切れに出力して切り貼りとかしてたが
今後は鉛筆カキカキやな
手間やが現状すでに棒読みのAV嬢よりずっとそそられると思うわ
前後を感情語(嬉しい! びっくり!など)で挟む
改行する
とかで欲しいアクセントや情感探しとるな自分は 雑感では
一発で欲しいセリフが出る 20~30%
テキスト微調整の繰り返しででる 60% ってとこやろか
残りはどうしても出んからコマ切れに出力して切り貼りとかしてたが
今後は鉛筆カキカキやな
手間やが現状すでに棒読みのAV嬢よりずっとそそられると思うわ
355今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/07(日) 00:37:57.48ID:HoAn3gCI Bert-VITS2の音素変換って総当たりの置き換えでやってるのね
中華系のVITSはpyopenjtalk使ってるイメージだったんだがpyopenjtalkそのまま使ってない理由とかあるんだろうか
中華系のVITSはpyopenjtalk使ってるイメージだったんだがpyopenjtalkそのまま使ってない理由とかあるんだろうか
2024/01/07(日) 01:07:07.32ID:legAf/UY
Bert-VITS2は読み取得のところでpyopenjtalk使っとるで、総当たりしとるのはpyopenjtalkで読みを取得してからのところやな
そのまま使っとらん理由は、ちょうどいま自分が突き当たっとる問題なんやけど、pyopenjtalkまんまだと「!」とか三点リーダーが消えたり「。」と「、」の区別がつかなかったりで、
だから(学習データの関係上)記号は記号のままで使いたい、という理由やと思う(既存TTSやと「!」で強調とか効かんから利点はあるな)。
やけど、そこが原因で、昨日の修正でもまだアクセントがおかしくなる場合があることに気づいたから、それをどうにかしようと修正中や……
そのまま使っとらん理由は、ちょうどいま自分が突き当たっとる問題なんやけど、pyopenjtalkまんまだと「!」とか三点リーダーが消えたり「。」と「、」の区別がつかなかったりで、
だから(学習データの関係上)記号は記号のままで使いたい、という理由やと思う(既存TTSやと「!」で強調とか効かんから利点はあるな)。
やけど、そこが原因で、昨日の修正でもまだアクセントがおかしくなる場合があることに気づいたから、それをどうにかしようと修正中や……
2024/01/07(日) 02:39:41.50ID:mUQausRZ
わぁい!わぁい!わぁい!わぁーい!とか同じ文章を読ませると
モデルによっては変な揺らぎでまともに発音しないな
モデルによっては変な揺らぎでまともに発音しないな
2024/01/07(日) 04:41:32.29ID:e3tLo7yU
もうほんとアクセント以外はほぼ完璧な気がするな~
ある意味恐怖
ある意味恐怖
359今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/07(日) 12:58:41.27ID:HoAn3gCI2024/01/07(日) 14:26:45.17ID:legAf/UY
>>341
ちょっと書いたけど、そもそもBert-VITS2のアクセントの取得法がミスってて、この修正でもアクセントがおかしいまま学習・推論されるバグがあったから、
とりあえず修正した(はずの)やつを置いとくで、何度もすまん(「私はそれがいい」→「ワ↑タシ↓ワ ソ↑レ↓ガ イ↓イ」だったのを「ワ↑タシハ ソ↑レガ イ↓イ」に修正)、
https://github.com/litagin02/Style-Bert-VITS2/blob/fix-g2p-again/text/japanese.py
改善はたぶんアクセントだけやから、正直どこまで効果があるかは分からんしまだこれを本流にするかは決めとらん、なかなか評価もしにくい
(あとアルファベットが学習時・推論時に無視されるのも直した)
ちょっと書いたけど、そもそもBert-VITS2のアクセントの取得法がミスってて、この修正でもアクセントがおかしいまま学習・推論されるバグがあったから、
とりあえず修正した(はずの)やつを置いとくで、何度もすまん(「私はそれがいい」→「ワ↑タシ↓ワ ソ↑レ↓ガ イ↓イ」だったのを「ワ↑タシハ ソ↑レガ イ↓イ」に修正)、
https://github.com/litagin02/Style-Bert-VITS2/blob/fix-g2p-again/text/japanese.py
改善はたぶんアクセントだけやから、正直どこまで効果があるかは分からんしまだこれを本流にするかは決めとらん、なかなか評価もしにくい
(あとアルファベットが学習時・推論時に無視されるのも直した)
2024/01/07(日) 16:18:17.33ID:+rXCtWkB
Install-Style-Bert-VITS2-CPU.bat を使わせて頂きました
languageが[EN][ZH]の時は[音声合成]ボタンで音声を生成してくれるのですが
日本語[JP]だとエラーがでてしまいます
プロンプト?には↓のように表示されます。 何か考えられる解決方法はありますのでしょうか。
File "C:Style-Bert-VITS2\Style-Bert-VITS2\venv\lib\site-packages\pyopenjtalk\__init__.py", line 209, in run_frontend
_global_jtalk = OpenJTalk(dn_mecab=OPEN_JTALK_DICT_DIR)
File "pyopenjtalk\openjtalk.pyx", line 142, in pyopenjtalk.openjtalk.OpenJTalk.__cinit__
RuntimeError: Failed to initalize Mecab
languageが[EN][ZH]の時は[音声合成]ボタンで音声を生成してくれるのですが
日本語[JP]だとエラーがでてしまいます
プロンプト?には↓のように表示されます。 何か考えられる解決方法はありますのでしょうか。
File "C:Style-Bert-VITS2\Style-Bert-VITS2\venv\lib\site-packages\pyopenjtalk\__init__.py", line 209, in run_frontend
_global_jtalk = OpenJTalk(dn_mecab=OPEN_JTALK_DICT_DIR)
File "pyopenjtalk\openjtalk.pyx", line 142, in pyopenjtalk.openjtalk.OpenJTalk.__cinit__
RuntimeError: Failed to initalize Mecab
2024/01/07(日) 16:19:48.00ID:05LovUN2
当初の修正でヤバげな発音が大体直って
後はアクセントが多少おかしいのがアレぐらいに思っとったんやけど
つまりこれでワイにとっては完全版になるんか
日本語の解釈処理だけでここまで変わるってことは根本はとんでもない代物なんやな
また回し直してみるわ
後はアクセントが多少おかしいのがアレぐらいに思っとったんやけど
つまりこれでワイにとっては完全版になるんか
日本語の解釈処理だけでここまで変わるってことは根本はとんでもない代物なんやな
また回し直してみるわ
363今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/07(日) 22:34:03.11ID:YVXGPhC0 普段お絵描きAIばっか使ってるけど
音声AIが面白いことになってるらしいと聞いて遊びに来たで
文章のみから勝手に感情まで付けて読み上げてくれるってすごいなぁ
ずんだもん喋らせて喜んでたくらいの自分からするとタイムマシンに乗せられたような気分や
Style-Bert-VITS2使わせてもろとるけど導入もめちゃ簡単で感謝やで
音声AIが面白いことになってるらしいと聞いて遊びに来たで
文章のみから勝手に感情まで付けて読み上げてくれるってすごいなぁ
ずんだもん喋らせて喜んでたくらいの自分からするとタイムマシンに乗せられたような気分や
Style-Bert-VITS2使わせてもろとるけど導入もめちゃ簡単で感謝やで
2024/01/08(月) 10:51:10.77ID:AR6gW25V
すげー!ちょっと入れてみよ
2024/01/08(月) 12:31:53.47ID:mWmMbrFN
マルチ投稿っぽくてスマンがStyle-Bert-VITS2を使うアプリを作ってみたんで紹介しとくで
https://twitter.com/Zuntan03/status/1744195658029117523
https://twitter.com/thejimwatkins
https://twitter.com/Zuntan03/status/1744195658029117523
https://twitter.com/thejimwatkins
2024/01/08(月) 13:36:39.72ID:EywVqhGQ
Style-Bert-VITS2は学習も簡単にできるのがいいな
分割とか文字起こしも内蔵してるから適当な音声ファイルぶっこんでやれば学習できる
あとモデルのマージも出来るんで適当な2キャラで学習したあとにマージすれば適度に学習本を特定されにくいレベルになる
ただ感情のスタイル指定がなかなかうまくいかないな
分割とか文字起こしも内蔵してるから適当な音声ファイルぶっこんでやれば学習できる
あとモデルのマージも出来るんで適当な2キャラで学習したあとにマージすれば適度に学習本を特定されにくいレベルになる
ただ感情のスタイル指定がなかなかうまくいかないな
2024/01/08(月) 14:22:34.67ID:e/yufQF+
368今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/08(月) 15:58:23.67ID:BXZVRFsl Style-Bert-VITS2を使わせてもらってるんですけどスタイルの指定方法の音声ファイルを入力の方がエラーが出て使えないんですけど使うにあたっての条件等があるのでしょうか?
2024/01/08(月) 16:24:34.37ID:do/uuRGs
370今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/08(月) 17:32:08.79ID:7pM2uyHm Style-Bert-VITS2試しに学習しようとしたらエラーおきたからデータが悪いのかと思いデータセット作成ツールから文字起こし選択するもこっちもエラー
もう分からん…
もう分からん…
2024/01/08(月) 17:33:38.30ID:do/uuRGs
>>370
どんなエラーや?
どんなエラーや?
372今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/08(月) 18:03:06.02ID:eZy0SDe/ Style-Bert-VITS2もテキストいるのか……
2024/01/08(月) 18:07:03.42ID:Ms5jIVaM
?
そりゃテキストを音声に変換するAIだし当然だろ
ボイチェンならrvc
そりゃテキストを音声に変換するAIだし当然だろ
ボイチェンならrvc
374今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/08(月) 18:57:06.81ID:eZy0SDe/ Elevenlabsはテキスト必要ない
375今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/08(月) 19:11:13.79ID:7pM2uyHm2024/01/08(月) 19:16:43.42ID:o82jRM3y
インストールファイルをダブクリしたら黒い窓がててきて途中で止まるわ
2024/01/08(月) 19:20:47.88ID:e/yufQF+
2024/01/08(月) 19:30:38.80ID:do/uuRGs
>>375
学習時の前処理のところで「bfloat16を使う」を外してみたらどうや?
学習時の前処理のところで「bfloat16を使う」を外してみたらどうや?
379今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/08(月) 19:32:35.54ID:eZy0SDe/2024/01/08(月) 19:45:36.70ID:do/uuRGs
Bert-VITS2は声音だけじゃなく喋り方の癖やら感情表現も学習してくれるのが売りやからな、音声少し与えて喋らせるだけのゼロショットとはちょっと方向性が違う気がするで
(ゼロショット方面やと最近はBert-VITS2開発陣ががんばって作っとるFish Speechとかいうやつがあるからそっち期待やな)
(ゼロショット方面やと最近はBert-VITS2開発陣ががんばって作っとるFish Speechとかいうやつがあるからそっち期待やな)
2024/01/08(月) 19:55:05.99ID:Ms5jIVaM
テキストが要らないって結局良くわからん
学習のときに音声のテキスト起こしが要らないということ?
それはstyleの機能の一つで自動でできるぞ
学習のときに音声のテキスト起こしが要らないということ?
それはstyleの機能の一つで自動でできるぞ
382今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/08(月) 19:57:16.65ID:eZy0SDe/ あ、そうなの
colabでもできる?
colabでもできる?
2024/01/08(月) 19:58:52.94ID:RQdHYKY9
384今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/08(月) 20:04:28.19ID:7pM2uyHm >>378
完全に見落としてました…
チェック外して再度行ったところ今度はValueError: need at least one array to concatenateというものに変わったのですがこれも分からないです
完全に見落としてました…
チェック外して再度行ったところ今度はValueError: need at least one array to concatenateというものに変わったのですがこれも分からないです
2024/01/08(月) 20:08:29.36ID:Ms5jIVaM
2024/01/08(月) 20:21:51.25ID:do/uuRGs
2024/01/08(月) 20:46:53.48ID:jickF518
どのライブラリなのか分からないけどStyle-Bert-VITS2の文字起こし精度高いよね
喘ぎ声混じりのエロゲ濡れ場シーンでもかなり正確
喘ぎ声混じりのエロゲ濡れ場シーンでもかなり正確
388今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/08(月) 21:18:15.45ID:QZW3cV1c389361
2024/01/08(月) 22:24:29.67ID:Cp/qxqUP 自己解決。cドライブ直下でインスコし直しで解決しました。わーい
2024/01/08(月) 22:39:05.92ID:EywVqhGQ
>>388
なんどか名前だけ聞いたことあるけどWhisperだったのか
確かに「ご視聴ありがとうございました。 高評価とチャンネル登録をお願いいたします」って出てるの時々あるな
つべの動画から学習してるんだろうか?
なんどか名前だけ聞いたことあるけどWhisperだったのか
確かに「ご視聴ありがとうございました。 高評価とチャンネル登録をお願いいたします」って出てるの時々あるな
つべの動画から学習してるんだろうか?
391今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/08(月) 23:14:52.80ID:waIebOgY2024/01/09(火) 00:07:37.49ID:VGWgumC1
Whisperはネット動画の音声と字幕から学習しとるんやけど
この字幕データがまあまあ正確に付いとる動画であっても
動画の最後にそれを破って話してもいない「ご視聴ありがとうございましたチャンネル登録高評価よろしくお願いします」が入ってたりすることが多いんや
BGMやらガヤしか入っとらん状況でいきなりそうなるもんやから、同じようによく分からん音声を食わされるとそう誘導される訳や
この字幕データがまあまあ正確に付いとる動画であっても
動画の最後にそれを破って話してもいない「ご視聴ありがとうございましたチャンネル登録高評価よろしくお願いします」が入ってたりすることが多いんや
BGMやらガヤしか入っとらん状況でいきなりそうなるもんやから、同じようによく分からん音声を食わされるとそう誘導される訳や
393今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/09(火) 00:27:04.69ID:QQwZv1/42024/01/09(火) 00:30:34.79ID:Z1LmPeH/
>>393
変換とは?前処理は成功してる?
変換とは?前処理は成功してる?
395今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/09(火) 01:03:01.44ID:QQwZv1/42024/01/09(火) 01:06:57.52ID:Z1LmPeH/
>>395
スタイルベクトル作る所で失敗しとる気配がする、エラーの前後がコマンドプロンプトでどうなっとるか教えてほしい
(あとwavsフォルダにwavファイルに対応したnpyって拡張子のファイルたちがあるかどうかも)
スタイルベクトル作る所で失敗しとる気配がする、エラーの前後がコマンドプロンプトでどうなっとるか教えてほしい
(あとwavsフォルダにwavファイルに対応したnpyって拡張子のファイルたちがあるかどうかも)
397今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/09(火) 01:27:40.41ID:QQwZv1/42024/01/09(火) 01:36:19.79ID:Z1LmPeH/
399今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/09(火) 01:51:56.44ID:QQwZv1/4 >>398
いつもはmanaって名前のフォルダなんですけど今回testって名前のフォルダにして前処理したらnpyが作られました…謎すぎる…グラボのアプデしたからかな?
それで今学習回してるところですこんな時間までお付き合い頂いてありがとうございました
https://i.imgur.com/D0dT0T2.png
https://i.imgur.com/mlsKhjB.png
いつもはmanaって名前のフォルダなんですけど今回testって名前のフォルダにして前処理したらnpyが作られました…謎すぎる…グラボのアプデしたからかな?
それで今学習回してるところですこんな時間までお付き合い頂いてありがとうございました
https://i.imgur.com/D0dT0T2.png
https://i.imgur.com/mlsKhjB.png
400今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/09(火) 02:12:51.83ID:QQwZv1/42024/01/09(火) 09:04:13.24ID:QUczHquz
>>399
横からだけど、自分もmanaって名前で作ったモデルあるけどちゃんと生成までいったから名前は関係ないと思う
ただこっちもちょっと失敗しちゃってesd.listに文法ミス(たぶん|の数の不一致)があったみたいなんだけど、そのままesd.listが文法おかしかった
所の手前までで破損しちゃった……
横からだけど、自分もmanaって名前で作ったモデルあるけどちゃんと生成までいったから名前は関係ないと思う
ただこっちもちょっと失敗しちゃってesd.listに文法ミス(たぶん|の数の不一致)があったみたいなんだけど、そのままesd.listが文法おかしかった
所の手前までで破損しちゃった……
2024/01/09(火) 18:49:53.09ID:Z1LmPeH/
https://github.com/litagin02/Style-Bert-VITS2/releases/tag/1.3
Style-Bert-VITS2のバージョン上げたで。日本語処理部分のバグを直したり、アクセント調整機能つけたり(万能ではない)、colabに学習データセット作るやつもつけたりいろいろ。
Style-Bert-VITS2のバージョン上げたで。日本語処理部分のバグを直したり、アクセント調整機能つけたり(万能ではない)、colabに学習データセット作るやつもつけたりいろいろ。
2024/01/09(火) 18:54:36.24ID:0hvO+s0S
>>402
サンガツ!!!
サンガツ!!!
404今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/09(火) 19:04:20.91ID:02Oz9qXT colabで開くリンクつけて~
2024/01/09(火) 19:08:35.99ID:Z1LmPeH/
>>404
あれREADMEにはつけとるはずやで
あれREADMEにはつけとるはずやで
406今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/09(火) 19:21:07.70ID:02Oz9qXT 見たらついてたわすまんな
2024/01/09(火) 20:09:34.99ID:QUczHquz
2024/01/09(火) 20:53:50.45ID:BOrj0zth
2024/01/09(火) 20:59:44.90ID:QUczHquz
読めない漢字があると事前学習止まるって見て結構たくさん修正いるかなとおもったけど
人物名とかの難読を除けば「ヶ」と「乃」くらいで殆ど修正しないで済んだ
人物名とかの難読を除けば「ヶ」と「乃」くらいで殆ど修正しないで済んだ
410今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/09(火) 21:06:02.79ID:02Oz9qXT 分割もしてくれるのね、ありがたい
2024/01/09(火) 21:11:25.32ID:Z1LmPeH/
2024/01/09(火) 21:17:48.23ID:fxqToDiR
javascriptで拾ってもフォーム部品単位だろうしなあ
2024/01/09(火) 21:25:44.09ID:Z8MDomlE
moegoeみたいにC#でフロントエンド作るのも良いかもしれん
414今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/09(火) 21:33:55.18ID:L5/GFLiJ https://i.imgur.com/xs4ppuN.png
こんな感じでエラー吐いて起動しないんじゃけど何かおかしいんじゃろうか
キャッシュ削除とか再インストールとか色々やってみたんだけど駄目だったので知恵をお借りしたい
こんな感じでエラー吐いて起動しないんじゃけど何かおかしいんじゃろうか
キャッシュ削除とか再インストールとか色々やってみたんだけど駄目だったので知恵をお借りしたい
2024/01/09(火) 21:34:01.45ID:Z1LmPeH/
RVCのほうで、事前学習モデルをこれに置き換えるとよいかもという噂があるらしい(AI HUBの人たちが事前学習モデルを改良したらしい?)
https://huggingface.co/ORVC/Ov2Super/tree/main
https://huggingface.co/ORVC/Ov2Super/tree/main
2024/01/09(火) 21:36:37.83ID:Z1LmPeH/
417今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/09(火) 21:55:25.99ID:L5/GFLiJ2024/01/09(火) 22:17:08.50ID:Z1LmPeH/
419今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/09(火) 22:23:21.93ID:L5/GFLiJ2024/01/09(火) 22:34:21.03ID:Z1LmPeH/
2024/01/09(火) 22:42:02.46ID:QUczHquz
import中にモジュールがzipダウンロードするのが失敗してるとかかな?
ファイアウォールが通信をブロックしてないかとか、proxy経由する必要があるとか、そんな感じ?
ファイアウォールが通信をブロックしてないかとか、proxy経由する必要があるとか、そんな感じ?
2024/01/10(水) 00:47:08.20ID:FrDCwiwR
>>419
BadZipFile…
BadZipFile…
423今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/10(水) 08:54:42.55ID:4y6ys5U/ やってみたけどすげえー
https://files.catbox.moe/bc6oj6.wav
https://files.catbox.moe/bc6oj6.wav
2024/01/10(水) 11:47:36.46ID:tMQlgLCv
Style-Bert-VITS2の1.3はスタイルの設定もかなり良くなってるね
いままであまり区別出来てなかった通常の会話とエロ声がちゃんと分別できるようになった
いままであまり区別出来てなかった通常の会話とエロ声がちゃんと分別できるようになった
425今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/10(水) 12:06:44.11ID:4y6ys5U/ colabでは生成できないの
2024/01/10(水) 12:25:51.53ID:7Nv1N++M
音声合成WebUI立ち上げるやつは一応一番下に載せとるはずやで
2024/01/10(水) 13:26:04.81ID:DInNoojP
「ずんだもん読み上げに感情を与える」ページを見ながらマージに挑戦中なんだけど、教えていただきたいことが…
「デフォルトのjvnv-F1」と「デフォルトのjvnv-F2」のマージはmodel_assetsフォルダを弄ることなくMerge.batから成功
しかし「Zuntanさんの10kステップ(v2.1とv2.3両方DL)」とのマージのやり方がわからない(自分なりにやったらモデルファイルのマージボタンでError吐いた)
まず基本的なフォルダ構造からわからんです
「mergeフォルダを作って〜」というのはmodel_assetsフォルダ内に作るって事なんだろうか?
「そこに2つのモデルを入れて」というのはどこのフォルダの何を入れるんでしょう?
「片方のモデルのconfig.jsonも入れて」というのはmergeフォルダ直下に放り込むんでしょうか?
わからん もう・・・なにもかもが・・・
「デフォルトのjvnv-F1」と「デフォルトのjvnv-F2」のマージはmodel_assetsフォルダを弄ることなくMerge.batから成功
しかし「Zuntanさんの10kステップ(v2.1とv2.3両方DL)」とのマージのやり方がわからない(自分なりにやったらモデルファイルのマージボタンでError吐いた)
まず基本的なフォルダ構造からわからんです
「mergeフォルダを作って〜」というのはmodel_assetsフォルダ内に作るって事なんだろうか?
「そこに2つのモデルを入れて」というのはどこのフォルダの何を入れるんでしょう?
「片方のモデルのconfig.jsonも入れて」というのはmergeフォルダ直下に放り込むんでしょうか?
わからん もう・・・なにもかもが・・・
2024/01/10(水) 13:33:49.75ID:7Nv1N++M
>>427
その記事はBert-VITS2本家のやつやからStyle-Bert-VITS2の情報とは違うで(mergeフォルダを作ってconfig.json入れてとかそこらへんは本家でsimple_merge.pyを使う場合の話や)
Style-Bert-VITS2ならMerge.batからやるだけや、デフォルトのjvnvモデルのマージに成功してるんならそのやりかたでええで。
あとたぶんZuntanさんの10kステップのやつはBert-VITS2本家のやつやからStyle-Bert-VITS2では使えんで
その記事はBert-VITS2本家のやつやからStyle-Bert-VITS2の情報とは違うで(mergeフォルダを作ってconfig.json入れてとかそこらへんは本家でsimple_merge.pyを使う場合の話や)
Style-Bert-VITS2ならMerge.batからやるだけや、デフォルトのjvnvモデルのマージに成功してるんならそのやりかたでええで。
あとたぶんZuntanさんの10kステップのやつはBert-VITS2本家のやつやからStyle-Bert-VITS2では使えんで
2024/01/10(水) 13:44:46.41ID:DInNoojP
あー、本家情報と分家情報の段階からの勘違いだったかー、これは酷い
お手数おかけしました
お手数おかけしました
2024/01/10(水) 13:46:12.73ID:WWohrpx2
たしかに紛らわしいなw
431今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/10(水) 13:55:40.12ID:4y6ys5U/ Dataフォルダ内の自動削除もつけてほしいなー
2024/01/10(水) 14:45:44.67ID:tMQlgLCv
Dataは残したままの方が良くない?
Inputの方は移動後は消しちゃって良さそうな気がするけど
Inputの方は移動後は消しちゃって良さそうな気がするけど
433今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/10(水) 14:47:47.95ID:4y6ys5U/ ドライブの容量食う
2024/01/10(水) 15:02:25.55ID:7Nv1N++M
追加で学習したりスタイル分けを作ったりに後からも必要やから自動削除機能は付ける予定はないで
colabでGoogle driveやったら自分でもういらんやつは消してくれ
colabでGoogle driveやったら自分でもういらんやつは消してくれ
435今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/10(水) 15:17:49.23ID:4y6ys5U/ スタイルってどこで保存できるの
2024/01/10(水) 15:45:19.70ID:xQ6+pCiw
説明書読んどらんのがよく分かるな
437今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった
2024/01/10(水) 15:52:38.60ID:4y6ys5U/ python webui_style_vectors.pyが起動できない
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【自主回収】「あんまん」に「肉まん」が混入1314パックを自主回収「肉まん」に「あんまん」が混入の可能性もあり [おっさん友の会★]
- 【映画】165億円の赤字か 米ディズニー「白雪姫」実写版、大型連休中の日本でも上映打ち切り [ネギうどん★]
- 【住宅】退職後も家賃支払う「賃貸」か、住宅ローン見極め「持ち家」か…住居費は手取りの3割が目安 ★5 [ぐれ★]
- 「これ、かわいくない」と同意を求めただけなのに…SNSのやりとりで誤解防ぐには [少考さん★]
- 【大阪・関西万博】来場者数きのう=5日『12万人1千人』(関係者1万7千人含む) [少考さん★]
- あのちゃん、“普通”の押し付けに苦言「お前が言ってるその普通も僕からしたら普通じゃない」 [ネギうどん★]
- ウク信「ロシアと中国の経済は崩壊する!!」。ロシア、GDP成長率4.1%、中国、GDP成長率5.2% [805596214]
- GW最終日の大阪万博、大雨でガラガラ [931948549]
- 【悲報】白人絵師「初音ミクは白人に見えるからアジア人に描き直した」→日本人ブチギレwwwwwwwwwwwwwwww [839150984]
- キィー🐢💢🏡
- ナザレンコさん、アンチにキレる [834922174]
- 【正論】X民「炎上覚悟で言う、開示請求は確実にインターネットをつまらなくしてる」 3.7万いいね [839150984]