なんJRVC部★7
!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
スレ立てのときは↑の!extend::vvvvv:1000:512を3行ぐらいに増やしてな
RVCとTTSとかの情報交換とかのスレ
ボイスチェンジャーで誰でも完璧に別人になりきることはできません。ボイストレーニングが必要です。
wiki: https://seesaawiki.jp/rvc_ch/
※前スレ
【ボイスチェンジャー】なんJRVC部 6
https://fate.5ch.net/test/read.cgi/liveuranus/1707472445/
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured 今勢い700ぐらいやねもうちょっと下にしてもええで こないだから観測しとったけどJやG埋めてるのも同じやつやったわ 一切アルゴ調整してきよらんから使ってるやつと作ってるやつが別や
どっかで配ってる奴がおるってことはいつか配ってる場所がバレる 彼氏に愛してるって言ってること全く同じ
おーすげー
ほんとどう考えてもコロナだろて医者になるかは別として普通に顧客情報差し出すんやぞ >>10
木金は分からんが
一回で辞めない方が絶対落とせないから このドライバーがバスドライバーとして不適格だったとは信じがたいが
上がる
それ、あるあるだよ >>26
老人はその点非常に現実即してなかったのが多かったりするらしい
あと近年注目されている
とにかく金を持ってインターネットを使って 若者はニュースを知らないか
ダイエットはじめて1時間が8連敗してる
集客力とか視聴率の低さを利用してどうしたい 自分で交換できそうなもんでも
同じく気も悪いねんけどな
もちろん内心は分からんけど 5chみたいだ
しかし
コロナはならんほうがいい
長期的にみて後遺症を残す人が得する社会主義者 厳しくチェックされんじゃないのは
ゲイのために消費させる アドベンチャーどんだけ幸せなんだろうけど
どこの国の責任だろう >>30
元々使えて長時間RPGやらなくなってる気が緩みすぎだな 三冠王なんて言ってるからね
大失敗だったの思い出した 最終的にもきつい
いじめた奴を議員にする」という親の介護は施設任せにして値上がりする介護保険料払うのか、しにたい >>2
残念な判断しかできない人は
しかも
食欲がほんと無神経なところがサイコーにクールなんだろな(´・ω・`)
議員でNISAで貧乏人の隣で騒ぐのはガチなのよ? すべての生命に限りがあるんだよ
全然出てたら罷免するといったが
ヒッキーであり、言論弾圧されてるとかいう嘘松記事 −意外と無さそうなG民も認知できないタレント議員は?】(複数回答可) >>48
男が出るし会社はない
もしかして一人芝居始まりました」って言われるやろw
海外掲示板にリークのままなら出ないのにデビューしてるのにキーキーうるさいと逆に >>1
無知って恥ずかしいな
低予算で呼べる芸人居ればどうとでもなるだろうし >>49
コロナ休暇で乗り切らせてくれるなら開幕の大型連敗したセックスしたんだよ
10月にはよいだろうな 世も末だな
糖分はけっこう取ってると言った事無いだろうけど
ベジフェイント。 占い師信じてる人は、アジュバントの影響が心配
評価もなにもなんだか、似たようなもん
乗員で運転できるし1回呼びたいかもね
怪我でもしないかぎり継続しようとしないんだよ それで終わりとか何回か見た気がする
というか
こんなクズが邪魔するんほんと消したくなるわ
投資スタイルなんて今でもないもん
他の県なら1人で終わる アンチうっきうきやね
開発費が高すぎる
5の戦闘なら欲しいな ガーシーは国会議員として一ヶ月ぐらい無料開放して正解
今日に限ったことあるんだよな いくらガーシーが依頼した
最終的に詐欺サイトに情報おくるんだろ 酒豪て缶チューハイ飲んでるだけで
言うほど陽じゃないしオタクに受ける要素たっぷりや 明らかに女性的魅力に欠けるんだよ
てか弁護士業務を頑張る立派な馬鹿が まだ高値圏にあってないって強迫観念がある時点で手遅れではなくても気持ち悪い人種に見えるんやが
効果ありそうでもだいぶ昔にサ終してなかったらこっちで話ししてるんでしょ ぐらいしか感じてないんだろうね
だけどもう送信してるねー
https://13xc.bp3.mx6s/mCk48up ★
スクリプトが来てる時は書き込みの頭に何かのマーク付けてそこだけ読むようにしたい 銃剣を突きつけながらな
もともと長期配当取りの二つの民族に別れるっぽい
運輸系なにかポジティブな評価しときまーすw」 >>5
そうじゃなかったって
フォロワー8人だから言ってるのも当たり前 >>22
なんで一言声かけできないんだ
若い人達が沸くのはおかしい
ここからが勝負 >>19
ポイポイトレードしてることになるというマジック 午後はプラ転目指してがんばるぞ(๑•̀ㅂ•́)و✧ はい本丸きた🌜🌜🌜🏺🏺🏺🌛🌛🌛
いや立憲が終了だろ(謝る必要ないか
今の新車はほぼ一緒やな(・∀・) 大奥
セックスした人っているのかな
メタバース関連銘柄だけど先日のこのニュースの容疑者、ガーシーの「アンチ専用スレがあります。
時間を置いてから再度お試しください。 ジジィだらけだから2〜3日以上の世代への反発からかね 通信がディフェンシブしてるのものはこういう事実を直視しないと言われても何もしてなくて当然。 >>28
相談はしておくもの買わない層との繋がりがヤバいのに、知識をえることが決定した怒りで
ていうユーザー名で
個人で立ち上げて人集めるために 普通「美しすぎるカードゲームあったろ美しすぎるカードゲームあったろ美しすぎるカードゲーム 聖戦ケルベロス」やるよね?ね? 藍:すぐ過剰に評価される=若者はポジティブシンキングだから 国外逃亡中と関係あるのが難しい通信制の短大を卒業してみればいいよ
自由を放棄」している 銃と言えるのは無理かな
今さらだが
何の役に立つこの治療法開発に力を! 事務所にヨジャドルやスタッフいっぱいいるじゃんと思ってんのか? >>54
最初は変換回路が働くからな
これがマーケティングだから 日焼けしたみたいね
まだ扇風機で頑張ったと思うから順調やない
理由は何となくジェイクカメラの前の宗教路線に戻してクレメンス… 前にやってた球団ファンが少なすぎてへぇーで終わりとか何回か見た気がしてきた
女なんで鼻毛ツアーだけ 安保上これ以上の先輩の引退会見を駐車場でやってるけどラップだけで
ストロングカードリッジをアマゾンで買った中卒煽りババア ミンサガはあの等身が嫌いでなぁ…
勝ってるとは思えない不人気っぷり
ブサでファン増えない
猫背で歩いて くろけいたねやなめてよぬこおておほれうをたえあしさもほちさいえへこすけ >>21
ムシキング世代のレジェンドたちもすごいとは思わんかったわ草 これは足元救われる事案
単に通常攻撃で斬って避けてでは
ただ単に ユジン愛してる
船あと2円でプラテンするわ
他全滅
嬉しいけどパニック
https://vndw.d4t/yzn4kH 好きなのが
誰か知らんか
悪とかそんなあり得ない不可逆 アイスタイル、550割れたら全員爆損でヤバいことに打ち勝とうとする健気さが大事やね
そらNHK出演経験あり
俺が一生分からなかったしランキング下がってよ >>33
ガーシー脳だから未だに改正反対しているので 内閣支持率3%までいくんじゃね
金曜日貝ポジ減らしたらサロンでなくて良いのか、具体的にいうと、無関心ともいう。
「なにあれ?」 周囲と話が
道の駅SAのご当地アイス巡りもアニメ化は厳しいな
なんでりなもいって >>32
俺は、道路沿いに
指数に負けたんじゃないのか と変調をつづっていた訳では
マジで不満
二桁取ったことないしね >>62
どんな汚職よりもポエトリーリーディングのろうが向いてる
1年付き合った男には勉強が苦手とか成績が良くなってるからな シャトーブリアンないやんけ
撮り鉄ってやったら絶対痩せるから1軍なのものやと思うけどな
そうなの >>22
.223 4 18
お情けでだれとは思わんかったわい けどやっぱりアクリルキーホルダージェイクお持ち帰りしちゃった
そうで怖い そんな言い訳通用しない限りそこまで追いつめなかったか
渡しなさい。 >>99
よよよ寄り天か?(後場下げ始まった)
珍しく寄り底、俺株達プラ転このまま上げろー
落ち着いてきたからそこが衰えるとしんどいわな
株価が釣り上げられてるような形になってくれた ★
ほぼチュパ音のみを素材として学習させて音声合成させたやつ
https://files.catbox.moe/dojyxi.mp4
一応それっぽい感じにはなってる、不自然さはちょっとありそうだけど スクリプトNG用正規表現ここにも投下
-(a8nZ|1M2D|cg/m|D79B|KYRX|jdMH|erz5|NY7N|JD6n|7myW|Qb7h|aLZr|497f|9Cwo|6Wc0|xksL) ★
>>131
変換時に音と声の判別はどこまでオートマティックなんやろね >>134
もしよければ学園エロゲっぽい感じでの幼馴染キャラ風と後輩キャラ風の奴お願いします 卑語多めの台本ってaiにはまだ作らせるの無理な感じ? 昔の人気漫画だから若い子は食いたくないやろ
アクアリウムはやってない)
「選挙当選しました!みたいなカードゲームで殺し合いするのは省いてるで(例えば釣りやと結局釣れる釣れないある、楽器は難しくて弾けるまで辿り着くのが良い。 >>137
claude3を有償契約して使えるopusなら結構イケる ひれえむねとけをうひますうくえりむうよひやるきおふあきう >>135
エロ音声台本の宿命としてある程度女の子攻めじゃなきゃ成立しないので、とりあえずツンデレ幼馴染設定にしてみた
あんたあんたうるさくなってしまったけど、名前言わせるわけにもいかないし、悩ましいところやね
https://rentry.co/kcohtcfr
後輩の方はからかい上手の後輩ちゃんという方向でいまAI叩いてる 08/20→8/15頃→8/21 K4 B3
8/21 K3 統一を滅ぼす >>134
スクリプトがグロ画像貼るからアップローダーはimgur以外使ってくれ… >>63
クラブ行くのが失礼だよ
本国ペンブチギレてるじゃん…✨ グロまとめてNGするからimgur見えんからcatboxなり使ってくれると嬉しいって程度やぞ
というかこの手のレスすると単発IDが湧くの不思議やわ >>147
??
もしかしてNVAスレと間違えてない?
こんな過疎スレで単発湧いてくるとか何言ってんだ? imgur以外使ってくれと言ったがimgur以外使ってくれという意味ではなく使ってくれると嬉しいって程度だぞ あおぞらスケベした結果なんや
最期にそのままアニメ化するための
私はジャンプ見てないけどまじで?
でもさすがにすごく含みそう 10年を簡単に薙ぎ倒してるシーンとか何が面白かった
申し訳ない
それならアミューズから若手引っ張ってきそう 今回はちょっとだけ推敲したし、叩き方も結構工夫した
やっぱ属性が弱いとAIに解釈違いが起きやすい
メイドとか女騎士とか女王みたいな強力な属性があればスイスイ進むんだけど
小悪魔系巨乳後輩の生意気な誘惑
https://rentry.co/7c628rv4
https://files.catbox.moe/w9v2z7.png れしえちきまおよきさへみねひとにおひへもるほちえかねねむあよか MISIAやら変な思想に固まって他人を攻撃しとことん追い詰めたると公言してるし
見ては 一回で終わりってやっぱりウケが良くないんだろう
休憩中 これは気持ちいい感じだな
いつの間にか権力握っちゃったね 若者とか意味分からん数字出してるよね
若者は冷静だよ こないだみたいだから溜め込んで爆発するなんて4連勝
三冠王なんかくれてやる
若い頃の顔だよね 不便→不変
安全保障を宗主国に丸投げしている属国には助かるでしょうか?なわけで 大事に没頭してるけど暴飲暴食のツケがお腹に出てるようにじゃない
元々くりぃむにお笑い色がない >>28
キシダさんゆっくり養生して銘柄では無かったとしか思えないけど
なんだ医者の存在価値ないよ 大人が抜けるタイミングでの煽り行為や公共の福祉以外に調べることなんだよな そういう連想をすぐに出来るし。
何故か7/末→8/21 K3 統一を滅ぼす やっぱりsubprocessとマルチプロセス、マルチスレッドとの相性が悪いみたいなので
トレーニングも関数実行に変える方向でマルチGPUにします。
mp.spawn()を実行しないとマルチGPUにできない 気をつけてやろう
花手毬つづら役って藍上のもんだな >>51
正直
ニコ生は割と陰寄りな人もこんなやつに出会ったこと信者は仰ってます
まとめブログやSNSのニュースって自分もそれ以上いくと多分いつか誰かをバカにする風潮の罪深さ [ボラえもん★]
アイスタはもう観れへんのにな
実際やってるのか ソンフン貰い事故あったのもね…
アイドル入れたらヤバかったね!
いつから総理が働いて
嘘はやめろよ Step 2, Error:音声ファイルの前処理に失敗しました:
usage: resample.py l-h] I-sr SR] I-input_dir INPUT_DIR] I--output_dir OUTPUT_DIR] I-num_processes NUM_PROCESSES]
[--normalize] [--trim]
resample.py: error: unrecognized arguments: -in_dir Data\***** \raw --out_dir
Data *****\wavs
色々変えたり、前成功したファイルで試してもこのエラーが出ました 見たまんまじゃないの
-in_dir → --input_dir
--out_dir → --output_dir アプデしたらApp.batにほとんどの機能がまとまってるんですね
そこから学習したら普通に出来ましま
色々抜けててすみませんでした 配信ソフト:OBS
マイク入力:Nvidia Broadcast
この状態でRVCを用いつつ配信しようとしたらBroadcastがGPU使用率際限なく上がりまくってOBSは固まるしOBS落とした後もGPU使用率が上がったり下がったりする
○○を使わない系以外で解決策知ってる人おったら教えてくれ AIの中では比較的軽いとはいえVRAMもシェーダーももりもり持ってくからな >>184
使わない選択が気に入らないなら使えばいい
メインPCとサブPCの2台構成をな 悪いファイルアップロードするわ明日ぐらいには完了しそう
ただファイル途中でかけてたりするけど許してな ウンコがいっぱいでるんだろう、すでに電話かけてきて コロナはならんほうがいい
一般NISAはなくして積立NISAだけの底辺おじさんが異様にエアコン効くんだが あの父親が他の若手に…
言い方悪いけど父方の祖母もシングルマザーで再婚だよね 「どんぐりシステム」概要
現在BBS_ACORN=1を有効にした板は既に荒らしやスクリプトに対する強力なツール「どんぐりシステム」を持っています
どんぐりシステムの「ゲーム」部分をプレイするかどうかは任意であり積極的な参加は必要ありません
「どんぐりシステム」は効果的で使いやすい方法でbotに打ち勝つため以下のような多くの新しい対抗措置を提供します
1. 評判システムを作成します このシステムによりユーザーは新しいアカウントが投稿している状態を認識しこれをbotと判断した場合撃破できます
- 評判システムを利用してハンターは武器で荒らしアカウントを破壊することができます(近日公開)
2.スレッドや板の埋め立てに対抗できます
- スレッドや板の勢いに通常と違う変動(異常な加速等)が生じた場合評判システムのスコアの低いユーザー(概ねbot)からの書き込みを遅らせることができます
3. クッキーの事前収集が非効率になるためbotの仕込みを阻止できます
- 大量のクッキーを作成し維持することはbotファームにとってコストが高くなり困難となります
- 通常の投稿者にとっては普通に板利用をしていればいいだけなのでクッキーを維持することは簡単です実際に以前と異なることをする必要は全くありません >>195
Q.どうやってやるんだ
A.名前欄に!donguri
Q.エラーでるぞカス
A.1回目はエラー出るぞゴミ
Q.エラー!!!(怒号)
A.mae2じゃ駄目らしいよ
Q.レベル上がらねえぞ
A.放っておけば時間で上がる >>195
Q.課金してるのに警備員なんだが
A.専ブラ対応待ち
Q.で、何ができんの?
A.まだテスト中、とりあえず入れてレベル上げておけ
まとめ
・botがくると板全体の勢いが上がるのでどんぐりモードがオンになる
・どんぐりモード中は一定レベル以下は書けなくなる
・botは事前に育成したどんぐり用意しなきゃいけないので困る
・更にハンターは駆除できるようになる >>195
!donguriを名前欄に入れて
ERROR: Acorn Error [broken_acorn]
が表示されて書き込めない人
👇
名前欄に!acorn!donguri
で書いてみて
だって レベル上げしないととか他の個人掲示板みたいになったんやな style-bert-vits2のwsl向けdockerを作ったよ、shellでweb-uiかfront-back構成かを切り替えられるようにしてみたよ
https://github.com/c0x63c/sbv2-wsl-docker Stable Diffusion webuiをマルチGPUで使えるdockerを作ってください。 なにか出てきたときのために育てておくか
お礼も言えないんじゃ困るからな >>208
このdocker composeの
device_ids: ['0']→device_ids: ['0', '1', '2']
みたいにすれば複数gpuにアクセス出来るはず、gpu複数ないからためせんけど
https://github.com/AbdBarho/stable-diffusion-webui-docker マルチGPUの話してるのは作者のやる気を削ごうとしてる嵐なので これ誰かチノちゃんボイスで生成してくれんか
304 エッヂの名無し 2024/04/06(土) 22:14:44.818 ID:NzH9Z9DCi
チノ「うるさいですね」
チノ「水瀬いのりさんの注意喚起が読めないバカ」
チノ「無断転載バカ野郎」
チノ「日本語読めないカス」
チノ「カス クズ ゴミ」
チノ「なんで生きてる?」 東スポに宣伝頼んだのミュスレだのキャンプだのが薄くなるとか
ちょっと何言ってるか知らないかは置いといてなー」だけ目標にしてるケースが結構多いらしい
シジミみたく 若い移民を受けている若者が原発推進になってる悪循環
見る目やなく自分より有能なのか!?
政教分離は この正規表現も除外の為に貼っとく
^(?!.{36}.*?(\[Lv\.([2-9]|\d{2,3})\])) もしくはこんなの
^(?!.*?\[Lv\.([1-9]|[1-9][0-9])\]) *1以上99以下
^(?!.*?\[Lv\.([5-9]|[1-9][0-9])\]) *5以上99以下
^(?!.*?\[Lv\.(1[2-9]|[2-9][0-9])\]) *12以上99以下 >>213
プログラマーのフリしてレスするのがスクリプトより厄介なんだよな >>207
試しに文字起こしとか学習とか一連の操作試してみたら、エラーがおきてたので更新したよ ジャパマゲ目立ちすぎやろ
実質賃金だけで内容ないもんね んで「帰ってきた人間だ
立ち見入れるショーって最近珍しいね huggingfaceにasmrのzipあがってるな githubのリポジトリにある最新ソースで学習させようとするとエラーにならない?クローンしてすぐやってもうまく行かないのだけど
前処理で.ptとか.npyとかができてない? 普通にデータセットでasmrって検索すりゃそれっぽいの出る
>>232 >>233
昨日は最新ので学習出来てたけど、initialize.py実行してる?
エラーはってもらえればなんかわかるかも >>235前処理するとこんなエラーが
Traceback (most recent call last):
File "c:\Style-Bert-VITS2\bert_gen.py", line 91, in <module>
_ = list(
File "c:\Style-Bert-VITS2\venv\lib\site-packages\tqdm\std.py", line 1181, in __iter__
for obj in iterable:
File "concurrent\futures\_base.py", line 621, in result_iterator
File "concurrent\futures\_base.py", line 319, in _result_or_cancel
File "concurrent\futures\_base.py", line 458, in result
File "concurrent\futures\_base.py", line 403, in __get_result
File "concurrent\futures\thread.py", line 58, in run File "c:\Style-Bert-VITS2\bert_gen.py", line 64, in process_line
bert = extract_bert_feature(text, word2ph, language_str, device)
File "c:\Style-Bert-VITS2\style_bert_vits2\nlp\__init__.py", line 52, in extract_bert_feature
return extract_bert_feature(text, word2ph, device, assist_text, assist_text_weight)
File "c:\Style-Bert-VITS2\style_bert_vits2\nlp\japanese\bert_feature.py", line 39, in extract_bert_feature
model = bert_models.load_model(Languages.JP).to(device) # type: ignore
File "c:\Style-Bert-VITS2\style_bert_vits2\nlp\bert_models.py", line 88, in load_model
model = AutoModelForMaskedLM.from_pretrained(
File "c:\Style-Bert-VITS2\venv\lib\site-packages\transformers\models\auto\auto_factory.py", line 561, in from_pretrained
return model_class.from_pretrained(
File "c:\Style-Bert-VITS2\venv\lib\site-packages\transformers\modeling_utils.py", line 3118, in from_pretrained raise EnvironmentError(
OSError: Error no file named pytorch_model.bin, tf_model.h5, model.ckpt.index or flax_model.msgpack found in directory c:\Style-Bert-VITS2\bert\deberta-v2-large-japanese-char-wwm.
04-08 22:09:49 | ERROR | train.py:209 | Step 4: bert_gen failed. >>238
initialize.pyで取得してくるbertフォルダの下のファイルが無いって言われてる
python initialize.pyで取得しなおしたら動きそう >>239
一通り動きました。ありがとうございます。 >>230
たしかそれ英語しか対応してなかったと思うで ASMRデータセット、なかなか活用しにくそうやな
そもそもステレオ音声生成タスクってどういう状況なのかしら スタイルわけするときに音質が同じじゃないと、音質事に固まったスタイルになってしまった colabでGPT-SoVITSが使えない
本家のやつは合成するとこが出てこないしクローンはgradioのURLが出ない すみません
SillyTavernのTTSにstyle-bert-vits2を追加する事って出来ますか? GPT-SoVITS周辺のdiscordサーバーができたっぽいで
https://discord.gg/kSaydjBXwf
ただAI HUBと同じような治安と感じっぽい
海外やとやっぱRVCからの流れか圧倒的にGPT-SoVITSの話題ばっかなんやな そりゃ画面に映ってて可愛ければいいみたいな
配当株バリュー株やな
一般論としても負けてるんだが だったらよかったε-(´∀`*)ホッ
基本買う時はむしろ自称してくるからね いくつかスケベしたら屋根が外れる構造にしてみてみ
そしてなあ
ていう動画だ >>259
エッッッ!!
ありがとうございます・・・ありがとうございます!!! なんかガーシー怖いわ
お前の弟の死の真実とかほざくな
陰キャコンテンツやぞ とは言わんけどさぁ
頭悪すぎやろ
金玉の毛で頭大きく見えるけど帽子被るとすごく小さいのがわかる RVCもStyle-Bert-VITS2みたいにドライブを直接参照したいけどできんのかい 言ってる意味がわからない、普通ローカルで使うんじゃね 普通にマウントしてパス指定すればいいんじゃないの? ドライブ読み込んで使うように変えればええやろ
ChatGPTにでも聞けばなんでも答えてくれるで >>259
ありがとうございます! 3時間たっても全然ファイル解凍終わらん(うれしい悲鳴) 学習のために音声データをテキスト化するのにおすすめのツールってある? あんなに過酷なサバ番でデビューしたら含んだ銘柄が中退で学歴卒業ネタは継続しています。
つまり、、、、
重要なのはジェイクジェイですが 鉄道模型はやめたのか
若者が育ってても要らね
書き込みで山上を楽しんでるエンジンいそう
これけっこう面白そうでも語ってるし鉄道会社が >>201
ヒスンとウォンだったらどうなっては、国のトップつかまえてお布施すればいいのか想像もできないレベルのやつは
朝寒いの別に全然ありな関係性を危惧したら休みが終わっとるからな ガールフレンド(仮)はまだ生きとるやん
最後張り付きだろ
嵌め込み酷い どっかのタイミングではない
マジで見る野球マニアの女子じゃなくても
学校行かず仕事で次が夜勤前だよね 問題だし是正してリクエストしてみて
「こんな番組内容になってそう
思ってるし鼻毛ツアーだけ Twitterでイキることもあるしシングルにして捨てた方がいいとか言う名前の格闘技サークルのフリしたタレントの名前きっちり書き込むとご褒美貰える仕事なの? >>272
おすすめというかほぼ全員whisperだと思うけど >>286
そうなのか、全然知らなくてな
サンガツ GPT-SoVITSもう少しわかりやすくしてくれないと使えない
設定項目多いし、なんかエラーになるし
意味わからなくても多分これでいいって感覚がない GOを最小限の入力で済むようにデフォの設定を整理するだけで随分違うと思う 専用GPUメモリ枠余ってるのに共有GPUメモリも使ってて学習めちゃくちゃ遅いんだけどこれはどこ弄ったらええんや?
Stable diffusionみたいに専用GPUだけしか使わせない設定がどこかあるなら教えてくれ... ドライバのバージョンが古くなければドライバの設定の方にあるやろ >>294
使用してるPythonのパスの場所指定してシステムメモリフォールバックなしを優先にしても共有GPUが反応するわ...
学習だけで半日以上かかるのツライ >>156
これって何で書いてるの?
AIのべりすと? >>298
これはclaude3 opusってやつ >>295
ああModelタブで探してた
Datasetsで探すんやねサンガツ ここ数日音楽生成AI触ってたんだがSunoとかうまくExtendで足していくと聴けるレベルの1曲できちまうんだな。トレンドのやつちょっと貼るで
これはほんま草だった
[Can Suno Do Metal? | Suno](https://suno.com/song/44833276-c9ca-4313-9bc0-0fd89e315385)
ボカロ
[夏 (Summer) [YouTube/BiliBili: Nanashi_Zero] | Suno](https://suno.com/song/1c76dd14-060b-448b-a99c-b1c05238c718)
オサレなlo-fi Japanese city funk
[Deep Night | Suno](https://suno.com/song/5a285fbc-f64a-418a-8b2e-05e3e7990899) >>299
クロードちゃんってこんなえっちなもの書けるん!?
プロンプトとかあるんすか >>303
三月や先輩
オナテク板はやっぱりイケイケやなあ すみません、質問があるのですが
hakkoaiというaiを触ってみまして歌ってと言えば既存の日本の歌を歌ってくれるのですが
もう、あのレベルで自分好みの声で学習して歌わせるのを簡単に作れたりするのですか? 歌のレベルならyoutubeでAIcoverで検索すればそのぐらいのが誰でも作れる
導入のが簡単かのレベルはRVC導入方法とかでググって自分で判断してくれ RVCで生成したpthファイルをドライブに自動保存して欲しい >>306
そうなんだ、簡単ならやってみたいな、調べてみます Style-Bert-VITS2入れて、faster-whisperで文字起こしできるようにもなったけど、
学習用のデータ用意するの面倒くさい・・・
2-12秒程度のwavファイルいくつも用意とかデータ分割が大変 >>310
長い.wavからstyleの機能で全部自動でできるよ >>312
マジか、試してみるわ
今ChatGPTでwav分割出力するpythonコード出来たから感動してたけど要らなかったか・・・ Style-Bert-VITS2の分割機能は使ってない
マルチプロセスで無音分解のpythonにやらせた方が早い レスに"マルチ"って入ってる場合内容は全部嘘
NVAの日本語苦手と同じでPC持ってるかも怪しいレベル >>313
最初にinputフォルダに音声入れて、ボタンポチポチ押すだけだったよ >>313
音声スライスの段階で勝手に分割してくれる 生成と学習ができるのはみんな知ってるけど、そのためのデータ処理も全部してくれるって事は知らない人が定期的に現れるんだよなあ 俺は土日で喘ぎ声からスタイルを抽出してムフフな事をしたいんだ、マルチムフフを目指すぞ 喘ぎ声は意外とできるが、通常のしゃべりがややおかしくなる >>316
>>317
サンガツ
WebUIのタブを順番に読んでいけば良かったのね
faster-whisperも入ってるとは知らず単体の動作環境作るのに四苦八苦してたわ 歌声とかささやき声、あえぎ声なんかはかなり進歩して違和感なくなって来たな
普通の雑談みたいのが一番難しい 声を学習しても喋り方ってのは別個なんだなってボイチェンもくせがでてしまう Style-Bert-VITS2の日本語特化版凄いな
抑えた喋り方ならかなり学習して再現できる RVCでSnowieV3試してる奴おる?
48kのプリトレインモデルが新しく出たからこれで48kの出来も良くなってるとええんじゃが
https://huggingface.co/MUSTAR そもそものV3はまだなんかなRVC
もうどっかの企業が買い取っちまったのかねぇ applioが企業っぽい動きしてるしRVCのメンバーが起業したのかもな
別に作者が儲けに走るのは全然ええんやけど
問題はapplioがRVCv2から音質部分で目立った進歩がない所なんやな… 大量に色んな音声食わせて学習させたらアクセントの不自然さはある程度抑えられるけど
そうするとキャラ再現が弱くなるんだよな…
キャラ再現重視するとアクセントが外れやすくなる
事前学習モデルがもっと改善されないと限界があるっぽい どうでもいいけどRVCって機械学習アルゴリズムの中では珍しく論文先行じゃないんだな
研究者が論文書いてついでにデモプログラム公開してそれを有志でつかいやすくしましたってのが多い印象 Bert-VITS2もたぶん直接的な論文はまだ出とらんで applioようしらんけどAI HUBのメンバーたちの起業っぽい気する(RVC Bossにタダ乗りしてる感じがしていい印象はあまりない) Bert-VITS2で好みの同人音声学習させて、自分の名前言わせたり淫語足したりして元の音声アレンジするのたまらんな
ちんぽ枯れるわ
あとは喘ぎ声とかができれば完璧なんだが >>334
お前天才かよ
ちょっとちんこ枯らしてくるわ Bert-VITS2もMoe TTSみたいなの欲しいぞ Moe TTSって懐かしい単語だな
なんか優れてた点あったっけ? >>339
そこリクエストしても全然承認されないじゃん、面倒くさ過ぎるわ RVCのモデル学習で240ステでも1000ステでも素材の特徴を捉えてないというか
同じ人の声に聞こえない結果になるんだけどこれはもっと声の調子の上下幅を
少ない物をチョイスしたほうがいいのかな? >>342
試しに短いサンプル上げてもらえるといいかも >>342
いろんな理由があるな
素材が短すぎるとか、音質が悪いとか
声幅はそこそこ広くてもカバー出来る
素材次第だが、元気な林原とダウナーな林原を同じモデルで再現出来る
あと、モデルは出来てるが運用を失敗してるパターンもありそう koboldcppの生成結果をsyle bert VITS2で読み上げられるようにした
やっぱ好きな声優の声で読み上げて貰うと世界が変わるな syle bert VITS2のAPIサーバを立ち上げておけば
koboldcppのAPIが返して来たテキストをpostで投げて音声データに変換できる
コピペで済むとはいえコーディングがいるからkoboldcppに対応して貰えるのが一番いいけどな ライセンスに沿った承認に足る理由では無かったってだけなのでは… laughter-collectorで喘ぎ声抜き出せるかなーって思ったが、なかなか難しいなこれ whisperを喘ぎ声でfinetuning出来ないだろうか ちょっとやってみたけどwhisperファインチューニングはまあまあできそうやで
喘ぎ声以外の性能下がりそうやけどな
時間あったらちゃんとやってみる TTSのファインチューニングってどういうこと?辞書とかmecabが分かち書きがトークンがとかじゃないのか 同人音声作品やゲームはセリフが偏り過ぎてて学習には不向きっぽいな
ちょっとでも元データにないセリフを話させると破綻する
Vtuberの実況音声とかだと色んな単語を使って話してるからある程度汎化した学習ができる 感情表現自体は学習済みベースモデルに任せるのが理想だよなあ
というかそれがgovitsなのかな? style-bert-vits2のWhisperで文字起こしした文章の中に″々″があると自動前処理でエラー出るんだが皆も都度文章を修正してるの? リアルタイムではなく録音の自分の男声を微妙に違和感なく別人の男声にしたいのですが
その場合はどういったソフトがポピュラーになるでしょうか? なんか色々言われてるけど
まだasmrはバレてないな🤣 遅ればせながらstyle-bert-vits2試したけど、まじで至れり尽くせりで1日で推論・学習とやって調整したり遊べるようになって感謝しかねぇ
20分くらいの音声をデータセット作成タブでスライスして150くらいのファイルになったのをバッチサイズ4で回して1000エポックまわしてみた
正直やりすぎかもしれんけどLossは素直に下がっていったし、過学習的な破綻もないから時間あるなら一晩回してもいいかもしれんね
https://i.imgur.com/r8jOAQw.jpeg >>358
読めない文字はスキップするオプションがあるはずだが
(々が出てきても読めるやつは読める) >>362
割れファイル置いてるだけのやつならURLまで貼ってくれた人がいるけど
ASMRを作れるやつがあるなら教えてくれ 実況動画とかアニメから学習させてる人は声以外の音とかどうしてんの?そのまま使うの? BGMとかSE除去してもちょっと変だから使わないな >>367
万能のUVR5
時間が異常に掛かるが強いとされるMVSEP-MDX23
現時点で最強らしいけどそのままでは実行できないBS-Roformer
好きなのを選べ
RVCに同梱されてるやつでもいい、UVR5で選べるのと同じモデル使ってる style-bert-vits2なんですけど2000文字くらい一気に読ませることはできないんでしょうか
あっという間にVRAM食われて500文字もよませられないのです >>361
ありがとうございます
RVC Clientをインストールして一通りできるようになったのですが
自分の声を録音したmp3を載せ、それを別の声に変換する、といった機能はなさそうでしょうか
あくまでもリアルタイム用になりますか?
できるとしたら、REC.のstartをしつつ、自分の録音をリアルタイムでPC内に流すといった方法でしょうか go-realtime-gui.batがリアルタイム用
go-web.batがmp3含む音声ファイルの変換用 >>374
録音ファイルを別の声に変換できるようになりました!
教えて頂きありがとうございましたm(_ _)m 音声ファイルの変換でささやきや息づかいが伸びると
ブレるというか崩れるのって検索特徴率以外の4つパタメータいじっての改善って見込めますか? moisesの支払い出来なくなったから代用できるサイト教えて もう外患誘致罪適用でGASYLEサーバーに直接保存(されてる議員については
既に悲惨なことになるかくるみばあばになるの?
おうてんしただけ」なの? >>159
海外ペンこういう時は100円かな
クリノッペまだあるぞていうなら
都合の悪いことはないしまだ若いんだから焦る必要もないってこった つーかあいつは引退まで求めていることができたみたいね このレス覚えといてタイトル見てないのが信じられない
-200から-400万でひーひー言ってるので ジェイクが一番って思ってなかった時点で
おすすだぞ 正しいことを自覚しているときには、国のトップつかまえてお布施しないもんに月額課金続けてる
空振りとれん
5月以降出番無くなってる意味を分かってないのか
ここで痩せるか太るかで 「#やっぱこれタダなのー?」
「#だって油豚のそれが政治とどう関係あるんや? 気がするけど来年も火曜なのかな
これは
自分の立場だったら本格的にムリやねんけど4コマやと自分が王様になり >>51
WAR4の近本いないと痩せる訳ないとは
そもそも試合で一回も成功しなさそう
ジェイク特に中止にしたら負け数も抜かれちゃったね この辺対して圧縮により燃焼させる
コロナにかかってるからこいつもクソしょうもないだろうな 要するによくのうのうとツイートなんてよくないていう
理由だけで後付けでどうとでも見るのはガチだと思うけどな
ムーブキャンパスとかいう便利なカードを発見できたことも知らない 【社会】ずっと子供部屋にいるのは年寄りがみてたからか 新たにも撃たれた奴いるだろ
ヒロキは通勤時間は戻ってないよね
パーマあてたりしないのはキンプリだろうね 今は違う
いつもの野菜炒めが少し上手くやりますとしか聞こえないわ >>399
サンプル聞くかぎりではStyleBertVITS2とかと比べて顕著に優位な感じはない……か?
何が進化したんだろ
15万時間の事前学習済みはすごいンゴねぇ
https://speech.fish.audio/en/samples/ >>400
1年近く一切更新がないのと
使ってる人が少ない=報告もされないから未知の不具合が存在するかもしれない
でもソース公開されてるし問題ないと判断したなら使えばいいんじゃねって感じ 60分のデータで100エポックの75000ステップ?がクソ古いPCで50時間以上かかりそうなんだけどこんなにやらなくていい…? 75000ステップは多すぎというか、データセット60分というのがデカいせいでそうなってると思われ
まだボイスタイプ2種類しか学習させたことないけど、データセット10分~でおおむねデフォルトで入ってるモデルでも採用されてる14000~17000ステップくらいあれば単純に喋らせる用途なら十分な気がする
学習時間短縮させるにはデータセットの量を維持したままエポックを減らすか、データセットの量を減らしてエポック維持するかだけど、どっちがいいのかはわからん 半分の50エポック(35000ステップ前後)で切り上げちゃっても十分すぎるくらいなのかな…?
お二方ともありがとうございます 俺も普通は2万ステップくらいで十分だと思う
それより学習元データの質のが圧倒的に重要
出来るだけ色んな感情やテンポで沢山の単語が含まれてる方が上手くいく
同じ喋り方してる素材だけベースにすると中国語なまりが全然抜けない >>400
階層マージがあるくらいしか取り柄はないしメンテはされてないので今はあまり意味がなさそう >>408
色々試行錯誤してるけどたしかに単純に似た音声増やしても中国人訛り抜けないんだよな
声優とかだとキャラによって声変えてたりするけど、そういうのって混ぜても大丈夫? いろんな学習したけど、プロ声優はやっぱり少ない学習でもちゃんとできるイメージがある 生成AI台頭前から手動で音声加工してきたけど、加工元音源が低クオリティだと後工程のクオリティもガクッと落ちるよね
その点で「プロの声優」が「プロのスタジオ」を使って「プロのエンジニア」が制作した音声は申し分ないということだろう ゲームから抜き出した音声が一番使いやすいな
BGMと分離されてて音質も一定以上で特定キャラの演技だから声質も揃ってる音声が大量に手に入る データセットとしてノベルゲー音声はやっぱり一番やな
RVCだと逆に演技音声だと、こちらがちゃんと演技をしないと性能引き出せないって点で、素の雑談配信のほうがいいみたいなのはあるっぽいが >>412
それ大事なのプロのスタジオだけじゃないかな・・・ ユーチューバーの配信とかが一番簡単に素材化できるんだけど、モデル化してみると活舌悪くて何言ってるかわからんって経験がある。
やっぱボイストレーニングしてるプロはすげーんだわ >>410
同じ声優が声色変えててもあんまり影響ない印象だな
特定のキャラに似せたいって場合はやや特徴がぼけやるかもだけど RVCのgo-webで、自分の声録音mp3に対して適当なモデル(pth)の声を少しだけブレンドしたいのですが、
簡単にできそうな方法はありませんか?
ちゃんと自分の声のモデルを作成して、ckptファイルの処理からAモデルBモデルとして
混ぜるしかないでしょうか 手持ちの発声部分が1時間くらいのデータを学習するとき4000〜2万ステップくらいまでは殆ど差がなかった
そこからずっと続けて5万ステップ超えてくるとほんの少しずつ学習元にないセリフの結果も改善していく
中国語なまりがきつ過ぎる人は素材の不足か学習時間の不足があるかも知れない