ボイチェン(音声を入れたら音声が返ってくる)とテキスト読み上げ(テキストを入れたら音声が返ってくる)は違うから、その目的ならRVCじゃね