>>461
サンプルのデータセットを見た限りでは
1ファイル10秒を100個ぐらいセットにしていたね
サンプルボイスを合計して15~20分ほど必要なんじゃない?