text2videoもZeroscope_v2 XLとかいう強めのモデルが出たしもっと注目されてもええと思う
ただし生成するにはVRAM15.3GB必要()

https://video.twimg.com/amplify_video/1672650028291178496/vid/1280x720/efYxGqL6T6FzYu_d.mp4