512で学習してるから768とか1024は意味無いって主張よく見るけど
論理がどうつながってるのか分からん詳しく教えてほしいわ
俺の理解だと512も768も1024もVAEで固定長の潜在空間に叩き落されるって認識
1024のほうが潜在空間に情報持っていけるって思ってるんだけど潜在空間のサイズ小さすぎて意味ねえって話か?