対4090で単純規模比では1.3倍やから
演算の8bitや4bitサポートが強化された分でFluxが2倍とぶちかましとるんやろな
やたらとTOPSにこだわるあたりもそれを証明しとる

fp16がblazing fastとはいかなそうや