>>822
LoRAだと使いづらいかもしれん
このスクリプトの目的はどっちかというとPixart-SigmaやHunyuan-Dit、sd3など自然言語+ T5 LLMのモデル用のキャプションを生成するためや
つまり、ファインチューニングやな
その目的ならSwinV2 tagger v3 + しきい値0.5の方が良いと思うで