首次训练模型老出错终于是跑通了
stablediffusion吧
全部回复
仅看楼主
level 7
张云帆😈
楼主
练了个flux半精度的lora模型不知道效果会怎么样,512*512的20张图训练要8个小时
2025年05月12日 16点05分
1
level 5
mEga
flux底膜是基于1024*1024训练的吧,你用512*512的图片去训练lora效果可能一般。
2025年05月12日 22点05分
3
张云帆😈
没办法,显存只有16g,大图跑不动
2025年05月12日 23点05分
level 6
yideli2009
我练一个fp8的1024的lora显存都要吃30g,你的fp16 512怎么才吃13g?
2025年05月12日 23点05分
4
张云帆😈
那就不知道了,我按着别人的视频教程填的参数!训练的批量大小只填了1,这个应该是能减少占用吧
2025年05月12日 23点05分
yideli2009
@张云帆😈
估计使用了类似offload的方法,不知道这样玩对训练速度有影响不
2025年05月13日 13点05分
level 1
眉间计
可以尝试用OneTrainer这个训练器
2025年05月13日 06点05分
6
张云帆😈
好的,回头试试看
2025年05月13日 07点05分
1