被BFloat16背刺了
大语言模型吧
全部回复
仅看楼主
level 3
KyvYang 楼主
为了节省显存和加速训练使用了全bf16训练,却总是莫名无法收敛,换成fp32一看才发现精度出了大问题
2025年06月21日 05点06分 1
1