请教关于训练速度的问题
deepface吧
全部回复
仅看楼主
level 1
revengekq 楼主
我租用的是GPU服务器,配置:64核8575C CPU,96G内存,A100(40G)显卡,虚拟内存300G,目前CPU使用率在15%,内存使用率50%,硬盘是Red Hat VirtIO SCSI Disk Device,GPU使用率一直处于波动状态,从90%到0再到90%,使用的deepfacelab版本是ICE版,显卡驱动是最新驱动,CUDA是12.6。模型分辨率384 SAHED,BS是12,模型训练速度现在是1000ms。
有大佬知道这个训练速度是合理的吗?我感觉偏慢,有没有办法提升一下,另外就是能够稳定一下GPU使用率以及提升CPU使用率?
2025年12月05日 03点12分 1
level 8
建议去ice群里问
2025年12月05日 06点12分 2
有群号吗?
2025年12月08日 03点12分
1