求助各位,关于pytorch分布式训练错误及其他
github吧
全部回复
仅看楼主
level 3
糖精爱加不加
楼主
具体是这个项目
网页链接
,我是第一次下载GitHub项目。
1.我运行图一代码后,却报错,如图二。在网上搜到说
在torch.nn.parallel.DistributedDataParallel函数加上find_unused_parameters=True,可是不知道这个函数在哪。
2.我想知道图三的代码是干嘛用的?需要输入吗?非常感谢各位批评指导!
2024年01月22日 03点01分
1
level 3
糖精爱加不加
楼主
图二图三弄反了,不好意思各位!
2024年01月22日 03点01分
2
Dragon1573
1)图一和图三的命令,命令末尾的反斜杠 \ 是 Unix/Linux 环境下的续行符,Windows 上的续行不是这个符号,而且 Command Prompt 和 Powershell 的续行符也是不一样的。我没怎么用过 Command Prompt ,Powershell 的续行符则是反引号 `
2024年01月24日 02点01分
1