求助各位,关于pytorch分布式训练错误及其他
github吧
全部回复
仅看楼主
level 3
具体是这个项目网页链接 ,我是第一次下载GitHub项目。
1.我运行图一代码后,却报错,如图二。在网上搜到说
在torch.nn.parallel.DistributedDataParallel函数加上find_unused_parameters=True,可是不知道这个函数在哪。
2.我想知道图三的代码是干嘛用的?需要输入吗?非常感谢各位批评指导!
2024年01月22日 03点01分 1
level 3
图二图三弄反了,不好意思各位!
2024年01月22日 03点01分 2
1)图一和图三的命令,命令末尾的反斜杠 \ 是 Unix/Linux 环境下的续行符,Windows 上的续行不是这个符号,而且 Command Prompt 和 Powershell 的续行符也是不一样的。我没怎么用过 Command Prompt ,Powershell 的续行符则是反引号 `
2024年01月24日 02点01分
1