1 系统环境
硬件环境(Ascend/GPU/CPU): Ascend
MindSpore版本: mindspore=2.6.0
执行模式(PyNative/ Graph): 不限
Python版本: Python=3.9
操作系统平台: Linux
2 报错信息
2.1 问题描述
在使用昇思MindSpore 进行分布式训练时,发现训练会错误,查询了具体的错误信息如下。
2.2 报错信息
RuntimeError: HCCL AllReduce failed, device type of rank 0 is Ascend, rank 1 is CPU
3 根因分析
此处由用户填写~
4 解决方案
此处由用户填写~
包含文字方案和最终脚本代码 请将正确的脚本打包并上传附件