MindSpore 分布式训练报错RuntimeError: HCCL AllReduce failed, device type of rank 0 is Ascend, rank 1 is CPU

1 系统环境

硬件环境(Ascend/GPU/CPU): Ascend
MindSpore版本: mindspore=2.6.0
执行模式(PyNative/ Graph): 不限
Python版本: Python=3.9
操作系统平台: Linux

2 报错信息

2.1 问题描述

在使用昇思MindSpore 进行分布式训练时,发现训练会错误,查询了具体的错误信息如下。

2.2 报错信息

RuntimeError: HCCL AllReduce failed, device type of rank 0 is Ascend, rank 1 is CPU

3 根因分析

此处由用户填写~

4 解决方案

此处由用户填写~
包含文字方案和最终脚本代码 请将正确的脚本打包并上传附件