使用昇腾训练和CPU训练的问题

minder · 2025 年11 月 18 日 03:50

昇腾设备训练似乎和CPU训练有所差异，使用mindspore在昇腾训练时，对于分类任务，不支持mindspore.int64，但是CPU上没有这个问题。而且在使用全零初始化权重的情况下，二者收敛速度差异较大，在昇腾上收敛速度远快于CPU，为什么会有这种情况？
还有就是推理时mindspore-lite默认使用float32还是float16？

chengxiaoli · 2025 年11 月 18 日 03:51

用户您好，欢迎安装使用MindSpore。已经收到上述问题，会尽快答复~

longvoyage · 2025 年11 月 18 日 06:26

1.对于分类任务，不支持mindspore.int64

→ 这个应该是某个算子在昇腾下不支持int64,但是cpu下支持int64

2.速度快

→ npu的作用不就是加速运算.肯定要比cpu快.架构决定的.

3.mindspore lite推理的类型

这个不是由模型决定的吗?模型如果定了输入和内部算子的类型,整个流程就是定了.

minder · 2025 年11 月 18 日 06:30

不是训练速度快，是优化速度快，损失值降得快。相同训练轮次下，Ascend设备上得损失下降远快于CPU

longvoyage · 2025 年11 月 18 日 06:34

这个真没注意过,理论上算子的计算结果不会相差太大,所以不应该出现这种情况.

minder · 2025 年11 月 18 日 06:37

是的，因为我本地没有昇腾环境，我在本地测试CIFAR10的训练情况时使用得CPU，前20个epoch从2.4下降到2.0左右，昇腾上从2.1下降到了1.7，所以感觉很奇怪

longvoyage · 2025 年11 月 18 日 07:06

2.4下降到2.0

2.1下降到了1.7

你是说2.4和2.1的差异吗?这个估计是有些算子的初始化权重不一致造成的,除非你把所有的算子的权重初始化为0.

chengxiaoli · 2025 年11 月 20 日 06:23

@minder 用户您好，MindSpore支撑人已经分析并给出了问题的原因，由于较长时间未看到您采纳回答，这里版主将进行采纳回答的结帖操作，如果还其他疑问请发新帖子提问，谢谢支持~

system · 2025 年11 月 20 日 07:24

此话题已在最后回复的 60 分钟后被自动关闭。不再允许新回复。

话题		回复	浏览量
mindspore lite 已经支持飞腾DSP，是推理和训练都支持吗？还是只支持推理？ MindSpore Lite推理部署	1	55	2025 年10 月 20 日
MindSpore网络推理时使用Matmul矩阵乘法算子计算速度较慢推理经验-Inference Experience	0	34	2025 年8 月 1 日
MindSpore训练时报错：TypeError: For ‘MatMul’, the input data must be float16, float32, uint16 but got int32 功能调试-Function Debugging	0	25	2025 年10 月 27 日
mindspore lite训练，急急急！！！ MindSpore Lite推理部署	3	75	2025 年12 月 2 日
【模型微调】指定Ascend设备但仍然使用CPU 问题求助 Help	4	53	2025 年11 月 24 日

使用昇腾训练和CPU训练的问题

相关话题