模型推理时TransData算子耗时多

chengxiaoli · 2026 年1 月 14 日 02:36

1 系统环境

硬件环境(Ascend/GPU/CPU): Ascend
MindSpore版本: mindspore=2.6.0
执行模式（PyNative/ Graph）: 不限
Python版本: Python=3.9
操作系统平台: Linux

onnx模型转换为.mindir格式后，查看profiling数据，其中transdata算子耗时占了总耗时的23.6%，这种情况下一般是什么原因？

按照如下试了下，[acl_build_options]里的input_format=“ND”，[ge_session_options]里的ge.exec.formatMode=1都配置上，结果还是一样，这种情况是否可以说明和配置无关，就是部分算子不支持ND格式导致？

主要算子消耗是BatchMatmul、SelectV2、SoftmaxV2、LogSoftmaxV2、LayerNorm，此时如何判断是哪些算子不支持ND格式？

试着看了下dump出来的ge图， softmax，batchMatmul，select等很多算子之前看起来都有transdata，是否正常？

尝试着又配置了下plugin_custom_ops=BatchMatmulToMatmul，想看看是否BMM和MM会不同，结果执行benchmark时加载模型报错：CreateDataBuffer] Malloc device buffer failed.

此处由用户填写~

此处由用户填写~
包含文字方案和最终脚本代码请将正确的脚本打包并上传附件

kang_zl · 2026 年1 月 30 日 11:50

话题		回复	浏览量
模型推理时TransData算子耗时优化推理经验-Inference Experience	0	70	2026 年1 月 30 日
TransData算子耗时多，如何优化？ MindSpore Lite推理部署	4	164	2025 年12 月 15 日
【MindSpore报错解决地图】常见报错问题和解决方案（持续更新）经验分享 Tech Blogs	3	240	2025 年11 月 17 日
MindSpore网络推理时使用Matmul矩阵乘法算子计算速度较慢推理经验-Inference Experience	0	49	2025 年8 月 1 日
onnx模型转换成mindir模型出现兼容问题问题求助 Help 模型 , 推理 , 部署	3	174	2025 年7 月 15 日