|
关于“调优经验-Tuning Experience”类别
|
|
0
|
28
|
2025 年6 月 5 日
|
|
onnx算子精度是fp32,使用atc转换om后都变为fp16,精度降低了,如何保持原精度?
|
|
1
|
17
|
2026 年1 月 30 日
|
|
onnx算子精度是fp32,使用atc转换om后都变为fp16精度降低,保持原精度
|
|
0
|
5
|
2026 年1 月 30 日
|
|
MindSpore中使用Graph模式运行网络首次运行慢,且输入Shape改变就会重新编译
|
|
0
|
6
|
2026 年1 月 30 日
|
|
微调qwen3-32B大模型,单机多卡信号同步失败 Sync run failed及解决
|
|
0
|
12
|
2025 年11 月 30 日
|
|
大模型迭代拖尾和其他性能优化
|
|
0
|
30
|
2025 年9 月 12 日
|
|
大模型前反向计算的性能优化
|
|
0
|
17
|
2025 年9 月 12 日
|
|
大模型迭代间隙的性能优化
|
|
0
|
17
|
2025 年9 月 12 日
|
|
大模型动态图训练内存优化
|
|
0
|
34
|
2025 年8 月 13 日
|
|
大模型动态图训练性能调优指南
|
|
0
|
71
|
2025 年8 月 13 日
|
|
模型编译的性能优化总结
|
|
0
|
45
|
2025 年8 月 8 日
|
|
通过优化数据来加速训练速度
|
|
0
|
28
|
2025 年8 月 8 日
|
|
mindspore之中间文件保存
|
|
0
|
23
|
2025 年7 月 31 日
|
|
随机数生成函数导致模型速度越来越慢
|
|
0
|
16
|
2025 年7 月 31 日
|
|
PyNative 调试体验
|
|
0
|
19
|
2025 年7 月 31 日
|
|
mindspore-Dump功能调试
|
|
0
|
32
|
2025 年7 月 31 日
|
|
使用model仓库的YOLOV5训练没有混合精度配置
|
|
0
|
40
|
2025 年7 月 30 日
|
|
使用mindpsore.nn.conv3d在GPU上精度不足问题
|
|
0
|
20
|
2025 年7 月 30 日
|
|
Mindspore网络精度自动比对功能中protobuf问题分析
|
|
0
|
18
|
2025 年7 月 30 日
|
|
Dump指定算子
|
|
0
|
27
|
2025 年7 月 26 日
|
|
静态图L0模块级dump使用常见注意事项
|
|
0
|
25
|
2025 年7 月 21 日
|
|
msprobe精度定位工具常见问题整理
|
|
0
|
67
|
2025 年7 月 14 日
|
|
msprobe工具应用场景--网络训练溢出
|
|
0
|
43
|
2025 年7 月 21 日
|
|
模型训练长稳性能抖动或劣化问题经验总结
|
|
0
|
56
|
2025 年7 月 16 日
|
|
Dump工具应用场景——网络训练溢出
|
|
0
|
49
|
2025 年7 月 14 日
|
|
Dump工具应用场景——算子执行报错(输入数据值越界)
|
|
0
|
36
|
2025 年7 月 14 日
|
|
大模型精度收敛分析和调优
|
|
0
|
56
|
2025 年7 月 9 日
|
|
大模型内存占用调优
|
|
0
|
66
|
2025 年6 月 13 日
|