【昇思学习营第七期·昇腾开发板】20250803_学习打卡_3

Sebastian · 2025 年8 月 5 日 14:54

优化推理部分

JIT 优化配置：

mindspore.set_context(
   enable_graph_kernel=True,
   mode=mindspore.GRAPH_MODE,
   jit_config={"jit_level": "O2"}  # O2级别优化
)

关键优化点：

推理效果：

其他

模型生成时可能出现关于 attention mask 和 pad token 的警告，可通过设置对应参数解决
Sliding Window Attention 在 eager 模式下未实现，可能导致意外结果
通过 MindSpore 的 JIT 编译技术，能有效降低 DeepSeek-R1-Distill-Qwen-1.5B 模型的推理耗时，尤其在自回归生成的后续步骤中优化效果明显。结合 MindNLP 提供的工具链，可快速实现模型部署和交互式对话功能

话题	回复	浏览量
[昇思学习营第七期·昇腾开发板特辑]第5章学习心得_20250727 活动打卡	41	2025 年7 月 27 日
昇思+昇腾开发板：DeepSeek-R1-Distill-Qwen-1.5B 模型推理部署与 JIT 优化实践基础知识-Basic Knowledge	105	2025 年9 月 2 日
昇思学习营第七期·昇腾开发板学习打卡_第03次活动打卡	34	2025 年8 月 6 日
昇思学习营-模型推理和性能优化笔记活动打卡	22	2025 年7 月 28 日
昇思学习营第七期·昇腾开发板学习打卡第三次（模型推理和性能优化）活动打卡	46	2025 年7 月 26 日