昇思学习营第七期-模型推理和性能优化学习心得3

xiyu30 · 2025 年8 月 1 日 12:22

长文本输出内容重复可加repetition_penalty=1.2调优解决该问题。

对话输入

超参

性能优化，减少token生成的间隔时间。

可以脚本中添加禁用多线程代码减少推理时间。

from mindspore._c_expression import disable_multi_thread
disable_multi_thread()

话题	回复	浏览量
昇思学习营第七期·昇腾开发板学习打卡_第03次活动打卡	25	2025 年8 月 6 日
昇思学习营-模型推理和性能优化学习心得. 活动打卡	27	2025 年8 月 4 日
昇思学习营第七期·昇腾开发板特辑第三次打卡活动打卡	23	2025 年7 月 29 日
昇思学习营第七期·昇腾开发板3 活动打卡	30	2025 年7 月 24 日
昇思学习营第七期·昇腾开发板学习打卡第三次（模型推理和性能优化）活动打卡	37	2025 年7 月 26 日