一行代码开启 优化 + 图算融合 ,推理时间从 18ms 降到 0.11ms。用 StaticCache 缓存历史结果,避免重复计算。 而且直接抄作业就能跑通,非常适合想在 昇腾板子 或 MindSpore 环境 玩大模型应用的朋友。