通过对第五章相关视频教程的学习,了解到模型推理的流程主要有权重加载、启动推理、效果比较与调优、性能测试、性能优化。
性能优化
前序准备
- 实现解码逻辑(decode函数、prefill-decode阶段)
- 实例化StaticCache,动态Cache无法成图
添加jit装饰器 - 设置O2整图下沉进一步优化
- model.jit()
- mindspore.jit装饰decode函数
通过对第五章相关视频教程的学习,了解到模型推理的流程主要有权重加载、启动推理、效果比较与调优、性能测试、性能优化。
性能优化
前序准备