昇思学习营第七期--第一天打卡

Nikor · 2025 年7 月 24 日 15:55

在香橙派OrangePi AIPro昇腾开发板上部署DeepSeek-R1-Distill-Qwen-1.5B模型的过程中，我深刻感受到国产AI框架的技术革新：

MoE架构的普惠化传统MoE（Mixture of Experts）模型因千亿参数规模难以落地，而DeepSeek通过蒸馏技术将模型压缩至1.5B参数，结合R1架构的慢思考机制，实现了轻量化与推理质量的平衡。这种创新让我意识到，模型效率比单纯堆参数更重要。
动态图开发的极致体验MindSpore的动态图模式让调试如丝般顺滑，类HuggingFace的API设计大幅降低上手门槛。例如，通过model.generate()一键生成对话，配合Gradio快速搭建交互界面，从代码编写到演示仅需30分钟，效率远超预期。
全流程国产化支持从CANN算子编译到MindSpore NLP微调，全程无需依赖国外框架。尤其在LoRA微调中，仅需1张20TOPS算力的昇腾NPU即可完成训练，成本降至传统方案的1/10，印证了“算力民主化”的趋势。
挑战1：环境适配的“蝴蝶效应”

现象：烧录镜像时误选Ubuntu版本导致驱动冲突，CANN升级时报错“找不到符号”。
解决：
- 严格遵循文档校验镜像版本（如CANN8.0需搭配MindSpore2.5）；
- 使用ldd排查动态库依赖，手动拷贝缺失的.so文件；
- 记录《开发板环境配置备忘录》，避免重复踩坑。

话题	回复	浏览量
昇思学习营昇腾开发板+DeepSeek介绍+模型开发与适配学习心得活动打卡	10	2025 年7 月 24 日
昇思学习营第七期·昇腾开发板学习打卡第一次（介绍、开发与适配）活动打卡	15	2025 年7 月 26 日
昇思学习营第七期·昇腾开发板1 活动打卡	18	2025 年7 月 24 日
昇思学习营第七期·昇腾开发板学习打卡_第一次01 活动打卡	17	2025 年7 月 24 日
昇思学习营第七期·昇腾开发板特辑第一次打卡活动打卡	16	2025 年7 月 27 日