昇思学习营 - 模型 LoRA 微调学习心得

chenhao1008 · 2025 年8 月 4 日 10:55

在昇思开发板上的DeepSeek-R1-Distill-Qwen-1.5B模型LoRA微调实践中，我深刻体会到边缘设备大模型落地的技术突破：仅需0.5%的参数量（923万/17.86亿）即可让模型精准习得《甄嬛传》古风对话风格，训练过程通过8秩低秩分解在QKV等关键层注入可学习旁路，配合1e-4学习率与32位alpha缩放因子，在3条样本的极简数据集上3步完成收敛，损失值从1.54降至1.00，全程显存占用控制在1.8GB以内，最终生成的"嘘——心愿说破便不灵了"等响应完美复现剧中神韵。尤为震撼的是，借助昇腾310芯片的22TOPS算力与MindSpore的静态缓存优化，整个微调在功耗不足5W的信用卡尺寸开发板上36秒完成，且通过SavePeftModelCallback的智能权重管理，使适配器模型体积压缩至35MB，为故宫讲解机器人等场景提供了"模型终身学习-本地实时响应-隐私零泄露"的三位一体解决方案，标志着大模型技术正式突破服务器桎梏，在能源、医疗、教育等边缘场景开启AI普惠新时代。

话题	回复	浏览量
昇思学习营LoRA学习心得活动打卡	64	2025 年8 月 5 日
[昇思学习营第七期·昇腾开发板特辑]第4章学习心得_20250726 活动打卡	52	2025 年7 月 26 日
【昇思学习营第七期·昇腾开发板】20250727_学习打卡_2 活动打卡	74	2025 年7 月 27 日
第二次打卡活动打卡	45	2025 年7 月 25 日
昇思学习营-LoRA 微调学习心得活动打卡	98	2025 年8 月 6 日

昇思学习营 - 模型 LoRA 微调学习心得

相关话题