昇思MindSpore论坛

第四章学习心得：大模型微调实战

活动公告 Activities 活动打卡

hellomo (Hellomo) 2025 年7 月 25 日 10:32 1

特别感谢主办方提供的预配置云算力环境！在免配置的环境中，我顺利完成了全流程实战，深入掌握了用 LoRA 技术低成本微调大模型的核心技能。以下是具体收获：

一、LoRA 技术精髓：大模型的“轻量手术”

核心突破
◦ 传统微调需更新十亿级参数 → 成本极高
◦ LoRA 通过冻结原模型，仅训练新增的低秩矩阵（插件）实现：
■ 参数更新量降至 0.5%（实测代码验证！）
■ 显存占用减少 50%+
■ 训练速度提升 3-5倍
关键参数解析
◦ 秩 r：控制插件"复杂度"（r=8 = 拆解为8维小矩阵）
◦ 缩放因子 lora_alpha：调节学习强度（alpha=32时梯度更新更激进）
→ 如同调节汽车：r控油耗，alpha控提速！

二、昇思（MindSpore）实战四大核心技能
在云环境中跑通全流程后，掌握以下关键技术：
环节
关键技术
云环境优势
数据预处理
用 .map() + 自定义函数 → 文本转模型输入
预装环境免去库冲突烦恼
权重加载
直接加载FP16权重 → 显存5G→2G↓
共享内存设备必备技巧
资源优化
双环境变量控进程：
export MAX_COMPILE_CORE_NUMBER=1
云主机SSD加速权重加载
Adapter保存
仅存LoRA权重 → 省90%存储空间
云存储随时备份训练成果
特别亮点：
• 用 cgroup 给进程设内存上限（cgset -r memory.limit_in_bytes=4G）
• 学习 Host/Device 侧内存共享机制 → 理解硬件协同原理

三、最震撼的实战成果
python

复制

下载

微调后模型学会特定对话风格

Input
: “如何安慰考试失利的同学？”
Output
: “别灰心呀~ 下次我们一起复习！(摸摸头)” # 微调后的"欢欢"风格
仅用3条数据+10分钟训练，让1.5B大模型掌握了温柔助手的对话能力！

四、致谢与未来探索

特别感谢
◦ 主办方预配置的云环境（跳过权重下载/依赖安装）
◦ 昇思团队优化的 LoRA 接口 → 让消费级设备玩转大模型
推荐实践方向
◦ 尝试不同 r 值对效果的影响（r=4 vs r=16）
◦ 将 Adapter 权重部署到手机端（LoRA天生适合端侧AI！）
◦ 探索多任务混合微调（Medical + Law Adapter）
课程代码：[GitHub链接]
云环境体验：强烈安利主办方环境——无需折腾环境，专注算法本质！

总结：LoRA 让大模型微调从"重装改造"变为"轻量插件升级"，而昇思的工程优化（FP16加载/进程控制）真正实现了平民化AI大模型定制。期待用所学技术创造更多行业应用！

话题		回复	浏览量	时间点
LoRA微调学习打卡活动打卡	0	240	2025 年8 月 3 日
昇思学习营第七期·昇腾开发板学习打卡2 活动打卡	0	38	2025 年7 月 25 日
昇思学习营第七期 day2 活动打卡	0	41	2025 年8 月 2 日
滴！第二次打卡活动打卡	0	53	2025 年7 月 26 日
昇思学习营第七期·昇腾开发板学习打卡_第02次活动打卡	0	20	2025 年8 月 6 日