lora微调

zhoutaohui · 2025 年7 月 28 日 11:53

LoRA（Low-Rank Adaptation）是一种参数高效的微调（PEFT）策略：它把原始大模型的权重全部冻结，只在 Attention 的 Q、K、V 等关键模块旁边插入一条“低秩旁路”。旁路由两个小巧的矩阵 A、B 组成，训练时只更新这对小矩阵，其余参数保持不变。这样就把显存和算力开销打下来，效果却跟全量微调差不多。
我们这次实验就采用了 LoRA。按教程一步步跑完，模型顺利收敛，而可训练参数量只占全部权重的 0.5%，对硬件资源紧张的场景非常友好。

话题	回复	浏览量
昇思学习营-lora微调学习心得活动打卡	39	2025 年7 月 28 日
昇思学习营第七期 day2 活动打卡	41	2025 年8 月 2 日
昇思学习营-模型LoRA微调学习心得. 活动打卡	22	2025 年8 月 4 日
昇思学习营第七期·昇腾开发板学习打卡_第二次02 活动打卡	28	2025 年8 月 6 日
昇思学习营第七期·昇腾开发板学习打卡2 活动打卡	38	2025 年7 月 25 日

lora微调

相关话题