[昇思学习营第七期·昇腾开发板特辑]第4章学习心得_20250726

Quin258 · 2025 年7 月 26 日 06:29

今天学习了课程的第4章，基于昇思大模型平台，对 DeepSeek-R1-Distill-Qwen-1.5B 模型进行 LoRA 微调，使得模型可以模仿《甄嬛传》中甄嬛的语气风格进行对话。
通过代码内注释找到数据集来源，开源为魔乐社区。

通过mindnlp的load_dataset函数导入下载的数据。

定义数据处理逻辑并查看部分数据。

对LoRA模型模型进行配置并实例化。

自定义回调函数在每3步训练时仅保存LoRA适配器权重并自动删除冗余基础模型文件，配置批次大小、学习率1e-4和输出路径等训练参数，最终启动Trainer利用LoRA技术对模型进行微调。

整个实验在昇腾单卡环境下完成轻量化训练，并展示了如何高效定制大语言模型的对话风格。

话题	回复	浏览量
【昇思学习营第七期·昇腾开发板】20250727_学习打卡_2 活动打卡	64	2025 年7 月 27 日
昇思+昇腾开发板：基于昇思平台使用 LoRA 微调模型模仿甄嬛语气对话基础知识-Basic Knowledge	63	2025 年9 月 2 日
昇思学习营 -模型 LoRA 微调学习心得活动打卡	64	2025 年8 月 4 日
昇思学习营-LoRA 微调学习心得活动打卡	87	2025 年8 月 6 日
昇思学习营-模型LoRA微调学习心得20250802 活动打卡	254	2025 年8 月 2 日