昇思学习营第七期·昇腾开发板学习打卡_第二次02

Joeson · 2025 年7 月 26 日 11:34

只动少部分的代码达到预期

蓝色部分是base model，用get_peft_model实现实例化模型

案例演示：本次案例只对少量数据进行微调

1>数据集方面的处理

2>base model ,loRA模型配置和实例化

只有adapter参与训练，其他意义不大

训练超参

最后整合到定义好的Trainer

以上就是大致过程

二、对话模型示例

通过tokenizer把对话转化成数字索引

数据的处理逻辑

User类似于用户，Assistant则是deepseek的回答，在对话结束后添加eso token用于提示模型对话结束

转化为数字索引后，由于对话格式不一（有长有短），需要对其进行限制

最后返回的三个内容，input_ids:实际对话的内容。attention_mask:attention 的掩码。labels:标签

通过map接口将操作作用在数据集上

map常为operation,input,ouput格式，与对应函数的参数要一致，不然会有乱码。

以下为常遇问题的经验分享

下载模型和数据集：

对数据集进行处理：

执行微调：

话题	回复	浏览量
昇思+昇腾开发板：软硬结合玩转DeepSeek开发实战（学习打卡第二天）活动打卡	56	2025 年7 月 27 日
【昇思学习营第七期·昇腾开发板】20250727_学习打卡_2 活动打卡	62	2025 年7 月 27 日
昇思学习营第七期·昇腾开发板学习打卡_02 活动打卡	33	2025 年8 月 3 日
昇腾开发板·学习打卡第二天活动打卡	35	2025 年7 月 25 日
昇思+昇腾开发板：基于昇思平台使用 LoRA 微调模型模仿甄嬛语气对话基础知识-Basic Knowledge	56	2025 年9 月 2 日