本次参加的《昇思+昇腾开发板:软硬结合玩转DeepSeek开发实战》课程,是我在昇思平台参与的第二次培训课程,本帖是对本次课程第一节学习内容的记录和个人感受。
#学习记录:
由于没有开发板,所以选择云上开发环境进行操作,相关的指引和答疑在官方手册和其他帖子中都有,这里主要说点不一样的,也是我在学习过程中遇到的问题。
在安装NLP套件后可以运行pytest进行测试:
pytest -v -s tests/transformers/models/qwen2/test_modeling_qwen2.py
然而使用云平台的话此时大概率会报错:
提示找不到文件,明显是路径不对,需要找到test_modeling_qwen2.py的完整路径。这里我们使用find大法,找到test_modeling_qwen2.py的完整路径:
/home/mindspore/miniconda/envs/jupyter/lib/python3.9/site-packages/tests/transformers/models/qwen2/test_modeling_qwen2.py
替换路径后再运行pytest:
显示缺少模块,通过pip install parameterized 解决。
之后可正常运行:
另一点需要注意的是,在test_modeling_qwen2.py中加入mindspore.set_context(pynative_synchronize=True)时,需添加在import mindspore之后,但原代码中并没有import mindspore,所以需要添加:
import mindspore
mindspore.set_context(pynative_synchronize=True)
即可。
#个人感受
本人对于大模型的训练微调等都有基础,但对于开发板等边缘节点部署却没有太多经验,于是希望借着这次活动加深一下对这方面的了解。
个人感觉这次的打卡营比较适合进阶的学者,尤其是拥有基本的大模型训练基础会比较容易上手一些。提一些小的建议,感觉这次活动从课程讲解到指引再到活动跟进都有点人手不足,有些细节没有照顾到,希望办方能够对活动提起重视吧,既然办了就要办好,把国内的社区规模做起来。


