1. 系统环境
硬件环境(Ascend/GPU/CPU): Ascend
MindSpore版本: 2.1
MF版本:0.7
执行模式(PyNative/ Graph): 不限
2. 报错信息
2.1 问题描述
在yaml文件的callbacks中配置SummaryMonitor后,训练时无法生成summary数据,如下为配置文件信息:
lcallbacks:
- type: MFLossMonitor
- type: SummaryMonitor
collect_freg: 50
keep_default_action: True
3. 根因分析
和MindSpore Transformers版本有关。
4. 解决方案
旧版本MindSpore Transformers的base_trainer.py文件中阴影部分的代码会导致SummaryMonitor失效,所以需要将其注释掉。最好的方法是将mindformers更新到最新版本。
# del SummaryMonitor, or it will crash
for index, callbacks inenumerate(self.config.callbacks):
if callbacks["type"] == "SummaryMonitor":
del self.config.callbacks[index]