现象
网络精度出现异常,没有思路。先做全量的统计信息Dump。
思路
网络精度出现异常,没有思路。
配置
推荐使用异步device统计信息,速度较快,占用磁盘少。
{
"common_dump_settings": {
"op_debug_mode": 0,
"dump_mode": 0,
"path": "/absolute_path",
"net_name": "ResNet50",
"iteration": "all",
"saved_data": "statistic",
"input_output": 0,
"kernels": ["Default/Conv-op12"],
"support_device": [0,1,2,3,4,5,6,7],
"statistic_category": ["max", "min", "l2norm"]
},
"e2e_dump_settings": {
"stat_calc_mode": "device"
}
}
性能
劣化10-50倍。
资源占用
显存
使用device算子计算统计信息会引入额外的显存申请,如果显存占用很极限,可能导致显存OOM。如果开启dump发生OOM,可以把统计信息计算调整为低精度,“e2e_dump_settings"中设置"device_stat_precision_mode”: “low” 。
磁盘
跟指定算子数量相关,支持统计信息和原始数据保存,统计信息占用小。