关于使用香橙派aipro针对TTS实验,使用Bark模型。
我在AIPro上重新配了环境、写了代码,结果出现了部分报错 sync stream error!。盯着npu-smi info看的时候,发现模型在升腾端侧设备上的内存占用一直在飙升,顶满之后就报那个错了。
为了排除是不是环境或者算力的问题,我在AutoDL上租了升腾910B的资源,把环境完整复刻过去后,模型居然能正常跑起来,没出任何问题。可把同样的代码放回端侧设备调试,还是老样子,报错没解决。
结合这些情况,我大概猜了两个可能的原因:一是Bark模型在端侧设备上,某些底层算子可能没完全适配好;二是端侧设备的显存(内存)是不是不太够,导致资源分配失败了。我使用了swap设置内存,但是还是不行,swap好像不扩充ascend的内存。
实在没头绪了,想问问您能不能给我指个排查方向,比如针对端侧模型适配有没有特殊的排查方法,或者定位内存异常的小技巧,又或者您知道有没有其他更适配升腾端侧的TTS模型可以参考?