qwen2_vl使用mindspore.ops.flash_attention_score算子代替常规attention时，attention的输出attn_output和原始的版本不一致

kindredspirit · 2025 年10 月 22 日 02:10

基于mindnlp仓库0.4分支，在对qwen2_vl进行加速时，使用mindspore.ops.flash_attention_score算子代替常规attention，发现得到的输出attn_output和原始版本输出不一致，实现代码如下图：

chengxiaoli · 2025 年10 月 22 日 03:36

用户您好，欢迎使用MindSpore，已经收到您上述的问题，还请耐心等待下答复~

lvyufenghh · 2025 年10 月 27 日 09:26

chengxiaoli · 2025 年10 月 29 日 00:39

@kindredspirit 用户您好，MindSpore支撑人已经分析并给出了问题的原因，由于较长时间未看到您采纳回答，这里版主将进行采纳回答的结帖操作，如果还其他疑问请发新帖子提问，谢谢支持~

system · 2025 年10 月 29 日 05:52

此话题已在最后回复的 60 分钟后被自动关闭。不再允许新回复。

话题		回复	浏览量
MindSpore2.2.10用Flash attention特性报错AttributeError: module 'mindspore.nn'has no attribute 'FlashAttention' 安装经验-Installation Experience	0	24	2025 年10 月 14 日
MindSpore2.2.10使用Flash attention特性报错AttributeError: module 'mindspore.nn'has no attribute 'FlashAttention' 安装经验-Installation Experience	0	28	2025 年10 月 2 日
昇腾910FlashAttention适配alibi问题模型训练-Model Training	0	19	2025 年10 月 7 日
MindSpore后端的MindSpeed框架下微调Qwen3模型报错EZ1001：Tensor indices not implemented for DT_BFLOAT16 问题求助 Help 模型	2	31	2026 年1 月 14 日
模型训练时报错RuntimeError: aclnnFlashAttentionScoreGetWorkspaceSize call failed, please check! 模型训练-Model Training	0	56	2025 年8 月 5 日