|
MindSpore训练大模型报错:BrokenPipeError: [Errno 32] Broken pipe, EOFError
|
|
0
|
17
|
2025 年9 月 29 日
|
|
昇腾910上CodeLlama报错Session options is not equal in diff config infos when models' weights are shared, last session options
|
|
0
|
13
|
2025 年9 月 29 日
|
|
昇腾910上算子溢出问题分析
|
|
0
|
61
|
2025 年9 月 29 日
|
|
MindSpore开启profile,使用并行策略报错ValueError: When dıstrıbuted loads are slıced we1ghts, sınk mode must be set True.
|
|
0
|
30
|
2025 年9 月 28 日
|
|
MindSpore大模型报错xxx is not a supported default model or a valid path to checkpoint.
|
|
0
|
22
|
2025 年9 月 28 日
|
|
INFNAN模式溢出问题
|
|
0
|
62
|
2025 年9 月 28 日
|
|
MindSpore SafeTensors 技术详解:高效模型存储与懒加载机制
|
|
0
|
148
|
2025 年9 月 17 日
|
|
Mindspore并行策略下hccl_tools工具使用报错
|
|
0
|
31
|
2025 年9 月 28 日
|
|
模型并行策略为 1:1:8 时报错RuntimeError: Stage num is 8 is not equal to stage used: 5
|
|
0
|
24
|
2025 年9 月 27 日
|
|
baichaun2-13b 在Ascend910上持续溢出
|
|
0
|
16
|
2025 年9 月 27 日
|
|
Mindspore在自回归推理时的精度对齐设置
|
|
0
|
14
|
2025 年9 月 27 日
|
|
MindSpore大模型报错: Inner Error! EZ9999 [InferShape] The k-axis of a(131072) and b(16384) tensors must be the same.
|
|
0
|
47
|
2025 年9 月 27 日
|
|
Ascend 910训练脚本刚运行就报错:RuntimeError: Initialize GE failed!
|
|
0
|
22
|
2025 年9 月 27 日
|
|
增加数据并行数之后模型占用显存增加
|
|
0
|
39
|
2025 年9 月 26 日
|
|
MindSpore报错ImportError cannot import name "build dataset loader' from 'mindformers.dataset. dataloader'
|
|
0
|
19
|
2025 年9 月 26 日
|
|
Tokenizer文件缺失报错TypeError:__init_() missing 2 required positional arguments: 'vocab_file' and 'merge_file'
|
|
0
|
11
|
2025 年9 月 26 日
|
|
昇腾910上CodeLlama导出mindir模型报错rankTablePath is invalid
|
|
0
|
24
|
2025 年9 月 26 日
|
|
Mixtral 8*7B 大模型精度问题总结
|
|
0
|
36
|
2025 年9 月 26 日
|
|
数据集异常导致编译(model.build)或者训练(model.train)卡住
|
|
0
|
10
|
2025 年9 月 25 日
|
|
报错日志不完整
|
|
0
|
23
|
2025 年9 月 25 日
|
|
MindSpore分布式并行报错The strategy is XXX, shape XXX cannot be divisible by strategy value XXX
|
|
0
|
18
|
2025 年9 月 25 日
|
|
qwen1.5_1.8B推理出现回答混乱问题及解决
|
|
0
|
20
|
2025 年9 月 25 日
|
|
MindSpore大模型在线推理速度慢及解决方案
|
|
0
|
45
|
2025 年9 月 24 日
|
|
权重文件被异常修改导致加载权重提示Failed to read the checkpoint file
|
|
0
|
17
|
2025 年9 月 24 日
|
|
MindSpore分布式8节点报错Call GE RunGraphWithStreamAsync Failed, ret is: 4294967295
|
|
0
|
29
|
2025 年9 月 24 日
|
|
【案例】训练过程中评测超时导致训练过程发生中断
|
|
0
|
44
|
2025 年9 月 24 日
|
|
MindSpore与CANN的协同优化:实现极致性能的深度学习训练与推理
|
|
0
|
133
|
2025 年9 月 24 日
|
|
MindSpore报错Select GPU kernel op[BatchNorm] fail! Incompatible data type!
|
|
0
|
14
|
2025 年9 月 19 日
|
|
使用自定义数据集运行mindformers的gpt2大模型,报错TypeError: The predict type and infer type is not match, predict type is Tuple
|
|
0
|
20
|
2025 年9 月 19 日
|
|
昇思MindSpore基于昇腾硬件快速支持Qwen3-Next-80B-A3B系列模型,内附教程4步实现推理!
|
|
0
|
275
|
2025 年9 月 19 日
|