0day系列模型提供昇腾同步首发支持

认证【Pass】表示经过昇腾官方版本测试的模型,【Test】表示待测试模型

模型 下载链接 脚本位置 序列 实现 集群 贡献方 认证
GLM-4 9B GLM4-9B-0414 8K Mcore 1x8 【Ascend】 【Test】
32B GLM4-32B-0414 8K Mcore 4x8 【Ascend】 【Test】
32B-Base GLM4-base-32B-0414 8K Mcore 4x8 【Ascend】 【Test】
GLM-Z1 9B GLM-Z1-9B-0414 8K Mcore 1x8 【Ascend】 【Test】
32B GLM-Z1-32B-0414 8K Mcore 4x8 【Ascend】 【Test】
Rumination-32B GLM-Z1-Rumination-32B-0414 8K Mcore 4x8 【Ascend】 【Test】

模型脚本声明:

上述模型目前仅支持0day首发下基本功能跑通,处于内部测试阶段,未完成充分的性能测试和验收。在实际使用中可能存在未被发现的问题,待后续充分验证后会发布正式版本。

配套版本说明:

以上模型的依赖配套如下表:

依赖软件 版本
昇腾NPU驱动 在研版本
昇腾NPU固件
Toolkit(开发套件) 在研版本
Kernel(算子包)
NNAL(Ascend Transformer Boost加速库)
Python 3.10
PyTorch 2.5
torch_npu插件
apex
transformers 4.51.3

版本声明

参考实现:

url=https://github.com/huggingface/transformers/tree/v4.51.3
commit_id=5f4ecf2

变更记录:

  • 2025.4.22:首次发布