0day系列模型提供昇腾同步首发支持
认证【Pass】表示经过昇腾官方版本测试的模型,【Test】表示待测试模型
| 模型 | 下载链接 | 脚本位置 | 序列 | 实现 | 集群 | 贡献方 | 认证 |
|---|---|---|---|---|---|---|---|
| GLM-4 | 9B | GLM4-9B-0414 | 8K | Mcore | 1x8 | 【Ascend】 | 【Test】 |
| 32B | GLM4-32B-0414 | 8K | Mcore | 4x8 | 【Ascend】 | 【Test】 | |
| 32B-Base | GLM4-base-32B-0414 | 8K | Mcore | 4x8 | 【Ascend】 | 【Test】 | |
| GLM-Z1 | 9B | GLM-Z1-9B-0414 | 8K | Mcore | 1x8 | 【Ascend】 | 【Test】 |
| 32B | GLM-Z1-32B-0414 | 8K | Mcore | 4x8 | 【Ascend】 | 【Test】 | |
| Rumination-32B | GLM-Z1-Rumination-32B-0414 | 8K | Mcore | 4x8 | 【Ascend】 | 【Test】 |
模型脚本声明:
上述模型目前仅支持0day首发下基本功能跑通,处于内部测试阶段,未完成充分的性能测试和验收。在实际使用中可能存在未被发现的问题,待后续充分验证后会发布正式版本。
配套版本说明:
以上模型的依赖配套如下表:
| 依赖软件 | 版本 |
|---|---|
| 昇腾NPU驱动 | 在研版本 |
| 昇腾NPU固件 | |
| Toolkit(开发套件) | 在研版本 |
| Kernel(算子包) | |
| NNAL(Ascend Transformer Boost加速库) | |
| Python | 3.10 |
| PyTorch | 2.5 |
| torch_npu插件 | |
| apex | |
| transformers | 4.51.3 |
版本声明
参考实现:
url=https://github.com/huggingface/transformers/tree/v4.51.3
commit_id=5f4ecf2
变更记录:
- 2025.4.22:首次发布