b134484d创建于 3 天前历史提交

文件	最后提交记录	最后更新时间
docs	modified md files(for readability improvement) Co-authored-by: duhuiping<duhuiping@h-partners.com> # message auto-generated for no-merge-commit merge: !3264 merge master_md into master modified md files(for readability improvement) Created-by: gitee-duhuiping Commit-by: duhuiping Merged-by: cann-robot Description: ## 描述 modified md files(for readability improvement) ## 关联的Issue NA ## 测试 NA ## 文档更新 md files ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [x] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他，请描述： See merge request: cann/ops-nn!3264	1 个月前
examples	md文档和示例代码修复 Co-authored-by: Chen_HaoWen<chenhaowen12@huawei.com> # message auto-generated for no-merge-commit merge: !2978 merge master_qbn into master md文档和示例代码修复 Created-by: Chen_HaoWen Commit-by: Chen_HaoWen Merged-by: cann-robot Description: ## 描述 md文档和示例代码修复 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。例如：关联Issue #000--> ## 测试 <!--描述进行了哪些测试来验证你的改动。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-nn!2978	2 个月前
framework	nn类onnx算子插件支持 Co-authored-by: x00842564<xuyanke@huawei.com> Co-authored-by: ouyangxiantian<ouyangxiantian@h-partners.com> # message auto-generated for no-merge-commit merge: !452 merge master into master nn类onnx算子插件支持 Created-by: yanke-xu Commit-by: x00842564;ouyangxiantian Merged-by: cann-robot Description: ## 描述涉及的onnx插件算子列表： 1. Elu 2. NPUFastGelu 3. NPUGeglu 4. NPUGeluV2 5. HardSigmoid 6. LeakyRelu 7. Mish 8. Selu 9. Shrink 10. NPUSoftmaxCrossEntropyWithLogits 11. Softmax 12. ThresholdedRelu 13. AdaCast 14. AdaptiveAvgPool2d 15. AdaptiveMaxPool2d 16. AscendAntiQuant 17. AscendDequant 18. AscendDequantS16 19. AscendQuant 20. AscendRequant 21. AscendRequantS16 22. BasicGRUInplaceFillWindowCache 23. BasicLSTMInplaceFillWindowCache 24. BatchMatMul 25. BatchNormalization 26. Celu 27. ConstantOfShape 28. DynSeqOuter 29. GlobalLpPool 30. GlobalMaxPool 31. GroupNormRelu 32. GRU 33. Hardmax 34. If 35. InstanceNormalization 36. Int8Dequantize 37. Int8GivenIntTensorFill 38. Int8Quantize 39. Int8Transpose 40. LogSoftmax 41. LRN 42. LSTM 43. LSTMP 44. MatMul 45. MeanVarianceNormalization 46. MovingSumWithSigmoid 47. NPUAnchorResponseFlags 48. NPUDropoutWithAddSoftmax 49. NPUGru 50. Resize 51. Size 52. SoftmaxCrossEntropyLoss 53. TopK 54. Unique 55. Shape 56. GatherElements 57. GatherND 58. Compress 59. Gather 60. NonZero 61. NPUScatter 62. ScatterElements 63. Scatter 64. QuantBatchMatMul 65. WeightQuantBatchMatmulV2 66. NPUAddRmsNorm 67. NPUGroupNormSilu 68. LpNormalization 69. NPURmsNorm 70. NPUAntiQuant 71. NPUAscendQuantV2 72. NPUDynamicQuant 73. NPUDynamicQuantV2 74. NPUGroupQuant 75. NPUQuantize ## 关联的Issue None ## 测试编译构建、冒烟测试、静态扫描 ## 文档更新 None ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-nn!452	4 个月前
op_graph	修复代码中的告警问题 Co-authored-by: yuanbin_22<yuanbin22@huawei.com> # message auto-generated for no-merge-commit merge: !4995 merge CleanCode0519 into master 修复代码中的告警问题 Created-by: yuanbin_22 Commit-by: yuanbin_22 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 修复代码中的告警问题 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。例如：关联Issue #000--> https://gitcode.com/cann/ops-nn/issues/1323 ## 测试 <!--描述进行了哪些测试来验证你的改动。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-nn!4995	3 天前
op_host	remove simplified_key, default value is 0 Co-authored-by: cong-jiyu<congjiyu@h-partners.com> # message auto-generated for no-merge-commit merge: !4892 merge master into master remove simplified_key, default value is 0 Created-by: cong-jiyu Commit-by: cong-jiyu Merged-by: cann-robot Description: ## 描述当simplified_key中属性只有default=0，且ascendc_config中配置了算子，那么simplified_key.ini文件可以删除，因为默认值为0. 修改了ascendc_config.json文件，将算子host/config中配置了soc，但是未在ascendc_config.json中的算子补充上去。 ## 关联的Issue [#1985](https://gitcode.com/cann/ops-nn/issues/1985) ## 测试编译950、910bpass ## 文档更新更新了ascendc_config.json配置了算子的simplified_key的ini文件 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-nn!4892	10 天前
op_kernel	adapt 3101 to 3510 Co-authored-by: 张磊<zhanglei121@huawei.com> # message auto-generated for no-merge-commit merge: !1158 merge master into master adapt 3101 to 3510 Created-by: zl_hw Commit-by: 张磊 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。例如：关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-nn!1158	2 个月前
tests	整改st目录下的atk用例统一目录格式 Co-authored-by: yue-ma<mayue54@huawei.com> # message auto-generated for no-merge-commit merge: !4782 merge master into master 整改st目录下的atk用例统一目录格式 Created-by: yue-ma Commit-by: yue-ma Merged-by: cann-robot Description: ## 描述整改st目录下的atk用例统一目录格式 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。例如：关联Issue #000--> https://gitcode.com/cann/ops-nn/issues/2671 ## 测试 <!--描述进行了哪些测试来验证你的改动。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他，请描述：st用例目录整改 See merge request: cann/ops-nn!4782	16 天前
CMakeLists.txt	Format update: Adjusted the license description format in all relevant files. Co-authored-by: jiangqi<jiangqi47@h-partners.com> # message auto-generated for no-merge-commit merge: !366 merge license6 into master Format update: Adjusted the license description format in all relevant files. Created-by: jiangqi2025 Commit-by: jiangqi Merged-by: turing_project1 Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。例如：关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-nn!366	5 个月前
README.md	Modify the aclnn and readme issue Co-authored-by: zhouwenfang<zhouwenfang3@h-partners.com> # message auto-generated for no-merge-commit merge: !3314 merge master into master Modify the aclnn and readme issue Created-by: zhouwenfang Commit-by: zhouwenfang Merged-by: cann-robot Description: ## 描述 Modify the aclnn and readme issue ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。例如：关联Issue #000--> ## 测试已对齐 ## 文档更新 Modify the aclnn and readme issue ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-nn!3314	1 个月前

AscendQuantV2

产品支持情况

产品	是否支持
Ascend 950PR/Ascend 950DT	√
Atlas A3 训练系列产品/Atlas A3 推理系列产品	√
Atlas A2 训练系列产品/Atlas A2 推理系列产品	√
Atlas 200I/500 A2 推理产品	×
Atlas 推理系列产品	√
Atlas 训练系列产品	×
Kirin X90 处理器系列产品	√
Kirin 9030 处理器系列产品	√

功能说明

算子功能：对输入x进行量化操作，支持设置axis以指定scale和offset对应的轴，scale和offset的shape需要满足和axis指定x的轴相等或1。axis当前支持设置最后两个维度。
计算公式：
- sqrt_mode为false时，计算公式为：
  $y = r o u n d ((x * s c a l e) + o f f s e t)$
- sqrt_mode为true时，计算公式为：
  $y = r o u n d ((x * s c a l e * s c a l e) + o f f s e t)$

参数说明

参数名	输入/输出/属性	描述	数据类型	数据格式
x	输入	需要执行量化的输入，对应公式中的`x`。	FLOAT16、FLOAT32、BFLOAT16	ND
scale	输入	量化中的scale值，对应公式中的`scale`。	FLOAT16、FLOAT32、BFLOAT16	ND
offset	可选输入	反量化中的offset值，对应公式中的`offset`。	FLOAT16、FLOAT32、BFLOAT16	ND
sqrt_mode	可选属性	指定scale参与计算的逻辑，对应公式中的`sqrtMode`。默认值为false。	BOOL	-
round_mode	可选属性	指定cast到int8输出的转换方式。支持取值round，ceil，trunc，floor。默认值为"round"。	STRING	-
dst_type	可选属性	指定输出的数据类型。默认值为DT_INT8。	INT	-
axis	可选属性	指定scale和offset对应x的维度。默认值为-1。	INT	-
y	输出	表示AscendQuantV2的结果输出`y`，对应公式中的`y`。shape与输入`x`的shape一致。	INT8、INT4、HIFLOAT8、FLOAT8_E5M2、FLOAT8_E4M3FN	ND

Atlas 推理系列产品：
- 数据类型：
  - 输入Tensor数据类型不支持BFLOAT16。
  - 输出Tensor数据类型仅支持INT8。
- round_mode，支持取值round，ceil，trunc，floor。
- dst_type：支持取值2，表示INT8。
- axis：只支持指定x的最后一个维度（假设输入x维度是xDimNum，axis取值是-1或xDimNum-1）。
Atlas A2 训练系列产品/Atlas A2 推理系列产品、Atlas A3 训练系列产品/Atlas A3 推理系列产品：
- 输出Tensor数据类型仅支持INT8、INT4。
- dst_type：支持取值2，29，分别表示INT8、INT4。
- axis：支持指定x的最后两个维度（假设输入x维度是xDimNum，axis取值范围是[-2，-1]或[xDimNum-2，xDimNum-1]）。
Ascend 950PR/Ascend 950DT：
- round_mode：dst_type表示FLOAT8_E5M2或FLOAT8_E4M3FN时，只支持round。dst_type表示HIFLOAT8时，支持round和hybrid。dst_type表示其他类型时，支持round，ceil，trunc和floor。
- axis：支持指定x的最后两个维度（假设输入x维度是xDimNum，axis取值范围是[-2，-1]或[xDimNum-2，xDimNum-1]）。
Kirin X90/Kirin 9030 处理器系列产品: x、scale、offset不支持BFLOAT16；y 数据类型不支持INT4、HIFLOAT8、FLOAT8_E5M2、FLOAT8_E4M3FN。

约束说明

无

调用说明

调用方式	样例代码	说明
aclnn接口	test_aclnn_ascend_quant	通过aclnnAscendQuant接口方式调用AscendQuantV2算子。
aclnn接口	test_aclnn_ascend_quant_v3	通过aclnnAscendQuantV3接口方式调用AscendQuantV2算子。
图模式	-	通过算子IR构图方式调用AscendQuantV2算子。