4cb442ad创建于 5 天前历史提交

文件	最后提交记录	最后更新时间
docs	【bugfix】修复资料规范问题 Co-authored-by: majiajian_hw<majiajian@huawei.com> # message auto-generated for no-merge-commit merge: !3018 merge bugfix_md_0529 into master 【bugfix】修复资料规范问题 Created-by: nunnons2 Commit-by: majiajian_hw Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 算子中推导关系表达不准确 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1542 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 已完成 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> 详见文件改动 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!3018	5 天前
examples	950支持静态库功能检查与修正 Co-authored-by: sunwenlong<sunwenlong8@huawei.com> # message auto-generated for no-merge-commit merge: !1872 merge static into master 950支持静态库功能检查与修正 Created-by: LuckySun Commit-by: sunwenlong Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 950支持静态库功能检查与修正。使用新的tiling模板注册接口。修改examples中的数据类型，因为走AICORE时不支持double ## 关联的Issue [[Bug-Report\|缺陷反馈]: 静态库执行算子样例时出现错误](https://gitcode.com/cann/ops-math/issues/1074) ## 测试算子样例执行通过 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!1872	2 个月前
op_api	优化多个文件中的代码风格 Co-authored-by: yuantao<taoyuan18@huawei.com> Co-authored-by: init__zhb__<zhanghaobo6@huawei.com> # message auto-generated for no-merge-commit merge: !1295 merge clean into master 优化多个文件中的代码风格 Created-by: yuantao_ Commit-by: init__zhb__;yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 多个文件中的代码风格可以进行改进： \| 文件路径 \| 代码片段 \| 问题描述 \| 行号 \| \| ---------------------------------------------------------------------------- \| --------------------------------------------------------------------------------------------------------- \| --------------------------- \| --- \| \| conversion/concat_d/op_api/concat_d.cpp \| `if (tail_dim * type_size[promoteType] % 32 != 0) {` \| 避免魔法数字 (32) \| 54 \| \| conversion/depth_to_space/examples/test_geir_depth_to_space.cpp \| `add1.update_output_desc_##outputName(outputName##outputIndex##_desc);` \| 宏定义无需分号 \| 68 \| \| conversion/depth_to_space/examples/test_geir_depth_to_space.cpp \| `inputs.push_back(placeholder##intputIndex);` \| 宏定义无需分号 \| 60 \| \| conversion/depth_to_space/examples/test_geir_depth_to_space.cpp \| `char endptr;` \| 使用std::string替代char \| 202 \| \| conversion/strided_slice_grad/examples/test_geir_strided_slice_grad.cpp \| `pData[i] = value + (i % 3) * 0.4f; // 让数据更有意义` \| 避免魔法数字 (3) \| 126 \| \| conversion/strided_slice_grad/examples/test_geir_strided_slice_grad.cpp \| `return 2;` \| 避免魔法数字 (2) \| 109 \| \| conversion/strided_slice_grad/examples/test_geir_strided_slice_grad.cpp \| `return 4;` \| 避免魔法数字 (4) \| 107 \| \| conversion/concat_d/op_api/concat_d.cpp \| `if (inputs->Size() > 512 \\|\\| inputs->Size() < 33) {` \| 避免魔法数字 (512) \| 45 \| \| conversion/concat_d/op_api/concat_d.cpp \| `catMaxInputSize = 512;` \| 避免魔法数字 (512) \| 92 \| \| conversion/depth_to_space/examples/test_geir_depth_to_space.cpp \| `FILE fp;` \| 变量应在使用时声明初始化 \| 153 \| \| conversion/depth_to_space/examples/test_geir_depth_to_space.cpp \| `add1.set_attr_##attrName(attrValue);` \| 宏定义无需分号 \| 63 \| \| random/dsa_random_uniform/op_host/op_api/aclnn_multinomial.cpp \| `auto randomUniform = GetRandomUniformNoReplaceMent(selfContiguous, randomParams, uniqueExecutor.get());` \| 数组参数应传递长度 (randomParams) \| 377 \| \| conversion/squeezev2/op_host/squeezev2_infershape.cpp \| `return SqueezeWithAxes(x_shape, squeeze_dims, y_shape);` \| 数组参数应传递长度 (squeeze_dims) \| 114 \| \| conversion/concat_dv2/op_host/concat_dv2_tiling.cpp \| `tiling.set_endTensorIdx(endTensorIdx);` \| 数组参数应传递长度 (endTensorIdx) \| 143 \| \| conversion/squeezev3/op_host/squeezev3_infershape.cpp \| `return SqueezeWithAxes(x_shape, squeeze_dims, y_shape);` \| 数组参数应传递长度 (squeeze_dims) \| 117 \| \| conversion/concat_dv2/op_host/concat_dv2_tiling.cpp \| `tiling.set_endTensorOffset(endTensorOffset);` \| 数组参数应传递长度 (endTensorOffset) \| 144 \| \| conversion/squeezev2/op_host/squeezev2_infershape.cpp \| `if (!IsAxesRangeValid(squeeze_dims, static_cast<int64_t>(x_shape->GetDimNum()), axes)) {` \| 数组参数应传递长度 (squeeze_dims) \| 108 \| \| random/sim_thread_exponential/op_kernel/sim_thread_exponential.h \| `AscendC::And(..., mask, len / SHIFT_LEFT_32, { 1, 1, 1, 8,` \| 数组参数应传递长度 (mask) \| 567 \| \| random/dsa_gen_bit_mask/examples/test_dropout_gen_mask.cpp \| `std::vector<float> outHostData(8, 0);` \| 避免魔法数字 (8) \| 89 \| \| conversion/diag_v2/examples/test_geir_diag_v2.cpp \| `char endptr;` \| 使用std::string替代char* \| 220 \| \| random/dsa_gen_bit_mask/examples/test_dropout_gen_mask.cpp \| `std::vector<uint8_t> maskOutHostData(16, 0);` \| 避免魔法数字 (16) \| 90 \| \| conversion/diag_v2/examples/test_geir_diag_v2.cpp \| `FILE *fp;` \| 变量应在使用时声明初始化 \| 177 \| \| conversion/diag_v2/examples/test_geir_diag_v2.cpp \| `add1.set_attr_##attrName(attrValue);` \| 宏定义无需分号 \| 63 \| \| conversion/diag_v2/examples/test_geir_diag_v2.cpp \| `inputs.push_back(placeholder##intputIndex);` \| 宏定义无需分号 \| 60 \| \| conversion/diag_v2/examples/test_geir_diag_v2.cpp \| `add1.update_output_desc_##outputName(outputName##outputIndex##_desc);` \| 宏定义无需分号 \| 92 \| \| conversion/unfold_grad/op_kernel/unfold_grad_final_axe_big_size.h \| _(空行)_ \| 代码块末尾不应有空行 \| 56 \| \| random/dsa_gen_bit_mask/examples/test_aclnn_dropout_gen_mask_v2_tensor.cpp \| `std::vector<uint8_t> outHostData(16, 0);` \| 避免魔法数字 (16) \| 93 \| \| random/dsa_gen_bit_mask/examples/test_dropout.cpp \| `std::vector<uint8_t> maskOutHostData(16, 0);` \| 避免魔法数字 (16) \| 90 \| \| random/dsa_gen_bit_mask/examples/test_dropout.cpp \| `std::vector<float> outHostData(8, 0);` \| 避免魔法数字 (8) \| 89 \| \| conversion/concat_dv2/op_host/concat_dv2_def.cpp \| `0` \| 代码块末尾不应有空行 \| 45 \| \| conversion/concat_d/op_api/aclnn_cat.cpp \| `catMaxInputs = 512;` \| 避免魔法数字 (512) \| 337 \| \| conversion/clip_by_value_v2/examples/test_aclnn_clamp_max.cpp \| `std::vector<int8_t> outHostData(8, 0);` \| 避免魔法数字 (8) \| 80 \| \| random/dsa_gen_bit_mask/examples/test_dropout_gen_mask_v2.cpp \| `std::vector<uint8_t> outHostData(16, 0);` \| 避免魔法数字 (16) \| 86 \| \| conversion/broadcast_to/examples/test_geir_broadcast_to.cpp \| `inputs.push_back(placeholder##intputIndex);` \| 宏定义无需分号 \| 89 \| \| random/dsa_gen_bit_mask/examples/test_aclnn_bernoulli.cpp \| `std::vector<float> outHostData(16, 0);` \| 避免魔法数字 (16) \| 89 \| \| conversion/confusion_transpose_d/examples/test_aclnn_confusion_transpose.cpp \| `std::vector<float> outHostData(8, 1);` \| 避免魔法数字 (8) \| 116 \| \| conversion/clip_by_value_v2/examples/test_aclnn_clamp_max_tensor.cpp \| `std::vector<double> outHostData(8, 0);` \| 避免魔法数字 (8) \| 82 \| ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他，请描述：清理代码，优化代码风格。 See merge request: cann/ops-math!1295	3 个月前
op_graph	math仓算子代码整改 Co-authored-by: cai-chengchao<caichengchao1@h-partners.com> # message auto-generated for no-merge-commit merge: !881 merge math_op_back_1 into master math仓算子代码整改 Created-by: cai-chengchao Commit-by: cai-chengchao Merged-by: cann-robot Description: ## 描述 math仓算子代码整改 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!881	4 个月前
op_host	refactor: 拆分 tiling 公共头文件，消除 conversion 算子重复依赖 Co-authored-by: tianqiguang<tianqiguang@huawei.com> # message auto-generated for no-merge-commit merge: !2951 merge feature/conversion-dedup into master refactor: 拆分 tiling 公共头文件，消除 conversion 算子重复依赖 Created-by: tianqiguang Commit-by: tianqiguang Merged-by: cann-robot Description: ## 描述将 tiling 基类和模板注册相关定义从 conversion 算子的公共头文件中拆分，消除各 conversion 算子的重复头文件依赖。 ### 改动原因 conversion 目录下 50+ 个算子各自直接引用 `tiling_base.h`、`tiling_util.h` 和 `tiling_templates_registry.h`： - `tiling_base.h` 包含完整 TilingBaseClass 实现（~240行），每个算子编译时都重复展开 - `tiling_templates_registry.h` 内混杂 math 算子的模板注册代码，不应被 conversion 算子依赖 ### 改动方法 1. 新建 `common/inc/op_host/math_tiling_templates_registry.h`：将 math 算子专用的模板注册宏和注册类从此文件中提供 2. 精简 `tiling_base.h`：改为仅转发引用 `tiling_base_class.h` 3. 批量更新 conversion 算子文件的 `#include`： - `tiling_base.h` → `tiling_base_class.h` - `tiling_util.h` → `tiling_base_util.h` - `tiling_templates_registry.h` → `math_tiling_templates_registry.h` 4. 批量更新命名空间引用： - `Ops::Math::OpTiling::TilingBaseClass` → `Ops::Base::TilingBaseClass` - `Ops::Math::OpTiling::EnsureNotScalar` → `Ops::Base::EnsureNotScalar` ## 关联的Issue - #1672 ## 测试 - 涉及的 conversion 算子二级冒烟测试已通过 ## 文档更新无文档变更 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他，请描述：代码重构，消除重复头文件依赖 See merge request: cann/ops-math!2951	7 天前
op_kernel	abs等算子A5实现 Co-authored-by: ly_cann_coder<liyao152@huawei.com> # message auto-generated for no-merge-commit merge: !495 merge develop into master abs等算子A5实现 Created-by: ly_cann_coder Commit-by: ly_cann_coder Merged-by: cann-robot Description: ## 描述新增以下算子的A5实现 \|序号\| 算子 \| 功能 \| \|--\|--\|--\| \|1\| abs \| 为输入张量的每一个元素取绝对值 \| \|2\| add \| 对输入完成相加操作 \| \|3\| addcdiv \| 张量运算函数，用于执行乘除加组合操作，将张量除法（带缩放）+ 张量加法合并为单个操作 \| \|4\| addcmul \| 张量运算函数，用于执行乘除加组合操作，将张量乘法（带缩放）+ 张量加法合并为单个操作 \| \|5\| axpy \| 源操作数中每个元素与标量求积后和目的操作数中的对应元素相加 \| \|6\| bincount \| 计算非负整数数组中每个数的频率 \| \|7\| ceil \| 返回输入tensor中每个元素向上取整的结果 \| \|8\| clip_by_value_v2 \| 将输入的所有元素限制在一定范围内 \| \|9\| concat \| 用于沿指定维度将多个输入 Tensor 进行拼接，输出包含所有输入数据按顺序拼接后的 Tensor \| \|10\| concat_v2 \| 用于沿指定维度将多个输入 Tensor 进行拼接，输出包含所有输入数据按顺序拼接后的 Tensor \| \|11\| equal \| 计算两个Tensor是否有相同的大小和元素，返回一个Bool类型 \| \|12\|exp\|返回一个新的张量，该张量的每个元素都是输入张量对应元素的指数\| \|13\| fill \| 对张量进行填充操作，支持非连续的Tensor操作 \| \|14\| floor \| 返回输入Tensor中每个元素向下取整，并将结果回填到输入Tensor中 \| \|15\| floor_div \| 完成除法计算，对余数向下取整 \| \|16\| floor_mod \| 用于计算两个数的模 \| \|17\| is_neg_inf \| 判断输入张量的元素是否为负无穷 \| \|18\| is_pos_inf \| 判断输入张量的元素是否为正无穷 \| \|19\| less \| 判断输入self中的每个元素是否小于输入other的值，返回一个Bool类型的Tensor \| \|20\| less_equal \| 判断输入self中的元素值是否小于等于other的值，并将self的每个元素的值与other值的比较结果写入out中 \| \|21\| logical_and \| 对两个输入张量的对应元素执行「与逻辑」判断，输出布尔型张量（True/False） \| \|22\| log \| 对输入张量x的元素，逐元素进行对数计算，并将结果保存到输出张量y中 \| \|23\| not_equal \| 逐元素比较两个输入张量是否不相等 \| \|24\| ones_like \| 返回形状和类型相同的张量，所有元素都设置为1 \| \|25\|sign\|对输入的tensor逐元素进行Sign符号函数的运算并输出结果tensor\| \|26\| sqrt \| 完成非负数平方根计算，负数情况返回nan \| \|27\| sqrt_grad \| 完成梯度平方根计算 \| \|28\| square \| 为输入张量的每一个元素计算平方值 \| \|29\| squared_difference \| 为第一个输入张量减去第二个输入张量，并计算其平方值 \| \|30\| tanh \| 激活函数，返回与输入tensor shape相同的tensor，对输入tensor进行elementwise的计算 \| \|31\| tril \| 将输入的self张量的最后二维（按shape从左向右数）沿对角线的右上部分置零 \| \|32\| triu \| 将输入的self张量的最后二维（按shape从左向右数）沿对角线的左下部分置零 \| \|33\| zeros_like \| 将张量填充为全零 \| ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!495	5 个月前
op_kernel_aicpu	optimize the performace of aicpu ClipByValueV2 operator Co-authored-by: ZhaiPeiChao<zhaipeichao@huawei.com> # message auto-generated for no-merge-commit merge: !2460 merge clip_by_value_v2 into master optimize the performace of aicpu ClipByValueV2 operator Created-by: ZhaiPeiChao Commit-by: ZhaiPeiChao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 对 AICPU 的 ClipByValueV2 算子进行了全面的性能优化，通过重构核心计算逻辑、优化并行调度策略、分离标量/逐元素边界处理路径，显著提升了算子执行效率。 ### 主要改动 1. 核心计算函数重构: 将原有的函数指针调用模式重构为专用的内联函数（ClampScalar、ClampComplex），使用 if constexpr 和类型特征在编译期选择最优路径，消除了运行时开销。 2. 并行调度优化: 将并行阈值从基于元素数量（256K/32K）改为基于字节数（200KB/40KB），新增统一的 DispatchParallel 调度函数，优化小数据量的串行回退策略。 3. 分支路径分离: 区分标量边界和逐元素边界两种场景，为每种场景提供专用的 kernel 函数（KernelScalarBound、KernelElemBound 等），标量场景预加载边界值到寄存器。 4. 编译器优化提示: 大量使用 __attribute__((always_inline))、__attribute__((hot))、__restrict__、__builtin_expect 等编译器提示，优化指令级并行和分支预测。 5. 类型分发重构: 将 std::map 函数指针分发改为 switch-case 结构，利用编译器优化和更紧凑的代码布局。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> issue [#1380](https://gitcode.com/cann/ops-math/issues/1380) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> - 高频 fp32 scalar-bounds 中等规模（64K）：T=4 7.5× / T=6 5.7×； - 整型 elem-bounds（1M int32）：T=6 1.37×； - int8 scalar-bounds：T=1 1.29× / T=4 1.22×； - 单线程普遍：1.1–1.4×（向量化 + 分支外提）； - 大张量 DRAM 带宽饱和场景：0.93–0.97×（噪声范围）。 ### T=1（单线程，反映纯算法/访存/向量化收益） \| case \| old(ms) \| new(ms) \| speedup \| old(GB/s) \| new(GB/s) \| equal \| \|---\|---:\|---:\|---:\|---:\|---:\|:---:\| \| fp32 small 1K scalar-bounds \| 0.0130 \| 0.0110 \| 1.18× \| 0.60 \| 0.71 \| Y \| \| fp32 small 1K elem-bounds \| 0.0120 \| 0.0130 \| 0.92× \| 1.30 \| 1.20 \| Y \| \| fp32 64K scalar-bounds \| 0.4419 \| 0.3173 \| 1.39× \| 1.19 \| 1.65 \| Y \| \| fp32 256K elem-bounds \| 2.1340 \| 2.2015 \| 0.97× \| 1.96 \| 1.91 \| Y \| \| int32 256K scalar-bounds \| 0.9320 \| 0.8534 \| 1.09× \| 2.25 \| 2.46 \| Y \| \| int32 1M elem-bounds \| 8.7056 \| 7.8415 \| 1.11× \| 1.93 \| 2.14 \| Y \| \| int8 1M scalar-bounds \| 2.2670 \| 1.7555 \| 1.29× \| 0.92 \| 1.19 \| Y \| \| fp32 16M elem-bounds \| 162.6 \| 175.2 \| 0.93× \| 1.65 \| 1.53 \| Y \| ### T=4 \| case \| old(ms) \| new(ms) \| speedup \| new(GB/s) \| equal \| \|---\|---:\|---:\|---:\|---:\|:---:\| \| fp32 64K scalar-bounds \| 0.4513 \| 0.0600 \| 7.52× \| 27.3 \| Y \| \| fp32 256K elem-bounds \| 2.1500 \| 1.6860 \| 1.28× \| 2.49 \| Y \| \| int32 1M elem-bounds \| 8.6700 \| 8.4860 \| 1.02× \| 1.98 \| Y \| \| int8 1M scalar-bounds \| 2.2500 \| 1.8450 \| 1.22× \| 1.13 \| Y \| ### T=6 \| case \| old(ms) \| new(ms) \| speedup \| new(GB/s) \| equal \| \|---\|---:\|---:\|---:\|---:\|:---:\| \| fp32 64K scalar-bounds \| 0.4450 \| 0.0776 \| 5.73× \| 21.1 \| Y \| \| int32 1M elem-bounds \| 8.6820 \| 6.3410 \| 1.37× \| 2.65 \| Y \| \| int8 1M scalar-bounds \| 2.2700 \| 1.9800 \| 1.15× \| 1.06 \| Y \| ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [x] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2460	23 天前
tests	整改st目录下的atk用例统一目录格式 Co-authored-by: yue-ma<mayue54@huawei.com> # message auto-generated for no-merge-commit merge: !2579 merge master into master 整改st目录下的atk用例统一目录格式 Created-by: yue-ma Commit-by: yue-ma Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 整改st目录下的atk用例统一目录格式 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1538 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他，请描述：st用例目录整改 See merge request: cann/ops-math!2579	21 天前
CMakeLists.txt	Arch编码更新 Co-authored-by: liulinxiang<liulinxiang1@huawei.com> # message auto-generated for no-merge-commit merge: !992 merge master1 into master Arch编码更新 Created-by: liulinxiang Commit-by: liulinxiang Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!992	4 个月前
README.md	【bugfix】修复clip_by_value_v2文档 Co-authored-by: majiajian_hw<majiajian@huawei.com> # message auto-generated for no-merge-commit merge: !2726 merge bugfix_md_0513 into master 【bugfix】修复clip_by_value_v2文档 Created-by: nunnons2 Commit-by: majiajian_hw Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> clip_by_value_v2文档中，aclnn接口名称写错，少了Tensor。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1541 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 已完成 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> conversion/clip_by_value_v2/README.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2726	20 天前

ClipByValueV2

产品支持情况

产品	是否支持
Ascend 950PR/Ascend 950DT	√
Atlas A3 训练系列产品/Atlas A3 推理系列产品	√
Atlas A2 训练系列产品/Atlas A2 推理系列产品	√
Atlas 200I/500 A2 推理产品	×
Atlas 推理系列产品	√
Atlas 训练系列产品	√

功能说明

算子功能: 将输入的所有元素限制在[clipValueMin,clipValueMax]范围内，若元素大于clipValueMax则限制为clipValueMax，若元素小于clipValueMin则限制为clipValueMin，否则等于元素本身。
计算公式：

{y}_{i} = max(min({{x}_{i}},{max\_value}_{i}),{min\_value}_{i})

参数说明

参数名	输入/输出/属性	描述	数据类型	数据格式
x	输入	输入张量。	INT8、INT16、INT32、INT64、UINT8、UINT16、UINT32、UINT64 FLOAT16、FLOAT、DOUBLE、BOOL、BFLOAT16、COMPLEX64、COMPLEX128	ND
clip_value_min	输入	限制元素范围的最小值。	同输入张量x	ND
clip_value_max	输入	限制元素范围的最大值。	同输入张量x	ND
y	输出	将输入张量x裁剪后的输出张量。	同输入张量x	ND

约束说明

无

调用说明

调用方式	样例代码	说明
aclnn调用	test_aclnn_clamp	通过aclnnClamp接口方式调用clip_by_value_v2算子。
aclnn调用	test_aclnn_clamp_max test_aclnn_inplace_clamp_max	通过aclnnClampMax&aclnnInplaceClampMax接口方式调用clip_by_value_v2算子。
aclnn调用	test_aclnn_clamp_max_tensor test_aclnn_inplace_clamp_max_tensor	通过aclnnClampMaxTensor&aclnnInplaceClampMaxTensor接口方式调用clip_by_value_v2算子。
aclnn调用	test_aclnn_clamp_min	通过aclnnClampMin接口方式调用clip_by_value_v2算子。
aclnn调用	test_aclnn_clamp_min_tensor test_aclnn_inplace_clamp_min_tensor	通过aclnnClampMinTensor&aclnnInplaceClampMinTensor接口方式调用clip_by_value_v2算子。
aclnn调用	test_aclnn_clamp_tensor	通过aclnnClampTensor接口方式调用clip_by_value_v2算子。
aclnn调用	test_aclnn_hardtanh test_aclnn_inplace_ardtanh	通过aclnnHardtanh&aclnnInplaceHardtanh接口方式调用clip_by_value_v2算子。
图模式调用	test_geir_clip_by_value_v2	通过算子IR构图方式调用clip_by_value_v2算子。