cann-robotrefactor: 消除 math 算子重复头文件依赖，统一引用 base 仓

文件	最后提交记录	最后更新时间
docs	math仓的doc tools 工具检测的低错问题 Co-authored-by: caiwenwen<caiwenwen6@h-partners.com> # message auto-generated for no-merge-commit merge: !2461 merge master into master math仓的doc tools 工具检测的低错问题 Created-by: caiwenwen Commit-by: caiwenwen Merged-by: cann-robot Description: ## 描述处理math仓的doc tools 工具检测的低错问题，包括markdown低错、htlm标签合入、链接是否可以正常跳转 ## 关联的Issue #关联issue#1262 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新更新全部文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2461	1 个月前
examples	abs等算子A5实现 Co-authored-by: ly_cann_coder<liyao152@huawei.com> # message auto-generated for no-merge-commit merge: !495 merge develop into master abs等算子A5实现 Created-by: ly_cann_coder Commit-by: ly_cann_coder Merged-by: cann-robot Description: ## 描述新增以下算子的A5实现 \|序号\| 算子 \| 功能 \| \|--\|--\|--\| \|1\| abs \| 为输入张量的每一个元素取绝对值 \| \|2\| add \| 对输入完成相加操作 \| \|3\| addcdiv \| 张量运算函数，用于执行乘除加组合操作，将张量除法（带缩放）+ 张量加法合并为单个操作 \| \|4\| addcmul \| 张量运算函数，用于执行乘除加组合操作，将张量乘法（带缩放）+ 张量加法合并为单个操作 \| \|5\| axpy \| 源操作数中每个元素与标量求积后和目的操作数中的对应元素相加 \| \|6\| bincount \| 计算非负整数数组中每个数的频率 \| \|7\| ceil \| 返回输入tensor中每个元素向上取整的结果 \| \|8\| clip_by_value_v2 \| 将输入的所有元素限制在一定范围内 \| \|9\| concat \| 用于沿指定维度将多个输入 Tensor 进行拼接，输出包含所有输入数据按顺序拼接后的 Tensor \| \|10\| concat_v2 \| 用于沿指定维度将多个输入 Tensor 进行拼接，输出包含所有输入数据按顺序拼接后的 Tensor \| \|11\| equal \| 计算两个Tensor是否有相同的大小和元素，返回一个Bool类型 \| \|12\|exp\|返回一个新的张量，该张量的每个元素都是输入张量对应元素的指数\| \|13\| fill \| 对张量进行填充操作，支持非连续的Tensor操作 \| \|14\| floor \| 返回输入Tensor中每个元素向下取整，并将结果回填到输入Tensor中 \| \|15\| floor_div \| 完成除法计算，对余数向下取整 \| \|16\| floor_mod \| 用于计算两个数的模 \| \|17\| is_neg_inf \| 判断输入张量的元素是否为负无穷 \| \|18\| is_pos_inf \| 判断输入张量的元素是否为正无穷 \| \|19\| less \| 判断输入self中的每个元素是否小于输入other的值，返回一个Bool类型的Tensor \| \|20\| less_equal \| 判断输入self中的元素值是否小于等于other的值，并将self的每个元素的值与other值的比较结果写入out中 \| \|21\| logical_and \| 对两个输入张量的对应元素执行「与逻辑」判断，输出布尔型张量（True/False） \| \|22\| log \| 对输入张量x的元素，逐元素进行对数计算，并将结果保存到输出张量y中 \| \|23\| not_equal \| 逐元素比较两个输入张量是否不相等 \| \|24\| ones_like \| 返回形状和类型相同的张量，所有元素都设置为1 \| \|25\|sign\|对输入的tensor逐元素进行Sign符号函数的运算并输出结果tensor\| \|26\| sqrt \| 完成非负数平方根计算，负数情况返回nan \| \|27\| sqrt_grad \| 完成梯度平方根计算 \| \|28\| square \| 为输入张量的每一个元素计算平方值 \| \|29\| squared_difference \| 为第一个输入张量减去第二个输入张量，并计算其平方值 \| \|30\| tanh \| 激活函数，返回与输入tensor shape相同的tensor，对输入tensor进行elementwise的计算 \| \|31\| tril \| 将输入的self张量的最后二维（按shape从左向右数）沿对角线的右上部分置零 \| \|32\| triu \| 将输入的self张量的最后二维（按shape从左向右数）沿对角线的左下部分置零 \| \|33\| zeros_like \| 将张量填充为全零 \| ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!495	5 个月前
op_api	math仓算子代码整改 Co-authored-by: cai-chengchao<caichengchao1@h-partners.com> # message auto-generated for no-merge-commit merge: !881 merge math_op_back_1 into master math仓算子代码整改 Created-by: cai-chengchao Commit-by: cai-chengchao Merged-by: cann-robot Description: ## 描述 math仓算子代码整改 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!881	4 个月前
op_graph	abs等算子A5实现 Co-authored-by: ly_cann_coder<liyao152@huawei.com> # message auto-generated for no-merge-commit merge: !495 merge develop into master abs等算子A5实现 Created-by: ly_cann_coder Commit-by: ly_cann_coder Merged-by: cann-robot Description: ## 描述新增以下算子的A5实现 \|序号\| 算子 \| 功能 \| \|--\|--\|--\| \|1\| abs \| 为输入张量的每一个元素取绝对值 \| \|2\| add \| 对输入完成相加操作 \| \|3\| addcdiv \| 张量运算函数，用于执行乘除加组合操作，将张量除法（带缩放）+ 张量加法合并为单个操作 \| \|4\| addcmul \| 张量运算函数，用于执行乘除加组合操作，将张量乘法（带缩放）+ 张量加法合并为单个操作 \| \|5\| axpy \| 源操作数中每个元素与标量求积后和目的操作数中的对应元素相加 \| \|6\| bincount \| 计算非负整数数组中每个数的频率 \| \|7\| ceil \| 返回输入tensor中每个元素向上取整的结果 \| \|8\| clip_by_value_v2 \| 将输入的所有元素限制在一定范围内 \| \|9\| concat \| 用于沿指定维度将多个输入 Tensor 进行拼接，输出包含所有输入数据按顺序拼接后的 Tensor \| \|10\| concat_v2 \| 用于沿指定维度将多个输入 Tensor 进行拼接，输出包含所有输入数据按顺序拼接后的 Tensor \| \|11\| equal \| 计算两个Tensor是否有相同的大小和元素，返回一个Bool类型 \| \|12\|exp\|返回一个新的张量，该张量的每个元素都是输入张量对应元素的指数\| \|13\| fill \| 对张量进行填充操作，支持非连续的Tensor操作 \| \|14\| floor \| 返回输入Tensor中每个元素向下取整，并将结果回填到输入Tensor中 \| \|15\| floor_div \| 完成除法计算，对余数向下取整 \| \|16\| floor_mod \| 用于计算两个数的模 \| \|17\| is_neg_inf \| 判断输入张量的元素是否为负无穷 \| \|18\| is_pos_inf \| 判断输入张量的元素是否为正无穷 \| \|19\| less \| 判断输入self中的每个元素是否小于输入other的值，返回一个Bool类型的Tensor \| \|20\| less_equal \| 判断输入self中的元素值是否小于等于other的值，并将self的每个元素的值与other值的比较结果写入out中 \| \|21\| logical_and \| 对两个输入张量的对应元素执行「与逻辑」判断，输出布尔型张量（True/False） \| \|22\| log \| 对输入张量x的元素，逐元素进行对数计算，并将结果保存到输出张量y中 \| \|23\| not_equal \| 逐元素比较两个输入张量是否不相等 \| \|24\| ones_like \| 返回形状和类型相同的张量，所有元素都设置为1 \| \|25\|sign\|对输入的tensor逐元素进行Sign符号函数的运算并输出结果tensor\| \|26\| sqrt \| 完成非负数平方根计算，负数情况返回nan \| \|27\| sqrt_grad \| 完成梯度平方根计算 \| \|28\| square \| 为输入张量的每一个元素计算平方值 \| \|29\| squared_difference \| 为第一个输入张量减去第二个输入张量，并计算其平方值 \| \|30\| tanh \| 激活函数，返回与输入tensor shape相同的tensor，对输入tensor进行elementwise的计算 \| \|31\| tril \| 将输入的self张量的最后二维（按shape从左向右数）沿对角线的右上部分置零 \| \|32\| triu \| 将输入的self张量的最后二维（按shape从左向右数）沿对角线的左下部分置零 \| \|33\| zeros_like \| 将张量填充为全零 \| ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!495	5 个月前
op_host	refactor: 消除 math 算子重复头文件依赖，统一引用 base 仓 Co-authored-by: tianqiguang<tianqiguang@huawei.com> # message auto-generated for no-merge-commit merge: !2969 merge feature/conversion-dedup into master refactor: 消除 math 算子重复头文件依赖，统一引用 base 仓 Created-by: tianqiguang Commit-by: tianqiguang Merged-by: cann-robot Description: ## 描述消除 math 目录下 60+ 个算子的重复头文件依赖，将 tiling 基类和模板注册引用统一到 base 仓。 ### 改动原因 math 目录下各算子各自直接 #include tiling_base.h 和 tiling_templates_registry.h，且通过 using namespace Ops::Math::OpTiling 引入全局命名空间： - tiling_base.h 中 TilingBaseClass 已在 base 仓提取为 tiling_base_class.h - tiling_templates_registry.h 中 math 专用注册宏已拆分到 math_tiling_templates_registry.h - using namespace 引入全局命名空间会导致符号冲突风险 ### 改动方法 1. 修正 math_tiling_templates_registry.h 中文件注释和拼写错误 2. 批量更新 math 算子文件的 #include： - tiling_base.h → tiling_base_class.h - tiling_templates_registry.h → math_tiling_templates_registry.h 3. 移除 using namespace Ops::Math::OpTiling，改用显式命名空间： - TilingBaseClass → Ops::Base::TilingBaseClass - TilingRegistry::GetInstance() → Ops::Math::OpTiling::TilingRegistry::GetInstance() ## 关联的Issue - #1682 ## 测试 - 涉及的 math 算子二级冒烟测试已通过 ## 文档更新无文档变更 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他，请描述：代码重构，消除重复头文件依赖 See merge request: cann/ops-math!2969	5 天前
op_kernel	refactor: convert math SIMT kernels to C-style APIs Co-authored-by: qianzehong<qianzehong@huawei.com> # message auto-generated for no-merge-commit merge: !2616 merge c_style into master refactor: convert math SIMT kernels to C-style APIs Created-by: qianzehong Commit-by: qianzehong Merged-by: cann-robot Description: ## 描述对 ops-math 中 `floor_div`、`floor_mod`、`mul`、`select`、`mod`、`gcd` 算子的 Ascend 950 arch35 kernel 做 SIMT C 风格 API 整改。主要变更： - 增加 `simt_api/asc_simt.h` 头文件依赖。 - 将线程索引/线程数 API 从 `Simt::GetThreadIdx/GetThreadNum` 替换为 `threadIdx.x/blockDim.x`。 - 将 SIMT 调用 API 从 `Simt::VF_CALL/Dim3` 替换为 `asc_vf_call/dim3`。 - `select` 中 `Simt::UintDiv` 因当前 CANN 9.0.0 SIMT 头文件无 C 风格等价 API，保持不变。 ## 关联的Issue https://gitcode.com/cann/ops-math/issues/1481 ## 测试按本次处理要求跳过编译验证；本地 CANN 包版本与目标验证环境不一致。 ## 文档更新无文档更新。 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他，请描述：SIMT C 风格 API 整改 See merge request: cann/ops-math!2616	21 天前
tests	整改st目录下的atk用例统一目录格式 Co-authored-by: yue-ma<mayue54@huawei.com> # message auto-generated for no-merge-commit merge: !2579 merge master into master 整改st目录下的atk用例统一目录格式 Created-by: yue-ma Commit-by: yue-ma Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 整改st目录下的atk用例统一目录格式 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1538 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他，请描述：st用例目录整改 See merge request: cann/ops-math!2579	20 天前
CMakeLists.txt	Arch编码更新 Co-authored-by: liulinxiang<liulinxiang1@huawei.com> # message auto-generated for no-merge-commit merge: !992 merge master1 into master Arch编码更新 Created-by: liulinxiang Commit-by: liulinxiang Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!992	4 个月前
README.md	math仓的doc tools 工具检测的低错问题 Co-authored-by: caiwenwen<caiwenwen6@h-partners.com> # message auto-generated for no-merge-commit merge: !2461 merge master into master math仓的doc tools 工具检测的低错问题 Created-by: caiwenwen Commit-by: caiwenwen Merged-by: cann-robot Description: ## 描述处理math仓的doc tools 工具检测的低错问题，包括markdown低错、htlm标签合入、链接是否可以正常跳转 ## 关联的Issue #关联issue#1262 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新更新全部文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2461	1 个月前

FloorMod

产品支持情况

产品	是否支持
Ascend 950PR/Ascend 950DT	√
Atlas A3 训练系列产品/Atlas A3 推理系列产品	√
Atlas A2 训练系列产品/Atlas A2 推理系列产品	√
Atlas 200I/500 A2 推理产品	×
Atlas 推理系列产品	×
Atlas 训练系列产品	√

功能说明

算子功能: 将scalar self进行broadcast成和tensor other一样shape的tensor以后，其中的每个元素都转换为除以other的对应元素以后得到的余数。该结果与除数other同符号，并且该结果的绝对值是小于other的绝对值。实际计算remainder(self, other) 等效于以下公式：
$out_i = self - floor(self / other_i) * other_i$
示例：

self = 5.0   # float
other = tensor([[-1, -2],
                [-3, -4]]).type(int32)
result = remainder(self, other)

# result的值
# tensor([[ 0., -1.],
#         [-1., -3.]])  float

# 对于元素other中的-4来说，计算结果为 5 - floor(5 / -4) * -4 = -3
# 可以看到，最终结果-3的绝对值小于原来的-4的绝对值。

参数说明

参数名	输入/输出/属性	描述	数据类型	数据格式
x1	输入	公式中的输入张量self_i	FLOAT16, BFLOAT16, FLOAT, INT32, INT64	ND
x2	输入	公式中的输入张量other_i	FLOAT16, BFLOAT16, FLOAT, INT32, INT64	ND
y	输出	公式中的输出张量out_i	FLOAT16, BFLOAT16, FLOAT, INT32, INT64	ND

调用说明

调用方式	调用样例	说明
aclnn调用	test_aclnn_remainder_scalar_tensor	通过aclnnRemainderScalarTensor接口方式调用FloorDiv算子