cann-robotrefactor: 删除废弃公共头文件，完成 math/random 算子头文件去重

文件	最后提交记录	最后更新时间
docs	math仓的doc tools 工具检测的低错问题 Co-authored-by: caiwenwen<caiwenwen6@h-partners.com> # message auto-generated for no-merge-commit merge: !2461 merge master into master math仓的doc tools 工具检测的低错问题 Created-by: caiwenwen Commit-by: caiwenwen Merged-by: cann-robot Description: ## 描述处理math仓的doc tools 工具检测的低错问题，包括markdown低错、htlm标签合入、链接是否可以正常跳转 ## 关联的Issue #关联issue#1262 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新更新全部文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2461	1 个月前
examples	增加A2 A3新算子支持 Co-authored-by: slx2008<shaolixin@huawei.com> # message auto-generated for no-merge-commit merge: !448 merge master into master 增加A2 A3新算子支持 Created-by: songkai111 Commit-by: slx2008 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!448	5 个月前
op_api	Ascend950新增GroupedBiasAddGrad算子 Co-authored-by: zhu-xun00613388<zhuxun7@huawei.com> # message auto-generated for no-merge-commit merge: !1890 merge GroupedBiasAddGrad into master Ascend950新增GroupedBiasAddGrad算子 Created-by: zhu-xun Commit-by: zhu-xun00613388 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> Ascend950新增GroupedBiasAddGrad算子 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!1890	2 个月前
op_graph	grouped_bias_add_grad算子原型增加输出约束描述 Co-authored-by: liaohuming<liaohuming@huawei.com> # message auto-generated for no-merge-commit merge: !2025 merge master into master grouped_bias_add_grad算子原型增加输出约束描述 Created-by: liaohuming Commit-by: liaohuming Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1150 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> 更新了grouped_bias_add_grad_proto.h文件增加了输出grad_bias与输入grad_y的关系描述： grad_bias: A Tensor. Data type must match that of 'grad_y' (BFloat16, Float16 or Float32). Shape constraints are determined based on the dimensionality of 'grad_y': - If 'grad_y' has 3 dimensions ('group_idx' is not provided), then: 'grad_bias.shape = [grad_y.shape[0], grad_y.shape[2]]' - If 'grad_y' has 2 dimensions ('group_idx' is provided), then: 'grad_bias.shape = [group_idx.shape[0], grad_y.shape[1]]' - Supports non-continuous tensors, and data format supports "ND". ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2025	2 个月前
op_host	refactor: 删除废弃公共头文件，完成 math/random 算子头文件去重 Co-authored-by: tianqiguang<tianqiguang@huawei.com> # message auto-generated for no-merge-commit merge: !3000 merge math_tiling into master refactor: 删除废弃公共头文件，完成 math/random 算子头文件去重 Created-by: tianqiguang Commit-by: tianqiguang Merged-by: cann-robot Description: ## 描述删除 4 个已废弃的公共头文件，并完成剩余 math 算子和全部 random 算子的重复头文件消除。本 PR 为此系列重构的收尾提交。 ### 改动原因前三批 PR（#2951 conversion / #2969 math上 / #2980 math下）已完成所有算子到 base 仓头文件的迁移。原公共头文件已成为空壳转发或不再被引用，可安全删除： - tiling_base.h：已改为转发 tiling_base_class.h，可直接删除 - tiling_templates_registry.h：math 专用部分已拆分到 math_tiling_templates_registry.h - tiling_util.h / tiling_util.cpp：功能已迁移至 base 仓 tiling_base_util.h 此前几批遗漏了部分 math 算子（add_lora, atan2, histogram_v2, stft 等 10+ 个）以及 random 目录下全部算子。 ### 改动方法 1. 删除 4 个废弃文件并精简 common/CMakeLists.txt 2. 更新遗漏的 math 算子：#include + 命名空间修正 3. 更新 20+ 个 random 算子：同样的 #include + 命名空间修正 4. 更新示例（add_example, add_example_c_api）和 opgen 模板脚本 ## 关联的Issue - #1697 ## 测试 - 涉及的算子二级冒烟测试已通过 ## 文档更新无文档变更 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他，请描述：代码重构，删除废弃头文件并完成去重收尾 See merge request: cann/ops-math!3000	5 天前
op_kernel	grouped_bias_add_grad算子性能优化 Co-authored-by: qq_45996812<liaohuming@huawei.com> # message auto-generated for no-merge-commit merge: !2057 merge master into master grouped_bias_add_grad算子性能优化 Created-by: liaohuming Commit-by: qq_45996812 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 优化grouped_bias_add_grad算子纯搬运场景的性能 (1) 将CutGH及CutH模板的块单位从128B换成521B，针对纯搬运场景，重新利用TQueBind来处理纯搬运场景，优化流水。 (2) 开启4Buffer。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1186 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [x] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2057	1 个月前
tests	整改st目录下的atk用例统一目录格式 Co-authored-by: yue-ma<mayue54@huawei.com> # message auto-generated for no-merge-commit merge: !2579 merge master into master 整改st目录下的atk用例统一目录格式 Created-by: yue-ma Commit-by: yue-ma Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 整改st目录下的atk用例统一目录格式 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1538 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他，请描述：st用例目录整改 See merge request: cann/ops-math!2579	21 天前
CMakeLists.txt	Ascend950新增GroupedBiasAddGrad算子 Co-authored-by: zhu-xun00613388<zhuxun7@huawei.com> # message auto-generated for no-merge-commit merge: !1890 merge GroupedBiasAddGrad into master Ascend950新增GroupedBiasAddGrad算子 Created-by: zhu-xun Commit-by: zhu-xun00613388 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> Ascend950新增GroupedBiasAddGrad算子 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!1890	2 个月前
README.md	doc Tools扫描错误修改 Co-authored-by: gitee-yanglulu<yanglulul@h-partners.com> # message auto-generated for no-merge-commit merge: !1899 merge master into master doc Tools扫描错误修改 Created-by: gitee-yanglulu Commit-by: gitee-yanglulu Merged-by: cann-robot Description: doc Tools扫描错误修改 See merge request: cann/ops-math!1899	2 个月前

GroupedBiasAddGrad

产品支持情况

产品	是否支持
Ascend 950PR/Ascend 950DT	×
Atlas A3 训练系列产品/Atlas A3 推理系列产品	√
Atlas A2 训练系列产品/Atlas A2 推理系列产品	√
Atlas 200I/500 A2 推理产品	×
Atlas 推理系列产品	×
Atlas 训练系列产品	×

功能说明

算子功能：对分组通道的偏置梯度进行归约求和。
计算公式：

(1) 有可选输入groupIdxOptional，且groupIdxType为0时：

\begin{cases} \displaystyle \sum_{i = \mathrm{groupIdxOptional}(j-1)}^{\mathrm{groupIdxOptional}(j)} \!\! \mathrm{gradY}(i, H), & 1 \leq j \leq G-1 \\[8pt] \displaystyle \sum_{i = 0}^{\mathrm{groupIdxOptional}(j)} \mathrm{gradY}(i, H), & j = 0 \end{cases}

(2) 有可选输入groupIdxOptional，且groupIdxType为1时：

\sum_{i=0}^{j} groupIdxOptional(j), j=0...G

\left\{ \begin{aligned} &\sum_{i\,=\,\mathrm{groupIdx}(j-1)}^{\mathrm{groupIdx}(j)} \!\! \mathrm{gradY}(i, H), && 1 \leq j \leq G-1 \\ &\sum_{i\,=\,0}^{\mathrm{groupIdx}(j)} \mathrm{gradY}(i, H), && j = 0 \end{aligned} \right.

其中，gradY共2维，H表示gradY最后一维的大小，G表示groupIdxOptional第0维的大小，即groupIdxOptional有G个数，groupIdxOptional(j)表示第j个数的大小，计算后out为2维，shape为(G, H)。
(3) 无可选输入groupIdxOptional时：

\sum_{i=0}^{C} gradY(G, i, H)

其中，gradY共3维，G, C, H依次表示gradY第0-2维的大小，计算后out为2维，shape为(G, H)。

参数说明

参数名	输入/输出/属性	描述	数据类型	数据格式
gradY	输入	反向传播梯度，公式中的输入gradY。支持非连续的Tensor。	FLOAT16、BFLOAT16、FLOAT	ND
groupIdxOptional	可选输入	每个分组结束位置，公式中输入的groupIdxOptional。最多支持2048个组，支持非连续的Tensor。	INT32、INT64	ND
out	输出	bias的梯度，公式中的out。	FLOAT16、BFLOAT16、FLOAT	ND
groupIdxType	可选属性	表示groupIdx的类型。支持的值为： 0：表示groupIdxOptional中的值为每个group的结束索引。 1：表示groupIdxOptional中的值为每个group的大小。	Int	-

约束说明

当存在输入group_idx时，需要满足下列约束：
- 需要确保张量的值不超过INT32的最大值并且是非负的。
- grad_y仅支持 2 维形状。
当不存在输入group_idx时，grad_y仅支持 3 维形状。
当存在输入group_idx并且group_idx_type为0时，需要确保张量数据按升序排列，最后一个数值等于grad_y的第0维度的大小。
当存在输入group_idx并且group_idx_type为1时，必须确保张量数据的总和必须等于grad_y的第0维度的大小。

调用说明

调用方式	调用样例	说明
aclnn调用	test_aclnn_grouped_bias_add_grad	通过aclnnGroupedBiasAddGrad接口方式调用GroupedBiasAddGrad算子。
图模式调用	test_geir_grouped_bias_add_grad	通过算子IR构图方式调用GroupedBiasAddGrad算子。