文件最后提交记录最后更新时间
math仓的doc tools 工具检测的低错问题 Co-authored-by: caiwenwen<caiwenwen6@h-partners.com> # message auto-generated for no-merge-commit merge: !2461 merge master into master math仓的doc tools 工具检测的低错问题 Created-by: caiwenwen Commit-by: caiwenwen Merged-by: cann-robot Description: ## 描述 处理math仓的doc tools 工具检测的低错问题,包括markdown低错、htlm标签合入、链接是否可以正常跳转 ## 关联的Issue #关联issue#1262 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 更新全部文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!24611 个月前
增加A2 A3新算子支持 Co-authored-by: slx2008<shaolixin@huawei.com> # message auto-generated for no-merge-commit merge: !448 merge master into master 增加A2 A3新算子支持 Created-by: songkai111 Commit-by: slx2008 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!4485 个月前
Ascend950新增GroupedBiasAddGrad算子 Co-authored-by: zhu-xun00613388<zhuxun7@huawei.com> # message auto-generated for no-merge-commit merge: !1890 merge GroupedBiasAddGrad into master Ascend950新增GroupedBiasAddGrad算子 Created-by: zhu-xun Commit-by: zhu-xun00613388 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> Ascend950新增GroupedBiasAddGrad算子 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!18902 个月前
grouped_bias_add_grad算子原型增加输出约束描述 Co-authored-by: liaohuming<liaohuming@huawei.com> # message auto-generated for no-merge-commit merge: !2025 merge master into master grouped_bias_add_grad算子原型增加输出约束描述 Created-by: liaohuming Commit-by: liaohuming Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1150 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 更新了grouped_bias_add_grad_proto.h文件 增加了输出grad_bias与输入grad_y的关系描述: grad_bias: A Tensor. Data type must match that of 'grad_y' (BFloat16, Float16 or Float32). Shape constraints are determined based on the dimensionality of 'grad_y': - If 'grad_y' has 3 dimensions ('group_idx' is not provided), then: 'grad_bias.shape = [grad_y.shape[0], grad_y.shape[2]]' - If 'grad_y' has 2 dimensions ('group_idx' is provided), then: 'grad_bias.shape = [group_idx.shape[0], grad_y.shape[1]]' - Supports non-continuous tensors, and data format supports "ND". ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!20252 个月前
refactor: 删除废弃公共头文件,完成 math/random 算子头文件去重 Co-authored-by: tianqiguang<tianqiguang@huawei.com> # message auto-generated for no-merge-commit merge: !3000 merge math_tiling into master refactor: 删除废弃公共头文件,完成 math/random 算子头文件去重 Created-by: tianqiguang Commit-by: tianqiguang Merged-by: cann-robot Description: ## 描述 删除 4 个已废弃的公共头文件,并完成剩余 math 算子和全部 random 算子的重复头文件消除。本 PR 为此系列重构的收尾提交。 ### 改动原因 前三批 PR(#2951 conversion / #2969 math上 / #2980 math下)已完成所有算子到 base 仓头文件的迁移。原公共头文件已成为空壳转发或不再被引用,可安全删除: - tiling_base.h:已改为转发 tiling_base_class.h,可直接删除 - tiling_templates_registry.h:math 专用部分已拆分到 math_tiling_templates_registry.h - tiling_util.h / tiling_util.cpp:功能已迁移至 base 仓 tiling_base_util.h 此前几批遗漏了部分 math 算子(add_lora, atan2, histogram_v2, stft 等 10+ 个)以及 random 目录下全部算子。 ### 改动方法 1. 删除 4 个废弃文件并精简 common/CMakeLists.txt 2. 更新遗漏的 math 算子:#include + 命名空间修正 3. 更新 20+ 个 random 算子:同样的 #include + 命名空间修正 4. 更新示例(add_example, add_example_c_api)和 opgen 模板脚本 ## 关联的Issue - #1697 ## 测试 - 涉及的算子二级冒烟测试已通过 ## 文档更新 无文档变更 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述:代码重构,删除废弃头文件并完成去重收尾 See merge request: cann/ops-math!30005 天前
grouped_bias_add_grad算子性能优化 Co-authored-by: qq_45996812<liaohuming@huawei.com> # message auto-generated for no-merge-commit merge: !2057 merge master into master grouped_bias_add_grad算子性能优化 Created-by: liaohuming Commit-by: qq_45996812 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 优化grouped_bias_add_grad算子纯搬运场景的性能 (1) 将CutGH及CutH模板的块单位从128B换成521B,针对纯搬运场景,重新利用TQueBind来处理纯搬运场景,优化流水。 (2) 开启4Buffer。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1186 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [x] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!20571 个月前
整改st目录下的atk用例统一目录格式 Co-authored-by: yue-ma<mayue54@huawei.com> # message auto-generated for no-merge-commit merge: !2579 merge master into master 整改st目录下的atk用例统一目录格式 Created-by: yue-ma Commit-by: yue-ma Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 整改st目录下的atk用例统一目录格式 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1538 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述:st用例目录整改 See merge request: cann/ops-math!257921 天前
Ascend950新增GroupedBiasAddGrad算子 Co-authored-by: zhu-xun00613388<zhuxun7@huawei.com> # message auto-generated for no-merge-commit merge: !1890 merge GroupedBiasAddGrad into master Ascend950新增GroupedBiasAddGrad算子 Created-by: zhu-xun Commit-by: zhu-xun00613388 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> Ascend950新增GroupedBiasAddGrad算子 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!18902 个月前
doc Tools扫描错误修改 Co-authored-by: gitee-yanglulu<yanglulul@h-partners.com> # message auto-generated for no-merge-commit merge: !1899 merge master into master doc Tools扫描错误修改 Created-by: gitee-yanglulu Commit-by: gitee-yanglulu Merged-by: cann-robot Description: doc Tools扫描错误修改 See merge request: cann/ops-math!18992 个月前
README.md

GroupedBiasAddGrad

产品支持情况

产品 是否支持
Ascend 950PR/Ascend 950DT ×
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品 ×
Atlas 推理系列产品 ×
Atlas 训练系列产品 ×

功能说明

  • 算子功能:对分组通道的偏置梯度进行归约求和。

  • 计算公式:

  (1) 有可选输入groupIdxOptional,且groupIdxType为0时:

out(G,H)={∑i=groupIdxOptional(j−1)groupIdxOptional(j) ⁣ ⁣gradY(i,H),1≤j≤G−1∑i=0groupIdxOptional(j)gradY(i,H),j=0out(G,H) = \begin{cases} \displaystyle \sum_{i = \mathrm{groupIdxOptional}(j-1)}^{\mathrm{groupIdxOptional}(j)} \!\! \mathrm{gradY}(i, H), & 1 \leq j \leq G-1 \\[8pt] \displaystyle \sum_{i = 0}^{\mathrm{groupIdxOptional}(j)} \mathrm{gradY}(i, H), & j = 0 \end{cases}

  (2) 有可选输入groupIdxOptional,且groupIdxType为1时:

groupIdx(i)=∑i=0jgroupIdxOptional(j),j=0...GgroupIdx(i) = \sum_{i=0}^{j} groupIdxOptional(j), j=0...G

out(G,H)={∑i = groupIdx(j−1)groupIdx(j) ⁣ ⁣gradY(i,H),1≤j≤G−1∑i = 0groupIdx(j)gradY(i,H),j=0out(G,H) = \left\{ \begin{aligned} &\sum_{i\,=\,\mathrm{groupIdx}(j-1)}^{\mathrm{groupIdx}(j)} \!\! \mathrm{gradY}(i, H), && 1 \leq j \leq G-1 \\ &\sum_{i\,=\,0}^{\mathrm{groupIdx}(j)} \mathrm{gradY}(i, H), && j = 0 \end{aligned} \right.

  其中,gradY共2维,H表示gradY最后一维的大小,G表示groupIdxOptional第0维的大小,即groupIdxOptional有G个数,groupIdxOptional(j)表示第j个数的大小,计算后out为2维,shape为(G, H)。
  (3) 无可选输入groupIdxOptional时:

out(G,H)=∑i=0CgradY(G,i,H)out(G, H) = \sum_{i=0}^{C} gradY(G, i, H)

  其中,gradY共3维,G, C, H依次表示gradY第0-2维的大小,计算后out为2维,shape为(G, H)。

参数说明

参数名 输入/输出/属性 描述 数据类型 数据格式
gradY 输入 反向传播梯度,公式中的输入gradY。支持非连续的Tensor FLOAT16、BFLOAT16、FLOAT ND
groupIdxOptional 可选输入 每个分组结束位置,公式中输入的groupIdxOptional。最多支持2048个组,支持非连续的Tensor。 INT32、INT64 ND
out 输出 bias的梯度,公式中的out。 FLOAT16、BFLOAT16、FLOAT ND
groupIdxType 可选属性 表示groupIdx的类型。支持的值为:
0:表示groupIdxOptional中的值为每个group的结束索引。
1:表示groupIdxOptional中的值为每个group的大小。
Int -

约束说明

  • 当存在输入group_idx时,需要满足下列约束:
    • 需要确保张量的值不超过INT32的最大值并且是非负的。
    • grad_y仅支持 2 维形状。
  • 当不存在输入group_idx时,grad_y仅支持 3 维形状。
  • 当存在输入group_idx并且group_idx_type为0时,需要确保张量数据按升序排列,最后一个数值等于grad_y的第0维度的大小。
  • 当存在输入group_idx并且group_idx_type为1时,必须确保张量数据的总和必须等于grad_y的第0维度的大小。

调用说明

调用方式 调用样例 说明
aclnn调用 test_aclnn_grouped_bias_add_grad 通过aclnnGroupedBiasAddGrad接口方式调用GroupedBiasAddGrad算子。
图模式调用 test_geir_grouped_bias_add_grad 通过算子IR构图方式调用GroupedBiasAddGrad算子。