文件最后提交记录最后更新时间
keeping_same_for_.h_and_docs Co-authored-by: jisongyuan@h-partners.com<jisongyuan@h-partners.com> # message auto-generated for no-merge-commit merge: !2339 merge 9.0.0 into 9.0.0 keeping_same_for_.h_and_docs Created-by: ji-songyuan Commit-by: jisongyuan@h-partners.com Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 修改资料保持头文件和资料完全一致 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 不涉及代码修改 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> conversion/pad_v3_grad_replicate/docs/aclnnReplicationPad2dBackward.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!23391 个月前
增加A2 A3新算子支持 Co-authored-by: slx2008<shaolixin@huawei.com> # message auto-generated for no-merge-commit merge: !448 merge master into master 增加A2 A3新算子支持 Created-by: songkai111 Commit-by: slx2008 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!4485 个月前
增加A2 A3新算子支持 Co-authored-by: slx2008<shaolixin@huawei.com> # message auto-generated for no-merge-commit merge: !448 merge master into master 增加A2 A3新算子支持 Created-by: songkai111 Commit-by: slx2008 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!4485 个月前
修复pad_v3_grad_replicate在kernel升精度时的UB分配策略问题 Co-authored-by: wy519<wangyang519@huawei.com> # message auto-generated for no-merge-commit merge: !1894 merge fix_rep_pad_grad_9.0.0 into 9.0.0 修复pad_v3_grad_replicate在kernel升精度时的UB分配策略问题 Created-by: wy519 Commit-by: wy519 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> pad_v3_grad_replicate当输入类型是fp16时存在core dump,定位发现是kernel做了升精度处理,但是tiling中ub分配策略没有调整 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1073 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 测试了200个case问题修复 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!18942 个月前
修复aclnnReplicationPad2dBackward内存检测问题 Co-authored-by: wy519<wangyang519@huawei.com> # message auto-generated for no-merge-commit merge: !2257 merge fix_oom_pad_9.0.0 into 9.0.0 修复aclnnReplicationPad2dBackward内存检测问题 Created-by: wy519 Commit-by: wy519 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 修复aclnnReplicationPad2dBackward内存检测问题 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1274 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> issue中case测试通过 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> / ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!22571 个月前
修复pad_v3_grad_replicate在kernel升精度时的UB分配策略问题 Co-authored-by: wy519<wangyang519@huawei.com> # message auto-generated for no-merge-commit merge: !1894 merge fix_rep_pad_grad_9.0.0 into 9.0.0 修复pad_v3_grad_replicate在kernel升精度时的UB分配策略问题 Created-by: wy519 Commit-by: wy519 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> pad_v3_grad_replicate当输入类型是fp16时存在core dump,定位发现是kernel做了升精度处理,但是tiling中ub分配策略没有调整 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1073 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 测试了200个case问题修复 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!18942 个月前
增加A2 A3新算子支持 Co-authored-by: slx2008<shaolixin@huawei.com> # message auto-generated for no-merge-commit merge: !448 merge master into master 增加A2 A3新算子支持 Created-by: songkai111 Commit-by: slx2008 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!4485 个月前
doc tool motidy Co-authored-by: caiwenwen<caiwenwen6@h-partners.com> # message auto-generated for no-merge-commit merge: !2186 merge 9.0.0 into 9.0.0 doc tool motidy Created-by: caiwenwen Commit-by: caiwenwen Merged-by: cann-robot Description: ## 描述 修改math仓的doc tools检测内容,修改markdown等语法 ## 关联的Issue 关联issue#1262 [https://gitcode.com/cann/ops-math/issues/1262](url) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 更新全部文件 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [X] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!21861 个月前
README.md

PadV3GradReplicate

产品支持情况

产品 是否支持
Ascend 950PR/Ascend 950DT ×
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品 ×
Atlas 推理系列产品 ×
Atlas 训练系列产品 ×

功能说明

  • 算子功能:replication_pad1d/replication_pad2d的反向传播。

参数说明

参数名 输入/输出/属性 描述 数据类型 数据格式
gradOutput 输入 replication_pad1d/replication_pad2d的正向传播,shape支持2~4维且维度需要与self和gradInput保持一致,2/3维为1d,3/4维为2d。 FLOAT16、FLOAT32、DOUBLE、COMPLEX64、COMPLEX128 ND
self 输入 shape支持2~4维且维度需要与self和gradInput保持一致,shape与gradInput一致。 FLOAT16、FLOAT32、DOUBLE、COMPLEX64、COMPLEX128 ND
padding 输入 padding描述了向外填充的大小,长度为2或4。
  • 长度为2时表示1d左右需要填充的值,padding的前两个值都需要小于self最后一维的数值。
  • 长度为4时表示2d左右上下需要填充的值,padding的前两个值都需要小于self最后一维的数值,后两个值需要小于倒数第二维的数值。
  • INT64
    gradInput 输出 数据类型与self保持一致。 FLOAT16、FLOAT32、DOUBLE、COMPLEX64、COMPLEX128 ND

    约束说明

    • 输入shape限制:gradOutput、self 和 gradInput 的维度需一致(支持三/四维),且它们的形状需与 replication_pad1d/replication_pad2d 正向传播的输出形状相互一致。

    • 输入值域限制:padding长度为2时,padding的前两个值都需要小于self最后一维的数值;长度为4时,padding的前两个值都需要小于self最后一维的数值,后两个值需要小于倒数第二维的数值。

    调用说明

    调用方式 调用样例 说明
    aclnn调用 test_aclnn_pad_v3_grad_replicate.cpp 通过aclnnReplicationPad1dBackward接口方式调用PadV3GradReplicate算子。
    aclnn调用 test_aclnn_replication_pad2d_backward 通过aclnnReplicationPad2dBackward接口方式调用PadV3GradReplicate算子。