0

0

cann-robotkeeping_same_for_.h_and_docs

4b0c990a创建于 4月21日历史提交

文件	最后提交记录	最后更新时间
docs	keeping_same_for_.h_and_docs Co-authored-by: jisongyuan@h-partners.com<jisongyuan@h-partners.com> # message auto-generated for no-merge-commit merge: !2339 merge 9.0.0 into 9.0.0 keeping_same_for_.h_and_docs Created-by: ji-songyuan Commit-by: jisongyuan@h-partners.com Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 修改资料保持头文件和资料完全一致 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 不涉及代码修改 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> conversion/pad_v3_grad_replicate/docs/aclnnReplicationPad2dBackward.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2339	1 个月前
examples	增加A2 A3新算子支持 Co-authored-by: slx2008<shaolixin@huawei.com> # message auto-generated for no-merge-commit merge: !448 merge master into master 增加A2 A3新算子支持 Created-by: songkai111 Commit-by: slx2008 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!448	5 个月前
op_graph	增加A2 A3新算子支持 Co-authored-by: slx2008<shaolixin@huawei.com> # message auto-generated for no-merge-commit merge: !448 merge master into master 增加A2 A3新算子支持 Created-by: songkai111 Commit-by: slx2008 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!448	5 个月前
op_host	修复pad_v3_grad_replicate在kernel升精度时的UB分配策略问题 Co-authored-by: wy519<wangyang519@huawei.com> # message auto-generated for no-merge-commit merge: !1894 merge fix_rep_pad_grad_9.0.0 into 9.0.0 修复pad_v3_grad_replicate在kernel升精度时的UB分配策略问题 Created-by: wy519 Commit-by: wy519 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> pad_v3_grad_replicate当输入类型是fp16时存在core dump，定位发现是kernel做了升精度处理，但是tiling中ub分配策略没有调整 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1073 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 测试了200个case问题修复 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!1894	2 个月前
op_kernel	修复aclnnReplicationPad2dBackward内存检测问题 Co-authored-by: wy519<wangyang519@huawei.com> # message auto-generated for no-merge-commit merge: !2257 merge fix_oom_pad_9.0.0 into 9.0.0 修复aclnnReplicationPad2dBackward内存检测问题 Created-by: wy519 Commit-by: wy519 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 修复aclnnReplicationPad2dBackward内存检测问题 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1274 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> issue中case测试通过 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> / ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2257	1 个月前
tests	修复pad_v3_grad_replicate在kernel升精度时的UB分配策略问题 Co-authored-by: wy519<wangyang519@huawei.com> # message auto-generated for no-merge-commit merge: !1894 merge fix_rep_pad_grad_9.0.0 into 9.0.0 修复pad_v3_grad_replicate在kernel升精度时的UB分配策略问题 Created-by: wy519 Commit-by: wy519 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> pad_v3_grad_replicate当输入类型是fp16时存在core dump，定位发现是kernel做了升精度处理，但是tiling中ub分配策略没有调整 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1073 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 测试了200个case问题修复 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!1894	2 个月前
CMakeLists.txt	增加A2 A3新算子支持 Co-authored-by: slx2008<shaolixin@huawei.com> # message auto-generated for no-merge-commit merge: !448 merge master into master 增加A2 A3新算子支持 Created-by: songkai111 Commit-by: slx2008 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!448	5 个月前
README.md	doc tool motidy Co-authored-by: caiwenwen<caiwenwen6@h-partners.com> # message auto-generated for no-merge-commit merge: !2186 merge 9.0.0 into 9.0.0 doc tool motidy Created-by: caiwenwen Commit-by: caiwenwen Merged-by: cann-robot Description: ## 描述修改math仓的doc tools检测内容，修改markdown等语法 ## 关联的Issue 关联issue#1262 [https://gitcode.com/cann/ops-math/issues/1262](url) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新更新全部文件 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [X] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2186	1 个月前

PadV3GradReplicate

产品支持情况

产品	是否支持
Ascend 950PR/Ascend 950DT	×
Atlas A3 训练系列产品/Atlas A3 推理系列产品	√
Atlas A2 训练系列产品/Atlas A2 推理系列产品	√
Atlas 200I/500 A2 推理产品	×
Atlas 推理系列产品	×
Atlas 训练系列产品	×

功能说明

算子功能：replication_pad1d/replication_pad2d的反向传播。

参数说明

参数名	输入/输出/属性	描述	数据类型	数据格式
gradOutput	输入	replication_pad1d/replication_pad2d的正向传播，shape支持2~4维且维度需要与self和gradInput保持一致，2/3维为1d，3/4维为2d。	FLOAT16、FLOAT32、DOUBLE、COMPLEX64、COMPLEX128	ND
self	输入	shape支持2~4维且维度需要与self和gradInput保持一致，shape与gradInput一致。	FLOAT16、FLOAT32、DOUBLE、COMPLEX64、COMPLEX128	ND
padding	输入	padding描述了向外填充的大小，长度为2或4。长度为2时表示1d左右需要填充的值，padding的前两个值都需要小于self最后一维的数值。长度为4时表示2d左右上下需要填充的值，padding的前两个值都需要小于self最后一维的数值，后两个值需要小于倒数第二维的数值。	INT64
gradInput	输出	数据类型与self保持一致。	FLOAT16、FLOAT32、DOUBLE、COMPLEX64、COMPLEX128	ND

约束说明

输入shape限制：gradOutput、self 和 gradInput 的维度需一致（支持三/四维），且它们的形状需与 replication_pad1d/replication_pad2d 正向传播的输出形状相互一致。
输入值域限制：padding长度为2时，padding的前两个值都需要小于self最后一维的数值；长度为4时，padding的前两个值都需要小于self最后一维的数值，后两个值需要小于倒数第二维的数值。

调用说明

调用方式	调用样例	说明
aclnn调用	test_aclnn_pad_v3_grad_replicate.cpp	通过aclnnReplicationPad1dBackward接口方式调用PadV3GradReplicate算子。
aclnn调用	test_aclnn_replication_pad2d_backward	通过aclnnReplicationPad2dBackward接口方式调用PadV3GradReplicate算子。