文件最后提交记录最后更新时间
nn仓芯片类型补充以及资料格式修改 Co-authored-by: sunchun<sunchun4@h-partners.com> # message auto-generated for no-merge-commit merge: !3420 merge xinpian into master nn仓芯片类型补充以及资料格式修改 Created-by: sunchun Commit-by: sunchun Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> ## 测试 <!--描述进行了哪些测试来验证你的改动。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-nn!34201 个月前
sigmoid/silu_grad/masked_scatter/kl_div_loss_grad/l1_loss_grad_l2_loss/lp_loss/smooth_l1_loss_grad算子支持下一代实现 Co-authored-by: Huang-Peng<huangpeng98@huawei.com> # message auto-generated for no-merge-commit merge: !538 merge trans1228 into master sigmoid/silu_grad/masked_scatter/kl_div_loss_grad/l1_loss_grad_l2_loss/lp_loss/smooth_l1_loss_grad算子支持下一代实现 Created-by: Huang-Peng Commit-by: Huang-Peng Merged-by: cann-robot Description: ## 描述 sigmoid/silu_grad/masked_scatter/kl_div_loss_grad/l1_loss_grad_l2_loss/lp_loss/smooth_l1_loss_grad算子支持下一代实现 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 算子已经经过本地编译测试和二级冒烟测试 ## 文档更新 更新了算子及其文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-nn!5384 个月前
支持MaskedScatterV1 Co-authored-by: 蒋家炜<jiangjiawei10@huawei.com> # message auto-generated for no-merge-commit merge: !3578 merge MaskedScatterV1 into master 支持MaskedScatterV1 Created-by: jiangjiawei Commit-by: 蒋家炜 Merged-by: cann-robot Description: ## 描述 优化masked_scatter算子在mask与x最后一维可广播场景下的性能 ## 关联的Issue https://gitcode.com/cann/ops-nn/issues/2256 ## 测试 ![image.png](https://raw.gitcode.com/user-images/assets/7665709/fe447c02-8e57-42e2-b23d-6dcdaaf744d1/image.png 'image.png') ## 文档更新 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [x] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-nn!35781 个月前
MaskedScatter 算子增加算子原型编译配置 Co-authored-by: 陈展熹<chenzhanxi1@huawei.com> # message auto-generated for no-merge-commit merge: !4030 merge masked into master MaskedScatter 算子增加算子原型编译配置 Created-by: yourealize Commit-by: 陈展熹 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> MaskedScatter 算子增加算子原型编译配置 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> 关联Issue [#2196](https://gitcode.com/cann/ops-nn/issues/2196) ## 测试 <!--描述进行了哪些测试来验证你的改动。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-nn!40301 个月前
remove simplified_key, default value is 0 Co-authored-by: cong-jiyu<congjiyu@h-partners.com> # message auto-generated for no-merge-commit merge: !4892 merge master into master remove simplified_key, default value is 0 Created-by: cong-jiyu Commit-by: cong-jiyu Merged-by: cann-robot Description: ## 描述 当simplified_key中属性只有default=0,且ascendc_config中配置了算子,那么simplified_key.ini文件可以删除,因为默认值为0. 修改了ascendc_config.json文件,将算子host/config中配置了soc,但是未在ascendc_config.json中的算子补充上去。 ## 关联的Issue [#1985](https://gitcode.com/cann/ops-nn/issues/1985) ## 测试 编译950、910bpass ## 文档更新 更新了ascendc_config.json配置了算子的simplified_key的ini文件 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-nn!489210 天前
算子的simt的cpp风格转换为c Co-authored-by: xiaodong666<yuanxiaodong6@huawei.com> # message auto-generated for no-merge-commit merge: !4589 merge to_simt_c into master 算子的simt的cpp风格转换为c Created-by: xiaodong666 Commit-by: xiaodong666 Merged-by: cann-robot Description: ## 描述 simt-c风格转换 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> 关联Issue [#2687](https://gitcode.com/cann/ops-nn/issues/2687) ## 测试 本地修改前后md5sum一致 ## 文档更新 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-nn!458915 天前
整改st目录下的atk用例统一目录格式 Co-authored-by: yue-ma<mayue54@huawei.com> # message auto-generated for no-merge-commit merge: !4782 merge master into master 整改st目录下的atk用例统一目录格式 Created-by: yue-ma Commit-by: yue-ma Merged-by: cann-robot Description: ## 描述 整改st目录下的atk用例统一目录格式 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> https://gitcode.com/cann/ops-nn/issues/2671 ## 测试 <!--描述进行了哪些测试来验证你的改动。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述:st用例目录整改 See merge request: cann/ops-nn!478216 天前
支持MaskedScatterV1 Co-authored-by: 蒋家炜<jiangjiawei10@huawei.com> # message auto-generated for no-merge-commit merge: !3578 merge MaskedScatterV1 into master 支持MaskedScatterV1 Created-by: jiangjiawei Commit-by: 蒋家炜 Merged-by: cann-robot Description: ## 描述 优化masked_scatter算子在mask与x最后一维可广播场景下的性能 ## 关联的Issue https://gitcode.com/cann/ops-nn/issues/2256 ## 测试 ![image.png](https://raw.gitcode.com/user-images/assets/7665709/fe447c02-8e57-42e2-b23d-6dcdaaf744d1/image.png 'image.png') ## 文档更新 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [x] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-nn!35781 个月前
nn仓芯片类型补充以及资料格式修改 Co-authored-by: sunchun<sunchun4@h-partners.com> # message auto-generated for no-merge-commit merge: !3420 merge xinpian into master nn仓芯片类型补充以及资料格式修改 Created-by: sunchun Commit-by: sunchun Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> ## 测试 <!--描述进行了哪些测试来验证你的改动。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-nn!34201 个月前
README.md

MaskedScatter

产品支持情况

产品 是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品 ×
Atlas 推理系列产品 ×
Atlas 训练系列产品 ×

功能说明

根据掩码(mask)张量中元素为True的位置,复制(source)中的元素到(selfRef)对应的位置上。

函数原型

每个算子分为两段式接口,必须先调用“aclnnInplaceMaskedScatterGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnInplaceMaskedScatter”接口执行计算。

aclnnStatus aclnnInplaceMaskedScatterGetWorkspaceSize(
 aclTensor*         selfRef,
 const aclTensor*   mask,
 const aclTensor*   source,
 uint64_t*          workspaceSize,
 aclOpExecutor**    executor)
aclnnStatus aclnnInplaceMaskedScatter(
 void*          workspace,
 uint64_t       workspaceSize,
 aclOpExecutor* executor,
 aclrtStream    stream)

aclnnInplaceMaskedScatterGetWorkspaceSize

  • 参数说明

    参数名 输入/输出 描述 使用说明 数据类型 数据格式 维度(shape) 非连续Tensor
    selfRef 输入 输入Tensor。 - FLOAT、FLOAT16、DOUBLE、INT8、INT16、INT32、INT64、UINT8、BOOL、BFLOAT16 ND -
    mask 输入 输入Tensor。 shape不能大于selfRef,且需要和selfRef满足broadcast关系 BOOL、UINT8 ND - -
    source 输入 输入Tensor。 元素数量需要大于等于mask中元素为true的数量。 与selfRef相同 ND - -
    workspaceSize 输出 返回需要在Device侧申请的workspace大小。 - - - - -
    executor 输出 返回op执行器,包含了算子计算流程。 - - - - -
  • 返回值

    aclnnStatus:返回状态码,具体参见aclnn返回码

    第一段接口完成入参校验,出现以下场景时报错:

    返回值 错误码 描述
    ACLNN_ERR_PARAM_NULLPTR 161001 传入的selfRef、mask、source是空指针。
    ACLNN_ERR_PARAM_INVALID 161002 selfRef和mask的数据类型不在支持的范围之内。
    selfRef和mask的shape无法做broadcast。
    mask的shape维度大于selfRef。
    source的数据类型和selfRef的数据类型不同。

aclnnInplaceMaskedScatter

  • 参数说明

    参数名 输入/输出 描述
    workspace 输入 在Device侧申请的workspace内存地址。
    workspaceSize 输入 在Device侧申请的workspace大小,由第一段接口aclnnInplaceMaskedScatterGetWorkspaceSize获取。
    executor 输入 op执行器,包含了算子计算流程。
    stream 输入 指定执行任务的Stream。
  • 返回值

    aclnnStatus:返回状态码,具体参见aclnn返回码

约束说明

调用示例

调用方式 样例代码 说明
aclnn接口 test_aclnn_masked_scatter 通过aclnnInplaceMaskedScatter接口方式调用MaskedScatter算子。