| 文件 | 最后提交记录 | 最后更新时间 |
|---|---|---|
feat(libdevice): update index_put op Co-authored-by: candyhong<1102229410@qq.com> # message auto-generated for no-merge-commit merge: !871 merge update-index-put into master feat(libdevice): update index_put op Created-by: candyhong Commit-by: candyhong Merged-by: ascend-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> index_put 接口简介: index_put 接口用于将 UB 中的 value 张量,按照 UB 中的 index 索引,沿目标张量的指定维度 dim,写入到 GM 中的 ptr 目标张量。 index_put 的接口参数最新调整如下: | 参数名 | 类型 | 是否必填 | 说明 | | ---------------- | ----------------- | ---- | ------------------------------------------- | | ptr | tl.tensor(指针类型) | 是 | 全局内存(GM)中的目标张量指针,数据将分散写入此张量中 | | index | tl.tensor | 是 | UB 中的索引,表示待分散操作的原始索引集合 | | value | tl.tensor | 是 | UB 中的值,表示待分散写入目标张量的数值集合 | | dim | int32 | 是 | 分散操作沿目标张量的维度,需满足0 ≤ dim < value.rank - 1 | | index_boundary | int64 | 是 | 索引值的上边界,用于索引边界检查,确保分散操作的索引有效性 | | end_offset | Tuple[int] | 是 | 索引张量的每个维度的结束偏移量,dype 和index.dtype 一致 | | start_offset | Tuple[int] | 是 | 索引张量的每个维度的起始偏移量,dype 和index.dtype 一致 | | dst_stride | Tuple[int] | 是 | 目标张量各维度的步长(stride),dype 和index.dtype 一致 | **约束与限制** * 维度一致性:ptr(目标张量)与 value(待写入张量)的秩(rank)必须相同。 * 数据类型限制:ptr 和 value 的数据类型仅支持 float16、bfloat16、float32 三种浮点类型。 * 索引张量约束:index 必须为整数类型张量,且index > 1D 时会在TA侧拍平为 1D,index.numel == value.shape[dim] * 维度范围约束:value 仅支持 2~5 维张量;dim 需为有效维度(满足 0 ≤ dim < rank(value)-1),确保沿合法维度进行散射。 ## checklist <!-- [x] 表示选中 --> - [x] 是否通过本地IDE对代码进行静态检查 - [x] 是否通过本地IDE对代码进行格式化处理 - [x] 是否进行空指针校验 - [x] 是否进行返回值校验 - [x] 是否正确释放new/malloc申请的内存 - [x] 是否充分考虑接口的异常场景 - [x] 是否正确记录错误日志 See merge request: Ascend/triton-ascend!871 | 6 个月前 | |
feat(triton): flipOp dim argument pass Co-authored-by: Alan Kadiev<kadiev.alan@huawei-partners.com> # message auto-generated for no-merge-commit merge: !826 merge feature-triton-flipop-dim-arg-pass into master feat(triton): flipOp dim argument pass Created-by: dainbow Commit-by: Alan Kadiev Merged-by: ascend-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## checklist <!-- [x] 表示选中 --> - [ ] 是否通过本地IDE对代码进行静态检查 - [ ] 是否通过本地IDE对代码进行格式化处理 - [ ] 是否进行空指针校验 - [ ] 是否进行返回值校验 - [ ] 是否正确释放new/malloc申请的内存 - [ ] 是否充分考虑接口的异常场景 - [ ] 是否正确记录错误日志 See merge request: Ascend/triton-ascend!826 | 6 个月前 | |
bugfix(autotuner): filter out l2 cache clear operation,modify match type column Co-authored-by: liuhuan<liuhuan261@huawei.com> # message auto-generated for no-merge-commit merge: !1008 merge autotuner_bugfix into master bugfix(autotuner): filter out l2 cache clear operation,modify match type column Created-by: LH_123L Commit-by: liuhuan Merged-by: ascend-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> filter out l2 cache clear operation,modify match type column when case name contains the keyword 'zero' , performance data is filtered. ## checklist <!-- [x] 表示选中 --> - [ ] 是否通过本地IDE对代码进行静态检查 - [ ] 是否通过本地IDE对代码进行格式化处理 - [ ] 是否进行空指针校验 - [ ] 是否进行返回值校验 - [ ] 是否正确释放new/malloc申请的内存 - [ ] 是否充分考虑接口的异常场景 - [ ] 是否正确记录错误日志 See merge request: Ascend/triton-ascend!1008 | 5 个月前 |