| TLA增加origin_shape,新增LocalTile、MakeTensorLike、Tensor的operator()和增加batched_matmul_tla样例
Co-authored-by: sinceseto<wangyuanfei6@huawei.com>
# message auto-generated for no-merge-commit merge:
!469 merge tla_modify_pr into master
TLA增加originShape,新增TileView、MakeTensorLike、Tensor的operator()和增加strided_batched_matmul_tla样例
Created-by: sinceseto
Commit-by: sinceseto
Merged-by: cann-robot
Description: ## 描述
<!--在这里详细描述你的改动,包括改动的原因和所采取的方法。-->
为了基于TLA提供kernel和block层不感知尾块逻辑,tile层感知origin_shape的新流程。
为tla::layout增加originShape,为了不影响当前其它算子原来流程,支持写layout类型中originShape类型自动推导,makeLayout自动推导originShape。
MakeLayoutTile更名GetTileLayout,增加coord参数,根据coord和origin_shape自动裁剪
更新GetTile(如果原来流程不规范写法涉及到coord>shape的GetTile操作会导致origin_shape被裁剪到0,导致tile层不工作,精度错误)
新增TileView(tile粒度的GetTIle)、MakeTensorLike(跨内存域自动origin_shape继承的新建Tensor)、Tensor的operator()接口(slice语义)
以一个strided_batched_matmul_tla样例承载新的TLA特性与流程。
## 原因
<!--说明此次改动的目的、解决的问题等,应与类型标签匹配 -->
## 测试
<!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。-->
## 文档更新
<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->
## 类型标签
<!-- [x] 表示选中 -->
- [ ] Bug修复
- [x] 新特性
- [ ] 性能优化
- [x] 文档更新
- [ ] 其他,请描述:
See merge request: cann/catlass!469 | 2 个月前 |