文件最后提交记录最后更新时间
27_matmul_gelu接入msTuner[示例] Co-authored-by: init__zhb__<zhanghaobo6@huawei.com> # message auto-generated for no-merge-commit merge: !467 merge pacr/mmgelu_tuner into master 27_matmul_gelu接入msTuner[示例] Created-by: init__zhb__ Commit-by: init__zhb__ Merged-by: cann-robot Description: ## 描述 将27号样例MatmulGelu算子接入msTuner框架。 ## 关联的Issue https://gitcode.com/cann/catlass/issues/130 ## 原因 性能调优需要,外加带Epilogue的msTuner接入动作。 ## 测试 自编译、运行验证通过。 ```bash # build & compile bash scripts/build.sh --clean -DCATLASS_LIBRARY_KERNELS=27_matmul_gelu mstuner_catlass # Run test export LD_LIBRARY_PATH=$PWD/output/lib64/:$LD_LIBRARY_PATH ./output/bin/mstuner_catlass --m=512 --n=1024 --k=4096 --accu_dtype=fp32 --device=1 --output=result.csv ``` tuner结果: ```bash Top 10: case_id,task_duration(us),device_id,operation,description,m,n,k,A,B,C,element_size 1790,44.361,1,Gemm,catlass_gemm_27_matmul_gelu_fp16xRowMajor_fp16xRowMajor_fp16xRowMajor_112x256x256_112x256x32_swizzle3x0,512,1024,4096,fp16:row,fp16:row,fp32:row,4 1791,44.641,1,Gemm,catlass_gemm_27_matmul_gelu_fp16xRowMajor_fp16xRowMajor_fp16xRowMajor_112x256x256_112x256x48_swizzle3x0,512,1024,4096,fp16:row,fp16:row,fp32:row,4 1792,45.081,1,Gemm,catlass_gemm_27_matmul_gelu_fp16xRowMajor_fp16xRowMajor_fp16xRowMajor_112x256x256_112x256x64_swizzle3x0,512,1024,4096,fp16:row,fp16:row,fp32:row,4 ``` ## 文档更新 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!4672 个月前
适配CANN 9.0.0.beta2 Co-authored-by: yuantao_<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !530 merge cmake_adapt_900b2 into master 适配CANN 9.0.0.beta2 Created-by: yuantao_ Commit-by: yuantao;yuantao_ Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 1. 适配b2多出来的libunified_dlog.so 2. 适配msopgen的新实现 3. 补充新版本对应文档 4. 修正一处文档错误 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!5302 个月前
950基础功能+950_basic_matmul Co-authored-by: yjp-hw<yanjiapeng1@huawei.com> Co-authored-by: yuantao<taoyuan18@huawei.com> # message auto-generated for no-merge-commit merge: !477 merge 950 into master 950基础功能+950_basic_matmul Created-by: yjp-hw Commit-by: yuantao;yjp-hw Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue--> ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!4772 个月前