文件最后提交记录最后更新时间
add full dequant test Co-authored-by: changjuye<changjuye1@h-partners.com> # message auto-generated for no-merge-commit merge: !560 merge br_full_dequant into master add full dequant test Created-by: changjuye Commit-by: changjuye Merged-by: cann-robot Description: ## 描述 添加全量化算子模板 ## 关联的Issue ## 原因 ## 测试 ## 文档更新 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!5601 个月前
add full dequant test Co-authored-by: changjuye<changjuye1@h-partners.com> # message auto-generated for no-merge-commit merge: !560 merge br_full_dequant into master add full dequant test Created-by: changjuye Commit-by: changjuye Merged-by: cann-robot Description: ## 描述 添加全量化算子模板 ## 关联的Issue ## 原因 ## 测试 ## 文档更新 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!5601 个月前
文档补充evaluation类和部分基础知识 Co-authored-by: sunhao_hw<sunhao203@huawei.com> # message auto-generated for no-merge-commit merge: !602 merge docs into master 文档补充evaluation类和部分基础知识 Created-by: sunhao_hw Commit-by: sunhao_hw Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> - 调整原先的docs/zh/1_Practice/evaluation_tools目录为evaluation目录,存放调测相关文档 - 新增evaluation相关精度定位思路文档 - 新增创新样例开发流程指南 - 新增CATLASS需要的AtlasA2硬件基础知识 - 完善LayoutTag说明文档,即旧版layout结构 - 修复部分文档低错问题 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> https://gitcode.com/cann/catlass/issues/185 ## 原因 <!--说明此次改动的目的、解决的问题等,应与类型标签匹配 --> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 已批量扫描文档跳转链接 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!60220 天前
add full dequant test Co-authored-by: changjuye<changjuye1@h-partners.com> # message auto-generated for no-merge-commit merge: !560 merge br_full_dequant into master add full dequant test Created-by: changjuye Commit-by: changjuye Merged-by: cann-robot Description: ## 描述 添加全量化算子模板 ## 关联的Issue ## 原因 ## 测试 ## 文档更新 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/catlass!5601 个月前
README.md

57_ascend950_matmul_full_dequant Example Readme

代码组织

├── 57_ascend950_matmul_full_dequant
│   ├── CMakeLists.txt  # CMake编译文件
│   ├── README.md
│   └── matmul_full_dequant.cpp # 主文件
  • 支持的量化模式
X1的量化模式 X2的量化模式 带有Bias
per_token per_tensor False
per_token per_channel False
per_tensor per_channel False
default per_channel False
per_token per_tensor True
per_token per_channel True
default per_tensor True
default per_channel True

default模式:不采用任何量化模式

使用示例

  • 获取代码之后编译相应的算子可执行文件,可参考quickstart,本用例为Ascend 950算子,编译时需加-DCATLASS_ARCH=3510
  • 执行算子
# 编译指定用例
bash scripts/build.sh 57_ascend950_matmul_full_dequant -DCATLASS_ARCH=3510
# 生成测试样例
cd examples/57_ascend950_matmul_full_dequant
python3 scripts/gen_data.py --shape "64 64 64" --x1_quant_mode per_token --x2_quant_mode per_channel
# 带有bias使用下面的命令
# python3 scripts/gen_data.py --shape "64 64 64" --x1_quant_mode per_token --x2_quant_mode per_channel --has_bias
cd ../../output/bin
cp -r ../../examples/57_ascend950_matmul_full_dequant/input/ .
cp -r ../../examples/57_ascend950_matmul_full_dequant/output/ .
# 可执行文件名 |矩阵m轴|n轴|k轴|x1QuantMode|x2QuantMode|has_bias
# has_bias可选,默认不带有bias
./57_ascend950_matmul_full_dequant 64 64 64 per_token per_channel
# 带有bias使用下面命令执行,需要配合gen_data.py生成bias
# ./57_ascend950_matmul_full_dequant 64 64 64 per_token per_channel has_bias

执行结果如下,说明精度比对成功。

Compare success.