CATLASS API 列表

CATLASS提供分层的Gemm API接口,从低到高(Basic/Tile/Block/Kernel/Device)组装模板实现算子。开发者可以根据特定需求复用低层次组件、开发高层次组件,实现定制化算子开发。

组件分类 描述
gemm/kernel 设备侧调用的入口,对应了所有Block在NPU上执行逻辑的集合
gemm/block 是矩阵乘(Block层级)累加(MMAD)主循环的主要接口
gemm/tile 使用基础API构建Gemm涉及的NPU微内核
epilogue/block Gemm的尾处理组件,也可用于Gemm之外的其他计算
epilogue/fusion EVG 的图组织器与基础节点组件
epilogue/tile 使用基础API构建尾处理涉及的NPU微内核
conv/tile 使用基础API构建Conv涉及的NPU微内核
gemv/tile 使用基础API构建Gemv涉及的NPU微内核
TLA 抽象数据存储细节,提供通用的访问多维数组算法