README.md

Instruction Optimization

指令优化方法相关样例。

n_buffer

演示如何使用 nBuffer(多区块缓存)编程模型在 NPU 上实现搬运计算流水并行。

unit_flag

演示使用 unit_flag 来开启计算(MMAD)与搬出(Fixpipe)流水并行,进一步提升流水并行度。

mte2_preload

演示指令数量超出队列深度时,通过矩阵预加载到L1缓存,利用Ping-Pong指令强制同步,优化搬运效率。

weightnz

演示带宽瓶颈时,将权重矩阵预转为 FRACTAL_NZ 格式,减少带宽损耗,提升搬运效率。