文件最后提交记录最后更新时间
fix: 修改common/FIA/IFA/PFA算子下面的arch32为arch22 Co-authored-by: j60100428<jingsong5@h-partners.com> # message auto-generated for no-merge-commit merge: !4937 merge master into master fix: 修改common/FIA/IFA/PFA算子下面的arch32为arch22 Created-by: SH_jingsong Commit-by: j60100428 Merged-by: cann-robot Description: ## 描述 fix: 修改common/FIA/IFA/PFA算子下面的arch32为arch22 ## 关联的Issue https://gitcode.com/cann/ops-transformer/issues/1784 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!493722 天前
[FIA]GQA perblock 支持Tiling 512 Co-authored-by: zhaoDan0110<zhaodan107@huawei.com> # message auto-generated for no-merge-commit merge: !4566 merge master into master [FIA]GQA perblock 支持Tiling 512 Created-by: zhaoDan0110 Commit-by: zhaoDan0110 Merged-by: cann-robot Description: ## 描述 [FIA]GQA perblock 全量化支持Tiling 512切块,交付exp目录。 ## 关联的Issue 关联Issue [#2046](https://gitcode.com/cann/ops-transformer/issues/2046) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!45661 个月前
[FIA]GQA Perblock Fullquant 基线代码迁移exp目录 Co-authored-by: zhaoDan0110<zhaodan107@huawei.com> # message auto-generated for no-merge-commit merge: !4417 merge master into master [FIA]GQA Perblock Fullquant 基线代码迁移exp目录 Created-by: zhaoDan0110 Commit-by: zhaoDan0110 Merged-by: cann-robot Description: ## 描述 GQA Perblock全量化支持512切块需求在experimental目录下交付,先迁移一笔基线代码。 ## 关联的Issue 关联Issue [#1964](https://gitcode.com/cann/ops-transformer/issues/1964) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!44171 个月前
[FIA]GQA Perblock Fullquant 基线代码迁移exp目录 Co-authored-by: zhaoDan0110<zhaodan107@huawei.com> # message auto-generated for no-merge-commit merge: !4417 merge master into master [FIA]GQA Perblock Fullquant 基线代码迁移exp目录 Created-by: zhaoDan0110 Commit-by: zhaoDan0110 Merged-by: cann-robot Description: ## 描述 GQA Perblock全量化支持512切块需求在experimental目录下交付,先迁移一笔基线代码。 ## 关联的Issue 关联Issue [#1964](https://gitcode.com/cann/ops-transformer/issues/1964) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!44171 个月前
[FIA]GQA Perblock Fullquant 基线代码迁移exp目录 Co-authored-by: zhaoDan0110<zhaodan107@huawei.com> # message auto-generated for no-merge-commit merge: !4417 merge master into master [FIA]GQA Perblock Fullquant 基线代码迁移exp目录 Created-by: zhaoDan0110 Commit-by: zhaoDan0110 Merged-by: cann-robot Description: ## 描述 GQA Perblock全量化支持512切块需求在experimental目录下交付,先迁移一笔基线代码。 ## 关联的Issue 关联Issue [#1964](https://gitcode.com/cann/ops-transformer/issues/1964) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!44171 个月前
experimental目录增加A2/A3性能优化demo Co-authored-by: linengyao<linengyao@huawei.com> # message auto-generated for no-merge-commit merge: !1049 merge master into master experimental目录增加A2/A3性能优化demo Created-by: linengyao Commit-by: linengyao Merged-by: cann-robot Description: ## 描述 本demo目的是为了演示preload的开启与关闭对于算子性能的影响。以最基础的qkv作为输入(不带任何特性),使用无preload与preload2轮作为对比实验,让使用者有方向对于算子性能进行自行优化。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!10494 个月前
experimental目录增加A2/A3性能优化demo Co-authored-by: linengyao<linengyao@huawei.com> # message auto-generated for no-merge-commit merge: !1049 merge master into master experimental目录增加A2/A3性能优化demo Created-by: linengyao Commit-by: linengyao Merged-by: cann-robot Description: ## 描述 本demo目的是为了演示preload的开启与关闭对于算子性能的影响。以最基础的qkv作为输入(不带任何特性),使用无preload与preload2轮作为对比实验,让使用者有方向对于算子性能进行自行优化。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!10494 个月前
[FIA]GQA Perblock Fullquant 基线代码迁移exp目录 Co-authored-by: zhaoDan0110<zhaodan107@huawei.com> # message auto-generated for no-merge-commit merge: !4417 merge master into master [FIA]GQA Perblock Fullquant 基线代码迁移exp目录 Created-by: zhaoDan0110 Commit-by: zhaoDan0110 Merged-by: cann-robot Description: ## 描述 GQA Perblock全量化支持512切块需求在experimental目录下交付,先迁移一笔基线代码。 ## 关联的Issue 关联Issue [#1964](https://gitcode.com/cann/ops-transformer/issues/1964) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!44171 个月前
experimental目录增加A2/A3性能优化demo Co-authored-by: linengyao<linengyao@huawei.com> # message auto-generated for no-merge-commit merge: !1049 merge master into master experimental目录增加A2/A3性能优化demo Created-by: linengyao Commit-by: linengyao Merged-by: cann-robot Description: ## 描述 本demo目的是为了演示preload的开启与关闭对于算子性能的影响。以最基础的qkv作为输入(不带任何特性),使用无preload与preload2轮作为对比实验,让使用者有方向对于算子性能进行自行优化。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!10494 个月前
[FIA]GQA Perblock Fullquant 基线代码迁移exp目录 Co-authored-by: zhaoDan0110<zhaodan107@huawei.com> # message auto-generated for no-merge-commit merge: !4417 merge master into master [FIA]GQA Perblock Fullquant 基线代码迁移exp目录 Created-by: zhaoDan0110 Commit-by: zhaoDan0110 Merged-by: cann-robot Description: ## 描述 GQA Perblock全量化支持512切块需求在experimental目录下交付,先迁移一笔基线代码。 ## 关联的Issue 关联Issue [#1964](https://gitcode.com/cann/ops-transformer/issues/1964) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!44171 个月前
experimental目录增加A2/A3性能优化demo Co-authored-by: linengyao<linengyao@huawei.com> # message auto-generated for no-merge-commit merge: !1049 merge master into master experimental目录增加A2/A3性能优化demo Created-by: linengyao Commit-by: linengyao Merged-by: cann-robot Description: ## 描述 本demo目的是为了演示preload的开启与关闭对于算子性能的影响。以最基础的qkv作为输入(不带任何特性),使用无preload与preload2轮作为对比实验,让使用者有方向对于算子性能进行自行优化。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!10494 个月前
[FIA]GQA perblock 支持Tiling 512 Co-authored-by: zhaoDan0110<zhaodan107@huawei.com> # message auto-generated for no-merge-commit merge: !4566 merge master into master [FIA]GQA perblock 支持Tiling 512 Created-by: zhaoDan0110 Commit-by: zhaoDan0110 Merged-by: cann-robot Description: ## 描述 [FIA]GQA perblock 全量化支持Tiling 512切块,交付exp目录。 ## 关联的Issue 关联Issue [#2046](https://gitcode.com/cann/ops-transformer/issues/2046) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!45661 个月前
experimental目录增加A2/A3性能优化demo Co-authored-by: linengyao<linengyao@huawei.com> # message auto-generated for no-merge-commit merge: !1049 merge master into master experimental目录增加A2/A3性能优化demo Created-by: linengyao Commit-by: linengyao Merged-by: cann-robot Description: ## 描述 本demo目的是为了演示preload的开启与关闭对于算子性能的影响。以最基础的qkv作为输入(不带任何特性),使用无preload与preload2轮作为对比实验,让使用者有方向对于算子性能进行自行优化。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!10494 个月前
[FIA]GQA Perblock Fullquant 基线代码迁移exp目录 Co-authored-by: zhaoDan0110<zhaodan107@huawei.com> # message auto-generated for no-merge-commit merge: !4417 merge master into master [FIA]GQA Perblock Fullquant 基线代码迁移exp目录 Created-by: zhaoDan0110 Commit-by: zhaoDan0110 Merged-by: cann-robot Description: ## 描述 GQA Perblock全量化支持512切块需求在experimental目录下交付,先迁移一笔基线代码。 ## 关联的Issue 关联Issue [#1964](https://gitcode.com/cann/ops-transformer/issues/1964) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!44171 个月前
experimental目录增加A2/A3性能优化demo Co-authored-by: linengyao<linengyao@huawei.com> # message auto-generated for no-merge-commit merge: !1049 merge master into master experimental目录增加A2/A3性能优化demo Created-by: linengyao Commit-by: linengyao Merged-by: cann-robot Description: ## 描述 本demo目的是为了演示preload的开启与关闭对于算子性能的影响。以最基础的qkv作为输入(不带任何特性),使用无preload与preload2轮作为对比实验,让使用者有方向对于算子性能进行自行优化。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!10494 个月前