MindStudio Ops Profiler 版本说明
版本配套说明
产品版本信息
| 产品名称 | 产品版本 | 版本类型 |
|---|---|---|
| msOpProf | 26.0.0 | 内测版本 |
| msOpProf | 8.3.0 | 正式版本 |
相关产品版本配套说明
| msOpProf版本 | CANN版本 | Python版本 | json版本 | securec版本 | makeself版本 | llvm-project版本 |
|---|---|---|---|---|---|---|
| 26.0.0 | 推荐9.0.0及以上 | 推荐3.11及以上 | v3.12.0及以上 | v1.1.16及以上 | release-2.5.0及以上 | 22.1.2及以上 |
| 8.3.0 | 8.2.RC1及以上版本 | 推荐3.11及以上 | v3.12.0及以上 | v1.1.16及以上 | release-2.5.0及以上 | 22.1.2及以上 |
版本兼容性说明
26.0.0
- 适配毕昇编译器编译选项变更。
- 适配多种新增芯片规格型号,并兼容CANN芯片标识变更。
特性变更说明
26.0.0
一、新增说明
功能类变更:
- 功能新增:
- 支持shmem算子库、asc算子库的性能调优。
- 支持自定义通算融合框架的性能分析能力,可通过AscendC API打点生成通算流水图。
- 支持Scalar性能数据精细化分析,可指导判断Scalar单元具体耗时阻塞位置,性能数据文件及计算内存热力图-内存负载分析中拓展相关性能指标。
- 支持SIMT VF指令Stall分析与寄存器利用率展示,上板代码热点图中拓展相关性能指标。
- 支持SIMT VF指令发射效率指标统计及负载均衡分析,计算内存热力图-核间负载分析中拓展相关性能指标。
- 优化变更:
- 根据不同芯片支持功能,优化help信息展示。
- 优化部分芯片型号的理论带宽数值、性能指标公式。
- 优化仿真流水图的泳道排序及指令颜色划分。
- 优化代码热点图的指令信息排序。
- 提升软件安全,变更构建产物、落盘文件权限及属组。
构建发布类:
- 优化依赖仓下载功能,10倍提升下载速度。
- 增加debug编译选项,支持编译产物的断点调试。
- 修改安装包名称为mindstudio-opprof_linux.run。
文档说明类:
- 刷新README链接,在docs仓新增用户指南等其余文档和图片。
- 重命名安装指南,改为msopprof_install_guide.md。
- 安装指南和快速入门内容修改优化。安装文档增加pigz依赖提示。
- 补充快速入门文档。
二、删除说明
无相关删除变更。
三、Bugfix
无相关Bugfix变更。
8.3.0
一、新增说明
首次发布,新增功能点如下:
msOpProf模式:
- 计算内存热力图:以资源维度展示算子基础信息、计算负载分析和内存负载分析的数据,协助开发者以全局视角识别资源瓶颈。
- Roofline瓶颈分析图:构建出处理器的性能模型,然后利用该性能模型快速评估出算子的理论性能极限,协助开发者快速识别瓶颈类型。
- 通算流水图(通算融合算子):直观看到通算运行情况、指令耗时等信息,协助开发者识别通算瓶颈。支持通过AscendC API进行性能打点,采集代码在算子block上的实际耗时情况,用于通算算子性能的分析和优化。
- Pipe流水图:直观观察算子各个Pipe的运行情况。
- 算子代码热点图:支持查看算子源码与指令集的映射关系、耗时情况等功能,可协助开发者识别热点代码分布,并分析热点函数优化的可行性。
- Cache 热力图:可视化呈现Cache热力图,可显示对应指令信息,以优化L2Cache命中率。
- 性能数据文件:从多个性能指标维度展示算子详细性能数据。
msOpProf simulator模式:
- 指令流水图:以指令维度展示时序关系,并关联调用栈快速定位瓶颈位置。
- 算子代码热点图:支持查看算子源码与指令集的映射关系、耗时情况等功能,可协助开发者识别热点代码分布,并分析热点函数优化的可行性。
- 内存通路吞吐率波形图:支持查看算子MTE日志通路的内存带宽在时序上的统计分析能力,可协助开发者识别算子各阶段的带宽使用状况,并分析带宽优化的可行性。
二、删除说明
无相关删除变更。
三、Bugfix
无相关Bugfix变更。