MindStudio Ops Profiler 版本说明

版本配套说明

产品版本信息

产品名称 产品版本 版本类型
msOpProf 26.0.0 内测版本
msOpProf 8.3.0 正式版本

相关产品版本配套说明

msOpProf版本 CANN版本 Python版本 json版本 securec版本 makeself版本 llvm-project版本
26.0.0 推荐9.0.0及以上 推荐3.11及以上 v3.12.0及以上 v1.1.16及以上 release-2.5.0及以上 22.1.2及以上
8.3.0 8.2.RC1及以上版本 推荐3.11及以上 v3.12.0及以上 v1.1.16及以上 release-2.5.0及以上 22.1.2及以上

版本兼容性说明

26.0.0

  1. 适配毕昇编译器编译选项变更。
  2. 适配多种新增芯片规格型号,并兼容CANN芯片标识变更。

特性变更说明

26.0.0

一、新增说明

功能类变更:

  • 功能新增:
  1. 支持shmem算子库、asc算子库的性能调优。
  2. 支持自定义通算融合框架的性能分析能力,可通过AscendC API打点生成通算流水图。
  3. 支持Scalar性能数据精细化分析,可指导判断Scalar单元具体耗时阻塞位置,性能数据文件及计算内存热力图-内存负载分析中拓展相关性能指标。
  4. 支持SIMT VF指令Stall分析与寄存器利用率展示,上板代码热点图中拓展相关性能指标。
  5. 支持SIMT VF指令发射效率指标统计及负载均衡分析,计算内存热力图-核间负载分析中拓展相关性能指标。
  • 优化变更:
  1. 根据不同芯片支持功能,优化help信息展示。
  2. 优化部分芯片型号的理论带宽数值、性能指标公式。
  3. 优化仿真流水图的泳道排序及指令颜色划分。
  4. 优化代码热点图的指令信息排序。
  5. 提升软件安全,变更构建产物、落盘文件权限及属组。

构建发布类:

  1. 优化依赖仓下载功能,10倍提升下载速度。
  2. 增加debug编译选项,支持编译产物的断点调试。
  3. 修改安装包名称为mindstudio-opprof_linux.run。

文档说明类:

  1. 刷新README链接,在docs仓新增用户指南等其余文档和图片。
  2. 重命名安装指南,改为msopprof_install_guide.md。
  3. 安装指南和快速入门内容修改优化。安装文档增加pigz依赖提示。
  4. 补充快速入门文档。

二、删除说明

无相关删除变更。

三、Bugfix

无相关Bugfix变更。

8.3.0

一、新增说明

首次发布,新增功能点如下:

msOpProf模式:

  1. 计算内存热力图:以资源维度展示算子基础信息、计算负载分析和内存负载分析的数据,协助开发者以全局视角识别资源瓶颈。
  2. Roofline瓶颈分析图:构建出处理器的性能模型,然后利用该性能模型快速评估出算子的理论性能极限,协助开发者快速识别瓶颈类型。
  3. 通算流水图(通算融合算子):直观看到通算运行情况、指令耗时等信息,协助开发者识别通算瓶颈。支持通过AscendC API进行性能打点,采集代码在算子block上的实际耗时情况,用于通算算子性能的分析和优化。
  4. Pipe流水图:直观观察算子各个Pipe的运行情况。
  5. 算子代码热点图:支持查看算子源码与指令集的映射关系、耗时情况等功能,可协助开发者识别热点代码分布,并分析热点函数优化的可行性。
  6. Cache 热力图:可视化呈现Cache热力图,可显示对应指令信息,以优化L2Cache命中率。
  7. 性能数据文件:从多个性能指标维度展示算子详细性能数据。

msOpProf simulator模式:

  1. 指令流水图:以指令维度展示时序关系,并关联调用栈快速定位瓶颈位置。
  2. 算子代码热点图:支持查看算子源码与指令集的映射关系、耗时情况等功能,可协助开发者识别热点代码分布,并分析热点函数优化的可行性。
  3. 内存通路吞吐率波形图:支持查看算子MTE日志通路的内存带宽在时序上的统计分析能力,可协助开发者识别算子各阶段的带宽使用状况,并分析带宽优化的可行性。

二、删除说明

无相关删除变更。

三、Bugfix

无相关Bugfix变更。