7b22dc80创建于 3月23日历史提交

文件	最后提交记录	最后更新时间
figures	Function Monitor Develop Co-authored-by: eejiechu<wjchuee@foxmail.com> # message auto-generated for no-merge-commit merge: !99 merge function_monitor_dev into master Function Monitor Develop Created-by: eejiechu Commit-by: eejiechu Merged-by: ascend-robot Description: # PR 合入模板注：经过自检不涉及的可标注“不涉及”或直接打勾，特殊情况请文字备注。不符合规范的 PR 不允许合入，请（后备）commit 注意。 ---- ## 1. 修改描述 - 修改原因： msprof 支持轻量化函数级 CPU PMU 采集能力 - 修改内容： 1. 引入 openeuler libkperf 组件，新增 Function Monitor 采集和转换脚本 2. 添加 Function Monitor 使用文档 ---- ## 2. 功能验证 - [x] 功能自验 ![image.png](https://raw.gitcode.com/user-images/assets/8551954/0d991a54-8f68-4910-9e4c-aa120217d1e9/image.png 'image.png') - [ ] 本地自验用例截图 - [ ] 冒烟是否通过（填入群链接的自验证报告中，如未通过，请说明原因：____________________ ，功能代码请主动申报添加冒烟） ---- ## 3. 分支合并要求 - [ ] 代码合并（请确保将 master 分支的最新代码同步合并至 poc 分支及 pre-research 分支，同时保证 poc 分支的代码也已正确合并到 pre-research 分支。） ---- ## 3. 代码检视 - 要求： - 合入代码超过 200 行，需三人以上会议检视。 - 检视密度≥1个/100行。 - 检视缺陷密度未达要求需提供说明。 - 大于 1000 行代码原则上不允许合入，需进行备案。 - [ ] 是否经过代码检视 - [ ] 是否具备 UT 测试用例看护（如不符合，请说明原因：____________________） - 检视意见数：____ 条（请填写本次检视的意见总数，用于commit合入前审视） ---- ## 4. 安全自检 ### Python、C++： - [ ] 对外接口新增/删除/变更后，资料要同步新增/删除/变更，新增接口入参校验参考外部输入表格 - [ ] 不允许私有的文件操作，需要使用公共模块的安全函数 - [ ] 任务结束后需要删除临时文件，同时需要考虑任务失败后，临时文件没有残留 - [ ] 数组访问需要校验越界场景，对除法需要做除零校验 - [ ] 需要对递归方法做递归深度校验，正则表达式必须做 ReDoS 校验 - [ ] 需要充分进行接口输入和返回值异常情况的校验 - [ ] 日志打印不要出现拼写或语法错误，不要暴露代码细节和敏感信息 ### C++： - [ ] 指针使用前需要判空 - [ ] 数值计算校验溢出和反转 - [ ] 不可存在内存泄漏（异常场景需要释放内存） - [ ] 类型转换不能出现数据截断 - [ ] 拷贝字符串时，目的缓冲区至少比源缓冲区大 1 - [ ] 拷贝内存时，目的缓冲区不小于源缓冲区 - [ ] 内存释放后指针赋值为 nullptr ---- ## 5. 变更知会 - [x] 资料修改 - [ ] 变更通知（消息知会 + 邮件知会） ---- See merge request: Ascend/msprof!99	2 个月前
README.md	docs: msprof资料合入950产品 Co-authored-by: cai-weiwei1989<734267852@qq.com> # message auto-generated for no-merge-commit merge: !107 merge master into master docs: msprof资料合入950产品 Created-by: cai-weiwei1989 Commit-by: cai-weiwei1989 Merged-by: ascend-robot Description: # PR 合入模板注：经过自检不涉及的可标注“不涉及”或直接打勾，特殊情况请文字备注。不符合规范的 PR 不允许合入，请（后备）commit 注意。 ---- ## 1. 修改描述 - 修改原因：新增950系列产品 - 修改内容： 1、docs/zh/msprof_parsing_instruct.md、misc/function_monitor/README.md中所有特性补充支持950PR/Ascend 950DT产品 2、docs/zh/profile_data_file_references.md新增950PR/Ascend 950DT产品特有数据soc_pmu（TLB命中率）、ccu_mission（集合通信指令信息）、ccu_channel（集合通信硬件加速单元带宽信息）、ub（UB带宽数据）、ub（UB带宽数据）以及全文数据补充支持950PR/Ascend 950DT产品 ## 2. 功能验证 - [ ] 功能自验 - [ ] 本地自验用例截图 - [ ] 冒烟是否通过（填入群链接的自验证报告中，如未通过，请说明原因：____________________ ，功能代码请主动申报添加冒烟） ---- ## 3. 分支合并要求 - [ ] 代码合并（请确保将 master 分支的最新代码同步合并至 poc 分支及 pre-research 分支，同时保证 poc 分支的代码也已正确合并到 pre-research 分支。） ---- ## 3. 代码检视 - 要求： - 合入代码超过 200 行，需三人以上会议检视。 - 检视密度≥1个/100行。 - 检视缺陷密度未达要求需提供说明。 - 大于 1000 行代码原则上不允许合入，需进行备案。 - [ ] 是否经过代码检视 - [ ] 是否具备 UT 测试用例看护（如不符合，请说明原因：____________________） - 检视意见数：____ 条（请填写本次检视的意见总数，用于commit合入前审视） ---- ## 4. 安全自检 ### Python、C++： - [ ] 对外接口新增/删除/变更后，资料要同步新增/删除/变更，新增接口入参校验参考外部输入表格 - [ ] 不允许私有的文件操作，需要使用公共模块的安全函数 - [ ] 任务结束后需要删除临时文件，同时需要考虑任务失败后，临时文件没有残留 - [ ] 数组访问需要校验越界场景，对除法需要做除零校验 - [ ] 需要对递归方法做递归深度校验，正则表达式必须做 ReDoS 校验 - [ ] 需要充分进行接口输入和返回值异常情况的校验 - [ ] 日志打印不要出现拼写或语法错误，不要暴露代码细节和敏感信息 ### C++： - [ ] 指针使用前需要判空 - [ ] 数值计算校验溢出和反转 - [ ] 不可存在内存泄漏（异常场景需要释放内存） - [ ] 类型转换不能出现数据截断 - [ ] 拷贝字符串时，目的缓冲区至少比源缓冲区大 1 - [ ] 拷贝内存时，目的缓冲区不小于源缓冲区 - [ ] 内存释放后指针赋值为 nullptr ---- ## 5. 变更知会 - [ ] 资料修改 - [ ] 变更通知（消息知会 + 邮件知会） ---- See merge request: Ascend/msprof!107	2 个月前
file_manager.py	Function Monitor Develop Co-authored-by: eejiechu<wjchuee@foxmail.com> # message auto-generated for no-merge-commit merge: !99 merge function_monitor_dev into master Function Monitor Develop Created-by: eejiechu Commit-by: eejiechu Merged-by: ascend-robot Description: # PR 合入模板注：经过自检不涉及的可标注“不涉及”或直接打勾，特殊情况请文字备注。不符合规范的 PR 不允许合入，请（后备）commit 注意。 ---- ## 1. 修改描述 - 修改原因： msprof 支持轻量化函数级 CPU PMU 采集能力 - 修改内容： 1. 引入 openeuler libkperf 组件，新增 Function Monitor 采集和转换脚本 2. 添加 Function Monitor 使用文档 ---- ## 2. 功能验证 - [x] 功能自验 ![image.png](https://raw.gitcode.com/user-images/assets/8551954/0d991a54-8f68-4910-9e4c-aa120217d1e9/image.png 'image.png') - [ ] 本地自验用例截图 - [ ] 冒烟是否通过（填入群链接的自验证报告中，如未通过，请说明原因：____________________ ，功能代码请主动申报添加冒烟） ---- ## 3. 分支合并要求 - [ ] 代码合并（请确保将 master 分支的最新代码同步合并至 poc 分支及 pre-research 分支，同时保证 poc 分支的代码也已正确合并到 pre-research 分支。） ---- ## 3. 代码检视 - 要求： - 合入代码超过 200 行，需三人以上会议检视。 - 检视密度≥1个/100行。 - 检视缺陷密度未达要求需提供说明。 - 大于 1000 行代码原则上不允许合入，需进行备案。 - [ ] 是否经过代码检视 - [ ] 是否具备 UT 测试用例看护（如不符合，请说明原因：____________________） - 检视意见数：____ 条（请填写本次检视的意见总数，用于commit合入前审视） ---- ## 4. 安全自检 ### Python、C++： - [ ] 对外接口新增/删除/变更后，资料要同步新增/删除/变更，新增接口入参校验参考外部输入表格 - [ ] 不允许私有的文件操作，需要使用公共模块的安全函数 - [ ] 任务结束后需要删除临时文件，同时需要考虑任务失败后，临时文件没有残留 - [ ] 数组访问需要校验越界场景，对除法需要做除零校验 - [ ] 需要对递归方法做递归深度校验，正则表达式必须做 ReDoS 校验 - [ ] 需要充分进行接口输入和返回值异常情况的校验 - [ ] 日志打印不要出现拼写或语法错误，不要暴露代码细节和敏感信息 ### C++： - [ ] 指针使用前需要判空 - [ ] 数值计算校验溢出和反转 - [ ] 不可存在内存泄漏（异常场景需要释放内存） - [ ] 类型转换不能出现数据截断 - [ ] 拷贝字符串时，目的缓冲区至少比源缓冲区大 1 - [ ] 拷贝内存时，目的缓冲区不小于源缓冲区 - [ ] 内存释放后指针赋值为 nullptr ---- ## 5. 变更知会 - [x] 资料修改 - [ ] 变更通知（消息知会 + 邮件知会） ---- See merge request: Ascend/msprof!99	2 个月前
function_monitor.py	function monitor log path fix Co-authored-by: eejiechu<wjchuee@foxmail.com> # message auto-generated for no-merge-commit merge: !108 merge function_monitor_fix into master function monitor log path fix Created-by: eejiechu Commit-by: eejiechu Merged-by: ascend-robot Description: # PR 合入模板注：经过自检不涉及的可标注“不涉及”或直接打勾，特殊情况请文字备注。不符合规范的 PR 不允许合入，请（后备）commit 注意。 ---- ## 1. 修改描述 - 修改原因：当function monitor指定的落盘路径不存在时，会错误的报一条error日志 - 修改内容：当function monitor指定的落盘路径不存在时，自动创建目录，并进行权限校验 ---- ## 2. 功能验证 - [x] 功能自验指定的落盘路径不存在时，会自动创建 ![image.png](https://raw.gitcode.com/user-images/assets/8551954/fa4a585d-7693-4d9e-bbc2-eda7626a59ad/image.png 'image.png') ![image.png](https://raw.gitcode.com/user-images/assets/8551954/28b065df-3c68-4cfc-9b34-612d1fc2510d/image.png 'image.png') - [ ] 本地自验用例截图 - [ ] 冒烟是否通过（填入群链接的自验证报告中，如未通过，请说明原因：____________________ ，功能代码请主动申报添加冒烟） ---- ## 3. 分支合并要求 - [ ] 代码合并（请确保将 master 分支的最新代码同步合并至 poc 分支及 pre-research 分支，同时保证 poc 分支的代码也已正确合并到 pre-research 分支。） ---- ## 3. 代码检视 - 要求： - 合入代码超过 200 行，需三人以上会议检视。 - 检视密度≥1个/100行。 - 检视缺陷密度未达要求需提供说明。 - 大于 1000 行代码原则上不允许合入，需进行备案。 - [ ] 是否经过代码检视 - [ ] 是否具备 UT 测试用例看护（如不符合，请说明原因：____________________） - 检视意见数：____ 条（请填写本次检视的意见总数，用于commit合入前审视） ---- ## 4. 安全自检 ### Python、C++： - [ ] 对外接口新增/删除/变更后，资料要同步新增/删除/变更，新增接口入参校验参考外部输入表格 - [ ] 不允许私有的文件操作，需要使用公共模块的安全函数 - [ ] 任务结束后需要删除临时文件，同时需要考虑任务失败后，临时文件没有残留 - [ ] 数组访问需要校验越界场景，对除法需要做除零校验 - [ ] 需要对递归方法做递归深度校验，正则表达式必须做 ReDoS 校验 - [ ] 需要充分进行接口输入和返回值异常情况的校验 - [ ] 日志打印不要出现拼写或语法错误，不要暴露代码细节和敏感信息 ### C++： - [ ] 指针使用前需要判空 - [ ] 数值计算校验溢出和反转 - [ ] 不可存在内存泄漏（异常场景需要释放内存） - [ ] 类型转换不能出现数据截断 - [ ] 拷贝字符串时，目的缓冲区至少比源缓冲区大 1 - [ ] 拷贝内存时，目的缓冲区不小于源缓冲区 - [ ] 内存释放后指针赋值为 nullptr ---- ## 5. 变更知会 - [ ] 资料修改 - [ ] 变更通知（消息知会 + 邮件知会） ---- See merge request: Ascend/msprof!108	2 个月前
log2trace.py	Function Monitor Develop Co-authored-by: eejiechu<wjchuee@foxmail.com> # message auto-generated for no-merge-commit merge: !99 merge function_monitor_dev into master Function Monitor Develop Created-by: eejiechu Commit-by: eejiechu Merged-by: ascend-robot Description: # PR 合入模板注：经过自检不涉及的可标注“不涉及”或直接打勾，特殊情况请文字备注。不符合规范的 PR 不允许合入，请（后备）commit 注意。 ---- ## 1. 修改描述 - 修改原因： msprof 支持轻量化函数级 CPU PMU 采集能力 - 修改内容： 1. 引入 openeuler libkperf 组件，新增 Function Monitor 采集和转换脚本 2. 添加 Function Monitor 使用文档 ---- ## 2. 功能验证 - [x] 功能自验 ![image.png](https://raw.gitcode.com/user-images/assets/8551954/0d991a54-8f68-4910-9e4c-aa120217d1e9/image.png 'image.png') - [ ] 本地自验用例截图 - [ ] 冒烟是否通过（填入群链接的自验证报告中，如未通过，请说明原因：____________________ ，功能代码请主动申报添加冒烟） ---- ## 3. 分支合并要求 - [ ] 代码合并（请确保将 master 分支的最新代码同步合并至 poc 分支及 pre-research 分支，同时保证 poc 分支的代码也已正确合并到 pre-research 分支。） ---- ## 3. 代码检视 - 要求： - 合入代码超过 200 行，需三人以上会议检视。 - 检视密度≥1个/100行。 - 检视缺陷密度未达要求需提供说明。 - 大于 1000 行代码原则上不允许合入，需进行备案。 - [ ] 是否经过代码检视 - [ ] 是否具备 UT 测试用例看护（如不符合，请说明原因：____________________） - 检视意见数：____ 条（请填写本次检视的意见总数，用于commit合入前审视） ---- ## 4. 安全自检 ### Python、C++： - [ ] 对外接口新增/删除/变更后，资料要同步新增/删除/变更，新增接口入参校验参考外部输入表格 - [ ] 不允许私有的文件操作，需要使用公共模块的安全函数 - [ ] 任务结束后需要删除临时文件，同时需要考虑任务失败后，临时文件没有残留 - [ ] 数组访问需要校验越界场景，对除法需要做除零校验 - [ ] 需要对递归方法做递归深度校验，正则表达式必须做 ReDoS 校验 - [ ] 需要充分进行接口输入和返回值异常情况的校验 - [ ] 日志打印不要出现拼写或语法错误，不要暴露代码细节和敏感信息 ### C++： - [ ] 指针使用前需要判空 - [ ] 数值计算校验溢出和反转 - [ ] 不可存在内存泄漏（异常场景需要释放内存） - [ ] 类型转换不能出现数据截断 - [ ] 拷贝字符串时，目的缓冲区至少比源缓冲区大 1 - [ ] 拷贝内存时，目的缓冲区不小于源缓冲区 - [ ] 内存释放后指针赋值为 nullptr ---- ## 5. 变更知会 - [x] 资料修改 - [ ] 变更通知（消息知会 + 邮件知会） ---- See merge request: Ascend/msprof!99	2 个月前

Function Monitor

简介

在大模型训练或推理场景中，Host 侧性能抖动是影响模型运行效率的典型问题之一，可能造成 PyTorch 等 AI 框架的算子下发延迟，进而拖慢模型运行速度。这类问题根源在于 Host 侧复杂的软件栈交互（如 Python解释器、AI 框架、CANN 软件栈），难以精确定位。

为了解决这一问题，通过集成 openEuler libkperf 轻量级 Linux 性能采集能力，我们开发了 Function Monitor 工具，用于监控 Host 侧函数的执行时间，低开销地采集指定函数执行过程中的 CPU PMU 指标（如 Cache Miss、Page Faults），并可与 Ftrace、MindStudio Profiler 数据联合分析，帮助用户更高效地识别 Host 性能问题并进行优化。

使用流程

通过 Python 装饰器或 with 语句实现对指定函数的执行时间及 CPU PMU 指标采集，支持基于耗时阈值进行数据过滤，并将采集结果持久化写入日志文件。
将采集的日志文件后处理，转换为 Chrome Trace Json 格式。
导入MindStudio Insight，进行可视化展示，分析函数执行耗时与 CPU PMU 指标之间的关系。

注意事项

仅支持在 PyTorch 框架下使用，其他 AI 框架暂不支持。
当设置 ENABLE_LIBKPERF 环境变量为 True，采集 CPU PMU 指标时，需要确保当前用户为 root 或具有 root 权限。
function_monitor.py 中提供的 @function_monitor 装饰器与 FunctionMonitorContext 上下文管理器可同时使用，分别在不同函数或代码块中采集数据，但不可在同一函数或代码块内叠加使用，若某函数已被 @function_monitor 装饰，再在该函数内部使用 FunctionMonitorContext 上下文管理器，可能导致数据采集异常。

使用前准备

编译安装 libkperf python whl 包，参考《libkperf 编译指南》。
获取仓库中提供的采集、转换脚本 function_monitor.py，log2trace.py，以及文件操作相关脚本（file_manager.py）。

数据采集

支持通过 Python 函数装饰器和 with 语句两种方式进行数据采集，以下为两种方式均适配的环境变量配置说明：

环境变量	可选/必选	说明
ENABLE_FUNCTION_MONITOR	可选	指定是否开启 Function Monitor 函数监控采集，支持设置为 True 或 False，若需要开启函数监控采集，必须设置为 True，默认值为 False，表示不开启
ENABLE_LIBKPERF	可选	指定是否使用 libkperf 采集 CPU PMU 指标，支持设置为 True 或 False，默认值为 False，表示不开启
FUNCTION_MONITOR_LOG_PATH	可选	指定函数监控采集日志文件的存储路径，若未指定，则默认存储在当前用户主目录下的 function_monitor_log 目录（如 /home/user/function_monitor_log）

当设置 ENABLE_LIBKPERF 环境变量为 True 时，采集 CPU PMU 指标时，用户可在 function_monitor.py 中 PerformanceMonitor 类的 evt_list 参数中指定要采集的 perf event 列表，默认值为 ['cycles', 'instructions', 'LLC-load-misses', 'LLC-loads', 'page-faults']。

当前系统支持的 perf event 列表可通过 perf list 命令查看，详细说明可参考 perf event 官方文档，用户可根据实际需求选择要采集的 perf event。

Perf Event

方式一：通过函数装饰器进行采集

function_monitor.py 中提供函数装饰器 @function_monitor，用户可以将数据采集逻辑精细地嵌入到应用程序的指定函数中，实现对该函数执行时间及 CPU PMU 指标的采集。

参数说明

参数	可选/必选	说明
func_name	可选	设置要采集数据的函数名称，若未指定，则默认为当前被装饰的函数名称
process_name	可选	设置采集数据的进程名称，若未指定，则默认为当前进程名称
threshold_ms	可选	设置采集数据的耗时阈值，只有函数执行耗时大于该阈值，才会记录到日志文件中，单位为 ms，若未指定，则默认为 1

使用示例

设置环境变量

export ENABLE_FUNCTION_MONITOR=True
export ENABLE_LIBKPERF=True
export FUNCTION_MONITOR_LOG_PATH=${HOME}/function_monitor_log

修改 function_monitor.py 中 PerformanceMonitor 类的 evt_list 参数，指定要采集的 perf event 列表为 ['cycles', 'instructions', 'LLC-load-misses', 'LLC-loads', 'page-faults']

class PerformanceMonitor:

    def __init__(self, evt_list=None, pid_list=None, cpu_list=None):
        # ...
        try:
            self._kperf = importlib.import_module('kperf')
            # set perf event list
            self.evt_list = evt_list or [
                'cycles', 'instructions', 'LLC-load-misses', 'LLC-loads', 'page-faults'
            ]
        except Exception as e:
            self.logger.error(f"Failed to import kperf module: {e}")
            self.monitor_enabled = False

在 PyTorch 模型脚本中引入 @function_monitor 装饰器，将需要采集数据的函数进行装饰

import os
import torch
from function_monitor import function_monitor

@function_monitor(func_name='model_run', threshold_ms=1)
def model_run():
    size = 1024
    A = torch.rand(size, size, dtype=torch.float32, requires_grad=False).npu()
    B = torch.rand(size, size, dtype=torch.float32, requires_grad=False).npu()

    for i in range(10):
        C = torch.matmul(A, B)
        D = torch.nn.functional.relu(C)
        E = torch.nn.functional.layer_norm(D, D.size()[1:])

if __name__ == '__main__':
    for i in range(10):
        model_run()

输出说明

采集结束后，会在环境变量 FUNCTION_MONITOR_LOG_PATH 配置的路径下（默认为当前用户主目录下的 function_monitor_log 目录）生成对应的日志文件，文件名格式为 function_monitor_<pid>.log，其中 <pid> 为进程 PID。

方式二：通过 with 语句进行采集

function_monitor.py 中还提供了上下文管理器 FunctionMonitorContext，用户可以将数据采集逻辑封装在 with 语句块中，实现对指定代码块的执行时间及 CPU PMU 指标的采集。

参数说明

参数	可选/必选	说明
func_name	必选	设置要采集数据的函数名称
process_name	可选	设置采集数据的进程名称，若未指定，则默认为当前进程名称
threshold_ms	可选	设置采集数据的耗时阈值，只有函数执行耗时大于该阈值，才会记录到日志文件中，单位为 ms，若未指定，则默认为 1

使用示例

设置环境变量

export ENABLE_FUNCTION_MONITOR=True
export ENABLE_LIBKPERF=True
export FUNCTION_MONITOR_LOG_PATH=${HOME}/function_monitor_log

修改 function_monitor.py 中 PerformanceMonitor 类的 evt_list 参数，指定要采集的 perf event 列表为 ['cycles', 'instructions', 'LLC-load-misses', 'LLC-loads', 'page-faults']

class PerformanceMonitor:

    def __init__(self, evt_list=None, pid_list=None, cpu_list=None):
        # ...
        try:
            self._kperf = importlib.import_module('kperf')
            # set perf event list
            self.evt_list = evt_list or [
                'cycles', 'instructions', 'LLC-load-misses', 'LLC-loads', 'page-faults'
            ]
        except Exception as e:
            self.logger.error(f"Failed to import kperf module: {e}")
            self.monitor_enabled = False

在 PyTorch 模型脚本中引入 FunctionMonitorContext 上下文管理器，将需要采集数据的代码块封装在 with 语句块中

import os
import torch
from function_monitor import FunctionMonitorContext

def model_run():
    size = 1024
    A = torch.rand(size, size, dtype=torch.float32, requires_grad=False).npu()
    B = torch.rand(size, size, dtype=torch.float32, requires_grad=False).npu()

    with FunctionMonitorContext(func_name='torch_operator_run', threshold_ms=1):
        for i in range(10):
            C = torch.matmul(A, B)
            D = torch.nn.functional.relu(C)
            E = torch.nn.functional.layer_norm(D, D.size()[1:])

if __name__ == '__main__':
    for i in range(10):
        model_run()

输出说明

数据后处理

采集结束后，可使用 log2trace.py 脚本将采集到的日志文件转换为 Chrome Trace Json 格式，以便导入 MindStudio Insight 可视化工具联合展示与分析。

使用方式

python log2trace.py --input <input_file> --output <output_file>

参数说明

参数	可选/必选	说明
--input	必选	指定输入的 function_monitor 采集日志文件路径，需指定到文件名
--output	可选	指定输出的 Chrome Trace Json 文件路径，需指定到文件名, 若未指定，则默认在当前目录下生成与输入文件名相同但后缀为 '_trace.json' 的文件

使用示例

python log2trace.py --input function_monitor_12345.log --output function_monitor_12345_trace.json

数据可视化

将转换后的 Chrome Trace Json 文件导入 MindStudio Insight 可视化工具，即可展示函数执行时间及 CPU PMU 指标的采集情况。

Function Monitor

其中，每个色块表示一个函数执行事件，包含函数名称、执行耗时等信息，Args 里包含了函数执行过程中的 CPU PMU 指标信息，如 Page Fault 次数、LLC 缓存 Miss 次数等。

安全说明

由于 libkperf 库底层限制，调用 function_monitor.py 中定义的装饰器或接口时，需要确保当前用户有足够的权限（root 权限），否则可能会导致采集数据失败。

数据后处理脚本 log2trace.py 无特殊权限要求，可在普通用户权限下运行。