msprof/analysis/msparser/aicpu/aicpu_bin_data_parser.py-代码预览-MindStudio-Profiler:基于昇腾AI的性能分析工具项目 - AtomGit

ascend-robot[msprof-master]out分支同步到master分支
65758472创建于 2025年12月25日历史提交
# -------------------------------------------------------------------------
# Copyright (c) 2025 Huawei Technologies Co., Ltd.
# This file is part of the MindStudio project.
#
# MindStudio is licensed under Mulan PSL v2.
# You can use this software according to the terms and conditions of the Mulan PSL v2.
# You may obtain a copy of Mulan PSL v2 at:
#
#    http://license.coscl.org.cn/MulanPSL2
#
# THIS SOFTWARE IS PROVIDED ON AN "AS IS" BASIS, WITHOUT WARRANTIES OF ANY KIND,
# EITHER EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO NON-INFRINGEMENT,
# MERCHANTABILITY OR FIT FOR A PARTICULAR PURPOSE.
# See the Mulan PSL v2 for more details.
# -------------------------------------------------------------------------

import json
import logging
import os
import sqlite3

from common_func.ai_stack_data_check_manager import AiStackDataCheckManager
from common_func.batch_counter import BatchCounter
from common_func.constant import Constant
from common_func.db_name_constant import DBNameConstant
from common_func.file_manager import FileManager, FileOpen
from common_func.iter_recorder import IterRecorder
from common_func.ms_multi_process import MsMultiProcess
from common_func.msprof_exception import ProfException
from common_func.msvp_common import is_valid_original_data
from common_func.path_manager import PathManager
from common_func.profiling_scene import ProfilingScene
from framework.offset_calculator import OffsetCalculator
from msconfig.config_manager import ConfigManager
from msmodel.ai_cpu.ai_cpu_model import AiCpuModel
from msparser.data_struct_size_constant import StructFmt
from profiling_bean.prof_enum.data_tag import DataTag
from profiling_bean.struct_info.ai_cpu_data import AiCpuData


class AicpuBinDataParser(MsMultiProcess):
    """
    parse ai cpu data by dp channel
    """
    TAG_AICPU = "AICPU"
    LIMIT_AI_CPU_LEN = 5000
    TABLES_PATH = ConfigManager.TABLES
    AI_CPU_DATA_MAP = "AiCpuDataMap"
    AI_CPU_TAG = 9
    NONE_NODE_NAME = ''

    def __init__(self: any, file_list: dict, sample_config: dict) -> None:
        super().__init__(sample_config)
        self._file_list = file_list.get(DataTag.AI_CPU, [])
        self.sample_config = sample_config
        self.project_path = self.sample_config.get("result_dir")
        self.ai_cpu_datas = []
        self._model = AiCpuModel(self.project_path, [DBNameConstant.TABLE_AI_CPU])
        self._iter_recorder = IterRecorder(self.project_path)
        self._overstep_task_cnt = 0

    def read_binary_data(self: any, file_path: str) -> None:
        """
        read lines from files
        :param file_path: file path of ai cpu
        :return: NA
        """
        ai_cpu_file = file_path
        file_size = os.path.getsize(ai_cpu_file)
        struct_nums = file_size // StructFmt.AI_CPU_FMT_SIZE
        offset_calculator = OffsetCalculator(self._file_list, StructFmt.AI_CPU_FMT_SIZE,
                                             self.project_path)
        with FileOpen(ai_cpu_file, 'rb') as cpu_f:
            cpu_f = offset_calculator.pre_process(cpu_f.file_reader, file_size)
        for index in range(struct_nums):
            ai_cpu = AiCpuData().ai_cpu_decode(
                cpu_f[index * StructFmt.AI_CPU_FMT_SIZE: (index + 1) * StructFmt.AI_CPU_FMT_SIZE])
            if ai_cpu.ai_cpu_time_consuming.ai_cpu_task_start_time != 0 and \
                    ai_cpu.ai_cpu_time_consuming.ai_cpu_task_end_time:
                if self._iter_recorder.check_task_before_max_iter(ai_cpu.ai_cpu_time_consuming.ai_cpu_task_end_syscnt):
                    self.ai_cpu_datas.append(
                        [ai_cpu.stream_id,
                         ai_cpu.task_id,
                         ai_cpu.ai_cpu_time_consuming.ai_cpu_task_start_time,
                         ai_cpu.ai_cpu_time_consuming.ai_cpu_task_end_time,
                         self.NONE_NODE_NAME,
                         ai_cpu.ai_cpu_time_consuming.compute_time,
                         ai_cpu.ai_cpu_time_consuming.memory_copy_time,
                         ai_cpu.ai_cpu_time_consuming.ai_cpu_task_time,
                         ai_cpu.ai_cpu_time_consuming.dispatch_time,
                         ai_cpu.ai_cpu_time_consuming.total_time])
                else:
                    self._overstep_task_cnt = self._overstep_task_cnt + 1
            struct_nums -= 1
            logging.debug(json.dumps(ai_cpu, default=lambda message: message.__dict__, sort_keys=True))

    def parse_ai_cpu(self: any) -> None:
        """
        parse ai cpu
        """
        if not AiStackDataCheckManager.contain_dp_aicpu_data(self.project_path):
            return

        data_dir = PathManager.get_data_dir(self.project_path)
        self._file_list.sort()
        for _file in self._file_list:
            if is_valid_original_data(_file, self.project_path):
                logging.info("start parsing ai cpu data file: %s", _file)
                self.read_binary_data(os.path.join(data_dir, _file))
                FileManager.add_complete_file(self.project_path, _file)
        if self._overstep_task_cnt > 0:
            logging.warning("AI_CPU overstep task number is %s", self._overstep_task_cnt)

    def save(self: any) -> None:
        """
        save data to db
        :return:
        """
        if self._model and self.ai_cpu_datas:
            self._model.init()
            self._model.flush(self.ai_cpu_datas)
            self._model.finalize()

    def ms_run(self: any) -> None:
        """
        main entry for parsing ai cpu data
        :return: None
        """
        try:
            self.parse_ai_cpu()
        except (OSError, SystemError, ValueError, TypeError, RuntimeError, ProfException) as task_rec_err:
            logging.error(str(task_rec_err), exc_info=Constant.TRACE_BACK_SWITCH)
            return
        try:
            self.save()
        except sqlite3.Error as task_rec_err:
            logging.error(str(task_rec_err), exc_info=Constant.TRACE_BACK_SWITCH)