msmodeling/experimental/optix/optimizer/store.py-代码预览-MindStudio-Modeling:基于 PyTorch 的神经网络推理性能模拟与分析框架项目 - AtomGit

# -------------------------------------------------------------------------
# This file is part of the MindStudio project.
# Copyright (c) 2025 Huawei Technologies Co.,Ltd.
#
# MindStudio is licensed under Mulan PSL v2.
# You can use this software according to the terms and conditions of the Mulan PSL v2.
# You may obtain a copy of Mulan PSL v2 at:
#
#          http://license.coscl.org.cn/MulanPSL2
#
# THIS SOFTWARE IS PROVIDED ON AN "AS IS" BASIS, WITHOUT WARRANTIES OF ANY KIND,
# EITHER EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO NON-INFRINGEMENT,
# MERCHANTABILITY OR FIT FOR A PARTICULAR PURPOSE.
# See the Mulan PSL v2 for more details.
# -------------------------------------------------------------------------
import csv
from pathlib import Path
from typing import Dict, Optional, List, Tuple

import numpy as np
from loguru import logger
from ..config.config import (
    DataStorageConfig,
    PerformanceIndex,
    OptimizerConfigField,
    get_settings,
)
from ..config.base_config import RUN_TIME
from ..io_utils import open_file, sanitize_csv_value
from ..optimizer.plugins.benchmark import VllmBenchMark, AisBench
from ..common import read_csv_s


LLM_MODEL = "llm_model"
DATASET_PATH = "dataset_path"
SIMULATOR = "simulator"
NUM_PROMPTS = "num_prompts"
MAX_OUTPUT_LEN = "max_output_len"


class DataStorage:
    def __init__(
        self,
        config: DataStorageConfig,
        simulator=None,
        benchmark=None,
    ):
        self.config = config
        if not self.config.store_dir.exists():
            self.config.store_dir.mkdir(parents=True, mode=0o750)
        self.save_file = self.config.store_dir.joinpath(f"data_storage_{RUN_TIME}.csv")
        self.simulator = simulator
        self.benchmark = benchmark

    @staticmethod
    def load_history_position(load_dir: Path, filter_field: Optional[Dict] = None) -> Optional[List]:
        if not load_dir.exists():
            raise FileNotFoundError(f"file: {load_dir}")
        if not load_dir.is_dir():
            raise ValueError("Expect a directory, not a file.")
        history_data = []
        for file in sorted(
            [f for f in load_dir.iterdir() if f.is_file()],
            key=lambda x: x.stat().st_ctime,
        ):
            if file.name.startswith("data_storage") and file.suffix == ".csv":
                data = read_csv_s(file).to_dict(orient="records")
                history_data.extend(data)
        if not history_data:
            return None
        return DataStorage.filter_data(history_data, filter_field)

    @staticmethod
    def filter_data(data: List[Dict], filter_field: Optional[Dict] = None):
        if not filter_field:
            return data
        filtered_data = []
        for d in data:
            flag = False
            for k, v in filter_field.items():
                if k not in d:
                    flag = True
                    continue
                _d_value = d[k]
                if isinstance(_d_value, int) and _d_value != int(v):
                    flag = True
                    break
                if isinstance(_d_value, float) and _d_value != float(v):
                    flag = True
                    break
                if isinstance(_d_value, bool) and _d_value != bool(v):
                    flag = True
                    break
                if str(_d_value).strip().lower() != str(v).strip().lower():
                    flag = True
                    break
            if flag:
                continue
            filtered_data.append(d)
        return filtered_data

    def get_run_info(self):
        _run_info = {}
        if self.benchmark is None:
            return _run_info
        if isinstance(self.benchmark, (AisBench, VllmBenchMark)):
            _run_info[NUM_PROMPTS] = self.benchmark.config.command.num_prompts
        elif self.benchmark.num_prompts:
            _run_info[NUM_PROMPTS] = self.benchmark.num_prompts
        return _run_info

    def save(
        self,
        performance_index: PerformanceIndex,
        params: Tuple[OptimizerConfigField],
        **kwargs,
    ):
        logger.info(f"Save result with DataStorage. File path: {self.save_file!r}")

        def safe_sanitize_csv_value(value):
            """
            Safely handle CSV values, particularly parameter values with -- prefix.
            Preserve CSV formula escaping while keeping command-line strings writable.
            """
            if isinstance(value, str):
                if value.startswith("--"):
                    value = "" + value[2:]
                elif "--" in value:
                    value = value.replace("--", "")
            return sanitize_csv_value(value)

        _column = []
        _value = []
        for k, v in performance_index.model_dump().items():
            _column.append(k)
            _value.append(v)
        for _p in params:
            _column.append(_p.name)
            _value.append(_p.value)
        for k, v in kwargs.items():
            _column.append(k)
            _value.append(v)
        for k, v in self.get_run_info().items():
            _column.append(k)
            _value.append(v)
        if self.save_file.exists():
            with open_file(self.save_file, "a+") as f:
                data_writer = csv.writer(f)
                data_writer.writerow([safe_sanitize_csv_value(_v) for _v in _value])
        else:
            with open_file(self.save_file, "w") as f:
                data_writer = csv.writer(f)
                data_writer.writerow(_column)
                data_writer.writerow([safe_sanitize_csv_value(_v) for _v in _value])

    def get_best_result(self):
        settings = get_settings()
        optimizer_result = read_csv_s(self.save_file)
        optimizer_result = optimizer_result.replace([np.inf, -np.inf], np.nan)
        pso_result = optimizer_result
        if self.benchmark:
            command = self.benchmark.config.command
            if hasattr(command, "num_prompts"):
                request_nums = command.num_prompts
                pso_result = optimizer_result[optimizer_result[NUM_PROMPTS] == request_nums]
        pso_result = pso_result.dropna(subset="fitness")
        pso_result = pso_result[pso_result["time_to_first_token"] > 0]
        pso_result = pso_result[pso_result["time_per_output_token"] > 0]
        pso_result = pso_result[pso_result["generate_speed"] > 0]
        pso_result = pso_result.reset_index()
        _fitness_index = pso_result.nsmallest(self.config.pso_top_k, "fitness").index
        if settings.ttft_penalty and settings.tpot_penalty:
            _generate_speed_index = (
                pso_result[
                    (pso_result["time_to_first_token"] <= settings.ttft_slo * (1 + settings.slo_coefficient))
                    & (pso_result["time_per_output_token"] <= settings.tpot_slo * (1 + settings.slo_coefficient))
                ]
                .nlargest(self.config.pso_top_k, "generate_speed")
                .index
            )
        elif settings.tpot_penalty:
            _generate_speed_index = (
                pso_result[pso_result["time_per_output_token"] <= settings.tpot_slo * (1 + settings.slo_coefficient)]
                .nlargest(self.config.pso_top_k, "generate_speed")
                .index
            )
        else:
            _generate_speed_index = pso_result.nlargest(self.config.pso_top_k, "generate_speed").index
        _fine_tune_index = _fitness_index.union(_generate_speed_index)
        return pso_result.iloc[_fine_tune_index]