功能介绍

CCAE(Cluster Computing Autonomous Engine)是华为开发的一套集群自智引擎系统。Motor 推理服务可纳管至 CCAE。

CCAE Reporter 负责与 CCAE 对接,采集 Motor 的运行信息(告警、日志、实例信息和metrics 等),上报到 CCAE。

配置说明

user_config.json 配置

user_config.json 中添加 CCAE 配置:

{
  "motor_deploy_config": {
    "tls_config": {
      "north_tls_config": {
        "enable_tls": true,
        "ca_file": "",
        "cert_file": "",
        "key_file": "",
        "passwd_file": ""
      }
    }
  },
  "north_config": {
    "name": "ccae_reporter",
    "ip": "xxx",
    "port": 31948
  }
}

说明:该配置支持动态修改,Motor 运行过程中可以直接对接 CCAE,无需重启 Motor 推理服务。

修改完配置后,在 examples/deployer 目录下执行以下命令更新配置:

cd examples/deployer
# 方式一:指定配置目录(推荐)
python deploy.py --config_dir ../infer_engines/vllm --update_config

# 方式二:单独指定配置文件
python deploy.py --user_config_path ../infer_engines/vllm/user_config.json --env_config_path ../infer_engines/vllm/env.json --update_config