README.md

README

安装部署

前置条件

支持的python版本:3.7+; failslow 依赖于 systrace 采集的数据通信算子数据,请先完成 训练任务的 通信算子采集;

failslow-mcpserver 支持本地或者远程获取远程目标服务器的systrace 采集的通信算子数据,需要在配置文件中指定通信算子数据的路径。 failslow-openapi 支持本地或者远程获取远程目标服务器的systrace 采集的通信算子数据,需要在配置文件中指定通信算子数据的路径。

从本仓库源码安装运行(适用于开发者)

下载源码

git clone https://gitcode.com/openeuler/sysTrace.git

安装 failslow

工程./systrace目录下执行下面命令: python3 setup.py install

运行

systrace-failslow

安装mcpserver

工程./systrace/systrace_mcp目录下执行下面命令: python3 setup.py install

运行

systrace-mcpserver #开启mcp server服务 服务端口为 12145

systrace-openapi #开启openapi server服务 服务端口 12146

配置远程获取数据,修改./config/ftp_config.json文件

{
  "servers": [
    {
      "ip": "192.168.122.196",  #远程目标服务器的ip
      "port": 22, #远程目标服务器的ssh端口
      "user": "", #用户名
      "password": "", #密码
      "perception_remote_dir": "/home/hx/sysTrace_dataloader/timeline", #远程目标服务器systrace采集的timeline数据保存路径
      "detection_remote_dir": "/home/hx/sysTrace_dataloader/mspti",#远程目标服务器systrace采集的mspti数据保存路径
    }
  ],
  "enable": "False" #True 为开启远程获取数据,False为关闭只使用本地文件进行分析
}

数据分析

算子执行:3ms左右,计算慢导致的异常时7-8ms 算子下发: 表示算子下发到算子开始执行的时间 600ms左右 通信慢: sendrecv:几十ms到1200ms