README.md

ST数据采集方法

采集ST性能数据使用LLM。考虑到模型获取的方便性,使用MindSpeed-LLM支持的模型。同时考虑到ST使用的数据不需要很大,使用Qwen3-0.6B作为采集ST数据使用的模型。为了采集通信数据,模型使用多卡进行训练。数据集使用alpaca。

ST数据每个季度使用最新的profiling工具进行采集。

采集配置

2025Q4

CANN 8.3.RC1

Python 3.10

PyTorch 2.7.1

MindSpeed 2.2.0

4卡

TP=1
 
PP=2
 
MBS=1
 
GBS=4
 
PROFILING_ARGS="
    --profile \
    --profile-export-type text \
    --profile-level level2 \
    --profile-data-simplification \
    --profile-with-cpu \
    --profile-step-start 15 \
    --profile-step-end 16 \
    --profile-save-path ./profile_dir \
    --profile-record-shapes \
    --profile-with-memory \
    --profile-ranks -1 \
"

采集数据删除operator_details.csv,因为MindStudio Insight未用到。

为了测试集群相关功能,1卡和3卡仅保留ascend_pytorch_profiler.db analysis.db communication_matrix.json communication.json step_trace_time.csv,其它文件都删除。

裁剪后文件大小共68M左右。