Qwen-3.5-28B-A3B-REAP/reap_layerwise_args.yaml-代码预览-Qwen-3.5-28B-A3B-REAP:基于 REAP 技术的 MoE 模型剪枝项目 - AtomGit

SsystemAdd REAP 20% pruned Qwen3.5-35B-A3B model weights and card
cluster_args:
  cluster_description: null
  cluster_method: agglomerative
  compression_ratio: 0.2
  expert_sim: ttm
  frequency_penalty: true
  linkage_method: average
  max_cluster_size: null
  multi_layer: null
  num_clusters: null
  singleton_outlier_experts: false
  singleton_super_experts: false
  softmax_temperature: null
ds_args:
  dataset_config_name: all
  dataset_name: combined
  dataset_test_split: test
  shuffle: true
  split: train
eval_args:
  evalplus_tasks:
  - mbpp
  - humaneval
  greedy: true
  lm_eval_tasks:
  - winogrande
  - arc_challenge
  - arc_easy
  - boolq
  - hellaswag
  - mmlu
  - openbookqa
  - rte
  min_p: 0.0
  parallel_tasks: 32
  results_dir: null
  run_evalplus: true
  run_livecodebench: true
  run_lm_eval: true
  run_math: false
  run_wildbench: false
  server_log_file_name: server.log
  temperature: 0.7
  top_k: 20
  top_p: 0.8
  use_server: true
  vllm_port: 8000
layerwise_args:
  aggressive_cleanup: true
  auto_resume: false
  low_cpu_mem_usage: true
  max_gpu_memory: null
  save_intermediate: false
  use_layerwise: false
model_args:
  model_name: Qwen/Qwen3.5-35B-A3B
  num_experts_per_tok_override: null
obs_args:
  batch_size: 1
  distance_measure: angular
  model_max_length: 2048
  output_file_name: observations_merged.pt
  overwrite_observations: false
  record_pruning_metrics_only: true
  renormalize_router_weights: true
  return_vllm_tokens_prompt: false
  samples_per_category: 1024
  select_only_categories: null
  split_by_category: false
  truncate: false
prune_args:
  n_experts_to_prune: null
  overwrite_pruned_model: false
  perserve_outliers: false
  perserve_super_experts: false
  prune_method: reap
reap_args:
  debug: false
  do_eval: true
  plot_clusters: true
  profile: true
  run_observer_only: false
  seed: 42
  smoke_test: true