MindIE-PyMotor/examples/deployer/patch · Ascend/MindIE-PyMotor - AtomGit

文件	最后提交记录	最后更新时间
0.20.2	[fix] 补丁增加对 vllm 0.21.0 的支持 Co-authored-by: c00951058<chenchaofeng5@huawei.com> # message auto-generated for no-merge-commit merge: !322 merge c00951058 into master [fix] 补丁增加对 vllm 0.21.0 的支持 Created-by: qq_40172610 Commit-by: c00951058 Merged-by: towncharlie Description: ## 1. 合入背景 B060 镜像（mindie-motor-vllm:dev-26.1.0.B060-...）已将 vLLM 升级至 0.21.0。前序 PR !284 引入了 safetensors 加载 shuffle 优化，但补丁仅适配 vLLM 0.20.2，在 0.21.0 环境下会被 should_apply_patch() 跳过，shuffle 能力无法生效。本 PR 在前序 shuffle 补丁机制基础上，扩展对 vLLM 0.21.0 的支持，使 B060 镜像无需重打即可恢复 shuffle 优化能力。 ## 2. 修改内容 1. 扩展 patch_apply_shuffle_safetensors.py 版本适配逻辑将 TARGET_VLLM_VERSION = "0.20.2" 扩展为 TARGET_VLLM_VERSIONS = ("0.20.2", "0.21.0")。按已安装 vLLM 版本动态选择补丁目录：patch/{version}/（如 patch/0.21.0/），实现多版本共存。保留幂等检测：已 patch 或目标文件已含 shuffle_safetensors_files 且语法有效时跳过。补丁文件按版本目录重组 2. 原 patch/vllm_shuffle_.patch 迁移至 patch/0.20.2/。新增 patch/0.21.0/ 下 3 个补丁，适配 vLLM 0.21.0 源码差异： vllm_shuffle_load_config.patch → config/load.py：新增 LoadConfig.shuffle_safetensors_files: bool = True vllm_shuffle_default_loader.patch → default_loader.py：将配置传入权重加载函数（0.21.0 调用链含 safetensors_prefetch_block_size 等参数，上下文与 0.20.2 不同） vllm_shuffle_weight_utils.patch → weight_utils.py：按 rank 确定性 shuffle 文件列表（random.Random(42 + rank)），分散各 rank 的 I/O 顺序 ## 3. 资料变更* 不涉及 ## 4. 接口变更不涉及 ## 5. 测试结果 d拉起时间约5min ![image.png](https://raw.gitcode.com/user-images/assets/9072912/cca7827b-cf23-41aa-af4a-904a3983889e/image.png 'image.png') p拉起时间约7min ![image.png](https://raw.gitcode.com/user-images/assets/9072912/b6d47f58-8a11-4815-a7e1-93d184569505/image.png 'image.png') ## 6. CheckList > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] [x] 代码注释完备 [x] 正确记录维测日志 [x] 是否有UT用例 [x] 若涉及多线程场景，考虑了并发场景，不存在死锁问题 See merge request: Ascend/MindIE-PyMotor!322	5 天前
0.21.0	[fix] 补丁增加对 vllm 0.21.0 的支持 Co-authored-by: c00951058<chenchaofeng5@huawei.com> # message auto-generated for no-merge-commit merge: !322 merge c00951058 into master [fix] 补丁增加对 vllm 0.21.0 的支持 Created-by: qq_40172610 Commit-by: c00951058 Merged-by: towncharlie Description: ## 1. 合入背景 B060 镜像（mindie-motor-vllm:dev-26.1.0.B060-...）已将 vLLM 升级至 0.21.0。前序 PR !284 引入了 safetensors 加载 shuffle 优化，但补丁仅适配 vLLM 0.20.2，在 0.21.0 环境下会被 should_apply_patch() 跳过，shuffle 能力无法生效。本 PR 在前序 shuffle 补丁机制基础上，扩展对 vLLM 0.21.0 的支持，使 B060 镜像无需重打即可恢复 shuffle 优化能力。 ## 2. 修改内容 1. 扩展 patch_apply_shuffle_safetensors.py 版本适配逻辑将 TARGET_VLLM_VERSION = "0.20.2" 扩展为 TARGET_VLLM_VERSIONS = ("0.20.2", "0.21.0")。按已安装 vLLM 版本动态选择补丁目录：patch/{version}/（如 patch/0.21.0/），实现多版本共存。保留幂等检测：已 patch 或目标文件已含 shuffle_safetensors_files 且语法有效时跳过。补丁文件按版本目录重组 2. 原 patch/vllm_shuffle_.patch 迁移至 patch/0.20.2/。新增 patch/0.21.0/ 下 3 个补丁，适配 vLLM 0.21.0 源码差异： vllm_shuffle_load_config.patch → config/load.py：新增 LoadConfig.shuffle_safetensors_files: bool = True vllm_shuffle_default_loader.patch → default_loader.py：将配置传入权重加载函数（0.21.0 调用链含 safetensors_prefetch_block_size 等参数，上下文与 0.20.2 不同） vllm_shuffle_weight_utils.patch → weight_utils.py：按 rank 确定性 shuffle 文件列表（random.Random(42 + rank)），分散各 rank 的 I/O 顺序 ## 3. 资料变更* 不涉及 ## 4. 接口变更不涉及 ## 5. 测试结果 d拉起时间约5min ![image.png](https://raw.gitcode.com/user-images/assets/9072912/cca7827b-cf23-41aa-af4a-904a3983889e/image.png 'image.png') p拉起时间约7min ![image.png](https://raw.gitcode.com/user-images/assets/9072912/b6d47f58-8a11-4815-a7e1-93d184569505/image.png 'image.png') ## 6. CheckList > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] [x] 代码注释完备 [x] 正确记录维测日志 [x] 是否有UT用例 [x] 若涉及多线程场景，考虑了并发场景，不存在死锁问题 See merge request: Ascend/MindIE-PyMotor!322	5 天前
0.22.1	[fix] 补丁增加对 vllm 0.22.1 的支持 Co-authored-by: c00951058<chenchaofeng5@huawei.com> # message auto-generated for no-merge-commit merge: !345 merge c00951058 into master [fix] 补丁增加对 vllm 0.22.1 的支持 Created-by: qq_40172610 Commit-by: c00951058 Merged-by: towncharlie Description: ## 1. 合入背景 B071 镜像（mindie-motor-vllm:dev-26.1.0.B071-...）已将 vLLM 升级至 0.22.1。引擎启动时会通过 patch_apply_shuffle_safetensors.py 对 vLLM 源码打 shuffle safetensors 补丁，用于多卡场景下随机化 safetensors 权重文件加载顺序，缓解 I/O 争抢、提升启动速度。本次合入在保持向后兼容的前提下，完成多版本 patch 目录化改造，并新增 0.22.1 适配。 ## 2. 修改内容 2.1 新增 vLLM 0.22.1 补丁文件，在 examples/deployer/patch/0.22.1/ 下新增 3 个 patch。 2.2 重构 patch 目录结构，支持按版本路由，将原 patch/ 根目录下的 3 个 patch 文件按版本拆分到子目录。 2.3 更新补丁应用脚本，修改 examples/deployer/patch/patch_apply_shuffle_safetensors.py。 ## 3. 资料变更不涉及 ## 4. 接口变更不涉及 ## 5. 测试结果清理缓存：sync && echo 3 \| tee /proc/sys/vm/drop_caches 重新拉起服务，测试p/d拉起时长，着重关注权重加载时长。 p拉起时长约6分钟： ![image.png](https://raw.gitcode.com/user-images/assets/9072912/7adb43b9-10ea-4fe3-96a2-2e96a332304c/image.png 'image.png') DeepSeek V3.1 (Worker_DP1_TP0_EP8 pid=963) INFO 06-25 12:19:12 [default_loader.py:400] Loading weights took 152.01 seconds (Worker_DP0_TP0_EP0 pid=962) INFO 06-25 12:19:20 [default_loader.py:400] Loading weights took 161.25 seconds MTP 投机解码 (Worker_DP1_TP0_EP8 pid=963) INFO 06-25 12:19:31 [default_loader.py:400] Loading weights took 7.21 seconds (Worker_DP0_TP0_EP0 pid=962) INFO 06-25 12:19:35 [default_loader.py:400] Loading weights took 6.65 seconds d拉起时长约6分钟： ![image.png](https://raw.gitcode.com/user-images/assets/9072912/743c3c03-034c-417a-a7f3-4bed661451e2/image.png 'image.png') DeepSeek V3.1 (Worker_DP15_EP15 pid=2884) INFO 06-25 12:18:50 [default_loader.py:400] Loading weights took 144.72 seconds ... 省略中间14个。 (Worker_DP0_EP0 pid=2834) INFO 06-25 12:19:13 [default_loader.py:400] Loading weights took 167.43 seconds MTP 投机解码 (Worker_DP2_EP2 pid=2868) INFO 06-25 12:19:27 [default_loader.py:400] Loading weights took 7.91 seconds ...省略中间14个。 (Worker_DP0_EP0 pid=2834) INFO 06-25 12:19:32 [default_loader.py:400] Loading weights took 7.00 seconds ## 6. CheckList > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] [x] 代码注释完备 [x] 正确记录维测日志 [x] 是否有UT用例 [x] 若涉及多线程场景，考虑了并发场景，不存在死锁问题 See merge request: Ascend/MindIE-PyMotor!345	3 天前
kv_vllm_multi_connector.patch	kv cache亲和性调度特性打vLLm补丁 Co-authored-by: zhoujing101<zhoujing101@huawei.com> # message auto-generated for no-merge-commit merge: !82 merge master_2 into master kv cache亲和性调度特性打vLLm补丁 Created-by: zhoujing101 Commit-by: zhoujing101 Merged-by: towncharlie Description: ## 1. 合入背景 kv cache亲和性调度特性需要打vLLm补丁，弄成自动化的 [#61](https://gitcode.com/Ascend/MindIE-PyMotor/issues/61) ## 2. 修改内容 kv cache亲和性调度特性需要打vLLm补丁，弄成自动化的 ## 3. 资料变更 “不涉及”。 ## 4. 接口变更 “不涉及”。 ## 5. 测试结果 ![Snipaste_2026-04-11_20-57-50.jpg](https://raw.gitcode.com/user-images/assets/9072912/f1b42654-a45d-45a3-bd64-918da9587cff/Snipaste_2026-04-11_20-57-50.jpg 'Snipaste_2026-04-11_20-57-50.jpg') ## 6. CheckList > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] [x] 代码注释完备 [x] 正确记录维测日志 [x] 是否有UT用例 [x] 若涉及多线程场景，考虑了并发场景，不存在死锁问题 See merge request: Ascend/MindIE-PyMotor!82	2 个月前
patch_apply_shuffle_safetensors.py	[fix] 补丁增加对 vllm 0.22.1 的支持 Co-authored-by: c00951058<chenchaofeng5@huawei.com> # message auto-generated for no-merge-commit merge: !345 merge c00951058 into master [fix] 补丁增加对 vllm 0.22.1 的支持 Created-by: qq_40172610 Commit-by: c00951058 Merged-by: towncharlie Description: ## 1. 合入背景 B071 镜像（mindie-motor-vllm:dev-26.1.0.B071-...）已将 vLLM 升级至 0.22.1。引擎启动时会通过 patch_apply_shuffle_safetensors.py 对 vLLM 源码打 shuffle safetensors 补丁，用于多卡场景下随机化 safetensors 权重文件加载顺序，缓解 I/O 争抢、提升启动速度。本次合入在保持向后兼容的前提下，完成多版本 patch 目录化改造，并新增 0.22.1 适配。 ## 2. 修改内容 2.1 新增 vLLM 0.22.1 补丁文件，在 examples/deployer/patch/0.22.1/ 下新增 3 个 patch。 2.2 重构 patch 目录结构，支持按版本路由，将原 patch/ 根目录下的 3 个 patch 文件按版本拆分到子目录。 2.3 更新补丁应用脚本，修改 examples/deployer/patch/patch_apply_shuffle_safetensors.py。 ## 3. 资料变更不涉及 ## 4. 接口变更不涉及 ## 5. 测试结果清理缓存：sync && echo 3 \| tee /proc/sys/vm/drop_caches 重新拉起服务，测试p/d拉起时长，着重关注权重加载时长。 p拉起时长约6分钟： ![image.png](https://raw.gitcode.com/user-images/assets/9072912/7adb43b9-10ea-4fe3-96a2-2e96a332304c/image.png 'image.png') DeepSeek V3.1 (Worker_DP1_TP0_EP8 pid=963) INFO 06-25 12:19:12 [default_loader.py:400] Loading weights took 152.01 seconds (Worker_DP0_TP0_EP0 pid=962) INFO 06-25 12:19:20 [default_loader.py:400] Loading weights took 161.25 seconds MTP 投机解码 (Worker_DP1_TP0_EP8 pid=963) INFO 06-25 12:19:31 [default_loader.py:400] Loading weights took 7.21 seconds (Worker_DP0_TP0_EP0 pid=962) INFO 06-25 12:19:35 [default_loader.py:400] Loading weights took 6.65 seconds d拉起时长约6分钟： ![image.png](https://raw.gitcode.com/user-images/assets/9072912/743c3c03-034c-417a-a7f3-4bed661451e2/image.png 'image.png') DeepSeek V3.1 (Worker_DP15_EP15 pid=2884) INFO 06-25 12:18:50 [default_loader.py:400] Loading weights took 144.72 seconds ... 省略中间14个。 (Worker_DP0_EP0 pid=2834) INFO 06-25 12:19:13 [default_loader.py:400] Loading weights took 167.43 seconds MTP 投机解码 (Worker_DP2_EP2 pid=2868) INFO 06-25 12:19:27 [default_loader.py:400] Loading weights took 7.91 seconds ...省略中间14个。 (Worker_DP0_EP0 pid=2834) INFO 06-25 12:19:32 [default_loader.py:400] Loading weights took 7.00 seconds ## 6. CheckList > PR提交人对以下CheckList自检项进行全量自检，自检通过或不涉及，均修改 [ ] 为 [x] [x] 代码注释完备 [x] 正确记录维测日志 [x] 是否有UT用例 [x] 若涉及多线程场景，考虑了并发场景，不存在死锁问题 See merge request: Ascend/MindIE-PyMotor!345	3 天前