| 文件 | 最后提交记录 | 最后更新时间 |
|---|---|---|
A5文件挂载与环境变量设置 Co-authored-by: weixin_63825906<gaopeng140@huawei.com> # message auto-generated for no-merge-commit merge: !324 merge A5_mouth into master A5文件挂载与环境变量设置 Created-by: weixin_63825906 Commit-by: weixin_63825906 Merged-by: towncharlie Description: ## **1. 合入背景** >A5存在较多额外环境配置,要写入启动脚本以减少手动修改的操作 Fixes [#205](https://gitcode.com/Ascend/MindIE-PyMotor/issues/205) ## **2. 修改内容** > 在A5环境下,新增pod挂载路径以及环境变量,以确保服务正常运行 ## **3. 资料变更** > 不涉及 ## **4. 接口变更** > 不涉及 ## **5. 测试结果** > A5 服务拉起后正常推理  ## **6. CheckList** > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] [ ] 代码注释完备 [ ] 正确记录维测日志 [ ] 是否有UT用例 [ ] 若涉及多线程场景,考虑了并发场景,不存在死锁问题 See merge request: Ascend/MindIE-PyMotor!324 | 4 天前 | |
[refractor] 重构deployer Co-authored-by: 吕有辉<lvyouhui@huawei.com> # message auto-generated for no-merge-commit merge: !286 merge refractor_deployer into master [refractor] 重构deployer Created-by: codeDogPro Commit-by: 吕有辉 Merged-by: ascend-robot Description: ## **1. 合入背景** https://gitcode.com/Ascend/MindIE-pyMotor-private/issues/147 ## **2. 修改内容** 1、拆分deploy.py文件 2、拆分boot.sh文件【以及调整文件夹名称】 3、重命名deployment文件夹 4、调整examples结构【详见ISSUE】 ## **3. 资料变更** 设计 ## **4. 接口变更** 不涉及 ## **5. 测试结果** 1、CRD:正常拉起(压测),静态扩缩无问题 2、多Deployment:正常拉起(压测),静态扩缩无问题 3、单容器:正常拉起(压测) ## **6. CheckList** > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] [x] 代码注释完备 [x] 正确记录维测日志 [x] 是否有UT用例 [x] 若涉及多线程场景,考虑了并发场景,不存在死锁问题 See merge request: Ascend/MindIE-pyMotor-private!286 | 3 个月前 | |
删除coordinator中depoly mode冗余配置,可靠性加强 Co-authored-by: tobking<wangjun292@huawei.com> # message auto-generated for no-merge-commit merge: !272 merge br_decouple_add_0603 into master 删除coordinator中depoly mode冗余配置,可靠性加强 Created-by: tobking Commit-by: tobking Merged-by: towncharlie Description: ## **1. 合入背景** > 请描述为什么要做这个PR内的改动。\ > 如涉及,请关联前序PR或同特性/需求下的其他PR。\ > 如果是修复之前PR引入的问题,请关联引入问题的PR。\ > 请通过#ISSUE ID关联issue。\ > 注意: Fixes #ISSUE ID会自动关闭issue,如问题部分解决请不要使用Fixes,可以用Fix part of #ISSUE ID替代. [#178](https://gitcode.com/Ascend/MindIE-PyMotor/issues/178) ## **2. 修改内容** > 请<ins>**描述修改内容的具体实现**</ins>,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列。 > 如果是需求或者重构类的PR,需要<ins>**补充详细设计文档**</ins>(说明上下游组件关系、时序图、类图、DFX能力等内容)。 删除coordinator的depoly_mode冗余配置,代码流程根据connector确认走CPCD还是CDP ## **3. 资料变更** > 请确认<ins>**是否涉及资料变更**</ins>。\ > 如涉及,需要在PR中体现,并简要说明修改内容。\ > 如不涉及,需填写“不涉及”。 userconfig中删除coordinator的depoly_mode ## **4. 接口变更** > 请确认<ins>**是否涉及跨代码仓或者客户面可见的接口变更**</ins>。\ > 如涉及,需详细说明接口以及对应的变更内容,同时需要在资料中体现。\ > 如不涉及,需填写“不涉及”。 不涉及 ## **5. 测试结果** > 需体现<ins>**测试场景,测试方法以及测试结果**</ins>。\ > 测试用例设计时需考虑硬件、部署方式、功能、性能、精度、显存等维度。 ## **6. CheckList** > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] [x] 代码注释完备 [x] 正确记录维测日志 [x] 是否有UT用例 [x] 若涉及多线程场景,考虑了并发场景,不存在死锁问题 See merge request: Ascend/MindIE-PyMotor!272 | 17 天前 | |
A5文件挂载与环境变量设置 Co-authored-by: weixin_63825906<gaopeng140@huawei.com> # message auto-generated for no-merge-commit merge: !324 merge A5_mouth into master A5文件挂载与环境变量设置 Created-by: weixin_63825906 Commit-by: weixin_63825906 Merged-by: towncharlie Description: ## **1. 合入背景** >A5存在较多额外环境配置,要写入启动脚本以减少手动修改的操作 Fixes [#205](https://gitcode.com/Ascend/MindIE-PyMotor/issues/205) ## **2. 修改内容** > 在A5环境下,新增pod挂载路径以及环境变量,以确保服务正常运行 ## **3. 资料变更** > 不涉及 ## **4. 接口变更** > 不涉及 ## **5. 测试结果** > A5 服务拉起后正常推理  ## **6. CheckList** > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] [ ] 代码注释完备 [ ] 正确记录维测日志 [ ] 是否有UT用例 [ ] 若涉及多线程场景,考虑了并发场景,不存在死锁问题 See merge request: Ascend/MindIE-PyMotor!324 | 4 天前 | |
[fix] 提升deployer中进度条读取日志速度 Co-authored-by: Jechin<yuzechen1@huawei.com> # message auto-generated for no-merge-commit merge: !309 merge fix/deployer-progress-log-throughput into master [fix] 提升deployer中进度条读取日志速度 Created-by: Jechin Commit-by: Jechin Merged-by: towncharlie Description: ## **1. 合入背景** > 请描述为什么要做这个PR内的改动。\ > 如涉及,请关联前序PR或同特性/需求下的其他PR。\ > 如果是修复之前PR引入的问题,请关联引入问题的PR。\ > 请通过#ISSUE ID关联issue。\ > 注意: Fixes #ISSUE ID会自动关闭issue,如问题部分解决请不要使用Fixes,可以用Fix part of #ISSUE ID替代. Fixes [#187](https://gitcode.com/Ascend/MindIE-PyMotor/issues/187) ## **2. 修改内容** > 请<ins>**描述修改内容的具体实现**</ins>,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列。 > 如果是需求或者重构类的PR,需要<ins>**补充详细设计文档**</ins>(说明上下游组件关系、时序图、类图、DFX能力等内容)。 1. 去掉每行 sleep,删除 SLEEP_LINE_INTERVAL = 0.05;有数据时不再 sleep,仅在 readline() 空读时保留 SLEEP_POLL_INTERVAL 2. 日志预过滤,新增 is_relevant_log_line(),仅当行内包含 key_steps 关键字时才进入 parse_log_line 3. 进度条去重,update_progress() 仅在 step > progress_bar.n 时更新,避免重复刷新 4. 描述区节流,新增 maybe_update_description(),tqdm 描述最多每 1s 刷新一次 5. safetensors 节流新增 should_update_safetensors_progress(),加载百分比进度最多每 300ms 更新一次;里程碑(80/90/100)不受限 ## **3. 资料变更** > 请确认<ins>**是否涉及资料变更**</ins>。\ > 如涉及,需要在PR中体现,并简要说明修改内容。\ > 如不涉及,需填写“不涉及”。 不涉及 ## **4. 接口变更** > 请确认<ins>**是否涉及跨代码仓或者客户面可见的接口变更**</ins>。\ > 如涉及,需详细说明接口以及对应的变更内容,同时需要在资料中体现。\ > 如不涉及,需填写“不涉及”。 不涉及 ## **5. 测试结果** > 需体现<ins>**测试场景,测试方法以及测试结果**</ins>。\ > 测试用例设计时需考虑硬件、部署方式、功能、性能、精度、显存等维度。   ## **6. CheckList** > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] [x] 代码注释完备 [x] 正确记录维测日志 [x] 是否有UT用例 [ ] 若涉及多线程场景,考虑了并发场景,不存在死锁问题 See merge request: Ascend/MindIE-PyMotor!309 | 10 天前 | |
【bugfix】强制删除处于terminating的pod Co-authored-by: ganglv<lvgang1@huawei.com> # message auto-generated for no-merge-commit merge: !69 merge master_b100 into master 【bugfix】强制删除处于terminating的pod Created-by: ganglv Commit-by: ganglv Merged-by: towncharlie Description: ## **1. 合入背景** > 请描述为什么要做这个PR内的改动。\ > 如涉及,请关联前序PR或同特性/需求下的其他PR。\ > 如果是修复之前PR引入的问题,请关联引入问题的PR。\ > 请通过#ISSUE ID关联issue。\ > 注意: Fixes #ISSUE ID会自动关闭issue,如问题部分解决请不要使用Fixes,可以用Fix part of #ISSUE ID替代. https://gitcode.com/Ascend/MindIE-PyMotor/issues/55 ## **2. 修改内容** > 请<ins>**描述修改内容的具体实现**</ins>,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列。 > 如果是需求或者重构类的PR,需要<ins>**补充详细设计文档**</ins>(说明上下游组件关系、时序图、类图、DFX能力等内容)。 在bash delete.sh中增加强制删pod的逻辑,等待时间与yaml_template/engine_template.yaml中terminationGracePeriodSeconds: 10保持一致 ## **3. 资料变更** > 请确认<ins>**是否涉及资料变更**</ins>。\ > 如涉及,需要在PR中体现,并简要说明修改内容。\ > 如不涉及,需填写“不涉及”。 不涉及 ## **4. 接口变更** > 请确认<ins>**是否涉及跨代码仓或者客户面可见的接口变更**</ins>。\ > 如涉及,需详细说明接口以及对应的变更内容,同时需要在资料中体现。\ > 如不涉及,需填写“不涉及”。 不涉及 ## **5. 测试结果** > 需体现<ins>**测试场景,测试方法以及测试结果**</ins>。\ > 测试用例设计时需考虑硬件、部署方式、功能、性能、精度、显存等维度。 txt [root@node-131 deployer]# bash delete.sh mindie-lvgang NOW EXECUTING [kubectl delete] COMMANDS. THE RESULT IS: Namespace: mindie-lvgang configmap "motor-config" deleted serviceaccount "mindie-motor-controller" deleted warning: deleting cluster-scoped resources, not scoped to the provided namespace clusterrole.rbac.authorization.k8s.io "mindie-controller-role" deleted clusterrolebinding.rbac.authorization.k8s.io "mindie-controller-binding" deleted deployment.apps "mindie-motor-controller" deleted service "mindie-motor-controller-service" deleted deployment.apps "mindie-motor-coordinator" deleted service "mindie-motor-coordinator-service" deleted service "mindie-motor-coordinator-infer" deleted deployment.apps "vllm-d0" deleted deployment.apps "vllm-p0" deleted Waiting for pods to terminate gracefully... 10s remaining Waiting for pods to terminate gracefully... 9s remaining Waiting for pods to terminate gracefully... 8s remaining Waiting for pods to terminate gracefully... 7s remaining Waiting for pods to terminate gracefully... 6s remaining Waiting for pods to terminate gracefully... 5s remaining Waiting for pods to terminate gracefully... 4s remaining Waiting for pods to terminate gracefully... 3s remaining Waiting for pods to terminate gracefully... 2s remaining Waiting for pods to terminate gracefully... 1s remaining Delete completed. [root@node-131 deployer]# ## **6. CheckList** > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] [x] 代码注释完备 [x] 正确记录维测日志 [ ] 是否有UT用例 [ ] 若涉及多线程场景,考虑了并发场景,不存在死锁问题 See merge request: Ascend/MindIE-PyMotor!69 | 2 个月前 | |
feat: pymotor支持CP + parallel_config重构 Co-authored-by: yilunh<hanyilun1@huawei.com> Co-authored-by: tobking<wangjun292@huawei.com> # message auto-generated for no-merge-commit merge: !111 merge pcpdcp into master feat: pymotor支持CP + parallel_config重构 Created-by: yilunh Commit-by: yilunh;tobking Merged-by: towncharlie Description: ## **1. 合入背景** 1、pymotor支持cp配置 2、重构parallel_config,支持引擎原生并行配置参数在engine_config中解析,同时前向兼容model_config fixes [#78](https://gitcode.com/Ascend/MindIE-PyMotor/issues/78) ## **2. 修改内容** 1、支持CP配置: instance.py扩展parallelConfig,支持pcp_size配置,重计算world_size nodemanager.py调整并行相关配置,修改打印 controller装配:修改instance_assembler.py组装实例时world_size计算公式 daemon.py修改nodemanager守护进程中的local_world_size计算 endpoint.py支持cp相关字段 vllm_config.py新增常量配置对接CP 2、重构parallel_config: 配置架构从 model_config /parallel_config 双配置块统一迁移为以 engine_config 为核心,新增配置解析器统一处理,兼容旧配置,优先级engine_config > model_config  ## **3. 资料变更** 适配cp配置 user_config接口变更,engine_config中支持引擎原生参数,逐步日落model_config ## **4. 接口变更** user_config的并行配置中新增pcp_size和cp_kv_cache_interleave_size参数 user_config接口变更,engine_config中支持引擎原生参数,逐步日落model_config ## **5. 测试结果**     ## **6. CheckList** > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] [ ] 代码注释完备 [ ] 正确记录维测日志 [ ] 是否有UT用例 [ ] 若涉及多线程场景,考虑了并发场景,不存在死锁问题 See merge request: Ascend/MindIE-PyMotor!111 | 1 个月前 |
| 文件 | 最后提交记录 | 最后更新时间 |
|---|---|---|
| 4 天前 | ||
| 3 个月前 | ||
| 17 天前 | ||
| 4 天前 | ||
| 10 天前 | ||
| 2 个月前 | ||
| 1 个月前 |