Fork
0
代码
介绍
代码
Issues
Pull Requests
流水线
Actions
讨论
Wiki
项目成员
分析
项目设置
Fork
0
master
MindIE-LLM
/
tests
/
dlt
/
ut
/
utils
下载当前目录
ascend-robot
重试Tokenizer子进程拉起时,Daemon忽略齐17信号量
ee73ba2d
创建于
4月23日
历史提交
文件
最后提交记录
最后更新时间
CMakeLists.txt
[dev]Synchronize code Co-authored-by: forcekeng<gengli8@huawei.com>
5 个月前
config.json
支持左侧截断-修复重新提交 Co-authored-by: shiqiangA<shiqiang15@huawei.com> # message auto-generated for no-merge-commit merge:
!541
merge dev_commit into dev 支持左侧截断-修复重新提交 Created-by: shiqiangA Commit-by: shiqiangA Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20251225 --> # 合入背景 > 请描述为什么要做这个PR内的改动。\ > 如涉及,请关联前序PR或同特性/需求下的其他PR。\ > 如果是修复之前PR引入的问题,请关联引入问题的PR。\ > 注意:
Fixes #ISSUE ID
会自动关闭issue,如问题部分解决请不要使用
Fixes
,可以用
Fix part of #ISSUE ID
替代. #[252]
https://gitcode.com/Ascend/MindIE-LLM/issues/252
# 修改内容 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列。\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容)。 配置参数truncation支持左侧截断 # 资料变更 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及”。 # 接口变更 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及”。 # 测试结果 > 请说明测试场景,测试方法以及测试结果。\ > 测试用例设计时需考虑硬件、部署方式、功能、性能、精度、显存等维度。 # CheckList > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x]。 - [ ] 代码注释完备 - [ ] 正确记录错误日志 - [ ] 进行了返回值校验 (禁止使用void屏蔽安全函数、自研函数返回值;考虑接口的异常场景;调用底层组件接口时,需要进行返回值校验) - [ ] 进行了空指针校验 - [ ] 若存在资源申请,使用后资源被正确的释放了 - [ ] 若涉及多线程场景,考虑了并发场景,不存在死锁问题 - [ ] 按照[代码仓中提供的格式模板](
https://gitcode.com/Ascend/MindIE-LLM/blob/master/.clang-format),使用clang-format工具格式化代码
- [ ] 符合Ascend社区的编码规范。[C++ 语言编程指导](
https://gitcode.com/Ascend/community/blob/master/docs/contributor/Ascend-cpp-coding-style-guide.md)
| [C++ 语言安全编程指导](
https://gitcode.com/Ascend/community/blob/master/docs/contributor/Ascend-cpp-secure-coding-guide.md)
See merge request: Ascend/MindIE-LLM
!541
2 个月前
src_common_utils_test.cpp
修复mindie-llm whl包服务拉起失败问题 Co-authored-by: 周天扬<zhoutianyang@huawei.com> # message auto-generated for no-merge-commit merge:
!930
merge dev_run_pkg into dev 修复mindie-llm whl包服务拉起失败问题 Created-by: hw-zhoutianyang Commit-by: 周天扬 Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20251225 --> # 合入背景 > 请描述为什么要做这个PR内的改动。\ > 如涉及,请关联前序PR或同特性/需求下的其他PR。\ > 如果是修复之前PR引入的问题,请关联引入问题的PR。\ > 注意:
Fixes #ISSUE ID
会自动关闭issue,如问题部分解决请不要使用
Fixes
,可以用
Fix part of #ISSUE ID
替代. Fixes [
#540
](
https://gitcode.com/Ascend/MindIE-LLM/issues/540)
# 修改内容 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列。\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容)。 修复mindie-llm whl包服务拉起失败问题,GetMindieLlmHomePath返回引用改为对象 # 资料变更 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及”。 不涉及 # 接口变更 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及”。 不涉及 # 测试结果 > 请说明测试场景,测试方法以及测试结果。\ > 测试用例设计时需考虑硬件、部署方式、功能、性能、精度、显存等维度。 服务拉起成功:  请求推理成功:  # CheckList > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x]。 - [x] 代码注释完备 - [x] 正确记录错误日志 - [x] 进行了返回值校验 (禁止使用void屏蔽安全函数、自研函数返回值;考虑接口的异常场景;调用底层组件接口时,需要进行返回值校验) - [x] 进行了空指针校验 - [x] 若存在资源申请,使用后资源被正确的释放了 - [x] 若涉及多线程场景,考虑了并发场景,不存在死锁问题 - [x] 按照[代码仓中提供的格式模板](
https://gitcode.com/Ascend/MindIE-LLM/blob/master/.clang-format),使用clang-format工具格式化代码
- [x] 符合Ascend社区的编码规范。[C++ 语言编程指导](
https://gitcode.com/Ascend/community/blob/master/docs/contributor/Ascend-cpp-coding-style-guide.md)
| [C++ 语言安全编程指导](
https://gitcode.com/Ascend/community/blob/master/docs/contributor/Ascend-cpp-secure-coding-guide.md)
See merge request: Ascend/MindIE-LLM
!930
1 个月前
src_file_utils_test.cpp
[dev]Synchronize code Co-authored-by: forcekeng<gengli8@huawei.com>
5 个月前
test_log.cpp
[dev]Synchronize code Co-authored-by: forcekeng<gengli8@huawei.com>
5 个月前
test_log_config.cpp
[dev]Synchronize code Co-authored-by: forcekeng<gengli8@huawei.com> # message auto-generated for no-merge-commit merge:
!7
merge dev into dev [dev]Synchronize code Created-by: forcekeng Commit-by: forcekeng Merged-by: ascend-robot Description: [dev]Synchronize code See merge request: Ascend/MindIE-LLM
!7
5 个月前
test_log_utils.cpp
[dev]Synchronize code Co-authored-by: forcekeng<gengli8@huawei.com>
5 个月前
test_pid_manage.cpp
重试Tokenizer子进程拉起时,Daemon忽略齐17信号量 Co-authored-by: wenjinhust<wenjin.sh@huawei.com> # message auto-generated for no-merge-commit merge:
!923
merge dev2604/tokenizer_timeout/0420 into dev 重试Tokenizer子进程拉起时,Daemon忽略齐17信号量 Created-by: wenjinhust Commit-by: wenjinhust Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20251225 --> # 合入背景 > 请描述为什么要做这个PR内的改动。\ > 如涉及,请关联前序PR或同特性/需求下的其他PR。\ > 如果是修复之前PR引入的问题,请关联引入问题的PR。\ > 注意:
Fixes #ISSUE ID
会自动关闭issue,如问题部分解决请不要使用
Fixes
,可以用
Fix part of #ISSUE ID
替代. Fixes [
#225
](
https://gitcode.com/Ascend/MindIE-LLM/issues/225)
# 修改内容 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列。\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容)。 - 主动重启tokenizer子进程场景,daemon进程忽略收到的子进程17信号。 # 资料变更 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及”。 - 不涉及 # 接口变更 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及”。 - 不涉及 # 测试结果 > 请说明测试场景,测试方法以及测试结果。\ > 测试用例设计时需考虑硬件、部署方式、功能、性能、精度、显存等维度。 - 测试用例: 构造tokenizer拉起超时,预期重试3次,期间主进程不复位。 - 测试结果: 测试通过:构造tokenizer拉起超时,重试3次,期间主进程不复位。 ``` [2026-04-22 09:14:29.486906] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:635] [tokenizer] Start tokenizer with retry. [2026-04-22 09:14:29.486965] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:640] [tokenizer] Start tokenizer[0] [2026-04-22 09:14:29.486970] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:663] [tokenizer] Start tokenizer[0] try 0 [2026-04-22 09:14:29.490175] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:621] [tokenizer] Started tokenizer sub process with pid 10529 [2026-04-22 09:14:29.490208] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:537] [tokenizer] Create and wait process success, sub pid 10529 [2026-04-22 09:14:29,664] [10529] [281468775126016] [llm] [INFO] [tokenizer_log.py-25] : tokenizer-10529 start. [2026-04-22 09:14:29,738] [10529] [281468775126016] [llm] [INFO] [tokenizer_log.py-25] : tokenizer-10529 import ok. [2026-04-22 09:14:29,739] [10529] [281468775126016] [llm] [INFO] [tokenizer_log.py-25] : tokenizer-10529 init start. try sleep 20 [2026-04-22 09:14:49.490291] [9175] [9186] [server] [WARN] [infer_tokenizer.cpp:565] [MIE04E04061C] [tokenizer] Timeout, Failed to init tokenizer process [2026-04-22 09:14:49.490327] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:690] [tokenizer] Start tokenizer timeout, try to restart it, pid=10529 [2026-04-22 09:14:49.504824] [9175] [9186] [server] [WARN] [llm_daemon.cpp:226] [MIE04W01011A] [daemon] Received exit signal[17], Process 9175, Thread 281468775126016 [2026-04-22 09:14:49.504861] [9175] [9186] [server] [WARN] [llm_daemon.cpp:232] [MIE04W01011A] [daemon] Process 10529 exited [2026-04-22 09:14:49.504870] [9175] [9186] [server] [WARN] [llm_daemon.cpp:247] [MIE04E010109] [daemon] Process 10529 was terminated by signal 9 (Killed) [2026-04-22 09:14:49.504876] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:698] [tokenizer] Wait tokenizer to restart, pid=10529, wait 0 [2026-04-22 09:14:49.504881] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:701] [tokenizer] Restart tokenizer success, pid=10529 [2026-04-22 09:14:49.504886] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:663] [tokenizer] Start tokenizer[0] try 1 [2026-04-22 09:14:49.511773] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:621] [tokenizer] Started tokenizer sub process with pid 10594 [2026-04-22 09:14:49.511807] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:537] [tokenizer] Create and wait process success, sub pid 10594 [2026-04-22 09:14:49,660] [10594] [281468775126016] [llm] [INFO] [tokenizer_log.py-25] : tokenizer-10594 start. [2026-04-22 09:14:49,735] [10594] [281468775126016] [llm] [INFO] [tokenizer_log.py-25] : tokenizer-10594 import ok. [2026-04-22 09:14:49,735] [10594] [281468775126016] [llm] [INFO] [tokenizer_log.py-25] : tokenizer-10594 init start. try sleep 20 [2026-04-22 09:15:09.511889] [9175] [9186] [server] [WARN] [infer_tokenizer.cpp:565] [MIE04E04061C] [tokenizer] Timeout, Failed to init tokenizer process [2026-04-22 09:15:09.511915] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:690] [tokenizer] Start tokenizer timeout, try to restart it, pid=10594 [2026-04-22 09:15:09.525904] [9175] [9186] [server] [WARN] [llm_daemon.cpp:226] [MIE04W01011A] [daemon] Received exit signal[17], Process 9175, Thread 281468775126016 [2026-04-22 09:15:09.525941] [9175] [9186] [server] [WARN] [llm_daemon.cpp:232] [MIE04W01011A] [daemon] Process 10594 exited [2026-04-22 09:15:09.525950] [9175] [9186] [server] [WARN] [llm_daemon.cpp:247] [MIE04E010109] [daemon] Process 10594 was terminated by signal 9 (Killed) [2026-04-22 09:15:09.525956] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:698] [tokenizer] Wait tokenizer to restart, pid=10594, wait 0 [2026-04-22 09:15:09.525962] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:701] [tokenizer] Restart tokenizer success, pid=10594 [2026-04-22 09:15:09.525965] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:663] [tokenizer] Start tokenizer[0] try 2 [2026-04-22 09:15:09.533059] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:621] [tokenizer] Started tokenizer sub process with pid 10659 [2026-04-22 09:15:09.533100] [9175] [9186] [server] [INFO] [infer_tokenizer.cpp:537] [tokenizer] Create and wait process success, sub pid 10659 ``` # CheckList > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x]。 - [x] 代码注释完备 - [x] 正确记录错误日志 - [x] 进行了返回值校验 (禁止使用void屏蔽安全函数、自研函数返回值;考虑接口的异常场景;调用底层组件接口时,需要进行返回值校验) - [x] 进行了空指针校验 - [x] 若存在资源申请,使用后资源被正确的释放了 - [x] 若涉及多线程场景,考虑了并发场景,不存在死锁问题 - [x] 按照[代码仓中提供的格式模板](
https://gitcode.com/Ascend/MindIE-LLM/blob/master/.clang-format),使用clang-format工具格式化代码
- [x] 符合Ascend社区的编码规范。[C++ 语言编程指导](
https://gitcode.com/Ascend/community/blob/master/docs/contributor/Ascend-cpp-coding-style-guide.md)
| [C++ 语言安全编程指导](
https://gitcode.com/Ascend/community/blob/master/docs/contributor/Ascend-cpp-secure-coding-guide.md)
See merge request: Ascend/MindIE-LLM
!923
1 个月前
test_process_group.cpp
[dev]Synchronize code Co-authored-by: forcekeng<gengli8@huawei.com>
5 个月前
test_qps_tracker.cpp
[dev]Synchronize code Co-authored-by: forcekeng<gengli8@huawei.com>
5 个月前
test_safe.cpp
[Bugfix] 增加配置项:json嵌套层次限制 Co-authored-by: wenjinhust<wenjin.sh@huawei.com> # message auto-generated for no-merge-commit merge:
!491
merge dev2602/bugfix_json into dev [Bugfix] 增加配置项:json嵌套层次限制 Created-by: wenjinhust Commit-by: wenjinhust Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20251225 --> # 合入背景 > 请描述为什么要做这个PR内的改动。\ > 如涉及,请关联前序PR或同特性/需求下的其他PR。\ > 如果是修复之前PR引入的问题,请关联引入问题的PR。\ > 注意:
Fixes #ISSUE ID
会自动关闭issue,如问题部分解决请不要使用
Fixes
,可以用
Fix part of #ISSUE ID
替代. Fixes [
#258
](
https://gitcode.com/Ascend/MindIE-LLM/issues/258)
# 修改内容 > 请描述修改内容的具体实现,涉及哪些组件之间进行交互,可以用1、2、3、...进行罗列。\ > 如果是需求或者重构类的PR,需要补充详细设计文档(说明上下游组件关系、时序图、类图、DFX能力等内容)。 ``` 【会议时间】2026-3-3 17:00 【会议方式】线上会议 【与会人】陈波、邵圣珂、温劲、杨安 【议题2】json嵌套层次灵活方案 【议题背景】 MindIE 2.3.0安全送检,将json嵌套层次限制为10层。但在现网实际应用时发现客户对functioncall使用的json嵌套层次较深,对嵌套层次有灵活修改的诉求。 【议题结论】 在config.json中增加配置项,允许客户灵活修改。配置项名称定为maxJsonDepth ``` # 资料变更 > 请确认是否涉及资料变更。如涉及,需要在PR中体现,并简要说明修改内容。如不涉及,需填写“不涉及”。 - 需要增加配置项
maxJsonDepth
资料说明 # 接口变更 > 请确认是否涉及跨代码仓或者客户面可见的接口变更。如涉及,需要详细说明接口以及对应的变更内容,同时需要在资料中体现。如不涉及,需填写“不涉及”。 - 不涉及 # 测试结果 > 请说明测试场景,测试方法以及测试结果。\ > 测试用例设计时需考虑硬件、部署方式、功能、性能、精度、显存等维度。 【配置项测试】 | 测试用例 | 预期结果 | 测试结果 | | --------- | --------- | --------- | |
maxJsonDepth
未配置 | 正常启动,Json嵌套层次限制为10 | 通过 | |
maxJsonDepth
配置为合法边界值
10
| 正常启动,Json嵌套层次限制为10 | 通过 | |
maxJsonDepth
配置为合法边界值
100
| 正常启动,Json嵌套层次限制为100 | 通过 | |
maxJsonDepth
配置为非法边界值
9
| 启动失败 | 通过 | |
maxJsonDepth
配置为非法边界值
101
| 启动失败 | 通过 | |
maxJsonDepth
配置为非法值
-1
| 启动失败 | 通过 | 【Json报文测试】 -
maxJsonDepth
未配置 | 测试用例 | 预期结果 | 测试结果 | | --------- | --------- | --------- | | Json嵌套层次<10 | 正常响应,无错误日志 | 通过 | | Json嵌套层次=10 | 正常响应,无错误日志 | 通过 | | Json嵌套层次>10 | 正常响应,有错误日志 | 通过 | -
maxJsonDepth
配置为默认值
10
| 测试用例 | 预期结果 | 测试结果 | | --------- | --------- | --------- | | Json嵌套层次<10 | 正常响应,无错误日志 | 通过 | | Json嵌套层次=10 | 正常响应,无错误日志 | 通过 | | Json嵌套层次>10 | 正常响应,有错误日志 | 通过 | -
maxJsonDepth
配置为合法值
20
| 测试用例 | 预期结果 | 测试结果 | | --------- | --------- | --------- | | Json嵌套层次<20 | 正常响应,无错误日志 | 通过 | | Json嵌套层次=20 | 正常响应,无错误日志 | 通过 | | Json嵌套层次>20 | 正常响应,有错误日志 | 通过 | # CheckList > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x]。 - [x] 代码注释完备 - [x] 正确记录错误日志 - [x] 进行了返回值校验 (禁止使用void屏蔽安全函数、自研函数返回值;考虑接口的异常场景;调用底层组件接口时,需要进行返回值校验) - [x] 进行了空指针校验 - [x] 若存在资源申请,使用后资源被正确的释放了 - [x] 若涉及多线程场景,考虑了并发场景,不存在死锁问题 - [x] 按照[代码仓中提供的格式模板](
https://gitcode.com/Ascend/MindIE-LLM/blob/master/.clang-format),使用clang-format工具格式化代码
- [x] 符合Ascend社区的编码规范。[C++ 语言编程指导](
https://gitcode.com/Ascend/community/blob/master/docs/contributor/Ascend-cpp-coding-style-guide.md)
| [C++ 语言安全编程指导](
https://gitcode.com/Ascend/community/blob/master/docs/contributor/Ascend-cpp-secure-coding-guide.md)
See merge request: Ascend/MindIE-LLM
!491
2 个月前
test_thread_group_cc.cpp
[dev]Synchronize code Co-authored-by: forcekeng<gengli8@huawei.com>
5 个月前