| [新需求]: CPP组图atb graph:基于新的权重加载方式支持multi lora,动态lora
Co-authored-by: zch777<zhuangchenghao@huawei.com>
# message auto-generated for no-merge-commit merge:
!142 merge local_dev into dev
[新需求]: CPP组图atb graph:基于新的权重加载方式支持multi lora,动态lora
Created-by: zch777
Commit-by: zch777
Merged-by: ascend-robot
Description: <!--
PR描述模板更新日期:20251225
-->
# 合入背景
[新需求]: CPP组图atb graph:基于新的权重加载方式支持multi lora,动态lora
Fixes #92
# 修改内容
CPP组图atb graph:基于新的权重加载方式支持multi lora,动态lora
1)新增mindie_llm/runtime/lora目录,新增
mindie_llm/runtime/lora/lora_layers.py, mindie_llm/runtime/lora/lora_manager.py, mindie_llm/runtime/lora/utils.py文件用于承载loralayer类,loramanager类。
2)新增mindie_llm/runtime/config/lora_config.py文件,用于承载loraconfig类。
3)新增mindie_llm/runtime/utils/singleton.py文件,用于承载singleton类。
4)新增examples/atb_models/atb_llm/utils/data/lora_adapter.py文件,用于承载loralayer和loramanager对接atb_graph的适配器类。
# 资料变更
不涉及
# 接口变更
不涉及
# 测试结果
1、Qwen2.5-7B Instruct模型,测试CPP组图atb graph的multi lora特性,功能跑通无报错,且精度和性能达标,动态加载卸载lora功能正常。
# CheckList
> PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x]。
- [ ] 代码注释完备
- [x] 正确记录错误日志
- [x] 进行了返回值校验 (禁止使用void屏蔽安全函数、自研函数返回值;考虑接口的异常场景;调用底层组件接口时,需要进行返回值校验)
- [x] 进行了空指针校验
- [x] 若存在资源申请,使用后资源被正确的释放了
- [ ] 若涉及多线程场景,考虑了并发场景,不存在死锁问题
- [x] 按照[代码仓中提供的格式模板](https://gitcode.com/Ascend/MindIE-LLM/blob/master/.clang-format),使用clang-format工具格式化代码
- [ ] 符合Ascend社区的编码规范。[C++ 语言编程指导](https://gitcode.com/Ascend/community/blob/master/docs/contributor/Ascend-cpp-coding-style-guide.md) | [C++ 语言安全编程指导](https://gitcode.com/Ascend/community/blob/master/docs/contributor/Ascend-cpp-secure-coding-guide.md)
See merge request: Ascend/MindIE-LLM!142 | 4 个月前 |