RAG SDK是昇腾面向大语言模型的知识增强开发套件,为解决大模型知识更新缓慢以及垂直领域知识回答弱的问题,面向大模型知识库提供垂域调优、生成增强、知识管理等特性,帮助用户搭建专属的高性能、准确度高的大模型问答系统
| 文件 | 最后提交记录 | 最后更新时间 |
|---|
| 更新PR模板 Co-authored-by: yihao1234<yihao6@huawei.com> | 1 个月前 |
| 【RAGSDK资料易用性整改】issues/75 Co-authored-by: deepSeekya<chenzhihan6@huawei.com> | 30 天前 |
| [rag资料易用性修改] 修复user_guide.md中的跳转链接、样例说明,修复所有文件中出现的MINDIE相关内容 Co-authored-by: deepSeekya<chenzhihan6@huawei.com> | 8 天前 |
| [docs]调整标题层级显示 Co-authored-by: YYTYY_<yanyuting6@h-partners.com> | 3 天前 |
| docs: add education math rag best practice demo Co-authored-by: Iroha-P<swm993934025@gmail.com> | 11 小时前 |
| 增加cache 初始化失败日志打印 Co-authored-by: printSSS<wangting287@h-partners.com> | 16 天前 |
| RAGSDK仓库初始化 | 5 个月前 |
| 修改precommit Co-authored-by: wangyongjun<wangyongjun7@huawei.com> | 1 个月前 |
| 【RAGSDK资料易用性整改】issues/75 Co-authored-by: deepSeekya<chenzhihan6@huawei.com> | 30 天前 |
| 【RAG资料易用性修改】将test/python目录命名修改为test/unit_tests Co-authored-by: deepSeekya<chenzhihan6@huawei.com> | 23 天前 |
| mineru-accelerate Co-authored-by: printSSS<wangting287@h-partners.com> | 21 天前 |
| RAGSDK仓库初始化 | 5 个月前 |
| RAGSDK仓库初始化,补充build | 5 个月前 |
| ADD AGREEMENT Co-authored-by: printSSS<wangting287@h-partners.com> | 1 个月前 |
| 修改资料审视提出的修改意见 Co-authored-by: deepSeekya<chenzhihan6@huawei.com> | 21 天前 |
| RAGSDK仓库初始化 | 5 个月前 |
| 修改资料审视提出的修改意见 Co-authored-by: deepSeekya<chenzhihan6@huawei.com> | 21 天前 |
| ADD demo Co-authored-by: printSSS<wangting287@h-partners.com> | 1 个月前 |
| 适配构建包包含whl Co-authored-by: wangyongjun<wangyongjun7@huawei.com> | 1 个月前 |
RAG SDK
✨ 最新消息
🔹 [2026.04.25]:RAG SDK 26.0.0 Release 版本发布
🔹 [2025.12.30]:RAG SDK 开源发布
ℹ️ 简介
RAG SDK 是昇腾面向大语言模型的知识检索增强开发套件,为解决大模型知识更新缓慢以及垂直领域知识回答弱的问题,提供多模态文档解析、知识库管理、垂域调优、生成增强等能力,帮助用户快速构建基于昇腾平台的高性能、准确度高的大模型问答系统,降低大模型应用开发门槛,支持对接开源生态。

⚙️ 功能介绍
RAG SDK 提供以下核心模块:
| 类别 |
模块 |
功能简介 |
| 知识管理 |
文档解析与切分 |
支持文档、表格、图片等多种类型文件的解析、切分与管理 |
| 向量化 |
Embedding |
调用向量化模型对文本进行向量编码,支持本地部署和服务化部署 |
| 检索 |
Retrieval |
基于昇腾 NPU 异构检索加速框架,提供高性能向量检索 |
| 排序 |
Reranker |
对检索结果进行精排,提高检索质量 |
| 缓存 |
Cache |
支持完全一致缓存和语义相似缓存,加速 RAG 应用 |
| 知识图谱 |
GraphRag |
一种结构化的、分层的检索增强生成(RAG)方法 |
具体功能特性及使用指南参考用户指南对应章节。
🚀 快速入门
RAG SDK提供了一个简单的样例,帮助用户快速体验运用RAG SDK进行知识检索增强的流程。详情可参考快速入门。
📦 安装指南
支持容器内和物理机内部署安装RAG SDK,详细的安装部署说明请参见《安装部署》。
📘 使用指南
RAG SDK的使用指南请参阅完整文档导航 RAG SDK 开发者文档。
🛠️ 贡献指南
欢迎参与项目贡献,贡献流程和规范请参见《贡献指南》。
⚖️ 相关说明
🔹 《版本说明》
🔹 《许可证声明》
🔹 《安全声明》
🔹 《免责声明》
🤝 建议与交流
如您在使用或参与过程中有任何问题与想法,可通过以下渠道与我们沟通、提交反馈或加入社区交流。
RAG SDK是昇腾面向大语言模型的知识增强开发套件,为解决大模型知识更新缓慢以及垂直领域知识回答弱的问题,面向大模型知识库提供垂域调优、生成增强、知识管理等特性,帮助用户搭建专属的高性能、准确度高的大模型问答系统
定制我的领域