RAG SDK是昇腾面向大语言模型的知识增强开发套件,为解决大模型知识更新缓慢以及垂直领域知识回答弱的问题,面向大模型知识库提供垂域调优、生成增强、知识管理等特性,帮助用户搭建专属的高性能、准确度高的大模型问答系统
RAG SDK
✨ 最新消息
🔹 [2026.04.25]:RAG SDK 26.0.0 Release 版本发布
🔹 [2025.12.30]:RAG SDK 开源发布
ℹ️ 简介
RAG SDK 是昇腾面向大语言模型的知识检索增强开发套件,为解决大模型知识更新缓慢以及垂直领域知识回答弱的问题,提供多模态文档解析、知识库管理、垂域调优、生成增强等能力,帮助用户快速构建基于昇腾平台的高性能、准确度高的大模型问答系统,降低大模型应用开发门槛,支持对接开源生态。
⚙️ 功能介绍
RAG SDK 提供以下核心模块:
| 类别 | 模块 | 功能简介 |
|---|---|---|
| 知识管理 | 文档解析与切分 | 支持文档、表格、图片等多种类型文件的解析、切分与管理 |
| 向量化 | Embedding | 调用向量化模型对文本进行向量编码,支持本地部署和服务化部署 |
| 检索 | Retrieval | 基于昇腾 NPU 异构检索加速框架,提供高性能向量检索 |
| 排序 | Reranker | 对检索结果进行精排,提高检索质量 |
| 缓存 | Cache | 支持完全一致缓存和语义相似缓存,加速 RAG 应用 |
| 知识图谱 | GraphRag | 一种结构化的、分层的检索增强生成(RAG)方法 |
具体功能特性及使用指南参考用户指南对应章节。
🚀 快速入门
RAG SDK提供了一个简单的样例,帮助用户快速体验运用RAG SDK进行知识检索增强的流程。详情可参考快速入门。
📦 安装指南
支持容器内和物理机内部署安装RAG SDK,详细的安装部署说明请参见《安装部署》。
📘 使用指南
RAG SDK的使用指南请参阅完整文档导航 RAG SDK 开发者文档。
🛠️ 贡献指南
欢迎参与项目贡献,贡献流程和规范请参见《贡献指南》。
⚖️ 相关说明
🔹 《版本说明》
🔹 《许可证声明》
🔹 《安全声明》
🔹 《免责声明》
🤝 建议与交流
如您在使用或参与过程中有任何问题与想法,可通过以下渠道与我们沟通、提交反馈或加入社区交流。
| 资源 | 说明 |
|---|---|
| FAQ | 常见问题解答与使用答疑 |
| 创建Issue | 提交 Bug、需求或建议 |
| 社区任务 | 查看和认领社区任务 |
| 会议日历 | 社区定期例会与活动日程 |