RAGSDK:基于昇腾生态的大语言模型知识增强开发套件

RAG SDK是昇腾面向大语言模型的知识增强开发套件,为解决大模型知识更新缓慢以及垂直领域知识回答弱的问题,面向大模型知识库提供垂域调优、生成增强、知识管理等特性,帮助用户搭建专属的高性能、准确度高的大模型问答系统

分支4Tags1

RAG SDK

昇腾面向大语言模型的知识检索增强开发套件

Ascend License Zread DeepWiki

✨ 最新消息

🔹 [2026.04.25]RAG SDK 26.0.0 Release 版本发布

🔹 [2025.12.30]:RAG SDK 开源发布

ℹ️ 简介

RAG SDK 是昇腾面向大语言模型的知识检索增强开发套件,为解决大模型知识更新缓慢以及垂直领域知识回答弱的问题,提供多模态文档解析、知识库管理、垂域调优、生成增强等能力,帮助用户快速构建基于昇腾平台的高性能、准确度高的大模型问答系统,降低大模型应用开发门槛,支持对接开源生态。

⚙️ 功能介绍

RAG SDK 提供以下核心模块:

类别 模块 功能简介
知识管理 文档解析与切分 支持文档、表格、图片等多种类型文件的解析、切分与管理
向量化 Embedding 调用向量化模型对文本进行向量编码,支持本地部署和服务化部署
检索 Retrieval 基于昇腾 NPU 异构检索加速框架,提供高性能向量检索
排序 Reranker 对检索结果进行精排,提高检索质量
缓存 Cache 支持完全一致缓存和语义相似缓存,加速 RAG 应用
知识图谱 GraphRag 一种结构化的、分层的检索增强生成(RAG)方法

具体功能特性及使用指南参考用户指南对应章节。

🚀 快速入门

RAG SDK提供了一个简单的样例,帮助用户快速体验运用RAG SDK进行知识检索增强的流程。详情可参考快速入门

📦 安装指南

支持容器内和物理机内部署安装RAG SDK,详细的安装部署说明请参见《安装部署》。

📘 使用指南

RAG SDK的使用指南请参阅完整文档导航 RAG SDK 开发者文档

🛠️ 贡献指南

欢迎参与项目贡献,贡献流程和规范请参见《贡献指南》。

⚖️ 相关说明

🔹 《版本说明
🔹 《许可证声明
🔹 《安全声明
🔹 《免责声明

🤝 建议与交流

如您在使用或参与过程中有任何问题与想法,可通过以下渠道与我们沟通、提交反馈或加入社区交流。

资源 说明
FAQ 常见问题解答与使用答疑
创建Issue 提交 Bug、需求或建议
社区任务 查看和认领社区任务
会议日历 社区定期例会与活动日程

项目介绍

RAG SDK是昇腾面向大语言模型的知识增强开发套件,为解决大模型知识更新缓慢以及垂直领域知识回答弱的问题,面向大模型知识库提供垂域调优、生成增强、知识管理等特性,帮助用户搭建专属的高性能、准确度高的大模型问答系统

定制我的领域