知识库管理
知识库是openJiuwen平台进行本地知识管理的重要方式,用户可以通过管理本地知识库增强智能体知识检索RAG能力。
知识库类型
openJiuwen 支持多种知识库类型:
| 类型 | 说明 |
|---|---|
| 文档型 | 通过上传本地文件(如 PDF、Word、TXT 等)构建知识库 |
| 网页链接型 | 通过添加网页 URL(如普通网页、微信公众号文章等)构建知识库 |
创建知识库时需选择类型,创建后不可更改。
创建知识库
前提条件
在模型管理模块的Embedding模型分页配置了可用的模型。如何配置Embedding模型请参考模型管理相关章节。
操作步骤
-
登录openJiuwen平台。
-
进入平台左侧导航栏的知识库管理模块。
-
单击 创建知识库 按钮。

-
在创建知识库弹窗中:
- 输入知识库名称与描述(可选)
- 选择知识库类型:文档型 或 网页链接型
- 在Embedding模型下拉选择一个模型(注意:知识库构建后 Embedding 模型不可更改)
- 点击创建

-
文档型知识库:在创建完毕的知识库名片,点击编辑按钮。

-
在编辑知识库页面,点击添加文档。

-
在添加文档弹窗中,通过拖拽或者点击选择文件选择想要上传到知识库的文件(支持选择多个文件)后,点击下一步。

-
在文档参数界面,配置文档解析和索引参数后,点击下一步。

文档参数配置说明如下:
参数名称 描述 配置说明 解析策略 控制文档的解析方式 - 快速解析:使用默认解析策略快速处理文档,适合大多数场景
- 注意:当前仅支持快速解析模式分段策略 控制文档文本的分段方式 - 自动分段与清洗:系统自动进行文本分段和清洗,适合大多数场景
- 自定义:手动配置分段参数,可精确控制分段效果
- 注意:选择"自定义"后,需要配置子参数最大Token数与分段重叠百分比最大Token数 单个分段的最大Token数量(子参数) - 作用:控制每个文本分段的长度
- 范围:16-1024
- 默认值:512
- 显示条件:仅在分段策略选择"自定义"时显示
- 建议:根据文档类型和检索需求设置,过小可能丢失上下文,过大可能影响检索精度分段重叠百分比 相邻分段之间的重叠比例(子参数) - 作用:控制分段之间的重叠程度,保持上下文连贯性
- 范围:0-50
- 默认值:10
- 显示条件:仅在分段策略选择"自定义"时显示
- 建议:通常设置为 10-20,可根据文档特点调整文档图构建 是否构建文档图 - 作用:启用后可以构建文档图索引,提升复杂关系检索效果
- 注意:启用文档图会增加索引构建时间以及消耗额外的大模型Token
- 注意:启用后,需要配置子参数LLM模型LLM模型 用于文档图构建的大语言模型(子参数) - 作用:文档图索引构建过程中用于提取实体和关系的模型
- 显示条件:仅在启用文档图构建时显示此参数,且必须选择
- 建议:选择性能稳定、支持长文本的模型 -
之后文档会逐个进行处理,可以点击刷新状态来获取文档最新状态,同时页面会自动刷新文档状态,可以通过停止自动刷新文档状态取消自动刷新。

-
索引完毕的文档会显示已索引,启用了文档图构建索引的文档会带有图增强标签,未启用则不带。如果仍需要上传文档,可以通过右上角的添加文档继续操作。

网页链接型知识库
网页链接型知识库支持通过添加网页 URL 构建知识库,适用于普通网页、微信公众号文章等在线内容。系统会抓取网页内容并进行解析、分段和索引构建,供智能体检索使用。
创建网页链接型知识库
-
登录 openJiuwen 平台,进入知识库管理模块。
-
单击 创建知识库 按钮。
-
在创建知识库弹窗中:
- 输入知识库名称与描述(可选)
- 选择知识库类型为 网页链接
- 选择 Embedding模型
- 点击创建
-
在创建完毕的知识库卡片上,点击编辑按钮进入编辑页面。
添加网页链接
-
在编辑知识库页面,点击 添加链接 按钮。
-
在“添加网页链接”弹窗中,每行输入一个 URL,支持 http:// 和 https:// 链接(如普通网页、微信公众号文章等)。
- 格式要求:URL 需以
http://或https://开头 - 数量限制:单次最多添加 50 个 URL
- 输入完成后点击 添加并下一步
- 格式要求:URL 需以
-
在“链接参数”界面配置解析和索引参数,点击完成开始处理。
参数名称 描述 配置说明 解析策略 控制网页的解析方式 - 快速解析:使用默认解析策略快速处理网页,适合大多数场景
- 注意:当前仅支持快速解析模式分段策略 控制文本的分段方式 - 自动分段与清洗:系统自动进行文本分段和清洗,适合大多数场景
- 自定义:手动配置分段参数,需配置最大Token数与分段重叠百分比最大Token数 单个分段的最大Token数量(子参数) - 范围:16-1024
- 默认值:512分段重叠百分比 相邻分段之间的重叠比例(子参数) - 范围:0-50
- 默认值:10文档图构建 是否构建文档图 - 作用:启用后可构建文档图索引,提升复杂关系检索效果
- 注意:启用文档图会增加索引构建时间以及消耗额外的大模型 Token
- 注意:启用后需选择 LLM 模型LLM模型 用于文档图构建的大语言模型(子参数) - 作用:文档图索引构建过程中用于提取实体和关系的模型
- 显示条件:仅在启用文档图构建时显示,且必须选择 -
链接会逐个进行处理。可以点击刷新状态获取最新状态,页面也会自动刷新。可通过停止自动刷新链接状态取消自动刷新。
-
索引完毕的链接会显示已索引,启用了文档图构建的链接会带有图增强标签。若需继续添加,可点击 添加链接 继续操作。
管理链接
- 重命名:在链接列表中点击链接名称可进行编辑。
- 删除:可单选或多选链接后进行删除。
- 刷新:点击刷新可更新单个链接状态;点击全部刷新可批量更新。首次加载或刷新时会尝试从 URL 解析网页标题并更新链接名称。
注意事项
- 网页链接型知识库创建后类型不可更改。
- 确保目标 URL 可公开访问,否则可能无法抓取内容。
- 微信公众号文章等需在浏览器中可正常打开,系统会按网页方式解析。
- 链接处理为异步执行,处理时间取决于网页大小和复杂度。