RAG SDK运行说明
环境准备(容器化部署)
需按以下顺序完成依赖服务部署,确保各服务可正常通信:
- 部署RAG SDK(参考链接)
- 部署LLM服务,(推荐模型:qwen2.5-32b-instruct,参考链接)
- 部署Milvus服务(支持v2.5.0及以上版本,参考链接)
- 部署mis-tei embedding与reranker服务(参考链接)
- 部署OCR服务(推荐模型:MinerU2.5-2509-1.2B,部署参考链接)
- 图文并茂回答支持(可选):
若需解析docx、pdf文件中的图片并生成图文回答,需额外部署VLM模型服务(推荐模型:qwen2.5-vl-7b-instruct,参考链接)。注:长或宽小于256像素的图片因信息不足,将被自动丢弃。
运行Demo步骤
1. 容器内环境准备
在ragsdk容器中,打开样例代码目录:
cd /opt/package/mindsdk-referenceapps/RAGSDK/MainRepo/Samples/chat_with_ascend/
容器内代码可能未同步至最新版本,建议从代码仓库拉取最新版本以确保一致性
2. 启动WEB服务
执行以下命令启动Streamlit服务,替换服务端口为实际可用端口(如8501):
streamlit run app.py --server.address "127.0.0.1" --server.port 服务端口
安全提示:示例为简单部署,生产环境需开启HTTPS安全认证以保障服务安全。
配置文件说明:代码运行之后,会自动生成参数配置文件,默认保存在/home/HwHiAiUser/workspace/config.json,可在app.py中进行修改
3. 访问与使用
在PC浏览器中输入地址访问:http://服务IP:服务端口
进入界面后,即可完成参数配置、文档上传、删除、问答等操作。
