RAG SDK运行说明

环境准备(容器化部署)

需按以下顺序完成依赖服务部署，确保各服务可正常通信：

部署RAG SDK（参考链接）
部署LLM服务，（推荐模型：qwen2.5-32b-instruct，参考链接）
部署Milvus服务（支持v2.5.0及以上版本，参考链接）
部署mis-tei embedding与reranker服务（参考链接）
部署OCR服务（推荐模型：MinerU2.5-2509-1.2B，部署参考链接）
图文并茂回答支持（可选）：
若需解析docx、pdf文件中的图片并生成图文回答，需额外部署VLM模型服务（推荐模型：qwen2.5-vl-7b-instruct，参考链接）。

注：长或宽小于256像素的图片因信息不足，将被自动丢弃。

在ragsdk容器中，打开样例代码目录：

cd /opt/package/mindsdk-referenceapps/RAGSDK/MainRepo/Samples/chat_with_ascend/

容器内代码可能未同步至最新版本，建议从代码仓库拉取最新版本以确保一致性

执行以下命令启动Streamlit服务，替换服务端口为实际可用端口（如8501）：

streamlit run app.py --server.address "127.0.0.1" --server.port 服务端口

安全提示：示例为简单部署，生产环境需开启HTTPS安全认证以保障服务安全。

配置文件说明：代码运行之后，会自动生成参数配置文件，默认保存在/home/HwHiAiUser/workspace/config.json，可在app.py中进行修改

在PC浏览器中输入地址访问：http://服务IP:服务端口
进入界面后，即可完成参数配置、文档上传、删除、问答等操作。