实战dify-1.3.1外接ragflow知识库
dify连接ragflow知识库
·
1.背景介绍
在Dify中连接ragflow知识库。
2.前置条件
2.1 部署RAGFlow
2.2 部署Dify
2.3 安装Ollama
2.4 本地化部署LLM、Embedding、Rerank模型
2.4.1Embedding模型推荐

3.1 配置模型
基于RAGFlow创建本地知识库,需要先配置LLM模型和Embedding模型。
3.2 创建知识库


3.2.1 配置说明
PDF解析器
- DeepDoc
基于深度文档理解(DeepDoc)进行构建的文档处理引擎。 - Naive
将文档解析拆分为布局分析、内容提取、关系整合等独立阶段,依赖规则引擎逐步处理结构化/非结构化文档。结合传统关键词检索(如 TF-IDF、BM25)与外部知识库增强生成结果,常用于基础文档解析与信息整合场景。
切片方法
- General
支持的文件格式为DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML、HTML。系统使用视觉检测模型将连续文本分割成多个片段,连续的片段被合并成Token数不超过“Token数”的块。 - Q&A
支持 excel 和 csv及txt 文件格式,如果文件是 excel 格式,则应由两个列组成且没有标题:一列提出问题,另一列用于答案。如果文件是 csv/txt 格式 以 UTF-8 编码且用 TAB 作分开问题和答案的定界符。 - Table
支持XLSX和CSV/TXT格式文件。对于 csv 或 txt 文件,列之间的分隔符为 TAB。第一行必须是列标题。
建议文本块大小大小
根据预料及应用场景,设置合适的大小。
文本分段标识符
通常设置中英文分段标识符,如常见的\n!?;.!?;。等
3.3 获取RAGFlow接口秘钥及知识库ID
3.3.1 创建RAGFlow接口秘钥


3.3.2知识库ID
打开创建的知识库,知识库ID就包含在跳转页的URL地址中,如图所示,复制id后的字符串。
4.Dify配置
4.1 添加外部知识库 API


添加外部知识库API需要添加三个参数
-
Name
知识库的名称,可自定义
API Endpoint
API组成结构:http://{主机IP地址}:{RAGFlow端口}/api/v1/dify
API Key
RAGFlow创建的API秘钥,请参考本文3.3.1 节内容。
4.2接入外部知识库


在dify中添加外部知识库成功
更多推荐




所有评论(0)