1.背景介绍

在Dify中连接ragflow知识库。

2.前置条件

2.1 部署RAGFlow

2.2 部署Dify

2.3 安装Ollama

2.4 本地化部署LLM、Embedding、Rerank模型

2.4.1Embedding模型推荐

embed模型推荐

3.1 配置模型

基于RAGFlow创建本地知识库,需要先配置LLM模型和Embedding模型。
ragflow配置模型

3.2 创建知识库

创建知识库

知识库配置

3.2.1 配置说明

PDF解析器
  • DeepDoc
    基于深度文档理解(DeepDoc)进行构建的文档处理引擎。
  • Naive
    将文档解析拆分为布局分析、内容提取、关系整合等独立阶段,依赖规则引擎逐步处理结构化/非结构化文档‌。结合传统关键词检索(如 TF-IDF、BM25)与外部知识库增强生成结果,常用于基础文档解析与信息整合场景‌。
切片方法
  • General
    支持的文件格式为DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML、HTML。系统使用视觉检测模型将连续文本分割成多个片段,连续的片段被合并成Token数不超过“Token数”的块。
  • Q&A
    支持 excel 和 csv及txt 文件格式,如果文件是 excel 格式,则应由两个列组成且没有标题:一列提出问题,另一列用于答案。如果文件是 csv/txt 格式 以 UTF-8 编码且用 TAB 作分开问题和答案的定界符。
  • Table
    支持XLSX和CSV/TXT格式文件。对于 csv 或 txt 文件,列之间的分隔符为 TAB。第一行必须是列标题。
建议文本块大小大小

根据预料及应用场景,设置合适的大小。

文本分段标识符

通常设置中英文分段标识符,如常见的\n!?;.!?;。等

3.3 获取RAGFlow接口秘钥及知识库ID

3.3.1 创建RAGFlow接口秘钥

ragflow秘钥
秘钥

3.3.2知识库ID

打开创建的知识库,知识库ID就包含在跳转页的URL地址中,如图所示,复制id后的字符串。
知识库ID

4.Dify配置

4.1 添加外部知识库 API

dify2
dify3
添加外部知识库API需要添加三个参数

  • Name

    知识库的名称,可自定义

API Endpoint

API组成结构:http://{主机IP地址}:{RAGFlow端口}/api/v1/dify

API Key

RAGFlow创建的API秘钥,请参考本文3.3.1 节内容。

4.2接入外部知识库

dify1
dify4

在dify中添加外部知识库成功
dify5

Logo

一站式 AI 云服务平台

更多推荐