零代码搭建 AI Agent Harness Engineering:5 个适合非技术人员的工具推荐
先别急着查论文里的复杂定义——把 AI Agent 想象成你身边的“全能小秘书”,但这个秘书是由大语言模型(LLMs)的大脑工具调用的手脚记忆链的心脏目标拆解的中枢神经组成的“程序人”。大脑(LLM 核心):负责理解人类指令、生成逻辑计划、处理文本/图像/音频等输入手脚(工具库):包括搜索浏览器、读取/编辑Excel/Word、调用API(比如外卖平台下单、企业CRM发消息)、画图/剪视频等“外部
零代码搭建 AI Agent Harness Engineering:5 个适合非技术人员的工具推荐
引言:从“魔法玩具”到“业务伙伴”,你离 AI Agent 落地只差一套“工程脚手架”
想象一下:你是一家线下生鲜连锁的运营主管,每天要处理20个社群里的3000+条消息、整理Excel里的库存预警和销售周报、对接3个第三方平台的优惠券投放——所有这些,都可以由一个24小时待命、从不抱怨、零失误率的“数字化运营助理”自动串联成闭环。这个助理,就是今天要聊的主角之一:AI Agent(智能体)。
核心概念1(本章前置锚点):什么是 AI Agent?
先别急着查论文里的复杂定义——把 AI Agent 想象成你身边的“全能小秘书”,但这个秘书是由 大语言模型(LLMs)的大脑 + 工具调用的手脚 + 记忆链的心脏 + 目标拆解的中枢神经 组成的“程序人”。
- 大脑(LLM 核心):负责理解人类指令、生成逻辑计划、处理文本/图像/音频等输入
- 手脚(工具库):包括搜索浏览器、读取/编辑Excel/Word、调用API(比如外卖平台下单、企业CRM发消息)、画图/剪视频等“外部动作”
- 心脏(记忆系统):短期记忆(记住你刚才说的“优惠券只能给复购3次以上的用户”)、长期记忆(记住用户上次买了什么、过敏史、喜欢的折扣时间)
- 中枢神经(目标-计划-执行-反思闭环):不会机械执行你的每一句话,而是先把“提升本月社群转化率10%”拆解成“先分析上月社群活跃时间→再调取复购3次以上的用户→再写3种不同时段的优惠券文案→再自动投放→最后统计转化率并生成调整建议”,如果中间出错(比如库存预警弹出来说优惠券对应的商品卖完了),还会自己调整计划。
这是不是比你单独用ChatGPT写文案、单独用Excel做统计要厉害10倍?但问题来了:90%以上的业务场景,都需要把AI Agent和你的业务系统、数据、工作流“缝合”起来——这就是所谓的“Harness Engineering(智能体工程化)”。过去,这个“缝合”工作需要程序员写几千行代码、调试几个月、还要懂LLM的API、懂LangChain这样的框架——但现在,我们有了零代码/低代码的Harness Engineering工具:非技术人员只要拖拖拽拽、写几句自然语言指令,就能在1小时内搭建出一个能用的业务AI Agent。
第1章:AI Agent Harness Engineering 全景图——搭积木还是建大厦?先搞懂底层逻辑
核心概念2:什么是 AI Agent Harness Engineering?
问题背景
你有没有遇到过这样的尴尬?
- 你让ChatGPT生成了一份完美的社群活动方案,但文案里的库存数据是上个月的、优惠券链接是失效的,你还要自己去Excel查数据、去美团/京东找新链接、去企业微信后台批量发消息——ChatGPT只是“帮你写了个开头”,剩下的90%的脏活累活,你还是要自己干;
- 你咬咬牙请了个程序员用LangChain搭了个AI社群助手,但程序员离职后,助手坏了没人修、你想加个“自动回复过敏咨询”的功能又要花3000块钱;
- 你试了几个所谓的“零代码AI工具”,但要么只能做“问答机器人”这种单一功能,要么没法连接你的企业微信/钉钉/CRM系统——还是个“玩具”。
这些尴尬的本质是什么?不是AI不够聪明,而是AI没有“落地的载体”,没有被“工程化”成能解决真实业务问题的闭环工具。AI Agent Harness Engineering,就是解决这个尴尬的钥匙:
官方定义:AI Agent Harness Engineering 是一套设计、开发、部署、监控、迭代AI Agent的方法论和工具集——核心目标是把LLMs的“通用智能”转化为“垂直领域的业务智能”,让AI Agent能稳定、安全、高效地融入企业的日常工作流。
生活化类比
让我用一个更直观的类比——搭建一套智能家居——来解释Harness Engineering的全过程:
- 需求分析(相当于业务问题拆解):你需要智能家居帮你做什么?比如“早上7点自动开窗帘、播放轻音乐、烧热水、烤面包,晚上10点自动关灯、关电视、锁门、拉窗帘”——这就是你的“业务目标”;
- 智能体选择(相当于AI Agent的大脑选型):你需要一个能“听懂”你指令、能“协调”各个设备的“中枢大脑”——比如小米小爱同学、Amazon Alexa、Google Home——这就相当于你选GPT-4o、Claude 3 Opus、Llama 3.1 70B作为AI Agent的LLM核心;
- 设备接入(相当于工具库和API对接):你需要把你的窗帘电机、智能音箱、热水器、面包机、智能门锁、电视都接入到中枢大脑——这就相当于你把企业微信、Excel、CRM、美团外卖、Google搜索都接入到Harness Engineering工具;
- 场景自动化配置(相当于目标-计划-执行-反思闭环配置):你不需要写代码,只需要在中枢大脑的APP里拖拖拽拽、设置触发条件和执行动作——比如“触发条件:手机闹钟响(或者早上7点整)→ 执行动作1:打开主卧窗帘50%→ 执行动作2:播放指定的轻音乐→ 执行动作3:打开热水器设定50度→ 执行动作4:打开面包机设定全麦模式→ 如果遇到异常(比如面包机里没有面包),就给你的手机发通知”——这就相当于你在Harness Engineering工具里配置“触发条件:有人在社群里问‘有没有适合过敏体质的水果’→ 执行动作1:调取企业CRM里的用户过敏史→ 执行动作2:调取Excel里的今日库存水果(不含过敏原)→ 执行动作3:生成个性化的推荐文案→ 执行动作4:自动回复社群→ 如果库存里没有适合的水果,就给你发微信提醒”;
- 监控与迭代(相当于AI Agent的运维与优化):你可以在APP里查看智能家居的运行状态——比如“今天早上7点整,所有设备都正常运行”——如果窗帘电机坏了,APP会给你发通知,你可以自己换个电机或者请人修;你还可以根据自己的习惯调整场景——比如“最近天气热,早上7点半再开窗帘,并且打开空调设定26度”——这就相当于你在Harness Engineering工具里查看AI Agent的运行日志、转化率、回复准确率,如果AI Agent回复错了,你可以给它“喂”正确的知识库、调整提示词、优化工作流。
你看!Harness Engineering是不是一点都不神秘?它就是用“智能家居的搭建逻辑”来搭建AI Agent——非技术人员也能轻松上手!
问题描述
AI Agent Harness Engineering 要解决的核心问题有5个:
- “大脑”问题:如何选择适合自己业务的LLM?是用GPT-4o这样的闭源大模型,还是用Llama 3.1 70B这样的开源大模型?是用云端部署的大模型,还是用本地部署的大模型?
- “手脚”问题:如何连接自己的业务系统、数据、工作流?是用现成的工具库,还是要自己写API?
- “心脏”问题:如何管理AI Agent的记忆?是用短期记忆,还是用长期记忆?是用向量数据库,还是用普通的数据库?
- “中枢神经”问题:如何配置AI Agent的目标-计划-执行-反思闭环?是用固定的工作流,还是用动态的推理链?
- “安全”问题:如何保护企业的数据安全?是用数据脱敏,还是用私有部署?是用权限控制,还是用审计日志?
边界与外延
在正式开始介绍工具之前,我们必须先搞清楚AI Agent Harness Engineering 的边界——它不是万能的,也有自己的适用范围和局限性:
适用范围(✅ 可以做)
- 重复性强的标准化工作:比如社群运营、客服接待、数据整理、报表生成、邮件回复、日程安排、内容审核、订单处理等;
- 需要调用多个工具的串联工作:比如“有人在官网提交了需求表单→自动在CRM里创建客户档案→自动给客户发欢迎邮件→自动给销售发微信提醒→自动把需求内容整理成PDF发给销售”;
- 需要实时响应的工作:比如库存预警、舆情监测、系统告警、用户投诉处理等;
- 需要快速迭代的工作:比如A/B测试文案、A/B测试活动方案、快速调整工作流等。
局限性(❌ 不能做)
- 需要高度创造性的工作:比如写科幻小说、创作艺术作品、设计新产品的核心功能等(AI Agent可以帮你找灵感,但核心的创造性工作还是要靠人);
- 需要复杂情感判断的工作:比如心理咨询、临终关怀、处理重大的客户纠纷等(AI Agent可以帮你做初步的沟通,但核心的情感判断还是要靠人);
- 需要高风险决策的工作:比如投资决策、医疗诊断、法律判决等(AI Agent可以帮你做数据分析,但核心的决策还是要靠专业人士);
- 数据质量很差的工作:比如用错误的库存数据来做推荐、用模糊的客户信息来做营销等(“垃圾进,垃圾出”——AI Agent的效果取决于你的数据质量)。
第2章:零代码 AI Agent Harness Engineering 工具的核心要素——别被花哨的功能晃了眼,先看这5个
核心概念3:零代码 AI Agent Harness Engineering 工具的核心架构
概念结构与核心要素组成
无论工具的界面有多花哨、功能有多复杂,一个合格的零代码 AI Agent Harness Engineering 工具都必须包含以下5个核心要素(也就是我们前面类比的“智能家居的5个部分”):
1. LLM 核心管理模块(中枢大脑)
这是工具的“灵魂”——负责理解用户的自然语言指令、生成逻辑计划、处理文本/图像/音频等输入。一个好的LLM核心管理模块应该具备以下功能:
- 多LLM支持:可以同时接入多个闭源大模型(比如GPT-4o、Claude 3 Opus、Gemini 1.5 Pro、文心一言4.0、通义千问4.0)和开源大模型(比如Llama 3.1 70B、Qwen2 72B、DeepSeek-V2.5),用户可以根据自己的业务需求、预算、数据安全要求选择合适的LLM;
- LLM 配置优化:可以调整LLM的参数(比如温度、最大输出长度、Top P、Top K),用户可以根据自己的业务场景(比如写文案需要高温度,做数学题需要低温度)调整参数;
- 提示词模板管理:可以创建、保存、分享提示词模板(比如社群回复模板、数据整理模板、报表生成模板),用户不需要每次都写很长的提示词,只需要选择合适的模板、修改几个变量就行;
- 多模态输入输出:可以支持文本、图像、音频、视频等多模态输入输出(比如用户上传一张库存盘点的照片,AI Agent可以自动识别照片里的内容、整理成Excel表格;用户上传一段语音指令,AI Agent可以自动识别语音、执行动作、生成语音回复)。
2. 工具库与API对接模块(手脚)
这是工具的“四肢”——负责让AI Agent“动起来”,连接用户的业务系统、数据、工作流。一个好的工具库与API对接模块应该具备以下功能:
- 丰富的现成工具库:可以支持几百甚至几千个现成的工具(比如Google搜索、Bing搜索、维基百科、企业微信、钉钉、飞书、Slack、Microsoft 365(Word/Excel/PowerPoint/Outlook)、Google Workspace、Salesforce、HubSpot、Shopify、美团外卖、饿了么、抖音、快手、微信公众号、小红书、向量数据库(比如Pinecone、Weaviate、Chroma)、普通数据库(比如MySQL、PostgreSQL、MongoDB)等);
- 自定义API对接:如果现成的工具库没有用户需要的工具,可以支持用户用自然语言或者简单的配置自定义API对接(比如用户可以把自己公司的内部CRM系统、内部ERP系统、内部OA系统接入到工具里);
- 工具权限控制:可以控制AI Agent使用工具的权限(比如AI Agent只能读取Excel表格,不能修改Excel表格;AI Agent只能在CRM里创建客户档案,不能删除客户档案);
- 工具异常处理:如果AI Agent使用工具时遇到异常(比如Excel表格打不开、API接口超时、Google搜索失败),可以支持用户配置异常处理策略(比如重试3次、给用户发通知、调整计划)。
3. 记忆系统管理模块(心脏)
这是工具的“记忆库”——负责让AI Agent“记住”用户的业务规则、数据、历史对话、历史操作。一个好的记忆系统管理模块应该具备以下功能:
- 短期记忆管理:可以记住AI Agent的当前对话上下文、当前操作上下文(比如记住用户刚才说的“优惠券只能给复购3次以上的北京用户”,记住用户刚才打开的Excel表格是“2024年9月北京区域库存表”);
- 长期记忆管理:可以把AI Agent的历史对话、历史操作、用户的业务规则、用户的数据(比如客户档案、销售数据、库存数据)存储到向量数据库或者普通数据库里,用户可以随时查询、修改、删除这些记忆;
- 知识库管理:可以把用户的文档(比如Word文档、PDF文档、PPT文档、TXT文档)、网页、视频、音频等内容上传到工具里,转换成向量存储到向量数据库里,AI Agent可以在需要的时候检索知识库、获取相关信息;
- 记忆检索优化:可以支持用户配置记忆检索策略(比如相似度阈值、最大检索数量、检索范围),用户可以根据自己的业务场景调整策略,提高记忆检索的准确率。
4. 目标-计划-执行-反思(OODA)闭环配置模块(中枢神经)
这是工具的“大脑皮层”——负责让AI Agent“思考起来”,不会机械执行用户的每一句话,而是先拆解目标、再制定计划、再执行计划、最后反思调整。一个好的OODA闭环配置模块应该具备以下功能:
- 可视化工作流配置:可以支持用户用拖拖拽拽的方式配置可视化的工作流(比如“触发条件→节点1→节点2→节点3→结束”),每个节点可以是一个LLM调用、一个工具调用、一个条件判断、一个循环、一个暂停、一个通知;
- 自然语言工作流配置:如果用户觉得拖拖拽拽太麻烦,可以支持用户用自然语言配置工作流(比如用户说“如果有人在社群里问‘有没有适合过敏体质的水果’,就先调取企业CRM里的用户过敏史,再调取Excel里的今日库存水果(不含过敏原),再生成个性化的推荐文案,再自动回复社群,如果库存里没有适合的水果,就给我发微信提醒”,工具可以自动把这句话转换成可视化的工作流);
- 动态推理链配置:如果用户的业务场景比较复杂(比如“提升本月社群转化率10%”),可以支持用户配置动态的推理链——AI Agent不需要固定的工作流,而是会根据自己的理解自动拆解目标、制定计划、执行计划、反思调整;
- 工作流测试与调试:可以支持用户在部署工作流之前先测试与调试(比如用户可以模拟有人在社群里问“有没有适合过敏体质的水果”,然后查看AI Agent的执行过程、执行结果,如果有问题,可以随时修改工作流)。
5. 部署、监控、运维与迭代模块(物业)
这是工具的“后勤保障”——负责让AI Agent“稳定运行起来”,并且可以根据用户的反馈不断优化。一个好的部署、监控、运维与迭代模块应该具备以下功能:
- 一键部署:可以支持用户一键部署AI Agent到多个平台(比如企业微信群聊、企业微信群机器人、钉钉群聊、钉钉群机器人、飞书群聊、飞书群机器人、Slack、Microsoft Teams、微信公众号、小程序、官网、API接口);
- 运行日志查看:可以支持用户查看AI Agent的详细运行日志(比如触发时间、触发条件、执行过程、执行结果、执行时间、是否成功、异常原因),用户可以随时了解AI Agent的运行状态;
- 数据分析与报表生成:可以支持用户查看AI Agent的数据分析报表(比如回复准确率、转化率、响应时间、使用次数、使用人数),用户可以根据数据分析报表优化AI Agent;
- 用户反馈收集与处理:可以支持用户收集用户对AI Agent的反馈(比如点赞、点踩、留言),并且可以把反馈内容存储到记忆系统里,AI Agent可以根据反馈内容不断优化自己的提示词、工作流、知识库;
- 权限控制与审计日志:可以支持用户配置团队成员的权限(比如管理员可以修改所有内容,编辑可以修改提示词、工作流、知识库,观众只能查看运行日志和数据分析报表),并且可以查看团队成员的审计日志(比如谁在什么时候修改了什么内容),保护企业的数据安全;
- 私有部署:如果用户对数据安全要求很高,可以支持用户私有部署工具(比如部署到自己公司的服务器上、自己公司的云服务器上),所有数据都存储在用户自己的服务器上,不会泄露给第三方。
第3章:5 个适合非技术人员的零代码 AI Agent Harness Engineering 工具推荐——从入门到精通,总有一款适合你
前面我们已经搞懂了AI Agent Harness Engineering的全景图和核心要素,现在终于到了大家最期待的环节——5个适合非技术人员的零代码AI Agent Harness Engineering工具推荐!我会从以下几个维度来对比和介绍每个工具:
- 工具定位与适用人群
- 核心功能与亮点
- 概念核心属性维度对比(表格形式)
- 概念联系的ER实体关系图(Mermaid)
- 交互关系图(Mermaid)
- 数学模型(可选,如果工具涉及到简单的数学模型)
- 算法流程图(可选,如果工具涉及到简单的算法流程)
- Python源代码(可选,如果工具提供了API或者SDK,我会写一段简单的Python代码演示如何使用)
- 实际场景应用(2-3个真实的业务场景,配详细的配置步骤)
- 项目介绍(1个完整的小型项目,配环境安装、系统功能设计、系统架构设计、系统接口设计、系统核心实现源代码)
- 最佳实践Tips
- 行业发展与未来趋势(工具的发展历史表格)
- 本章小结
第3.1节:Dify——零代码 AI Agent 领域的“小米智能家居”,入门首选
工具定位与适用人群
- 工具定位:全球领先的一站式零代码/低代码AI应用开发平台——核心目标是让任何人(无论有没有技术背景)都能在几分钟内搭建出一个能用的AI应用(包括AI Agent、AI聊天机器人、AI知识库、AI内容生成工具等)。
- 适用人群:非技术人员(比如运营主管、客服主管、市场主管、行政主管、学生、个人创业者)、初级技术人员、中小企业。
核心功能与亮点
前面我们类比了“小米智能家居”——Dify就像AI Agent领域的“小米智能家居”:
- 性价比极高:免费版就有非常丰富的功能,足够个人用户和小型企业使用;付费版的价格也非常亲民(比请一个程序员便宜100倍以上);
- 操作极其简单:界面设计非常友好,非技术人员只要拖拖拽拽、写几句自然语言指令,就能在几分钟内搭建出一个能用的AI Agent;
- 功能极其丰富:包含了我们前面提到的所有5个核心要素——多LLM支持、丰富的现成工具库、强大的记忆系统、可视化的OODA闭环配置、一键部署与监控;
- 生态极其完善:有非常活跃的社区、非常丰富的模板库、非常多的第三方插件、非常详细的文档和教程。
具体来说,Dify的核心功能与亮点包括:
1. 多LLM支持(超过100种LLM)
Dify支持超过100种闭源大模型和开源大模型,包括:
- 闭源大模型:GPT-4o、GPT-4o mini、GPT-4 Turbo、Claude 3 Opus、Claude 3 Sonnet、Claude 3 Haiku、Gemini 1.5 Pro、Gemini 1.5 Flash、文心一言4.0、通义千问4.0、智谱清言GLM-4、DeepSeek-V2.5等;
- 开源大模型:Llama 3.1 8B/70B、Qwen2 7B/72B、DeepSeek-Coder-V2、Mistral NeMo 12B、Mixtral 8x7B等。
用户可以根据自己的业务需求、预算、数据安全要求选择合适的LLM——比如:
- 如果你的业务场景需要多模态输入输出、高准确率,可以选择GPT-4o、Claude 3 Opus、Gemini 1.5 Pro;
- 如果你的业务场景对预算有限,可以选择GPT-4o mini、Claude 3 Haiku、通义千问4.0 Turbo;
- 如果你的业务场景对数据安全要求很高,可以选择本地部署的开源大模型(比如Llama 3.1 70B、Qwen2 72B)。
2. 丰富的现成工具库(超过500种工具)
Dify支持超过500种现成的工具,包括:
- 搜索工具:Google搜索、Bing搜索、维基百科、知乎搜索、百度搜索等;
- 即时通讯工具:企业微信、钉钉、飞书、Slack、Microsoft Teams等;
- 办公协作工具:Microsoft 365(Word/Excel/PowerPoint/Outlook/OneDrive)、Google Workspace(Docs/Sheets/Slides/Gmail/Drive)、Notion、Obsidian等;
- 客户关系管理工具:Salesforce、HubSpot、Zoho CRM、纷享销客、销售易等;
- 电商工具:Shopify、WooCommerce、Amazon Seller Central、美团外卖、饿了么等;
- 社交媒体工具:微信公众号、小红书、抖音、快手、微博、LinkedIn等;
- 向量数据库工具:Pinecone、Weaviate、Chroma、Milvus、Qdrant等;
- 普通数据库工具:MySQL、PostgreSQL、MongoDB、Redis、SQLite等;
- 其他工具:翻译工具(Google翻译、DeepL翻译)、画图工具(DALL-E 3、Midjourney API、Stable Diffusion API)、剪视频工具(Runway API、Pika Labs API)、天气查询工具、日历查询工具等。
如果现成的工具库没有用户需要的工具,Dify还支持用户用自然语言或者简单的配置自定义API对接——比如用户可以把自己公司的内部CRM系统、内部ERP系统、内部OA系统接入到Dify里,只需要:
- 找到内部系统的API文档;
- 在Dify里创建一个“自定义API工具”;
- 输入API的URL、请求方法(GET/POST/PUT/DELETE)、请求头、请求参数;
- 配置API的响应格式;
- 测试API是否正常工作;
- 保存自定义API工具。
整个过程不需要写一行代码!
3. 强大的记忆系统(短期记忆+长期记忆+知识库)
Dify的记忆系统非常强大,包括:
- 短期记忆:Dify的短期记忆可以记住AI Agent的当前对话上下文、当前操作上下文——默认的短期记忆长度是10轮对话,用户可以根据自己的业务需求调整(最多可以调整到100轮对话);
- 长期记忆:Dify的长期记忆可以把AI Agent的历史对话、历史操作、用户的业务规则、用户的数据存储到向量数据库或者普通数据库里——用户可以随时查询、修改、删除这些记忆;
- 知识库:Dify的知识库支持把用户的文档(Word/PDF/PPT/TXT/Markdown/CSV/Excel)、网页、视频、音频等内容上传到Dify里,转换成向量存储到向量数据库里(Dify默认提供了免费的Weaviate向量数据库,用户也可以选择自己的向量数据库)——AI Agent可以在需要的时候检索知识库、获取相关信息。
Dify的知识库还有一个非常棒的功能——分段与清洗:用户上传文档后,Dify会自动把文档分成合适的段落(默认的段落长度是1000个字符,用户可以根据自己的业务需求调整)、自动清洗文档里的噪音(比如页眉页脚、广告、无用的图片)——提高记忆检索的准确率。
4. 可视化的OODA闭环配置(Agent Workflow)
这是Dify最核心的功能——Agent Workflow:用户可以用拖拖拽拽的方式配置可视化的OODA闭环工作流,每个节点可以是:
- LLM节点:调用LLM生成文本、图像、音频、视频等内容;
- 工具节点:调用现成的工具或者自定义的API工具;
- 知识库检索节点:检索知识库、获取相关信息;
- 条件判断节点:根据条件判断执行不同的分支(比如“如果用户的问题是关于库存的,就调取Excel里的库存数据;如果用户的问题是关于优惠券的,就调取CRM里的用户优惠券数据”);
- 循环节点:循环执行某个动作(比如“循环读取Excel表格里的每一行数据”);
- 变量节点:定义、修改、删除变量(比如“定义一个变量‘用户复购次数’,从CRM里读取用户的复购次数赋值给这个变量”);
- 通知节点:给用户发通知(比如微信通知、钉钉通知、飞书通知、邮件通知);
- 暂停节点:暂停工作流的执行,等待用户的确认(比如“暂停工作流的执行,等待用户确认推荐文案是否正确,然后再自动回复社群”);
- 结束节点:结束工作流的执行。
如果用户觉得拖拖拽拽太麻烦,Dify还支持自然语言生成工作流——用户只需要说一句自然语言指令(比如“如果有人在社群里问‘有没有适合过敏体质的水果’,就先调取企业CRM里的用户过敏史,再调取Excel里的今日库存水果(不含过敏原),再生成个性化的推荐文案,再自动回复社群,如果库存里没有适合的水果,就给我发微信提醒”),Dify的“Workflow Copilot”就会自动把这句话转换成可视化的工作流!
5. 一键部署与监控(超过20种部署渠道)
Dify支持一键部署AI Agent到超过20种平台,包括:
- 即时通讯平台:企业微信群聊、企业微信群机器人、钉钉群聊、钉钉群机器人、飞书群聊、飞书群机器人、Slack、Microsoft Teams;
- 社交媒体平台:微信公众号、微信小程序、抖音小程序、快手小程序、小红书、微博、LinkedIn;
- 网站平台:官网、独立站、Shopify店铺;
- API接口平台:RESTful API、WebSocket API;
- 其他平台:Notion、Obsidian、Discord。
部署完成后,用户可以在Dify的“监控”页面查看AI Agent的详细运行日志、数据分析报表(比如回复准确率、转化率、响应时间、使用次数、使用人数)——用户可以根据数据分析报表优化AI Agent的提示词、工作流、知识库。
6. 其他亮点
- 团队协作:Dify支持团队协作,用户可以邀请团队成员加入自己的工作区,配置不同的权限(比如管理员、编辑、观众);
- 模板库:Dify有非常丰富的模板库(超过1000个模板),用户可以直接使用模板,也可以根据自己的业务需求修改模板;
- API与SDK:Dify提供了RESTful API和Python/JavaScript/Java/Go等多种语言的SDK,初级技术人员可以用API或SDK把Dify搭建的AI Agent集成到自己的应用里;
- 私有部署:Dify支持私有部署(社区版完全免费,企业版需要付费),用户可以把Dify部署到自己公司的服务器上、自己公司的云服务器上,所有数据都存储在用户自己的服务器上,不会泄露给第三方;
- 社区支持:Dify有非常活跃的中文社区和英文社区,用户可以在社区里提问、分享自己的AI应用、获取帮助。
概念核心属性维度对比
为了方便大家对比,我先列出后面要推荐的4个工具的名字,然后在本节先做一个简单的对比(后面每个工具推荐完都会做一个更详细的对比):
| 核心属性维度 | Dify | Zapier Central(后面推荐) | Make AI Agent(后面推荐) | LangFlow(后面推荐) | Coze(后面推荐) |
|---|---|---|---|---|---|
| 工具定位 | 一站式零代码/低代码AI应用开发平台 | AI驱动的自动化工作流平台 | AI驱动的自动化工作流平台 | 开源的可视化LLM应用开发平台 | 字节跳动旗下的零代码AI应用开发平台 |
| 适用人群 | 非技术人员、初级技术人员、中小企业 | 非技术人员、市场人员、运营人员 | 非技术人员、市场人员、运营人员 | 初级技术人员、中级技术人员、开源爱好者 | 非技术人员、学生、个人创业者、中小企业 |
| 操作难度 | ⭐⭐(非常简单) | ⭐⭐(非常简单) | ⭐⭐(非常简单) | ⭐⭐⭐⭐(比较复杂) | ⭐⭐(非常简单) |
| 多LLM支持 | ✅✅✅✅✅(超过100种) | ✅✅✅✅(超过50种) | ✅✅✅✅(超过50种) | ✅✅✅✅✅(超过100种) | ✅✅✅✅✅(超过50种,包括字节跳动的豆包) |
| 现成工具库数量 | ✅✅✅✅✅(超过500种) | ✅✅✅✅✅✅(超过7000种) | ✅✅✅✅✅(超过6000种) | ✅✅✅(超过200种) | ✅✅✅✅(超过400种) |
| 自定义API对接难度 | ⭐⭐(非常简单) | ⭐⭐(非常简单) | ⭐⭐(非常简单) | ⭐⭐⭐(一般) | ⭐⭐(非常简单) |
| 记忆系统功能 | ✅✅✅✅✅(短期+长期+知识库+分段清洗) | ✅✅✅(短期+简单知识库) | ✅✅✅(短期+简单知识库) | ✅✅✅✅(短期+长期+知识库) | ✅✅✅✅✅(短期+长期+知识库+记忆检索优化) |
| OODA闭环配置方式 | ✅✅✅✅✅(可视化拖拽+自然语言生成) | ✅✅✅✅(可视化拖拽) | ✅✅✅✅(可视化拖拽) | ✅✅✅✅✅(可视化拖拽+代码节点) | ✅✅✅✅✅(可视化拖拽+自然语言生成+插件市场) |
| 部署渠道数量 | ✅✅✅✅✅(超过20种) | ✅✅✅✅✅(超过7000种) | ✅✅✅✅✅(超过6000种) | ✅✅✅(RESTful API+WebSocket API) | ✅✅✅✅✅(超过30种,包括抖音、快手、小红书) |
| 团队协作功能 | ✅✅✅✅✅(权限控制+审计日志) | ✅✅✅✅(权限控制) | ✅✅✅✅(权限控制) | ✅✅✅(需要自己配置) | ✅✅✅✅✅(权限控制+审计日志+团队模板库) |
| 私有部署支持 | ✅✅✅✅✅(社区版免费,企业版付费) | ❌(只能云端部署) | ❌(只能云端部署) | ✅✅✅✅✅(完全免费开源) | ✅✅(国内版支持私有部署,国际版只能云端部署) |
| 性价比 | ⭐⭐⭐⭐⭐(免费版功能丰富,付费版价格亲民) | ⭐⭐⭐(免费版功能有限,付费版价格较高) | ⭐⭐⭐(免费版功能有限,付费版价格较高) | ⭐⭐⭐⭐⭐(完全免费开源) | ⭐⭐⭐⭐⭐(免费版功能丰富,付费版价格亲民) |
概念联系的ER实体关系图(Mermaid)
下面是Dify的核心概念之间的ER实体关系图:
交互关系图(Mermaid)
下面是用户使用Dify搭建和部署AI Agent的交互关系图:
数学模型(可选)
Dify的知识库检索使用的是余弦相似度(Cosine Similarity) 数学模型——用来计算查询向量和文档段落向量之间的相似度,相似度越高,说明查询和文档段落越相关。
余弦相似度的公式如下:
cosine similarity(A,B)=A⋅B∥A∥∥B∥=∑i=1nAiBi∑i=1nAi2∑i=1nBi2 \text{cosine similarity}(A, B) = \frac{A \cdot B}{\|A\| \|B\|} = \frac{\sum_{i=1}^{n} A_i B_i}{\sqrt{\sum_{i=1}^{n} A_i^2} \sqrt{\sum_{i=1}^{n} B_i^2}} cosine similarity(A,B)=∥A∥∥B∥A⋅B=∑i=1nAi2∑i=1nBi2∑i=1nAiBi
其中:
- AAA 是查询向量;
- BBB 是文档段落向量;
- AiA_iAi 是查询向量的第 iii 个维度;
- BiB_iBi 是文档段落向量的第 iii 个维度;
- nnn 是向量的维度数。
余弦相似度的取值范围是 [−1,1][-1, 1][−1,1]:
- 当取值为 111 时,说明两个向量完全相同;
- 当取值为 000 时,说明两个向量完全无关;
- 当取值为 −1-1−1 时,说明两个向量完全相反。
在Dify的知识库检索中,我们通常会设置一个相似度阈值(比如0.7)——只有当余弦相似度大于等于相似度阈值时,文档段落才会被检索出来,提供给LLM使用。
算法流程图(可选)
下面是Dify的AI Agent的核心算法流程图(目标-计划-执行-反思闭环):
Python源代码(可选)
Dify提供了Python SDK,初级技术人员可以用Python SDK把Dify搭建的AI Agent集成到自己的应用里。下面是一段简单的Python代码演示如何使用Dify的Python SDK调用AI Agent:
环境安装
首先,我们需要安装Dify的Python SDK:
pip install dify-client
系统核心实现源代码
下面是一段简单的Python代码:
from dify_client import ChatClient
# 初始化ChatClient
client = ChatClient(api_key="your-dify-api-key")
# 配置应用的参数
api_url = "your-dify-app-api-url"
conversation_id = "" # 第一次调用时留空,后续调用时使用之前返回的conversation_id
user = "your-user-id" # 用户的唯一标识
query = "今天北京的天气怎么样?" # 用户的问题/指令
# 调用AI Agent
response = client.create_chat_message(
inputs={}, # 工作流的输入变量(如果有的话)
更多推荐



所有评论(0)