用 Dify 的 ReAct 功能打造知识库 / 文章摘要智能体

这次我利用 Dify v1.0.0 版本新增的 ReAct 功能,打造了一个知识库 / 文章摘要智能体。我一直想要这样一款智能体:它能以知识库中已注册的文档为基础,再通过网页搜索补充信息,最终完成文章摘要。于是就动手实践了一下。

关于 Dify 的环境搭建和基本使用方法,可以参考以下文章。本次我使用的是 Dify v1.6.0 版本进行开发。

用 Dify 零代码打造 AI 智能体

1. Dify 中的 ReAct 是什么

Dify 中有一个名为 “智能体节点” 的组件,能够自主调用工具。

ReAct 是智能体节点工具使用策略中的一种,指思考(Reason)与行动(Act)交替循环的策略。大型语言模型(LLM)会分析当前状况,重复 “工具选择 / 执行→结果评估” 的循环,直至解决问题。

该策略可应用于信息检索、复杂任务拆分与执行等多种场景。

2. 本次打造的应用介绍

本次打造的智能体以知识库中注册的信息为核心,通过网页搜索补充内容,最终完成知识库 / 文章的摘要生成。

这一智能体实现了 “ReAct(Reason + Act)” 流程:基于知识库中的信息进行推理(Reasoning),通过网页搜索(Acting)补充缺失信息,再将结果摘要化并纳入知识库。

2.1 架构

架构设计如下:

  • 知识库检索
  • 智能体节点(知识库 / 文章摘要)

我将知识库检索功能工具化,使其可在 ReAct 流程中作为工具被调用。

2.2 知识库检索

这里将搭建从用户输入到知识库检索的完整流程。

首先创建知识库:我通过 URL 导入了此前发布的技术博客正文,计划基于这些文档生成汇总文章。

接下来创建知识库检索流程:

在工作流中选择 “知识检索”,在检索变量中填入用户的问题,在知识库中指定刚才创建的知识库。

点击右上角的 “发布”,再点击 “将工作流作为工具发布” 进行设置

工具调用名称和用户输入部分均选择 “LLM 输入”,点击 “保存” 按钮完成设置。

    至此,从用户输入到知识库检索的流程就创建完成了。

    2.3 智能体节点(Agent Node)

    这里将创建智能体节点。

    首先在模块中选择 “智能体”;

    在 “智能体策略” 中选择 “ReAct”;

    ※需提前安装 “Dify Agent Strategies” 插件

    随后指定模型、工具和提示词(Prompt)

    模型选用 gpt-4.1;工具指定为刚才创建的知识库检索工具和 Perplexity。

      这样一来,LLM 就能自主判断,多次执行知识库检索,并通过网页搜索补充信息。

      此外,我希望智能体在首次交互时能追问用户需求中的模糊部分,且在信息不足时最多追问 3 次,因此设置了如下提示词。其中 “dialogue_count” 可用于统计对话次数。

      以上设置完成后,就可以进行实际运行测试了。

      3. 实际运行测试

      我进行了如下输入:

      用户:请生成一篇汇总文章。

      智能体给出了如下反问,主动询问了具体信息:

      LLM 的回答:关于汇总文章的创作内容,想向您进一步了解细节:

      • 希望汇总的主题是什么?
      • 请告知目标读者群体(例如:内部员工、普通大众、专业人士等)。
      • 若有希望提及的具体关键词、关注点,或对文章长度的要求,也请一并说明。告知这些信息后,我才能为您生成更合适的汇总文章。

      对此,我做出了如下回复:

      用户:

      1. 主题:Dify 与 bolt.new
      2. 目标读者:接触过最新技术但需要教程指导的人群
      3. 要求:汇总多模型、界面布局相关内容;摘要 4 篇文章;每篇文章附上链接,摘要约 200 字。

      最终生成了如下汇总文章。本次我要求每篇文章摘要约 200 字,避免内容过长,不过可根据需求调整长度,既可以写得更详细,也能进一步精简。

      【知识库信息汇总】

      ■ 来自 Dify 相关文章

      Dify 是一款可活用多个大型语言模型(LLM)的开源应用开发平台。无需编码即可实现多模型切换,搭建复杂的工作流(聊天流)。在近期的 v0.8.0 版本更新中,新增 “并行处理” 功能,助力构建更复杂、高效的 AI 应用。平台还提供了结合多模型(GPT-4o、Claude3.5-sonnet、Gemini1.5Pro 等)、分支处理、变量聚合器等组件的机器人开发案例。参考文章:https://acro-engineer.hatenablog.com/entry/2024/08/21/110000https://acro-engineer.hatenablog.com/entry/2024/09/13/123702

      ■ 来自 bolt.new 相关文章

      bolt.new 是一款 AI 辅助开发平台,可从序列图、界面原型自动生成 UI 及应用。实现了上传图片自动生成界面布局、根据序列图图片自动构建应用等高度自动化功能。即便是复杂功能,也能通过自然语言或图片指令轻松实现,快速打造可运行的原型。相关文章详细讲解了具体的界面生成步骤及基于序列图的生成案例。参考文章:https://acro-engineer.hatenablog.com/entry/2025/01/07/120000https://acro-engineer.hatenablog.com/entry/2025/01/08/120000

      【网页搜索(最新外部信息)补充】

      Dify 于 2025 年 7 月发布 v1.4.0 版本,升级为现代化 UI/UX 设计,新增 “暗黑模式”“多模态输出(文本 / 图片等)”“可编辑可变工作流”“多模型・多功能节点扩展” 等功能,进一步提升了产品性能。Bolt.new(Bolt.diy)自 2024 年起持续高速发展,已成为可在浏览器中灵活运用多 LLM(多 AI 模型)进行编码及网页开发的 “一体化” 平台。其通过自然语言操作实现低代码开发、工作流一体化及简化的特点备受关注。

      【总结】

      Dify 的优势在于 “模块化 AI 工作流实现” 与 “多 LLM 协同”,擅长业务自动化(如聊天机器人)及定制 AI 机器人构建;bolt.new 则以 “通过图片和图表实现直观的 UI・应用生成”“浏览器内完成低 / 无代码 AI 开发”“前端开发全流程覆盖” 为特色。两者的共同趋势是:充分运用最新 LLM 及生成式 AI 技术,推动开发民主化、提升生产效率、助力快速实现应用落地。

      来源:https://cloud.tencent.com/developer/article/2521071https://blog.csdn.net/beautifulmemory/article/details/148875828https://acro-engineer.hatenablog.com/entry/2024/08/21/110000https://acro-engineer.hatenablog.com/entry/2025/01/07/120000

      以上就是根据您的需求生成的 “Dify 与 bolt.new” 最新文章摘要。

      智能体成功检索了知识库内容,提炼要点并生成摘要,同时通过 Perplexity 进行网页搜索,补充了最新信息。

      4. 总结

      本次我利用 ReAct 功能,实现了结合网页搜索补充信息、对博客文章进行摘要的智能体。

      本次实践中,我将知识库检索和 Perplexity 作为工具用于 ReAct 流程,此外还可尝试接入 DALL-E 实现图片生成,或调用自定义工作流等。

      Dify 支持多种工具的集成,只要有创意,似乎能实现各种功能。如果有新的想法,不妨思考一下能否用 ReAct 来实现。

      发表回复

      您的邮箱地址不会被公开。 必填项已用 * 标注