Planning模式详解

2025-09-11 01:00 113

1. 什么是规划模式

规划模式让AI Agent在执行任何操作之前制定计划或解决方案。

Planning Agent不会像ReAct那样直接深入到逐步推理和工具使用中，而是会先为任务指定一个高级计划或路线图，之后Agent会去执行计划中的每一个步骤，最终给出答案。这种方式通过首先制定计划然后采取行动，增强了LLM代理处理复杂任务和决策的能力。

2. 为什么要规划

为什么我们需要为AI Agent设置明确的规划阶段？简而言之，有些问题过于复杂，如果没有全局战略，就无法一步一步解决。ReAct范式擅长被动决策。Agent会观察当前状态，决定一个动作并执行，然后观察结果并重复执行。

这对简单或高度不确定的任务非常有效，但对于受益于全局观的多步骤问题可能效果不好。Planning模式通过细分任务和概述目标，Agent可以获得对问题的整体看法，更具有战略性和更高的效率。

在这种情况下，ReAct Agent可能最终也能找到答案，但在过程中蜿蜒曲折或重复工作，因为每次它只能决定一个动作；而规划Agent会尝试提前确定所有必要的步骤，并且不太可能偏离目标。

规划是有效的，另一个原因是避免错过重要步骤，即使强制LLM逐步推理，也可能会跳过关键步骤或产生有缺陷的解决路径而出现幻觉。如果我们强调模型先制定计划再执行它，我们会迫使它思考整个解决方案路径，从而减少跳过步骤的机会。ReAct代理的设计使其每次只能规划一个动作，并且不一定会预见下一步之后的动作，可能导致复杂任务的执行轨迹不理想。

使用规划有效的情况：

问题自然地分解为子任务或阶段不规划，Agent可能在许多步骤中忘记要求或背景。贪婪的循序渐进的方法可能会陷入困境或偏离轨道。希望Agent的解决方案路径是可解释和可验证的。

3.规划模式实际上如何运作

Agent会花一些时间提前思考，然后才逐一执行这些步骤。通过以这种方式构建Agent循环，可以获得更有条理、通常更高效的工作流程。

首先，LLM规划师分析用户请求并生成子任务列表。单任务执行Agent按顺序处理每一个子任务，可能使用工具来完成。单步任务执行后，Agent会根据结果更新其状态。如果新信息需要，Agent会在继续执行之前重新规划。所有步骤完成后，Agent会像用户发出响应。这种关注点分离使得清晰的长期规划与迭代操作相结合成为可能。

3.1.规划阶段

Agent检查用户的查询或目标并制定高级计划，通常意味着将问题分解为子目标或子任务，可能会提示LLM输出解决问题所需的有序步骤列表。

此时，Agent正在创建路线图，尚未解决任何问题，它会在执行之前分析目标并决定策略，生成的计划可以是简单的语言或结构化格式，只要后续步骤可以解释即可。

3.2. 执行阶段

一旦有了计划，Agent就会进入循环，迭代执行每个子任务。从计划中迈出第一步，执行并获取结果，然后进入下一步，以此类推。在执行过程中，Agent可能会根据每个子任务的需要调用外部工具或API，Agent始终将该计划作为下一步的行动指南，而不是从头开始构思新的行动，一直持续到所有计划的步骤都完成。

在次阶段，Agent会将结果或中间发现汇总到记忆或暂存器中，每次迭代都可以被认为Agent在计划的指导下专注于单个子问题。

3.3.聚合和响应

执行必要的步骤后，Agent会收集所有相关的输出并组成最终的答案或结果。由于Agent遵循了结构化计划，因此在此阶段可以直接汇总结果然后将最终响应呈现给用户。

规划模式的一个可选但重要的方面是反馈和迭代。与传统程序不同，AI Agent可以检测到某些事情没有按预期进行时进行调整。在执行过程中，如果子任务失败或产生意外结果，代理可以决定重新审视计划。

理想情况下，代理将按照修改后的计划继续执行。实际上，可以通过再次调用LLM规划师来实现，向其提供部分进度并请求更新后的计划。这确保了当情况发生变化时，Agent不会陷入糟糕的初始计划。

通过将Agent的工作流程构建为计划阶段和执行阶段，可以获得更好的组织性、清晰度，并且通常可以为复杂任务获得更好的结果。

如果您觉得这篇文章对您了解什么是Planning规划模式、Planning模式的工作原理以及Planning规划模式与ReAct模式的区别有帮助，欢迎关注公众号，查看更多精彩内容；点赞或赞赏表达您的鼓励！

#优质好文激励计划#

Planning模式详解

足球资讯介绍

热点资讯

足球资讯介绍

产品展示

新闻动态