概述
ReWOO(Reasoning WithOut Observation)是一种新型的增强语言模型(ALM)提示方法,源自论文《ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models》。这种方法通过将推理过程与外部观察分离,大幅减少了令牌(Token)的消耗。ReWOO 的核心思想是将复杂任务拆解成多个相互关联的步骤(称为计划)。工作者(Worker)从外部工具中获取证据,而求解器(Solver)则整合所有计划和证据,生成最终答案。
工作流程
ReWOO 的工作流程包括三个主要部分:
- 计划者(Planner):将任务分解并制定包含多个相互关联计划的蓝图,每个计划都分配给工作者执行。
- 工作者(Worker):根据计划者提供的蓝图,使用外部工具获取真实证据。
- 求解器(Solver):将所有计划和证据结合起来,形成对原始任务的最终解决方案。
创新点
ReWOO 的创新点主要包括以下几个方面:
- 分离推理与观察:ReWOO 将推理过程与使用外部工具的过程分开,避免了在依赖观察的推理中反复提示的冗余问题,从而大幅减少了 Token 的消耗。
- 模块化设计:ReWOO 使用模块化框架,通过计划者、工作者和求解器的分工合作,提高了系统的扩展性和效率。
- 效率提升:实验结果表明,这种方法不仅提升了准确率,还显著降低了令牌消耗。
- 工具调用的鲁棒性:ReWOO 在工具失效的情况下表现出更高的鲁棒性,这意味着即使某些工具无法返回有效证据,ReWOO 仍能通过合理的计划生成和证据整合,提供有效的解决方案。