2026-05-20 21:39:12 +08:00

1.3 KiB
Raw Blame History

title created updated type tags sources
ReAct 循环 2026-04-13 2026-04-13 concept
agent
runtime
architecture
packages/backend/src/modules/netaclaw/runtime/agent.ts

ReAct 循环

ReActReasoning + Acting是 NetaClaw Agent 的核心推理模式。LLM 交替进行"思考"和"行动",直到任务完成。

工作原理

用户输入 → LLM 推理
  ├─ 直接回答(无需工具)→ 结束
  └─ 需要工具 → 输出 tool_use block
       → 执行工具 → 获取 tool_result
       → 将结果追加到对话历史
       → 再次调用 LLM 推理(下一轮)
       → 重复直到 LLM 不再调用工具

关键约束

  • 最大轮次maxToolRounds 限制循环次数,防止无限循环
  • 流式输出:每轮推理的 token 实时通过 WebSocket 推送
  • 思考能力:支持 Anthropic 的 extended_thinking,思考内容单独推送

与传统 Chain 的区别

ReAct 固定 Chain
决策方式 LLM 自主决定是否调用工具 预定义的步骤序列
灵活性 高,可动态组合工具 低,固定流程
适用场景 开放式任务 结构化流程

相关页面