2026-05-20 21:39:12 +08:00

3.7 KiB
Raw Permalink Blame History

title created updated type tags sources
上下文压缩与历史视图 2026-04-19 2026-04-23 concept
runtime
agent
api
backend
packages/backend/src/modules/netaclaw/runtime/compaction.ts
packages/backend/src/modules/netaclaw/session-tree/context_builder.ts
packages/backend/src/modules/netaclaw/session-tree/types.ts
packages/backend/src/modules/netaclaw/service/chat_orchestrator.ts
packages/frontend/src/modules/agent/store/chat.ts
packages/frontend/src/modules/agent/views/chat.vue

上下文压缩与历史视图

上下文压缩用于长对话的 token 控制。早期实现更接近在线性消息表上标记 compactedAt 和摘要消息;当前架构下,压缩结果应进入 session-tree-runtime,成为 compaction 节点,并由 active path 决定是否参与模型上下文。

核心目标

  • 控制模型上下文窗口。
  • 保留长会话的可读摘要。
  • 避免切断 assistant/tool 成对消息。
  • 支持前端在历史中展示压缩事件。
  • 与分支、子 Agent 批次、模型切换共享同一会话树。

运行流程

ChatOrchestrator 准备运行
  -> SessionTreeContextBuilder 读取 active path
  -> 估算上下文 token
  -> 达到阈值时触发 compaction
  -> CompactionService 生成摘要
  -> appendCompaction 写入 session tree
  -> runtimeContext 使用摘要后的上下文
  -> 前端 snapshot/patch 展示 compaction 节点

与 Session Tree 的关系

压缩不应只作为消息 metadata 存在。新的表达方式是:

  • compaction entry 保存摘要、firstKeptEntryIdtokensBefore、details。
  • activePath 决定压缩摘要是否对当前分支生效。
  • runtimeContext.messagescontext_builder.ts 构造,负责把压缩节点转成模型可消费消息。
  • 前端 visibleEntries 把压缩节点渲染为会话中的结构化提示。

这让压缩和分支天然兼容。

手动与自动触发

手动触发仍可通过对话命令或 UI 入口发起。自动触发由 Agent 配置中的上下文阈值控制,运行前由后端判断是否需要压缩。

配置页面需要注意:

  • 压缩阈值是 Agent 运行配置的一部分。
  • 辅助模型配置会影响压缩质量和成本。
  • 压缩结果在刷新后应从 session tree 恢复。

当前还要注意一个过渡事实:

  • legacy netaclaw_message.compactedAt 相关逻辑仍存在,主要用于兼容旧历史与压缩服务本身。
  • 但 Agent Chat 的主展示和主恢复路径已经切到 Session Tree压缩节点应该被理解为 compaction entry,不是“数据库里某几条 message 被隐藏了”这么简单。

前端展示

Agent 对话页需要展示:

  • 压缩开始、完成、失败状态。
  • 摘要内容。
  • 压缩前 token 数和保留边界。
  • 当前是否处于压缩后的 active path。

前端不应自行计算“哪些历史已经压缩”,而应依赖后端 snapshot 和 compaction entry。

与子 Agent 的关系

子 Agent 批次也写入会话树,因此压缩时需要明确哪些批次节点进入摘要、哪些仅用于 UI 展示。当前建议:

  • subagent_batchsubagent_result 可作为可见节点保留。
  • 进入模型上下文时使用其摘要信息,而不是完整工具日志。
  • 压缩摘要应保留子任务结论和影响主任务的关键事实。

随着子 Agent 回放投影落地,这里的边界也更清楚:

  • evidence summary、process replay、tool execution 主要属于 UI/回放层。
  • 真正进入压缩摘要和后续 prompt 的,应该是对主任务有语义价值的结论,而不是完整过程事件。

详见 subagent-session

相关页面