子智能体委派

delegate_task 工具会生成具有隔离上下文、受限工具集和独立终端会话的子 AIAgent 实例。每个子智能体获得全新的对话并独立运行——只有其最终摘要会进入父智能体的上下文。

单任务

并行批处理

默认最多 3 个并发子智能体（可配置，无硬性上限）：

子智能体上下文的工作方式

:::warning 关键：子智能体一无所知
子智能体以全新对话启动。它们对父智能体的对话历史、之前的工具调用或委派前讨论的任何内容一无所知。子智能体的唯一上下文来自父智能体调用 delegate_task 时填写的 goal 和 context 字段。
:::

这意味着父智能体必须在调用中传递子智能体所需的一切信息：

子智能体会收到一个基于你的 goal 和 context 构建的专注系统 prompt（提示词），指示其完成任务并提供结构化摘要，包括所做的事情、发现的内容、修改的文件以及遇到的问题。

实际示例

并行研究

同时研究多个主题并收集摘要：

代码审查 + 修复

将审查并修复的工作流委派给全新上下文：

多文件重构

将会大量占用父智能体上下文的大型重构任务委派出去：

批处理模式详情

当你提供 tasks 数组时，子智能体会使用线程池并行运行：

最大并发数： 默认 3 个任务（可通过 delegation.max_concurrent_children 或环境变量 DELEGATION_MAX_CONCURRENT_CHILDREN 配置；最低为 1，无硬性上限）。超出限制的批次会返回工具错误，而不是被静默截断。

线程池： 使用 ThreadPoolExecutor，以配置的并发限制作为最大工作线程数

进度显示： 在 CLI 模式下，树形视图会实时显示每个子智能体的工具调用，并附带每个任务的完成行。在 gateway 模式下，进度会被批量汇总并转发给父智能体的进度回调

结果排序： 结果按任务索引排序，与输入顺序一致，不受完成顺序影响

中断传播： 中断父智能体（例如发送新消息）会中断所有活跃的子智能体

单任务委派直接运行，无线程池开销。

模型覆盖

你可以通过 config.yaml 为子智能体配置不同的模型——适用于将简单任务委派给更便宜/更快的模型：

如果省略，子智能体将使用与父智能体相同的模型。

工具集选择建议

toolsets 参数控制子智能体可以访问的工具。根据任务选择：

工具集模式	使用场景
`["terminal", "file"]`	代码工作、调试、文件编辑、构建
`["web"]`	研究、事实核查、文档查阅
`["terminal", "file", "web"]`	全栈任务（默认）
`["file"]`	只读分析、无需执行的代码审查
`["terminal"]`	系统管理、进程管理

无论你指定什么，某些工具集对子智能体始终被屏蔽：

delegation — 对叶子子智能体屏蔽（默认）。role="orchestrator" 的子智能体可保留，受 max_spawn_depth 约束——参见下方深度限制与嵌套编排。

clarify — 子智能体无法与用户交互

memory — 不可写入共享持久内存

code_execution — 子智能体应逐步推理

send_message — 无跨平台副作用（例如发送 Telegram 消息）

最大迭代次数

每个子智能体都有迭代次数限制（默认：50），控制其可进行的工具调用轮次：

子智能体超时

如果子智能体静默超过 delegation.child_timeout_seconds 秒（挂钟时间），则会被判定为卡死并终止。默认值为 600（10 分钟）——相比早期版本的 300 秒有所提升，因为高推理能力模型在处理非平凡研究任务时会在推理中途被终止。可按安装实例调整：

对于快速本地模型可降低此值；对于处理难题的慢速推理模型可提高此值。计时器在子智能体每次发起 API 调用或工具调用时重置——只有真正空闲的工作线程才会触发终止。

零调用超时时的诊断转储

如果子智能体在零次 API 调用的情况下超时（通常原因：provider 不可达、认证失败或工具 schema 被拒绝），delegate_task 会将结构化诊断信息写入 ~/.hermes/logs/subagent-timeout-<session>-<timestamp>.log，其中包含子智能体的配置快照、凭据解析追踪以及早期错误消息。比之前的静默超时行为更易于定位根因。

监控运行中的子智能体（`/agents`）

TUI 提供 /agents 浮层（别名 /tasks），将递归 delegate_task 扇出转化为一级审计界面：

运行中和最近完成的子智能体的实时树形视图，按父智能体分组

每个分支的费用、token 和已触及文件的汇总

终止和暂停控制——可在不中断其兄弟智能体的情况下取消特定子智能体

事后回顾：即使子智能体已返回父智能体，也可逐轮查看其历史记录

经典 CLI 仅将 /agents 打印为文本摘要；TUI 才是浮层真正发挥作用的地方。参见 TUI — 斜杠命令。

深度限制与嵌套编排 {#depth-limit-and-nested-orchestration}

默认情况下，委派是扁平的：父智能体（深度 0）生成子智能体（深度 1），而这些子智能体无法进一步委派。这可防止失控的递归委派。

对于多阶段工作流（研究 → 综合，或对子问题进行并行编排），父智能体可以生成编排者子智能体，这些子智能体可以委派自己的工作线程：

role="leaf"（默认）：子智能体无法进一步委派——与扁平委派行为相同。

role="orchestrator"：子智能体保留 delegation 工具集。受 delegation.max_spawn_depth 约束（默认 1 = 扁平，因此在默认设置下 role="orchestrator" 无效）。将 max_spawn_depth 提高到 2 可允许编排者子智能体生成叶子孙智能体；设为 3 则允许三层（上限）。

delegation.orchestrator_enabled: false：全局开关，无论 role 参数如何，强制所有子智能体为 leaf。

费用警告： 在 max_spawn_depth: 3 和 max_concurrent_children: 3 的情况下，树可达到 3×3×3 = 27 个并发叶子智能体。每增加一层都会成倍增加开销——请谨慎提高 max_spawn_depth。

生命周期与持久性

delegate_task 是同步的——不具备持久性

delegate_task 在父智能体的当前轮次内运行。它会阻塞父智能体，直到所有子智能体完成（或被取消）。它不是后台任务队列：

如果父智能体被中断（用户发送新消息、/stop、/new），所有活跃的子智能体都会被取消并返回 status="interrupted"。其进行中的工作将被丢弃。

子智能体在父智能体轮次结束后不会继续运行。

被取消的子智能体会返回结构化结果（status="interrupted"，exit_reason="interrupted"），但由于父智能体也被中断，该结果通常不会出现在用户可见的回复中。

对于必须在中断后存活或超出当前轮次的持久长时间运行工作，请使用：

cronjob（action=create）——调度独立的智能体运行；不受父智能体轮次中断影响。

terminal(background=True, notify_on_complete=True)——长时间运行的 shell 命令，在智能体执行其他操作时持续运行。

关键特性

每个子智能体获得其独立的终端会话（与父智能体分离）

嵌套委派为可选项——只有 role="orchestrator" 的子智能体可以进一步委派，且仅在 max_spawn_depth 从默认值 1（扁平）提高后才生效。可通过 orchestrator_enabled: false 全局禁用。

叶子子智能体不能调用：delegate_task、clarify、memory、send_message、execute_code。编排者子智能体保留 delegate_task，但仍不能使用其他四个。

中断传播——中断父智能体会中断所有活跃的子智能体（包括编排者下的孙智能体）

只有最终摘要进入父智能体的上下文，保持 token 使用高效

子智能体继承父智能体的 API 密钥、provider 配置和凭据池（支持在速率限制时轮换密钥）

delegate_task 与 execute_code 对比

因素	delegate_task	execute_code
推理	完整 LLM 推理循环	仅 Python 代码执行
上下文	全新隔离对话	无对话，仅脚本
工具访问	所有非屏蔽工具，具备推理能力	通过 RPC 访问 7 个工具，无推理
并行性	默认 3 个并发子智能体（可配置）	单脚本
最适合	需要判断力的复杂任务	机械式多步骤流水线
Token 费用	较高（完整 LLM 循环）	较低（仅返回 stdout）
用户交互	无（子智能体无法澄清）	无

经验法则： 当子任务需要推理、判断或多步骤问题解决时，使用 delegate_task。当需要机械式数据处理或脚本化工作流时，使用 execute_code。

配置

当 base_url 指向 Anthropic 兼容端点时——例如路径以 /anthropic 结尾、Azure Foundry Claude 路由或 MiniMax /anthropic 代理——api_mode 会被自动检测为 anthropic_messages，子智能体无需任何配置即可使用正确的传输格式。当自动检测结果有误时（罕见），请显式设置 api_mode。

提示

智能体会根据任务复杂度自动处理委派。你无需明确要求它进行委派——它会在合适时自行决定。

"子智能体委派"

子智能体委派#

单任务#

并行批处理#

子智能体上下文的工作方式#

实际示例#

并行研究#

代码审查 + 修复#

多文件重构#

批处理模式详情#

模型覆盖#

工具集选择建议#

最大迭代次数#

子智能体超时#

监控运行中的子智能体（/agents）#

深度限制与嵌套编排 {#depth-limit-and-nested-orchestration}#

生命周期与持久性#

关键特性#

delegate_task 与 execute_code 对比#

配置#