在上周五 Meta 举办的 @Scale 会议上,Claude Code 的创造者 Boris Cherny 遇到了一个来自观众的意外提问:“循环(loops)是下一个炒作周期,还是真实存在的?”Cherny 的回答毫不含糊。“是的,它们是真实存在的,”他说,并直接勾勒出一条从手写源代码到代理编写代码,再到如今代理在持续自我维持的循环中相互提示的新范式。
Cherny 描述了自己工作流程中的一个场景:一个代理不断寻找改进代码架构的方法,而另一个代理则专门查找可合并的重复抽象。这些代理会像人类程序员一样提交拉取请求(pull request)。由于代码库在持续演变,它们永远不会停止。从管理离散的代理任务,到授权一组持久运行的后台代理,这一转变在信任度和能力上都实现了重大飞跃。对大多数用户而言,重点一直在于设定清晰的目标并分阶段检查进度。而循环打破了这一天花板,让 AI 能够无休止地处理开放式问题。
递归——函数调用自身直到满足某个条件——是计算机科学入门课程中的经典内容。然而,代理循环的运行逻辑是非确定性的:由子代理自行决定何时停止,而非依赖硬编码的条件。这既带来了灵活性,也引入了不可预测性。一种流行的实现方式——Ralph 循环(以《辛普森一家》中的 Ralph Wiggum 命名)——只是要求模型总结自己的进展并检查目标是否完成。这是一种粗糙但有效的方法,可以防止模型在长时间运行的任务中偏离方向。
OpenAI 研究员 Noam Brown 近期指出,只要给予足够的算力,当代模型几乎可以解决任何问题。循环正体现了这一原理:开发者无需设计一次性的完美方案,而是可以对一个问题持续投入算力,直到它收敛。这对于代码库改进这类“爬坡”任务尤其有效,因为增量收益会随时间累积。Cherny 举的那个不断无限优化架构的代理例子,正是这一想法的直接应用。
听起来很昂贵?确实如此。代理循环消耗的 token 量远高于简单的问答聊天机器人,而且由于循环设计为持续运行,计算开销没有上限。对于销售 token 的 Anthropic 来说,这是利好;而对于企业用户,则是一个必须谨慎管理的成本。不过,潜在收益可能同样惊人——尤其是对于代码维护、安全补丁以及其他从持续增量改进中受益的任务。关键在于建立对 token 消耗、模型漂移和输出质量的监督机制。
Cherny 在 @Scale 上的发言表明,AI 循环正从实验性技巧转变为严肃的生产技术。随着模型改进和成本变化,运行持久、自我导向的代理集群的能力可能重新定义软件的构建与维护方式。眼下,循环仍是一个新兴概念——但无论是开发者还是高管,都值得密切关注。
Q1:什么是 AI 循环?A:AI 循环是一种配置,其中 AI 代理持续运行某项任务(通常是提示其他代理),没有固定终点,只有在子代理或某种条件判断目标达成时才停止。
Q2:AI 循环与标准代理有何不同?A:标准代理执行离散的任务,有明确的起点和终点。而循环授权代理在后台持续工作,因此适合代码重构或监控等需要持续改进的任务。
Q3:运行 AI 循环成本高吗?A:是的。由于循环持续运行,它们消耗的计算 token 远多于一次性查询。必须仔细监控成本,尽管对某些任务而言,其潜在价值可能超过费用。