工程师不再为AI编写提示词。他们设计自主运行的循环,让智能体自主工作——这一转变在三年内压缩了四个截然不同的编码时代。
工程师不再为AI编写提示词。他们设计自主运行的循环,让智能体自主工作——这一转变在三年内压缩了四个截然不同的编码时代。

工程师不再为AI编写提示词。他们设计自主运行的循环,让智能体自主工作——这一转变在三年内压缩了四个截然不同的编码时代。
英伟达的黄仁勋宣布提示词编写已过时,标志着循环工程的到来——工程师不再输入指令,而是设计自主反馈系统,在三年内压缩了四个截然不同的AI编码时代。
"已经没人写提示词了,"黄仁勋表示。"新的工作是编写和处理循环。"Anthropic旗下Claude Code的创造者鲍里斯·切尔尼也描述了类似的转变:"我不再为Claude编写提示词了。我运行一些循环,告诉Claude该做什么,并决定下一步发生什么。"
Claude Code目前提供三种循环原语——/loop用于定时循环,/goal用于目标驱动执行直到验证通过,/schedule用于基于云端的无人值守运行。/goal命令强制执行一条关键架构规则:编写代码的模型不能验证自己的输出。Anthropic通过其大模型进行代码生成,同时由另一个独立的小型Haiku模型负责验收测试。OpenAI的Codex则采取并行方式,在隔离的云端沙箱中启动多达八个智能体,各自处理子任务后再合并结果。
从提示词到循环的转变对AI基础设施支出具有直接影响。相比单次提示工作流,自主循环系统每项任务消耗的Token更多,从而增加了对推理计算的需求。英伟达作为驱动这些多智能体循环的GPU主要供应商将持续受益,而云服务提供商——亚马逊AWS、微软Azure和谷歌云——则竞相争夺增量工作负载。上周刚提交IPO申请的Anthropic已将循环架构直接嵌入Claude Code,有望加速企业采用并带动API经常性收入增长。
四个阶段的演进轨迹清晰可辨。2023年至2024年,提示工程占据主导地位——用户为每次交互精心编写指令,输出质量完全取决于提示词的精细程度。大约2024年至2025年,上下文工程将焦点从"如何提问"转向"向模型展示什么",RAG管道和代码库集成扩展了每次查询可用的信息量。到2025年至2026年,工具工程兴起,智能体获得了访问工具、API和真实执行环境的能力。循环工程作为第四阶段,也是当前阶段,通过让智能体自主运行——无需人工逐步骤干预即可规划、执行、验证和重试——完成了整个循环的闭环。
循环背后的架构
核心思路是职责分离。在Claude Code的/goal系统中,一个模型生成代码,而一个独立的验证器——一个无法看到生成器推理过程的其他模型——对输出进行测试。这避免了单一模型工作流中常出现的"给自己的作业打分"问题。验证器会拒绝那些看似合理但未通过功能测试的输出,迫使生成器重新进入循环。
谷歌工程主管、也是循环工程这一术语的创造者阿迪·奥斯马尼对此持谨慎态度。"还为时过早。我暂且保留看法。你必须对Token成本非常小心,"他写道。这一警告并非空谈:缺乏硬性停止条件——Token限制、迭代上限或时间边界——的循环系统可能会一直运行到预算耗尽或触及API速率限制。
"理解债务"问题
安德烈·卡帕西在红杉资本2026年AI峰会上发表演讲,对自动化热潮提出了不同看法。"你可以外包你的思考,但不能外包你的理解,"他引用了一句他多次回味的话。当循环合并代码的速度快于人类审查速度时,工程师会积累"理解债务"——团队中无人能完全理解的系统。卡帕西指出,实际成本并非Token账单,而是有一天某人必须调试一个没人读过的系统。
切尔尼称自己在2025年11月删除了集成开发环境,现在通过手机管理着数百个智能体。他承认这一取舍存在的代价。无法自行解决的智能体会升级到他的收件箱。他的工作流程代表了循环方法的终极状态:人类编写规则并做出判断,智能体执行其余一切。
循环系统的学术基础可追溯至姚顺宇2022年提出的ReAct框架(推理+行动),该研究被评为ICLR 2023口头报告论文,累计被引数万次。ReAct正式确立了支撑每个现代智能体循环的思考-行动-观察周期。后续工作——Reflexion的错误反馈机制、思维树的多元路径搜索以及一系列工具使用智能体论文——最终汇聚为如今被称为循环工程的工程学科。
对投资者而言,关键指标是每次验收变更的成本。如果循环的验收率低于50%,系统就在亏损——人类在做本该由循环自动完成的审查工作。随着企业大规模部署循环架构,赢家将是那些在最大化自主吞吐量的同时最小化Token浪费的企业。
本文仅供参考,不构成投资建议。