维克多·科英布拉因在人工智能创新领域做出的杰出贡献,入选了《福布斯》巴西“30岁以下精英榜”。他共同Artefact拉丁美洲Artefact业务,该业务现已发展成为拥有200名员工的全球技术中心。他在扩展人工智能解决方案以及在国际市场上组建高绩效技术团队方面拥有深厚的专业知识。
在第一部分中,我们探讨了以下问题:人工智能系统会随时间推移而性能下降,基准测试结果掩盖了实际应用中的故障,甚至经验丰富的专业人士在使用人工智能辅助时,工作效率可能反而低于不使用时。发展前景令人鼓舞,但当前的现实却乱象丛生。
那么,如何构建能够让人持续数小时保持专注的系统呢?
不同研究领域已提出三种方法,它们都致力于解决同一个根本性问题:当人工智能系统的工作记忆有限时,如何保持连贯的进展?
方法 1:重新开始循环
2025年底,一种名为“拉尔夫·威格姆”的技法在从业者中迅速走红。这个名字源自《辛普森一家》中的一个角色——之所以起得如此滑稽,是因为其核心理念简单得近乎尴尬。
让 AI 运行。一旦效果开始变差,就停止它。重新开始。让它从上次中断的地方继续。
就是这样。AI 会持续处理一项任务,直到其表现开始下降。随后它会停止运行,将进度保存到文件中,并退出。新一轮处理将从头开始。AI 会读取已完成的内容,识别剩余的工作,然后继续进行。
理念:别再与内存限制作对,而是善加利用。每次工作会话都独立运行。进度记录保存在文档和日志中,而非存储在 AI 的“脑海”里。
实际应用中的表现
典型的实现过程分为三个阶段:
- 第一阶段(需求):人类与人工智能协作,确定需要完成的工作。最终产出是一份清晰明确的需求规格说明书。
- 第二阶段(规划):AI分析需求规格与当前状态之间的差距。输出:一份按优先级排序的任务清单。目前尚未开展实际工作。
- 第3阶段(执行):AI 每次会话处理一项任务。完成任务,验证是否成功,记录已完成的工作,退出。开始新会话。重复上述步骤。
关键限制:任务必须具有明确可衡量的完成标准。对于模糊的需求、需要主观判断的情况,或是没有明确终点的探索性工作,这种方法效果不佳。
早期采用者的反馈
虽然这些数据来自从业者的自我报告而非对照研究,但其数字依然令人震惊。
一位顾问通过在夜间运行自动化会话,仅花费不到300美元的人工智能成本,就完成了原本价值5万美元的项目。一家初创团队在一夜之间完成了六项主要交付成果,包括可运行的输出结果、验证和文档。一位从业者通过三个月的自动化会话,开发出了一款完整的产品。
对于需要进行50次以上训练课程的大型项目,费用通常在50至100美元之间。每次训练课程在骑行前持续30至45分钟。
Anthropic 于 2025 年 12 月将这一方法正式化,并发布了官方支持。该方法由此从权宜之计转变为被认可的方法论。
限制
在充满不确定性的世界中,这种方法具有确定性。正如一位从业者所言:“与其不可预测地成功,不如可预测地失败。”
这既是优势,也是局限。当你能明确界定成功时,从头开始的迭代方法就能奏效;但当成功标准主观、质量难以量化,且“正确”答案需要依靠人的判断才能识别时,这种方法就会遇到困难。
方法 2:选择性记忆
“全新开始”模式会在每次迭代结束后清空所有数据。每个迭代周期都从零开始。如果能有选择地保留重要部分,会怎样?
选择性记忆采取了不同的方法:提取并存储关键信息,舍弃其余内容。人工智能无需从头开始,而是继承了一份经过筛选的重要信息摘要。
双角色模式
一种常见的实现方式是使用两个专门的AI角色:
- 设置角色:仅在开始时运行。建立上下文,识别关键信息,创建初始参考文档。
- 职责:负责处理后续的所有会议。通过以下三项工作成果确保工作连续性:一个显示已完成和待办事项的进度跟踪器、一个标注已完成或待办事项的检查清单,以及一个显示修改内容及原因的变更记录。
本次会议的开始流程明确如下:确认当前状态,审阅进度文件,选定剩余工作中优先级最高的一项,并在开展新工作前核对基准。
与“从头开始”的循环模式相比,其区别在于压缩步骤。“工作角色”会继承一份经过筛选的相关上下文摘要。研究表明,这种方法能让 AI 仅使用原本所需信息量的 16% 即可完成长任务序列,从而将开销降低了 84%。
高级记忆:关系维护
选择性记忆领域的最新进展不仅能保存事实,还能保存事物之间的关联。
试想一下人类是如何记忆项目的。我们不仅仅是在回忆孤立的事实。我们会记得某个决定导致了某种后果,某个人承担着某项责任,某份文件与某项要求相关。这些关联与内容本身同样重要。
先进的AI记忆系统如今能够捕捉这些关联。在存储信息时,它们不仅提取事件本身,还会提取事件涉及的对象、事件的关联对象以及事件的重要性。在检索信息时,它们能够通过追踪这些关联线索来重构上下文。
这些系统的性能指标:质量评估提升 26%。在保持一致性的同时,信息开销减少 90% 以上。对跨多个会话的任务处理能力显著提升。
权衡
选择性记忆增加了复杂性。你需要存储和检索的基础设施。你需要决定保留什么、舍弃什么。你需要相信压缩过程能保留关键内容。
这并非一个已解决的问题。记忆系统可能会遗漏关键细节。压缩可能会引入细微的失真。人工智能可能会在错误的时间调取错误的上下文。84%的压缩率听起来很惊人,但如果你保留的16%中缺少了某些关键内容,那一切就都白费了。
方法 3:团队协调
如果答案并非一个拥有更强记忆力的人工智能,而是多个职责分明的人工智能系统,会怎样?
团队协调将复杂的工作分解为由中央管理者协调的专门角色。每个角色都有明确的职责范围、有限的信息需求以及具体的工作任务。管理者把握全局,并仅将相关信息分发给每位工作人员。
幕后的规律
领先的人工智能公司都在内部使用这一方案。其结构如下:
协调员:一个功能强大的人工智能系统,负责分析请求、制定方案、管理记忆以及指挥专家。
专家型系统:专注于特定任务并并行运行的AI系统。
结果表明:在复杂的研究任务中,基于团队的系统比单一人工智能系统表现高出90%。这绝非微不足道的进步,而是性能几乎翻了一番。
关键洞见:在基于团队的人工智能领域,信息管理解释了80%的绩效差异。相比之下,具体使用的工具和人工智能模型的重要性,远不如角色之间信息流动的方式。
两种协调模式
交接模式:一个 AI 系统在任务进行中将控制权移交给另一个系统。双方都了解彼此,并自行决定何时进行交接。工作线程继续运行,但责任已转移。该模式适用于顺序式、分阶段的工作流。
经理模式:由一个中央协调器向专家分配任务并收集结果。专家返回输出结果;协调器保留控制权并做出决策。主线程不进行交接。该模式适用于并行处理和结果合成。
选择取决于您的工作流程。当任务能自然分解为各个阶段时,交接模式效果良好;当您需要在集中决策的同时进行并行处理时,管理模式则更为适用。
行业标准化
2025年,业界对人工智能系统之间以及与外部资源的连接方式进行了标准化。这就像电源插座的标准化一样——不同厂商的产品现在可以互操作了。
一项标准定义了人工智能如何连接信息源和工具;另一项标准则定义了人工智能系统如何相互通信。这两项标准共同构成了可自由组合、形成不同配置的构建模块。
这一点至关重要,因为它实现了模块化。一个团队构建的工作流可以整合另一个团队开发的组件。存储系统变得可以互换。信息源变得可被发现。“AI生态系统”并非营销噱头——它是这些标准所促成的技术现实。
《The Overhead》
基于团队的 AI 所消耗的资源约为单交互式 AI 的 15 倍。这就是协调所需的代价。对于简单任务而言,这种开销远大于其带来的收益;而对于复杂任务,可靠性提升则足以证明这种投入是值得的。
故障模式也更加复杂。由于切换设计不佳,某家电商公司在AI切换过程中因操作混乱导致用户流失率高达40%。连锁故障可能在AI网络中蔓延。一份2025年的行业分析报告指出了14种独特的故障模式,涉及系统设计、协调失灵和质量验证等方面。
选择合适的方法
以下是我对这些选项的看法:
- “重新开始”式迭代在以下情况下行之有效:任务的完成情况具有明确的可衡量标准;你能接受可预见的渐进式进展;进展情况能够通过文档和记录完整地记录下来;并且你更倾向于简单而非复杂。
- 当任务需要在不同会话之间保持关系、具备存储和检索的基础设施、大规模场景下效率至关重要,并且能够投入资源构建压缩系统时,选择性内存便能发挥作用。
- 团队协作在以下情况下行之有效:任务能自然分解为专门化的子任务;需要并行处理;协调开销(15倍的资源)在可接受范围内;并且能够应对更复杂的故障模式。
大多数生产系统都会结合这三种模式的要素。例如,一种基于团队的系统,其中每位专家都采用“从头开始”的循环模式;或者一种由内存增强型协调器来指挥无状态工作者的系统。这些方法是相辅相成的,而非相互排斥的。
共同点在于:这三种方法都将人工智能无法在内部可靠维护的信息外部化。它们的区别在于外部化的程度以及信息检索的管理方式。
在第三部分中,我们将探讨长期运行的AI对组织意味着什么:工作方式将如何改变、需要什么样的治理机制,以及2026年有哪些切实可行的机遇。
参考文献
研究论文
- 利用可扩展的长期记忆构建生产级人工智能 —arxiv.org/abs/2504.19413
- 基于多图的人工智能内存架构 —arxiv.org/abs/2601.03236
- 生产环境中的人工智能评估 —arxiv.org/abs/2512.04123
行业报告与白皮书
- AI 系统的故障模式 — 微软
- 2025年关于人工智能与信任的启示 — GoogleCloud
- 人工智能工程现状 — LangChain
- 基准测试与实际应用评估 — METR
技术文档
- 我们如何构建多智能体研究系统 — Anthropic
- 模型上下文协议规范 — modelcontextprotocol.io
- 《Fresh-Start Cycling》文档(“Ralph Wiggum”)——Geoffrey Huntley (ghuntley.com/ralph/)

博客






