Token Robin Hood
诊断 2026 年 4 月 14 日 8分钟

Claude Code 和 Codex:使用量在限制之前泄漏

可见的限制很少不是第一个问题。在它出现之前,通常存在一层操作泄漏,导致每个会话的交付量低于应有的水平。

泄漏1重复的摘要。
泄漏2循环研究。
泄漏3没有治理的上下文增长。

1. 重复的摘要

这是最常见的泄漏。代理阅读一些内容并进行总结。然后它执行一个动作并再次总结。然后它解释了已知的内容。它看起来像是一个风格问题,但在长时间的会话中,它会成为构建时间的经常性负担。

2. 循环研究

当探索不断扩大时,就会出现另一种强烈的模式,因为没有人解决核心问题。如果没有严格的目标,会话会不断打开选项卡、文件和选项。感觉就像发生了很多事情,而真正的交付却保持冻结状态。

  • 有用的研究有一个假设。
  • 昂贵的研究有一个范围。
  • 糟糕的研究变成了没有决定的收集。

3. 夸大的语境

Claude Code 和 Codex 可以处理大量上下文,但这并不意味着更多上下文总是有帮助的。当旧的历史、辅助指示和已经结束的决定留在提示空间时,响应通常会变得更长、更谨慎、更分散。

4.静音模式切换

许多会议以执行开始,以咨询结束。其他人则从回顾开始,然后逐渐进入头脑风暴。没有明确信号的模式转换会产生半动作半叙述的混合反应,这会损害清晰度和效率。

If the agent is talking more than it is delivering, the problem may be operational mode before it is raw usage limits.

如何回应

  • 将任务减少到下一个可观察的工件。
  • 删除不再改变决定的上下文。
  • 仅在实际需要时才请求合成。
  • 设置响应模式:执行、回顾、解释或比较。

TRH的机会

一旦用户了解了使用泄漏的位置,Token Robin Hood 的叙述就会变得更加具体。它不再听起来像一个抽象的生产力承诺,而开始听起来像是一种在会话失去价值的情况下恢复效率的实用方法。

简而言之: 极限是可见的。极限前的泄漏往往不是。这正是 TRH 博客可以教育、捕捉需求并将好奇心转化为产品意图的地方。

href="../index.html">返回博客 href="../静默操作减少混乱并恢复构建时间的手册.html">下一篇文章