Token Robin Hood
OpenAI2026 年 4 月 25 日5分鐘

OpenAI GPT-5.5 發揮編碼代理效率:更多完成的工作、更少的令牌、相同的延遲

OpenAI 4 月 23 日推出的 GPT-5.5 很容易理解为另一个型号升级。更有用的建構器角度是可操作的。 OpenAI 表示,GPT-5.5 提高了編碼和電腦使用效能,同時在相同的 Codex 任務上使用更少的代幣,並且在 4 月 24 日也確認了 API 的可用性。這改變了團隊評估編碼代理的方式:不僅透過基準分數或每個代幣的價格,還透過在審核摩擦出現之前每次運行完成了多少實際工作。

發生了什麼事OpenAI於2026年4月23日推出了GPT-5.5,然後於4月24日更新了版本,稱GPT-5.5和GPT-5.5 Pro可在API中使用。
為什麼建築商關心OpenAI 明確地將勝利定義為使用更少的代幣和類似的服務延遲完成更完整的編碼工作,而不僅僅是更聰明的模型。
TRH 動作將 GPT-5.5 與目前編碼代理預設值進行比較時,追蹤每個已完成任務的成本、重試計數並查看負載。

真正的指標是每次運行完成的工作

OpenAI 表示,GPT-5.5 是迄今為止最強的代理程式編碼模型,並引用了 Terminal-Bench 2.0、SWE-Bench Pro、Expert-SWE、OSWorld-Verified、Toolathlon 和 ZXQTERM14。這是有用的上下文,但對於操作員來說更尖銳的句子在版本中的其他地方:GPT-5.5 通常使用更少的令牌和更少的重試來達到更高品質的輸出,同時匹配現實世界服務中的 GPT-5.4 每個令牌延遲。

这很重要,因为编码代理的昂贵部分通常不是单一的推理。這是整個循環:計劃、檢查文件、呼叫工具、重試、測試、修復和手動返回進行審查。如果模型在崩潰之前關閉了更多的循環,則有用的指標將變成每次運行完成的工作。為了 Token Robin Hood 讀者們,這比追逐原始基準螢幕截圖或單獨爭論標價更好。

OpenAI 也正在擴大 Codex 的營運故事

GPT-5.5 適合更廣泛的 OpenAI 序列。 Codex 實驗室和企業推出計劃 推動了受監管的採用。 工作區代理 將代理擴展到團隊工作流程。 響應中的 WebSocket 模式 API 使代理循環在延遲方面更便宜。 GPT-5.5 在頂部添加了模型級聲明:現在可以用更少的令牌阻力完成相同的工作流程。

這使得 GPT-5.5 不再是一個孤立的版本,而是整個堆疊中的一個效率層。如果您的團隊已經擁有代理利用、評估和審核流程,那麼問題不是“GPT-5.5 更聰明嗎?”問題是“在人工修正成為瓶頸之前,它是否會關閉更多的票證、重構和調試會話?”

為什麼 4 月 24 日的 API 更新很重要

OpenAI 的發行說明於 2026 年 4 月 24 日更新,表示 GPT-5.5 和 GPT-5.5 Pro 在 API 中可用。這很重要,因為它將 GPT-5.5 從產品興奮轉變為建築商規劃。 Reddit 的討論立即反映了實際問題:人們已經嘗試在 Codex 和 CLI 工作流程中使用它,並且正在關注模型何時真正可以跨曲面選擇。

對於運行內部編碼代理的團隊來說,API 可用性是將發布轉變為在您自己的環境中進行基準測試的產品。一旦可以透過程式設計方式存取模型,您就可以比較任務完成率、令牌花費、掛鐘時間,並根據當前基準查看差異,而不是從供應商圖表推斷所有內容。

團隊接下來該做什麼

在狭窄的高信号评估集上运行 GPT-5.5:通过测试修复错误、分支合并冲突、存储库范围的重构以及使用工具的调试循环。測量總代幣消耗、每個任務的重試、代理停止後的人工編輯以及第一個計劃方向正確的頻率。如果GPT-5.5減少了清理負擔,那才是真正的營運收益。如果不是,基準測試的勝利並不像看起來那麼重要。

從此版本中受益的團隊將是比較已完成工作的團隊,而不僅僅是模型標籤。

來源