Token Robin Hood
開放人工智慧2026 年 4 月 19 日7分鐘

OpenAI Agents SDK 增加了用於生產代理的本機沙箱、記憶體和線束控制

OpenAI 於 4 月 15 日發布的 Agents SDK 不僅僅是另一個 SDK 更新。這是堆疊的向上移動:從模型存取和工具呼叫到運行時層,它實際上決定了代理是否安全、耐​​用且可負擔得起的操作。

發生了什麼事OpenAI 在 Agents SDK 中新增了本機沙箱執行、可設定記憶體、類似 Codex 的檔案工具、檢查點和多沙箱編排模式。
為什麼建築商關心製作代理商最難的部分不再是提示寫作。它是運行時控制、隔離,並在不增加支出的情況下保持長時間任務的運行。
TRH 行動將代理程式運行時設計視為令牌預算問題:縮小記憶體、限制工具、隔離計算和積極檢查點。

OpenAI 實際出貨了什麼

OpenAI 表示,更新後的 SDK 現在為開發人員提供了一個模型原生工具,可以檢查檔案、運行命令、編輯程式碼以及跨長期任務進行操作。此版本添加了可配置記憶體、shell 和補丁原語、對 MCP 和技能風格漸進公開的支持,以及具有用於塑造工作空間的可移植清單模型的本機沙箱執行。

實際的轉變是,OpenAI 正在打包代理工程中更多無聊但昂貴的部分:如何掛載文件、輸出去哪裡、容器死亡後如何恢復運行以及如何將憑證排除在模型生成的執行環境之外。

為什麼這比其他工具清單更重要

大多數代理演示在生產中失敗的原因相同:沙箱後期縫合在一起,提示狀態與運行時狀態混合,並且每次重試都從頭開始。這將一個聰明的原型變成了令牌洩漏。 OpenAI 顯然試圖使預設路徑更加固執己見:受控的工作空間、更清晰的線束邊界以及透過快照和補水實現的持久執行。

這對於建立編碼代理、研究代理、品質保證代理和內部工作流程自動化的團隊來說很重要。現在,SDK 看起來不再像模型呼叫的包裝器,而更像是 OpenAI 認為應如何建構生產代理的參考架構。

TRH 角度:運行時錯誤是令牌浪費

建構者經常關注模型選擇而忽略運行時形狀。那是倒退。嘈雜的線束中的強大模型仍然會浪費代幣。寬記憶體儲存、過度寬鬆的工具和重複使用的沙箱使代理程式收集的狀態超過任務所需的狀態。結果是重複的文件檢查、過時的假設和永遠不會改變最終工件的額外推理循環。

如果您希望每個付費方案交付更多工作,請像下面的設計一樣設計線束。決定代理可以讀取什麼、可以在哪裡寫入、可以呼叫哪些工具、設定檢查點的狀態以及何時應停止運作而不是搜尋更多上下文。

建設者下一步該做什麼

對於全新的代理,從最小的沙箱和最小的記憶體表面開始,仍然可以讓任務成功。將憑證保留在代理執行的計算之外。記錄收集的上下文、調用的工具和實際更改的檔案之間的比率。如果該比率持續上升,則表示您的代理商正在養成錯誤的習慣。

對於現有的自動化,此版本是一個很好的強制功能,可以審核您目前的工具是否正在執行過多的自訂工作,而 SDK 現在可以更安全地擁有這些工作。

來源