OpenAI Codex走出程式碼: computer use、自動化、記憶與代理工作流
4月16日的Codex發佈把Codex從程式碼助手變成更廣的軟體工作流代理。它可以用自己的游標操作Mac,使用內建瀏覽器,生成影像,記住偏好,執行自動化,並更深入地連接開發者工具。
發生了什麼Codex新增了computer use、外掛、影像生成、記憶預覽、自動化、SSH、PR審查支援,以及多檔案工作區改進。
為什麼重要代理工作正從程式碼編輯擴展到整個軟體生命週期。
TRH動作在讓Codex跨應用操作之前,先定義範圍、輸出契約與來源邊界。
OpenAI宣布了什麼
OpenAI表示,Codex現在每週服務超過300萬名開發者,並正在擴展到完整的軟體開發生命週期。這個應用可以在macOS上使用背景computer use,透過內建瀏覽器工作,用gpt-image-1.5生成並反覆修改影像,還能在GitLab Issues、CircleCI、CodeRabbit、Render、Microsoft Suite、Atlassian Rovo、Remotion、Neon、Superpowers等工具上使用90多個額外外掛。
為什麼這不只是功能堆疊
真正重要的變化是,Codex正從孤立的程式碼任務轉向真實工作流的運行:審查評論、終端機、PDF、試算表、簡報、文件、透過SSH的遠端devbox、視覺迭代,以及排程後續工作。OpenAI也表示,基於執行緒的自動化可以跨越幾天或幾週保留脈絡,而記憶可以保存偏好、修正與辛苦累積的專案事實。
風險:脈絡越廣,浪費也越廣
讓Codex更有用的同一批功能,也會讓執行成本更高、更難稽核。computer use代理可能會點擊無關的介面。具記憶能力的代理可能攜帶過時假設。外掛很多的代理可能蒐集超出任務需要的脈絡。視覺工作流可能把token燒在截圖與重複檢查迴圈上。
TRH操作手冊
在把工作流委派給Codex之前,先定義目標產物、允許的應用、來源邊界、停止條件與驗證命令。把自動化用於重複性的探索與草稿,但讓發佈關卡繼續由人工核准。對團隊來說,要追蹤已蒐集脈絡、已執行動作與已交付產物之間的比例。這就是代理槓桿與代理拖累的分界線。