OpenAI Codexはコードの外へ広がる: computer use、自動化、メモリ、エージェントワークフロー
4月16日のCodexリリースにより、Codexは単なるコード支援から、より広いソフトウェアワークフローのエージェントへと変わります。独自のカーソルでMacを操作し、内蔵ブラウザを使い、画像を生成し、設定を記憶し、自動化を走らせ、開発ツールとより深くつながれるようになりました。
OpenAIが発表した内容
OpenAIによれば、Codexはすでに週300万人超の開発者に使われており、今後はソフトウェア開発ライフサイクル全体に広げられます。アプリはmacOSでバックグラウンドのcomputer useを使え、内蔵ブラウザで作業し、gpt-image-1.5で画像を生成・反復し、GitLab Issues、CircleCI、CodeRabbit、Render、Microsoft Suite、Atlassian Rovo、Remotion、Neon、Superpowersなど90以上の追加プラグインを使えます。
これは単なる機能追加以上の変化
重要なのは、Codexが孤立したコード作業から実際のワークフロー運用へ移っていることです。レビューコメント、ターミナル、PDF、スプレッドシート、スライド、ドキュメント、SSH越しのリモートdevbox、ビジュアル反復、予定されたフォローアップ作業まで含みます。OpenAIは、スレッド型の自動化が数日から数週間にわたり文脈を保持し、メモリが好み、修正、苦労して得たプロジェクト情報を保持できるとも述べています。
リスク: 文脈が広がるほど無駄も広がる
Codexをより有用にする同じ機能が、実行コストを上げ、監査も難しくします。computer useのエージェントは無関係なUIをクリックできます。メモリ付きのエージェントは古い前提を持ち込みます。プラグインの多いエージェントは必要以上の文脈を集めます。視覚ワークフローはスクリーンショットや反復的な確認ループでトークンを消費します。
TRH運用プレイブック
Codexにワークフローを委任する前に、目標成果物、許可するアプリ、参照境界、停止条件、検証コマンドを定義してください。定期的な探索や下書きには自動化を使い、公開の最終ゲートは人間の承認に残します。チームでは、集めた文脈、取った行動、出荷した成果物の比率を追ってください。それがエージェントのてこ作用とエージェントの足かせを分けます。