OpenAI Codex melampaui koding: computer use, otomasi, memori, dan workflow agen
Rilis Codex tanggal 16 April mengubah Codex dari asisten kode menjadi agen yang lebih luas untuk workflow software. Ia bisa mengoperasikan Mac dengan kursornya sendiri, memakai browser bawaan, membuat gambar, mengingat preferensi, menjalankan otomasi, dan terhubung lebih dalam ke alat developer.
Apa yang diumumkan OpenAI
OpenAI mengatakan Codex kini melayani lebih dari 3 juta developer mingguan dan sedang diperluas untuk bekerja di seluruh siklus pengembangan software. Aplikasi ini bisa memakai kontrol komputer latar belakang di macOS, bekerja dengan browser bawaan, membuat dan mengiterasi gambar dengan gpt-image-1.5, serta memakai lebih dari 90 plugin tambahan di alat seperti GitLab Issues, CircleCI, CodeRabbit, Render, Microsoft Suite, Atlassian Rovo, Remotion, Neon, dan Superpowers.
Kenapa ini lebih dari sekadar drop fitur
Perubahan pentingnya adalah Codex bergerak dari tugas kode yang terisolasi menuju pengoperasian workflow nyata: komentar review, terminal, PDF, spreadsheet, slide, dokumen, devbox jarak jauh lewat SSH, iterasi visual, dan pekerjaan tindak lanjut terjadwal. OpenAI juga mengatakan otomasi berbasis thread bisa mempertahankan konteks selama berhari-hari atau berminggu-minggu, sementara memori bisa menyimpan preferensi, koreksi, dan fakta proyek yang susah diperoleh.
Risikonya: konteks yang lebih luas berarti pemborosan yang lebih luas
Fitur yang membuat Codex lebih berguna juga bisa membuat run lebih mahal dan lebih sulit diaudit. Agen computer use bisa mengeklik UI yang tidak relevan. Agen yang memakai memori bisa membawa asumsi lama. Agen yang kaya plugin bisa mengumpulkan konteks lebih banyak daripada yang dibutuhkan tugas. Workflow visual bisa membakar token pada screenshot dan loop inspeksi yang berulang.
Playbook operasional TRH
Sebelum mendelegasikan workflow ke Codex, tentukan artefak target, aplikasi yang diizinkan, batas sumber, kondisi berhenti, dan perintah verifikasi. Gunakan otomasi untuk discovery berulang dan drafting, tetapi tetap taruh gerbang publish di bawah persetujuan manusia. Untuk tim, lacak rasio antara konteks yang dikumpulkan, tindakan yang diambil, dan artefak yang dikirim. Di situlah perbedaan antara leverage agen dan drag agen terlihat.