OpenAI Codex18 Apr 20268 menit

OpenAI Codex melampaui koding: computer use, otomasi, memori, dan workflow agen

Rilis Codex tanggal 16 April mengubah Codex dari asisten kode menjadi agen yang lebih luas untuk workflow software. Ia bisa mengoperasikan Mac dengan kursornya sendiri, memakai browser bawaan, membuat gambar, mengingat preferensi, menjalankan otomasi, dan terhubung lebih dalam ke alat developer.

Apa yang terjadiCodex mendapatkan computer use, plugin, pembuatan gambar, preview memori, otomasi, SSH, dukungan review PR, dan peningkatan workspace multi-file.

Kenapa ini pentingPekerjaan agen bergerak dari edit kode ke seluruh siklus hidup software.

Aksi TRHTentukan scope, kontrak output, dan batas sumber sebelum membiarkan Codex bergerak lintas aplikasi.

Apa yang diumumkan OpenAI

OpenAI mengatakan Codex kini melayani lebih dari 3 juta developer mingguan dan sedang diperluas untuk bekerja di seluruh siklus pengembangan software. Aplikasi ini bisa memakai kontrol komputer latar belakang di macOS, bekerja dengan browser bawaan, membuat dan mengiterasi gambar dengan gpt-image-1.5, serta memakai lebih dari 90 plugin tambahan di alat seperti GitLab Issues, CircleCI, CodeRabbit, Render, Microsoft Suite, Atlassian Rovo, Remotion, Neon, dan Superpowers.

Kenapa ini lebih dari sekadar drop fitur

Perubahan pentingnya adalah Codex bergerak dari tugas kode yang terisolasi menuju pengoperasian workflow nyata: komentar review, terminal, PDF, spreadsheet, slide, dokumen, devbox jarak jauh lewat SSH, iterasi visual, dan pekerjaan tindak lanjut terjadwal. OpenAI juga mengatakan otomasi berbasis thread bisa mempertahankan konteks selama berhari-hari atau berminggu-minggu, sementara memori bisa menyimpan preferensi, koreksi, dan fakta proyek yang susah diperoleh.

Risikonya: konteks yang lebih luas berarti pemborosan yang lebih luas

Fitur yang membuat Codex lebih berguna juga bisa membuat run lebih mahal dan lebih sulit diaudit. Agen computer use bisa mengeklik UI yang tidak relevan. Agen yang memakai memori bisa membawa asumsi lama. Agen yang kaya plugin bisa mengumpulkan konteks lebih banyak daripada yang dibutuhkan tugas. Workflow visual bisa membakar token pada screenshot dan loop inspeksi yang berulang.

Playbook operasional TRH

Sebelum mendelegasikan workflow ke Codex, tentukan artefak target, aplikasi yang diizinkan, batas sumber, kondisi berhenti, dan perintah verifikasi. Gunakan otomasi untuk discovery berulang dan drafting, tetapi tetap taruh gerbang publish di bawah persetujuan manusia. Untuk tim, lacak rasio antara konteks yang dikumpulkan, tindakan yang diambil, dan artefak yang dikirim. Di situlah perbedaan antara leverage agen dan drag agen terlihat.