OpenAI Codex ก้าวพ้นโค้ด: computer use, อัตโนมัติ, ความจำ และเวิร์กโฟลว์เอเจนต์
การเปิดตัว Codex วันที่ 16 เมษายนทำให้ Codex เปลี่ยนจากผู้ช่วยเขียนโค้ดไปเป็นเอเจนต์สำหรับเวิร์กโฟลว์ซอฟต์แวร์ที่กว้างขึ้น มันสามารถควบคุม Mac ด้วยเคอร์เซอร์ของตัวเอง ใช้เบราว์เซอร์ในแอป สร้างภาพ จดจำความชอบ รันระบบอัตโนมัติ และเชื่อมต่อกับเครื่องมือนักพัฒนาได้ลึกขึ้น
OpenAI ประกาศอะไร
OpenAI ระบุว่า Codex ตอนนี้ให้บริการนักพัฒนามากกว่า 3 ล้านคนต่อสัปดาห์ และกำลังขยายให้ทำงานครอบคลุมวงจรการพัฒนาซอฟต์แวร์ทั้งหมด แอปสามารถใช้การควบคุมคอมพิวเตอร์แบบพื้นหลังบน macOS ทำงานกับเบราว์เซอร์ในแอป สร้างและปรับภาพด้วย gpt-image-1.5 และใช้ปลั๊กอินเพิ่มเติมมากกว่า 90 รายการบนเครื่องมืออย่าง GitLab Issues, CircleCI, CodeRabbit, Render, Microsoft Suite, Atlassian Rovo, Remotion, Neon และ Superpowers
ทำไมสิ่งนี้จึงมากกว่าการปล่อยฟีเจอร์
การเปลี่ยนที่สำคัญคือ Codex กำลังขยับจากงานโค้ดที่แยกขาดไปสู่การปฏิบัติการเวิร์กโฟลว์จริง ทั้งคอมเมนต์รีวิว เทอร์มินัล PDF สเปรดชีต สไลด์ เอกสาร devbox ระยะไกลผ่าน SSH การทำซ้ำเชิงภาพ และงานติดตามผลตามกำหนดเวลา OpenAI ยังบอกด้วยว่าระบบอัตโนมัติแบบ thread-based สามารถเก็บบริบทข้ามวันหรือหลายสัปดาห์ได้ ในขณะที่ memory สามารถเก็บความชอบ การแก้ไข และข้อเท็จจริงของโปรเจ็กต์ที่ได้มาด้วยความยากลำบากไว้ได้
ความเสี่ยง: บริบทที่กว้างขึ้นหมายถึงความสูญเปล่าที่กว้างขึ้น
ฟีเจอร์เดียวกันที่ทำให้ Codex มีประโยชน์มากขึ้น ก็อาจทำให้การรันแพงขึ้นและตรวจสอบยากขึ้นได้ เอเจนต์ที่ใช้ computer use อาจคลิก UI ที่ไม่เกี่ยวข้อง เอเจนต์ที่มี memory อาจพกสมมติฐานเก่าติดมาด้วย เอเจนต์ที่มีปลั๊กอินมากอาจรวบรวมบริบทมากเกินกว่าที่งานต้องใช้ เวิร์กโฟลว์เชิงภาพอาจเผา token ไปกับภาพหน้าจอและลูปตรวจซ้ำที่เกิดขึ้นเรื่อย ๆ
คู่มือปฏิบัติการของ TRH
ก่อนมอบเวิร์กโฟลว์ให้ Codex ให้กำหนดชิ้นงานเป้าหมาย แอปที่อนุญาต ขอบเขตของแหล่งข้อมูล เงื่อนไขหยุด และคำสั่งตรวจสอบ ใช้ระบบอัตโนมัติสำหรับการค้นคว้าและการร่างที่เกิดซ้ำ แต่คงประตูการเผยแพร่ไว้ภายใต้การอนุมัติของมนุษย์ สำหรับทีม ให้ติดตามสัดส่วนระหว่างบริบทที่เก็บมา การกระทำที่ทำไป และชิ้นงานที่ส่งออก นั่นคือจุดต่างระหว่างแรงทุ่นของเอเจนต์กับแรงฉุดของเอเจนต์