Token Robin Hood
OpenAI19 Nis 20267 dakika

OpenAI Agents SDK, üretim aracıları için yerel sanal alanlar, bellek ve donanım kontrolleri ekler

OpenAI'nin 15 Nisan Agents SDK sürümü yalnızca başka bir SDK güncellemesi değil. Bu, yığında yukarı doğru bir harekettir: Model erişimi ve araç çağrılarından, bir aracının güvenli, dayanıklı ve çalıştırmanın uygun fiyatlı olup olmadığını gerçekten belirleyen çalışma zamanı katmanına doğru.

Ne olduOpenAI, Agents SDK'ya yerel sanal alan yürütme, yapılandırılabilir bellek, Codex benzeri dosya araçları, denetim noktası oluşturma ve çoklu sanal alan düzenleme desenleri ekledi.
İnşaatçılar neden önemsiyor?Prodüksiyon temsilcilerinin en zor kısmı artık istem yazmak değil. Harcamaları şişirmeden çalışma zamanı kontrolü, izolasyon ve uzun görevleri canlı tutmaktır.
TRH eylemiAracı çalışma zamanı tasarımını bir belirteç bütçe sorunu olarak ele alın: belleği daraltın, araçları kısıtlayın, bilgi işlemi yalıtın ve agresif bir şekilde kontrol noktası oluşturun.

OpenAI gerçekte ne gönderdi?

OpenAI, güncellenen SDK'nın artık geliştiricilere dosyaları inceleyebilen, komutları çalıştırabilen, kodu düzenleyebilen ve uzun vadeli görevlerde çalışabilen, modele özgü bir donanım sağladığını söylüyor. Sürüm, yapılandırılabilir bellek, kabuk ve yama temel öğeleri, MCP desteği ve beceri tarzı aşamalı açıklamanın yanı sıra çalışma alanını şekillendirmek için taşınabilir bir bildirim modeliyle yerel sanal alan yürütme özelliği ekler.

Pratik değişim, OpenAI'nin aracı mühendisliğinin sıkıcı ama pahalı kısmını daha fazla paketlemesidir: dosyaların nasıl monte edileceği, çıktıların nereye gideceği, bir konteyner öldükten sonra çalıştırmaların nasıl kurtarılacağı ve kimlik bilgilerinin model tarafından oluşturulan yürütme ortamlarının dışında nasıl tutulacağı.

Bu neden başka bir araç listesinden daha önemli?

Çoğu aracı demosu üretimde aynı nedenlerden dolayı başarısız olur: Korumalı alanlar geç birleştirilir, istem durumu çalışma zamanı durumuyla karıştırılır ve her yeniden deneme sıfırdan başlar. Bu, akıllı bir prototipi token sızıntısına dönüştürüyor. OpenAI açıkça varsayılan yolu daha düşünceli hale getirmeye çalışıyor: kontrollü bir çalışma alanı, daha net bir donanım sınırı ve anlık görüntü alma ve yeniden doldurma yoluyla dayanıklı uygulama.

Bu, kodlama aracıları, araştırma temsilcileri, QA temsilcileri ve dahili iş akışı otomasyonları oluşturan ekipler için önemlidir. SDK artık model çağrılarını çevreleyen bir sarmalayıcıdan ziyade OpenAI'nin üretim aracılarının nasıl oluşturulması gerektiğini düşündüğüne dair bir referans mimarisine benziyor.

TRH açısı: çalışma zamanı hataları jeton israfıdır

İnşaatçılar genellikle model seçimine odaklanır ve çalışma zamanı şeklini göz ardı eder. Bu geriye doğru. Gürültülü bir emniyet kemeri içindeki güçlü bir model hâlâ jeton israfına neden oluyor. Geniş bellek depoları, aşırı izin veren araçlar ve yeniden kullanılan sanal alanlar, aracıların görevin gerektirdiğinden daha fazla durum toplamasına neden olur. Sonuç olarak, tekrarlanan dosya incelemeleri, eski varsayımlar ve nihai eseri asla değiştirmeyen ekstra akıl yürütme döngüleri ortaya çıkar.

Ücretli plan başına daha fazla iş gönderilmesini istiyorsanız, koşum takımını da aşağıda tasarladığınız gibi tasarlayın. Aracının neyi okuyabileceğine, nereye yazabileceğine, hangi araçları çağırabileceğine, hangi durumun kontrol noktasına getirileceğine ve daha fazla bağlam aramak yerine bir çalıştırmanın ne zaman durması gerektiğine karar verin.

İnşaatçıların bundan sonra ne yapması gerekiyor?

Ağda yeni aracılar için, görevin başarılı olmasını sağlayan en küçük sanal alan ve en küçük bellek yüzeyiyle başlayın. Kimlik bilgilerini aracı tarafından yürütülen bilgi işlemin dışında tutun. Toplanan bağlam, çağrılan araçlar ve fiilen değiştirilen dosyalar arasındaki oranı günlüğe kaydedin. Bu oran tırmanmaya devam ederse temsilciniz yanlış alışkanlığı öğreniyor demektir.

Mevcut otomasyonlar için bu sürüm, mevcut donanımınızın SDK'nın artık daha güvenli bir şekilde sahip olabileceği çok fazla özel iş yapıp yapmadığını denetlemek için iyi bir zorlama işlevidir.

Kaynaklar