ओपनएआई19 अप्रैल, 20267 मिनट

OpenAI एजेंट SDK उत्पादन एजेंटों के लिए देशी सैंडबॉक्स, मेमोरी और हार्नेस नियंत्रण जोड़ता है

ओपनएआई की 15 अप्रैल एजेंट्स एसडीके रिलीज सिर्फ एक और एसडीके अपडेट नहीं है। यह स्टैक में ऊपर की ओर एक कदम है: मॉडल एक्सेस और टूल कॉल से लेकर रनटाइम लेयर तक जो वास्तव में यह निर्धारित करता है कि कोई एजेंट सुरक्षित, टिकाऊ और संचालित करने के लिए किफायती है या नहीं।

क्या हुआOpenAI ने एजेंट SDK में देशी सैंडबॉक्स निष्पादन, कॉन्फ़िगर करने योग्य मेमोरी, Codex-जैसे फ़ाइल टूल, चेकपॉइंटिंग और मल्टी-सैंडबॉक्स ऑर्केस्ट्रेशन पैटर्न जोड़े।

बिल्डरों को इसकी परवाह क्यों है?उत्पादन एजेंटों का सबसे कठिन हिस्सा अब शीघ्र लिखना नहीं है। यह रनटाइम नियंत्रण, अलगाव और भारी खर्च के बिना लंबे कार्यों को जीवित रखना है।

TRH कार्रवाईएजेंट रनटाइम डिज़ाइन को एक टोकन बजट समस्या के रूप में मानें: मेमोरी को सीमित करें, टूल को प्रतिबंधित करें, गणना को अलग करें और आक्रामक तरीके से चेकपॉइंट करें।

OpenAI ने वास्तव में क्या भेजा

ओपनएआई का कहना है कि अपडेटेड एसडीके अब डेवलपर्स को एक मॉडल-नेटिव हार्नेस देता है जो फाइलों का निरीक्षण कर सकता है, कमांड चला सकता है, कोड संपादित कर सकता है और लंबे-क्षितिज कार्यों को संचालित कर सकता है। रिलीज़ में कॉन्फ़िगर करने योग्य मेमोरी, शेल और पैच प्रिमिटिव, एमसीपी और कौशल-शैली प्रगतिशील प्रकटीकरण के लिए समर्थन, साथ ही कार्यक्षेत्र को आकार देने के लिए पोर्टेबल मेनिफेस्ट मॉडल के साथ देशी सैंडबॉक्स निष्पादन शामिल है।

व्यावहारिक बदलाव यह है कि ओपनएआई एजेंट इंजीनियरिंग के अधिक उबाऊ लेकिन महंगे हिस्से की पैकेजिंग कर रहा है: फाइलों को कैसे माउंट किया जाए, आउटपुट कहां जाएं, कंटेनर के खत्म होने के बाद रन कैसे ठीक हो जाएं, और मॉडल-जनरेटेड निष्पादन वातावरण से क्रेडेंशियल्स को कैसे दूर रखा जाए।

यह किसी अन्य टूल सूची से अधिक महत्वपूर्ण क्यों है?

अधिकांश एजेंट डेमो समान कारणों से उत्पादन में विफल हो जाते हैं: सैंडबॉक्स देर से एक साथ सिले जाते हैं, शीघ्र स्थिति रनटाइम स्थिति के साथ मिश्रित हो जाती है, और प्रत्येक पुनः प्रयास खरोंच से शुरू होता है। यह एक चतुर प्रोटोटाइप को टोकन लीक में बदल देता है। ओपनएआई स्पष्ट रूप से डिफ़ॉल्ट पथ को अधिक सुविचारित बनाने की कोशिश कर रहा है: एक नियंत्रित कार्यक्षेत्र, एक स्पष्ट हार्नेस सीमा, और स्नैपशॉटिंग और रिहाइड्रेशन के माध्यम से टिकाऊ निष्पादन।

यह कोडिंग एजेंट, अनुसंधान एजेंट, क्यूए एजेंट और आंतरिक वर्कफ़्लो ऑटोमेशन बनाने वाली टीमों के लिए मायने रखता है। एसडीके अब मॉडल कॉल के चारों ओर एक आवरण की तरह कम दिखता है और ओपनएआई कैसे सोचता है कि उत्पादन एजेंटों का निर्माण किया जाना चाहिए, इसके लिए एक संदर्भ वास्तुकला की तरह अधिक दिखता है।

TRH कोण: रनटाइम गलतियाँ टोकन बर्बादी हैं

बिल्डर्स अक्सर मॉडल की पसंद पर ध्यान केंद्रित करते हैं और रनटाइम आकार को नजरअंदाज करते हैं। वह पीछे की ओर है. शोरगुल वाले हार्नेस के अंदर एक मजबूत मॉडल अभी भी टोकन बर्बाद करता है। व्यापक मेमोरी भंडार, अति-अनुमेय उपकरण और पुन: उपयोग किए गए सैंडबॉक्स एजेंटों को कार्य की आवश्यकता से अधिक स्थिति एकत्र करने में सक्षम बनाते हैं। इसका परिणाम बार-बार फ़ाइल निरीक्षण, पुरानी धारणाएँ और अतिरिक्त तर्क लूप होते हैं जो अंतिम आर्टिफैक्ट को कभी नहीं बदलते हैं।

यदि आप प्रति भुगतान योजना के अनुसार अधिक शिप किया गया कार्य चाहते हैं, तो हार्नेस को उसी तरह डिज़ाइन करें जैसे आप इन्फ्रा डिज़ाइन करते हैं। अधिक संदर्भ खोजने के बजाय यह तय करें कि एजेंट क्या पढ़ सकता है, कहाँ लिख सकता है, कौन से टूल को कॉल कर सकता है, किस स्थिति में चेकपॉइंट है, और रन कब रुकना चाहिए।

बिल्डरों को आगे क्या करना चाहिए

नेट-नए एजेंटों के लिए, सबसे छोटे सैंडबॉक्स और सबसे छोटी मेमोरी सतह से शुरुआत करें जो अभी भी कार्य को सफल बनाती है। एजेंट द्वारा निष्पादित गणना के बाहर क्रेडेंशियल रखें। एकत्र किए गए संदर्भ, लागू किए गए टूल और वास्तव में बदली गई फ़ाइलों के बीच अनुपात को लॉग करें। यदि वह अनुपात बढ़ता रहता है, तो आपका एजेंट गलत आदत सीख रहा है।

मौजूदा ऑटोमेशन के लिए, यह रिलीज़ यह ऑडिट करने के लिए एक अच्छा फ़ोर्सिंग फ़ंक्शन है कि क्या आपका वर्तमान हार्नेस बहुत अधिक कस्टम कार्य कर रहा है जिसे SDK अब अधिक सुरक्षित रूप से अपना सकता है।