Token Robin Hood
खुला पंजा23 अप्रैल, 20265 मिनट

जब आप रीप्ले, टूल पेलोड और समीक्षा ओवरहेड को विभाजित करते हैं तो ओपनक्लॉ लागत ट्रैकिंग तेज हो जाती है

ओपनक्लॉ संचालक एक एजेंट की प्रति माह लागत के अस्पष्ट प्रश्न से आगे बढ़ रहे हैं। अधिक उपयोगी प्रश्न यह है कि एक बार जब आप संदर्भ लोड, टूल पेलोड, पुनः प्रयास, लूप और मानव समीक्षा को अलग कर देते हैं तो एक सफल कार्य की लागत क्या होती है। यह बदलाव मायने रखता है क्योंकि सबसे बड़ा लीक आमतौर पर मॉडल स्टिकर की कीमत नहीं है। यह एक मिश्रित औसत के अंदर छिपा हुआ रीप्ले है।

क्या हुआएक लाइव ओपनक्लॉ थ्रेड में पूछा गया कि लोग एआई एजेंट की लागतों को कैसे ट्रैक कर रहे हैं, और सबसे मजबूत संकेत एक फ्लैट नंबर की रिपोर्ट करने के बजाय रीप्ले स्रोत द्वारा सत्र के योग को अलग करने की आवश्यकता थी।
बिल्डरों को इसकी परवाह क्यों है?प्रति-एजेंट औसत छुपाता है जहां वर्कफ़्लो उसी कार्य को दोबारा पढ़ रहा है, दोबारा भेज रहा है, या दोबारा समीक्षा कर रहा है।
TRH कार्रवाईएक सफल कार्य को शुरू से अंत तक मैप करें, फिर लागत को संदर्भ लोड, टूल पेलोड, पुनः प्रयास और लूप में विभाजित करें, और कुछ भी अनुकूलित करने से पहले समीक्षा करें।

गलत संख्या प्रति एजेंट लागत है

लाइव आर/ओपनक्ला चर्चा उपयोगी है क्योंकि यह सीधे परिचालन संबंधी प्रश्न पूछता है: जब एजेंट वास्तविक काम कर रहे हों तो लोग लागत पर नज़र कैसे रख रहे हैं? एक एकल मिश्रित संख्या साफ-सुथरी लगती है, लेकिन यह आमतौर पर उस कारण को छिपा देती है जिससे दौड़ महंगी लगती है।

यदि एक वर्कफ़्लो पहले पास पर सफल होता है और दूसरा बार-बार संदर्भ पुनः लोड करने, दो पुनः प्रयास लूप और मैन्युअल समीक्षा हॉप के बाद सफल होता है, तो उन रन को समान लागत बकेट के अंदर नहीं बैठना चाहिए। बजट की समस्या "एजेंट" नहीं है। बजट की समस्या यह है कि कौन सा चरण आवश्यकता से अधिक बार दोहराया या पढ़ा जाता है।

रीप्ले ईमानदार लागत लेखांकन को कठिन बना देता है

बेहतर लेखांकन करने के लिए ओपनक्लॉ पहले से ही सत्र लॉग में पर्याप्त कच्चे माल को उजागर करता है, लेकिन केवल तभी जब टीमें इसे परिणाम और रीप्ले स्रोत के आधार पर समूहित करती हैं। व्यावहारिक बकेट सरल हैं: संदर्भ लोड, टूल पेलोड, पुनः प्रयास और लूप, और मानव समीक्षा। एक बार जब वे दिखाई देने लगते हैं, तो प्रति सफल कार्य की लागत प्रति एजेंट लागत या प्रति ग्राहक लागत से अधिक उपयोगी हो जाती है।

यह मायने रखता है क्योंकि बार-बार दोहराए जाने वाले टूल स्कीमा, पहचान ब्लॉक और हार्नेस-स्तरीय पुनर्प्रयास अक्सर अलगाव में हानिरहित दिखते हैं। जब एक ही सफल परिणाम के लिए तीन प्रयासों और एक समीक्षा चरण की आवश्यकता होती है जो टोकन गिनती के आगे कभी दिखाई नहीं देता है तो वे हानिरहित दिखना बंद कर देते हैं।

ऑपरेटरों को आगे क्या मापना चाहिए

प्रत्येक रन को एक कार्य आईडी दें। ट्रैक करें कि क्या रन पूरा हुआ, क्या इसे दोबारा चलाने की आवश्यकता थी, कौन से उपकरण बुलाए गए थे, कितना स्थिर पेलोड फिर से भेजा गया था, और क्या किसी मानव को इसमें कदम रखना था। फिर वर्कफ़्लो, प्रोजेक्ट और दिन के आधार पर समूह बनाएं। यह लागत को मासिक आश्चर्य से परिचालन ट्रेस में बदल देता है।

Token Robin Hood टीमों को यह विश्लेषण करने में मदद करके उस परत को फिट किया जाता है कि परिणाम की गुणवत्ता को उचित ठहराने से पहले उपयोग का विस्तार कहां होता है। मुद्दा गारंटीशुदा बचत का वादा करना नहीं है। मुद्दा यह पता लगाना है कि हार्नेस बार-बार एक ही रनटाइम टैक्स का भुगतान कहां कर रहा है ताकि वर्कफ़्लो को साक्ष्य के साथ अनुकूलित किया जा सके।

अगला व्यावहारिक कदम

ऐसा ओपनक्लॉ वर्कफ़्लो चुनें जो पहले से ही लागत पर धुंधला लगता हो। पहले प्रॉम्प्ट से अंतिम आर्टिफैक्ट तक एक सफल कार्य लॉग करें। बिल को संदर्भ लोड, टूल पेलोड, पुनः प्रयास और लूप में अलग करें और समीक्षा करें। फिर अगले रन से एक दोहराया गया पेलोड या एक रीप्ले पथ हटा दें। यह आमतौर पर किसी अन्य प्रदाता-मूल्य की तुलना की तुलना में वास्तविक रिसाव को तेजी से सामने लाएगा।

सूत्रों का कहना है