Hugging Faceअप्रैल 26, 20266 मिनट

Hugging Face एमएल-इंटर्न प्रशिक्षण के बाद एक एजेंट लूप की तरह दिखता है, न कि एक शोध कतार की तरह

Hugging Face का नया ml-intern रिलीज़ को एक चतुर डेमो के रूप में पढ़ना आसान है। अधिक उपयोगी व्याख्या वास्तुशिल्प है। प्रोजेक्ट पेपर खोज, डेटासेट खोज, कोड जनरेशन, प्रशिक्षण कार्य, मूल्यांकन और Hugging Face पारिस्थितिकी तंत्र में निर्मित एक निरीक्षण योग्य एजेंट लूप में पुनः प्रयास को पैकेज करता है। यह प्रशिक्षण के बाद बिखरी हुई मानव कोरियोग्राफी को एजेंट के बुनियादी ढांचे के करीब में बदल देता है।

क्या हुआHugging Face खुला स्रोत ml-intern, एक लाइव स्पेस प्रकाशित किया, और इसे प्रोडक्ट हंट पर एक एजेंट के रूप में लॉन्च किया जो कागजात पढ़ता है, डेटासेट ठीक करता है, नौकरियां चलाता है, और एमएल मॉडल भेजता है।

बिल्डरों को इसकी परवाह क्यों है?रेपो स्वयं वर्कफ़्लो को उजागर करता है: संदर्भ प्रबंधन, टूल रूटिंग, डूम-लूप डिटेक्शन, अनुमोदन और क्लाउड-जॉब निष्पादन।

TRH कार्रवाईअपने स्वयं के मूल्यांकन, प्रशिक्षण और परिनियोजन प्रक्रिया को एक एजेंट ग्राफ़ के रूप में मानें, जिसे आप एक ढीली नोटबुक अनुष्ठान के बजाय उपकरण, बाधा और पुन: चला सकते हैं।

वास्तविक संकेत केवल स्वायत्तता नहीं है। यह निरीक्षण योग्य स्वायत्तता है

GitHub रिपॉजिटरी ml-इंटर्न को एक ओपन-सोर्स ML इंजीनियर के रूप में वर्णित करती है जो Hugging Face दस्तावेज़, कागजात, डेटासेट, नौकरियां, GitHub खोज और स्थानीय या सैंडबॉक्स टूल का उपयोग करके एमएल-संबंधित कोड पर शोध, लेखन और शिप कर सकता है। README सीधे लूप संरचना को भी उजागर करता है: एक सबमिशन लूप, टूल राउटर, संदर्भ प्रबंधक, अनुमोदन और बार-बार टूल पैटर्न के लिए एक डूम-लूप डिटेक्टर।

यही वह हिस्सा है जिसका बिल्डरों को ध्यान रखना चाहिए। बंद किए गए "एआई शोधकर्ता" डेमो एक सप्ताह के लिए दिलचस्प हैं। ओपन वर्कफ़्लो प्रिमिटिव वर्षों तक उपयोगी होते हैं। एमएल-इंटर्न के साथ, Hugging Face दिखा रहा है कि प्रशिक्षण के बाद के काम को अनुसंधान नोट्स, नोटबुक, डेटासेट, स्क्रिप्ट और क्लाउड नौकरियों के बीच हैंडऑफ़ श्रृंखला के बजाय एक दोहराए जाने योग्य एजेंट सिस्टम के रूप में व्यक्त किया जा सकता है।

वितरण संकेत जितना दिखता है उससे अधिक मजबूत है

परियोजना केवल एक भंडार नहीं है. Hugging Face ने एक सार्वजनिक स्थान भी भेजा और प्रोडक्ट हंट के माध्यम से रिलीज को आगे बढ़ाया, जहां लॉन्च कॉपी पेपर रीडिंग, डेटासेट मरम्मत, प्रशिक्षण-कार्य निष्पादन और बड़े बेंचमार्क लाभ पर प्रकाश डालती है। 26 अप्रैल तक, GitHub रेपो 6.7k सितारे और 611 कांटे दिखाता है, जो वर्कफ़्लो-भारी एमएल टूल के लिए एक असामान्य रूप से मजबूत प्रारंभिक संकेत है।

यह मायने रखता है क्योंकि एजेंट टूलींग निरीक्षण योग्य कलाकृतियों और आसान कांटों के माध्यम से फैलता है। एक बार टीमें रेपो को क्लोन कर सकती हैं, मॉडल प्रदाता को स्वैप कर सकती हैं, लूप को अपने डेटासेट पर इंगित कर सकती हैं, और हेडलेस कमांड चला सकती हैं जैसे ml-intern "fine-tune llama on my dataset", उत्पाद एक शोकेस बनना बंद कर देता है और बुनियादी ढांचे की तरह व्यवहार करना शुरू कर देता है।

यह मॉडल प्रशिक्षण टीमों से परे क्यों मायने रखता है?

TRH पाठकों को इससे सीखने के लिए सीमांत मॉडलों को प्रशिक्षित करने की आवश्यकता नहीं है। महत्वपूर्ण पैटर्न यह है कि Hugging Face ने स्पष्ट उपकरण, अनुमोदन, पुनरावृत्ति सीमा और संघनन के साथ एक अव्यवस्थित मल्टी-स्टेज वर्कफ़्लो को प्रथम श्रेणी एजेंट सिस्टम में बदल दिया। यह वही संरचनात्मक कदम है जो दिखाई दे रहा है समीक्षक-प्रथम कोड एजेंट, एजेंट हार्नेस, और परिनियोजन-केंद्रित एजेंट सीएलआई।

यदि आपकी टीम के पास कोई आवर्ती प्रक्रिया है जो खोज, निर्णय, निष्पादन और मूल्यांकन को मिश्रित करती है, तो आपको उसी आकार में सोचना चाहिए। सवाल यह नहीं है कि "क्या एक एजेंट पूरा काम कर सकता है?" सवाल यह है कि "लूप के किन हिस्सों को स्पष्ट, निरीक्षण योग्य और दोबारा चलाने के लिए सस्ता बनाया जा सकता है?"

इस सिग्नल का क्या करें

एक आंतरिक अनुसंधान या ऑप्स लूप लें और इसे एक एजेंट उत्पाद की तरह मैप करें। टूल्स को परिभाषित करें. अनुमोदन सीमा परिभाषित करें. उस eval को परिभाषित करें जो यह तय करता है कि पुनः प्रयास करना उचित है या नहीं। परिभाषित करें कि लूप कब रुकना चाहिए और मानव को काम सौंपना चाहिए। फिर लागत लिखिए. Hugging Face प्रभावी ढंग से दिखा रहा है कि नियंत्रण विमान मॉडल जितना ही मायने रखता है।

एमएल-इंटर्न जैसे टूल से कंपाउंड करने वाली टीमें वही होंगी जो लूप को संचालित करती हैं, न कि वे जो केवल डेमो की प्रशंसा करती हैं।