Hugging Face ml-intern يجعل ما بعد التدريب يبدو وكأنه حلقة وكيل، وليس قائمة انتظار بحث
Hugging Face الجديد ml-intern الإصدار سهل القراءة باعتباره عرضًا توضيحيًا ذكيًا. التفسير الأكثر فائدة هو المعماري. يقوم المشروع بحزم البحث الورقي، واكتشاف مجموعة البيانات، وتوليد الأكواد، ووظائف التدريب، والتقييم، وإعادة المحاولة في حلقة وكيل واحدة قابلة للفحص ومبنية عبر النظام البيئي Hugging Face. وهذا يحول مرحلة ما بعد التدريب من تصميم الرقصات البشرية المتناثرة إلى شيء أقرب إلى البنية التحتية للعميل.
ml-intern، نشرت مساحة حية، وأطلقتها على Product Hunt كوكيل يقرأ الأوراق، ويصلح مجموعات البيانات، ويدير الوظائف، ويشحن نماذج تعلم الآلة.الإشارة الحقيقية ليست الحكم الذاتي وحده. إنه استقلالية قابلة للتفتيش
يصف مستودع GitHub ml-intern بأنه مهندس تعلم الآلة مفتوح المصدر يمكنه البحث عن التعليمات البرمجية المتعلقة بتعلم الآلة وكتابتها وإرسالها باستخدام مستندات Hugging Face والأوراق ومجموعات البيانات والوظائف وبحث GitHub والأدوات المحلية أو أدوات وضع الحماية. يعرض README أيضًا بنية الحلقة مباشرةً: حلقة إرسال، وموجه أداة، ومدير السياق، والموافقات، وكاشف حلقة الموت لأنماط الأداة المتكررة.
هذا هو الجزء الذي يجب أن يهتم به البناة. العروض التوضيحية المغلقة لـ "باحث الذكاء الاصطناعي" مثيرة للاهتمام لمدة أسبوع. تعتبر أساسيات سير العمل المفتوحة مفيدة لسنوات. باستخدام ml-intern، يوضح Hugging Face أنه يمكن التعبير عن عمل ما بعد التدريب كنظام وكيل قابل للتكرار بدلاً من سلسلة تسليم بين الملاحظات البحثية والدفاتر ومجموعات البيانات والبرامج النصية والوظائف السحابية.
إشارة التوزيع أقوى مما تبدو
المشروع ليس مجرد مستودع. قامت Hugging Face أيضًا بشحن مساحة عامة ودفعت بالإصدار من خلال Product Hunt، حيث تسلط نسخة الإطلاق الضوء على قراءة الورق وإصلاح مجموعة البيانات وتنفيذ مهام التدريب ومكاسب قياسية كبيرة. اعتبارًا من 26 أبريل، يُظهر GitHub repo 6.7 ألف نجمة و611 شوكة، وهي إشارة مبكرة قوية بشكل غير عادي لأداة ML كثيفة سير العمل.
وهذا مهم لأن أدوات الوكيل تنتشر من خلال القطع الأثرية القابلة للفحص والشوك السهلة. بمجرد أن تتمكن الفرق من استنساخ الريبو، وتبديل موفر النموذج، وتوجيه الحلقة إلى مجموعات البيانات الخاصة بهم، وتشغيل أوامر بدون رأس مثل ml-intern "fine-tune llama on my dataset"، يتوقف المنتج عن كونه واجهة عرض ويبدأ في التصرف مثل البنية التحتية.
لماذا يهم هذا خارج فرق التدريب النموذجية
لا يحتاج قراء TRH إلى تدريب النماذج الرائدة للتعلم من هذا. النمط المهم هو أن Hugging Face حول سير العمل الفوضوي متعدد المراحل إلى نظام وكيل من الدرجة الأولى مع أدوات وموافقات وحدود تكرار وضغط واضحة. هذه هي نفس الحركة الهيكلية التي تظهر فيها وكلاء التعليمات البرمجية للمراجعين أولاً, يسخر وكيلوCLIs للوكيل الذي يركز على النشر.
إذا كان فريقك يمتلك أي عملية متكررة تمزج بين البحث والحكم والتنفيذ والتقييمات، فيجب أن تفكر بنفس الطريقة. السؤال ليس "هل يستطيع الوكيل أن يفعل كل شيء؟" والسؤال هو "ما هي أجزاء الحلقة التي يمكن جعلها واضحة وقابلة للفحص ورخيصة الثمن لإعادة التشغيل؟"
ما يجب القيام به مع هذه الإشارة
خذ بحثًا داخليًا أو حلقة عمليات ورسم خريطة لها مثل منتج الوكيل. تحديد الأدوات. تحديد حدود الموافقة. حدد التقييم الذي يقرر ما إذا كانت إعادة المحاولة تستحق العناء أم لا. حدد متى يجب أن تتوقف الحلقة وتسلم العمل إلى الإنسان. ثم صك التكلفة. يُظهر Hugging Face بشكل فعال أن مستوى التحكم مهم بقدر أهمية النموذج.
الفرق التي تتكون من أدوات مثل ml-intern ستكون هي التي تقوم بتشغيل الحلقة، وليس تلك التي تعجب بالعرض التوضيحي فقط.