Hugging Face ml-intern 讓訓練後看起來像一個代理循環,而不是一個研究隊列
Hugging Face 的新 ml-intern 發布版作為一個巧妙的演示很容易閱讀。更有用的解釋是建築學的。本計畫將論文搜尋、資料集發現、程式碼產生、訓練作業、評估和重試打包到一個跨 Hugging Face 生態系統建構的可檢查代理循環中。這將培訓後從分散的人類編排轉變為更接近代理基礎設施的東西。
ml-intern,發布了一個即時 Space,並在 Product Hunt 上將其作為代理啟動,用於讀取論文、修復資料集、運行作業和發布 ML 模型。真正的訊號不僅僅是自主性。這是可檢查的自主權
GitHub 儲存庫將 ml-intern 描述為開源 ML 工程師,可以使用 Hugging Face 文件、論文、資料集、作業、GitHub 搜尋以及本地或沙箱工具來研究、編寫和發布 ML 相關程式碼。自述文件也直接公開了循環結構:提交循環、工具路由器、上下文管理器、批准和重複工具模式的末日循環檢測器。
這是建構者應該關心的部分。封閉式「人工智慧研究員」演示一週很有趣。開放式工作流程原語多年來一直有用。透過 ml-intern,Hugging Face 展示了訓練後工作可以表示為可重複的代理系統,而不是研究筆記、筆記本、資料集、腳本和雲端作業之間的切換鏈。
分佈訊號比看起來更強
該項目不僅僅是一個儲存庫。 Hugging Face 還發布了一個公共空間,並透過 Product Hunt 推動了發布,其中發布副本強調了論文閱讀、資料集修復、訓練作業執行和大型基準測試收益。截至 4 月 26 日,GitHub 儲存庫顯示有 6700 個 star 和 611 個分支,這對於工作流程繁重的 ML 工具來說是一個異常強烈的早期訊號。
這很重要,因為代理工具透過可檢查的工件和簡單的分叉進行傳播。一旦團隊可以克隆存儲庫,交換模型提供程序,將循環指向他們自己的數據集,並運行無頭命令,例如 ml-intern "fine-tune llama on my dataset",產品不再是展示品,而是開始表現得像基礎設施。
為什麼這比模型訓練團隊更重要
ZXQQQ7QXXZ 讀者無需訓練前緣模型即可從中學習。重要的模式是,Hugging Face 將混亂的多階段工作流程轉變為具有明確工具、審批、迭代限制和壓縮的一流代理系統。這與出現在 審閱者優先的代碼代理, 特工安全帶和以部署為中心的代理 CLI。
如果您的團隊擁有混合搜尋、判斷、執行和評估的任何重複流程,您應該以相同的方式進行思考。問題不是“代理人能做全部事情嗎?”問題是“循環的哪些部分可以變得明確、可檢查並且重新運行成本低廉?”
如何處理這個訊號
採用一個內部研究或營運循環並將其像代理產品一樣映射。定義工具。明確審批邊界。定義決定重試是否值得的 eval。定義循環何時必須停止並將工作交給人工。然後衡量成本。 Hugging Face 有效地顯示了控制平面與模型一樣重要。
由 ml-intern 等工具組合而成的團隊將是那些可操作循環的團隊,而不是那些只欣賞演示的團隊。