Google डीप रिसर्च मैक्स एमसीपी और देशी विज़ुअल जोड़ता है: अनुसंधान एजेंट पुन: प्रयोज्य बिल्डर पाइपलाइन बन रहे हैं
Google का 21 अप्रैल का डीप रिसर्च अपडेट चैटबॉट फीचर के रूप में कम और एजेंट-सिस्टम मूव के रूप में अधिक मायने रखता है। जेमिनी डीप रिसर्च और डीप रिसर्च मैक्स अब खुले वेब को निजी डेटा के साथ मिला सकते हैं, चार्ट इनलाइन तैयार कर सकते हैं, और पृष्ठभूमि अनुसंधान नौकरियों के रूप में चला सकते हैं जो श्रृंखला में अगले मॉडल को फीड करते हैं।
Google ने वास्तव में क्या शिप किया
Google का कहना है कि नए एजेंट जेमिनी 3.1 प्रो पर बनाए गए हैं और अब अनुसंधान वर्कफ़्लो का समर्थन करते हैं जो वेब खोज, रिमोट एमसीपी सर्वर, अपलोड की गई फ़ाइलें, कनेक्टेड फ़ाइल स्टोर, यूआरएल संदर्भ, कोड निष्पादन और फ़ाइल खोज को जोड़ते हैं। कंपनी ने उत्पाद को दो मोड में विभाजित किया है: कम-विलंबता, कम लागत वाले इंटरैक्टिव अनुभवों के लिए मानक डीप रिसर्च, और उच्च-व्यापक पृष्ठभूमि रन के लिए डीप रिसर्च मैक्स जो अधिक परीक्षण-समय गणना का उपयोग करता है।
लक्ष्य वर्कफ़्लो के बारे में आधिकारिक घोषणा असामान्य रूप से स्पष्ट है। Google का उदाहरण उपभोक्ता चैट क्वेरी नहीं है. विश्लेषक टीम के जागने से पहले उचित परिश्रम रिपोर्ट तैयार करना एक रात्रिकालीन क्रॉन जॉब है। यह एक मजबूत संकेत है कि अनुसंधान एजेंटों को केवल उत्तर इंजन के रूप में नहीं, बल्कि डाउनस्ट्रीम कार्य के लिए बुनियादी ढांचे के रूप में तैनात किया जा रहा है।
बिल्डरों के लिए यह क्यों मायने रखता है?
यहां तीन महत्वपूर्ण बदलाव हुए हैं. सबसे पहले, Google अनुसंधान को पुन: प्रयोज्य पाइपलाइन चरण में बदल रहा है। एक टीम सबूत इकट्ठा करने और संश्लेषित करने के लिए डीप रिसर्च चला सकती है, फिर उस स्थिति को किसी अन्य जेमिनी मॉडल को सौंपने के लिए इंटरैक्शन एपीआई का उपयोग कर सकती है previous_interaction_id सारांश, पुन: स्वरूपण, या अगले चरण के निष्पादन के लिए। दूसरा, Google एजेंट को वेब और कस्टम डेटा स्रोतों पर काम करने की अनुमति देकर सार्वजनिक और निजी संदर्भ के बीच अंतर को कम कर रहा है। तीसरा, चार्ट और इन्फोग्राफिक्स अब एक अलग विज़ुअलाइज़ेशन चरण के बजाय एक ही रन का हिस्सा हैं।
बिल्डरों के लिए, इसका मतलब है कि "गहरा शोध" एक प्रीमियम यूआई सुविधा बनना बंद कर देता है और बैकएंड जॉब क्लास की तरह दिखने लगता है। उत्पाद टीमें इसे अनुसंधान संक्षेप, बिक्री तैयारी, अनुपालन वर्कफ़्लो, बाज़ार स्कैन और तकनीकी जांच से जोड़ सकती हैं। यदि यह अच्छी तरह से काम करता है, तो यह खोज, नोट्स, स्प्रेडशीट आउटपुट और कार्यकारी सारांशों को मैन्युअल रूप से एक साथ जोड़ने में लगने वाले समय को कम कर देता है।
महत्वपूर्ण चेतावनी: दस्तावेज़ अभी भी पकड़ में आ रहे हैं
Google की अपनी सतहों में एक उपयोगी चेतावनी छिपी हुई है। ब्लॉग पोस्ट में कहा गया है कि डीप रिसर्च अब मनमाने ढंग से दूरस्थ एमसीपी और संयुक्त टूलींग का समर्थन करता है, लेकिन सार्वजनिक इंटरैक्शन एपीआई दस्तावेज़ पृष्ठ अभी भी 15 अप्रैल के पूर्वावलोकन-युग की चेतावनी और पुराने मॉडल आईडी दिखाता है। उस बेमेल का मतलब यह नहीं है कि लॉन्च नकली है। इसका मतलब है कि उत्पाद की सतह स्थिर दस्तावेज़ों की तुलना में तेज़ी से आगे बढ़ रही है।
ठीक यहीं से टोकन की बर्बादी और टीम की उलझन शुरू होती है। यदि आप सीधे घोषणा प्रति से निर्माण करते हैं, तो आप आज जो स्थिर है उसका अधिक अनुमान लगाने का जोखिम उठाते हैं। यदि आप लॉन्च को अनदेखा करते हैं, तो आप वास्तविक वर्कफ़्लो बदलाव से चूक जाते हैं। व्यावहारिक नियम अनुसंधान एजेंटों को किसी भी अन्य पूर्वावलोकन रनटाइम की तरह व्यवहार करना है: आपके द्वारा परीक्षण किए गए सटीक एजेंट या मॉडल आईडी को पिन करें, लॉग करें कि कौन सा टूल मिश्रण वास्तव में काम करता है, और जब बीटा सतह बदलती है तो फ़ॉलबैक पथ रखें।
यह वही ऑपरेटिंग अनुशासन है जिसे TRH लागू करता है Google AI स्टूडियो कोटा वास्तविकता और OpenAI एजेंट SDK रनटाइम डिज़ाइन. वर्कफ़्लो संपीड़न केवल तभी मूल्यवान है जब रनटाइम सुपाठ्य रहता है।
TRH कोण: अनुसंधान पाइपलाइनों को भी बजट की आवश्यकता होती है
Token Robin Hood पाठकों को केवल बेंचमार्क चार्ट ही नहीं, बल्कि बिलिंग आकार पर भी ध्यान देना चाहिए। डीप रिसर्च मैक्स को गहराई के लिए अनुकूलित किया गया है, जिसका आमतौर पर मतलब होता है लंबे समय तक चलना, अधिक उपकरण का उपयोग, अधिक संदर्भ संचय और बड़ी आउटपुट कलाकृतियाँ। यह तब सार्थक हो सकता है जब रिपोर्ट पुन: प्रयोज्य हो या राजस्व से जुड़ी हो। यह बेकार है जब रिपोर्ट किसी टैब में बंद हो जाती है या स्क्रैच से पुनर्जीवित हो जाती है क्योंकि किसी ने भी परिणाम को उस रूप में संग्रहीत नहीं किया है जिसे बाकी स्टैक उपभोग कर सकता है।
सही पैटर्न सरल है. नौकरी बांध दी. परिभाषित करें कि किन डेटा स्रोतों की अनुमति है। आउटपुट को पुन: प्रयोज्य प्रारूप में सहेजें। केवल अगले मॉडल चरण की श्रृंखला बनाएं जो वास्तव में होने की आवश्यकता है। यदि रिपोर्ट को केवल एक बार स्किम्ड किया जा रहा है, तो डीप रिसर्च मैक्स संभवतः गलत डिफ़ॉल्ट है। यदि यह कोडिंग एजेंट, बिक्री वर्कफ़्लो, या ऑपरेटिंग मेमो के लिए ब्रीफिंग परत बन जाता है, तो खर्च स्वयं उचित हो सकता है।
बिल्डरों को आगे क्या करना चाहिए
एक पृष्ठभूमि वर्कफ़्लो से शुरू करें जहां अनुसंधान की गुणवत्ता तत्काल विलंबता से अधिक मायने रखती है: प्रतिस्पर्धी निगरानी, उचित परिश्रम, नीति ट्रैकिंग, बग फोरेंसिक, या भागीदार तैयारी। एक दोहराए जाने वाले कार्य पर नियमित डीप रिसर्च बनाम मैक्स की तुलना करें। कुल रनटाइम, आउटपुट उपयोगिता और कितनी बार परिणाम को पूरी समस्या को दोबारा बताए बिना दूसरे मॉडल को सौंपा जा सकता है, इसका आकलन करें। फिर तय करें कि क्या महंगा संस्करण उत्पादन में है या केवल मानव द्वार के पीछे है।
यदि आपका स्टैक पहले से ही एजेंटों का उपयोग करता है, तो एक और नियम जोड़ें: अनुसंधान आउटपुट को इनपुट बनना चाहिए, न कि मृत अंत। उन्हें जारी रखें, उनका संस्करण बनाएं और डाउनस्ट्रीम हैंडऑफ़ को स्पष्ट रखें।