Perplexity Agent API पुराने Gemini मार्गों को अप्रचलित करते हुए फ़ॉलबैक चेन जोड़ता है
Perplexity के नवीनतम डेवलपर अपडेट केवल फीचर परिवर्धन नहीं हैं। वे एक अनुस्मारक हैं कि एजेंट बिल्डरों को अब एक साथ दो समस्याओं का प्रबंधन करना होगा: ऑर्केस्ट्रेशन विश्वसनीयता और निरंतर प्रदाता मंथन।
/v1/modelsपुराने Gemini मार्गों को अप्रचलित करते हुए समापन बिंदु, और OpenAI-संगत रूटिंग।Perplexity ने क्या बदला
अपने मार्च और अप्रैल 2026 डॉक्स अपडेट में, Perplexity ने Agent API को एजेंटिक वर्कफ़्लो के लिए प्रबंधित रनटाइम के रूप में स्थान दिया, न कि केवल मॉडल कॉल पर एक और रैपर के रूप में। कंपनी का कहना है कि रनटाइम एक समापन बिंदु के माध्यम से पुनर्प्राप्ति, उपकरण निष्पादन, तर्क और मल्टी-मॉडल फ़ॉलबैक को व्यवस्थित कर सकता है। इसमें GPT-5.4, Claude Sonnet 4.6, NVIDIA Nemotron और Gemini 3.1 Pro Preview सहित अधिक तृतीय-पक्ष मॉडल विकल्प भी जोड़े गए हैं।
उसी समय, चेंजलॉग का कहना है कि पुराने Gemini मार्गों को हटा दिया गया और त्वरित उत्तराधिकार में हटा दिया गया।google/gemini-2.5-flash20 मार्च 2026 को हटा दिया गया।google/gemini-2.5-proऔरgoogle/gemini-3-pro-preview1 अप्रैल को इसका अनुसरण किया गया। Perplexity ने एक नया अप्रमाणित भी जोड़ाGET /v1/modelsसमापन बिंदु ताकि बिल्डर हार्ड-कोडिंग धारणाओं से पहले वर्तमान उपलब्धता का निरीक्षण कर सकें।
एजेंट बिल्डरों के लिए यह क्यों मायने रखता है?
इस रिलीज़ को पढ़ने के दो तरीके हैं। आशावादी अध्ययन सुविधा है: एक API कुंजी, एक एजेंट रनटाइम, एक संगतता परत, और फ्रंटियर प्रदाताओं में आसान स्वैपिंग। अधिक परिचालनात्मक बात यह है कि रूटिंग अब आपकी विश्वसनीयता सतह का हिस्सा है। यदि आपका एजेंट एक विशिष्ट तर्क आकार, खोज व्यवहार, या संरचित-आउटपुट विचित्रता पर निर्भर करता है, तो फ़ॉलबैक श्रृंखला एक मुक्त अमूर्त नहीं है।
यह लंबे समय से चल रहे अनुसंधान एजेंटों और कोडिंग एजेंटों के लिए विशेष रूप से सच है। जब फ़ॉलबैक मॉडल अतिरिक्त टूल कॉल करता है, संदर्भ को अधिक आक्रामक तरीके से विस्तारित करता है, या एक ही त्वरित अनुबंध के तहत अलग-अलग व्यवहार करता है, तो एक साफ़ अमूर्तता अभी भी गन्दा खर्च पैदा कर सकती है। मॉडल मंथन तेजी से टोकन मंथन बन जाता है।
TRH कोण: विश्वसनीयता अपशिष्ट को छिपा सकती है
बिल्डर्स अक्सर मॉडल फ़ॉलबैक को पूरी तरह से सकारात्मक मानते हैं क्योंकि इससे अपटाइम में सुधार होता है। इससे अपटाइम में सुधार होता है. लेकिन यह ख़राब लागत प्रोफ़ाइल को भी छुपा सकता है। यदि एक मार्ग विफल हो जाता है और दूसरा मार्ग लंबे तर्क, अधिक खोजों, या कमजोर प्रथम-पास परिशुद्धता के साथ कार्य पूरा करता है, तो कार्य अभी भी "काम करता है" जबकि टोकन दक्षता चुपचाप गिर जाती है।
इसीलिए Perplexity का अपडेट मायने रखता है। यह API को अधिक उपयोगी बनाता है, लेकिन यह अवलोकन क्षमता को भी अधिक महत्वपूर्ण बनाता है। टीमों को लॉग इन करना चाहिए कि किस मॉडल ने वास्तव में उत्तर दिया, कितने चरणों का उपयोग किया गया, कितने संदर्भ का उपभोग किया गया, और क्या फ़ॉलबैक ने आउटपुट या खर्च को महत्वपूर्ण रूप से बदल दिया।
बिल्डरों को आगे क्या करना चाहिए
सबसे पहले, यह मानना बंद करें कि आपका पसंदीदा प्रदाता मार्ग अगले महीने भी मौजूद रहेगा। मॉडल के अंतिम बिंदु का सर्वेक्षण करें, उन मॉडल को पिन करें जिन पर आप वास्तव में निर्भर हैं, और प्रत्येक एजेंट के लिए एक परीक्षण किया हुआ माइग्रेशन मानचित्र रखें। दूसरा, समतुल्य आउटपुट की गारंटी के रूप में "OpenAI-संगत" पर भरोसा करने के बजाय समान कार्य सेट के साथ फ़ॉलबैक श्रृंखलाओं में लागत और व्यवहार की तुलना करें।
यदि आप OpenClaw-शैली या टर्मिनल-प्रथम अनुसंधान प्रवाह का निर्माण कर रहे हैं, तो Perplexity के अद्यतन खोज एकीकरण और संरचित परिणाम उपयोगी हैं। बस सुविधा के अनुसार इस तथ्य को छिपाने न दें कि आपका प्रभावी रनटाइम बदल गया है।