Token Robin Hood
Perplexity2026 年 4 月 19 日7分鐘

Perplexity Agent API 增加後備鏈,同時棄用舊的 Gemini 路由

Perplexity 的最新開發者更新不僅僅是功能添加。它們提醒我們,代理建構者現在必須同時解決兩個問題:編排可靠性和持續的提供者流失。

發生了什麼事Perplexity透過更多第三方型號擴展了Agent API,公共/v1/models端點和 OpenAI 相容路由,同時棄用舊的 Gemini 路由。
為什麼建築商關心與模型無關的運行時聽起來更乾淨,但它們也隱藏了遷移風險,直到路由消失或後備鏈開始表現不同。
TRH動作在提供者方棄用變成無聲浪費之前,審核每個代理程式的模型固定、後備順序和令牌預算。

Perplexity改變了什麼

在 2026 年 3 月和 4 月的文件更新中,Perplexity 將 Agent API 定位為代理工作流程的託管運行時,而不僅僅是模型呼叫的另一個包裝器。該公司表示,運行時可以透過一個端點協調檢索、工具執行、推理和多模型回退。它還添加了更多第三方型號選項,包括 GPT-5.4、Claude Sonnet 4.6、NVIDIA Nemotron 和 Gemini 3.1 Pro Preview。

同時,變更日誌顯示較舊的 Gemini 路線已被快速連續棄用和刪除。google/gemini-2.5-flash於 2026 年 3 月 20 日刪除。google/gemini-2.5-progoogle/gemini-3-pro-preview緊隨其後的是4月1日。 Perplexity還增加了新的未經認證的GET /v1/models端點,以便建構者可以在硬編碼假設之前檢查當前可用性。

為什麼這對代理建構者很重要

有兩種方法可以閱讀此版本。樂觀的解讀是便利性:一個 API 密鑰、一個代理運行時、一個兼容層以及更輕鬆地跨前沿提供者交換。更具操作性的解讀是,路由現在已成為可靠性表面的一部分。如果您的代理人依賴特定的推理形式、搜尋行為或結構化輸出怪癖,則後備鏈就不是一個自由的抽象。

對於長期運作的研究代理和編碼代理來說尤其如此。當後備模型進行額外的工具呼叫、更積極地擴展上下文或在同一提示契約下表現不同時,乾淨的抽象仍然會造成混亂的支出。模型流失變得快速。

TRH角度:可靠性可以隱藏浪費

建構者通常將模型回退視為純粹的正面因素,因為它可以提高正常運行時間。它確實提高了正常運行時間。但它也可能掩蓋成本狀況的下降。如果一條路線失敗,而另一條路線以更長的推理、更多的搜索或更弱的首次通過精度完成了工作,任務仍然“有效”,而令牌效率卻悄悄下降。

這就是為什麼 Perplexity 的更新很重要。它使 API 更加有用,但也使可觀察性變得更加重要。團隊應該記錄哪個模型實際回答了,使用了多少步驟,消耗了多少上下文,以及後備是否實質地改變了輸出或支出。

建設者下一步該做什麼

首先,不要假設您的首選提供者路線下個月仍然存在。輪詢模型端點,固定您真正依賴的模型,並為每個代理保留經過測試的遷移映射。其次,比較具有相同任務集的後備鏈的成本和行為,而不是相信「OpenAI 相容」作為等效輸出的保證。

如果您正在建立 OpenClaw 式或終端優先的研究流程,Perplexity 更新的搜尋整合和結構化結果非常有用。只是不要讓便利性掩蓋了有效運行時間改變的事實。

來源