Token Robin Hood
Perplexity2026 年 4 月 19 日7分钟

Perplexity Agent API 添加后备链,同时弃用旧的 Gemini 路由

Perplexity 的最新开发者更新不仅仅是功能添加。它们提醒我们,代理构建者现在必须同时解决两个问题:编排可靠性和持续的提供商流失。

发生了什么Perplexity通过更多第三方型号扩展了Agent API,公共/v1/models端点和 OpenAI 兼容路由,同时弃用旧的 Gemini 路由。
为什么建筑商关心与模型无关的运行时听起来更干净,但它们也隐藏了迁移风险,直到路由消失或后备链开始表现不同。
TRH动作在提供商方弃用变成无声浪费之前,审核每个代理的模型固定、后备顺序和令牌预算。

Perplexity改变了什么

在 2026 年 3 月和 4 月的文档更新中,Perplexity 将 Agent API 定位为代理工作流的托管运行时,而不仅仅是模型调用的另一个包装器。该公司表示,运行时可以通过一个端点协调检索、工具执行、推理和多模型回退。它还添加了更多第三方型号选项,包括 GPT-5.4、Claude Sonnet 4.6、NVIDIA Nemotron 和 Gemini 3.1 Pro Preview。

与此同时,变更日志显示较旧的 Gemini 路线已被快速连续弃用和删除。google/gemini-2.5-flash于 2026 年 3 月 20 日被删除。google/gemini-2.5-progoogle/gemini-3-pro-preview紧随其后的是4月1日。Perplexity还添加了新的未经认证的GET /v1/models端点,以便构建者可以在硬编码假设之前检查当前可用性。

为什么这对代理构建者很重要

有两种方法可以阅读此版本。乐观的解读是便利:一个 API 密钥、一个代理运行时、一个兼容层以及更轻松地跨前沿提供商交换。更具操作性的解读是,路由现在已成为可靠性表面的一部分。如果您的代理依赖于特定的推理形式、搜索行为或结构化输出怪癖,则后备链就不是一个自由的抽象。

对于长期运行的研究代理和编码代理来说尤其如此。当后备模型进行额外的工具调用、更积极地扩展上下文或在同一提示契约下表现不同时,干净的抽象仍然会造成混乱的支出。模型流失变得快速。

TRH角度:可靠性可以隐藏浪费

构建者通常将模型回退视为纯粹的积极因素,因为它可以提高正常运行时间。它确实提高了正常运行时间。但它也可能掩盖成本状况的下降。如果一条路线失败,而另一条路线以更长的推理、更多的搜索或更弱的首次通过精度完成了工作,任务仍然“有效”,而令牌效率却悄悄下降。

这就是为什么 Perplexity 的更新很重要。它使 API 更加有用,但也使可观察性变得更加重要。团队应该记录哪个模型实际回答了,使用了多少步骤,消耗了多少上下文,以及后备是否实质性地改变了输出或支出。

建设者下一步应该做什么

首先,不要假设您的首选提供商路线下个月仍然存在。轮询模型端点,固定您真正依赖的模型,并为每个代理保留经过测试的迁移映射。其次,比较具有相同任务集的后备链的成本和行为,而不是相信“OpenAI 兼容”作为等效输出的保证。

如果您正在构建 OpenClaw 式或终端优先的研究流程,Perplexity 更新的搜索集成和结构化结果非常有用。只是不要让便利掩盖了有效运行时间发生变化的事实。

来源