Perplexity Agent API はフォールバック チェーンを追加し、古い Gemini ルートは非推奨になります
Perplexity の最新の開発者向けアップデートは単なる機能追加ではありません。これらは、エージェント ビルダーがオーケストレーションの信頼性と絶え間ないプロバイダーのチャーンという 2 つの問題を同時に管理する必要があることを思い出させます。
/v1/modelsエンドポイント、および OpenAI と互換性のあるルーティングをサポートしますが、古い Gemini ルートは非推奨になります。Perplexity の変更点
2026 年 3 月と 4 月のドキュメント更新で、Perplexity は、Agent API をモデル呼び出しの単なるラッパーではなく、エージェント ワークフローのマネージド ランタイムとして位置づけました。同社によれば、このランタイムは、1 つのエンドポイントを通じて、取得、ツールの実行、推論、マルチモデルのフォールバックを調整できるという。また、GPT-5.4、Claude Sonnet 4.6、NVIDIA Nemotron、Gemini 3.1 Pro Preview などのサードパーティ モデル オプションも追加されました。
同時に、変更ログには、古い Gemini ルートが非推奨となり、立て続けに削除されたことが記載されています。google/gemini-2.5-flash2026 年 3 月 20 日に削除されました。google/gemini-2.5-proそしてgoogle/gemini-3-pro-previewPerplexity も新しい未認証を追加しましたGET /v1/modelsエンドポイントを使用して、ビルダーが仮定をハードコーディングする前に現在の可用性を検査できるようにします。
エージェントビルダーにとってこれが重要な理由
このリリースを読む方法は 2 つあります。楽観的に読むと、API キーが 1 つ、エージェント ランタイムが 1 つ、互換性レイヤーが 1 つあり、フロンティア プロバイダー間での交換が容易になるため、便利です。さらに運用上重要なことは、ルーティングが信頼性面の一部になったことです。エージェントが特定の推論形式、検索動作、または構造化された出力の癖に依存している場合、フォールバック チェーンは自由な抽象化ではありません。
これは、長期にわたる調査エージェントやコーディング エージェントに特に当てはまります。フォールバック モデルが追加のツール呼び出しを行ったり、コンテキストをより積極的に拡張したり、同じプロンプト コントラクトの下で異なる動作をしたりすると、クリーンな抽象化でも乱雑な支出が発生する可能性があります。モデルのチャーンは急速にトークンのチャーンになります。
TRH の角度: 信頼性は無駄を隠すことができる
ビルダーは、稼働時間を向上させるため、モデルのフォールバックを純粋にポジティブなものとして扱うことがよくあります。稼働時間は向上します。しかし、コストプロファイルの低下を隠してしまう可能性もあります。 1 つのルートが失敗し、別のルートがより長い推論、より多くの検索、または低い初回パス精度でジョブを完了した場合でも、タスクは依然として「機能」しますが、トークン効率は静かに低下します。
だからこそ、Perplexity のアップデートが重要なのです。これにより、API はより便利になりますが、可観測性もより重要になります。チームは、どのモデルが実際に応答したか、使用されたステップの数、消費されたコンテキストの量、フォールバックによって出力や支出が大幅に変更されたかどうかを記録する必要があります。
建築業者が次にすべきこと
まず、優先プロバイダーのルートが来月も存在すると仮定するのはやめてください。モデルのエンドポイントをポーリングし、本当に依存するモデルを固定し、各エージェントのテスト済み移行マップを保持します。次に、同等の出力の保証として「OpenAI 互換」を信頼するのではなく、同じタスクセットを使用してフォールバック チェーン全体でコストと動作を比較します。
OpenClaw スタイルまたはターミナルファーストのリサーチ フローを構築している場合は、Perplexity の更新された検索統合と構造化された結果が役立ちます。利便性を理由に、実効ランタイムが変更されたという事実を隠蔽しないでください。