Token Robin Hood
Perplexity19 april 20267 minuten

Perplexity Agent API voegt fallback-ketens toe terwijl oudere Gemini-routes worden beëindigd

De nieuwste ontwikkelaarsupdates van Perplexity zijn niet alleen toevoegingen aan functies. Ze herinneren ons eraan dat agentbouwers nu twee problemen tegelijk moeten aanpakken: de betrouwbaarheid van de orkestratie en het constante verloop van leveranciers.

Wat is er gebeurdPerplexity breidde zijn Agent API uit met meer modellen van derden, een publiek/v1/modelseindpunt en OpenAI-compatibele routering, terwijl oudere Gemini-routes worden afgeschaft.
Waarom bouwers erom gevenModelonafhankelijke looptijden klinken schoner, maar verbergen ook het migratierisico totdat een route verdwijnt of een terugvalketen zich anders gaat gedragen.
TRH-actieControleer elke agent op het vastzetten van modellen, reservevolgorde en tokenbudgetten voordat een beëindiging aan de providerzijde verandert in stille verspilling.

Wat Perplexity is veranderd

In de documentatie-updates van maart en april 2026 positioneerde Perplexity de Agent API als een beheerde runtime voor agentische workflows, en niet zomaar een wrapper over modelaanroepen. Het bedrijf zegt dat de runtime het ophalen, uitvoeren van tools, redeneren en terugvallen op meerdere modellen via één eindpunt kan orkestreren. Het heeft ook meer modelopties van derden toegevoegd, waaronder GPT-5.4, Claude Sonnet 4.6, NVIDIA Nemotron en Gemini 3.1 Pro Preview.

Tegelijkertijd zegt de changelog dat oudere Gemini-routes snel achter elkaar zijn verouderd en verwijderd.google/gemini-2.5-flashwerd op 20 maart 2026 verwijderd.google/gemini-2.5-proEngoogle/gemini-3-pro-previewgevolgd op 1 april. Perplexity heeft ook een nieuwe niet-geverifieerde toegevoegdGET /v1/modelseindpunt, zodat bouwers de huidige beschikbaarheid kunnen inspecteren voordat ze aannames hard coderen.

Waarom dit belangrijk is voor agentbouwers

Er zijn twee manieren om dit persbericht te lezen. De optimistische interpretatie is gemak: één API-sleutel, één agentruntime, één compatibiliteitslaag en gemakkelijker wisselen tussen grensproviders. Het meer operationele inzicht is dat routing nu deel uitmaakt van uw betrouwbaarheidsoppervlak. Als uw agent afhankelijk is van een specifieke redeneervorm, zoekgedrag of gestructureerde uitvoer, is een terugvalketen geen vrije abstractie.

Dat geldt vooral voor langlopende onderzoeksagenten en codeeragenten. Een zuivere abstractie kan nog steeds voor rommelige uitgaven zorgen wanneer een fallback-model extra tooloproepen doet, de context agressiever uitbreidt of zich anders gedraagt ​​onder hetzelfde promptcontract. Modelverloop wordt snel tokenverloop.

De TRH-hoek: betrouwbaarheid kan verspilling verbergen

Bouwers beschouwen modelfallback vaak als puur positief omdat het de uptime verbetert. Het verbetert de uptime. Maar het kan ook een verslechterd kostenprofiel maskeren. Als de ene route mislukt en een andere route de taak voltooit met langer redeneren, meer zoekopdrachten of een zwakkere first-pass-precisie, "werkt" de taak nog steeds terwijl de token-efficiëntie stilletjes afneemt.

Daarom is de update van Perplexity belangrijk. Het maakt de API nuttiger, maar maakt de waarneembaarheid ook belangrijker. Teams moeten bijhouden welk model daadwerkelijk heeft geantwoord, hoeveel stappen er zijn gebruikt, hoeveel context er is gebruikt en of de terugval de output of de uitgaven wezenlijk heeft veranderd.

Wat bouwers vervolgens moeten doen

Ga er eerst niet van uit dat de route van uw voorkeursaanbieder volgende maand nog steeds bestaat. Voer een enquête uit bij het eindpunt van de modellen, zet de modellen vast waarvan u echt afhankelijk bent, en houd voor elke agent een geteste migratiekaart bij. Ten tweede: vergelijk de kosten en het gedrag van fallback-ketens met dezelfde takenset in plaats van te vertrouwen op "OpenAI-compatibel" als garantie voor gelijkwaardige output.

Als u OpenClaw-achtige of terminal-first onderzoeksstromen bouwt, zijn de bijgewerkte zoekintegraties en gestructureerde resultaten van Perplexity nuttig. Laat het gemak niet verhullen dat uw effectieve looptijd is veranderd.

Bronnen