Token Robin Hood

Perplexity Agent API ganha fallback de modelos enquanto aposenta rotas Gemini antigas

As mudancas recentes da Perplexity colocam duas coisas no mesmo pacote: conveniencia de orquestracao e risco constante de migracao entre providers.

A Perplexity diz que o Agent API agora funciona como runtime gerenciado para retrieval, tool execution, reasoning e fallback multi-modelo. O changelog tambem adiciona modelos de terceiros como GPT-5.4, Claude Sonnet 4.6 e Gemini 3.1 Pro Preview, alem de um endpoint publico /v1/models para listar o catalogo atual.

Ao mesmo tempo, rotas Gemini antigas foram removidas rapidamente. google/gemini-2.5-flash saiu em 20 de marco de 2026. google/gemini-2.5-pro e google/gemini-3-pro-preview sairam em 1 de abril.

O ponto para builders e direto: fallback melhora uptime, mas tambem pode esconder token waste. Se a cadeia de fallback muda o numero de tool calls, o tamanho do contexto ou o estilo de reasoning, o job continua funcionando enquanto a eficiencia piora.

A regra TRH: registre qual modelo realmente respondeu, custo por tarefa, numero de passos e diferenca entre rota principal e fallback. Compatibilidade OpenAI nao significa comportamento equivalente.

Fontes