Perplexity Agent API는 이전 Gemini 경로를 더 이상 사용하지 않는 동시에 폴백 체인을 추가합니다.
Perplexity의 최신 개발자 업데이트는 단순한 기능 추가가 아닙니다. 이는 이제 에이전트 빌더가 오케스트레이션 안정성과 지속적인 공급자 이탈이라는 두 가지 문제를 동시에 관리해야 함을 상기시켜 줍니다.
/v1/models이전 Gemini 경로를 더 이상 사용하지 않는 동시에 엔드포인트 및 OpenAI 호환 라우팅을 지원합니다.Perplexity가 변경한 것
2026년 3월 및 4월 문서 업데이트에서 Perplexity는 Agent API를 모델 호출에 대한 또 다른 래퍼가 아닌 에이전트 워크플로를 위한 관리형 런타임으로 포지셔닝했습니다. 회사는 런타임이 하나의 엔드포인트를 통해 검색, 도구 실행, 추론 및 다중 모델 대체를 조정할 수 있다고 말합니다. 또한 GPT-5.4, Claude Sonnet 4.6, NVIDIA Nemotron 및 Gemini 3.1 Pro Preview를 포함한 더 많은 타사 모델 옵션도 추가되었습니다.
동시에, 변경 로그에는 이전 Gemini 경로가 더 이상 사용되지 않고 빠르게 연속적으로 제거되었다고 나와 있습니다.google/gemini-2.5-flash2026년 3월 20일에 삭제되었습니다.google/gemini-2.5-pro그리고google/gemini-3-pro-preview4월 1일에 이어졌습니다. Perplexity는 또한 인증되지 않은 새로운 항목을 추가했습니다.GET /v1/models빌더가 가정을 하드코딩하기 전에 현재 가용성을 검사할 수 있도록 엔드포인트를 제공합니다.
이것이 에이전트 빌더에게 중요한 이유
이 릴리스를 읽는 방법에는 두 가지가 있습니다. 낙관적 읽기는 편리합니다. API 키 1개, 에이전트 런타임 1개, 호환성 계층 1개, 프론티어 제공업체 간 교환이 더 쉬워집니다. 더 많은 운영상 읽기는 라우팅이 이제 안정성 표면의 일부라는 것입니다. 에이전트가 특정 추론 형태, 검색 동작 또는 구조화된 출력 특성에 의존하는 경우 폴백 체인은 무료 추상화가 아닙니다.
이는 장기간 연구 에이전트와 코딩 에이전트의 경우 특히 그렇습니다. 깨끗한 추상화는 대체 모델이 추가 도구를 호출하거나, 컨텍스트를 보다 공격적으로 확장하거나, 동일한 프롬프트 계약 하에서 다르게 동작할 때 여전히 지저분한 지출을 초래할 수 있습니다. 모델 이탈이 토큰 이탈로 빠르게 진행됩니다.
TRH 각도: 신뢰성으로 낭비를 숨길 수 있음
빌더는 가동 시간을 향상시키기 때문에 모델 대체를 순전히 긍정적인 것으로 간주하는 경우가 많습니다. 가동 시간이 향상됩니다. 그러나 이는 저하된 비용 프로필을 가릴 수도 있습니다. 한 경로가 실패하고 다른 경로가 더 긴 추론, 더 많은 검색 또는 약한 첫 번째 통과 정밀도로 작업을 완료하는 경우 토큰 효율성이 조용히 떨어지는 동안 작업은 여전히 "작동"합니다.
이것이 바로 Perplexity의 업데이트가 중요한 이유입니다. 이는 API를 더욱 유용하게 만들지만 관찰 가능성을 더욱 중요하게 만듭니다. 팀은 실제로 응답한 모델, 사용된 단계 수, 컨텍스트 소비량, 폴백이 결과 또는 지출에 실질적으로 변화를 주었는지 여부를 기록해야 합니다.
건축업자가 다음에 해야 할 일
먼저, 선호하는 제공업체 경로가 다음 달에도 계속 존재할 것이라고 가정하지 마세요. 모델 엔드포인트를 폴링하고, 실제로 의존하는 모델을 고정하고, 각 에이전트에 대해 테스트된 마이그레이션 맵을 유지하세요. 둘째, 동등한 출력을 보장하기 위해 "OpenAI 호환"을 신뢰하는 대신 동일한 작업 세트를 사용하여 폴백 체인 전체의 비용과 동작을 비교합니다.
OpenClaw 스타일 또는 터미널 우선 연구 흐름을 구축하는 경우 Perplexity의 업데이트된 검색 통합 및 구조화된 결과가 유용합니다. 단지 편의상 유효 런타임이 변경되었다는 사실을 숨기지 마십시오.