Token Robin Hood
Perplexity19 April 20267 menit

Perplexity Agent API menambahkan rantai fallback sambil menghentikan rute Gemini lama

Update terbaru developer Perplexity bukan sekedar penambahan fitur saja. Hal ini merupakan pengingat bahwa pembuat agen kini harus menangani dua masalah sekaligus: keandalan orkestrasi dan churn penyedia yang konstan.

Apa yang telah terjadiPerplexity memperluas Agent API dengan lebih banyak model pihak ketiga, publik/v1/modelstitik akhir, dan perutean yang kompatibel dengan OpenAI sambil menghentikan rute Gemini yang lama.
Mengapa pembangun peduliWaktu proses model-agnostik terdengar lebih bersih, namun juga menyembunyikan risiko migrasi hingga rute menghilang atau rantai cadangan mulai berperilaku berbeda.
Tindakan TRHAudit setiap agen untuk mengetahui penyematan model, pesanan cadangan, dan anggaran token sebelum penghentian di sisi penyedia berubah menjadi pemborosan.

Apa yang diubah Perplexity

Dalam pembaruan dokumen bulan Maret dan April 2026, Perplexity memposisikan Agent API sebagai runtime terkelola untuk alur kerja agen, bukan sekadar pembungkus panggilan model. Perusahaan mengatakan runtime dapat mengatur pengambilan, eksekusi alat, penalaran, dan fallback multi-model melalui satu titik akhir. Itu juga menambahkan lebih banyak opsi model pihak ketiga termasuk GPT-5.4, Claude Sonnet 4.6, NVIDIA Nemotron, dan Gemini 3.1 Pro Preview.

Pada saat yang sama, log perubahan menyatakan bahwa rute Gemini lama tidak digunakan lagi dan dihapus secara berurutan.google/gemini-2.5-flashtelah dihapus pada 20 Maret 2026.google/gemini-2.5-proDangoogle/gemini-3-pro-previewdiikuti pada tanggal 1 April. Perplexity juga menambahkan yang tidak diautentikasi baruGET /v1/modelstitik akhir sehingga pembangun dapat memeriksa ketersediaan saat ini sebelum asumsi hard-coding.

Mengapa hal ini penting bagi pembuat agen

Ada dua cara untuk membaca rilis ini. Pembacaan optimisnya adalah kenyamanan: satu kunci API, satu runtime agen, satu lapisan kompatibilitas, dan pertukaran yang lebih mudah antar penyedia frontier. Bacaan yang lebih operasional adalah bahwa perutean kini menjadi bagian dari permukaan keandalan Anda. Jika agen Anda bergantung pada bentuk penalaran tertentu, perilaku pencarian, atau kekhasan keluaran terstruktur, rantai fallback bukanlah abstraksi bebas.

Hal ini terutama berlaku untuk agen penelitian dan agen pengkodean yang sudah berjalan lama. Abstraksi yang bersih masih dapat menimbulkan pembelanjaan yang berantakan ketika model fallback membuat panggilan alat tambahan, memperluas konteks dengan lebih agresif, atau berperilaku berbeda dalam kontrak cepat yang sama. Model churn menjadi token churn dengan cepat.

Sudut TRH: keandalan dapat menyembunyikan pemborosan

Pembangun sering kali memperlakukan penggantian model sebagai sesuatu yang positif karena meningkatkan waktu kerja. Itu memang meningkatkan waktu aktif. Namun hal ini juga dapat menutupi penurunan profil biaya. Jika satu rute gagal dan rute lain menyelesaikan pekerjaan dengan alasan yang lebih panjang, lebih banyak pencarian, atau presisi lintasan pertama yang lebih lemah, tugas tersebut masih "berfungsi" sementara efisiensi token turun secara perlahan.

Itulah mengapa pembaruan Perplexity penting. Hal ini membuat API lebih berguna, namun juga menjadikan kemampuan observasi menjadi lebih penting. Tim harus mencatat model mana yang benar-benar menjawab, berapa banyak langkah yang digunakan, berapa banyak konteks yang digunakan, dan apakah fallback mengubah output atau pembelanjaan secara signifikan.

Apa yang harus dilakukan pembangun selanjutnya

Pertama, berhenti berasumsi bahwa rute penyedia pilihan Anda masih ada bulan depan. Lakukan polling pada titik akhir model, sematkan model yang benar-benar Anda andalkan, dan simpan peta migrasi yang teruji untuk setiap agen. Kedua, bandingkan biaya dan perilaku di seluruh rantai fallback dengan kumpulan tugas yang sama alih-alih mempercayai "kompatibel dengan OpenAI" sebagai jaminan keluaran yang setara.

Jika Anda membangun alur penelitian bergaya OpenClaw atau terminal-first, integrasi pencarian terbaru dan hasil terstruktur Perplexity akan berguna. Hanya saja, jangan biarkan kenyamanan menyembunyikan fakta bahwa waktu proses efektif Anda berubah.

Sumber