Perplexity Agent API menambahkan rantai fallback sambil menghentikan rute Gemini lama
Update terbaru developer Perplexity bukan sekedar penambahan fitur saja. Hal ini merupakan pengingat bahwa pembuat agen kini harus menangani dua masalah sekaligus: keandalan orkestrasi dan churn penyedia yang konstan.
/v1/modelstitik akhir, dan perutean yang kompatibel dengan OpenAI sambil menghentikan rute Gemini yang lama.Apa yang diubah Perplexity
Dalam pembaruan dokumen bulan Maret dan April 2026, Perplexity memposisikan Agent API sebagai runtime terkelola untuk alur kerja agen, bukan sekadar pembungkus panggilan model. Perusahaan mengatakan runtime dapat mengatur pengambilan, eksekusi alat, penalaran, dan fallback multi-model melalui satu titik akhir. Itu juga menambahkan lebih banyak opsi model pihak ketiga termasuk GPT-5.4, Claude Sonnet 4.6, NVIDIA Nemotron, dan Gemini 3.1 Pro Preview.
Pada saat yang sama, log perubahan menyatakan bahwa rute Gemini lama tidak digunakan lagi dan dihapus secara berurutan.google/gemini-2.5-flashtelah dihapus pada 20 Maret 2026.google/gemini-2.5-proDangoogle/gemini-3-pro-previewdiikuti pada tanggal 1 April. Perplexity juga menambahkan yang tidak diautentikasi baruGET /v1/modelstitik akhir sehingga pembangun dapat memeriksa ketersediaan saat ini sebelum asumsi hard-coding.
Mengapa hal ini penting bagi pembuat agen
Ada dua cara untuk membaca rilis ini. Pembacaan optimisnya adalah kenyamanan: satu kunci API, satu runtime agen, satu lapisan kompatibilitas, dan pertukaran yang lebih mudah antar penyedia frontier. Bacaan yang lebih operasional adalah bahwa perutean kini menjadi bagian dari permukaan keandalan Anda. Jika agen Anda bergantung pada bentuk penalaran tertentu, perilaku pencarian, atau kekhasan keluaran terstruktur, rantai fallback bukanlah abstraksi bebas.
Hal ini terutama berlaku untuk agen penelitian dan agen pengkodean yang sudah berjalan lama. Abstraksi yang bersih masih dapat menimbulkan pembelanjaan yang berantakan ketika model fallback membuat panggilan alat tambahan, memperluas konteks dengan lebih agresif, atau berperilaku berbeda dalam kontrak cepat yang sama. Model churn menjadi token churn dengan cepat.
Sudut TRH: keandalan dapat menyembunyikan pemborosan
Pembangun sering kali memperlakukan penggantian model sebagai sesuatu yang positif karena meningkatkan waktu kerja. Itu memang meningkatkan waktu aktif. Namun hal ini juga dapat menutupi penurunan profil biaya. Jika satu rute gagal dan rute lain menyelesaikan pekerjaan dengan alasan yang lebih panjang, lebih banyak pencarian, atau presisi lintasan pertama yang lebih lemah, tugas tersebut masih "berfungsi" sementara efisiensi token turun secara perlahan.
Itulah mengapa pembaruan Perplexity penting. Hal ini membuat API lebih berguna, namun juga menjadikan kemampuan observasi menjadi lebih penting. Tim harus mencatat model mana yang benar-benar menjawab, berapa banyak langkah yang digunakan, berapa banyak konteks yang digunakan, dan apakah fallback mengubah output atau pembelanjaan secara signifikan.
Apa yang harus dilakukan pembangun selanjutnya
Pertama, berhenti berasumsi bahwa rute penyedia pilihan Anda masih ada bulan depan. Lakukan polling pada titik akhir model, sematkan model yang benar-benar Anda andalkan, dan simpan peta migrasi yang teruji untuk setiap agen. Kedua, bandingkan biaya dan perilaku di seluruh rantai fallback dengan kumpulan tugas yang sama alih-alih mempercayai "kompatibel dengan OpenAI" sebagai jaminan keluaran yang setara.
Jika Anda membangun alur penelitian bergaya OpenClaw atau terminal-first, integrasi pencarian terbaru dan hasil terstruktur Perplexity akan berguna. Hanya saja, jangan biarkan kenyamanan menyembunyikan fakta bahwa waktu proses efektif Anda berubah.