Dorongan17 April 20268 menit

Nerf yang cepat dan penguncian parameter: mengapa pengguna AI merasa model menjadi lebih buruk

Nerfing yang cepat adalah perasaan yang dihadapi pengguna bahwa model atau produk menjadi kurang responsif, kurang langsung, atau kurang mampu setelah adanya perubahan. Terkadang itu nyata. Terkadang ini merupakan interaksi antara default, parameter, perilaku keselamatan, peralatan, dan ekspektasi.

Apa yang berubah dalam percakapan itu

Postingan komunitas seputar Opus 4.7 menyertakan klaim bahwa nilai suhu non-default, top_p, atau top_k ditolak. Klaim tersebut memerlukan konfirmasi resmi, namun kekhawatiran pengguna nyata: ketika default menjadi lebih ketat, pengguna ahli mungkin merasa model tersebut telah di-nerf.

Nerf yang cepat bukanlah satu hal

Degradasi yang dirasakan dapat berasal dari perutean model, penyetelan keselamatan, perubahan cepat sistem, konteks tersembunyi, tekanan batas laju, kegagalan alat, atau pembatasan parameter. Tim yang serius tidak boleh bergantung pada getaran. Ini harus menjalankan kembali tugas-tugas yang representatif, membandingkan artefak, dan mengukur percobaan ulang, latensi, pengeditan, dan kualitas akhir.

Bagaimana cara mengujinya

Pertahankan set prompt benchmark yang stabil.
Catat model, alat, dan pengaturan parameter.
Bandingkan artefak akhir, bukan hanya perasaan subjektif.
Pisahkan kualitas model dari perilaku pemanfaatan agen.
Lacak penggunaan token per artefak yang diterima.

Sudut TRH

Jika pengguna merasa suatu model menjadi lebih buruk, mereka sering kali memberikan kompensasi dengan meminta lebih banyak, mencoba lebih banyak, dan menambahkan lebih banyak konteks. Hal ini dapat meningkatkan pemborosan token meskipun penyebab sebenarnya tidak jelas. Pemulihan token membantu mengubah keluhan menjadi bukti alur kerja yang terukur.