بحث17 أبريل 20268 دقائق

لا تزال أدوات برمجة الذكاء الاصطناعي تفشل بطرق مملة: الأخطاء في Claude Code، وCodex، وGemini CLI

وجدت دراسة تجريبية أجريت في مارس 2026 حول أدوات تشفير الذكاء الاصطناعي أن العديد من حالات الفشل المرئية للمستخدم ليست حالات فشل غريبة في النماذج. إنها أخطاء واجهة برمجة التطبيقات (API)، ومشكلات طرفية، وفشل الأوامر، ومشكلات التكوين، واحتكاك التكامل.

نقطة البيانات

تدرس ورقة arXiv بعنوان "المزالق الهندسية في أدوات تشفير الذكاء الاصطناعي" الأخطاء في Claude Code وCodex وGemini CLI. يتضمن توزيع الأعراض المُبلغ عنها أخطاء واجهة برمجة التطبيقات (API) بنسبة 18.3%، والمشكلات الطرفية بنسبة 14%، وفشل الأوامر بنسبة 12.7% بين الأعراض التي تمت ملاحظتها والتي تواجه المستخدم.

لماذا هذا مهم للبناة

غالبًا ما تكون أكبر الخسائر اليومية في تشفير الذكاء الاصطناعي تشغيلية. يمكن أن يكون النموذج قويًا ولا يزال يضيع جلسة عمل من خلال التعامل مع البيئة السيئة أو فشل الصدفة المتكرر أو استدعاءات الأدوات الهشة. يجب على الفرق تتبع احتكاك الأدوات كجزء من إنتاجية الذكاء الاصطناعي، وليس التعامل معه على أنه ضجيج عشوائي.

اتصال النفايات رمزية

يمكن لكل أمر فاشل أن يؤدي إلى تشغيل حلقة تشخيصية أخرى. يمكن لكل واجهة سطر أوامر (CLI) تم تكوينها بشكل خاطئ أن تحرق السياق بينما يقوم الوكيل بإعادة قراءة الملفات وإعادة المحاولة. وبالتالي فإن موثوقية الأداة جزء من اقتصاديات الرمز المميز.

مصدر

المخاطر الهندسية في أدوات تشفير الذكاء الاصطناعي: دراسة تجريبية للأخطاء في Claude Code، وCodex، وGemini CLI