AI コーディング ツールは依然として退屈な方法で失敗します: Claude Code、Codex、および Gemini CLI のバグ
AI コーディング ツールに関する 2026 年 3 月の実証研究では、ユーザーに見える障害の多くは特殊なモデルの障害ではないことが判明しました。それは、API エラー、端末の問題、コマンドの失敗、構成の問題、統合の摩擦です。
データポイント
arXiv の論文「AI コーディング ツールのエンジニアリングの落とし穴」では、Claude Code、Codex、および Gemini CLI のバグを研究しています。報告された症状の分布には、観察されたユーザー側の症状のうち、API エラーが 18.3%、端末の問題が 14%、コマンドの失敗が 12.7% 含まれています。
建築業者にとってこれが重要な理由
AI コーディングにおける日々の最大の損失は、多くの場合、運用上の損失です。モデルは強力であっても、不適切な環境処理、シェルの繰り返しの失敗、または脆弱なツールの呼び出しによってセッションが無駄になる場合があります。チームはツールの摩擦をランダムなノイズとして扱うのではなく、AI の生産性の一部として追跡する必要があります。
トークン廃棄接続
失敗したコマンドごとに、別の診断ループがトリガーされる可能性があります。 CLI の設定が間違っていると、エージェントがファイルを再読み取りして再試行するときにコンテキストが書き込まれる可能性があります。したがって、ツールの信頼性はトークン経済学の一部です。