Investigación17 de abril de 20268 minutos

Las herramientas de codificación de IA todavía fallan de manera aburrida: errores en Claude Code, Codex y Gemini CLI

Un estudio empírico de marzo de 2026 sobre herramientas de codificación de IA encontró que muchas fallas visibles para el usuario no son fallas de modelos exóticos. Son errores de API, problemas de terminal, fallas de comandos, problemas de configuración y fricciones de integración.

El punto de datos

El artículo de arXiv "Errores de ingeniería en herramientas de codificación de IA" estudia errores en Claude Code, Codex y Gemini CLI. Su distribución de síntomas reportada incluye errores de API en un 18,3%, problemas de terminal en un 14% y fallas de comandos en un 12,7% entre los síntomas observados que enfrenta el usuario.

Por qué esto es importante para los constructores

Las mayores pérdidas diarias en la codificación de IA suelen ser operativas. Un modelo puede ser sólido y aún así desperdiciar una sesión debido a un mal manejo del entorno, fallas repetidas del shell o llamadas de herramientas frágiles. Los equipos deben realizar un seguimiento de la fricción de las herramientas como parte de la productividad de la IA, no tratarla como ruido aleatorio.

Conexión de residuos de tokens

Cada comando fallido puede desencadenar otro bucle de diagnóstico. Cada CLI mal configurada puede grabar contexto a medida que el agente vuelve a leer los archivos y los vuelve a intentar. Por lo tanto, la confiabilidad de las herramientas es parte de la economía simbólica.

Fuente

Errores de ingeniería en las herramientas de codificación de IA: un estudio empírico de errores en Claude Code, Codex y Gemini CLI