Token Robin Hood
Claude Code30 abr 20267 min

Atualização do Claude Code: hooks MCP, subagentes com fork e um medidor de contexto 1M mais honesto

A atualização Week 17 do Claude Code não é só acabamento. As mudanças que importam para builders ficam mais embaixo na stack: hooks agora podem chamar ferramentas MCP direto, subagentes com fork podem carregar o contexto completo em builds externas, e sessões com Opus 4.7 passam a medir o uso contra a janela nativa de 1M de contexto.

O que aconteceuA Anthropic publicou uma nova leva de mudanças do Claude Code para 20-24 de abril de 2026 com hooks MCP diretos, suporte a forked subagents em builds externas, retomada mais rápida de sessão e medição de contexto mais limpa.
Por que importaEssas mudanças atacam exatamente os pontos em que times com coding agents perdem tempo e tokens: guardrails de runtime, handoff de contexto e leitura ruim do estado da sessão.
Ação TRHJogue checks determinísticos para hooks, use subagentes só em trabalho delimitado e passe a medir output antes da primeira edição, não só tamanho de prompt.

Hooks estão virando um control plane de verdade

O maior sinal é que hooks agora conseguem chamar ferramentas MCP direto via type: "mcp_tool". Isso remove uma camada de cola em shell quando o time quer enforcement, logging, aprovações ou policy checks em cima de ferramentas já conectadas. Na prática, Claude Code está saindo de "agente com ferramentas" para "runtime de agentes com guardrails programáveis".

Isso combina com o material de advanced patterns da Anthropic, apresentado em 24 de março, que separa hooks como camada de automação determinística do ciclo de vida e MCP como camada para raciocinar sobre estado externo. Quando essas duas camadas se conectam de forma mais direta, o agente tende a gastar menos output explicando coreografia de ferramentas e mais budget resolvendo a tarefa.

Subagentes com fork só ajudam quando o papel é estreito

A Anthropic também liberou forked subagents em builds externas atrás de CLAUDE_CODE_FORK_SUBAGENT=1, o que permite que um fork herde toda a conversa em vez de começar do zero. É poderoso, mas também aumenta o risco de usar subagentes como resposta genérica para qualquer tarefa difícil.

Tanto a documentação oficial quanto o webinar repetem a mesma restrição: subagentes funcionam melhor quando têm papel claro, acesso estreito a ferramentas e um artefato pequeno de retorno. O sinal social mais recente aponta na mesma direção. Um thread novo em r/ClaudeCode argumenta que muitas contas de coding agents são dominadas por output gasto com redescoberta do repo, chatter de planejamento e framing repetido antes da primeira edição útil. Multiplicar agentes sem estreitar o escopo pode piorar isso.

O conserto do medidor de 1M importa porque pressão falsa gera otimização falsa

A Anthropic diz que sessões com Opus 4.7 agora contam contra a janela nativa de 1M de contexto, corrigindo porcentagens infladas em /context e autocompactação prematura. Isso importa porque um medidor ruim cria comportamento ruim. Se o time acha que a janela está mais cheia do que realmente está, ele resume cedo demais, compacta cedo demais ou quebra a tarefa de formas que adicionam mais coordenação do que removem.

O Search Console já mostra que a página de Claude Code 2026 gera impressões para leitores da Token Robin Hood. Esta atualização deixa o ângulo mais prático: janela de contexto não é detalhe de modelo. É uma superfície de orçamento operacional que muda como o time decide resumir, delegar, revisar e ramificar sessões.

O que fazer agora

Empurre comportamento determinístico para hooks primeiro. Use MCP quando o agente realmente precisa de estado externo, não quando um script local resolve. Reserve subagentes para investigação delimitada, revisão ou fatias paralelas com critério explícito de sucesso. Depois meça três coisas em sessões reais: output tokens antes da primeira edição, chamadas de descoberta antes da primeira edição e se o agente chegou no arquivo certo mais cedo.

Essa é a linha útil entre automação e desperdício. Token Robin Hood ajuda a analisar onde o uso cresce, onde o contexto é refeito e onde a orquestração vira gasto invisível. A promessa não é economia garantida. A promessa é visibilidade melhor sobre os hábitos de runtime que decidem se uma stack mais forte fica mais rápida ou só mais barulhenta.

Fontes