Hugging Face mostra o playbook reviewer-first para code agents: skills, harness de testes e PRs mantiveis

Um dos posts mais uteis sobre coding agents neste mes nao anunciou um modelo. Anunciou um padrao. No texto de 16 de abril, a Hugging Face diz que o problema novo e volume de PR plausivel demais para pouca capacidade de revisao. A resposta deles nao e banir agentes. E obrigar o agente a gerar sinal util para o revisor.

O artigo descreve uma skill para portar modelos de transformers para mlx-lm e um harness externo, nao agentico, para reproduzir os testes. O objetivo nao e maximizar numero de PRs. E gerar algo que pareca submissao cuidadosa de humano, com escopo estreito, sem refactors oportunistas e com artefatos verificaveis.

Isso importa porque o gargalo deixou de ser so escrever codigo. Agora o gargalo tambem e respeitar convencoes locais, evitar efeitos colaterais e nao desperdiçar tempo de manutencao. Um patch tecnicamente valido ainda pode ser caro se faz o revisor redescobrir contexto que o agente deveria ter respeitado.

A regra TRH: review waste tambem e token waste. Se o agente gera tres PRs quase certas, mas cada uma custa rodada extra de leitura, verificacao e correcoes sociais, voce queimou uso antes do merge. Skills estreitas, manifests reproduziveis e harness externo sao o tipo de disciplina que transforma agente em alavanca, nao em divida de revisao.

Hugging Face mostra o playbook reviewer-first para code agents: skills, harness de testes e PRs mantiveis

Fontes