O Teto do Copilot: Por Que Digitar Mais Rápido Nunca Resolveu o Problema Real

Cresci no Brasil e passei minha primeira década em tecnologia lá, construindo experiência em infraestrutura de TI, serviços de consultoria e entrega de software. Essa base em como sistemas realmente são construídos e mantidos moldou tudo que veio depois. Passei quinze anos na Austrália como Partner em duas das Big Four, liderando transformações de larga escala enraizadas em dados, analytics e a era pré-IA generativa de machine learning. Ajudei grandes clientes em recursos naturais, energia e serviços financeiros a construir plataformas modernas de dados do zero. Nos últimos anos estou baseado no Sudeste Asiático, liderando estratégia e transformação com IA em petroleiras nacionais, mineradoras globais, utilities e conglomerados petroquímicos.

Essa jornada me deu uma perspectiva que vai da infraestrutura à estratégia, do código à sala de diretoria. Vi cada onda de adoção de tecnologia empresarial de perto: o data warehousing, a revolução de analytics, o machine learning, e agora o momento agêntico. E o padrão é sempre o mesmo. A tecnologia funciona. Fazê-la funcionar dentro de grandes organizações é o desafio real.

Quando assistentes de código com IA apareceram em 2023, observei a curva de adoção com aquela mistura familiar de empolgação e ceticismo. Desenvolvedores individuais ficaram mais rápidos, sem dúvida. Mas a maquinaria empresarial de construir e entregar software melhorou na mesma proporção? Na minha experiência em dezenas de projetos: nem de longe.

No último ano, algo mais interessante tomou forma. Não apenas assistentes que ajudam a escrever código, mas sistemas autônomos capazes de executar pipelines inteiros de desenvolvimento. Análise de requisitos, raciocínio arquitetural, implementação, testes. E as equipes que estão fazendo isso funcionar não estão construindo algum enxame de IA auto-organizado. Estão construindo workflows disciplinados e faseados com gates claros e convenções rigorosas. Parece muito com desenvolvimento estruturado de décadas atrás, exceto que completa em horas em vez de trimestres.

Este livro é minha tentativa de explicar o que está funcionando de verdade, trazer a pesquisa que valida, e oferecer uma perspectiva de quem está na linha de frente. Vamos lá.

O Teto do Copilot

Um padrão que encontro constantemente nos meus projetos. A liderança técnica apresenta números impressionantes de produtividade dos desenvolvedores assistidos por IA. Tempos de conclusão caíram 30 a 40 por cento. Linhas entregues por sprint estão subindo.

Aí eu faço uma pergunta diferente: quanto mais rápido uma capacidade de negócio sai do quadro branco para a produção?

Essa pergunta tende a cair de forma diferente na sala.

A restrição na entrega de software empresarial nunca foi a velocidade de digitação. É a série de traduções entre quem entende a necessidade do negócio e quem (ou o que) escreve o código. Cada ponto de tradução vaza informação. O product owner descreve uma feature para um designer. O designer interpreta. Um arquiteto toma decisões tecnológicas, algumas registradas, muitas discutidas verbalmente numa reunião que ninguém vai referenciar de novo.

Vi isso nitidamente numa transformação digital upstream de uma grande petroleira no Sudeste Asiático. Tínhamos engenheiros excelentes usando assistentes de IA. A velocidade individual era legitimamente impressionante. Mas as features ainda levavam semanas para chegar em produção porque cada handoff entre times criava uma brecha onde contexto se perdia. O assistente de IA acelerou a parte de codificação, claro. Mas codificação era talvez 20 por cento do tempo total. Os outros 80 por cento eram reuniões de alinhamento, loops de esclarecimento e retrabalho gerado por requisitos mal interpretados.

Pesquisa apresentada no workshop XP2025 em Brugg-Windisch (Suíça) validou isso sistematicamente: assistentes de IA para código aceleram a execução dentro de fases individuais mas não melhoram significativamente a transição entre fases.

O grupo de Pesquisa em Produtividade de Engenharia de Software de Stanford estuda isso rigorosamente desde o final de 2022. A metodologia deles é incomumente fundamentada: em vez de pesquisas auto-reportadas, analisam commits reais avaliados por painéis de engenheiros sênior com contexto do repositório. Descobriram que as versões iniciais das ferramentas de IA tinham impacto mensurável desprezível na produção por equipe. O sinal só se tornou detectável conforme as ferramentas amadureceram, e mesmo assim observaram um gap crescente entre equipes que aprenderam a usar IA efetivamente e as que não aprenderam. A dinâmica de 'quem tem mais ganha mais' é consistente com o que vejo em campo: os ganhos são reais mas distribuídos desigualmente, concentrados em equipes que investiram em workflows estruturados, não apenas em acesso a ferramentas.

O MIT Sloan capturou um achado relacionado: numa pesquisa de 2025, 35 por cento dos respondentes já haviam adotado agentes de IA, com outros 44 por cento planejando deploy em breve. Mas mesmo empresas na vanguarda não entendiam plenamente como usar agentes para maximizar produtividade. O gap entre adoção e impacto é enorme, e é predominantemente um problema de workflow, não de tecnologia.

Kate Kellogg e colegas do MIT publicaram um achado particularmente revelador em sua pesquisa de 2025. Descobriram que 80 por cento do esforço para fazer agentes de IA funcionarem na prática era consumido por engenharia de dados, alinhamento de stakeholders, governança e integração de workflows. Não ajuste de modelo. Não prompt engineering. O trabalho 'sem glamour' de encaixar sistemas inteligentes em processos organizacionais reais. Essa proporção corresponde quase exatamente à minha experiência em contextos industriais e empresariais.

O Que Agentes Adicionam ao Problema

Agentes de IA (sistemas que não apenas sugerem mas executam) trazem complicações adicionais:

Saídas não-determinísticas. Entregue o mesmo requisito ao mesmo modelo duas vezes e você receberá código diferente. A variância depende da técnica de prompting, do contexto fornecido e da aleatoriedade inerente dos modelos de linguagem. Dá pra gerenciar para um desenvolvedor experimentando. É um problema sério quando você quer construir um pipeline de entrega confiável.

Raciocínio que evapora. Quando um agente ajuda a escolher uma tecnologia de fila de mensagens durante uma sessão de chat, o raciocínio desaparece quando a sessão fecha. Três meses depois ninguém sabe por que a equipe usa aquela infraestrutura específica.

O insight que importa: esses não são problemas de inteligência. Um modelo mais esperto não vai resolvê-los. São problemas de arquitetura de workflow, e as soluções são de engenharia, não de capacidade de IA.

Este artigo é de O SDLC Agêntico por Carlos Aggio.