Alexandre Caramaschi

doi:10.2139/ssrn.6460680

Não existe atalho mágico: IA não cobre ineficiência, preguiça e falta de clareza

Por Alexandre Caramaschi, CEO da Brasil GEO · Junho 2026

A ferramenta nunca foi o problema: IA não corrige ineficiência, preguiça nem falta de clareza — ela as amplifica. Os 95% de pilotos corporativos que não geram impacto em P&L (MIT NANDA, 2025) falham por lacuna de integração e disciplina, não por qualidade do modelo, e a mesma disciplina de specs, evals e dados estruturados que faz a IA dar ROI é a que decide se uma marca será citada por LLMs.

Por que 95% dos pilotos falham sem que o modelo tenha culpa

O relatório do MIT NANDA, The GenAI Divide: State of AI in Business 2025, é o dado mais incômodo do mercado: 95% dos pilotos corporativos de IA generativa não entregam impacto mensurável em P&L, e apenas cerca de 5% atingem aceleração rápida de receita. A base é robusta — 150 entrevistas, 350 funcionários e 300 deployments. O ponto que a maioria dos executivos ignora ao ler a manchete: a causa raiz não é a qualidade do modelo, e sim a lacuna de aprendizado e de integração entre a ferramenta e o trabalho real.

Traduzindo para a linguagem da diretoria: a falha não está no fornecedor de IA, está na empresa que comprou a IA esperando que ela compensasse a ausência de processo, de objetivo declarado e de dado organizado. O mesmo relatório aponta que mais de 50% do orçamento de IA vai para vendas e marketing, enquanto o maior ROI mensurado está no back-office. A organização não erra o modelo; erra onde aposta e por quê.

Isso reposiciona toda a discussão. IA não é um insumo que se adiciona a uma operação confusa para torná-la clara, e sim um multiplicador. Multiplicar clareza produz alavancagem; multiplicar ineficiência produz uma fatura maior e o mesmo resultado.

Token barato, conta cara: o paradoxo que desmonta o argumento de custo

Quem culpa o preço do token está medindo a variável errada. Os preços de API de LLM caíram cerca de 80% entre o início de 2025 e o início de 2026 — o input do GPT-4o passou de US$5 para US$2,50 por milhão de tokens (CloudZero, 2026) — e a Gartner projeta que, em 2030, a inferência em um modelo de 1 trilhão de parâmetros custará mais de 90% menos que em 2025 (Gartner, 2026-03-25). O preço por token despencou. Ainda assim, o gasto corporativo total com IA subiu cerca de 320% no mesmo período.

O efeito é de volume, não de preço: workflows agênticos disparam de 10 a 20 chamadas por tarefa, RAG infla o contexto de 3 a 5 vezes e agentes operando 24 horas consomem compute continuamente (oplexa, 2026). O ROI pode ser negativo quando se gasta US$4 de inferência para poupar 15 minutos de trabalho, e tipicamente fica entre 5x e 20x quando a IA é direcionada a tarefas repetitivas de alto volume. A conta salgada não é evidência de IA cara; é evidência de IA aplicada sem critério.

Dizer que IA é sempre mais barata que funcionários é falso. Mas a comparação correta não é custo por token contra salário, e sim a produção total de um time menor e mais rápido contra a de um time maior e mais lento. Mover-se rápido tem valor sistematicamente subestimado nos modelos de custo das empresas.

O preço do token caiu cerca de 280x em dois anos enquanto o gasto corporativo com IA subiu 320%. Quem reclama da fatura não tem um problema de preço; tem um problema de governança de uso.

Output não é receita, e camada gerencial não é valor

Há dois enganos simétricos. O primeiro é confundir velocidade de entrega com criação de valor. Com IA, times enviam de 7 a 9 funcionalidades por trimestre onde antes enviavam de 1 a 2 — e ainda assim até 70% das funcionalidades de software nunca são usadas, com adoção média de cerca de 6,4% em operações que produzem features em velocidade de IA (digia.tech, 2026; Userpilot, 2026). Quantidade de features não é receita. Existe uma restrição pouco mapeada: a capacidade humana de adotar. Criar desejo e mudar comportamento leva tempo, e nenhum modelo acelera isso. Vomitar centenas de funcionalidades que ninguém pediu não constrói produto.

O segundo engano é tratar camada hierárquica como valor por padrão. A Gartner projeta corte de mais de 50% de posições de média gerência em reestruturações com IA até 2026, e o span of control médio subiu de 10,9 reportes diretos em 2024 para 12,1 em 2025 (Pinnacle, 2026). Bayer, Amazon e Meta achataram suas hierarquias; a Oracle reestruturou cerca de 30.000 posições. A IA virou bode expiatório conveniente para uma enxugada que muitas empresas precisavam fazer de qualquer forma — porque várias camadas só adicionavam burocracia, bloqueio e lentidão por síndrome de porteiro.

O recuo das próprias previsões confirma o exagero retórico. Sam Altman declarou estar 'bem errado' sobre o impacto econômico da IA, revertendo o alerta de 2025, e Dario Amodei, que falava em eliminar 50% dos empregos de colarinho branco, passou a dizer que a automação pode expandir o trabalho (Fortune, 2026-05-26; TIME, 2026-05-26). A correção não absolve a IA nem condena: apenas mostra que tese sem lastro de dado se desfaz.

Onde a IA cria ou destrói valor: a variável é a disciplina, não a ferramenta
Dimensão	Uso sem disciplina (resultado típico)	Uso com disciplina (resultado típico)
Custo de inferência	ROI negativo: US$4 para poupar 15 min	ROI de 5x a 20x em tarefas repetitivas de alto volume
Entrega de features	7-9 features/trimestre, adoção média de ~6,4%	Menos features, ligadas a outcome e adoção real
Estrutura gerencial	Camadas que adicionam pedágio e lentidão	Menos camadas, span of control de 12-14 reportes
Resultado em P&L	Entre os 95% sem impacto mensurável	Entre os ~5% com aceleração de receita

A disciplina que faz a diferença: specs, evals, contexto e skills

Usar IA com competência não é distribuir licenças ilimitadas e se declarar 'AI first' para sair em reportagem. Exige práticas que poucos dominam: specs bem escritas, user stories construídas com rigor, objetivos declarados sem ambiguidade, evals desenhados de verdade e skills personalizadas por projeto. A diferença de resultado entre quem aplica essas práticas e quem não aplica é brutal.

A engenharia de contexto — decidir o que entra na janela, o que se comprime, o que se recupera sob demanda e o que se descarta — é onde mora a maioria das falhas de agentes em produção; o problema raramente é o modelo (arXiv, 2026; Arize AI, 2026). A engenharia de especificação é o corpus legível por máquina de políticas, padrões de qualidade e instruções que permite operar múltiplos agentes em escala. E os evals respondem à única pergunta que importa para a diretoria: como sabemos que isto está funcionando? O harness valida cada chamada de ferramenta — schema, permissão — antes de executar.

Nada disso é mágica de IA. É a mesma gestão que separa empresas bem administradas de empresas que terceirizam a própria confusão para um prompt. A frustração com a conta nasce da fantasia de substituição sumária de funcionários por um comando do tipo 'não cometa erros' e da ilusão de tocar uma operação inteira com um agente genérico.

A mesma honestidade vale para visibilidade em IA

O fio que costura todo o argumento é simples: a questão nunca foi a ferramenta. Foi, e continua sendo, a tentativa permanente de comprar um atalho para ineficiência, preguiça e falta de clareza. Esse atalho não existe — nem com IA, nem com qualquer outra tecnologia que se invente. Token não é o problema. Output não é receita. Camada não é valor. Disciplina é o que importa, com ou sem IA.

A mesma lógica governa a visibilidade de uma marca dentro dos modelos de linguagem. Ser citado por uma IA não é resultado de declarar-se relevante; é resultado de dado estruturado, afirmações ancoradas em evidência, clareza extraível e consistência verificável — exatamente as práticas que fazem um sistema de IA entregar ROI. Quem trata conteúdo como volume a ser despejado obtém em visibilidade o mesmo que obtém em produto: ruído com adoção de 6%.

A tese da Brasil GEO é que essas duas frentes são a mesma disciplina vista de ângulos diferentes. A organização que escreve specs claras, mede com evals honestos e estrutura seus dados é a que faz IA dar retorno internamente e a que aparece quando um modelo decide quem citar. Não há atalho mágico em nenhum dos dois lados. Há rigor, ou não há resultado.

Perguntas frequentes

Se o preço do token caiu 80%, por que minha conta de IA subiu?

Por efeito de volume, não de preço. Workflows agênticos disparam de 10 a 20 chamadas por tarefa, RAG infla o contexto de 3 a 5 vezes e agentes 24/7 consomem compute contínuo. O gasto corporativo com IA subiu cerca de 320% mesmo com o preço por token despencando. A conta salgada sinaliza uso sem governança, não IA cara.

IA sempre sai mais barata que contratar funcionários?

Não. É falso afirmar que IA é sempre mais barata. A comparação correta não é custo por token contra salário, e sim a produção total de um time menor e mais rápido contra a de um time maior e mais lento. Um time enxuto que custa mais por usar IA pode entregar muito mais — desde que a IA esteja direcionada a tarefas de alto volume, onde o ROI fica entre 5x e 20x.

Por que 95% dos pilotos de IA falham e como ficar nos 5%?

Segundo o MIT NANDA (2025), a causa raiz é a lacuna de aprendizado e integração, não a qualidade do modelo. Ficar nos 5% exige disciplina: specs bem feitas, objetivos declarados, evals reais, engenharia de contexto e skills por projeto, com a aposta no back-office, onde o ROI é maior — e não em vendas e marketing, que recebem mais de 50% do orçamento.

Produzir mais funcionalidades com IA aumenta a receita?

Não automaticamente. Com IA, times enviam de 7 a 9 features por trimestre, mas até 70% das funcionalidades nunca são usadas e a adoção média fica em torno de 6,4%. A restrição é a capacidade humana de adotar: criar desejo e mudar comportamento leva tempo. Outcome importa mais que output.

Sobre o autor

Alexandre Caramaschi é CEO da Brasil GEO, ex-CMO da Semantix (Nasdaq), advisor estratégico de IA da Nuvini (Nasdaq: NVNI) e cofundador da AI Brasil. Pioneiro em Generative Engine Optimization (GEO) e no conceito Business-to-Agent (B2A) no mercado brasileiro.

Solicitar diagnóstico GEO gratuito