AI-first de verdade x AI-first de reportagem
Declarar-se "AI-first" não é capacidade: capacidade é a disciplina de aplicação. O dado decisivo é que 95% dos pilotos corporativos de IA generativa não produzem impacto mensurável em P&L (MIT NANDA, 2025), e a causa raiz é lacuna de integração e aprendizado, não qualidade do modelo, exatamente o que o selo de reportagem comprada e as licenças ilimitadas não compram.
Por que o selo "AI-first" virou marketing antes de virar competência
O termo "AI-first" passou a operar como insígnia reputacional, não como descrição de prática. Comprar licenças amplas, liberar limites de tokens para todo mundo e estampar a adesão em uma reportagem patrocinada são gestos de posicionamento. Nenhum deles altera como o trabalho é especificado, validado e entregue. A confusão entre adquirir acesso e construir capacidade explica boa parte da frustração que hoje se atribui ao custo da tecnologia.
O contraste fica brutal quando se mede resultado. O relatório do MIT NANDA, "The GenAI Divide: State of AI in Business 2025", documenta que 95% dos pilotos corporativos de IA generativa não entregam impacto mensurável em P&L, e que apenas cerca de 5% atingem aceleração rápida de receita (Fortune, 2025-08-18). A base é robusta: 150 entrevistas, 350 funcionários e 300 implementações. O ponto que desmonta o discurso performático é a causa raiz apontada: a lacuna está em aprendizado e integração ao fluxo de trabalho, não na qualidade do modelo.
Se o modelo não é o gargalo, então o selo "AI-first" não compra o que falta. O que separa o grupo dos 5% do grupo dos 95% não é o tamanho da licença, e sim a engenharia de aplicação, e sim uma distinção de natureza, não de grau: uma empresa pode ter acesso ilimitado e zero capacidade.
O recuo de Altman e Amodei expõe o teatro da previsão
Em maio de 2026, dois dos maiores arautos da disrupção recuaram. Sam Altman, da OpenAI, declarou ter estado "bem errado" (pretty wrong) sobre o impacto econômico da IA, revertendo o alerta que ele próprio havia feito em junho de 2025 (TIME, 2026-05-26). Dario Amodei, da Anthropic, que afirmava que a IA poderia eliminar 50% dos empregos de colarinho branco, passou a sustentar que a automação pode expandir o trabalho. As duas reversões coincidiram com janelas de IPO (Fortune, 2026-05-26).
O timing importa porque revela o mecanismo. A retórica apocalíptica e a retórica triunfalista são instrumentos de narrativa, ajustados conforme o público e o momento de captação. O "AI-first de reportagem" pertence à mesma família: é declaração calibrada para audiência, não compromisso operacional verificável.
Há ainda o teste da realidade do mercado de trabalho. O Yale Budget Lab (maio de 2026) concluiu que a IA provavelmente não foi a causa do enfraquecimento do emprego, sem mudança relevante no desemprego até março de 2026 para ocupações de alta exposição à tecnologia. Mesmo assim, os layoffs em tech ultrapassaram 115.000 até maio de 2026, perto dos 124.000 de todo o ano de 2025, com Meta, Amazon e Snap citando IA. A IA virou justificativa conveniente para cortes que teriam outras origens.
A lição executiva é direta: previsão pública sobre IA tem valor informativo próximo de zero quando emitida por quem tem interesse no preço da ação. O que tem valor é a evidência de aplicação dentro da própria operação.
O que distingue a aplicação real: specs, evals e skills por projeto
A capacidade de extrair retorno da IA é uma disciplina técnica com componentes nomeáveis. Specs bem feitas e user stories bem construídas declaram o que o sistema deve fazer antes que ele gaste um token. Objetivos explícitos substituem o prompt mágico do tipo "não cometa erros". Evals respondem à pergunta operacional decisiva: como sabemos que isto está funcionando? E skills personalizadas por projeto convertem conhecimento de domínio em comportamento repetível.
Duas disciplinas mais recentes sustentam a operação em escala. A context engineering decide o que entra na janela de contexto, o que se comprime, o que se recupera sob demanda e o que se descarta; a maioria das falhas de agentes em produção vem de contexto mal gerido, não do modelo (Arize AI, 2026). A specification engineering constitui um corpus legível por máquina de políticas, padrões de qualidade e instruções que permite operação autônoma de múltiplos agentes em escala (arXiv, 2026). Nenhuma das duas aparece em reportagem patrocinada porque nenhuma é vendável como selo.
Por que o investimento em disciplina muda o número de P&L: o MIT NANDA registra que mais de 50% do orçamento corporativo de IA vai para vendas e marketing, enquanto o maior ROI está no back-office. A alocação segue a narrativa, não a evidência. Quem aplica as práticas certas direciona compute para tarefas repetitivas de alto volume, onde o ROI típico fica entre 5x e 20x, e evita o caso em que se gasta US$4 de inferência para poupar 15 minutos, cujo retorno pode ser negativo (oplexa, 2026).
O modelo não é o gargalo. O gargalo é a engenharia de aplicação: specs, evals e contexto bem geridos. Por isso o selo não compra o resultado, e por isso 95% dos pilotos param antes do P&L.
Custo de token desmente o álibi do "AI cara demais"
A queixa sobre conta salgada confunde preço unitário com volume de uso. Os preços de API de LLM caíram cerca de 80% entre o início de 2025 e o início de 2026 (CloudZero, 2026), e o Gartner projeta que realizar inferência em um modelo de 1 trilhão de parâmetros custará mais de 90% menos em 2030 do que em 2025 (Gartner, 2026-03-25). O preço por token caiu cerca de 280x em dois anos.
No mesmo período, o gasto corporativo total com IA subiu cerca de 320%. O paradoxo de Jevons opera: workflows agênticos disparam de 10 a 20 chamadas por tarefa, o RAG infla o contexto de 3 a 5 vezes e agentes operando continuamente consomem compute sem pausa (Silicon Data, 2026). A conta cresce porque o uso cresce, não porque o token encareceu.
Isso reposiciona o problema. Custo elevado de IA é, na maioria dos casos, sintoma de aplicação indisciplinada: contexto inflado, chamadas redundantes, agentes sem objetivo declarado. O "AI-first de verdade" gasta mais por usar IA de forma intensiva, mas em um time menor que produz e entrega mais. O "AI-first de reportagem" gasta para exibir adesão e colhe a fatura sem o retorno.
| Dimensão | AI-first de reportagem | AI-first de verdade |
|---|---|---|
| Gesto central | Licenças ilimitadas e selo em matéria comprada | Specs, user stories, objetivos declarados, evals, skills por projeto |
| O que mede sucesso | Adesão anunciada e percepção de mercado | Impacto em P&L e ROI por tarefa (5x-20x em alto volume) |
| Onde aloca recurso | Vendas/marketing (>50% do orçamento, MIT NANDA) | Back-office e tarefas repetitivas de alto volume |
| Origem do custo alto | Uso indisciplinado: contexto inflado, chamadas redundantes | Volume intencional com retorno direcionado |
| Resultado típico | Faz parte dos 95% sem impacto em P&L | Compõe os ~5% com aceleração de receita |
A mesma disciplina que dá ROI à IA é a que faz a marca ser citada por LLMs
Mover-se rápido tem valor subestimado, mas produzir mais funcionalidades não aumenta receita automaticamente. Com IA, times enviam de 7 a 9 features por trimestre onde antes enviavam de 1 a 2; ainda assim, até 70% das funcionalidades de software nunca são usadas, e a feature factory em velocidade de IA registra adoção média de cerca de 6,4% (digia.tech, 2026; Userpilot, 2026). A capacidade humana de adotar é o gargalo que nenhum selo resolve. Outcome supera output: adotantes de automação de workflow mostram 94% de retenção e 35% de expansão, contra 68% e 12% dos não-adotantes.
A conclusão atravessa todo o argumento. A ferramenta nunca foi a questão; a questão é a tentativa permanente de tapar ineficiência, preguiça e falta de clareza com uma solução mágica, o que não acontece com IA nem com qualquer outra coisa. Declarar-se "AI-first" é a versão corporativa desse atalho.
Há uma ponte que vale registrar. A disciplina que faz a IA dar retorno (especificação clara, evals, dados estruturados, objetivos declarados) é a mesma que faz uma marca ser citada por modelos de linguagem. Conteúdo com afirmações declarativas, estrutura legível por máquina e fontes ancoradas é, ao mesmo tempo, o que um sistema de IA bem aplicado consome e o que um LLM recupera para responder. Clareza extraível é a unidade comum entre operar com IA e ser encontrado por ela. O selo não produz nenhuma das duas.
Perguntas frequentes
Por que 95% dos pilotos de IA não entregam resultado se os modelos melhoraram tanto?
Porque o gargalo não é o modelo. O relatório MIT NANDA (2025) aponta a causa raiz na lacuna de aprendizado e integração ao fluxo de trabalho. Sem specs claras, evals e contexto bem gerido, o melhor modelo não chega ao P&L.
Como saber se minha empresa é "AI-first" de verdade ou apenas no discurso?
Verifique a prática, não o selo. AI-first real tem especificações legíveis por máquina, evals que respondem "como sabemos que está funcionando", objetivos declarados e skills por projeto, com ROI medido por tarefa. Se a evidência é uma reportagem e licenças amplas, é posicionamento.
Se o preço do token caiu, por que minha conta de IA subiu?
É o paradoxo de Jevons. O preço por token caiu cerca de 280x em dois anos, mas o uso explodiu: agentes disparam 10 a 20 chamadas por tarefa e o RAG infla o contexto de 3 a 5 vezes. A conta alta sinaliza aplicação indisciplinada, não tecnologia cara.
Devo confiar nas previsões públicas de líderes de IA sobre empregos e impacto econômico?
Com cautela. Em maio de 2026, Altman se disse "bem errado" e Amodei reverteu sua previsão de eliminar 50% dos empregos, ambos em janela de IPO. O Yale Budget Lab não encontrou efeito relevante no desemprego até março de 2026. Vale mais a evidência da sua própria operação.
Sobre o autor
Alexandre Caramaschi é CEO da Brasil GEO, ex-CMO da Semantix (Nasdaq) e cofundador da AI Brasil. Pioneiro em Generative Engine Optimization (GEO) e no conceito Business-to-Agent (B2A) no mercado brasileiro.