AI agents, modelos preditivos e decisão automatizada: onde a IA do varejo dá lucro e onde dá susto
O varejo brasileiro já tem IA — 59% dos varejistas usam. A pergunta deixou de ser se vai usar e virou onde automatizar a decisão, com qual modelo medir e onde manter o humano no comando
Alexandre Caramaschi
CEO da Brasil GEO, ex-CMO da Semantix (Nasdaq), cofundador da AI Brasil
Camada agêntica e IA · Guia profundo
Leitura executiva desta página
Use este bloco para entender a tese, localizar o sistema afetado e sair com uma decisão prática. Ele cruza taxonomia, sistemas afetados, métrica principal e próximos passos para que a leitura avance da tese para a execução.
- AI agents, modelos preditivos e decisão automatizada: onde a IA do varejo dá lucro e onde dá susto
- Knowledge graph, APIs, protocolos, identidade e auditoria
- Mention rate, cobertura de citação, automação e incidentes
Matriz de prontidão
Fluxo de decisão
A sequência organiza a página como decisão operacional: primeiro localiza a dor, depois conecta dados, sistemas, risco e ação.
Tabela de decisão rápida
| Critério | Leitura desta página | Como usar |
|---|---|---|
| Dono da decisão | Dados, governança e arquitetura | Define prioridade, orçamento e responsabilidade operacional. |
| Sistema afetado | Knowledge graph, APIs, protocolos, identidade e auditoria | Mostra onde o conteúdo encosta na operação real. |
| KPI de leitura | Mention rate, cobertura de citação, automação e incidentes | Transforma a página em critério de gestão, não apenas em artigo. |
| Risco se ignorar | Agente sem contexto, permissão ampla ou rastro de decisão | Ajuda o leitor a enxergar o custo de adiar a decisão. |
| Decisão da semana | Separar o que pode automatizar agora do que exige supervisão e prova de confiança | Converte leitura em ação curta, verificável e conectada ao portal. |
Um varejista brasileiro ligou um modelo de precificação dinâmica e, na primeira semana, ele baixou o preço de um item de alto giro a ponto de zerar a margem para bater volume. O modelo fez exatamente o que foi treinado para fazer: maximizar conversão. Ninguém tinha dito a ele que existia um piso de margem. O problema não foi a IA decidir; foi ninguém ter desenhado onde ela podia decidir sozinha, onde devia sugerir e onde não podia tocar. A automação sem governança não é eficiência — é risco em velocidade de máquina.
A tese deste guia incomoda os dois extremos. Para quem ainda trata IA como futuro distante: o varejo brasileiro já usa, com 59% dos varejistas operando IA e 90% planejando ampliar (Zucchetti/Central do Varejo, 2026). Para quem acha que basta ligar o modelo: a IA que dá lucro é indistinguível da que dá susto, exceto pela disciplina de measurement e pelo desenho de human-in-the-loop por baixo dela. O guia Data platform, CDP e identity resolution trata da fundação de dados; aqui tratamos do que se constrói sobre ela — e de como não se machucar no processo.
Quais modelos de IA já dão retorno no varejo brasileiro?
Resposta direta: os que decidem sobre estoque, preço e cliente com dado coerente por trás — forecast de demanda, propensão de compra, churn e precificação dinâmica. O retorno é mensurável: analytics preditivo reduz até 30% das perdas por excesso de estoque e eleva cerca de 25% a efetividade das campanhas no Brasil (CNDL, 2026).
A ontologia deste portal modela o tópico com seis entidades — Model, Agent, Tool, Decision, Guardrail e Evaluation — e a ordem importa. O modelo produz uma decisão, mas a decisão precisa de guardrail e de avaliação antes de virar ação. Os modelos que entregam retorno hoje no varejo são os clássicos bem aplicados, não a novidade da moda.
O forecast de demanda é o caso mais maduro. Prever quanto vai vender de cada SKU em cada loja reduz ao mesmo tempo a ruptura, que faz perder venda, e o excesso, que prende capital em estoque parado. Num varejo de moda com coleção sazonal e risco de obsolescência, errar o forecast é errar a coleção inteira. Os modelos de propensão e churn miram o cliente: quem está prestes a comprar de novo e quem está prestes a sumir. Direcionar campanha por propensão, em vez de disparar para a base inteira, é o que eleva a efetividade em torno de 25%.
Precificação dinâmica e o limite que ninguém configura
A precificação dinâmica ajusta preço em tempo real conforme demanda, estoque e concorrência. A plataforma Carol, da TOTVS, alimenta o módulo de Pricing Insights do varejo supermercadista justamente com esse propósito. Mas precificação é onde o guardrail mais falta. Um modelo que maximiza conversão sem piso de margem destrói margem; um que maximiza margem sem teto de preço afasta cliente. O modelo não erra por ser burro; erra porque ninguém configurou o limite. O guardrail não é detalhe técnico — é a decisão de negócio que precede a decisão do modelo.
O que muda quando o ERP ganha um copiloto de IA?
Resposta direta: muda a velocidade de operar e de parametrizar, e tira o operador da tarefa repetitiva para colocá-lo na decisão. Os copilotos saíram do anúncio para a operação em 2025-2026, e o efeito mais concreto aparece no tempo de go-live e na configuração do sistema.
O movimento é real e datado. O TOTVS Copilot foi lançado em junho de 2025, no Universo TOTVS, com agentes de IA generativa embarcados nos ERPs da empresa e uma loja online de agentes especializados por segmento — varejo, logística, atacado, finanças. Em dezembro de 2025, a TOTVS anunciou um assistente de IA específico para descomplicar a reforma tributária no setor supermercadista. A SAP, na NRF 2026, anunciou uma geração nova de IA para o varejo: o Retail Intelligence no Business Data Cloud para planejamento de demanda e estoque, e o Order Reliability Agent, ambos com disponibilidade geral prevista para 2026.
| Plataforma | Capacidade de IA | Status |
|---|---|---|
| TOTVS Copilot | Agentes generativos por segmento, loja de agentes | Lançado jun/2025 |
| TOTVS (supermercados) | Assistente de IA para reforma tributária | Anunciado dez/2025 |
| SAP Retail Intelligence | Planejamento de demanda e estoque (Business Data Cloud) | GA previsto 1º sem/2026 |
| SAP Order Reliability Agent | Confiabilidade de pedido via Order Management | GA previsto 2º tri/2026 |
| Senior Sistemas | 50+ agentes embarcados, implantação AI-Centric | Em operação 2026 |
O ganho operacional é tangível. A TOTVS relata redução de 46% no tempo de go-live com IA, de 480 horas para 22 horas em casos de parametrização, e a Senior reporta até 90% de redução de implantação com abordagem AI-Centric. Num país onde 33,31% das empresas pretendem adquirir ou trocar de ERP até 2026, com a reforma tributária como maior gatilho de troca do ciclo, o copiloto que acelera a parametrização vira argumento de decisão. É também o território em que opera a Onclick, do grupo Nuvini (NASDAQ: NVNI), com a tese de que o gargalo do varejo está na operação e na conformidade fiscal, não na demanda.
Como medir se um modelo está dando lucro ou susto?
Resposta direta: medindo lift contra um grupo de controle, não acurácia isolada, e acompanhando automation rate, human override, AI ROI e incident rate. Um modelo com acurácia alta no papel mas override constante na operação não está funcionando — está sendo vigiado em tempo integral, o que custa o trabalho humano que ele deveria poupar.
A ontologia lista cinco KPIs para o tópico, e cada um corta uma ilusão diferente. Model lift é o mais importante e o mais ignorado: ele compara a decisão com o modelo contra a decisão sem ele, num grupo de controle. Acurácia de 95% não diz nada se a decisão sem o modelo já acertava 94%; o lift real é 1 ponto, não 95. Medir lift exige a disciplina de manter um controle, e é justamente o que muitas operações pulam.
O automation rate mede quanto da decisão já roda sem humano — quanto da promessa de automação virou realidade. O human override mede quantas vezes o humano teve de corrigir o modelo: override alto significa que o modelo não está confiável, por melhor que pareça a métrica de papel. O AI ROI confronta o retorno com o custo real, que inclui o dado, a infraestrutura e o tempo humano de supervisão. E o incident rate mede quantas vezes o modelo errou feio o bastante para causar dano — o preço de margem zerada, a campanha disparada para o público errado, o estoque comprado em excesso.
Acurácia é o que o modelo promete na demonstração. Override e incident rate são o que ele entrega na operação. A diferença entre IA que dá lucro e IA que dá susto não está no algoritmo; está em quem teve a disciplina de medir o que importa antes de confiar a decisão à máquina.
Onde manter o humano no comando, e onde tirá-lo?
Resposta direta: human-in-the-loop é desenho de operação, não enfeite de governança. Define três zonas — onde o agente decide sozinho, onde ele sugere e o humano aprova, e onde ele não pode tocar — e a régua que separa as zonas é o valor e o risco da decisão, não o entusiasmo com a tecnologia.
A decisão de automação não é binária. Há decisões de baixo valor e alto volume — reprecificar um item de catálogo dentro de uma faixa configurada, sugerir um produto relacionado — em que o agente pode decidir sozinho, porque o erro é barato e o ganho de velocidade é alto. Há decisões de valor médio em que o agente sugere e o humano aprova: um pedido de compra grande, uma campanha para um segmento inteiro. E há decisões de alto risco em que o agente não decide — apenas informa: cancelar uma linha de produto, mudar a política de preço de uma categoria inteira.
O erro comum é aplicar a mesma régua a tudo. Times ou travam o agente em todas as decisões, matando o ganho de automação, ou liberam tudo e descobrem o piso de margem zerado na sexta-feira. O desenho correto mapeia cada tipo de decisão num eixo de valor e risco e atribui a zona certa. À medida que o measurement mostra que o override caiu e o incident rate é baixo numa zona, a operação pode mover decisões da aprovação humana para a automação — com dado, não com fé.
Esse cuidado conecta-se ao perímetro de risco mais amplo do varejo, como mostra o guia Fraude agêntica e o novo perímetro de risco: a pergunta deixou de ser “é humano?” e virou “este agente tem autorização verificável para esta decisão?”. Human-in-the-loop é a resposta interna a essa pergunta — a procuração que a sua própria operação dá, ou nega, a cada agente.
Por que tantos projetos de IA no varejo morrem na operação?
Resposta direta: porque a barreira raramente é a tecnologia — é conhecimento interno, integração e custo, nessa ordem. A pesquisa de 2026 é direta: entre os 59% de varejistas brasileiros que já usam IA, as três maiores barreiras são conhecimento interno (46%), integração (36%) e custo (31%) (Zucchetti/Central do Varejo, 2026). Nenhuma delas é “falta de modelo bom”.
O conhecimento interno é a barreira número um, e ela explica por que tantos pilotos não viram operação. Comprar um modelo é fácil; saber qual decisão automatizar, como medir lift e onde colocar o guardrail exige um repertório que muitos times não têm. Sem esse repertório, a operação liga o modelo, não sabe medir se ele funciona e o desliga ao primeiro susto. A IA não falhou; a operação não soube operá-la.
A integração é a segunda barreira, e ela conecta este guia à fundação. Um modelo precisa ler dado de vários sistemas e devolver decisão para vários sistemas. Se o ERP, a loja e o estoque não conversam, o modelo recebe dado parcial e devolve decisão que não chega à operação. É por isso que a fundação de dados unificada, tratada no guia Data platform, CDP e identity resolution, é pré-requisito e não detalhe. O modelo é a ponta; a integração é o que o sustenta.
Custo real não é o preço da licença
A terceira barreira, custo, engana porque o preço visível — a licença do modelo — costuma ser a menor parcela. O custo real inclui o dado a ser tratado, a integração a ser construída e, principalmente, o tempo humano de supervisão enquanto o override é alto. Um modelo que exige um operador vigiando cada decisão custa o salário desse operador, não só a assinatura. É por isso que o AI ROI precisa contabilizar o custo total, e não o preço de tabela. Modelos que reduzem o override ao longo do tempo baixam esse custo; modelos que permanecem sob vigilância permanente nunca pagam a conta. A McKinsey nota que, embora 88% das empresas usem IA em ao menos uma função, apenas 62% testam agentes — o salto de “usar IA” para “confiar decisão a um agente” é exatamente onde o custo de supervisão pesa.
A decisão automatizada em 2027
Em 2027, a decisão automatizada deixa de ser modelo isolado e vira agente que age entre sistemas. O Gartner projeta que 60% das marcas terão IA agêntica em interação um-a-um com o cliente até 2028, e que até 2030 cerca de 20% das transações digitais passarão por agentes — mas alerta que mais de 40% dos projetos de IA agêntica serão cancelados até 2027 por falta de valor claro. O contraste é a lição: a tecnologia avança, mas o retorno só vem para quem tem fundação de dados e disciplina de measurement. O split payment da reforma tributária, previsto para 2027, adiciona um agente obrigatório de fato — o ERP terá de separar tributo automaticamente no momento do pagamento, uma decisão automatizada de alto risco que não admite override manual em escala. Em 2027, a pergunta não será se a sua operação automatiza a decisão; será se ela automatiza com guardrail, com lift medido e com a zona de human-in-the-loop desenhada antes do incidente, e não depois.
O que decidir nesta semana
- Escolha um modelo preditivo de retorno conhecido — forecast de demanda ou propensão — e exija que ele seja medido por lift contra um grupo de controle, não por acurácia isolada.
- Mapeie as suas decisões operacionais num eixo de valor e risco e defina, para cada tipo, a zona de human-in-the-loop: automação plena, sugestão com aprovação ou apenas informação.
- Configure o guardrail antes de ligar qualquer automação de preço ou estoque — piso de margem, teto de preço, limite de pedido — porque o modelo não erra por maldade, erra por falta de limite.
- Avalie o copiloto de IA do seu ERP atual ou futuro pelo ganho concreto de go-live e parametrização, não pela demonstração, e pese isso na decisão de troca puxada pela reforma tributária.
- Comece a medir override e incident rate desde o primeiro dia de qualquer modelo em produção, porque é esse par de números, e não a acurácia, que vai dizer se você tem IA que dá lucro ou IA que dá susto.
Perguntas frequentes
Quais modelos de IA dão retorno real no varejo, e não só demonstração?
Os que decidem sobre estoque, preço e cliente com dado coerente por trás. Forecast de demanda reduz ruptura e excesso — analytics preditivo corta até 30% das perdas por excesso de estoque no Brasil (CNDL, 2026). Modelos de propensão e churn elevam a efetividade de campanha em cerca de 25%. Precificação dinâmica ajusta margem em tempo real. O denominador comum é que todos dependem de uma fundação de dados unificada; sem ela, o modelo é demonstração bonita que não escala.
O que muda quando o ERP ganha um copiloto de IA?
Muda a velocidade de operar e parametrizar. O TOTVS Copilot, lançado em junho de 2025, embarca agentes de IA generativa nos ERPs da empresa, com uma loja de agentes por segmento. A SAP anunciou na NRF 2026 o Retail Intelligence e o Order Reliability Agent. O efeito prático aparece no go-live: a TOTVS relata redução de 46% no tempo de implantação com IA, de 480 para 22 horas em casos de parametrização. O copiloto não substitui o operador; ele tira o operador da tarefa repetitiva e o coloca na decisão.
Como saber se um modelo de IA está realmente funcionando?
Medindo lift contra um grupo de controle, não olhando a acurácia isolada. Model lift compara a decisão do modelo com a decisão sem ele — quanto a mais ele entrega. Automation rate mede quanto da decisão já roda sem humano. Human override mede quantas vezes o humano teve de corrigir o modelo, e incident rate mede quantas vezes ele errou feio. Um modelo com acurácia alta no papel mas override constante na operação não está funcionando; está sendo babá vigiado em tempo integral.