Operating Intelligence 13 min de leitura

AI agents, modelos preditivos e decisão automatizada: onde a IA do varejo dá lucro e onde dá susto

O varejo brasileiro já tem IA — 59% dos varejistas usam. A pergunta deixou de ser se vai usar e virou onde automatizar a decisão, com qual modelo medir e onde manter o humano no comando

Alexandre Caramaschi

CEO da Brasil GEO, ex-CMO da Semantix (Nasdaq), cofundador da AI Brasil

Atualizado em 10 de junho de 2026

Resposta direta

Modelos preditivos de forecast, propensão e churn já dão retorno mensurável no varejo brasileiro: analytics preditivo reduz até 30% das perdas por excesso de estoque e eleva 25% a efetividade de campanhas (CNDL, 2026).
Copilotos em ERP saíram do anúncio para a operação: o TOTVS Copilot foi lançado em junho de 2025 e a SAP anunciou Retail Intelligence e Order Reliability Agent na NRF 2026, mudando a parametrização e o go-live.
Measurement de modelo é o que separa IA que dá lucro de IA que dá susto: model lift, automation rate, human override, AI ROI e incident rate precisam ser medidos antes de confiar a decisão à máquina.
Human-in-the-loop é desenho de operação, não enfeite de governança: define onde o agente decide sozinho, onde ele sugere e o humano aprova, e onde ele não pode tocar — a régua muda por valor e risco da decisão.
59% dos varejistas brasileiros já usam IA e 90% planejam ampliar, mas as barreiras são conhecimento interno (46%), integração (36%) e custo (31%) — não falta de tecnologia, falta de fundação e de operação.

Camada agêntica e IA · Guia profundo

Leitura executiva desta página

Use este bloco para entender a tese, localizar o sistema afetado e sair com uma decisão prática. Ele cruza taxonomia, sistemas afetados, métrica principal e próximos passos para que a leitura avance da tese para a execução.

AI agents, modelos preditivos e decisão automatizada: onde a IA do varejo dá lucro e onde dá susto
Knowledge graph, APIs, protocolos, identidade e auditoria
Mention rate, cobertura de citação, automação e incidentes

Matriz de prontidão

Fluxo de decisão

A sequência organiza a página como decisão operacional: primeiro localiza a dor, depois conecta dados, sistemas, risco e ação.

Tabela de decisão rápida

Critério	Leitura desta página	Como usar
Dono da decisão	Dados, governança e arquitetura	Define prioridade, orçamento e responsabilidade operacional.
Sistema afetado	Knowledge graph, APIs, protocolos, identidade e auditoria	Mostra onde o conteúdo encosta na operação real.
KPI de leitura	Mention rate, cobertura de citação, automação e incidentes	Transforma a página em critério de gestão, não apenas em artigo.
Risco se ignorar	Agente sem contexto, permissão ampla ou rastro de decisão	Ajuda o leitor a enxergar o custo de adiar a decisão.
Decisão da semana	Separar o que pode automatizar agora do que exige supervisão e prova de confiança	Converte leitura em ação curta, verificável e conectada ao portal.

Um varejista brasileiro ligou um modelo de precificação dinâmica e, na primeira semana, ele baixou o preço de um item de alto giro a ponto de zerar a margem para bater volume. O modelo fez exatamente o que foi treinado para fazer: maximizar conversão. Ninguém tinha dito a ele que existia um piso de margem. O problema não foi a IA decidir; foi ninguém ter desenhado onde ela podia decidir sozinha, onde devia sugerir e onde não podia tocar. A automação sem governança não é eficiência — é risco em velocidade de máquina.

A tese deste guia incomoda os dois extremos. Para quem ainda trata IA como futuro distante: o varejo brasileiro já usa, com 59% dos varejistas operando IA e 90% planejando ampliar (Zucchetti/Central do Varejo, 2026). Para quem acha que basta ligar o modelo: a IA que dá lucro é indistinguível da que dá susto, exceto pela disciplina de measurement e pelo desenho de human-in-the-loop por baixo dela. O guia Data platform, CDP e identity resolution trata da fundação de dados; aqui tratamos do que se constrói sobre ela — e de como não se machucar no processo.

Quais modelos de IA já dão retorno no varejo brasileiro?

Resposta direta: os que decidem sobre estoque, preço e cliente com dado coerente por trás — forecast de demanda, propensão de compra, churn e precificação dinâmica. O retorno é mensurável: analytics preditivo reduz até 30% das perdas por excesso de estoque e eleva cerca de 25% a efetividade das campanhas no Brasil (CNDL, 2026).

A ontologia deste portal modela o tópico com seis entidades — Model, Agent, Tool, Decision, Guardrail e Evaluation — e a ordem importa. O modelo produz uma decisão, mas a decisão precisa de guardrail e de avaliação antes de virar ação. Os modelos que entregam retorno hoje no varejo são os clássicos bem aplicados, não a novidade da moda.

O forecast de demanda é o caso mais maduro. Prever quanto vai vender de cada SKU em cada loja reduz ao mesmo tempo a ruptura, que faz perder venda, e o excesso, que prende capital em estoque parado. Num varejo de moda com coleção sazonal e risco de obsolescência, errar o forecast é errar a coleção inteira. Os modelos de propensão e churn miram o cliente: quem está prestes a comprar de novo e quem está prestes a sumir. Direcionar campanha por propensão, em vez de disparar para a base inteira, é o que eleva a efetividade em torno de 25%.

Precificação dinâmica e o limite que ninguém configura

A precificação dinâmica ajusta preço em tempo real conforme demanda, estoque e concorrência. A plataforma Carol, da TOTVS, alimenta o módulo de Pricing Insights do varejo supermercadista justamente com esse propósito. Mas precificação é onde o guardrail mais falta. Um modelo que maximiza conversão sem piso de margem destrói margem; um que maximiza margem sem teto de preço afasta cliente. O modelo não erra por ser burro; erra porque ninguém configurou o limite. O guardrail não é detalhe técnico — é a decisão de negócio que precede a decisão do modelo.

O que muda quando o ERP ganha um copiloto de IA?

Resposta direta: muda a velocidade de operar e de parametrizar, e tira o operador da tarefa repetitiva para colocá-lo na decisão. Os copilotos saíram do anúncio para a operação em 2025-2026, e o efeito mais concreto aparece no tempo de go-live e na configuração do sistema.

O movimento é real e datado. O TOTVS Copilot foi lançado em junho de 2025, no Universo TOTVS, com agentes de IA generativa embarcados nos ERPs da empresa e uma loja online de agentes especializados por segmento — varejo, logística, atacado, finanças. Em dezembro de 2025, a TOTVS anunciou um assistente de IA específico para descomplicar a reforma tributária no setor supermercadista. A SAP, na NRF 2026, anunciou uma geração nova de IA para o varejo: o Retail Intelligence no Business Data Cloud para planejamento de demanda e estoque, e o Order Reliability Agent, ambos com disponibilidade geral prevista para 2026.

Plataforma	Capacidade de IA	Status
TOTVS Copilot	Agentes generativos por segmento, loja de agentes	Lançado jun/2025
TOTVS (supermercados)	Assistente de IA para reforma tributária	Anunciado dez/2025
SAP Retail Intelligence	Planejamento de demanda e estoque (Business Data Cloud)	GA previsto 1º sem/2026
SAP Order Reliability Agent	Confiabilidade de pedido via Order Management	GA previsto 2º tri/2026
Senior Sistemas	50+ agentes embarcados, implantação AI-Centric	Em operação 2026

O ganho operacional é tangível. A TOTVS relata redução de 46% no tempo de go-live com IA, de 480 horas para 22 horas em casos de parametrização, e a Senior reporta até 90% de redução de implantação com abordagem AI-Centric. Num país onde 33,31% das empresas pretendem adquirir ou trocar de ERP até 2026, com a reforma tributária como maior gatilho de troca do ciclo, o copiloto que acelera a parametrização vira argumento de decisão. É também o território em que opera a Onclick, do grupo Nuvini (NASDAQ: NVNI), com a tese de que o gargalo do varejo está na operação e na conformidade fiscal, não na demanda.

Como medir se um modelo está dando lucro ou susto?

Resposta direta: medindo lift contra um grupo de controle, não acurácia isolada, e acompanhando automation rate, human override, AI ROI e incident rate. Um modelo com acurácia alta no papel mas override constante na operação não está funcionando — está sendo vigiado em tempo integral, o que custa o trabalho humano que ele deveria poupar.

A ontologia lista cinco KPIs para o tópico, e cada um corta uma ilusão diferente. Model lift é o mais importante e o mais ignorado: ele compara a decisão com o modelo contra a decisão sem ele, num grupo de controle. Acurácia de 95% não diz nada se a decisão sem o modelo já acertava 94%; o lift real é 1 ponto, não 95. Medir lift exige a disciplina de manter um controle, e é justamente o que muitas operações pulam.

O automation rate mede quanto da decisão já roda sem humano — quanto da promessa de automação virou realidade. O human override mede quantas vezes o humano teve de corrigir o modelo: override alto significa que o modelo não está confiável, por melhor que pareça a métrica de papel. O AI ROI confronta o retorno com o custo real, que inclui o dado, a infraestrutura e o tempo humano de supervisão. E o incident rate mede quantas vezes o modelo errou feio o bastante para causar dano — o preço de margem zerada, a campanha disparada para o público errado, o estoque comprado em excesso.

Acurácia é o que o modelo promete na demonstração. Override e incident rate são o que ele entrega na operação. A diferença entre IA que dá lucro e IA que dá susto não está no algoritmo; está em quem teve a disciplina de medir o que importa antes de confiar a decisão à máquina.

Onde manter o humano no comando, e onde tirá-lo?

Resposta direta: human-in-the-loop é desenho de operação, não enfeite de governança. Define três zonas — onde o agente decide sozinho, onde ele sugere e o humano aprova, e onde ele não pode tocar — e a régua que separa as zonas é o valor e o risco da decisão, não o entusiasmo com a tecnologia.

A decisão de automação não é binária. Há decisões de baixo valor e alto volume — reprecificar um item de catálogo dentro de uma faixa configurada, sugerir um produto relacionado — em que o agente pode decidir sozinho, porque o erro é barato e o ganho de velocidade é alto. Há decisões de valor médio em que o agente sugere e o humano aprova: um pedido de compra grande, uma campanha para um segmento inteiro. E há decisões de alto risco em que o agente não decide — apenas informa: cancelar uma linha de produto, mudar a política de preço de uma categoria inteira.

O erro comum é aplicar a mesma régua a tudo. Times ou travam o agente em todas as decisões, matando o ganho de automação, ou liberam tudo e descobrem o piso de margem zerado na sexta-feira. O desenho correto mapeia cada tipo de decisão num eixo de valor e risco e atribui a zona certa. À medida que o measurement mostra que o override caiu e o incident rate é baixo numa zona, a operação pode mover decisões da aprovação humana para a automação — com dado, não com fé.

Esse cuidado conecta-se ao perímetro de risco mais amplo do varejo, como mostra o guia Fraude agêntica e o novo perímetro de risco: a pergunta deixou de ser “é humano?” e virou “este agente tem autorização verificável para esta decisão?”. Human-in-the-loop é a resposta interna a essa pergunta — a procuração que a sua própria operação dá, ou nega, a cada agente.

Por que tantos projetos de IA no varejo morrem na operação?

Resposta direta: porque a barreira raramente é a tecnologia — é conhecimento interno, integração e custo, nessa ordem. A pesquisa de 2026 é direta: entre os 59% de varejistas brasileiros que já usam IA, as três maiores barreiras são conhecimento interno (46%), integração (36%) e custo (31%) (Zucchetti/Central do Varejo, 2026). Nenhuma delas é “falta de modelo bom”.

O conhecimento interno é a barreira número um, e ela explica por que tantos pilotos não viram operação. Comprar um modelo é fácil; saber qual decisão automatizar, como medir lift e onde colocar o guardrail exige um repertório que muitos times não têm. Sem esse repertório, a operação liga o modelo, não sabe medir se ele funciona e o desliga ao primeiro susto. A IA não falhou; a operação não soube operá-la.

A integração é a segunda barreira, e ela conecta este guia à fundação. Um modelo precisa ler dado de vários sistemas e devolver decisão para vários sistemas. Se o ERP, a loja e o estoque não conversam, o modelo recebe dado parcial e devolve decisão que não chega à operação. É por isso que a fundação de dados unificada, tratada no guia Data platform, CDP e identity resolution, é pré-requisito e não detalhe. O modelo é a ponta; a integração é o que o sustenta.

Custo real não é o preço da licença

A terceira barreira, custo, engana porque o preço visível — a licença do modelo — costuma ser a menor parcela. O custo real inclui o dado a ser tratado, a integração a ser construída e, principalmente, o tempo humano de supervisão enquanto o override é alto. Um modelo que exige um operador vigiando cada decisão custa o salário desse operador, não só a assinatura. É por isso que o AI ROI precisa contabilizar o custo total, e não o preço de tabela. Modelos que reduzem o override ao longo do tempo baixam esse custo; modelos que permanecem sob vigilância permanente nunca pagam a conta. A McKinsey nota que, embora 88% das empresas usem IA em ao menos uma função, apenas 62% testam agentes — o salto de “usar IA” para “confiar decisão a um agente” é exatamente onde o custo de supervisão pesa.

A decisão automatizada em 2027

Em 2027, a decisão automatizada deixa de ser modelo isolado e vira agente que age entre sistemas. O Gartner projeta que 60% das marcas terão IA agêntica em interação um-a-um com o cliente até 2028, e que até 2030 cerca de 20% das transações digitais passarão por agentes — mas alerta que mais de 40% dos projetos de IA agêntica serão cancelados até 2027 por falta de valor claro. O contraste é a lição: a tecnologia avança, mas o retorno só vem para quem tem fundação de dados e disciplina de measurement. O split payment da reforma tributária, previsto para 2027, adiciona um agente obrigatório de fato — o ERP terá de separar tributo automaticamente no momento do pagamento, uma decisão automatizada de alto risco que não admite override manual em escala. Em 2027, a pergunta não será se a sua operação automatiza a decisão; será se ela automatiza com guardrail, com lift medido e com a zona de human-in-the-loop desenhada antes do incidente, e não depois.

O que decidir nesta semana

Escolha um modelo preditivo de retorno conhecido — forecast de demanda ou propensão — e exija que ele seja medido por lift contra um grupo de controle, não por acurácia isolada.
Mapeie as suas decisões operacionais num eixo de valor e risco e defina, para cada tipo, a zona de human-in-the-loop: automação plena, sugestão com aprovação ou apenas informação.
Configure o guardrail antes de ligar qualquer automação de preço ou estoque — piso de margem, teto de preço, limite de pedido — porque o modelo não erra por maldade, erra por falta de limite.
Avalie o copiloto de IA do seu ERP atual ou futuro pelo ganho concreto de go-live e parametrização, não pela demonstração, e pese isso na decisão de troca puxada pela reforma tributária.
Comece a medir override e incident rate desde o primeiro dia de qualquer modelo em produção, porque é esse par de números, e não a acurácia, que vai dizer se você tem IA que dá lucro ou IA que dá susto.

Perguntas frequentes

Quais modelos de IA dão retorno real no varejo, e não só demonstração?

Os que decidem sobre estoque, preço e cliente com dado coerente por trás. Forecast de demanda reduz ruptura e excesso — analytics preditivo corta até 30% das perdas por excesso de estoque no Brasil (CNDL, 2026). Modelos de propensão e churn elevam a efetividade de campanha em cerca de 25%. Precificação dinâmica ajusta margem em tempo real. O denominador comum é que todos dependem de uma fundação de dados unificada; sem ela, o modelo é demonstração bonita que não escala.

O que muda quando o ERP ganha um copiloto de IA?

Muda a velocidade de operar e parametrizar. O TOTVS Copilot, lançado em junho de 2025, embarca agentes de IA generativa nos ERPs da empresa, com uma loja de agentes por segmento. A SAP anunciou na NRF 2026 o Retail Intelligence e o Order Reliability Agent. O efeito prático aparece no go-live: a TOTVS relata redução de 46% no tempo de implantação com IA, de 480 para 22 horas em casos de parametrização. O copiloto não substitui o operador; ele tira o operador da tarefa repetitiva e o coloca na decisão.

Como saber se um modelo de IA está realmente funcionando?

Medindo lift contra um grupo de controle, não olhando a acurácia isolada. Model lift compara a decisão do modelo com a decisão sem ele — quanto a mais ele entrega. Automation rate mede quanto da decisão já roda sem humano. Human override mede quantas vezes o humano teve de corrigir o modelo, e incident rate mede quantas vezes ele errou feio. Um modelo com acurácia alta no papel mas override constante na operação não está funcionando; está sendo babá vigiado em tempo integral.