Operating Intelligence 12 min de leitura

Governança de IA agêntica: as três fases — Design, Runtime e Assurance — que decidem quem fica de pé em 2027

Agente de IA sem governança não é inovação, é passivo. As três fases que separam quem coloca agentes para operar com segurança de quem vira estatística dos 40% de projetos cancelados pela Gartner

Alexandre Caramaschi

CEO da Brasil GEO, ex-CMO da Semantix (Nasdaq), cofundador da AI Brasil

Atualizado em 10 de junho de 2026

Resposta direta

Governança de IA agêntica acontece em três fases distintas: Design (limites codificados antes do agente rodar), Runtime (controle enquanto ele opera) e Assurance (auditoria do que ele fez). Pular qualquer uma deixa um buraco que a operação paga depois.
Policy-as-code e orçamento por agente são o coração do Design: o agente não deve poder gastar, comprar ou decidir além de limites escritos em código, não em política de PDF que ninguém aplica.
Human-in-the-loop no Runtime não é fraqueza de automação: é a regra que mantém a decisão de alto valor sob supervisão humana até a operação ter confiança e dados para afrouxar o controle.
A Gartner prevê que 40% dos projetos de comércio agêntico serão cancelados até 2027 por falta de maturidade e desalinhamento — e a ausência de governança é uma das principais causas desse cancelamento.
Shadow AI — agentes e ferramentas de IA usados sem aprovação ou trilha — é o risco silencioso: o que a governança não vê, ela não controla, e o audit log existe justamente para trazer o invisível à tona.

Camada agêntica e IA · Guia profundo

Leitura executiva desta página

Use este bloco para entender a tese, localizar o sistema afetado e sair com uma decisão prática. Ele cruza taxonomia, sistemas afetados, métrica principal e próximos passos para que a leitura avance da tese para a execução.

Governança de IA agêntica: as três fases
Knowledge graph, APIs, protocolos, identidade e auditoria
Mention rate, cobertura de citação, automação e incidentes

Matriz de prontidão

Fluxo de decisão

A sequência organiza a página como decisão operacional: primeiro localiza a dor, depois conecta dados, sistemas, risco e ação.

Tabela de decisão rápida

Critério	Leitura desta página	Como usar
Dono da decisão	Dados, governança e arquitetura	Define prioridade, orçamento e responsabilidade operacional.
Sistema afetado	Knowledge graph, APIs, protocolos, identidade e auditoria	Mostra onde o conteúdo encosta na operação real.
KPI de leitura	Mention rate, cobertura de citação, automação e incidentes	Transforma a página em critério de gestão, não apenas em artigo.
Risco se ignorar	Agente sem contexto, permissão ampla ou rastro de decisão	Ajuda o leitor a enxergar o custo de adiar a decisão.
Decisão da semana	Separar o que pode automatizar agora do que exige supervisão e prova de confiança	Converte leitura em ação curta, verificável e conectada ao portal.

Um agente de IA solto numa operação de varejo é um passivo com aparência de inovação. Ele pode alterar preço, disparar reposição, responder cliente e mexer no fiscal — e, sem governança, faz tudo isso sem limite escrito, sem supervisão na hora certa e sem trilha do que decidiu. A tese deste guia contraria o entusiasmo dominante: a pergunta que separa quem terá agentes operando em 2027 de quem vira estatística não é “qual modelo é mais inteligente”, é “quais limites estão codificados antes de o agente rodar”.

A Gartner colocou número nessa tensão. Em previsão de janeiro de 2026, a consultoria estima que 40% dos projetos de comércio agêntico serão cancelados até 2027, por falta de maturidade técnica e desalinhamento de incentivos. Governança não é o que atrasa o projeto — é o que evita que ele entre nessa fatia de 40%. E governança de verdade tem três fases que precisam coexistir: Design, Runtime e Assurance.

Por que governança de IA precisa de três fases distintas?

Resposta direta: porque o risco do agente aparece em três momentos diferentes — antes de rodar, enquanto roda e depois de ter rodado — e cada momento exige um controle próprio. Limite codificado no Design não substitui supervisão no Runtime, que não substitui auditoria no Assurance. As três são camadas, não alternativas.

Pense numa decisão de remarcação de preço executada por um agente. No Design, você define que esse agente não pode baixar preço além de um percentual nem mexer em itens acima de certo valor sem aprovação. No Runtime, quando ele propõe uma remarcação que cruza o limiar de valor, um humano confirma antes de a mudança ir ao ar. No Assurance, fica registrado qual sinal levou à proposta, quem aprovou e qual foi o resultado.

A ontologia deste portal modela o tópico com quatro entidades que mapeiam exatamente essas fases — Guardrail, Policy, Audit Log e AI Guardrail. Os KPIs também: audit findings, policy violations, human override e shadow AI incidents. Repare que três das quatro métricas medem o que deu errado. Governança madura não é a que promete que nada falha; é a que torna a falha visível e rastreável.

Limite no Design impede o que não deveria acontecer. Supervisão no Runtime intercepta o que está prestes a acontecer. Auditoria no Assurance explica o que aconteceu. Quem só tem uma das três tem a ilusão de controle, não o controle.

O que entra na fase de Design?

Resposta direta: tudo que precisa ser verdade antes de o agente executar a primeira ação — política escrita em código, orçamento máximo por agente, escopo de ação delimitado e os gatilhos que exigem aprovação humana. Design é onde a governança é barata; depois que o agente roda, corrigir custa caro.

O conceito central do Design é policy-as-code: a política não vive num documento que alguém deveria seguir, vive em código que o sistema aplica. A diferença é entre “a equipe não deveria deixar o agente comprar acima de X” e “o agente é tecnicamente incapaz de comprar acima de X”. A primeira é uma intenção; a segunda é um guardrail.

O orçamento por agente é a expressão mais concreta disso. Cada agente recebe um teto — de gasto, de volume de ações, de alcance de SKUs — que ele não cruza. Isso vale tanto para o agente que negocia compra de mercadoria quanto para o que dispara campanhas pagas ou o que executa remarcações. Sem orçamento por agente, um erro de lógica vira um prejuízo proporcional à velocidade da máquina.

Elemento de Design	O que define	Risco que mitiga
Policy-as-code	Regras aplicadas pelo sistema, não por boa vontade	Política ignorada na pressa do dia a dia
Orçamento por agente	Teto de gasto, volume e alcance por agente	Erro de lógica amplificado pela velocidade
Escopo de ação	Quais sistemas e dados o agente pode tocar	Agente operando além do que foi autorizado
Gatilho de aprovação	Quando a ação exige confirmação humana	Decisão de alto valor sem supervisão

No varejo brasileiro, o Design tem um eixo fiscal inegociável. Qualquer agente que toque em precificação, emissão ou conciliação precisa operar dentro das regras da NF-e modelo 55 e da NFC-e modelo 65, já adaptadas à reforma tributária pela Nota Técnica 2025.002 desde 1.º de janeiro de 2026. Um agente que decide preço sem respeitar a lógica tributária embutida no documento fiscal não é eficiente, é uma autuação esperando para acontecer.

Como o Runtime mantém o controle sem matar a automação?

Resposta direta: pelo human-in-the-loop calibrado por valor e risco. Decisões rotineiras e baratas o agente executa sozinho; decisões de alto valor ou alto risco passam pela confirmação de uma pessoa. O controle não é tudo ou nada — é graduado pela consequência da decisão.

Human-in-the-loop é frequentemente lido como sinal de que a automação ainda é imatura. É o contrário: é a regra que permite ligar a automação com segurança antes de ter confiança total. A Forrester (Q2 2026) observa que a autonomia real ainda é rara e que a maioria das experiências agênticas permanece conversacional — ou seja, com humano no circuito. Isso não é fracasso do agentic commerce; é a forma responsável de operá-lo no estágio atual.

O calibre certo do Runtime depende de duas variáveis: valor e reversibilidade da decisão. Uma resposta de atendimento é barata e reversível — o agente faz e segue. Uma remarcação de coleção inteira é cara e difícil de reverter — passa por aprovação. A métrica que monitora isso é o human override: se a taxa de override é altíssima, o agente não está pronto para aquela classe de decisão; se é zero em decisões críticas, alguém afrouxou o controle cedo demais.

O que o caso Mercado Livre ensina sobre a fase de Runtime?

Em 8 de janeiro de 2026, o Mercado Livre demitiu 119 funcionários na América Latina (38 no Brasil), concentrados no departamento de UX, cujas funções foram absorvidas por designers treinados em IA generativa. A empresa, que contratou 42 mil pessoas na região em 2025, classificou as demissões como “isoladas”. O episódio é menos sobre redução de quadro e mais sobre a tensão organizacional que a IA agêntica cria: quando a máquina absorve uma função, quem fica no loop?

A lição de Runtime é direta. Human-in-the-loop não é só uma trava técnica; é uma decisão sobre onde o julgamento humano continua sendo necessário. Esvaziar o loop humano cedo demais — porque o agente “parece” capaz — é como a operação acumula risco sem perceber. A governança madura define explicitamente quais decisões permanecem com pessoas não por nostalgia, mas porque o custo do erro autônomo supera o ganho de velocidade. O Mercado Livre escolheu absorver uma função inteira; a maioria do varejo brasileiro fará melhor mantendo a pessoa no ponto de decisão de alto valor e deixando o agente nas tarefas repetitivas.

Como o Assurance fecha o ciclo?

Resposta direta: pelo audit log e pela trilha de derivação. O Assurance registra cada decisão do agente, qual sinal a disparou, quem aprovou e qual foi o resultado — transformando o comportamento do agente em algo auditável em vez de uma caixa-preta. Sem Assurance, todo incidente é um mistério sem causa rastreável.

O audit log é o documento que responde à pergunta inevitável depois de um problema: “por que o agente fez isso?”. Ele liga a ação à derivação — a cadeia de sinais, regras e dados que levou à decisão. No varejo, isso importa para incidente operacional (“por que repusemos esse item?”), para disputa fiscal (“com base em qual regra esse imposto foi calculado?”) e para conformidade com a LGPD quando o agente toca dados de cliente.

O Assurance também é a defesa contra o Shadow AI. Shadow AI é o uso de ferramentas e agentes de IA fora do perímetro de governança — uma equipe que pluga um assistente no catálogo sem registro, um analista que automatiza precificação por fora. O que a governança não vê, ela não controla. O KPI shadow AI incidents existe justamente para medir o tamanho do território invisível. Trazer esse uso para dentro do audit log é o que converte risco oculto em risco gerenciado.

A trilha de derivação tem um valor extra na era da descoberta por IA: ela é parente próxima do que torna o catálogo legível por máquinas. A mesma disciplina de estruturar e registrar dados que sustenta a governança sustenta a visibilidade generativa — tema do guia sobre medição de visibilidade generativa. E a governança não opera no vácuo: ela é a camada de controle sobre a orquestração descrita no guia de orquestração multiagente e middleware.

A consolidação de 2027

O ano de 2027 vai endurecer a exigência de governança por uma via que não é hype: a regulatória. O split payment da reforma tributária entra em vigor, separando automaticamente CBS e IBS no momento do pagamento. Quando um agente participa de precificação ou conciliação dentro desse fluxo, cada decisão passa a ter consequência fiscal imediata e rastreável pelo Fisco. O audit log deixa de ser boa prática e vira evidência potencial. Some-se a isso a previsão da Gartner de 40% de projetos cancelados até 2027: a janela entre 2026 e 2027 é o período em que as operações que sobreviverem terão construído as três fases de governança, e as que trataram governança como item opcional terão descoberto, na pior hora, que ela era a fundação.

O que decidir nesta semana

Escreva em código, não em PDF, ao menos uma política de orçamento por agente para o primeiro agente que você colocar para operar: um teto de gasto, volume e alcance de SKUs que o sistema aplique sozinho.
Defina o gatilho de human-in-the-loop por valor e reversibilidade: liste quais decisões o agente executa sozinho e quais exigem confirmação humana, e instrumente o human override desde o primeiro dia.
Faça um inventário honesto de Shadow AI: quais ferramentas e agentes de IA já estão em uso na operação sem trilha ou aprovação, e traga-os para dentro do audit log antes que virem incidente.
Garanta que qualquer agente que toque preço, emissão ou conciliação opere dentro das regras da NF-e e NFC-e já adaptadas à reforma tributária — governança fiscal é parte do Design, não um detalhe posterior.
Trate a janela 2026-2027 como o prazo de construção das três fases: chegar a 2027, com o split payment em vigor, sem audit log funcionando é entrar na fatia de 40% de projetos que a Gartner prevê cancelados.

Perguntas frequentes

O que são as três fases de governança de IA agêntica?

São Design, Runtime e Assurance. No Design, você codifica os limites antes de o agente rodar: políticas em código, orçamento máximo por agente, escopo de ação. No Runtime, você controla enquanto o agente opera: human-in-the-loop para decisões de alto valor, guardrails que bloqueiam ações fora do escopo. No Assurance, você audita o que aconteceu: log de cada decisão, trilha de derivação que explica por que o agente agiu assim. As três são sequenciais e complementares — falha em qualquer uma vira incidente operacional.

O que é Shadow AI e por que é perigoso no varejo?

Shadow AI é o uso de ferramentas e agentes de IA sem aprovação, registro ou supervisão da governança da empresa. Um analista que conecta um agente ao catálogo por conta própria, uma equipe que usa um assistente para precificar sem trilha — tudo isso é Shadow AI. O perigo é que o que a governança não enxerga, ela não controla nem audita. No varejo, isso pode significar um agente alterando preço ou estoque sem registro de quem autorizou. O audit log e a política de Design existem para trazer esse uso invisível para dentro do perímetro controlado.

Por que tantos projetos de IA agêntica são cancelados?

Porque muitos começam pela ambição de autonomia sem a fundação de governança. A Gartner prevê 40% de cancelamento de projetos de comércio agêntico até 2027, atribuindo a falta de maturidade técnica e o desalinhamento de incentivos. Na prática, projetos que não definem orçamento por agente, não mantêm human-in-the-loop e não auditam decisões acumulam incidentes até perder a confiança da organização. A governança em três fases não é burocracia que atrasa o projeto: é o que mantém o projeto vivo tempo suficiente para gerar valor.