Governança de IA agêntica: as três fases — Design, Runtime e Assurance — que decidem quem fica de pé em 2027
Agente de IA sem governança não é inovação, é passivo. As três fases que separam quem coloca agentes para operar com segurança de quem vira estatística dos 40% de projetos cancelados pela Gartner
Alexandre Caramaschi
CEO da Brasil GEO, ex-CMO da Semantix (Nasdaq), cofundador da AI Brasil
Camada agêntica e IA · Guia profundo
Leitura executiva desta página
Use este bloco para entender a tese, localizar o sistema afetado e sair com uma decisão prática. Ele cruza taxonomia, sistemas afetados, métrica principal e próximos passos para que a leitura avance da tese para a execução.
- Governança de IA agêntica: as três fases
- Knowledge graph, APIs, protocolos, identidade e auditoria
- Mention rate, cobertura de citação, automação e incidentes
Matriz de prontidão
Fluxo de decisão
A sequência organiza a página como decisão operacional: primeiro localiza a dor, depois conecta dados, sistemas, risco e ação.
Tabela de decisão rápida
| Critério | Leitura desta página | Como usar |
|---|---|---|
| Dono da decisão | Dados, governança e arquitetura | Define prioridade, orçamento e responsabilidade operacional. |
| Sistema afetado | Knowledge graph, APIs, protocolos, identidade e auditoria | Mostra onde o conteúdo encosta na operação real. |
| KPI de leitura | Mention rate, cobertura de citação, automação e incidentes | Transforma a página em critério de gestão, não apenas em artigo. |
| Risco se ignorar | Agente sem contexto, permissão ampla ou rastro de decisão | Ajuda o leitor a enxergar o custo de adiar a decisão. |
| Decisão da semana | Separar o que pode automatizar agora do que exige supervisão e prova de confiança | Converte leitura em ação curta, verificável e conectada ao portal. |
Um agente de IA solto numa operação de varejo é um passivo com aparência de inovação. Ele pode alterar preço, disparar reposição, responder cliente e mexer no fiscal — e, sem governança, faz tudo isso sem limite escrito, sem supervisão na hora certa e sem trilha do que decidiu. A tese deste guia contraria o entusiasmo dominante: a pergunta que separa quem terá agentes operando em 2027 de quem vira estatística não é “qual modelo é mais inteligente”, é “quais limites estão codificados antes de o agente rodar”.
A Gartner colocou número nessa tensão. Em previsão de janeiro de 2026, a consultoria estima que 40% dos projetos de comércio agêntico serão cancelados até 2027, por falta de maturidade técnica e desalinhamento de incentivos. Governança não é o que atrasa o projeto — é o que evita que ele entre nessa fatia de 40%. E governança de verdade tem três fases que precisam coexistir: Design, Runtime e Assurance.
Por que governança de IA precisa de três fases distintas?
Resposta direta: porque o risco do agente aparece em três momentos diferentes — antes de rodar, enquanto roda e depois de ter rodado — e cada momento exige um controle próprio. Limite codificado no Design não substitui supervisão no Runtime, que não substitui auditoria no Assurance. As três são camadas, não alternativas.
Pense numa decisão de remarcação de preço executada por um agente. No Design, você define que esse agente não pode baixar preço além de um percentual nem mexer em itens acima de certo valor sem aprovação. No Runtime, quando ele propõe uma remarcação que cruza o limiar de valor, um humano confirma antes de a mudança ir ao ar. No Assurance, fica registrado qual sinal levou à proposta, quem aprovou e qual foi o resultado.
A ontologia deste portal modela o tópico com quatro entidades que mapeiam exatamente essas fases — Guardrail, Policy, Audit Log e AI Guardrail. Os KPIs também: audit findings, policy violations, human override e shadow AI incidents. Repare que três das quatro métricas medem o que deu errado. Governança madura não é a que promete que nada falha; é a que torna a falha visível e rastreável.
Limite no Design impede o que não deveria acontecer. Supervisão no Runtime intercepta o que está prestes a acontecer. Auditoria no Assurance explica o que aconteceu. Quem só tem uma das três tem a ilusão de controle, não o controle.
O que entra na fase de Design?
Resposta direta: tudo que precisa ser verdade antes de o agente executar a primeira ação — política escrita em código, orçamento máximo por agente, escopo de ação delimitado e os gatilhos que exigem aprovação humana. Design é onde a governança é barata; depois que o agente roda, corrigir custa caro.
O conceito central do Design é policy-as-code: a política não vive num documento que alguém deveria seguir, vive em código que o sistema aplica. A diferença é entre “a equipe não deveria deixar o agente comprar acima de X” e “o agente é tecnicamente incapaz de comprar acima de X”. A primeira é uma intenção; a segunda é um guardrail.
O orçamento por agente é a expressão mais concreta disso. Cada agente recebe um teto — de gasto, de volume de ações, de alcance de SKUs — que ele não cruza. Isso vale tanto para o agente que negocia compra de mercadoria quanto para o que dispara campanhas pagas ou o que executa remarcações. Sem orçamento por agente, um erro de lógica vira um prejuízo proporcional à velocidade da máquina.
| Elemento de Design | O que define | Risco que mitiga |
|---|---|---|
| Policy-as-code | Regras aplicadas pelo sistema, não por boa vontade | Política ignorada na pressa do dia a dia |
| Orçamento por agente | Teto de gasto, volume e alcance por agente | Erro de lógica amplificado pela velocidade |
| Escopo de ação | Quais sistemas e dados o agente pode tocar | Agente operando além do que foi autorizado |
| Gatilho de aprovação | Quando a ação exige confirmação humana | Decisão de alto valor sem supervisão |
No varejo brasileiro, o Design tem um eixo fiscal inegociável. Qualquer agente que toque em precificação, emissão ou conciliação precisa operar dentro das regras da NF-e modelo 55 e da NFC-e modelo 65, já adaptadas à reforma tributária pela Nota Técnica 2025.002 desde 1.º de janeiro de 2026. Um agente que decide preço sem respeitar a lógica tributária embutida no documento fiscal não é eficiente, é uma autuação esperando para acontecer.
Como o Runtime mantém o controle sem matar a automação?
Resposta direta: pelo human-in-the-loop calibrado por valor e risco. Decisões rotineiras e baratas o agente executa sozinho; decisões de alto valor ou alto risco passam pela confirmação de uma pessoa. O controle não é tudo ou nada — é graduado pela consequência da decisão.
Human-in-the-loop é frequentemente lido como sinal de que a automação ainda é imatura. É o contrário: é a regra que permite ligar a automação com segurança antes de ter confiança total. A Forrester (Q2 2026) observa que a autonomia real ainda é rara e que a maioria das experiências agênticas permanece conversacional — ou seja, com humano no circuito. Isso não é fracasso do agentic commerce; é a forma responsável de operá-lo no estágio atual.
O calibre certo do Runtime depende de duas variáveis: valor e reversibilidade da decisão. Uma resposta de atendimento é barata e reversível — o agente faz e segue. Uma remarcação de coleção inteira é cara e difícil de reverter — passa por aprovação. A métrica que monitora isso é o human override: se a taxa de override é altíssima, o agente não está pronto para aquela classe de decisão; se é zero em decisões críticas, alguém afrouxou o controle cedo demais.
O que o caso Mercado Livre ensina sobre a fase de Runtime?
Em 8 de janeiro de 2026, o Mercado Livre demitiu 119 funcionários na América Latina (38 no Brasil), concentrados no departamento de UX, cujas funções foram absorvidas por designers treinados em IA generativa. A empresa, que contratou 42 mil pessoas na região em 2025, classificou as demissões como “isoladas”. O episódio é menos sobre redução de quadro e mais sobre a tensão organizacional que a IA agêntica cria: quando a máquina absorve uma função, quem fica no loop?
A lição de Runtime é direta. Human-in-the-loop não é só uma trava técnica; é uma decisão sobre onde o julgamento humano continua sendo necessário. Esvaziar o loop humano cedo demais — porque o agente “parece” capaz — é como a operação acumula risco sem perceber. A governança madura define explicitamente quais decisões permanecem com pessoas não por nostalgia, mas porque o custo do erro autônomo supera o ganho de velocidade. O Mercado Livre escolheu absorver uma função inteira; a maioria do varejo brasileiro fará melhor mantendo a pessoa no ponto de decisão de alto valor e deixando o agente nas tarefas repetitivas.
Como o Assurance fecha o ciclo?
Resposta direta: pelo audit log e pela trilha de derivação. O Assurance registra cada decisão do agente, qual sinal a disparou, quem aprovou e qual foi o resultado — transformando o comportamento do agente em algo auditável em vez de uma caixa-preta. Sem Assurance, todo incidente é um mistério sem causa rastreável.
O audit log é o documento que responde à pergunta inevitável depois de um problema: “por que o agente fez isso?”. Ele liga a ação à derivação — a cadeia de sinais, regras e dados que levou à decisão. No varejo, isso importa para incidente operacional (“por que repusemos esse item?”), para disputa fiscal (“com base em qual regra esse imposto foi calculado?”) e para conformidade com a LGPD quando o agente toca dados de cliente.
O Assurance também é a defesa contra o Shadow AI. Shadow AI é o uso de ferramentas e agentes de IA fora do perímetro de governança — uma equipe que pluga um assistente no catálogo sem registro, um analista que automatiza precificação por fora. O que a governança não vê, ela não controla. O KPI shadow AI incidents existe justamente para medir o tamanho do território invisível. Trazer esse uso para dentro do audit log é o que converte risco oculto em risco gerenciado.
A trilha de derivação tem um valor extra na era da descoberta por IA: ela é parente próxima do que torna o catálogo legível por máquinas. A mesma disciplina de estruturar e registrar dados que sustenta a governança sustenta a visibilidade generativa — tema do guia sobre medição de visibilidade generativa. E a governança não opera no vácuo: ela é a camada de controle sobre a orquestração descrita no guia de orquestração multiagente e middleware.
A consolidação de 2027
O ano de 2027 vai endurecer a exigência de governança por uma via que não é hype: a regulatória. O split payment da reforma tributária entra em vigor, separando automaticamente CBS e IBS no momento do pagamento. Quando um agente participa de precificação ou conciliação dentro desse fluxo, cada decisão passa a ter consequência fiscal imediata e rastreável pelo Fisco. O audit log deixa de ser boa prática e vira evidência potencial. Some-se a isso a previsão da Gartner de 40% de projetos cancelados até 2027: a janela entre 2026 e 2027 é o período em que as operações que sobreviverem terão construído as três fases de governança, e as que trataram governança como item opcional terão descoberto, na pior hora, que ela era a fundação.
O que decidir nesta semana
- Escreva em código, não em PDF, ao menos uma política de orçamento por agente para o primeiro agente que você colocar para operar: um teto de gasto, volume e alcance de SKUs que o sistema aplique sozinho.
- Defina o gatilho de human-in-the-loop por valor e reversibilidade: liste quais decisões o agente executa sozinho e quais exigem confirmação humana, e instrumente o human override desde o primeiro dia.
- Faça um inventário honesto de Shadow AI: quais ferramentas e agentes de IA já estão em uso na operação sem trilha ou aprovação, e traga-os para dentro do audit log antes que virem incidente.
- Garanta que qualquer agente que toque preço, emissão ou conciliação opere dentro das regras da NF-e e NFC-e já adaptadas à reforma tributária — governança fiscal é parte do Design, não um detalhe posterior.
- Trate a janela 2026-2027 como o prazo de construção das três fases: chegar a 2027, com o split payment em vigor, sem audit log funcionando é entrar na fatia de 40% de projetos que a Gartner prevê cancelados.
Perguntas frequentes
O que são as três fases de governança de IA agêntica?
São Design, Runtime e Assurance. No Design, você codifica os limites antes de o agente rodar: políticas em código, orçamento máximo por agente, escopo de ação. No Runtime, você controla enquanto o agente opera: human-in-the-loop para decisões de alto valor, guardrails que bloqueiam ações fora do escopo. No Assurance, você audita o que aconteceu: log de cada decisão, trilha de derivação que explica por que o agente agiu assim. As três são sequenciais e complementares — falha em qualquer uma vira incidente operacional.
O que é Shadow AI e por que é perigoso no varejo?
Shadow AI é o uso de ferramentas e agentes de IA sem aprovação, registro ou supervisão da governança da empresa. Um analista que conecta um agente ao catálogo por conta própria, uma equipe que usa um assistente para precificar sem trilha — tudo isso é Shadow AI. O perigo é que o que a governança não enxerga, ela não controla nem audita. No varejo, isso pode significar um agente alterando preço ou estoque sem registro de quem autorizou. O audit log e a política de Design existem para trazer esse uso invisível para dentro do perímetro controlado.
Por que tantos projetos de IA agêntica são cancelados?
Porque muitos começam pela ambição de autonomia sem a fundação de governança. A Gartner prevê 40% de cancelamento de projetos de comércio agêntico até 2027, atribuindo a falta de maturidade técnica e o desalinhamento de incentivos. Na prática, projetos que não definem orçamento por agente, não mantêm human-in-the-loop e não auditam decisões acumulam incidentes até perder a confiança da organização. A governança em três fases não é burocracia que atrasa o projeto: é o que mantém o projeto vivo tempo suficiente para gerar valor.