Taxonomia, feeds e structured data: a governança de atributo que decide quem o agente compara
Schema válido sem taxonomia governada é fachada. O que faz um agente comparar a sua oferta com a do concorrente é a disciplina invisível de categoria, faceta e atributo — o trabalho que ninguém quer fazer
Alexandre Caramaschi
CEO da Brasil GEO, ex-CMO da Semantix (Nasdaq), cofundador da AI Brasil
Camada agêntica e IA · Guia profundo
Leitura executiva desta página
Use este bloco para entender a tese, localizar o sistema afetado e sair com uma decisão prática. Ele cruza taxonomia, sistemas afetados, métrica principal e próximos passos para que a leitura avance da tese para a execução.
- Taxonomia, feeds e structured data: a governança de atributo que decide quem o agente compara
- Knowledge graph, APIs, protocolos, identidade e auditoria
- Mention rate, cobertura de citação, automação e incidentes
Matriz de prontidão
Fluxo de decisão
A sequência organiza a página como decisão operacional: primeiro localiza a dor, depois conecta dados, sistemas, risco e ação.
Tabela de decisão rápida
| Critério | Leitura desta página | Como usar |
|---|---|---|
| Dono da decisão | Dados, governança e arquitetura | Define prioridade, orçamento e responsabilidade operacional. |
| Sistema afetado | Knowledge graph, APIs, protocolos, identidade e auditoria | Mostra onde o conteúdo encosta na operação real. |
| KPI de leitura | Mention rate, cobertura de citação, automação e incidentes | Transforma a página em critério de gestão, não apenas em artigo. |
| Risco se ignorar | Agente sem contexto, permissão ampla ou rastro de decisão | Ajuda o leitor a enxergar o custo de adiar a decisão. |
| Decisão da semana | Separar o que pode automatizar agora do que exige supervisão e prova de confiança | Converte leitura em ação curta, verificável e conectada ao portal. |
Dois e-commerces de moda venderam o mesmo vestido. Um marcou a cor como “vinho”, o outro como “bordô”, um terceiro SKU do próprio catálogo dizia “marsala”. Quando um agente de IA recebeu o pedido “vestido vinho até R$ 300”, ele agrupou as ofertas que diziam “vinho”, comparou preço e prazo, e montou a lista curta. Os SKUs marcados como “bordô” e “marsala” não entraram na comparação — não porque o produto fosse pior, mas porque a faceta de cor não tinha valor canônico. O schema da página estava válido nos três. O que faltava era governança de atributo.
A tese deste guia contraria quem acha que basta “ter schema”. Marcação válida é o piso, não o teto. O que decide se um agente compara a sua oferta com a do concorrente é a disciplina invisível por trás da taxonomia: a faceta canônica, o valor permitido por categoria, a obrigatoriedade por canal. O guia panorâmico Structured data, feeds e o catálogo machine-readable defende por que o catálogo virou infraestrutura de descoberta; aqui descemos ao nível de governança de atributo, que é onde a maioria das operações falha sem perceber.
O que é taxonomia de catálogo, na prática operacional?
Resposta direta: é a árvore de categorias e o conjunto de facetas que cada categoria expõe para filtrar e comparar. Categoria responde “onde este produto vive”; faceta responde “por qual critério o cliente, ou o agente, restringe a busca dentro dela”. A ontologia deste portal modela o tópico com cinco entidades — Category, Attribute, Feed, Schema e Endpoint — porque é exatamente essa a cadeia, da categoria ao endpoint que o agente consulta.
A categoria organiza o catálogo numa hierarquia: roupas › vestidos › vestidos de festa. A faceta é o filtro dentro do nível: cor, tamanho, comprimento, ocasião, faixa de preço. Cada faceta tem um atributo por trás, e cada atributo precisa de um conjunto de valores permitidos. É aqui que a maioria das operações trata a taxonomia como decoração de menu e ignora a parte que importa.
Categoria não é faceta, e confundir as duas custa caro
Times misturam os dois eixos o tempo todo. Criam uma categoria “vestidos vermelhos” quando vermelho deveria ser um valor da faceta cor, aplicável a qualquer categoria. O resultado é uma árvore que explode em galhos redundantes, impossível de manter, e um agente que não consegue cruzar “vestido” com “vermelho” porque os dois viraram a mesma coisa. A regra é simples: o que descreve onde o produto vive é categoria; o que descreve um critério de filtro transversal é faceta. Manter os dois eixos separados é o que permite ao agente combinar livremente — “vestido vermelho tamanho M até R$ 300” — sem que você precise prever cada combinação.
Por que a governança de atributo é o trabalho que decide tudo?
Resposta direta: porque sem ela a taxonomia tem caixas vazias e inconsistentes, e atributo inconsistente é invisível para comparação. Governança de atributo é definir, para cada faceta, qual é a forma canônica, quais valores são permitidos por categoria, se ela é obrigatória por canal e quem responde por ela. É o trabalho que ninguém quer fazer e o único que faz o agente agrupar a sua oferta com a do concorrente.
Pense no que governança resolve. Sem ela, a cor aparece como “vinho”, “bordô” e “marsala” no mesmo catálogo; a voltagem aparece como “110V”, “110”, “bivolt opcional” e em branco; o material vem ora como “couro legítimo”, ora como “couro”, ora vazio. Cada variação é um SKU que não casa com os outros na hora da comparação. Com governança, cada faceta tem um valor canônico, uma lista fechada de valores aceitos e uma regra de obrigatoriedade — e o catálogo inteiro fala a mesma língua.
| Camada de governança | O que define | Exemplo no varejo brasileiro |
|---|---|---|
| Faceta canônica | A forma única de nomear o atributo | ”cor” (não “cor do produto”, “cor principal”, “tonalidade”) |
| Valores permitidos por categoria | Lista fechada de valores aceitos | Banho em semijoia: ouro 18k, ródio, prata 925 — não texto livre |
| Obrigatoriedade por canal | Se o atributo é exigido para publicar | GTIN obrigatório para o feed do Merchant Center |
| Dono do atributo | Quem responde pela qualidade e atualização | Comprador da categoria, não “a equipe de cadastro” |
A consequência de ignorar isso é direta. Taxonomia inconsistente empurra a IA para o concorrente — quando o agente não consegue normalizar o seu atributo, ele compara as ofertas que conseguiu normalizar, e a sua fica de fora. No varejo especializado brasileiro, onde joalheria precisa distinguir quilatagem e tipo de banho e cosmético precisa de lote e validade, a governança de atributo é a diferença entre aparecer na comparação e sumir dela.
Schema válido com taxonomia mal governada é uma fachada bem pintada sobre uma fundação rachada. O agente não lê a fachada; ele tenta normalizar o atributo. Se não consegue, compara quem conseguiu — e você não está nessa lista.
Como o feed funciona como canal de distribuição machine-readable?
Resposta direta: o feed é o arquivo estruturado que você envia ao Google Merchant Center e aos marketplaces, e é o mesmo dado que alimenta busca, vitrine paga e, muitas vezes, a resposta de IA. Item com atributo obrigatório faltante é rejeitado e some da vitrine sem disparar nenhum alerta no seu relatório de campanha.
O feed não é um detalhe técnico do marketing de performance; é uma das principais superfícies de distribuição do catálogo. A Linx Microvix, hoje parte da TOTVS, integra-se a mais de 70 marketplaces no Brasil, e o Bling a mais de 250 plataformas — cada conexão dessas consome um feed. Quando o feed está limpo, o mesmo dado abastece a vitrine paga, o marketplace e a comparação. Quando está sujo, o problema se multiplica por canal.
O KPI que governa isso aparece na ontologia: feed health, schema coverage, catalog discoverability e rejected items. O “rejected items” é o mais revelador. Um item rejeitado no Merchant Center não dá erro visível na operação; ele apenas para de aparecer. A loja continua pagando mídia para um catálogo do qual uma fatia inteira está invisível, e descobre o buraco só quando vai investigar por que as impressões caíram. Feed health é a disciplina de monitorar essa taxa de rejeição e tratá-la na origem, no PIM, em vez de remendar item a item.
Por que feed e structured data precisam sair da mesma fonte
O feed que você envia ao marketplace e o JSON-LD que está na página de produto deveriam carregar o mesmo preço, o mesmo estoque e o mesmo GTIN. Quando divergem — porque o feed saiu de uma planilha e o schema de um template — o item é rejeitado por inconsistência ou a IA extrai da página um dado que o feed já corrigiu. A única forma de manter os dois sincronizados é fazê-los sair da mesma fonte de verdade, o PIM, como detalha o guia PIM, PXM, DAM e MDM. Feed e schema não são dois projetos; são duas saídas do mesmo dado governado.
Quem é o dono do atributo, na prática?
A camada de governança que mais falha é a do dono. Quando o atributo é responsabilidade de “a equipe de cadastro”, ele não tem dono de verdade — tem um setor que digita o que recebe, sem autoridade para definir a forma canônica nem para recusar um valor fora da lista. O dono correto do atributo é quem conhece a categoria e responde pela sua qualidade: o comprador de moda sabe que “caimento” é faceta crítica e quais valores ela aceita; o comprador de semijoias sabe distinguir banho de liga. Atribuir o atributo a quem entende da categoria, e não a quem opera o sistema, é o que transforma taxonomia de exercício burocrático em vantagem de descoberta. Sem dono, a faceta apodrece: novos valores entram soltos, sinônimos se acumulam e, em um ano, o que era uma lista limpa virou um campo livre disfarçado. Governança de atributo é, antes de tudo, uma decisão de quem responde — e essa decisão precede qualquer ferramenta.
Por que o GTIN é o atributo que mais vale a pena acertar?
Resposta direta: porque o GTIN é o identificador universal que permite a um agente cruzar a sua oferta com reviews, comparadores e o mesmo produto em outros lugares. Sem GTIN, a IA não tem certeza de que está falando do seu item — e na dúvida, ela cita quem identificou direito. Nenhum outro atributo tem esse poder de desambiguação.
O GTIN é o número global de item comercial, o código de barras universal. Para um humano, ele é invisível. Para um agente, ele é a chave que cruza a sua página de produto com a avaliação no comparador, com o mesmo item no marketplace e com a ficha técnica em outra fonte. Quando o GTIN está presente e correto, a IA tem confiança de que o item que você anuncia é exatamente aquele que tem 4,7 estrelas em mil avaliações. Quando falta, a IA precisa inferir pela descrição — e inferência é onde nasce a alucinação de atributo e a citação do concorrente.
No catálogo brasileiro, o GTIN é especialmente subaproveitado. Muitos varejistas de moda e semijoias produzem item próprio sem código de barras universal e nunca cadastram um GTIN, perdendo a chance de serem cruzados com outras fontes. Para esses casos, a governança precisa decidir uma política clara: usar GTIN quando existe, e um identificador consistente e estável quando não existe, para que ao menos o seu próprio ecossistema possa rastrear o item entre canais.
O que a evidência realmente diz sobre schema e citação por IA?
Resposta direta: schema ajuda forte no ecossistema Google e tem efeito fraco ou nulo nos demais motores — a evidência de 2025-2026 é divergente e exige honestidade. O erro é prometer que schema sozinho resolve visibilidade em qualquer motor. Ele é necessário porque o custo é baixo e o ganho no Google é real, mas não é suficiente.
Os dados de 2026 não convergem, e fingir que convergem é desinformar. A BrightEdge mediu, em 2025, que schema mais FAQ geram +44% de citações em AI search, e que páginas com schema válido aparecem 20% a 30% mais. Estudos apontam que 71% das páginas citadas no ChatGPT e 65% no Google AI Mode carregam structured data. Por outro lado, a Ahrefs, em março de 2026, comparou 1.885 páginas com schema contra 4.000 de controle e não encontrou uplift relevante de citações. Um estudo da SSRN (Fischman, 2026) achou 38,5% de citação com JSON-LD contra 32,0% sem — um ganho de 6,5 pontos, modesto mas real.
A leitura honesta é que o efeito é forte no ecossistema Google e fraco ou nulo nos demais motores generativos. Some-se a isso que apenas cerca de 12,4% dos domínios implementam schema.org (2025), e a conclusão prática fica clara: o custo de fazer schema é baixo, a concorrência que o faz é pequena e o ganho no maior ecossistema é mensurável. Implemente, mas calibre a expectativa por motor e meça — não prometa milagre universal.
Taxonomia e feeds na era dos protocolos, em 2027
Em 2027, a taxonomia governada deixa de servir só ao feed e passa a alimentar protocolo. A NRF 2026 consagrou o agentic commerce com o anúncio do Universal Commerce Protocol pelo Google, e a ontologia deste portal já inclui o endpoint UCP como entidade do tópico — sinal de que o catálogo machine-readable está virando interface de protocolo, não apenas arquivo de feed. A SAP anunciou na NRF 2026 um Storefront MCP Server no Commerce Cloud para tornar vitrines compreensíveis a agentes de IA. Ao mesmo tempo, a reforma tributária força um eixo novo de atributo: a NT 2025.002 já exige grupos de IBS, CBS e IS na NF-e e na NFC-e, e notas sem esses grupos serão rejeitadas pela SEFAZ a partir de agosto de 2026 — o que significa que a classificação fiscal vira mais um atributo governado do catálogo. Em 2027, a faceta canônica não serve só para o cliente filtrar; serve para o agente comprar e para o fisco classificar. Quem governa atributo hoje está construindo a interface de amanhã.
O que decidir nesta semana
- Separe categoria de faceta na sua árvore de catálogo: liste as facetas que viraram categoria por engano e que estão impedindo o agente de combinar critérios livremente.
- Escolha as cinco facetas que mais importam para a sua categoria principal e defina, para cada uma, a forma canônica e a lista fechada de valores permitidos — comece pela que hoje tem mais variações soltas.
- Audite a sua taxa de rejeição no Google Merchant Center (rejected items) e trate as três causas mais frequentes na origem, no PIM, em vez de corrigir item a item.
- Verifique a cobertura de GTIN do catálogo e defina uma política clara para itens sem código universal, para que ao menos o seu ecossistema rastreie o produto entre canais.
- Implemente JSON-LD nas categorias de maior giro com expectativa calibrada por motor, e meça citação por motor em vez de presumir uplift universal — schema é necessário, não suficiente.
Perguntas frequentes
Qual a diferença entre taxonomia e governança de atributo?
Taxonomia é a estrutura — a árvore de categorias e as facetas que cada categoria expõe (cor, tamanho, material, voltagem). Governança de atributo é a disciplina por trás dela: definir qual é a faceta canônica, quais valores são permitidos para ela em cada categoria, se é obrigatória por canal e quem é o dono. Ter taxonomia sem governança é ter caixas vazias e inconsistentes; é o que faz o mesmo atributo aparecer como 'cor: vinho' num SKU e 'cor: bordô' em outro, e o agente não conseguir agrupar.
O feed do Merchant Center e o structured data da página são a mesma coisa?
São camadas diferentes do mesmo dado, e ambas precisam estar certas. O feed é o arquivo estruturado que você envia ao Google Merchant Center e aos marketplaces — canal de distribuição direto. O structured data (JSON-LD) é a marcação na própria página, que mecanismos de busca e IA extraem. O ideal é que ambos saiam da mesma fonte de verdade, o PIM, para que preço, estoque e GTIN sejam idênticos nos dois. Quando divergem, o item é rejeitado no feed ou a IA extrai um dado desatualizado da página.
Vale a pena investir em schema se a evidência sobre ele é divergente?
Vale, com expectativa calibrada por motor. A evidência de 2025-2026 é honesta sobre isso: schema ajuda forte no ecossistema Google — a BrightEdge mediu +44% de citações em AI search com schema e FAQ — mas estudos como o da Ahrefs (mar/2026) não encontraram uplift relevante nos demais motores. Como apenas ~12,4% dos domínios implementam schema, o custo de fazer é baixo e o ganho no Google é real. O erro é prometer que schema sozinho resolve visibilidade em todos os motores; ele é necessário, não suficiente.