Knowledge graph de commerce: como construir o grafo e virar a entidade que a IA cita
Marca, produto e política só são recomendados por uma IA quando existem como nós legíveis e desambiguados por máquina. Este guia é sobre a construção do grafo e da entidade — Wikidata, schema.org e o caminho para deixar de ser uma string e virar uma coisa que o modelo conhece.
Alexandre Caramaschi
CEO da Brasil GEO, ex-CMO da Semantix (Nasdaq), cofundador da AI Brasil
Camada agêntica e IA · Guia profundo
Leitura executiva desta página
Use este bloco para entender a tese, localizar o sistema afetado e sair com uma decisão prática. Ele cruza taxonomia, sistemas afetados, métrica principal e próximos passos para que a leitura avance da tese para a execução.
- Knowledge graph de commerce: como construir o grafo e virar a entidade que a IA cita
- Knowledge graph, APIs, protocolos, identidade e auditoria
- Mention rate, cobertura de citação, automação e incidentes
Matriz de prontidão
Fluxo de decisão
A sequência organiza a página como decisão operacional: primeiro localiza a dor, depois conecta dados, sistemas, risco e ação.
Tabela de decisão rápida
| Critério | Leitura desta página | Como usar |
|---|---|---|
| Dono da decisão | Dados, governança e arquitetura | Define prioridade, orçamento e responsabilidade operacional. |
| Sistema afetado | Knowledge graph, APIs, protocolos, identidade e auditoria | Mostra onde o conteúdo encosta na operação real. |
| KPI de leitura | Mention rate, cobertura de citação, automação e incidentes | Transforma a página em critério de gestão, não apenas em artigo. |
| Risco se ignorar | Agente sem contexto, permissão ampla ou rastro de decisão | Ajuda o leitor a enxergar o custo de adiar a decisão. |
| Decisão da semana | Separar o que pode automatizar agora do que exige supervisão e prova de confiança | Converte leitura em ação curta, verificável e conectada ao portal. |
Quando alguém pergunta a uma IA “quais marcas de colchão de espuma viscoelástica entregam em até 48 horas”, o modelo não consulta o seu site na hora. Ele responde a partir do que já sabe sobre as entidades daquela categoria — quem elas são, o que vendem, que atributos carregam. Se a sua marca existe para o modelo como uma entidade clara, ela entra na resposta. Se existe só como uma string de texto que aparece esparsa em algumas páginas, o modelo a ignora ou a confunde com outra de nome parecido. Ser citado começa muito antes da resposta: começa por existir como uma coisa que o modelo conhece.
A tese deste guia é que a recomendação por IA é um problema de entidade antes de ser um problema de conteúdo. Não adianta publicar duzentas páginas se o modelo não sabe que todas falam da mesma marca, nem qual categoria ela ocupa, nem o que a distingue de uma homônima. O trabalho de fundação — construir o knowledge graph e desambiguar a entidade — é o que transforma texto ambíguo em conhecimento que a máquina carrega. É um trabalho que poucos fazem e que separa, de forma decisiva, a marca recomendada da ignorada.
Existe um guia complementar a este, sobre commerce knowledge graph e agentic readiness, que trata da camada interna — CDP, resolução de identidade, governança. Este guia foca no outro lado: a construção do grafo e da entidade pública, o caminho para ser reconhecido e citado por modelos de IA. Um é sobre operar com agentes; este é sobre ser conhecido por eles.
O que é um knowledge graph de commerce, do ponto de vista da entidade?
É a representação da sua marca, dos seus produtos e das suas políticas como nós identificados e conectados por relações explícitas, em vez de texto solto que a máquina precisa interpretar a cada vez. Um nó é uma entidade — a marca, um produto, uma categoria, uma política de devolução. Uma relação liga os nós: este produto pertence a esta categoria, é vendido por esta marca, sujeito a esta política. Quando nós e relações estão declarados em formato legível por máquina, o modelo lê o significado; quando estão implícitos no texto, ele adivinha.
A diferença entre ter os dados e ter o grafo é a mesma diferença entre uma pilha de fichas e um índice. Quase toda operação tem os atributos do produto em algum lugar, a descrição da marca em outro, a política no rodapé. O grafo é o que conecta esses fragmentos com sentido declarado, de modo que uma máquina entenda que são partes de uma mesma estrutura. É a fundação de quatro coisas ao mesmo tempo: SEO técnico, GEO, busca interna e agentes. Sem o grafo, cada um desses sistemas reconstrói o significado por conta própria — e erra de um jeito diferente.
Os nós que importam para a entidade pública de um e-commerce:
| Nó | O que identifica | Por que o modelo precisa dele |
|---|---|---|
| Marca | A organização vendedora, única e desambiguada | Para associar todo o resto a uma entidade estável |
| Produto | O item com atributos, variantes e identificadores | Para saber o que é, exatamente, e compará-lo |
| Categoria | A classe a que o produto pertence | Para entrar na resposta certa da pergunta certa |
| Política | Devolução, frete, garantia como regra declarada | Para responder à pergunta de condição, não só de produto |
| Conteúdo | Guia, review, FAQ que prova e explica | Para sustentar a citação com evidência recuperável |
Por que virar de “string” para “thing” é o salto que decide tudo?
Porque string é texto que a máquina não entende e thing é entidade que ela reconhece — e modelos recomendam coisas, não strings. A expressão “from strings to things” vem do próprio Google, ao lançar o Knowledge Graph, e descreve exatamente a virada que um e-commerce precisa fazer. Enquanto a sua marca for uma sequência de caracteres, ela compete com qualquer outra sequência parecida e o modelo precisa decidir, a cada resposta, se “Marca X” é você, o concorrente homônimo ou um termo genérico.
A desambiguação é o coração do salto. Pense em marcas com nomes comuns, produtos com denominação ambígua, categorias que se sobrepõem. Para um humano, o contexto resolve. Para um modelo, sem uma entidade identificada de forma única, a ambiguidade vira ruído: ele pode atribuir a você a fama de um homônimo, ignorar você por não ter certeza, ou misturar atributos de entidades diferentes. Dar à marca um identificador estável — uma entrada no Wikidata, por exemplo — e declarar seus atributos e relações é o que dissolve o ruído e fixa a entidade.
A consequência é direta para a visibilidade em IA. A base da Source Stack — Wikidata e Knowledge Graph — é a camada mais negligenciada e a mais decisiva, como detalha o guia de GEO para e-commerce: se o Knowledge Graph não sabe que a sua marca é um e-commerce de uma categoria específica, nenhuma quantidade de conteúdo no seu blog conserta isso. Resolver a entidade vem primeiro. Conteúdo sem entidade resolvida é volume que o modelo lê sem saber a quem atribuir.
Como construir a entidade com Wikidata e schema.org?
A construção tem duas pontas que precisam se costurar: schema.org expõe o grafo no seu próprio domínio, e Wikidata ancora a entidade num grafo público que os modelos leem. Uma sem a outra fica incompleta — o schema diz quem você diz que é, o Wikidata corrobora num espaço neutro, e a propriedade sameAs prova que as duas pontas são a mesma coisa.
No seu domínio, schema.org é como você declara os nós e relações em linguagem que a máquina lê. Os tipos que sustentam a entidade de um e-commerce:
- Organization (ou os subtipos de varejo) — declara a marca como entidade, com nome, logo, descrição e, crucialmente, o
sameAsapontando para o Wikidata, perfis oficiais e fontes que confirmam a identidade. - Product — declara cada produto com atributos, identificadores (GTIN, MPN), marca, oferta e avaliação, conectando o produto à entidade da marca.
- FAQPage e tipos de conteúdo — declaram a evidência recuperável que sustenta a citação, amarrada à mesma entidade.
Fora do seu domínio, Wikidata é a âncora pública. É um grafo estruturado, aberto e legível por máquina que o Knowledge Graph do Google e muitos modelos tratam como referência sobre o que as entidades são. Uma entrada de Wikidata correta — categoria certa, atributos verificáveis, desambiguada de homônimos, com referências a fontes confiáveis — ensina o ecossistema de IA quem a sua marca é, de forma que o modelo herda em vez de inferir. A disciplina aqui é honestidade verificável: Wikidata exige fonte para afirmações, e tentar inflar a entidade com dados não verificáveis é contraproducente.
A costura entre as duas pontas é o sameAs. Quando o schema.org no seu site aponta sameAs para a sua entidade no Wikidata, e a entidade no Wikidata referencia o seu site oficial, o ecossistema fecha o círculo: a máquina tem como confirmar que a Organization declarada no domínio é a mesma entidade do grafo público. Sem essa costura, você tem duas declarações soltas; com ela, tem uma entidade verificada. Essa lógica de catálogo e dados estruturados legíveis se conecta diretamente à taxonomia de feeds e structured data que governa a descoberta de produto.
Como modelar produto e política como nós, não como texto?
Modelar produto e política como nós é dar a cada um atributos declarados e relações explícitas, em vez de descrevê-los em prosa que a máquina precisa interpretar. O produto deixa de ser um parágrafo de descrição e vira uma entidade com voltagem, material, dimensão, variante e identificador, cada atributo num campo que a máquina lê sem ambiguidade. A política deixa de ser um PDF para humano e vira uma regra declarada — prazo de devolução, condição, elegibilidade — que o modelo consegue aplicar ao responder uma pergunta de condição.
A diferença aparece na pergunta que o modelo consegue responder sobre você. Compare:
- Como texto — “Nossa política de troca é flexível e pensada no cliente.” O modelo não extrai nenhuma condição acionável; não sabe o prazo, não sabe a exceção, não consegue responder “posso trocar em 40 dias?”.
- Como nó — uma política declarada com prazo de 30 dias, condição de produto não usado, exceção para itens de higiene. O modelo responde com precisão, e a sua marca entra como fonte da resposta de condição, não só da resposta de produto.
A modelagem de produto segue o mesmo princípio. Atributo crítico em texto livre é atributo que o modelo pode ler errado; atributo em campo estruturado, conectado à categoria e à marca, é atributo recuperável. A riqueza e a estrutura desses atributos são exatamente o que o guia de PDP e busca na era da descoberta por IA trata como centro de decisão — e o que faz o produto ser comparável quando o modelo decompõe uma pergunta em facetas.
Há um ganho transversal nessa modelagem: o mesmo grafo que torna a entidade legível para a IA externa torna o catálogo operável por agentes — protocolos como o UCP, anunciado pelo Google em janeiro de 2026 com Shopify, Etsy, Target e Walmart, dependem de catálogo machine-readable para que agentes naveguem e comprem (agenticplug.ai, 2026). Construir o grafo para ser citado é, ao mesmo tempo, construir o grafo para ser operado. Uma fundação, dois retornos.
Como saber se o grafo está funcionando?
O grafo funciona quando a IA atribui à sua marca a categoria, os atributos e a citação corretos — e isso se mede com um painel de checagens, não com fé. Os indicadores que importam, derivados da própria ontologia de commerce:
- Entity coverage — sua marca e seus produtos principais existem como entidades reconhecíveis no Wikidata e no Knowledge Graph?
- Disambiguation accuracy — quando você pergunta a um modelo sobre a marca, ele acerta quem você é, ou confunde com homônimo, ou mistura atributos?
- Schema coverage — quanto do seu catálogo e das suas políticas está declarado em schema.org válido e coerente com o HTML visível?
- Match rate — o
sameAscostura corretamente as pontas, de modo que a máquina confirme que site e entidade pública são a mesma coisa?
A checagem prática é fazer ao modelo a pergunta que um cliente faria e auditar a resposta: a categoria está certa? Os atributos batem? A marca aparece desambiguada do concorrente de nome parecido? Onde a resposta falha, o grafo tem um buraco — uma entidade não ancorada, um atributo em texto livre, uma política que ninguém declarou. Repare que a regra de coerência é a mesma da governança do portal: toda propriedade do schema precisa ter contrapartida no texto visível, ou a IA detecta a incoerência e desconfia da fonte.
A decisão e o próximo passo
A construção do grafo e da entidade é o trabalho de fundação que ninguém gosta de fazer e que tudo o mais depende. SEO, GEO, busca interna e agentes herdam a clareza — ou a confusão — da camada de entidade. Em 2026, com a descoberta migrando para interfaces de IA, ser uma string que o modelo adivinha virou desvantagem estrutural; ser uma thing que ele reconhece virou pré-requisito de existir na resposta. A boa notícia é que fundação de entidade é mais durável e mais difícil de copiar do que qualquer conteúdo: o concorrente pode replicar o seu blog, não a sua entidade desambiguada no grafo público.
O próximo passo cabe em uma tarde e revela o seu marco zero. Pergunte a três modelos de IA “o que é a [sua marca]?” e anote: a categoria está certa? Os atributos batem? Ele confunde você com outra? Depois confira se a sua marca tem entrada no Wikidata e se o seu site declara a Organization em schema.org com sameAs apontando para lá. Onde houver lacuna — entidade ausente, atributo errado, costura faltando — está o primeiro nó a construir. A partir daí, cada produto e cada política que você transformar de texto em nó é um pedaço a mais da marca que a IA conhece, em vez de adivinha.
Perguntas frequentes
Qual a diferença entre este guia e o de commerce knowledge graph e agentic readiness?
O guia de agentic readiness trata da camada interna do grafo — CDP, resolução de identidade, governança de IA e o score que mede prontidão para agentes operarem a sua loja. Este guia trata da construção do grafo e da entidade pública: como modelar nós e relações, e como fazer sua marca virar uma entidade desambiguada no Wikidata e no schema.org para ser citada e recomendada por modelos de IA. Um é sobre operar com agentes; este é sobre ser reconhecido por eles.
O que significa virar de string para thing?
String é um pedaço de texto que a máquina não entende — o nome da sua marca é só uma sequência de caracteres que pode ser confundida com qualquer outra parecida. Thing é uma entidade identificada de forma única, com atributos e relações declaradas, que o modelo associa a uma categoria com confiança. A virada acontece quando você dá à sua marca um identificador estável (no Wikidata, por exemplo) e o conecta ao seu site via schema.org, transformando texto ambíguo em entidade reconhecível.
Por que Wikidata importa para ser citado por IA em e-commerce?
Porque o Wikidata é um grafo público e estruturado que muitos modelos e o Knowledge Graph do Google leem como fonte de verdade sobre o que as entidades são. Se o Wikidata sabe que sua marca é um e-commerce de uma categoria específica, com atributos corretos e desambiguada de homônimos, o modelo herda esse conhecimento. Sem essa âncora, a IA tem que inferir quem você é a cada resposta — e inferência erra, ignora ou confunde com o concorrente de nome parecido.