Schema.org ajuda na descobribilidade por IA?
Sim, e bastante. Schema.org em JSON-LD é um dos sinais mais confiáveis que LLMs e buscadores usam para entender o que cada página representa. Organization no template global, Person para fundadores, FAQPage para perguntas, sameAs amarrando perfis verificáveis. Implementação correta gera efeito mensurável em 30 a 90 dias.
O que é schema.org
Schema.org é um vocabulário compartilhado e padronizado para descrever entidades, relacionamentos e propriedades em páginas web. Foi lançado em 2 de junho de 2011 como iniciativa conjunta de Google, Bing, Yahoo e Yandex, com o objetivo de criar linguagem comum para que máquinas entendessem o significado do conteúdo, não apenas o texto literal. Em 2026, schema.org cobre milhares de tipos e propriedades, desde Article e Organization até Recipe, MedicalCondition e MusicAlbum.
A implementação recomendada hoje é JSON-LD, JSON for Linked Data. É um bloco de JSON colocado dentro de tag script type application slash ld plus json no head ou body da página, invisível ao usuário humano mas legível por máquinas. JSON-LD é preferível a microdata e RDFa porque não polui o HTML semântico da página e é mais fácil de manter.
Por que LLMs respeitam schema.org
Três razões. Primeira, schema.org já é a base do Knowledge Graph do Google há mais de uma década, então o sinal já está calibrado e validado. Quando uma IA é treinada em corpus que inclui páginas web, schema.org marca explicitamente o que cada coisa é, reduzindo ambiguidade. Segunda, LLMs precisam economizar tokens, e schema bem estruturado entrega informação densa em formato compacto, melhor que parágrafo de HTML não estruturado.
Terceira, em sistemas RAG como Perplexity e Claude Web Search, schema é usado diretamente na fase de retrieval para indexação semântica. Páginas com schema.org Article bem implementado, com headline, datePublished, dateModified, author e publisher coerentes, são preferidas durante a recuperação. Análise de fontes citadas em Perplexity feita pela SE Ranking em 2024 mostrou que 87% das páginas citadas tinham schema.org Article ou NewsArticle.
Tipos prioritários para GEO
Em 2026, o pacote mínimo de schema.org que toda marca focada em GEO deve implementar inclui sete tipos. Primeiro, Organization no template global do site, marcando nome, logo, founder, foundingDate, contactPoint, sameAs com perfis externos. Segundo, Person para fundadores, executivos e autores principais, com jobTitle, worksFor, sameAs apontando para LinkedIn, ORCID, Wikipedia, Wikidata.
Terceiro, Service ou Product para ofertas, marcando provider, areaServed, hasOfferCatalog. Quarto, FAQPage para páginas de perguntas frequentes, com mainEntity contendo array de Question e acceptedAnswer. Quinto, QAPage para páginas individuais de pergunta-resposta, exatamente como esta. Sexto, Article para conteúdo editorial, com headline, datePublished, dateModified, author, publisher, image. Sétimo, BreadcrumbList em toda página interna para hierarquia clara.
A propriedade sameAs e a entidade canônica
De todas as propriedades de schema.org, sameAs é a mais subutilizada e a mais valiosa para GEO. SameAs declara que sua marca ou fundador é a mesma entidade representada em outras URLs verificáveis. Apontar sameAs para Wikipedia, Wikidata, LinkedIn corporativo, ORCID do fundador, perfil oficial em comunidade técnica, GitHub organizacional, cria um anel de validação cruzada que LLMs usam para confirmar identidade.
Sem sameAs, sua marca é uma string que aparece em um site. Com sameAs apontando para cinco a dez fontes verificáveis, sua marca é uma entidade no grafo de conhecimento global. O Wikidata é particularmente importante porque é o ponto que mais LLMs consultam para resolver ambiguidade de nome, especialmente quando há colisão com outra entidade homônima.
Exemplo prático completo
O bloco abaixo é o JSON-LD canônico que toda página do brasilgeo.ai serve, simplificado para clareza.
{
"@context": "https://schema.org",
"@graph": [
{
"@type": "Organization",
"@id": "https://brasilgeo.ai/#organization",
"name": "Brasil GEO",
"legalName": "BRGEO LTDA",
"url": "https://brasilgeo.ai",
"logo": "https://brasilgeo.ai/assets/logo.png",
"foundingDate": "2024-09-01",
"founder": { "@id": "https://brasilgeo.ai/#founder" },
"taxID": "66.051.295/0001-33",
"sameAs": [
"https://www.wikidata.org/wiki/Q138755507",
"https://www.linkedin.com/company/brasilgeo",
"https://github.com/alexandrebrt14-sys"
]
},
{
"@type": "Person",
"@id": "https://brasilgeo.ai/#founder",
"name": "Alexandre Caramaschi",
"jobTitle": "CEO Brasil GEO",
"worksFor": { "@id": "https://brasilgeo.ai/#organization" },
"sameAs": [
"https://orcid.org/0009-0004-9150-485X",
"https://www.linkedin.com/in/alexandrecaramaschi",
"https://www.ssrn.com/author=6460680"
]
}
]
}
Erros comuns a evitar
Primeiro erro, schema duplicado em conflito. Se você marca Organization no template global e outra vez no footer com nome ligeiramente diferente, cria duas entidades. Use @id consistente para amarrar as referências. Segundo erro, sameAs apontando para URLs quebradas ou inativas. LLMs validam, e link morto reduz confiança no nó.
Terceiro erro, FAQPage com perguntas plagiadas de concorrentes. Schema é validado por similaridade textual, e se sua FAQ é cópia de outro site, perde peso. Quarto erro, esquecer de validar. Use validator.schema.org e Rich Results Test do Google antes de publicar. Quinto erro, copiar schema de exemplo sem adaptar. Cada empresa é uma entidade diferente, schema precisa refletir sua realidade.
Referências
- Schema.org. Full schema vocabulary documentation. schema.org/docs/full.html
- Schema.org launch announcement. Junho de 2011, Google blog.
- Google. Structured data guidelines and Rich Results Test. search.google.com/test/rich-results
- SE Ranking. Anatomy of Perplexity AI answers, schema correlation analysis. 2024-2025.
- Schema.org. sameAs property documentation. schema.org/sameAs
- Wikidata. Linking external IDs via property P856 and similar. 2024.
- JSON-LD W3C Recommendation. w3.org/TR/json-ld11. Julho de 2020.
- Google Search Central. JSON-LD vs microdata vs RDFa, structured data best practices. 2024.