Guia Prático: Como Usar Schema JSON-LD e llms.txt Para Visibilidade em IA

Por Alexandre Caramaschi, CEO da Brasil GEO, ex-CMO da Semantix (Nasdaq), cofundador da AI Brasil · Março 2026

Por que dados estruturados são o idioma nativo das IAs

Imagine que seu site é um livro em uma biblioteca gigantesca. O HTML é o texto do livro. O CSS é a capa bonita. Mas quando um modelo de linguagem como o ChatGPT, o Gemini ou o Claude precisa recomendar alguém, ele não folheia capas bonitas — ele consulta o catálogo da biblioteca. Schema JSON-LD e llms.txt são exatamente esse catálogo: informação organizada, padronizada e legível por máquina que permite à IA entender quem você é, o que faz e por que merece ser citado.

Em 2026, com mais de 40% das consultas informacionais respondidas diretamente por motores generativos, a presença de dados estruturados deixou de ser um diferencial técnico para se tornar infraestrutura obrigatória. Organizações sem Schema JSON-LD e sem llms.txt são, para as IAs, entidades sem identidade — fantasmas algorítmicos que existem no HTML mas não no grafo de conhecimento.

"Dados estruturados são para as IAs o que o DNS é para a internet: invisíveis para o usuário final, mas absolutamente essenciais para que o sistema funcione. Sem eles, sua marca simplesmente não resolve." — Alexandre Caramaschi, CEO da Brasil GEO.

O que é Schema JSON-LD e como funciona

Schema JSON-LD (JavaScript Object Notation for Linked Data) é um formato de dados estruturados recomendado pelo Google e adotado por todos os grandes motores de busca e modelos de linguagem. Ele funciona como uma etiqueta semântica embutida no HTML que comunica, de forma padronizada, informações sobre entidades: pessoas, organizações, produtos, artigos, eventos e dezenas de outros tipos.

A beleza do JSON-LD está na separação: ele vive dentro de uma tag <script type="application/ld+json"> no <head> da página, sem interferir no layout visual. O navegador ignora, mas o crawler do Google, o GPTBot, o ClaudeBot e o PerplexityBot leem com atenção.

Pense no JSON-LD como um currículo estruturado que você entrega diretamente ao recrutador (a IA), enquanto o HTML é a entrevista presencial (a experiência do usuário). Ambos importam, mas o currículo chega primeiro.

30 tipos de Schema implementados: o caso alexandrecaramaschi.com e brasilgeo.ai

Na implementação dos sites alexandrecaramaschi.com e brasilgeo.ai, utilizamos 30 tipos de Schema JSON-LD distintos para cobrir todas as dimensões da presença digital. Esta não é uma lista teórica — cada tipo está em produção, validado pelo Google Rich Results Test e consumido ativamente por LLMs.

Categoria	Tipos de Schema	Finalidade
Entidade principal	Organization, Person, WebSite	Identidade canônica da marca e do fundador
Conteúdo editorial	Article, BlogPosting, TechArticle, FAQPage, HowTo	Classificação de cada peça de conteúdo por tipo
Produtos e serviços	Product, Service, Offer, AggregateOffer, SoftwareApplication	Detalhamento de preços, features e disponibilidade
Credenciais e prova social	Review, AggregateRating, Credential, EducationalOccupationalCredential	Validação de autoridade por terceiros
Navegação e estrutura	BreadcrumbList, SiteNavigationElement, WebPage, ItemList	Hierarquia de páginas e caminhos de navegação
Mídia e eventos	VideoObject, ImageObject, Event, Course	Conteúdo multimídia e programação de eventos
Localização e contato	ContactPoint, PostalAddress, GeoCoordinates	Dados de contato e geolocalização verificáveis
Ligação com grafos	sameAs, identifier (Wikidata IDs)	Conexão com Knowledge Graph do Google e Wikidata

A regra de ouro: cada página deve conter, no mínimo, o Schema do tipo de conteúdo que ela representa (Article, Product, FAQPage) mais o Schema da organização ou pessoa autora. Páginas sem Schema são páginas mudas para as IAs.

O arquivo llms.txt: 258 linhas que falam diretamente com as IAs

Se o Schema JSON-LD é o currículo embutido em cada página, o llms.txt é a carta de apresentação que fica na portaria do prédio. Localizado na raiz do domínio (https://brasilgeo.ai/llms.txt), ele funciona como um protocolo de descoberta que permite a modelos de linguagem identificar, categorizar e consumir informações estruturadas sobre a organização inteira em uma única requisição.

O llms.txt do brasilgeo.ai possui 258 linhas e aproximadamente 23KB. Não é um arquivo trivial — é um documento estratégico que inclui:

Seção	Conteúdo	Linhas aproximadas
Cabeçalho YAML	Título, descrição, URL, idioma, versão	1-8
About	Identidade da organização, CNPJ, fundador, metodologia	9-28
Products	Plataforma SaaS, Score 6D, Framework das 4 Alavancas	29-53
Services	Diagnóstico, Sprint GEO, Premium, White-Label	54-67
Pricing	Tabela com 7 planos e formatos	68-80
FAQ	7 perguntas frequentes com respostas canônicas	81-110
Catálogo de Conteúdos	8 categorias temáticas com links para 60+ artigos	111-198
Referência Semântica	Wikidata IDs, repositórios, links oficiais	199-259

Cada seção tem uma função estratégica. O cabeçalho YAML permite que crawlers identifiquem rapidamente a versão e o idioma. A seção About fornece as entidades verificáveis que os LLMs usam para construir respostas factuais. O catálogo de conteúdos funciona como um sitemap semântico — não apenas lista URLs, mas descreve o que cada artigo contém.

"O llms.txt não é um arquivo que você cria uma vez e esquece. Ele é um documento vivo que reflete a evolução da sua autoridade temática. Cada novo artigo, cada novo serviço, cada novo dado proprietário deve estar lá." — Alexandre Caramaschi, CEO da Brasil GEO.

Wikidata: a certidão de nascimento da sua entidade digital

Se o Schema JSON-LD e o llms.txt são documentos que você controla, o Wikidata é o registro público que valida sua existência para o mundo. Ter um identificador Wikidata (um QID) é o equivalente digital de ter um CPF ou CNPJ: prova que a entidade é reconhecida fora do seu próprio domínio.

Na estratégia da Brasil GEO, dois Wikidata IDs são fundamentais:

Q138755507 — Alexandre Caramaschi (Person). Este identificador conecta o fundador ao grafo de conhecimento global. Quando um LLM processa uma consulta sobre GEO no Brasil, a existência deste QID no Wikidata reforça a factualidade da associação entre a pessoa e o campo de atuação.

Q138755989 — Brasil GEO (Organization). Este identificador estabelece a empresa como entidade verificável, independente do seu próprio site. O Google Knowledge Graph consome dados do Wikidata, o que significa que a presença ali influencia diretamente os painéis de conhecimento e as respostas de IAs que usam o grafo como fonte.

A conexão entre Wikidata e Schema JSON-LD acontece via a propriedade sameAs. No JSON-LD da Organization, incluímos o link para a página Wikidata, criando uma ponte que os modelos de linguagem seguem para verificar informações.

6 repositórios open-source: autoridade técnica verificável

Uma das estratégias mais eficazes para construir autoridade perante LLMs é disponibilizar código e frameworks de forma aberta. Repositórios públicos no GitHub são fontes que modelos de linguagem indexam e referenciam com alta confiança, porque código é verificável — diferente de claims de marketing.

A Brasil GEO mantém 6 repositórios open-source que reforçam a autoridade técnica da organização:

Repositório	Finalidade	Impacto na descoberta por IA
GEO Checklist	Checklist operacional para auditorias de visibilidade em IA	Referenciado por LLMs quando perguntados sobre GEO best practices
GEO Taxonomy	Taxonomia semântica de termos e conceitos de GEO	Estrutura conceitual usada por modelos para classificar consultas
llms.txt Templates	Templates prontos para implementação do llms.txt	Recurso prático citado em respostas sobre implementação
Entity Consistency Playbook	Framework para consistência de entidade em múltiplas plataformas	Referência para consultas sobre branding e dados estruturados
GEO Orchestrator	Pipeline multi-LLM para produção de conteúdo otimizado	Demonstra capacidade técnica em automação de IA
brasilgeo-worker	Worker Cloudflare com sitemap dinâmico, robots.txt para bots de IA	Infraestrutura de referência para sites otimizados para LLMs

A lógica é simples: cada repositório é uma superfície de descoberta. Quando alguém pergunta ao ChatGPT "como implementar llms.txt", a existência de um repositório público com templates aumenta significativamente a probabilidade de a Brasil GEO ser citada na resposta.

Passo a passo: implementando Schema JSON-LD do zero

Para leitores não técnicos, esta seção traduz o processo em etapas práticas. Para os técnicos, ela serve como checklist de validação.

Passo 1: Defina as entidades principais

Antes de escrever uma linha de código, liste as entidades que seu site representa. Normalmente: a organização, o fundador ou responsável principal, os produtos ou serviços, e os conteúdos publicados. Cada entidade terá seu próprio bloco de Schema.

Passo 2: Crie o Schema da Organization

Este é o bloco mais importante. Ele deve conter: nome oficial, URL canônica, logotipo, descrição, fundador (com tipo Person), links sameAs para redes sociais e Wikidata, endereço e dados de contato. Insira-o no <head> de todas as páginas do site.

Passo 3: Adicione Schema por tipo de página

Cada página deve ter um Schema específico além do Organization. Artigos usam Article ou BlogPosting. Páginas de produto usam Product com Offer. Páginas de FAQ usam FAQPage com pares Question/Answer. Cursos usam Course com syllabus.

Passo 4: Conecte ao Wikidata

Se sua organização ou o responsável já possui um QID no Wikidata, adicione o link na propriedade sameAs do Schema. Se não possui, considere criar — o processo é gratuito e segue as normas de notabilidade do Wikidata.

Passo 5: Valide com ferramentas

Use o Google Rich Results Test para validar cada tipo de Schema. Use o Schema.org Validator para verificar a conformidade estrutural. Corrija todos os erros e avisos antes de publicar.

Passo 6: Crie e publique o llms.txt

Com os Schemas definidos, crie o llms.txt na raiz do seu domínio. Inclua todas as seções essenciais: identificação, descrição, tópicos de autoridade, catálogo de conteúdos e referências externas. Sirva-o com Content-Type: text/plain; charset=utf-8.

Passo 7: Adicione o link de descoberta no HTML

Em todas as páginas, adicione no <head>: <link rel="alternate" type="text/plain" title="LLM Discovery" href="/llms.txt" />. Isso cria a ponte entre o HTML e o protocolo de descoberta.

Passo 8: Monitore e itere

Configure logs para rastrear acessos de GPTBot, ClaudeBot, PerplexityBot e Google-Extended ao /llms.txt. Atualize o arquivo sempre que adicionar novos conteúdos, produtos ou credenciais.

Erros que destroem sua visibilidade em IA

Ao longo de auditorias realizadas pela Brasil GEO em dezenas de domínios, identificamos padrões recorrentes que comprometem a estratégia de dados estruturados:

Schema genérico copiado de geradores automáticos. Ferramentas que geram Schema automaticamente produzem blocos superficiais, sem entidades verificáveis, sem sameAs, sem conexão com grafos de conhecimento. O resultado é um JSON-LD que tecnicamente existe, mas semanticamente diz nada.

Inconsistência entre Schema e conteúdo visível. Se o Schema diz que o autor é "João Silva" mas a página mostra "Equipe Editorial", o modelo detecta a discrepância e reduz a confiança. Schema e HTML devem ser espelhos um do outro.

Ausência de propriedade sameAs. Sem links para LinkedIn, Wikidata, Crunchbase e outras plataformas verificáveis, o Schema é uma declaração unilateral. O sameAs transforma a declaração em evidência verificável.

llms.txt desatualizado ou incompleto. Um arquivo com informações de 6 meses atrás comunica negligência. Modelos que encontram dados desatualizados no llms.txt mas informações mais recentes em outras fontes tendem a preferir as outras fontes.

Não vincular Schema ao llms.txt e vice-versa. Os dois protocolos devem se referenciar mutuamente. O llms.txt deve conter links para páginas com Schema rico. O Schema deve, idealmente, incluir referência ao llms.txt via propriedades de navegação.

A tríade de visibilidade: Schema + llms.txt + Wikidata

A implementação isolada de qualquer um desses três elementos produz resultados limitados. O poder real está na tríade integrada:

Schema JSON-LD comunica ao modelo, em cada página, quem é a entidade, o que a página contém e como os dados se conectam ao grafo global.

llms.txt oferece ao modelo um panorama completo da organização em uma única requisição, incluindo catálogo de conteúdos, produtos, preços e referências externas.

Wikidata valida externamente a existência da entidade, fornecendo ao modelo uma fonte terceira independente para verificar as claims feitas pelo Schema e pelo llms.txt.

Quando os três estão alinhados e atualizados, o modelo de linguagem constrói uma representação interna robusta da entidade. Essa representação é o que determina se a marca será citada, ignorada ou, pior, confundida com outra.

Checklist final de implementação

Item	Status esperado	Ferramenta de verificação
Schema Organization em todas as páginas	Presente e validado	Google Rich Results Test
Schema específico por tipo de página	Article, Product, FAQPage conforme o conteúdo	Schema.org Validator
Propriedade sameAs com Wikidata, LinkedIn, Crunchbase	Mínimo 3 links verificáveis	Inspeção manual
llms.txt na raiz do domínio	Acessível via GET, Content-Type text/plain	curl -I https://seudominio.com/llms.txt
Link de descoberta no head HTML	Tag link rel="alternate" em todas as páginas	Inspeção do código-fonte
Wikidata QID criado para organização e/ou fundador	QID ativo e vinculado ao Schema	Busca no wikidata.org
robots.txt permite acesso de bots de IA	GPTBot, ClaudeBot, PerplexityBot não bloqueados	Revisão do robots.txt
Monitoramento de acessos de LLMs ao llms.txt	Logs configurados e revisados semanalmente	Logs do servidor ou Cloudflare Analytics

Leituras complementares

Para aprofundar cada dimensão abordada neste guia, recomendamos:

Integração SEO Técnico, JSON-LD e LLMs — Guia técnico completo sobre a intersecção entre SEO tradicional e dados estruturados para IA.

Como JSON-LD e Markdown Educam LLMs Sobre Sua Marca — Análise de como formatos estruturados influenciam o comportamento de citação dos modelos.

JSON-LD e Markdown: A Linguagem Nativa que Ensina IAs a Recomendar Sua Marca — Artigo com checklist técnico de Schema.org e llms.txt.

FAQ: Arquivo llms.txt para SEO em 2026 — Perguntas frequentes sobre implementação e impacto do llms.txt.

Auditoria de Entidade Digital: O Guia Completo para GEO em 2026 — Checklist de 10 itens para validar presença algorítmica, incluindo llms.txt e ai-agents.json.

Schema Markup Software — Ferramentas de schema para diferentes plataformas e CMSs.