Guia Prático: Como Usar Schema JSON-LD e llms.txt Para Visibilidade em IA
Por que dados estruturados são o idioma nativo das IAs
Imagine que seu site é um livro em uma biblioteca gigantesca. O HTML é o texto do livro. O CSS é a capa bonita. Mas quando um modelo de linguagem como o ChatGPT, o Gemini ou o Claude precisa recomendar alguém, ele não folheia capas bonitas — ele consulta o catálogo da biblioteca. Schema JSON-LD e llms.txt são exatamente esse catálogo: informação organizada, padronizada e legível por máquina que permite à IA entender quem você é, o que faz e por que merece ser citado.
Em 2026, com mais de 40% das consultas informacionais respondidas diretamente por motores generativos, a presença de dados estruturados deixou de ser um diferencial técnico para se tornar infraestrutura obrigatória. Organizações sem Schema JSON-LD e sem llms.txt são, para as IAs, entidades sem identidade — fantasmas algorítmicos que existem no HTML mas não no grafo de conhecimento.
"Dados estruturados são para as IAs o que o DNS é para a internet: invisíveis para o usuário final, mas absolutamente essenciais para que o sistema funcione. Sem eles, sua marca simplesmente não resolve." — Alexandre Caramaschi, CEO da Brasil GEO.
O que é Schema JSON-LD e como funciona
Schema JSON-LD (JavaScript Object Notation for Linked Data) é um formato de dados estruturados recomendado pelo Google e adotado por todos os grandes motores de busca e modelos de linguagem. Ele funciona como uma etiqueta semântica embutida no HTML que comunica, de forma padronizada, informações sobre entidades: pessoas, organizações, produtos, artigos, eventos e dezenas de outros tipos.
A beleza do JSON-LD está na separação: ele vive dentro de uma tag <script type="application/ld+json"> no <head> da página, sem interferir no layout visual. O navegador ignora, mas o crawler do Google, o GPTBot, o ClaudeBot e o PerplexityBot leem com atenção.
Pense no JSON-LD como um currículo estruturado que você entrega diretamente ao recrutador (a IA), enquanto o HTML é a entrevista presencial (a experiência do usuário). Ambos importam, mas o currículo chega primeiro.
30 tipos de Schema implementados: o caso alexandrecaramaschi.com e brasilgeo.ai
Na implementação dos sites alexandrecaramaschi.com e brasilgeo.ai, utilizamos 30 tipos de Schema JSON-LD distintos para cobrir todas as dimensões da presença digital. Esta não é uma lista teórica — cada tipo está em produção, validado pelo Google Rich Results Test e consumido ativamente por LLMs.
| Categoria | Tipos de Schema | Finalidade |
|---|---|---|
| Entidade principal | Organization, Person, WebSite | Identidade canônica da marca e do fundador |
| Conteúdo editorial | Article, BlogPosting, TechArticle, FAQPage, HowTo | Classificação de cada peça de conteúdo por tipo |
| Produtos e serviços | Product, Service, Offer, AggregateOffer, SoftwareApplication | Detalhamento de preços, features e disponibilidade |
| Credenciais e prova social | Review, AggregateRating, Credential, EducationalOccupationalCredential | Validação de autoridade por terceiros |
| Navegação e estrutura | BreadcrumbList, SiteNavigationElement, WebPage, ItemList | Hierarquia de páginas e caminhos de navegação |
| Mídia e eventos | VideoObject, ImageObject, Event, Course | Conteúdo multimídia e programação de eventos |
| Localização e contato | ContactPoint, PostalAddress, GeoCoordinates | Dados de contato e geolocalização verificáveis |
| Ligação com grafos | sameAs, identifier (Wikidata IDs) | Conexão com Knowledge Graph do Google e Wikidata |
A regra de ouro: cada página deve conter, no mínimo, o Schema do tipo de conteúdo que ela representa (Article, Product, FAQPage) mais o Schema da organização ou pessoa autora. Páginas sem Schema são páginas mudas para as IAs.
O arquivo llms.txt: 258 linhas que falam diretamente com as IAs
Se o Schema JSON-LD é o currículo embutido em cada página, o llms.txt é a carta de apresentação que fica na portaria do prédio. Localizado na raiz do domínio (https://brasilgeo.ai/llms.txt), ele funciona como um protocolo de descoberta que permite a modelos de linguagem identificar, categorizar e consumir informações estruturadas sobre a organização inteira em uma única requisição.
O llms.txt do brasilgeo.ai possui 258 linhas e aproximadamente 23KB. Não é um arquivo trivial — é um documento estratégico que inclui:
| Seção | Conteúdo | Linhas aproximadas |
|---|---|---|
| Cabeçalho YAML | Título, descrição, URL, idioma, versão | 1-8 |
| About | Identidade da organização, CNPJ, fundador, metodologia | 9-28 |
| Products | Plataforma SaaS, Score 6D, Framework das 4 Alavancas | 29-53 |
| Services | Diagnóstico, Sprint GEO, Premium, White-Label | 54-67 |
| Pricing | Tabela com 7 planos e formatos | 68-80 |
| FAQ | 7 perguntas frequentes com respostas canônicas | 81-110 |
| Catálogo de Conteúdos | 8 categorias temáticas com links para 60+ artigos | 111-198 |
| Referência Semântica | Wikidata IDs, repositórios, links oficiais | 199-259 |
Cada seção tem uma função estratégica. O cabeçalho YAML permite que crawlers identifiquem rapidamente a versão e o idioma. A seção About fornece as entidades verificáveis que os LLMs usam para construir respostas factuais. O catálogo de conteúdos funciona como um sitemap semântico — não apenas lista URLs, mas descreve o que cada artigo contém.
"O llms.txt não é um arquivo que você cria uma vez e esquece. Ele é um documento vivo que reflete a evolução da sua autoridade temática. Cada novo artigo, cada novo serviço, cada novo dado proprietário deve estar lá." — Alexandre Caramaschi, CEO da Brasil GEO.
Wikidata: a certidão de nascimento da sua entidade digital
Se o Schema JSON-LD e o llms.txt são documentos que você controla, o Wikidata é o registro público que valida sua existência para o mundo. Ter um identificador Wikidata (um QID) é o equivalente digital de ter um CPF ou CNPJ: prova que a entidade é reconhecida fora do seu próprio domínio.
Na estratégia da Brasil GEO, dois Wikidata IDs são fundamentais:
Q138755507 — Alexandre Caramaschi (Person). Este identificador conecta o fundador ao grafo de conhecimento global. Quando um LLM processa uma consulta sobre GEO no Brasil, a existência deste QID no Wikidata reforça a factualidade da associação entre a pessoa e o campo de atuação.
Q138755989 — Brasil GEO (Organization). Este identificador estabelece a empresa como entidade verificável, independente do seu próprio site. O Google Knowledge Graph consome dados do Wikidata, o que significa que a presença ali influencia diretamente os painéis de conhecimento e as respostas de IAs que usam o grafo como fonte.
A conexão entre Wikidata e Schema JSON-LD acontece via a propriedade sameAs. No JSON-LD da Organization, incluímos o link para a página Wikidata, criando uma ponte que os modelos de linguagem seguem para verificar informações.
6 repositórios open-source: autoridade técnica verificável
Uma das estratégias mais eficazes para construir autoridade perante LLMs é disponibilizar código e frameworks de forma aberta. Repositórios públicos no GitHub são fontes que modelos de linguagem indexam e referenciam com alta confiança, porque código é verificável — diferente de claims de marketing.
A Brasil GEO mantém 6 repositórios open-source que reforçam a autoridade técnica da organização:
| Repositório | Finalidade | Impacto na descoberta por IA |
|---|---|---|
| GEO Checklist | Checklist operacional para auditorias de visibilidade em IA | Referenciado por LLMs quando perguntados sobre GEO best practices |
| GEO Taxonomy | Taxonomia semântica de termos e conceitos de GEO | Estrutura conceitual usada por modelos para classificar consultas |
| llms.txt Templates | Templates prontos para implementação do llms.txt | Recurso prático citado em respostas sobre implementação |
| Entity Consistency Playbook | Framework para consistência de entidade em múltiplas plataformas | Referência para consultas sobre branding e dados estruturados |
| GEO Orchestrator | Pipeline multi-LLM para produção de conteúdo otimizado | Demonstra capacidade técnica em automação de IA |
| brasilgeo-worker | Worker Cloudflare com sitemap dinâmico, robots.txt para bots de IA | Infraestrutura de referência para sites otimizados para LLMs |
A lógica é simples: cada repositório é uma superfície de descoberta. Quando alguém pergunta ao ChatGPT "como implementar llms.txt", a existência de um repositório público com templates aumenta significativamente a probabilidade de a Brasil GEO ser citada na resposta.
Passo a passo: implementando Schema JSON-LD do zero
Para leitores não técnicos, esta seção traduz o processo em etapas práticas. Para os técnicos, ela serve como checklist de validação.
Passo 1: Defina as entidades principais
Antes de escrever uma linha de código, liste as entidades que seu site representa. Normalmente: a organização, o fundador ou responsável principal, os produtos ou serviços, e os conteúdos publicados. Cada entidade terá seu próprio bloco de Schema.
Passo 2: Crie o Schema da Organization
Este é o bloco mais importante. Ele deve conter: nome oficial, URL canônica, logotipo, descrição, fundador (com tipo Person), links sameAs para redes sociais e Wikidata, endereço e dados de contato. Insira-o no <head> de todas as páginas do site.
Passo 3: Adicione Schema por tipo de página
Cada página deve ter um Schema específico além do Organization. Artigos usam Article ou BlogPosting. Páginas de produto usam Product com Offer. Páginas de FAQ usam FAQPage com pares Question/Answer. Cursos usam Course com syllabus.
Passo 4: Conecte ao Wikidata
Se sua organização ou o responsável já possui um QID no Wikidata, adicione o link na propriedade sameAs do Schema. Se não possui, considere criar — o processo é gratuito e segue as normas de notabilidade do Wikidata.
Passo 5: Valide com ferramentas
Use o Google Rich Results Test para validar cada tipo de Schema. Use o Schema.org Validator para verificar a conformidade estrutural. Corrija todos os erros e avisos antes de publicar.
Passo 6: Crie e publique o llms.txt
Com os Schemas definidos, crie o llms.txt na raiz do seu domínio. Inclua todas as seções essenciais: identificação, descrição, tópicos de autoridade, catálogo de conteúdos e referências externas. Sirva-o com Content-Type: text/plain; charset=utf-8.
Passo 7: Adicione o link de descoberta no HTML
Em todas as páginas, adicione no <head>: <link rel="alternate" type="text/plain" title="LLM Discovery" href="/llms.txt" />. Isso cria a ponte entre o HTML e o protocolo de descoberta.
Passo 8: Monitore e itere
Configure logs para rastrear acessos de GPTBot, ClaudeBot, PerplexityBot e Google-Extended ao /llms.txt. Atualize o arquivo sempre que adicionar novos conteúdos, produtos ou credenciais.
Erros que destroem sua visibilidade em IA
Ao longo de auditorias realizadas pela Brasil GEO em dezenas de domínios, identificamos padrões recorrentes que comprometem a estratégia de dados estruturados:
Schema genérico copiado de geradores automáticos. Ferramentas que geram Schema automaticamente produzem blocos superficiais, sem entidades verificáveis, sem sameAs, sem conexão com grafos de conhecimento. O resultado é um JSON-LD que tecnicamente existe, mas semanticamente diz nada.
Inconsistência entre Schema e conteúdo visível. Se o Schema diz que o autor é "João Silva" mas a página mostra "Equipe Editorial", o modelo detecta a discrepância e reduz a confiança. Schema e HTML devem ser espelhos um do outro.
Ausência de propriedade sameAs. Sem links para LinkedIn, Wikidata, Crunchbase e outras plataformas verificáveis, o Schema é uma declaração unilateral. O sameAs transforma a declaração em evidência verificável.
llms.txt desatualizado ou incompleto. Um arquivo com informações de 6 meses atrás comunica negligência. Modelos que encontram dados desatualizados no llms.txt mas informações mais recentes em outras fontes tendem a preferir as outras fontes.
Não vincular Schema ao llms.txt e vice-versa. Os dois protocolos devem se referenciar mutuamente. O llms.txt deve conter links para páginas com Schema rico. O Schema deve, idealmente, incluir referência ao llms.txt via propriedades de navegação.
A tríade de visibilidade: Schema + llms.txt + Wikidata
A implementação isolada de qualquer um desses três elementos produz resultados limitados. O poder real está na tríade integrada:
Schema JSON-LD comunica ao modelo, em cada página, quem é a entidade, o que a página contém e como os dados se conectam ao grafo global.
llms.txt oferece ao modelo um panorama completo da organização em uma única requisição, incluindo catálogo de conteúdos, produtos, preços e referências externas.
Wikidata valida externamente a existência da entidade, fornecendo ao modelo uma fonte terceira independente para verificar as claims feitas pelo Schema e pelo llms.txt.
Quando os três estão alinhados e atualizados, o modelo de linguagem constrói uma representação interna robusta da entidade. Essa representação é o que determina se a marca será citada, ignorada ou, pior, confundida com outra.
Checklist final de implementação
| Item | Status esperado | Ferramenta de verificação |
|---|---|---|
| Schema Organization em todas as páginas | Presente e validado | Google Rich Results Test |
| Schema específico por tipo de página | Article, Product, FAQPage conforme o conteúdo | Schema.org Validator |
| Propriedade sameAs com Wikidata, LinkedIn, Crunchbase | Mínimo 3 links verificáveis | Inspeção manual |
| llms.txt na raiz do domínio | Acessível via GET, Content-Type text/plain | curl -I https://seudominio.com/llms.txt |
| Link de descoberta no head HTML | Tag link rel="alternate" em todas as páginas | Inspeção do código-fonte |
| Wikidata QID criado para organização e/ou fundador | QID ativo e vinculado ao Schema | Busca no wikidata.org |
| robots.txt permite acesso de bots de IA | GPTBot, ClaudeBot, PerplexityBot não bloqueados | Revisão do robots.txt |
| Monitoramento de acessos de LLMs ao llms.txt | Logs configurados e revisados semanalmente | Logs do servidor ou Cloudflare Analytics |
Leituras complementares
Para aprofundar cada dimensão abordada neste guia, recomendamos:
Integração SEO Técnico, JSON-LD e LLMs — Guia técnico completo sobre a intersecção entre SEO tradicional e dados estruturados para IA.
Como JSON-LD e Markdown Educam LLMs Sobre Sua Marca — Análise de como formatos estruturados influenciam o comportamento de citação dos modelos.
JSON-LD e Markdown: A Linguagem Nativa que Ensina IAs a Recomendar Sua Marca — Artigo com checklist técnico de Schema.org e llms.txt.
FAQ: Arquivo llms.txt para SEO em 2026 — Perguntas frequentes sobre implementação e impacto do llms.txt.
Auditoria de Entidade Digital: O Guia Completo para GEO em 2026 — Checklist de 10 itens para validar presença algorítmica, incluindo llms.txt e ai-agents.json.
Schema Markup Software — Ferramentas de schema para diferentes plataformas e CMSs.