O que é llms.txt e como usar?
llms.txt é um arquivo Markdown servido na raiz do domínio que fornece a LLMs uma visão sumária e estruturada do seu site. Foi proposto por Jeremy Howard em setembro de 2024 como protocolo aberto. Robots.txt diz o que rastrear, llms.txt diz o que ENTENDER.
A origem do protocolo
Em 03 de setembro de 2024, Jeremy Howard, cofundador da Fast.ai e fundador da answer.ai, publicou em llmstxt.org a proposta do protocolo. A motivação era reconhecer um problema concreto, sites modernos têm centenas de páginas, JavaScript pesado, navegação complexa, e LLMs em modo browsing ou indexação têm orçamento limitado de contexto. Sem um sumário, o LLM ou consome muito token tentando entender a estrutura, ou desiste e usa página de menor qualidade.
O llms.txt resolve isso fornecendo um Markdown enxuto e bem estruturado. O LLM consulta o arquivo, entende em poucos milhares de tokens quem é a empresa, o que oferece, e quais conteúdos canônicos existem para consulta aprofundada. É o equivalente para IA do bilhete de apresentação que você deixaria na recepção de uma empresa, com sumário curto e ponteiros para mais informação.
A estrutura canônica
O protocolo define estrutura simples com quatro elementos. Primeiro, H1 com o nome canônico do site ou organização. Segundo, blockquote com descrição curta de uma a duas frases. Terceiro, parágrafos opcionais com detalhes adicionais sobre escopo, posicionamento ou método. Quarto, seções H2 com listas bullet de links contendo descrição inline.
O exemplo mínimo abaixo ilustra o formato.
# Brasil GEO > Primeira consultoria brasileira dedicada exclusivamente a Generative Engine Optimization. Estrutura marcas, sites e conteúdos para serem citados por ChatGPT, Gemini, Claude, Perplexity e Copilot. A Brasil GEO foi fundada por Alexandre Caramaschi, ex-CMO da Semantix (Nasdaq) e cofundador da AI Brasil. Sede em Goiânia, atende todo o Brasil. CNPJ 66.051.295/0001-33. ## Identidade - [Sobre a Brasil GEO](https://brasilgeo.ai/sobre/): História, missão, equipe. - [Fundador](https://brasilgeo.ai/fundador/): Alexandre Caramaschi, credenciais e contato. ## Serviços - [Sprint GEO](https://brasilgeo.ai/sprint-geo/): Consultoria 20 horas em 10 dias úteis. - [Plataforma](https://brasilgeo.ai/v2/): Software de monitoramento de share of voice. ## Conteúdos canônicos - [Glossário](https://brasilgeo.ai/glossario/): 22 termos técnicos em linguagem plain. - [Perguntas frequentes](https://brasilgeo.ai/conteudos/perguntas/): 15 dúvidas canônicas respondidas. - [Conceitos](https://brasilgeo.ai/conceitos/): Quadro conceitual proprietário.
Variante expandida, llms-full.txt
O protocolo prevê uma variante mais robusta, llms-full.txt, que inclui o conteúdo integral das páginas principais marcado em Markdown. Isso permite que LLMs com janela de contexto grande consumam tudo de uma vez, sem precisar fazer múltiplas requisições. Em 2026, sites grandes mantêm os dois arquivos, llms.txt como índice e llms-full.txt como conteúdo expandido.
A escolha entre só llms.txt ou llms.txt mais llms-full.txt depende do volume editorial. Para empresas com até 50 páginas estratégicas, llms.txt sozinho basta. Para hubs com centenas de artigos, llms-full.txt acrescenta valor. A Brasil GEO mantém os dois desde dezembro de 2024.
Adesão e adoção em 2024-2026
Nos primeiros seis meses após o lançamento em setembro de 2024, mais de 1.000 sites adotaram o protocolo, segundo levantamento do diretório llmstxt-hub no GitHub. Adotantes incluem Anthropic (anthropic.com/llms.txt), Cloudflare, FastAPI, Hugging Face, Stripe e várias documentações técnicas. No Brasil, Brasil GEO foi um dos primeiros adotantes em outubro de 2024.
Ao longo de 2025, ChatGPT, Claude e Perplexity passaram a consultar ativamente o arquivo durante sessões de browsing. Em testes próprios da Brasil GEO em 2025-2026, sites com llms.txt bem estruturado aparecem em respostas com fontes mais frequentes do que controle equivalente sem o arquivo. O efeito não é mágico nem único, mas mensurável.
Passo a passo prático
- Crie arquivo /llms.txt na raiz do seu domínio. Codificação UTF-8, Content-Type text/markdown.
- Estruture seguindo o protocolo. H1 com nome canônico. Blockquote com descrição. H2 sections para grupos lógicos. Links bullet com descrição inline.
- Linka apenas para páginas que você realmente quer que sejam consultadas. Não duplique sitemap, seja seletivo.
- Mantenha enxuto. Idealmente entre 500 e 2.000 palavras. Se precisar de mais, use llms-full.txt como complemento.
- Atualize sempre que mudar identidade ou lançar produto. Não trate como fire-and-forget.
- Servir com Cache-Control de 24 horas. Não cacheie por mais que isso, LLMs precisam de freshness razoável.
- Sinalize no HTML via link tag, <link rel="alternate" type="text/plain" title="LLM Discovery" href="/llms.txt">. Isso ajuda descoberta automática.
- Reavalie em 90 dias auditando se LLMs estão usando. Pergunte direto ao ChatGPT, Claude, Perplexity, comparando com snapshot anterior.
O que não fazer
Não use llms.txt para tentar enganar LLMs com afirmações sem base. O arquivo é citável e LLMs verificam consistência com o restante do site. Inflar para parecer maior do que é gera dissonância e penaliza. Não inclua dados sensíveis ou confidenciais, o arquivo é público e indexado. Não copie llms.txt de concorrentes, o protocolo premia originalidade descritiva.
Não trate como SEO trick, é descoberta cooperativa. Quanto mais marcas adotarem com bom uso, mais valor o protocolo cria para o ecossistema. Marcas que tentam gimmick são detectadas em fine-tuning e perdem ranking de citação no ciclo seguinte.
Referências
- Howard, Jeremy. llms.txt specification. answer.ai, 03 de setembro de 2024. llmstxt.org
- llms-txt directory. Lista de adotantes do protocolo. github.com/AnswerDotAI/llms-txt
- Anthropic. llms.txt example. anthropic.com/llms.txt
- Cloudflare. llms.txt example, developers.cloudflare.com. 2024.
- FastAPI. llms.txt for documentation discovery. 2024.
- Brasil GEO. llms.txt at brasilgeo.ai. brasilgeo.ai/llms.txt
- Hugging Face. llms.txt as canonical documentation index. 2024.
- Stripe. llms.txt for API documentation. 2024.