Alexandre Caramaschi

doi:10.2139/ssrn.6460680

PERGUNTA CANÔNICA · PERPLEXITY

Como ser citado pelo Perplexity?

O Perplexity é o LLM mais transparente em citações, sempre mostrando as fontes que usou. Por usar RAG intensivo, prioriza páginas com freshness alta, domain authority forte e schema.org bem implementado. Liberar PerplexityBot e Perplexity-User no robots.txt é o ponto de partida não negociável.

O Perplexity é arquitetonicamente diferente

Enquanto ChatGPT e Claude começam tentando responder pelo conhecimento aprendido no treinamento, o Perplexity foi desenhado desde o primeiro dia como RAG, Retrieval-Augmented Generation. Para toda pergunta, o sistema executa busca na web em tempo real, ranqueia fontes, extrai conteúdo relevante e só então gera resposta sintetizada. As fontes aparecem citadas com número de referência no texto, no estilo de uma Wikipedia ou paper acadêmico.

Essa arquitetura tem consequência prática enorme para GEO. Aparecer no Perplexity é mais parecido com aparecer em uma busca tradicional do que ser absorvido pelo treinamento. Mudanças no seu site refletem em dias, não em meses. E como o Perplexity sempre mostra as fontes, seu monitoramento de share of voice fica mais direto e auditável.

Os dois crawlers do Perplexity

A Perplexity opera dois user-agents distintos, documentados em docs.perplexity.ai. O PerplexityBot é usado para indexar páginas para o índice próprio da empresa, alimentando o sistema de retrieval. O Perplexity-User é usado quando um usuário clica em uma resposta e pede ao Perplexity para visitar uma página específica em tempo real. Bloquear qualquer um dos dois reduz visibilidade.

A documentação oficial em 2025 estabeleceu políticas específicas para esses bots. Para aparecer em respostas, ambos devem ter Allow no robots.txt. Para opt-out de treinamento de modelos derivados, há instrução separada via meta tag ou cabeçalho HTTP. A decisão deve ser consciente. Em quase todos os casos B2B, permitir os dois bots é o que faz sentido.

O que o Perplexity prioriza ao escolher fontes

Análise da SparkToro de outubro de 2024 e estudos independentes de SE Ranking publicados em 2024-2025 identificaram padrões consistentes nas fontes citadas pelo Perplexity. Primeiro, domínios com Domain Rating alto pelo Ahrefs ou Domain Authority alto pelo Moz, ou seja, sites com backlinks de qualidade. Segundo, conteúdo recente, com datePublished ou dateModified nos últimos 12 a 24 meses para temas dinâmicos. Terceiro, schema.org Article ou NewsArticle bem implementado, com headline, datePublished, dateModified, author e publisher coerentes.

Quarto, presença em domínios reconhecidos como confiáveis dentro do tema. Para tecnologia, isso significa TechCrunch, The Verge, Wired, MIT Technology Review. Para negócios, FT, Bloomberg, HBR, Forbes. No Brasil, Valor, Estadão, Folha, Exame. Quinto, llms.txt na raiz como sinal de cooperação com o ecossistema de IA. Sexto, conteúdo bem estruturado em listas, tabelas, FAQ, formatos que permitem extração limpa pelo retrieval.

Passo a passo prático

Audite hoje. Pergunte ao Perplexity cinco prompts do seu mercado e registre as fontes citadas em cada resposta. O Perplexity é o LLM que mais facilita esse benchmark porque sempre mostra as referências.
Libere PerplexityBot e Perplexity-User no robots.txt. Documentação oficial em docs.perplexity.ai.
Implemente schema.org Article com datePublished e dateModified em ISO 8601. Para conteúdo evergreen, atualize dateModified ao revisar.
Garanta sitemap XML segmentado por data. O Perplexity puxa de sitemaps quando descobre o site.
Publique llms.txt na raiz com identidade, serviços e conteúdos canônicos.
Invista em backlinks de domínios tier 1 dentro do seu tema. Análise de fontes citadas no seu mercado mostra quais domínios o Perplexity confia.
Mantenha calendar editorial. Publicação frequente, mesmo modesta, sinaliza freshness ao retrieval. Um post bem feito por semana supera dez por mês irregulares.
Use IndexNow para notificar mudanças. O Perplexity respeita esse protocolo desde 2024.
Reavalie em 30 dias. Perplexity é o LLM mais rápido para refletir mudanças, em testes próprios da Brasil GEO, novas páginas começam a aparecer em respostas em uma a duas semanas após publicação.

Vantagens estratégicas do Perplexity

Por ser RAG transparente, é o melhor LLM para começar GEO. Permite mensurar progresso em ciclos curtos, mostra as fontes que você precisa superar, e responde rápido a mudanças no seu site. Para empresas começando programa GEO, recomendamos priorizar Perplexity nos primeiros 90 dias e expandir para ChatGPT e Claude na sequência.

Outra vantagem, o Perplexity tem ferramentas de Espaços que permitem criar agentes especializados em fontes específicas. Esse mecanismo pode ser explorado para co-branding e parcerias editoriais que aumentam citabilidade colateral.

Referências

Perplexity. Bots and crawlers documentation. docs.perplexity.ai/guides/bots
Perplexity. PerplexityBot and Perplexity-User policy clarification. Comunicado oficial, 2024.
SparkToro. Perplexity citation patterns analysis. Estudo, outubro de 2024.
SE Ranking. Anatomy of Perplexity AI answers, 1000 query study. Relatório, 2024-2025.
Schema.org. Article and NewsArticle specifications. schema.org/Article
IndexNow. Protocol documentation. indexnow.org
Lewis et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. arXiv 2005.11401. Maio de 2020.
Howard, Jeremy. llms.txt specification. answer.ai, setembro de 2024.