As três camadas da visibilidade agêntica
TL;DR. O mercado brasileiro está otimizando uma camada que não decide o jogo. A síntese de 25+ papers acadêmicos (NeurIPS 2025, ICLR 2026, ACL 2026 Findings, McKinsey, Linux Foundation) e benchmarks de produção (Pinterest, ACES Columbia/Microsoft) converge em um framework operacional de três camadas: GEO técnico (condição de existência), autoridade ganha (condição de descoberta) e agent legibility (condição de conversão). As três precisam operar simultaneamente. Otimizar uma só é desperdício de orçamento. Este artigo entrega o playbook com limiares quantitativos extraídos diretamente da literatura.
Por que três camadas, e por que agora
Em janeiro de 2026, Sharma publicou no arXiv (2601.00912) o estudo que mediu, em 2.240 queries reais sobre 112 startups, a distância entre o que LLMs sabem e o que LLMs recomendam. O número virou referência: 99,4% de reconhecimento contra 3,32% de descoberta orgânica no ChatGPT. Um gap de 30 para 1. O achado mais incômodo do paper, contudo, não foi o gap em si. Foi a correlação: scores de GEO (a métrica que a indústria adotou como termômetro) não correlacionam com descoberta. r ≈ 0. Os preditores reais são referring domains (r=+0,319) e presença em Reddit (r=+0,395, p=0,002).
Sharma não estava sozinho. O C-SEO Bench, apresentado no NeurIPS 2025 (Aggarwal et al., arXiv:2506.11097), testou 10 métodos de Conversational SEO em 6 domínios e modelou a adoção como jogo não-cooperativo. A maioria das técnicas isoladas se mostrou ineficaz; o que funciona é a combinação SEO clássico + GEO; e a dinâmica é zero-sum quando vários competidores adotam a mesma tática.
Junte os dois achados ao trabalho de Volpini et al. sobre dados estruturados ligados (+29,6% de acurácia em RAG quando páginas incluem instruções estilo llms.txt) e ao caso Pinterest GEO (Zhang et al., arXiv:2602.02961, +20% de tráfego orgânico em produção bilionária após adaptar catálogo a VLMs), e a conclusão se forma por triangulação: nenhuma das alavancas vence sozinha; todas perdem se as outras estiverem ausentes. O framework de três camadas é a forma mais limpa de operacionalizar essa convergência.
Camada 1 — GEO técnico: condição de existência
A primeira camada é a infraestrutura que impede a marca de ser descartada por ilegibilidade. O paper GEO-16 (Kumar et al., arXiv:2509.08919) define dezesseis pilares estruturais e mostra que páginas com G ≥ 0,70 e ao menos 12 pilares acionados atingem 78% de taxa de citação cross-engine. Três pilares são não-negociáveis: metadata, freshness e structured data.
O que o framework GEO-16 audita, em ordem decrescente de peso marginal:
| Pilar | Critério mínimo | Bloqueante? |
|---|---|---|
| Metadata | Description 140-160 caracteres com entidade-âncora; OG e Twitter completos | Sim |
| Freshness | dateModified ≤ 90 dias evergreen, ≤ 14 dias temas voláteis | Sim |
| Structured data | JSON-LD válido contra SHACL com sameAs para Wikidata | Sim |
| Schema JSON-LD | author, datePublished, dateModified, inLanguage, keywords | Bloqueante para B2B |
| Answer blocks | Bloco AEO de 40-80 palavras autocontido após cada heading | Aviso |
| llms.txt + readme_ai.json | Ambos presentes na raiz do domínio | Bloqueante para B2B |
| Entity density | 1 entidade nomeada a cada 100 palavras, 30% linkadas | Aviso |
| Citations out | 1 outlink para fonte primária a cada 250 palavras | Aviso |
| Headings | Cada H2/H3 responde uma pergunta (não rótulo genérico) | Aviso |
| Semantic HTML | Único H1, hierarquia consistente, article/section/aside | Aviso |
| Authority signals | Person/Organization JSON-LD com sameAs para perfis canônicos | Aviso |
| Internal links | Pelo menos 3 links internos contextuais | Aviso |
| Canonical | link rel=canonical correto | Aviso |
| FAQ | FAQPage JSON-LD quando aplicável, 3-7 pares | Aviso |
| Media alt | Alt text descritivo ≥ 15 palavras (não SEO-spam) | Aviso |
| Accessibility | Contraste ≥ 4.5:1, focus indicators, ARIA labels | Aviso |
Dois dados quantitativos completam o argumento. Primeiro, o estudo Source Coverage and Citation Bias (arXiv:2512.09483) analisou 55.936 queries em 124.287 domínios e isolou via SHAP os preditores dominantes de citação por LLM: Tranco rank (importância 0,923), número de outlinks (0,799) e TLD .com (0,623). Outlinks não é detalhe — é o segundo preditor mais forte depois de autoridade global do domínio. Segundo, Volpini et al. demonstram que llms.txt bem implementado eleva a acurácia de RAG de 3,89 para 4,40 (Δ=+0,50, t=-5,22, estatisticamente significativo). O custo de implementação é trivial; a omissão é cara.
Sage 2025 (LLM4Schema.org, Dang et al.) reporta que aproximadamente 75% das páginas web não possuem qualquer markup Schema.org. Para o mercado brasileiro, onde a maturidade técnica de SEO ainda é desigual, isso representa janela competitiva — não detalhe técnico. Quem implementa esta camada de forma correta, validada por SHACL e ligada a Wikidata via sameAs, captura desproporcionalmente a citação que está disponível.
Camada 2 — Autoridade ganha: condição de descoberta
A segunda camada é onde mora o Discovery Gap. Já estabelecemos que GEO técnico isolado não move o ponteiro da descoberta. A pergunta seguinte é: onde, exatamente, ganhar autoridade externa? A resposta empírica é desagradável para quem cresceu com a tese de "qualquer link de qualidade ajuda".
O trabalho News Source Citing Patterns (arXiv:2507.05301) analisou 366.087 URLs em 24.069 conversas reais entre março e maio de 2025 com 12 modelos de OpenAI, Perplexity e Google. Achados críticos: top 20 fontes respondem por 67,3% das citações em modelos OpenAI. Há clustering forte intra-família (cosseno > 0,67) e divergência marcante entre famílias (cosseno < 0,33). Otimizar "para a IA" no singular é falácia de design: não existe uma IA, existem ecossistemas de citação concorrentes.
O Discovery Gap (Sharma, arXiv:2601.00912) entrega os preditores reais de descoberta orgânica em LLMs:
| Variável | Correlação com descoberta | Significância |
|---|---|---|
| GEO score (técnico) | r ≈ 0 | não significante |
| Referring domains qualificados | r = +0,319 | significante |
| Presença em Reddit | r = +0,395 | p = 0,002 |
| Recognition direto (Brand awareness) | 99,4% (ChatGPT) | vs 3,32% discovery |
O peso do Reddit, em particular, merece atenção. As bases de treinamento e os pipelines de RAG de várias engines atribuem a fóruns peso desproporcional, porque estes oferecem o que sites institucionais raramente oferecem — linguagem natural de usuários reais resolvendo problemas reais, com sinais sociais de validação. Para um modelo que precisa decidir o que é "bom" sem clicar em nada, o Reddit é, em larga escala, um proxy de relevância vivida.
Operacionalmente, o playbook da Camada 2 envolve quatro frentes:
- Mapear top-20 por família de LLM. Listar quais 20 domínios concentram citação no nicho-alvo, separadamente para ChatGPT, Perplexity, Gemini e Claude. Cada família tem hierarquia distinta. Sob estratégia única, perde-se share cruzado.
- Calendário trimestral de earned media. Meta de 1 publicação ou backlink contextual a cada 60 dias em domínios do cluster top-20 da família-alvo. Para 4 famílias, isso se traduz em ~6 placements por trimestre.
- Presença ativa em Reddit e fóruns verticais. Tom nativo, regra 9:1 (9 contribuições para outros para cada 1 autopromocional). Karma suficiente no subreddit antes de qualquer self-post relevante. No Brasil: r/marketing, r/SEO, r/MachineLearning, r/brasil, mais Hacker News para audiência técnica internacional.
- Sentiment Integrity. Varredura trimestral em Trustpilot, Reclame Aqui, Glassdoor, Reddit, G2. Sentimento líquido ≥ +0,4 em escala -1 a +1. Reviews contraditórias suprimem citação mesmo com GEO técnico perfeito (Uri Samet, GEO-First Framework, WJARR-2026-0152).
Camada 3 — Agent legibility: condição de conversão
A terceira camada é a fronteira que separa marcas que serão lidas de marcas que serão escolhidas pelo agente. McKinsey publicou em janeiro de 2026 o estudo The Automation Curve in Agentic Commerce que define seis níveis de automação no funil de compra. O ponto de inflexão está no nível 4: a partir dele, o agente executa partes substanciais da decisão de compra com autonomia, e a unidade de competição deixa de ser o clique para ser o lugar da marca no plano contínuo do agente.
O paper que mais perturba a narrativa otimista da indústria é What Is Your AI Agent Buying? (arXiv:2508.02630, Columbia Business School / Microsoft). Os autores construíram o ACES (Agentic e-Commerce Simulator) e rodaram experimentos randomizados com Claude Sonnet/Opus, GPT-4.1/5.1 e Gemini 2.5/3.0 Pro. Três efeitos sistemáticos:
- Penalização causal de tags "sponsored". Agentes desclassificam ativamente itens com rótulos "patrocinado", "anúncio", "promo" — independente do conteúdo.
- Recompensa para endorsements de plataforma. Selos verificados, certificações, badges curados, prêmios listados em Schema.org elevam consideravelmente a probabilidade de seleção.
- Concentração em produtos modais. Demanda agêntica concentra-se no produto-mediano da categoria. Marcas em nichos longos sofrem desvantagem agravada se não construírem sinais explícitos de diferenciação.
A camada de protocolo amarra a transição. A Linux Foundation Agentic AI Foundation, constituída em 2025, consolidou MCP (Model Context Protocol), A2A (Agent-to-Agent) e AP2 (Agent Payments Protocol) como infraestrutura. O survey de Ehtesham et al. (arXiv:2505.02279) propõe sequência de adoção em fases: MCP → ACP → A2A → ANP. MCP Landscape & Security (Hou et al., arXiv:2503.23278) detalha lifecycle de 4 fases, 16 atividades e 4 taxonomias de ameaça — base para implementação segura.
Operacionalmente, o playbook da Camada 3 exige enriquecer o JSON-LD de produto/serviço com campos específicos para agentes:
| Campo Schema.org | O que expõe | Por que importa |
|---|---|---|
eligibility | Quem pode comprar/se matricular | Agente filtra antes de considerar |
loyaltyProgram | Programa de fidelidade integrado | Plano contínuo do agente leva isso em conta |
serviceLevel | SLA, atualizações, suporte | Decisão de longo prazo do agente |
replacementPolicy | Substitutos aceitáveis em ruptura | Crítico para nível 4+ (estoque agêntico) |
hasMerchantReturnPolicy | Política de devolução estruturada | Reduz fricção de decisão automatizada |
aggregateRating | Rating agregado de plataforma | Endorsement reconhecido pelos agentes |
award | Prêmios e certificações | Sinal de diferenciação acima do produto modal |
O complemento técnico é o endpoint MCP. Páginas de produto/serviço devem expor as mesmas informações via servidor MCP próprio, consumível por agentes externos. Na Brasil GEO mantemos https://alexandrecaramaschi.com/api/mcp com quatro tools básicas (getBusinessInfo, getLocation, contactUs, listCourses) como prova de conceito; a próxima onda inclui getCourseDetails e checkEligibility para cobrir o nível 4+ da curva McKinsey.
O que NÃO funciona: anti-patterns ancorados em evidência
A literatura também é clara sobre o que evitar. Quatro anti-patterns têm evidência empírica direta de degradação:
| Anti-pattern | Evidência de degradação | Fonte |
|---|---|---|
| Otimizar para um único engine | Cluster cross-family cosseno < 0,33 — sacrifica share cruzado | arXiv:2507.05301; AutoGEO arXiv:2510.11438 |
| Maximizar densidade de estatísticas | Trustworthiness cai de 8,352 (baseline) para 7,613 | CC-GSEO-Bench arXiv:2509.05607 |
| Aplicar Knowledge Graphs indiscriminadamente | Alguns métodos KG degradam LLM por excesso de ruído | GraphRAG-Bench ICLR 2026, arXiv:2506.05690 |
| Substituir SEO clássico por GEO | SEO + GEO combinados vencem; substituição perde | C-SEO Bench NeurIPS 2025, arXiv:2506.11097 |
O contraponto à densidade de estatísticas é o achado mais robusto do CC-GSEO-Bench: "More Quotes" é a estratégia editorial mais eficaz. Exposure 5,769 e Faithful Credit 6,328 — ambos superiores a baseline. Quotes diretas atribuíveis (pessoa + cargo + organização + data) são o instrumento mais confiável de conquistar citação por LLM. Razão recomendada: quote:estatística ≥ 2:1 em conteúdo orientativo.
Como medimos sucesso: indicadores próprios para descoberta agêntica
Times brasileiros que continuam medindo visibilidade exclusivamente por rankings no Google estão cegos para 37% do território que importa. O estudo Source Coverage (arXiv:2512.09483) demonstra que mais de um terço dos domínios citados por LLMs nunca aparecem em resultados orgânicos relevantes da busca tradicional. Isso significa que dashboards baseados em Search Console e Semrush precisam ser complementados — não substituídos — por instrumentação agêntica própria.
Os indicadores mínimos para acompanhar a saúde das três camadas:
- G médio (Camada 1). Score GEO-16 das URLs centrais, atualizado mensalmente. Meta: G ≥ 0,70 em 80% das páginas-pilar.
- Densidade de citação por engine (Camada 2). Prompt bank de 30-50 queries do nicho, rodadas semanalmente em ChatGPT, Perplexity, Gemini e Claude, contando quantas trazem a marca como recomendação espontânea. Meta inicial: 5% no trimestre 1, 15% no trimestre 4.
- Cobertura no top-20 por família (Camada 2). Quantos dos vinte domínios mais citados pela família-alvo trazem menção orgânica à marca. Meta: progresso de 1 placement a cada 60 dias.
- Schema completeness (Camada 3). Porcentagem de páginas de produto/serviço com os 7 campos avançados (eligibility, loyaltyProgram, serviceLevel, replacementPolicy, hasMerchantReturnPolicy, aggregateRating, award) preenchidos.
- Anti-signal score (Camada 3). Auditoria automática contra rótulos "sponsored", "anúncio", "promocional" no JSON-LD e em meta description. Meta: zero.
Em conjunto, esses cinco indicadores triangulam o que dashboards tradicionais não capturam. Eles também resistem ao ciclo de hype porque cada um está ancorado em evidência empírica publicada — não em opinião editorial.
Síntese — o que muda a partir daqui
A frase que sintetiza o argumento e que mereceria estar no topo do deck de qualquer conselho discutindo orçamento de marketing em 2026 é simples: o GEO técnico é a condição de existência; a autoridade ganha é a condição de descoberta; a legibilidade agêntica é a condição de conversão. Quem otimiza apenas a primeira é invisível. Quem otimiza as três é encontrado, escolhido e mantido no plano contínuo do agente.
Os números convergem. GEO-16 entrega 78% de citação cross-engine quando G ≥ 0,70 e ≥ 12 pilares acionados. llms.txt entrega +29,6% em RAG. Knowledge Graph grounding entrega +26,5% em raciocínio. Top-20 fontes concentram 67,3% das citações em modelos OpenAI. Discovery Gap mostra que GEO score isolado tem r ≈ 0 com descoberta — só referring domains (r=+0,319) e Reddit (r=+0,395) movem o ponteiro. Pinterest entrega +20% em produção quando catálogo é otimizado para VLM. Agentes penalizam "sponsored" e recompensam endorsements verificados.
A janela competitiva está aberta agora. C-SEO Bench documenta que a dinâmica é zero-sum em equilíbrio: à medida que a adoção das técnicas se generaliza, o ganho marginal colapsa. Marcas brasileiras que perceberem essa ruptura nos próximos doze meses construirão vantagem composta — porque autoridade ganha não é replicável em ciclo curto, e porque a fase competitiva ainda admite assimetrias significativas.
Este artigo opera no registro institucional da Brasil GEO: framework, limiares quantitativos, playbook acionável. A leitura complementar — em registro autoral, sobre como cheguei a esta tese e por que reorganizei a Brasil GEO em torno deste framework — está publicada em A era em que o clique não conta mais.
Referências centrais
O corpus completo (25+ papers) com URLs canônicas, contribuição-chave de cada paper e mapeamento para as três camadas está consolidado na base de conhecimento da Brasil GEO. As âncoras quantitativas mais citadas neste artigo:
- Kumar et al., GEO-16, arXiv:2509.08919 — framework de 16 pilares, 78% citação cross-engine.
- Aggarwal et al., C-SEO Bench, NeurIPS 2025, arXiv:2506.11097 — benchmark de Conversational SEO em 6 domínios.
- Sharma, The Discovery Gap, arXiv:2601.00912 — gap 30:1 entre recognition e discovery.
- News Source Citing Patterns, arXiv:2507.05301 — top-20 = 67,3% das citações OpenAI.
- Source Coverage and Citation Bias, arXiv:2512.09483 — SHAP isolando Tranco, outlinks, .com.
- Wu et al., MAGEO, ACL 2026 Findings, arXiv:2604.19516 — multi-agente com Twin Branch Evaluation.
- CC-GSEO-Bench, arXiv:2509.05607 — quotes vencem stats.
- AutoGEO, CMU, arXiv:2510.11438 — regras de preferência por engine.
- Grounding LLM Reasoning with KGs, arXiv:2502.13247 — +26,5% em raciocínio.
- GraphRAG-Bench, ICLR 2026, arXiv:2506.05690 — alguns métodos KG degradam LLM.
- Allouah et al., What Is Your AI Agent Buying?, arXiv:2508.02630 — ACES simulator com Claude/GPT/Gemini.
- Hou et al., MCP Landscape & Security, arXiv:2503.23278 — 4 fases, 16 atividades, 4 taxonomias de ameaça.
- Ehtesham et al., Agent Interoperability Survey, arXiv:2505.02279 — sequência MCP → ACP → A2A → ANP.
- Yang et al., Agentic Web, Berkeley/Dawn Song, arXiv:2507.21206 — 3 dimensões, Agent Attention Economy.
- Zhang et al., Pinterest GEO, arXiv:2602.02961 — +20% tráfego em produção bilionária.
- Dang et al., LLM4Schema.org, Sage 2025, DOI:10.1177/22104968251382172 — ~75% das páginas sem schema.
A Brasil GEO mantém este corpus ativo, com revisão trimestral de novos papers e calibragem dos limiares quantitativos conforme a evidência se consolida. Este artigo é o estado da arte em 25 de abril de 2026.
Alexandre Caramaschi — CEO da Brasil GEO, ex-CMO da Semantix (Nasdaq), cofundador da AI Brasil. alexandrecaramaschi.com · ORCID 0009-0004-9150-485X