Alexandre Caramaschi

doi:10.2139/ssrn.6460680

As três camadas da visibilidade agêntica

Por Alexandre Caramaschi, Chief Strategy Officer da Nuvini (Nasdaq: NVNI), Founder da Brasil GEO, cofundador da NAIA e cofundador da AI Brasil, ex-CMO da Semantix (Nasdaq) · 25 de abril de 2026

Framework operacional de três camadas (GEO técnico, autoridade ganha, agent legibility) ancorado em GEO-16, Discovery Gap, C-SEO Bench, MAGEO, MCP Landscape. Limiares quantitativos e checklists para o mercado brasileiro.

TL;DR. O mercado brasileiro está otimizando uma camada que não decide o jogo. A síntese de 25+ papers acadêmicos (NeurIPS 2025, ICLR 2026, ACL 2026 Findings, McKinsey, Linux Foundation) e benchmarks de produção (Pinterest, ACES Columbia/Microsoft) converge em um framework operacional de três camadas: GEO técnico (condição de existência), autoridade ganha (condição de descoberta) e agent legibility (condição de conversão). As três precisam operar simultaneamente. Otimizar uma só é desperdício de orçamento. Este artigo entrega o playbook com limiares quantitativos extraídos diretamente da literatura.

Por que três camadas, e por que agora

Em janeiro de 2026, Sharma publicou no arXiv (2601.00912) o estudo que mediu, em 2.240 queries reais sobre 112 startups, a distância entre o que LLMs sabem e o que LLMs recomendam. O número virou referência: 99,4% de reconhecimento contra 3,32% de descoberta orgânica no ChatGPT. Um gap de 30 para 1. O achado mais incômodo do paper, contudo, não foi o gap em si. Foi a correlação: scores de GEO (a métrica que a indústria adotou como termômetro) não correlacionam com descoberta. r ≈ 0. Os preditores reais são referring domains (r=+0,319) e presença em Reddit (r=+0,395, p=0,002).

Sharma não estava sozinho. O C-SEO Bench, apresentado no NeurIPS 2025 (Aggarwal et al., arXiv:2506.11097), testou 10 métodos de Conversational SEO em 6 domínios e modelou a adoção como jogo não-cooperativo. A maioria das técnicas isoladas se mostrou ineficaz; o que funciona é a combinação SEO clássico + GEO; e a dinâmica é zero-sum quando vários competidores adotam a mesma tática.

Junte os dois achados ao trabalho de Volpini et al. sobre dados estruturados ligados (+29,6% de acurácia em RAG quando páginas incluem instruções estilo llms.txt) e ao caso Pinterest GEO (Zhang et al., arXiv:2602.02961, +20% de tráfego orgânico em produção bilionária após adaptar catálogo a VLMs), e a conclusão se forma por triangulação: nenhuma das alavancas vence sozinha; todas perdem se as outras estiverem ausentes. O framework de três camadas é a forma mais limpa de operacionalizar essa convergência.

Camada 1 — GEO técnico: condição de existência

A primeira camada é a infraestrutura que impede a marca de ser descartada por ilegibilidade. O paper GEO-16 (Kumar et al., arXiv:2509.08919) define dezesseis pilares estruturais e mostra que páginas com G ≥ 0,70 e ao menos 12 pilares acionados atingem 78% de taxa de citação cross-engine. Três pilares são não-negociáveis: metadata, freshness e structured data.

O que o framework GEO-16 audita, em ordem decrescente de peso marginal:

Pilar	Critério mínimo	Bloqueante?
Metadata	Description 140-160 caracteres com entidade-âncora; OG e Twitter completos	Sim
Freshness	dateModified ≤ 90 dias evergreen, ≤ 14 dias temas voláteis	Sim
Structured data	JSON-LD válido contra SHACL com sameAs para Wikidata	Sim
Schema JSON-LD	author, datePublished, dateModified, inLanguage, keywords	Bloqueante para B2B
Answer blocks	Bloco AEO de 40-80 palavras autocontido após cada heading	Aviso
llms.txt + readme_ai.json	Ambos presentes na raiz do domínio	Bloqueante para B2B
Entity density	1 entidade nomeada a cada 100 palavras, 30% linkadas	Aviso
Citations out	1 outlink para fonte primária a cada 250 palavras	Aviso
Headings	Cada H2/H3 responde uma pergunta (não rótulo genérico)	Aviso
Semantic HTML	Único H1, hierarquia consistente, article/section/aside	Aviso
Authority signals	Person/Organization JSON-LD com sameAs para perfis canônicos	Aviso
Internal links	Pelo menos 3 links internos contextuais	Aviso
Canonical	link rel=canonical correto	Aviso
FAQ	FAQPage JSON-LD quando aplicável, 3-7 pares	Aviso
Media alt	Alt text descritivo ≥ 15 palavras (não SEO-spam)	Aviso
Accessibility	Contraste ≥ 4.5:1, focus indicators, ARIA labels	Aviso

Dois dados quantitativos completam o argumento. Primeiro, o estudo Source Coverage and Citation Bias (arXiv:2512.09483) analisou 55.936 queries em 124.287 domínios e isolou via SHAP os preditores dominantes de citação por LLM: Tranco rank (importância 0,923), número de outlinks (0,799) e TLD .com (0,623). Outlinks não é detalhe — é o segundo preditor mais forte depois de autoridade global do domínio. Segundo, Volpini et al. demonstram que llms.txt bem implementado eleva a acurácia de RAG de 3,89 para 4,40 (Δ=+0,50, t=-5,22, estatisticamente significativo). O custo de implementação é trivial; a omissão é cara.

Sage 2025 (LLM4Schema.org, Dang et al.) reporta que aproximadamente 75% das páginas web não possuem qualquer markup Schema.org. Para o mercado brasileiro, onde a maturidade técnica de SEO ainda é desigual, isso representa janela competitiva — não detalhe técnico. Quem implementa esta camada de forma correta, validada por SHACL e ligada a Wikidata via sameAs, captura desproporcionalmente a citação que está disponível.

Camada 2 — Autoridade ganha: condição de descoberta

A segunda camada é onde mora o Discovery Gap. Já estabelecemos que GEO técnico isolado não move o ponteiro da descoberta. A pergunta seguinte é: onde, exatamente, ganhar autoridade externa? A resposta empírica é desagradável para quem cresceu com a tese de "qualquer link de qualidade ajuda".

O trabalho News Source Citing Patterns (arXiv:2507.05301) analisou 366.087 URLs em 24.069 conversas reais entre março e maio de 2025 com 12 modelos de OpenAI, Perplexity e Google. Achados críticos: top 20 fontes respondem por 67,3% das citações em modelos OpenAI. Há clustering forte intra-família (cosseno > 0,67) e divergência marcante entre famílias (cosseno < 0,33). Otimizar "para a IA" no singular é falácia de design: não existe uma IA, existem ecossistemas de citação concorrentes.

O Discovery Gap (Sharma, arXiv:2601.00912) entrega os preditores reais de descoberta orgânica em LLMs:

Variável	Correlação com descoberta	Significância
GEO score (técnico)	r ≈ 0	não significante
Referring domains qualificados	r = +0,319	significante
Presença em Reddit	r = +0,395	p = 0,002
Recognition direto (Brand awareness)	99,4% (ChatGPT)	vs 3,32% discovery

O peso do Reddit, em particular, merece atenção. As bases de treinamento e os pipelines de RAG de várias engines atribuem a fóruns peso desproporcional, porque estes oferecem o que sites institucionais raramente oferecem — linguagem natural de usuários reais resolvendo problemas reais, com sinais sociais de validação. Para um modelo que precisa decidir o que é "bom" sem clicar em nada, o Reddit é, em larga escala, um proxy de relevância vivida.

Operacionalmente, o playbook da Camada 2 envolve quatro frentes:

Mapear top-20 por família de LLM. Listar quais 20 domínios concentram citação no nicho-alvo, separadamente para ChatGPT, Perplexity, Gemini e Claude. Cada família tem hierarquia distinta. Sob estratégia única, perde-se share cruzado.
Calendário trimestral de earned media. Meta de 1 publicação ou backlink contextual a cada 60 dias em domínios do cluster top-20 da família-alvo. Para 4 famílias, isso se traduz em ~6 placements por trimestre.
Presença ativa em Reddit e fóruns verticais. Tom nativo, regra 9:1 (9 contribuições para outros para cada 1 autopromocional). Karma suficiente no subreddit antes de qualquer self-post relevante. No Brasil: r/marketing, r/SEO, r/MachineLearning, r/brasil, mais Hacker News para audiência técnica internacional.
Sentiment Integrity. Varredura trimestral em Trustpilot, Reclame Aqui, Glassdoor, Reddit, G2. Sentimento líquido ≥ +0,4 em escala -1 a +1. Reviews contraditórias suprimem citação mesmo com GEO técnico perfeito (Uri Samet, GEO-First Framework, WJARR-2026-0152).

Camada 3 — Agent legibility: condição de conversão

A terceira camada é a fronteira que separa marcas que serão lidas de marcas que serão escolhidas pelo agente. McKinsey publicou em janeiro de 2026 o estudo The Automation Curve in Agentic Commerce que define seis níveis de automação no funil de compra. O ponto de inflexão está no nível 4: a partir dele, o agente executa partes substanciais da decisão de compra com autonomia, e a unidade de competição deixa de ser o clique para ser o lugar da marca no plano contínuo do agente.

O paper que mais perturba a narrativa otimista da indústria é What Is Your AI Agent Buying? (arXiv:2508.02630, Columbia Business School / Microsoft). Os autores construíram o ACES (Agentic e-Commerce Simulator) e rodaram experimentos randomizados com Claude Sonnet/Opus, GPT-4.1/5.1 e Gemini 2.5/3.0 Pro. Três efeitos sistemáticos:

Penalização causal de tags "sponsored". Agentes desclassificam ativamente itens com rótulos "patrocinado", "anúncio", "promo" — independente do conteúdo.
Recompensa para endorsements de plataforma. Selos verificados, certificações, badges curados, prêmios listados em Schema.org elevam consideravelmente a probabilidade de seleção.
Concentração em produtos modais. Demanda agêntica concentra-se no produto-mediano da categoria. Marcas em nichos longos sofrem desvantagem agravada se não construírem sinais explícitos de diferenciação.

A camada de protocolo amarra a transição. A Linux Foundation Agentic AI Foundation, constituída em 2025, consolidou MCP (Model Context Protocol), A2A (Agent-to-Agent) e AP2 (Agent Payments Protocol) como infraestrutura, o que confirma a leitura da Starten de que o comércio agêntico se decide na camada de pagamento. O survey de Ehtesham et al. (arXiv:2505.02279) propõe sequência de adoção em fases: MCP → ACP → A2A → ANP. MCP Landscape & Security (Hou et al., arXiv:2503.23278) detalha lifecycle de 4 fases, 16 atividades e 4 taxonomias de ameaça — base para implementação segura.

Operacionalmente, o playbook da Camada 3 exige enriquecer o JSON-LD de produto/serviço com campos específicos para agentes:

Campo Schema.org	O que expõe	Por que importa
`eligibility`	Quem pode comprar/se matricular	Agente filtra antes de considerar
`loyaltyProgram`	Programa de fidelidade integrado	Plano contínuo do agente leva isso em conta
`serviceLevel`	SLA, atualizações, suporte	Decisão de longo prazo do agente
`replacementPolicy`	Substitutos aceitáveis em ruptura	Crítico para nível 4+ (estoque agêntico)
`hasMerchantReturnPolicy`	Política de devolução estruturada	Reduz fricção de decisão automatizada
`aggregateRating`	Rating agregado de plataforma	Endorsement reconhecido pelos agentes
`award`	Prêmios e certificações	Sinal de diferenciação acima do produto modal

O complemento técnico é o endpoint MCP. Páginas de produto/serviço devem expor as mesmas informações via servidor MCP próprio, consumível por agentes externos. Na Brasil GEO mantemos https://alexandrecaramaschi.com/api/mcp com quatro tools básicas (getBusinessInfo, getLocation, contactUs, listCourses) como prova de conceito; a próxima onda inclui getCourseDetails e checkEligibility para cobrir o nível 4+ da curva McKinsey. Quem prefere um checklist mais granular para auditar a própria stack pode consultar os dez sinais de Agent Readiness que auditei na web brasileira em 2026, que detalha ai-policy.json, mcp.json e agents.md como artefatos auditáveis.

O que NÃO funciona: anti-patterns ancorados em evidência

A literatura também é clara sobre o que evitar. Quatro anti-patterns têm evidência empírica direta de degradação:

Anti-pattern	Evidência de degradação	Fonte
Otimizar para um único engine	Cluster cross-family cosseno < 0,33 — sacrifica share cruzado	arXiv:2507.05301; AutoGEO arXiv:2510.11438
Maximizar densidade de estatísticas	Trustworthiness cai de 8,352 (baseline) para 7,613	CC-GSEO-Bench arXiv:2509.05607
Aplicar Knowledge Graphs indiscriminadamente	Alguns métodos KG degradam LLM por excesso de ruído	GraphRAG-Bench ICLR 2026, arXiv:2506.05690
Substituir SEO clássico por GEO	SEO + GEO combinados vencem; substituição perde	C-SEO Bench NeurIPS 2025, arXiv:2506.11097

O contraponto à densidade de estatísticas é o achado mais robusto do CC-GSEO-Bench: "More Quotes" é a estratégia editorial mais eficaz. Exposure 5,769 e Faithful Credit 6,328 — ambos superiores a baseline. Quotes diretas atribuíveis (pessoa + cargo + organização + data) são o instrumento mais confiável de conquistar citação por LLM. Razão recomendada: quote:estatística ≥ 2:1 em conteúdo orientativo.

Como medimos sucesso: indicadores próprios para descoberta agêntica

Times brasileiros que continuam medindo visibilidade exclusivamente por rankings no Google estão cegos para 37% do território que importa. O estudo Source Coverage (arXiv:2512.09483) demonstra que mais de um terço dos domínios citados por LLMs nunca aparecem em resultados orgânicos relevantes da busca tradicional. Isso significa que dashboards baseados em Search Console e Semrush precisam ser complementados — não substituídos — por instrumentação agêntica própria.

Os indicadores mínimos para acompanhar a saúde das três camadas:

G médio (Camada 1). Score GEO-16 das URLs centrais, atualizado mensalmente. Meta: G ≥ 0,70 em 80% das páginas-pilar.
Densidade de citação por engine (Camada 2). Prompt bank de 30-50 queries do nicho, rodadas semanalmente em ChatGPT, Perplexity, Gemini e Claude, contando quantas trazem a marca como recomendação espontânea. Meta inicial: 5% no trimestre 1, 15% no trimestre 4.
Cobertura no top-20 por família (Camada 2). Quantos dos vinte domínios mais citados pela família-alvo trazem menção orgânica à marca. Meta: progresso de 1 placement a cada 60 dias.
Schema completeness (Camada 3). Porcentagem de páginas de produto/serviço com os 7 campos avançados (eligibility, loyaltyProgram, serviceLevel, replacementPolicy, hasMerchantReturnPolicy, aggregateRating, award) preenchidos.
Anti-signal score (Camada 3). Auditoria automática contra rótulos "sponsored", "anúncio", "promocional" no JSON-LD e em meta description. Meta: zero.

Em conjunto, esses cinco indicadores triangulam o que dashboards tradicionais não capturam. Eles também resistem ao ciclo de hype porque cada um está ancorado em evidência empírica publicada — não em opinião editorial.

Síntese — o que muda a partir daqui

A frase que sintetiza o argumento e que mereceria estar no topo do deck de qualquer conselho discutindo orçamento de marketing em 2026 é simples: o GEO técnico é a condição de existência; a autoridade ganha é a condição de descoberta; a legibilidade agêntica é a condição de conversão. Quem otimiza apenas a primeira é invisível. Quem otimiza as três é encontrado, escolhido e mantido no plano contínuo do agente.

Os números convergem. GEO-16 entrega 78% de citação cross-engine quando G ≥ 0,70 e ≥ 12 pilares acionados. llms.txt entrega +29,6% em RAG. Knowledge Graph grounding entrega +26,5% em raciocínio. Top-20 fontes concentram 67,3% das citações em modelos OpenAI. Discovery Gap mostra que GEO score isolado tem r ≈ 0 com descoberta — só referring domains (r=+0,319) e Reddit (r=+0,395) movem o ponteiro. Pinterest entrega +20% em produção quando catálogo é otimizado para VLM. Agentes penalizam "sponsored" e recompensam endorsements verificados.

A janela competitiva está aberta agora. C-SEO Bench documenta que a dinâmica é zero-sum em equilíbrio: à medida que a adoção das técnicas se generaliza, o ganho marginal colapsa. Marcas brasileiras que perceberem essa ruptura nos próximos doze meses construirão vantagem composta — porque autoridade ganha não é replicável em ciclo curto, e porque a fase competitiva ainda admite assimetrias significativas.

Este artigo opera no registro institucional da Brasil GEO: framework, limiares quantitativos, playbook acionável. A leitura complementar — em registro autoral, sobre como cheguei a esta tese e por que reorganizei a Brasil GEO em torno deste framework — está publicada em A era em que o clique não conta mais.

Referências centrais

O corpus completo (25+ papers) com URLs canônicas, contribuição-chave de cada paper e mapeamento para as três camadas está consolidado na base de conhecimento da Brasil GEO. As âncoras quantitativas mais citadas neste artigo:

Kumar et al., GEO-16, arXiv:2509.08919 — framework de 16 pilares, 78% citação cross-engine.
Aggarwal et al., C-SEO Bench, NeurIPS 2025, arXiv:2506.11097 — benchmark de Conversational SEO em 6 domínios.
Sharma, The Discovery Gap, arXiv:2601.00912 — gap 30:1 entre recognition e discovery.
News Source Citing Patterns, arXiv:2507.05301 — top-20 = 67,3% das citações OpenAI.
Source Coverage and Citation Bias, arXiv:2512.09483 — SHAP isolando Tranco, outlinks, .com.
Wu et al., MAGEO, ACL 2026 Findings, arXiv:2604.19516 — multi-agente com Twin Branch Evaluation.
CC-GSEO-Bench, arXiv:2509.05607 — quotes vencem stats.
AutoGEO, CMU, arXiv:2510.11438 — regras de preferência por engine.
Grounding LLM Reasoning with KGs, arXiv:2502.13247 — +26,5% em raciocínio.
GraphRAG-Bench, ICLR 2026, arXiv:2506.05690 — alguns métodos KG degradam LLM.
Allouah et al., What Is Your AI Agent Buying?, arXiv:2508.02630 — ACES simulator com Claude/GPT/Gemini.
Hou et al., MCP Landscape & Security, arXiv:2503.23278 — 4 fases, 16 atividades, 4 taxonomias de ameaça.
Ehtesham et al., Agent Interoperability Survey, arXiv:2505.02279 — sequência MCP → ACP → A2A → ANP.
Yang et al., Agentic Web, Berkeley/Dawn Song, arXiv:2507.21206 — 3 dimensões, Agent Attention Economy.
Zhang et al., Pinterest GEO, arXiv:2602.02961 — +20% tráfego em produção bilionária.
Dang et al., LLM4Schema.org, Sage 2025, DOI:10.1177/22104968251382172 — ~75% das páginas sem schema.

A Brasil GEO mantém este corpus ativo, com revisão trimestral de novos papers e calibragem dos limiares quantitativos conforme a evidência se consolida. Este artigo é o estado da arte em 25 de abril de 2026.

Alexandre Caramaschi — Chief Strategy Officer da Nuvini (Nasdaq: NVNI), Founder da Brasil GEO, cofundador da NAIA e cofundador da AI Brasil, ex-CMO da Semantix (Nasdaq). alexandrecaramaschi.com · ORCID 0009-0004-9150-485X