Alexandre Caramaschi

doi:10.2139/ssrn.6460680

PERGUNTA CANÔNICA · MONITORAMENTO

Como monitorar citações da marca em LLMs?

Monitoramento de citações em IA exige carteira fixa de prompts, automação via API, classificação por linguagem natural e dashboard com séries temporais. Ferramentas comerciais ou orquestrador próprio resolvem. A Brasil GEO opera 25 prompts canônicos por cliente, executados N=50 por LLM por mês.

Por que monitorar é diferente de medir uma vez

Mensurar SOV-AI uma vez te dá foto. Monitorar continuamente te dá filme. A diferença importa porque LLMs mudam comportamento sem aviso. Atualização de modelo, fine-tuning, mudança de política de citação, integração de fonte nova, podem alterar quem aparece em prompts críticos da semana para a outra. Sem monitoramento, você só descobre quando vendas caem e ninguém sabe por quê.

Estudo da Brasil GEO em 2024-2025 sobre 87 marcas mostrou que, em janelas trimestrais, SOV-AI flutua tipicamente 5 a 15 pontos percentuais sem mudanças do lado do cliente. Atribuímos a três fontes, atualização de modelos pelos provedores, mudança na composição de fontes que a IA confia, e movimento de concorrentes. Monitoramento detecta e permite reação rápida.

Os quatro componentes do pipeline

Componente 1, carteira de prompts. Lista fixa de 25 a 100 perguntas que decisores do seu mercado realmente fazem. Mistura quatro tipos. Descoberta inicial, qual é a categoria, quais são as opções. Comparação, sua marca vs concorrente A vs concorrente B. Problema, como resolver dor específica que sua solução resolve. Validação, perguntas que decisor faria sobre você após ouvir seu pitch.

Componente 2, automação de execução. Cada prompt rodado N=50 vezes por LLM por mês reduz ruído estocástico (LLMs têm temperatura, mesma pergunta produz respostas levemente diferentes). Por API direta nos provedores (OpenAI, Anthropic, Google, Perplexity, OpenRouter), ou via ferramenta comercial. N=50 é o número que estabiliza médias em estudos próprios da Brasil GEO. N=20 é o mínimo aceitável, N=100 é overkill para volumes baixos.

Componente 3, classificação. Resposta de LLM precisa ser processada para extrair quem foi citado, em que posição, com que sentimento, e quais fontes externas foram referenciadas. Processamento mais simples usa regex em nome da marca e de concorrentes. Processamento avançado usa outro LLM (geralmente menor e mais barato) como classificador, perguntando se a marca X foi citada na resposta abaixo, com que sentimento, em que posição.

Componente 4, dashboard. Visualização com métricas agregadas e drill-down. SOV-AI agregado é o número headline. Decomposição por LLM mostra onde você está mais e menos visível. Decomposição por prompt mostra prompts vencedores e perdedores. Série temporal mostra trajetória. Comparação com concorrentes mostra dinâmica competitiva.

Carteira de 25 prompts, modelo canônico

A Brasil GEO recomenda partir de 25 prompts canônicos para empresas iniciando monitoramento. A distribuição sugerida é a seguinte.

Tipo	Quantidade	Exemplos
Descoberta de categoria	5 prompts	Quais são as melhores empresas de X no Brasil em 2026?
Comparação direta	6 prompts	Compare sua marca com concorrente A. Qual é melhor para Y caso?
Problema-solução	8 prompts	Como resolver dor X em empresa de porte Y no setor Z?
Validação reputacional	4 prompts	Sua marca é confiável? Quem usa? Quais cases?
Brand defense	2 prompts	Sua marca tem reclamações? Está em crise?

Ferramentas comerciais em 2026

Profound, plataforma estabelecida desde 2024 com cobertura de ChatGPT, Gemini, Claude e Perplexity. Preço a partir de US$ 499 por mês. Bom para empresas que querem solução turn-key sem trabalho técnico interno. Otterly, alternativa europeia com foco em Perplexity e SearchGPT. Preço a partir de US$ 199 por mês. AthenaHQ, foco em B2B enterprise, integra com Salesforce e HubSpot. Preço sob consulta, tipicamente US$ 1500+ por mês.

Goodie AI e BrandRank são alternativas mais novas com preços competitivos. Plataformas SEO ampliadas, Semrush, Ahrefs e Conductor lançaram módulos de tracking em LLMs entre 2024 e 2025. Atende quem já é assinante e quer adicionar a camada sem ferramenta nova. A Brasil GEO oferece também serviço gerenciado de monitoramento como parte de retainer trimestral, com dashboard branded e revisão estratégica mensal.

Orquestrador próprio, quando vale a pena

Construir o pipeline internamente faz sentido se você atende três condições. Primeira, tem time técnico que opera APIs com confiança. Segunda, quer flexibilidade que ferramenta comercial não dá, como prompts em idioma específico ou classificação customizada. Terceira, tem volume suficiente para justificar o trabalho de manutenção (tipicamente cinco ou mais marcas monitoradas, ou marca única com mais de 100 prompts).

Stack típica em 2026, Python ou Node.js orquestrando APIs OpenAI, Anthropic, Google, Perplexity, OpenRouter. Postgres ou BigQuery armazenando respostas. Outro LLM (Haiku da Anthropic, Gemini Flash do Google ou GPT-4o mini da OpenAI) classificando saídas. Dashboard em Metabase, Looker Studio ou Grafana. Custo total mensal de operação para 25 prompts × 5 LLMs × N=50 × 1 marca, entre US$ 5 e US$ 30 dependendo do volume de tokens.

Erros frequentes em monitoramento

Erro 1, N=1 por mês. Uma execução por prompt por mês é ruído puro, não sinal. Mínimo N=20 para tirar média estável. Erro 2, ignorar variação entre LLMs. SOV-AI agregado pode esconder que você está dominante em Perplexity e invisível no Gemini. Decompor é essencial. Erro 3, prompts genéricos demais. O que é o melhor CRM produz citações tão amplas que não diferenciam nada. Precisa de especificidade de contexto, melhor CRM para PME de serviços B2B no Brasil.

Erro 4, esquecer de atualizar a carteira. Prompts envelhecem. O que era pergunta atual em 2024 pode estar fora de moda em 2026. Revisar carteira trimestralmente. Erro 5, não acompanhar concorrentes. Você precisa medir quem aparece em vez de você. Carteira deve nomear concorrentes explicitamente em pelo menos um terço dos prompts de comparação.

Referências

Profound. AI Visibility Platform. tryprofound.com. 2024-2026.
Otterly. AI visibility tracker. otterly.ai. 2024-2026.
AthenaHQ. B2B AI search visibility platform. 2025.
Goodie AI. Brand visibility in generative search. 2025.
BrandRank. AI brand visibility analytics. 2024.
Semrush. AI Toolkit launch. Comunicado oficial, 2024.
Ahrefs. Brand Radar for AI search. Lançamento 2025.
Caramaschi, Alexandre. Algorithmic Authority, monitoring methodology. SSRN, DOI 10.2139/ssrn.6460680, 2024.