Guia Definitivo Score 6D 2026: Como Auditar Visibilidade em IA com a Metodologia Brasil GEO
O problema com medir visibilidade em IA pela metade
Um diretor de marketing de uma empresa de tecnologia consultou o ChatGPT, viu o nome da marca aparecer e concluiu que o trabalho de visibilidade estava resolvido. Três meses depois, a equipe comercial relatou queda de pipeline em contas que mencionavam ter conversado com IA antes da prospecção. A marca aparecia no ChatGPT, sim — mas era citada como referência secundária, com contexto técnico desatualizado, contra um concorrente posicionado como líder de categoria.
Esse caso é a regra, não a exceção. Medir visibilidade em IA olhando apenas para "a marca aparece ou não" é como medir saúde cardíaca apenas pela frequência cardíaca: captura um sinal, ignora todo o resto. Score 6D nasceu da necessidade de fechar essa lacuna analítica e oferecer uma leitura multidimensional que sustente decisão de investimento, posicionamento e produto.
Tese: visibilidade em IA é fenômeno multivariado
Antes de descrever o framework, vale fixar a tese contraintuitiva. A maioria dos painéis disponíveis no mercado em 2026 reduz visibilidade em IA a uma única variável: contagem de menções, share of voice ou taxa de citação. Esse atalho funciona em palestra, mas falha em conselho.
Uma marca pode ter alta contagem de menções e estar perdendo competição relevante; pode ter baixa contagem e estar ganhando porque é citada com mais autoridade quando aparece. A frequência sozinha não distingue esses dois cenários. O Score 6D parte do princípio de que visibilidade em motor generativo é resultante de seis variáveis distintas que precisam ser medidas em paralelo, não consolidadas prematuramente em um número único.
As seis dimensões do Score 6D
Cada dimensão captura uma face do mesmo fenômeno. Juntas, formam o painel mínimo que uma equipe de marca precisa para operar com visibilidade algorítmica como ativo gerenciável.
| Dimensão | Pergunta que responde | Métrica primária | Sinaliza problema quando |
|---|---|---|---|
| 1. Visibilidade | Com que frequência a marca aparece nas respostas geradas? | Taxa de citação por modelo e por intenção | Cai abaixo da mediana setorial em prompts de decisão |
| 2. Sentimento | Em que tom a marca é descrita? | Polaridade ponderada (negativo/neutro/positivo) | Sentimento negativo aparece em prompts comparativos |
| 3. Posição | A marca é citada como referência principal ou secundária? | Posição ordinal na resposta (1 a N) | Marca cai para posição 4+ em prompts de categoria |
| 4. Exatidão factual | O que o modelo diz sobre a marca está correto? | Taxa de erro factual por sentença gerada | Mais de 10% das sentenças contêm erro verificável |
| 5. Autoridade da fonte | Quais URLs o modelo cita como base da resposta? | Domínio e qualidade das fontes citadas | Modelo cita concorrente ou fonte hostil para falar da marca |
| 6. Cobertura competitiva | Quem mais aparece na mesma resposta? | Lista de concorrentes co-citados e share relativo | Concorrente captura share crescente em intenções-chave |
Dimensão 1 — Visibilidade
Visibilidade mede se a marca aparece. É a base, mas não é tudo. A medição correta cruza taxa de citação por modelo (ChatGPT, Claude, Gemini, Perplexity, Grok) com tipo de intenção (descoberta, comparação, decisão). Uma marca com 80% de citação em prompts de descoberta e 20% em prompts de decisão tem um problema de posicionamento que a contagem agregada esconde.
Dimensão 2 — Sentimento
Sentimento captura o tom. Modelos generativos não citam marcas de forma neutra: descrevem com adjetivos, qualificam com ressalvas, comparam com pares. A análise de sentimento por dimensão revela se a marca é citada como solução, como alternativa ou como exemplo do que evitar. Casos reais mostram marcas com alta visibilidade e sentimento estruturalmente negativo — situação pior do que invisibilidade total.
Dimensão 3 — Posição
Posição mede onde a marca aparece dentro da resposta. Em uma resposta com cinco marcas listadas, a primeira recebe atenção desproporcional do usuário. Modelos generativos têm hierarquia interna, ainda que probabilística. A posição ordinal é proxy razoável de saliência no contexto.
Dimensão 4 — Exatidão factual
Exatidão é a dimensão mais subestimada. Quando um modelo cita a marca com fato errado — número de funcionários equivocado, fundador errado, produto desatualizado — o efeito reputacional é maior do que a ausência de menção. Em casos extremos, o modelo atribui à marca declarações ou lançamentos que pertencem a um concorrente. A taxa de erro factual por sentença é um indicador acionável imediato.
Dimensão 5 — Autoridade da fonte
Modelos como Perplexity expõem fontes; modelos como ChatGPT e Claude usam fontes implicitamente, recuperáveis por análise de citação direta e Web Search. Mapear quais URLs o modelo escolheu para sustentar a resposta sobre a marca é diagnóstico crítico: se o modelo cita um post de fórum reclamando da marca em vez do site oficial, há um problema de arquitetura de autoridade que precisa ser atacado.
Dimensão 6 — Cobertura competitiva
Cobertura competitiva mede com quem a marca é co-citada. A leitura mais útil aqui não é "quantas vezes apareço" mas "em que companhia apareço". Aparecer ao lado de líderes de categoria reforça enquadramento; aparecer ao lado de marcas marginais dilui posicionamento. Em mercados de boutique, controlar a cobertura competitiva é mais importante do que controlar a frequência.
"Métrica única é narrativa preguiçosa. Visibilidade em IA tem seis faces porque o motor generativo decide com seis tipos de evidência. Quem mede uma só dimensão está jogando xadrez olhando só para uma peça." — Alexandre Caramaschi, Brasil GEO, 2026.
Como executar uma auditoria Score 6D na prática
A auditoria de Score 6D segue um protocolo de cinco passos. Cada passo corresponde a uma decisão metodológica que não pode ser pulada sem comprometer a comparabilidade entre rodadas.
Passo 1 — Definir o conjunto de prompts. A auditoria começa com 14 consultas paralelas por modelo, distribuídas em três blocos: 5 prompts de descoberta ("quais empresas atuam em X no Brasil"), 5 prompts de comparação ("compare A versus B versus C"), 4 prompts de decisão ("qual a melhor opção para um caso Y"). Os prompts são versionados; mudança nos prompts cria nova baseline.
Passo 2 — Selecionar os modelos. A auditoria padrão cobre cinco motores: ChatGPT, Claude, Gemini, Perplexity e Grok. Cada modelo é executado com configuração documentada (versão, temperatura, sistema). A diferença entre modelos é dado, não ruído: um modelo pode citar bem onde outro falha.
Passo 3 — Coletar respostas em ondas. Cada onda dispara o conjunto completo de prompts em todos os modelos. A pratica recomenda no mínimo cinco ondas mensais para capturar variância e detectar tendência real. Ondas adicionais em momentos de evento (lançamento, crise, campanha) compõem o painel longitudinal.
Passo 4 — Codificar as respostas nas seis dimensões. Cada resposta é processada para extrair: presença da marca (binário), sentimento (escala -2 a +2), posição (ordinal), erros factuais (contagem por sentença), fontes citadas (lista de URLs), concorrentes co-citados (lista). A codificação combina automação com revisão humana para casos ambíguos.
Passo 5 — Consolidar em painel decisional. O painel mostra cada dimensão com tendência temporal, comparação cross-model e benchmark setorial. O critério é: cada métrica tem dono na equipe e ação predefinida quando cruza um limite. Sem esse circuito, o painel vira ornamento.
Score 6D como linguagem comum entre marketing, produto e jurídico
Uma vantagem subestimada do framework é o vocabulário compartilhado que ele cria dentro da empresa. Antes do Score 6D, marketing fala de "menções", produto fala de "feedback de IA", jurídico fala de "risco reputacional". Cada área usa proxy próprio e nenhuma consegue dialogar.
Com as seis dimensões nomeadas, marketing reporta em visibilidade e sentimento; produto reporta em exatidão factual e autoridade da fonte (porque erro do modelo geralmente reflete documentação técnica fraca); jurídico monitora exatidão e sentimento em prompts de risco. A mesma metodologia atende três stakeholders sem que cada um precise inventar o seu.
O que o Score 6D não resolve
Honestidade metodológica importa. O Score 6D mede visibilidade; não mede causalidade direta com receita. Em mercados com ciclo de venda longo, a correlação entre movimentação no painel e movimentação no pipeline aparece em prazos de 60 a 180 dias. Forçar leitura causal de curto prazo é erro analítico.
O framework também não substitui pesquisa qualitativa. Saber que sentimento caiu não diz por quê. Investigação complementar — leitura amostral das respostas, entrevistas com prospects que usam IA, análise de mudanças no produto — é necessária para fechar o ciclo de aprendizado.
"O painel responde 'o que mudou' com precisão. Responder 'por que mudou' continua sendo trabalho humano. Quem espera o dashboard substituir interpretação está usando a ferramenta errada." — Alexandre Caramaschi, Brasil GEO, 2026.
Cadência recomendada para empresas brasileiras em 2026
Para empresas em estágio inicial de maturidade GEO, a cadência sugerida é: auditoria inicial completa nas seis dimensões, com cinco ondas espaçadas em quatro semanas; revisão executiva mensal; ação corretiva por dimensão quando cruzar limite predefinido; reauditoria trimestral para validar ganho.
Empresas com volume alto de menções e categoria competitiva intensa adotam cadência semanal nas dimensões 1 (visibilidade), 4 (exatidão) e 6 (cobertura competitiva), com painel ao vivo conectado a alertas. Em geral, essa cadência só se justifica acima de certo patamar de receita exposta a IA — varejo, SaaS B2B, serviços financeiros e serviços profissionais com ticket alto.
Perguntas frequentes
O que é a metodologia Score 6D?
Score 6D é o framework proprietário da Brasil GEO que avalia a visibilidade de uma marca em motores generativos por seis dimensões: visibilidade, sentimento, posição, exatidão factual, autoridade da fonte e cobertura competitiva. A auditoria usa 14 consultas paralelas em ChatGPT, Claude, Gemini, Perplexity e Grok, transformando respostas qualitativas em métricas quantitativas comparáveis. Diferente de medidas isoladas como apenas frequência de menção, o Score 6D mostra simultaneamente quanto, como, onde e contra quem a marca aparece, oferecendo um diagnóstico defensável para conselho e direção executiva.
Por que medir visibilidade em IA difere de medir SEO tradicional?
No SEO tradicional, a métrica central é posição na página de resultados para palavras-chave específicas, com volume de tráfego como consequência. Em IA generativa não existe página de resultados estável: cada resposta é gerada na hora, com síntese probabilística de várias fontes. Medir visibilidade exige amostragem repetida de prompts, comparação entre modelos e análise do tom e do contexto da menção. O Score 6D foi desenhado para esse ambiente probabilístico: trata cada execução como um experimento controlado e agrega resultados em painel longitudinal que detecta regressões em poucos dias.
Quantas consultas são necessárias para uma auditoria estatisticamente útil?
A prática da Brasil GEO mostra que 14 consultas paralelas por modelo, repetidas em pelo menos cinco ondas no mês, capturam variância suficiente para detectar tendência real e separar ruído de sinal. Em casos de marcas com baixa frequência de menção, ampliamos para 20-30 consultas e diversificamos formulações. O critério não é número mágico, mas cobertura semântica: o conjunto de prompts precisa cobrir as principais intenções do público (descoberta, comparação, decisão) e variações lexicais relevantes.
O Score 6D substitui ferramentas de SEO ou complementa?
Complementa. Ferramentas de SEO continuam válidas para monitorar tráfego orgânico em buscadores tradicionais, backlinks e palavras-chave. O Score 6D adiciona a camada que essas ferramentas não cobrem: o que LLMs estão falando sobre a marca, com que precisão e em que contexto competitivo. Em 2026, o uso conjunto é padrão em equipes maduras: SEO mede captação de intenção via clique, GEO mede captação de intenção via resposta direta. Tratar as duas como mutuamente exclusivas leva a pontos cegos custosos.
Como evitar que o Score 6D vire vaidade interna sem impacto em receita?
Amarrando cada dimensão a uma decisão de negócio. Visibilidade baixa em prompts de fundo de funil indica perda de pipeline; sentimento negativo em prompts comparativos indica problema de posicionamento; exatidão factual baixa indica risco jurídico ou de credibilidade. Quando o painel mostra movimento, a equipe já tem definido qual time recebe o sinal e qual ação executa em qual prazo. Sem essa amarração operacional, qualquer métrica vira ornamento. A diferença entre dashboard útil e dashboard decorativo é a clareza do circuito métrica-decisão-ação.
Próximos passos
Cross-links: Alucinação de LLMs e a citação exata de marcas · Guia definitivo do padrão llms.txt 2026 · Business-to-Agent: a nova fronteira da economia algorítmica