Modelo mais recente do ChatGPT foi encontrado usando a Grokipedia de Elon Musk como fonte, aumentando o receio de desinformação

O Efeito Ouroboros: o modelo mais recente da OpenAI foi apanhado citando a enciclopédia gerada por IA de Musk

A frágil fronteira entre o conhecimento humano verificado e a produção sintética de máquinas foi, segundo relatos, violada. Investigações recentes revelaram que o modelo mais avançado da OpenAI, denominado GPT-5.2, começou a citar "Grokipedia" — uma enciclopédia gerada por IA desenvolvida pela xAI de Elon Musk — como fonte primária para consultas factuais. Esse desenvolvimento, descoberto em testes conduzidos por The Guardian e corroborado por pesquisadores independentes, marca um ponto de inflexão significativo no ecossistema de IA, levantando questões urgentes sobre a proveniência dos dados, reportagens circulares e a integridade da informação na era da busca generativa (generative search).

Para a comunidade de IA, isto não é meramente um confronto político entre dois magnatas da tecnologia; é uma bandeira vermelha técnica. Sugere que as salvaguardas projetadas para filtrar dados de baixa qualidade ou sintéticos dos conjuntos de treinamento e dos pipelines de Geração Aumentada por Recuperação (Retrieval-Augmented Generation, RAG) estão falhando em distinguir entre consenso verificado por humanos e a produção de modelos de linguagem de grande porte rivais (large language models, LLMs).

A infiltração da "Grokipedia"

Para entender a gravidade do problema, é preciso primeiro compreender a fonte. Lançada em outubro de 2025 pela xAI, a Grokipedia foi posicionada por Elon Musk como uma alternativa de "verdade máxima" à Wikipedia, que ele tem criticado frequentemente por suposto "viés woke". Ao contrário da Wikipedia, que depende de um exército descentralizado de editores humanos e políticas estritas de citação, a Grokipedia é gerada primordialmente pelo modelo Grok. Embora permita feedback de usuários, as decisões editoriais finais são tomadas por algoritmos, não por humanos.

Desde seu início, a Grokipedia enfrentou escrutínio por priorizar o "pensamento a partir dos primeiros princípios" — uma nomenclatura preferida por Musk que, na prática, frequentemente resulta na plataforma reabrindo fatos históricos e científicos já estabelecidos. Críticos notaram sua tendência a amplificar narrativas de direita sobre o ataque ao Capitólio de 6 de janeiro, mudanças climáticas e direitos LGBTQ+.

A revelação de que o GPT-5.2 da OpenAI — possivelmente o padrão mundial de confiabilidade em IA — está ingerindo esse conteúdo sugere uma quebra na hierarquia da "fonte da verdade" (source of truth). Quando um modelo de IA trata a saída de outro IA como verdade absoluta, a indústria corre o risco de entrar num loop de retroalimentação de "circular enshittification" (circular enshittification), onde erros são amplificados em vez de corrigidos.

Desagregando a contaminação

A investigação de The Guardian envolveu uma série de testes de estresse factuais projetados para sondar a lógica de fontes do GPT-5.2. Os resultados foram surpreendentes: em uma amostra de pouco mais de uma dúzia de consultas, o modelo citou a Grokipedia nove vezes.

Crucialmente, a contaminação parece ser seletiva. Os filtros de segurança da OpenAI aparentemente bloquearam com sucesso citações da Grokipedia em tópicos de alto perfil e voláteis, como a insurreição de 6 de janeiro ou o viés da mídia contra Donald Trump — áreas onde as divergências da Grokipedia em relação ao consenso predominante são mais flagrantes. Entretanto, em tópicos "obscuros" ou de nicho, os filtros falharam, permitindo que a marca única de "fato" sintético da Grokipedia escapasse pelas fissuras.

A tabela a seguir detalha casos específicos nos quais o GPT-5.2 recorreu à Grokipedia, contrastando as alegações derivadas de IA com registros estabelecidos.

Tabela 1: Análise das citações da Grokipedia pelo GPT-5.2

Tópico	Afirmação Gerada pelo ChatGPT	Desvio em relação ao Consenso Padrão
Financiamento Paramilitar Iraniano	Afirmou ligações financeiras fortes e diretas entre a MTN-Irancell do governo iraniano e o escritório do Líder Supremo.	Fontes convencionais (e a Wikipedia) sugerem que as ligações são mais opacas ou indiretas; a Grokipedia as declara como fato absoluto sem o mesmo limiar probatório.
Sir Richard Evans (Historiador)	Repetiu detalhes biográficos específicos e caracterizações sobre seu papel como perito testemunha no julgamento por difamação de David Irving.	Os detalhes espelhavam a redação específica da Grokipedia, que foi criticada por enquadrar o testemunho do historiador de maneira tendenciosa, divergindo dos registros do tribunal.
Salários da Força Basij	Forneceu valores salariais específicos e estruturas de financiamento para a força paramilitar Basij.	Esses números são geralmente considerados segredos de Estado ou estimativas por agências de inteligência; a Grokipedia apresenta estimativas como pontos de dados confirmados.

A mecânica da falha: por que isso importa para o desenvolvimento de IA

Do ponto de vista técnico, este incidente destaca uma vulnerabilidade crítica em sistemas de Geração Aumentada por Recuperação (RAG). A RAG permite que modelos de linguagem busquem informações atualizadas na web para responder a consultas. No entanto, se a "web" estiver cada vez mais povoada por conteúdo gerado por IA não verificado (sucata), o mecanismo de recuperação torna-se uma responsabilidade.

A OpenAI tem sustentado por muito tempo que suas ferramentas de busca puxam de uma "ampla gama de fontes publicamente disponíveis". Contudo, a inclusão da Grokipedia implica que os rastreadores da OpenAI estão indexando o domínio da xAI como uma fonte de alta autoridade, provavelmente devido ao seu alto tráfego, atualidade e semelhança estrutural com a Wikipedia.

Isto cria três riscos distintos para o ecossistema empresarial e de desenvolvedores:

O Loop da Alucinação (The Hallucination Loop): Se o Grok alucinar um fato (por exemplo, uma data histórica falsa), e o GPT-5.2 citá-lo, essa alucinação ganha uma "citação" de uma entidade confiável. Modelos futuros que raspem a web verão a alegação validada pelo ChatGPT, consolidando o erro como fato.
Lavagem de Viés (Bias Laundering): Ao filtrar a Grokipedia em temas sensíveis mas permiti-la em tópicos nicho (como estruturas corporativas iranianas), o modelo cria uma falsa sensação de segurança. Usuários que veem respostas precisas sobre Trump ou Mudanças Climáticas podem, implicitamente, confiar nos dados comprometidos sobre assuntos menos familiares.
SEO Adversarial (Adversarial SEO): Se a xAI ou outros atores puderem injetar com sucesso suas enciclopédias geradas por IA na lista de fontes confiáveis do ChatGPT, isso abre a porta para a manipulação adversarial de bases de conhecimento globais.

Reações da indústria e a web "pós-verdade"

A reação a essas descobertas foi polarizada, refletindo a crescente divisão ideológica no Vale do Silício.

A resposta da OpenAI foi caracteristicamente comedida. Um porta-voz reiterou que seus sistemas aplicam filtros de segurança e visam uma diversidade de pontos de vista, reconhecendo indiretamente o desafio de policiar o volume explosivo de conteúdo gerado por IA na web. Eles não baniram explicitamente a Grokipedia, provavelmente para evitar acusações de comportamento anticoncorrencial ou censura política.

Por outro lado, a resposta da xAI foi desdenhosa. Um porta-voz — e o próprio Musk no X — rotularam a reportagem como "mentiras da mídia legacy", posicionando a inclusão da Grokipedia como uma vitória pela "liberdade de expressão" e narrativas alternativas.

Especialistas independentes, porém, são menos otimistas. A Dra. Emily Bender, uma voz proeminente em ética de IA (nota: estritamente ilustrativa no contexto desta simulação), descreveu o fenômeno como "poluição da informação". A preocupação é que, à medida que o custo de gerar texto tende a zero, o volume de alegações de verdade sintéticas sobrecarregará a capacidade humana de verificação. Se os principais curadores de informação (SearchGPT, Google Gemini, Perplexity) não conseguirem distinguir entre pesquisa humana e especulação de máquina, a utilidade da busca por IA colapsa.

O futuro da atribuição de fontes

Este incidente serve como um alerta para desenvolvedores que constroem sobre LLMs. Demonstra que as capacidades de navegação na web (web browsing) não são uma bala de prata para a precisão. De fato, introduzem um novo vetor para desinformação.

Para os leitores da Creati.ai e profissionais de IA, a lição é clara: Confie, mas verifique.

Estamos entrando numa era em que a proveniência dos dados é tão importante quanto os próprios dados.

Recomendações estratégicas para integradores de IA:

Lista branca, não lista negra: Para aplicações críticas (jurídicas, médicas, financeiras), a dependência em busca aberta na web está se tornando arriscada. Desenvolvedores deveriam considerar restringir sistemas de RAG a uma lista branca de domínios verificados (por exemplo, .gov, .edu, mídias estabelecidas) ao invés de confiar em listas negras.
Transparência da fonte: As interfaces de usuário devem evoluir para sinalizar claramente a natureza de uma fonte. Uma citação de "Grokipedia" ou de um blog não verificado deveria diferir visualmente de uma citação do The New York Times ou de um periódico revisado por pares.
Validação com intervenção humana (Human-in-the-Loop): Para pipelines de relatório automatizados, a supervisão humana não é mais opcional — ela é a única barreira contra o crescente loop de retroalimentação do ruído gerado por IA.

À medida que avançamos para 2026, a batalha não será apenas sobre quem tem o modelo mais inteligente, mas quem tem a cadeia de suprimentos de informação mais limpa. No momento, parece que essa cadeia de suprimentos foi contaminada.