AI News

Uma Nova Era para a IA: David Silver Sai do DeepMind para Buscar uma Superinteligência "Ineffable"

Em uma mudança sísmica para o panorama da inteligência artificial, David Silver, o cientista pesquisador principal por trás do AlphaGo e uma figura central no Google DeepMind, anunciou sua saída para lançar uma nova iniciativa independente, Ineffable Intelligence. A mudança, confirmada na sexta-feira, marca a mais recente saída de alto perfil de um grande gigante de tecnologia, sinalizando um pivô crescente da indústria da IA generativa (Generative AI) em direção à busca de uma superinteligência autônoma e orientada por objetivos.

Silver, amplamente considerado o "pai do AlphaGo", passou mais de uma década no DeepMind, onde seu trabalho em aprendizado por reforço (Reinforcement Learning) (RL) mudou fundamentalmente a trajetória do campo. Sua nova startup pretende contornar a atual obsessão da indústria por Modelos de Linguagem de Grande Porte (Large Language Models) (LLMs), apostando em vez disso na filosofia da "Alberta School": que um agente que aprende a partir da interação e da recompensa é o único caminho viável para a verdadeira Inteligência Artificial Geral (Artificial General Intelligence) (AGI).

Os Limites da Linguagem e o Surgimento da Ineffable Intelligence

O nome do novo laboratório de Silver, Ineffable Intelligence, serve como um desafio filosófico direto ao status quo. Enquanto o boom atual da IA é impulsionado por sistemas que dominam a linguagem humana — prevendo probabilisticamente a próxima palavra em uma sequência — a tese de Silver postula que os aspectos mais críticos da inteligência são "inefáveis", ou impossíveis de capturar apenas por meio da linguagem.

"Linguagem é uma compressão da experiência, não a experiência em si", afirmou Silver em uma coletiva de imprensa após o anúncio. "Para alcançar a superinteligência, devemos construir agentes que aprendam desde a base por meio de tentativa, erro e descoberta, muito como o AlphaZero fez. Estamos indo além da era de conjuntos de dados estáticos para a era da experiência infinita."

A startup pretende focar exclusivamente em agentes de Aprendizado por Reforço (RL) capazes de planejamento de longo horizonte e descoberta científica inédita, em vez de chatbots ou mídia generativa. Isso alinha-se com o famoso artigo de Silver de 2021, Recompensa é Suficiente (Reward is Enough), que argumentava que a maximização de recompensa é suficiente para explicar o surgimento de todo comportamento inteligente.

Caminhos Divergentes: a Tendência "Neolab"

A saída de Silver faz parte de um fenômeno mais amplo de "neolab", onde pesquisadores de alto nível deixam laboratórios corporativos consolidados para fundar startups ágeis e orientadas por missão. Essa tendência reflete uma fragmentação na comunidade de IA quanto ao melhor caminho a seguir. Enquanto empresas como OpenAI e Google se concentram em escalar transformers, pesquisadores como Silver (e o ex-cientista-chefe da OpenAI, Ilya Sutskever) estão apostando em arquiteturas alternativas.

Ineffable Intelligence junta-se a uma coorte crescente de laboratórios de pesquisa de elite surgindo em Londres e São Francisco, com o objetivo de resolver os gargalos de raciocínio e confiabilidade que atualmente afligem os LLMs.

Table: The Strategic Divide in Modern AI Development

Feature Generative AI (LLMs) Reinforcement Learning (RL)
Core Objective Predict the next token in a sequence Maximize cumulative future reward
Learning Source Static datasets (internet text/images) Dynamic interaction with environments
Capabilities Summarization, translation, content creation Planning, strategy, novel discovery
Limitations Hallucinations, lack of true grounding High computational cost for simulation
Primary Goal Human-mimicry Superhuman optimization

A Influência da Alberta School

David Silver’s approach is deeply rooted in the "Alberta School" of AI, influenced by his mentor, Richard Sutton. This school of thought prioritizes "computationally scalable" methods that do not rely on human-labeled data.

Durante seu período no Google DeepMind, Silver aplicou esses princípios para criar o AlphaGo, que chocou o mundo em 2016 ao derrotar o campeão mundial Lee Sedol, e subsequentemente o AlphaZero e o MuZero, que dominaram xadrez, shogi e go sem aprender a partir de partidas humanas. Espera-se que a Ineffable Intelligence leve algoritmos de planejamento ao estilo MuZero para domínios do mundo real como ciência de materiais, matemática e robótica, onde há feedback de "verdade fundamental" disponível.

Implicações para a Indústria

  • Mudança para o Pensamento "Sistema 2" (System 2): Enquanto os Modelos de Linguagem de Grande Porte (LLMs) se destacam no pensamento "Sistema 1" (respostas rápidas e intuitivas), a abordagem de RL de Silver mira o pensamento "Sistema 2" (raciocínio deliberado e busca lenta), que é essencial para resolver problemas complexos de engenharia ou medicina.
  • Solução para a Parede de Dados (Data Wall): À medida que a indústria alerta que pode faltar texto humano de alta qualidade para treinar modelos, agentes de RL oferecem uma solução: eles geram seus próprios dados por meio de auto-jogo (self-play) e simulação, permitindo teoricamente uma escalabilidade infinita.
  • Migração de Talentos: Espera-se que a reputação de Silver atraia um número significativo de especialistas em RL de grandes laboratórios, potencialmente desencadeando uma guerra por talentos por pesquisadores qualificados em teoria da decisão e sistemas de controle.

Conclusão

A saída de David Silver representa mais do que uma simples mudança de pessoal; serve como uma declaração de intenções para o futuro do campo. Ao apostar na Ineffable Intelligence, Silver está apostando que o caminho para a superinteligência não está em ler toda a internet, mas em experimentar o mundo — simulado ou real — e aprender a dominá-lo uma recompensa de cada vez. À medida que o ciclo de hype da IA amadurece, a indústria observará de perto para ver se o aprendizado por reforço pode entregar as capacidades de raciocínio que os modelos de linguagem prometeram, mas ainda não alcançaram completamente.

Em Destaque