DeepMindのベテラン、デイビッド・シルバーがLLMなしで超知能を構築するために10億ドルのシード資金を調達

DeepMindのベテラン、David Silver氏がLLMを使わずに超知能（Superintelligence）を構築するため、10億ドルのシードラウンドを調達

汎用人工知能（Artificial General Intelligence：AGI）の追求における潜在的なパラダイムシフトを示唆する動きとして、AlphaGoやAlphaZeroの開発を主導した著名な研究者、David Silver氏が、自身の新会社であるIneffable Intelligenceのために、歴史的な10億ドルのシードラウンドを調達していると報じられています。ロンドンを拠点とするこのスタートアップは、約40億ドルの評価額でステルス状態から姿を現し、業界が現在固執している大規模言語モデル（Large Language Models：LLMs）に対抗する賭けに出ています。その目的は、純粋な強化学習（reinforcement learning）を通じて超知能を実現することです。

このラウンドはSequoia Capitalが主導しており、Nvidia、Google、Microsoftを含むテック大手との出資交渉も進められていると伝えられています。もし完了すれば、この取引は欧州のテクノロジーセクター史上最大のシード資金調達ラウンドとなり、Silver氏の実績と、AIの未来に対する彼の逆張り的なテーゼに投資家がいかに大きな比重を置いているかを浮き彫りにすることになります。

「言い表せない（Ineffable）」直感への10億ドルの賭け

まだ製品をリリースしていない企業に対する10億ドルという巨額の資金注入は、激化する世界的なAI軍拡競争の利害を反映しています。OpenAIやAnthropicのような確立されたプレーヤーにとって数十億ドルのラウンドは一般的になりましたが、この規模のシードラウンドは前代未聞です。これは、ベンチャーキャピタリストたちが、単なるテキストベースのモデルのスケーリングを超えた、資本集約的なAI開発の分岐点に備えていることを示唆しています。

Ineffable Intelligenceはロンドンに本社を置いており、この決定はフロンティアAI研究の重要な拠点としての英国の地位を大きく強化するものです。この案件に近い関係者によると、SequoiaのパートナーであるAlfred Lin氏とSonya Huang氏は、自らロンドンに赴いて契約を確保したとのことで、Google DeepMindのような主要な研究所を去るトップクラスの技術的才能を支援しようとするVC間の激しい競争を際立たせています。

テーゼ：模倣よりも経験を

David Silver氏の評価は、これまで不可能と考えられていたことを達成したシステムを構築したという、具体的で強力な歴史に基づいています。AlphaGoのリード研究者として、彼は2016年に自身の創造物が世界チャンピオンに18回輝いた李世ドル（Lee Sedol）氏を圧倒するのを見守りました。その後、彼はAlphaZeroでその功績を塗り替えました。AlphaZeroは人間のデータを一切使わず、自己対局のみを通じて学習することで、囲碁、チェス、将棋をマスターしました。

この歴史がIneffable Intelligenceの知的な基盤となっています。Silver氏の中心的な主張は、GPT-4やGeminiのような現在の業界標準であるLLMは、人間のデータの模倣に依存しているため、根本的に限界があるというものです。LLMはインターネット上のテキストで訓練されているため、人類の集合知や推論の誤りによって境界が定められています。知能を近似することはできますが、人間の能力を容易に超越することはできません。

Ineffable Intelligenceは、真の超知能には**強化学習（Reinforcement Learning：RL）**が必要であると主張しています。このパラダイムでは、エージェントは世界について読むことによって学ぶのではなく、世界と対話することによって学びます。つまり、行動を提案し、結果を観察し、報酬に基づいて戦略を更新するのです。この手法はしばしば「システム2（System 2）」思考や「探索」と呼ばれ、AIが人間には決して思いつかないような斬新な解決策を発見することを可能にします。それはちょうど、AlphaGoが放った「Move 37（37手目）」のように、人間のプレイヤーなら誰もしなかったであろう、しかし勝利を決定づけた一手と同じです。

表：超知能への分岐する道

以下の表は、普及しているLLMのアプローチと、Silver氏が焦点を当てるRLの手法の根本的な違いをまとめたものです。

特徴	大規模言語モデル（LLMs）	強化学習（RL）
主なデータソース	静的なデータセット（インターネット上のテキスト、書籍）	動的な経験（シミュレーション、自己対局）
学習メカニズム	パターンマッチングと次トークン予測	報酬フィードバックを伴う試行錯誤
能力の天井	人間の知識の総和に限定される	理論上は上限なし。人間の限界を超えることが可能
推論スタイル	直感的、「システム1」（速い）	熟考的、「システム2」（遅い、探索ベース）
主な弱点	ハルシネーション（幻覚）、真の接地感の欠如	計算コスト、オープンな環境での困難さ

「経験の時代」

Silver氏は以前、RLの先駆者であるRichard Sutton氏と共同執筆した「経験の時代（Era of Experience）」という論文の中で、このビジョンを学術界で表明していました。彼らは、AIの次の飛躍はモデルにより多くのトークンを与えることからではなく、エージェントが「あらゆる知識の基礎を自己発見する」ことから生まれると主張しました。

Ineffable Intelligenceにとっての課題は、ボードゲームという閉鎖的で完全情報の環境で成功したAlphaZeroを、現実世界の混沌とした自由度の高い複雑さに適用することです。これこそが、資金需要がこれほどまでに高い理由でしょう。汎用的なRLエージェントを訓練するのに十分な堅牢性を備えた「ワールドモデル（世界モデル）」やシミュレーションを構築するには、最大のLLMを訓練するためのインフラコストに匹敵する膨大な計算リソースが必要となります。

アーキテクトたちの脱出

Silver氏のGoogle DeepMindからの離職は、確立されたAI研究所からの著名な人物たちの離脱という、より広範なトレンドの一部です。巨大企業の中で官僚主義が強まるにつれ、基礎技術を構築した科学者たちは、妥協のない単一のAGIビジョンを追求するためにスピンアウトしています。

この動きは、新しいクラスの「スーパーシード（Super-Seed）」スタートアップを生み出しました。これらはAI界の著名人によって設立された企業で、伝統的なベンチャーのステージを飛び越し、必要な計算クラスターを購入するために即座に数十億ドルを調達します。

表：AIスピンオフの新たなフロンティア

以下の表は、Ineffable Intelligenceと、元テック大手の研究者によって率いられている他の注目すべきベンチャーを比較したものです。

スタートアップ名|創業者|出身ラボ|核となる哲学
---|---|----
Ineffable Intelligence|David Silver|Google DeepMind|純粋な強化学習（超人間的）
Safe Superintelligence (SSI)|Ilya Sutskever|OpenAI|AGIに向けた安全性優先のスケーリング
Thinking Machines Lab|Mira Murati|OpenAI|高度なAI製品と研究
xAI|Elon Musk|様々|真実の探究、最大の好奇心

市場への影響と将来の展望

Ineffable Intelligenceの立ち上げは、現在のAI分野のリーダーたちに多大なプレッシャーを与えています。もしSilver氏が正しければ、LLMのスケーリングによる収穫逓減はやがて明らかになり、業界はRLベースのアプローチへと急激に転換する可能性があります。これは、計算の「スケーリング則（Scaling laws）」を、テキスト処理のためではなく、経験をシミュレートするためという異なる方向で検証することになるでしょう。

欧州にとって、これは画期的な瞬間です。Silver氏のような才能を引き留め、ロンドンを拠点とする事業体に10億ドルの投資を確保したことは、フロンティアAI開発のすべてがサンフランシスコに向かう運命にあるという筋書きを覆すものです。

しかし、前途には技術的なリスクが潜んでいます。強化学習は、ゲーム環境以外では安定させることが極めて難しいことで知られています。もしIneffable Intelligenceが成功すれば、単に優れたチャットボットを作るだけでなく、人間の認知限界を超える独立した科学的発見や戦略的計画が可能なシステムを構築することになるでしょう。もし失敗すれば、コンピュータサイエンス史上、最も高価な実験の一つとなるはずです。

このラウンドの交渉が最終段階に入る中、Nvidiaのような戦略的バックアップ企業の関与は、Silver氏のビジョンを支えるためのハードウェアインフラがすでに整えられつつあることを示唆しています。AGIへの競争は事実上、2つのレーンに分かれました。一方は、人間がどのように考えるかを学ぶためにインターネットを読んでいる人々、もう一方は、人間ができることよりも優れた考え方を学ぶために、自分自身に対してゲームをプレイしている人々です。