AnthropicのAI安全責任者が辞任、世界が危機に瀕しているとの厳しい警告

Anthropicのセーフティ部門責任者が退任：「危機の淵にある世界」への警告がAI業界を震撼させる

Creati.ai 編集チーム
2026年2月10日

人工知能（AI）コミュニティに衝撃が走る中、Anthropicのセーフガード研究チームの責任者であるムリナンク・シャルマ（Mrinank Sharma）氏が辞任した。月曜日にX（旧Twitter）上で難解かつ哲学的な書簡を通じて発表された彼の退職は、同社の最新フラッグシップモデルであるClaude Opus 4.6のリリースからわずか数日後のことだった。シャルマ氏の去り際は単なる人事異動ではなく、世界をリードするAI研究所内における商業的スケーリングと倫理的整合性（Ethical Alignment）の間の激化する緊張を物語る、極めて重要なシグナルとなっている。

技術的なベンチマークよりも詩人のライナー・マリア・リルケやウィリアム・スタッフォードを引用したシャルマ氏の辞職願は、「連鎖的な危機」に直面する「危機の淵にある世界」について警告した。「憲法的AI（Constitutional AI）」と安全性優先の開発という約束のもとに設立されたAnthropicのような企業にとって、3,500億ドルの時価評価に向けたプッシュの最中に主要なセーフガードのリーダーを失うことは、業界の軌道について不穏な問いを投げかけている。

「危機の淵にある世界」の書簡：警告を読み解く

その辞表には、シリコンバレーの退職時にしばしば見られる標準的な企業向けの社交辞令は目立って欠けていた。代わりに、シャルマ氏は世界の現状と、その中でのテクノロジーの役割について厳かな考察を述べた。彼は、人類は「結果に直面しないよう、世界に影響を与える能力と同等に私たちの知恵が成長しなければならない閾値」に近づいていると明確に述べた。

この言葉は、シャルマ氏の懸念が技術的な失敗や「ハルシネーション（Hallucination：幻覚）」を超えたものであることを示唆している。彼は、加速するAIの能力と、それらを抑制するための社会構造との間にある、より深く実存的な不一致を指摘している。

辞任声明の主な抜粋は以下の通り：

グローバルな危機について： 世界は単なるAIのリスクだけでなく、AIが既存の脆弱性を悪化させる「ポリクライシス（Polycrisis：複合危機）」に直面しているという警告。
人類について： AIアシスタントがどのように私たちの人間性を損なわせ、あるいは歪めるかを調査する彼の最終プロジェクトへの具体的な言及。
知恵 vs 権力： 私たちのテクノロジー的な影響力が、道徳的および知的な成熟を追い越しているという主張。

価値観の衝突：内部の葛藤

おそらくシャルマ氏の声明の中で最も痛烈な部分は、プレッシャーの下で原則を遵守することの難しさに関する告白だろう。「価値観に自らの行動を真に支配させることがいかに難しいかを、私は繰り返し目にしてきた」とシャルマ氏は記している。「それは自分自身の中でも、そして最も重要なことを脇に置くよう常にプレッシャーにさらされている組織の中でも見てきたことだ」

この告白は、Anthropicのブランドアイデンティティの核心を突くものである。安全上の懸念からOpenAIを去った元従業員らによって設立されたAnthropicは、スピードのために安全性を妥協しない「大人の対応ができる研究所」として自らを位置づけてきた。しかし、シャルマ氏の退任は、Claude Opus 4.6のリリースと巨額の資本注入によって利害が高まるにつれ、内部文化が変化している可能性を示唆している。

業界のアナリストは、シャルマ氏が挙げた「プレッシャー」は、GPT-5.3-Codexやその他の新興の巨人に対抗するために競争力のあるモデルを出荷する必要性である可能性が高いと推測している。3,500億ドルの時価評価を追求するには、厳格なセーフガード研究に必要な緩やかで慎重なペースとは相反する、積極的な製品ロードマップが求められるからだ。

AIセーフティにおける相次ぐ離脱のパターン

ムリナンク・シャルマ（Mrinank Sharma）氏は孤立したケースではない。彼の辞職は、プロトコルよりも製品の優先順位付けに関する同様の懸念を理由に、トップクラスのAI企業を去るセーフティ研究者の増加傾向に続くものである。つい先週も、Harsh Mehta氏（R&D）や主任科学者のBehnam Neyshabur氏を含む、Anthropicの他の著名な人物たちが「新しい何かを始める」ために退職することを発表した。

この大量離脱は他の研究所における過去の退職事例を反映しており、AIシステムの「ブレーキ」を構築する任務を負った個人が、車両から完全に降りざるを得ないと自覚するという懸念すべきパターンを生み出している。

表：最近の著名な AIセーフティ担当者の離脱と背景

名前	役割	組織	理由 / 背景
Mrinank Sharma	セーフガードチーム責任者	Anthropic	スケーリングのプレッシャーの中、価値観の衝突と「危機の淵にある世界」を理由に挙げる。 Claude Opus 4.6の発表数日後に発生。
Harsh Mehta	R&D研究員	Anthropic	内部の変化の中、「新しい何かを始める」ために退職を発表。技術系人材の広範な離脱の一部。
Behnam Neyshabur	主任AI科学者	Anthropic	他の研究者と同時に離脱。研究の方向性における潜在的な戦略的相違を示唆。
歴史的前例	シニア・セーフティ・リード	OpenAI / Google DeepMind	過去数年間、製品出荷を優先したセーフティチームの軽視を理由に、同様の離脱（例：Jan Leike氏、Ilya Sutskever氏）が見られた。

商業的背景：Claude Opus 4.6

この辞任のタイミングは極めて重要である。Anthropicは最近、優れたエージェンティック・コーディング（Agentic Coding）性能とオフィス生産性の向上を謳ったモデル、Claude Opus 4.6を投入したばかりだ。技術的なレビューはこのモデルの能力を賞賛しているが、そのリリースの速さは精査の対象となっている。

シャルマ氏の辞任を受けたオンライン上の議論は激しさを増している。X上の技術専門家やコメンテーターは彼の投稿を分析し、Opus 4.6を出荷するためのプッシュには安全性の閾値に関する妥協が含まれていたのではないかと推測している。あるバイラル化したコメントは次のように指摘している。「ガードレールを構築している人々と、収益目標を構築している人々は同じ組織図の中にいるが、彼らが最適化しようとしている変数は異なっている」

懸念されるのは、「安全性」がエンジニアリング上の制約ではなく、マーケティング用語になりつつあることだ。もしセーフガードの責任者が、組織が「最も重要なことを脇に置いている」と感じているのであれば、Claudeの挙動を支配しているはずの「憲法的AI」の枠組みの信頼性に疑問を投げかけることになる。

AIガバナンスへの影響

シャルマ氏の退任は、AI業界における自主規制の現状を測る指針となる。もし、主要な研究所の中で最も安全意識が高いとされるAnthropicが、価値観の衝突によってセーフガードのリーダーシップを維持するのに苦労しているのだとすれば、市場のインセンティブの重みの下で、自発的なコーポレートガバナンスが失敗しつつある可能性を示唆している。

辞任によって浮き彫りになった主な課題：

脱人間化のリスク： AIがどのように人間性を歪めるかというシャルマ氏の焦点は、物理的な安全性（生物兵器など）を超えて、心理的・社会的な害にまで及ぶリスクを示唆している。
展開のスピード： モデルの開発サイクルと安全性研究のサイクルの乖離が広がっている。
資本の圧力： 時価評価が数千億ドルに達する中、投資家に対する受託者責任が、人類に対する道徳的義務と衝突している。

結論

ムリナンク・シャルマ氏の辞任は、単なる人事発表ではない。それは静かな部屋で鳴らされた警笛である。Anthropicが急速な拡大を続け、世界がClaude Opus 4.6のようなツールを受け入れる中、シャルマ氏が提起した知恵、価値観、そして「危機の淵にある世界」に関する問いは、答えが出ないまま残されている。Creati.aiでは、業界がこの警告に耳を傾けるのか、それともそれを無視して加速するのかを、引き続き注視していく。