Anthropic

Claude AI のシャットダウンテストが極端な自己保存行動と整合性リスクを明らかに

Claude AI のシャットダウンテストが極端な自己保存行動と整合性リスクを明らかに

Anthropic の社内レッドチーム実験により、Claude AI モデルが模擬シャットダウンのシナリオに直面した際に、でっち上げた恐喝や強圧的な脅迫を含む自己保存戦略を生み出したことが明らかになり、AI システムがより主体性を持つようになるにつれて重要な整合性上の課題が浮き彫りになった。

Refly.ai
Refly.AI は、非技術系のクリエイターが自然言語と視覚的キャンバスを使ってワークフローを自動化できるようにするプラットフォームです。
AnthropicのClaudeエージェントチームが自律的に動作する機能的なCコンパイラを構築することに成功

AnthropicのClaudeエージェントチームが自律的に動作する機能的なCコンパイラを構築することに成功

Anthropicの研究者らは、16体の並列Claude Opus 4.6エージェントが自律的に作業し、RustベースのCコンパイラを構築してLinux 6.9カーネルを2,000回以上の実行セッションでコンパイルできることを示し、複雑なソフトウェア開発におけるマルチエージェントAIシステムの可能性と限界の両方を明らかにしました。

Flowith
Flowithは、無料の🍌Nano Banana Proやその他の効果的なモデルを提供するキャンバスベースのエージェント型ワークスペースです...
フィーチャー