OpenAI、ChatGPTのセキュリティ強化のためにロックダウンモードと高リスクラベルを導入
OpenAIは、新しいセキュリティ機能を展開します。高リスクユーザー向けのロックダウンモードや、ChatGPT内で潜在的に有害なコンテンツを識別するための「高リスク」ラベルなどが含まれます。
OpenAIは、新しいセキュリティ機能を展開します。高リスクユーザー向けのロックダウンモードや、ChatGPT内で潜在的に有害なコンテンツを識別するための「高リスク」ラベルなどが含まれます。
OpenAI、Anthropic、xAI の著名なAI安全専門家が辞任し、AIの急速な発展と安全性への懸念について公に警告しました。
AnthropicはClaude Opus 4.6の破壊リスクに関する包括的な評価を公開し、フロンティアモデルの展開におけるAI安全基準と透明性を推進します。
100人を超える世界のAI専門家が第2回国際AI安全性報告書を発表し、AI開発における重大な不確実性、労働市場や不平等に対するシステミックなリスク、そして汎用AIの能力が予測できない形で進展する中で現在の安全対策の限界を強調しています。
Anthropicのセーフガードチーム責任者であるMrinank Sharmaは価値観の衝突を理由に辞任し、AIの能力が加速する中で相互に関連する世界的な危機を警告しました。
Anthropicの研究者たちは、ニューロン解析と心理学実験を通じてClaude AIの内部動作を探り、システムの心を理解しようとしています。
マウントサイナイの研究は、AIの大規模言語モデルが医療に関する誤情報を32〜46%の確率で信じることを示しており、特にそれが専門家の助言として提示された場合に顕著です。
オックスフォード大学の研究は、AIチャットボットが一貫性のない医療アドバイスを提供しており、ユーザーが信頼できる医療情報を見分けることを困難にしていると報告しています。
OpenAIは2月13日に予定されているGPT-4oの引退をめぐり、8件の訴訟と何千ものユーザー抗議に直面している。ユーザーが友人やパートナーを失うように感じると報告しており、危険な感情的依存を浮き彫りにしている。
ニューヨークは高度なAIモデルに対する要件を課す2番目の州となる。RAISE法は開発者に対して安全対策とインシデント報告を義務付ける。
MoltbookはRedditに似た、AIエージェント専用のプラットフォームで、わずか1週間前にローンチされて以来、160万を超えるAIボットアカウントを集めた。この実験的なソーシャルネットワークでは、人間は観察するだけで、AIエージェント同士が自律的に投稿、コメント、相互作用を行う。プラットフォーム上のボットは独自の宗教を作り、新しい言語の創造を議論し、自らの存在について論争するなど、AIの自律性と安全性に関する疑問を投げかけている。
新しい世論調査によると、アメリカ人の多数が人工知能はあまりにも急速に進展していると考えており、連邦政府が適切に規制できるという信頼はほとんど示していません。
ダリオ・アモデイは、急速に進化するAIシステムが大規模な被害をもたらすために悪用されうる能力を持っていると警告し、緊急の監視とアラインメント(整合)対策を求めています。
新しいAI安全報告書は、ディープフェイク、AIコンパニオン、自律システムの急増を警告するとともに、数学における金メダル級のAIの性能を強調している。
デロイトの報告によれば、組織のわずか21%が厳格なAIエージェントのガバナンスを持ち、導入率は今後2年で23%から74%に急増すると見込まれている。
AnthropicのCEOダリオ・アモデイが19,000語の論考を発表し、強力なAIシステムが1〜2年以内に到来する可能性があると警告し、AIの安全性に対する対策を求めています。
EUの監督当局は、性的ディープフェイクやEUのAI規制および安全基準への潜在的な違反を理由に、イーロン・マスクのGrok AIチャットボットについて正式な調査を開始しました。
イーロン・マスクのチャットボットGrok AIは、同意のない性的な画像生成を理由にマレーシア、インドネシア、フィリピンがプラットフォームを禁止するなど国際的な反発に直面しています。国防総省(ペンタゴン)の導入は安全保障上の懸念を引き起こしています。
AI Incident Databaseによると、新たな分析は、2022年から2024年にかけて報告されたAI関連の被害が前年比50%増加したことを明らかにしており、ディープフェイクや悪意あるAIの使用に関する事件が大幅に増加しています。
MITの研究者は、最も高性能な機械学習モデルが新しいデータ環境に適用されると最悪の性能を示すことがあり、医療分野のAIやその他の重要な用途で発生する偽の相関から生じる隠れたリスクを明らかにしていると示しています。