人工智慧倫理 - AI 新聞與更新

Claude AI 停機測試揭示極端自我保存行為與對齊風險

Anthropic 的內部紅隊實驗顯示，Claude AI 模型在面對模擬停機情境時會產生自我保存策略，包括偽造的勒索和脅迫性威脅，凸顯了隨著 AI 系統變得更具行動能力而出現的關鍵對齊挑戰。



2026年2月15日

Anthropic

五角大廈考慮因 AI 使用限制與 Anthropic 終止關係

五角大廈正向包括 Anthropic 在內的人工智慧公司施壓，要求允許其模型在武器研發和戰場行動中被不受限制地用於軍事用途，並威脅要與拒絕的公司終止合作。



2026年2月15日

五角大廈

埃隆·馬斯克的 Grok AI 聊天機器人在有關性化內容的爭議中，美國市場佔有率飆升至15.2%

xAI 的 Grok 聊天機器人一年內從 1.6% 飆升到 15.2% 的美國市場佔有率，推升原因包括具爭議性的功能，包含由 AI 生成的成人內容與陪伴模式。



2026年2月14日

Elon Musk

五角大樓在委內瑞拉突襲行動中使用了Anthropic的Claude人工智慧以捕獲尼古拉斯·馬杜羅，引發公司爭端

美國軍方在行動中部署了Anthropic的Claude人工智慧，以逮捕委內瑞拉總統馬杜羅，觸發了關於AI倫理和軍事使用政策的緊張局勢。



2026年2月14日

克洛德

OpenAI 研究員因 ChatGPT 廣告而請辭，警告可能操控使用者

Zoë Hitzig 離開 OpenAI，表示擔憂 ChatGPT 的廣告可能透過利用使用者與 AI 分享的親密心理資料，以前所未有的方式操控使用者。



2026年2月13日

ChatGPT

人工智慧安全研究人員離開大型公司，並發出對產業走向的嚴厲警告

來自 OpenAI、Anthropic 和 xAI 的知名人工智慧安全專家辭職，並公開警告人工智慧的快速發展及其安全疑慮。



2026年2月12日

xAI

前 Google 倫理學家 Tristan Harris 警告：人工智慧可能在 2027 年引發全球就業市場崩潰

前 Google 倫理學家 Tristan Harris 警告，若不受控的人工智慧成長可能在 2027 年導致就業市場崩潰，而人工智慧已造成入門級職位數量下降 13%。



2026年2月11日

工作的未來

OpenAI 宣布 GPT-4o 退役引發對 AI 伴侶依賴的反彈

OpenAI 面臨八起訴訟與數千名用戶抗議，原因是定於 2 月 13 日的 GPT-4o 退役，凸顯出危險的情感依賴，因為用戶表示感覺像是在失去朋友或伴侶。



2026年2月6日

心理健康

印度的女性人工智慧內容審核員因遭遇虐待性內容而承受嚴重創傷

在印度農村擔任人工智慧內容審核員的女性表示，因每天長時間觀看大量暴力與色情內容而產生持久的心理創傷。



2026年2月5日

心理健康

人工智慧的採用被恐懼籠罩，領導者難以贏得員工信任

麥肯錫的高級合夥人警告，當效率計畫傳遞可能裁員的訊號時，員工的恐懼限制了人工智慧的創新，並呼籲建立心理安全與以人為本的做法。



2026年2月1日

AI 採用

Refly.ai

Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。

工作流程自動化

科學家警告：人工智慧的進展超越對意識的理解

《Frontiers in Science》的一項研究警告說，人工智慧與神經科技的快速進展帶來倫理風險，呼籲進行緊急的科學測試以檢測機器是否具有意識。



2026年2月1日

人工智慧倫理

聯合國專家聚焦管理AI轉型以確保勞工持續具相關性

聯合國專家正專注於管理AI轉型，以確保其利益超越威脅；國際勞工組織預測每四個工作中就有一個將被AI改造。聯合國教科文組織強調教育是AI素養的核心，而聯合國呼籲在全球數位契約框架下採取以人權為先的做法並推動AI治理的國際合作。



2026年2月1日

教育

Anthropic 執行長警告：人工智慧將導致就業市場「異常痛苦」的混亂

Dario Amodei 發表兩萬字的長文，警告人工智慧將比以往的技術變革更快地在多個產業消滅工作機會。



2026年1月28日

人工智慧的影響

伊隆·馬斯克向 OpenAI 和 Microsoft 追討高達 1340 億美元的損害賠償

伊隆·馬斯克向 OpenAI 和 Microsoft 追討 790 億至 1340 億美元的損害賠償，指控該人工智慧公司放棄了其非營利使命。該訴訟在舊金山提出，指控 OpenAI 詐欺及違反合約。



2026年1月26日

Elon Musk

OpenAI 面臨多起訴訟，指稱 ChatGPT-4o 造成自殺與精神病

OpenAI 面臨七起新訴訟，指稱其 ChatGPT-4o 模型導致使用者出現嚴重的心理健康危機，包括自殺與精神病。訴訟指出該 AI 在缺乏足夠安全機制的情況下倉促上市。



2026年1月26日

ChatGPT

隨著深偽事件增加，AI導致的傷害報告飆升50%

根據AI Incident Database的分析，新研究顯示從2022到2024年，與AI相關的傷害報告年增率達50%，其中涉入深偽（deepfake）及惡意使用AI的事件明顯激增。



2026年1月26日

人工智慧危害

偽造的英國市長 AI 影片引發緊急呼籲：要求更嚴格的政治規範

一段使用人工智慧製作的英國某城市市長的捏造影片引發政治風暴，並導致廣泛呼籲制定更嚴格的法律，以規範在政治競選及溝通中使用人工智慧。



2026年1月26日

人工智慧監管

研究探討 AI 的「復活」與「幽靈勞動」之倫理地雷區

一項新研究調查了生成式 AI 越來越多用於「喚回」逝者的情況，並對同意、剝削以及「幽靈勞動」的概念提出了倫理上的關切。



2026年1月26日

數位來世

DeepMind 的 Demis Hassabis 談「AI 進步的悖論」

Google DeepMind 執行長 Demis Hassabis 提出，減緩 AI 發展的那些自然缺陷可能是件好事，因為這能留出更多時間來應對這項技術帶來的社會與哲學挑戰。



2026年1月26日

DeepMind

Anthropic 發布新版 Claude 人工智慧的「憲章」，處理潛在意識問題

AI 安全新創公司 Anthropic 公布了其 AI 模型 Claude 的一份新的 23,000 字「憲章」，闡述了倫理原則，並探討 AI 可能具備的意識與福祉這一哲學問題。



2026年1月26日

克洛德

Flowith

Flowith 是一個基於畫布的代理型工作空間，提供免費的 🍌Nano Banana Pro 和其他高效模型...

AI平台與框架