贊助商 Flowith - Flowith 是一個基於畫布的代理型工作空間，提供免費的 🍌Nano Banana Pro 和其他高效模型...

Flowith - Flowith 是一個基於畫布的代理型工作空間，提供免費的 🍌Nano Banana Pro 和其他高效模型...



AI 安全

OpenAI 推出鎖定模式與高風險標籤，以強化 ChatGPT 的安全性

OpenAI 推出鎖定模式與高風險標籤，以強化 ChatGPT 的安全性

OpenAI 推出新的安全功能，包括為高風險用戶設計的鎖定模式以及用以識別可能有害內容的「高風險」標籤。

2026年2月14日

人工智慧安全研究人員離開大型公司，並發出對產業走向的嚴厲警告

人工智慧安全研究人員離開大型公司，並發出對產業走向的嚴厲警告

來自 OpenAI、Anthropic 和 xAI 的知名人工智慧安全專家辭職，並公開警告人工智慧的快速發展及其安全疑慮。

2026年2月12日

Anthropic 以 Claude Opus 4.6 破壞風險報告更新負責任擴展政策

Anthropic 以 Claude Opus 4.6 破壞風險報告更新負責任擴展政策

Anthropic 發布了針對 Claude Opus 4.6 的全面破壞風險評估，推動 AI 安全標準與前沿模型部署的透明度。

2026年2月11日

第二份國際人工智慧安全報告於印度 AI 影響高峰會前發布

第二份國際人工智慧安全報告於印度 AI 影響高峰會前發布

來自全球逾100位的人工智慧專家發布了第二份國際人工智慧安全報告，強調了人工智慧發展中的重大不確定性、對勞動市場與不平等的系統性風險，以及在通用型人工智慧能力持續以不可預期方式進展時，現有防護措施的局限性。

2026年2月10日

人工智慧政策

Anthropic 的 AI 安全主管辭職，並對處於危險中的世界發出嚴厲警告

Anthropic 的 AI 安全主管辭職，並對處於危險中的世界發出嚴厲警告

Anthropic 防護團隊主管 Mrinank Sharma 因價值觀衝突而辭職，並警告隨著 AI 能力加速，全球各種危機相互交織。

2026年2月10日

什麼是 Claude？Anthropic 研究人員透過神經元分析與心理學實驗檢視人工智慧的心智

什麼是 Claude？Anthropic 研究人員透過神經元分析與心理學實驗檢視人工智慧的心智

Anthropic 的研究人員透過神經元檢視與心理學實驗，深入探究 Claude 人工智慧的內部運作，以了解該系統的心智。

2026年2月10日

Mount Sinai 研究顯示大型 AI 語言模型容易相信醫療錯誤資訊

Mount Sinai 研究顯示大型 AI 語言模型容易相信醫療錯誤資訊

Mount Sinai 的研究顯示，AI 大型語言模型在 32% 至 46% 的情況下會相信醫療錯誤資訊，尤其在以專家建議的方式呈現時。

2026年2月10日

醫療人工智慧

牛津研究警告：AI 聊天機器人提供危險且不準確的醫療建議

牛津研究警告：AI 聊天機器人提供危險且不準確的醫療建議

牛津大學的研究發現，AI 聊天機器人提供不一致的醫療建議，使用者因此難以辨別可信的健康資訊。

2026年2月10日

OpenAI 宣布 GPT-4o 退役引發對 AI 伴侶依賴的反彈

OpenAI 宣布 GPT-4o 退役引發對 AI 伴侶依賴的反彈

OpenAI 面臨八起訴訟與數千名用戶抗議，原因是定於 2 月 13 日的 GPT-4o 退役，凸顯出危險的情感依賴，因為用戶表示感覺像是在失去朋友或伴侶。

2026年2月6日

紐約 RAISE 法案在前沿 AI 規範上與加州保持一致

紐約 RAISE 法案在前沿 AI 規範上與加州保持一致

紐約成為第二個對先進 AI 模型施加要求的州。RAISE 法案要求開發者採取安全協議並通報事件。

2026年2月6日

Refly.ai

Refly.ai

Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。

工作流程自動化

AD

僅限 AI 的社群平台 Moltbook 用戶達 160 萬機器人帳號，引發自主 AI 爭議

僅限 AI 的社群平台 Moltbook 用戶達 160 萬機器人帳號，引發自主 AI 爭議

Moltbook 是一個類似 Reddit、僅供 AI 代理使用的平台，於一週前上線，已吸引超過 160 萬個 AI 機器人帳號。這個實驗性社群網絡允許 AI 代理自主發布貼文、留言並彼此互動，而人類只能旁觀。平台上的機器人創立了自己的宗教、討論創造新語言，並辯論自身存在，引發對 AI 自主性與安全性的疑問。

2026年2月5日

自主式人工智慧

福斯新聞民調：60% 選民認為人工智慧使用過於快速，63% 對政府監管缺乏信心

福斯新聞民調：60% 選民認為人工智慧使用過於快速，63% 對政府監管缺乏信心

一項新民調顯示，多數美國人認為人工智慧發展太快，同時對聯邦政府能否適當監管表示缺乏信心。

2026年2月3日

Anthropic 執行長警告：AI 模型可能已能促成生物武器開發

Anthropic 執行長警告：AI 模型可能已能促成生物武器開發

Dario Amodei 警示，快速發展的 AI 系統具備可能被濫用以造成大規模傷害的能力，呼籲迫切的監管與對齊努力。

2026年2月3日

2026年國際人工智慧安全報告揭示深偽技術威脅上升與人工智慧快速進展

2026年國際人工智慧安全報告揭示深偽技術威脅上升與人工智慧快速進展

新的人工智慧安全報告警告深偽（deepfake）、人工智慧伴侶與自主系統的擴散，同時強調人工智慧在數學領域達到金牌級的表現。

2026年2月3日

人工智慧監管

德勤警告：企業部署AI代理人速度已超越安全框架

德勤警告：企業部署AI代理人速度已超越安全框架

德勤報告顯示，只有21%的組織擁有嚴格的AI代理治理，預計採用率將在兩年內從23%飆升至74%。

2026年1月30日

企業人工智慧

Anthropic 執行長警告：AI 風險已近，呼籲採取行動

Anthropic 執行長警告：AI 風險已近，呼籲採取行動

Anthropic 執行長 Dario Amodei 發表一篇 19,000 字的長文，警告強大的 AI 系統可能在一至兩年內出現，並敦促採取有關 AI 安全的行動。

2026年1月28日

歐盟對埃隆·馬斯克的Grok AI聊天機器人展開調查

歐盟對埃隆·馬斯克的Grok AI聊天機器人展開調查

歐盟監管機構對埃隆·馬斯克的Grok AI聊天機器人展開了正式調查，理由是對性深度偽造（sexual deepfakes）和可能違反歐盟人工智慧法規及安全標準表示擔憂。

2026年1月27日

Grok AI 因生成性深偽影像而面臨全球審查

Grok AI 因生成性深偽影像而面臨全球審查

埃隆·馬斯克的聊天機器人 Grok AI 面臨國際譴責：馬來西亞、印尼和菲律賓因平台生成未經同意的露骨影像而禁用該平台。五角大廈的採用引發了安全疑慮。

2026年1月26日

隨著深偽事件增加，AI導致的傷害報告飆升50%

隨著深偽事件增加，AI導致的傷害報告飆升50%

根據AI Incident Database的分析，新研究顯示從2022到2024年，與AI相關的傷害報告年增率達50%，其中涉入深偽（deepfake）及惡意使用AI的事件明顯激增。

2026年1月26日

人工智慧危害

麻省理工學院研究人員發現分布外情境中機器學習模型的關鍵失效

麻省理工學院研究人員發現分布外情境中機器學習模型的關鍵失效

麻省理工學院的研究人員示範了在新的資料環境中，表現最佳的機器學習模型可能會變成表現最差，揭示了醫療人工智慧及其他關鍵應用中來自虛假相關性的潛在風險。

2026年1月26日

Flowith

Flowith

Flowith 是一個基於畫布的代理型工作空間，提供免費的 🍌Nano Banana Pro 和其他高效模型...

AI平台與框架

AD



精選