人工智慧安全

Anthropic 的 Claude Code 原始碼在 GitHub 上外洩，數千個儲存庫被下架

Anthropic 意外曝光了 Claude Code 的 512,000 行原始碼；該公司在一場具爭議的 DMCA 大規模清理中下架了 GitHub 上數千個儲存庫。



2026年4月2日

Claude 程式碼

LiteLLM 在遭受惡意軟體攻擊與偽造認證指控後與合規新創 Delve 決裂

人氣 AI 門戶新創公司 LiteLLM 已公開切斷與合規供應商 Delve 的關係，因發生竊取憑證的惡意軟體事件，並有吹哨者指控 Delve 捏造合規稽核資料。



2026年3月31日

合規

RSAC 2026：五家廠商推出 AI 代理人身份框架，但留下三個關鍵安全缺口

在 RSA Conference 2026 中，CrowdStrike、Cisco、Palo Alto Networks、Microsoft 與 Cato CTRL 各自公布了 AI 代理人身份框架，然而真實世界中 Fortune 50 公司的事件顯示，代理型 AI 的安全仍有三個未解決的缺口。



2026年3月31日

代理式人工智慧

'Claudy Day' 攻擊鏈：三個 Claude AI 弱點讓透過 Google 廣告進行無聲資料竊取成為可能

Oasis Security 的研究人員發現 Anthropic 的 Claude 中有三個串聯漏洞 — 包括提示注入（prompt injection）、Files API 的外洩路徑及開放重導向 — 可透過 Google 搜尋廣告進行無聲資料竊取。



2026年3月19日

克洛德

AI代理利用已有數十年的提示注入技術，在不到兩小時內入侵麥肯錫的內部AI平台

資安研究人員示範了一個自主AI代理如何利用提示注入——一種廣為人知但仍未被充分緩解的攻擊向量——在不到兩小時內成功入侵麥肯錫的內部AI系統，對企業AI安全提出緊迫的擔憂。



2026年3月14日

人工智慧代理人

OpenAI 收購 AI 安全新創公司 Promptfoo 以強化代理人安全

OpenAI 已宣布收購 Promptfoo，一家開源的 AI 安全與紅隊測試（red-teaming）新創公司，藉此提升其 AI 代理人對抗對抗性攻擊與提示注入（prompt injection）漏洞的安全性與可靠性。



2026年3月10日

獲取

Anthropic 指控中國 AI 實驗室透過蒸餾攻擊挖掘 Claude

Anthropic 公開指控中國的 AI 實驗室透過蒸餾攻擊系統性地從其 Claude 模型中提取知識，並在美國討論 AI 晶片出口管制之際，發佈了新的偵測與防護研究。



2026年2月23日

克洛德

Microsoft Copilot 在八個月內兩度忽略敏感性標籤，暴露包括 NHS 紀錄在內的企業資料

Microsoft Copilot 在八個月內兩度繞過 DLP（資料外洩防護）政策與敏感性標籤 — 包括影響英國 NHS 的為期四週的暴露 — 揭示了企業 AI 安全堆疊中的系統性盲點。



2026年2月21日

企業人工智慧

Anthropic 推出 Claude Code Security，自主偵測軟體漏洞

Anthropic 發布了 Claude Code Security，一款新的 AI 驅動的應用程式安全工具，使用類似人類的推理掃描程式碼庫以尋找複雜漏洞，該消息使資安類股暴跌。



2026年2月20日

Anthropic

資安專家警告：Moltbook AI 代理網絡可能導致大規模資安外洩

資安專家警告，作為 AI 代理人的社群網路 Moltbook 存在提示注入風險，可能同時危及數千名代理人。



2026年2月20日

人工智慧代理人

Video Watermark Remover

AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!

佛羅里達大學研究人員開發AI越獄方法以強化安全性

UF的科學家建立了HMNS方法來測試AI的安全措施，成功繞過Meta和Microsoft的系統以識別安全漏洞。



2026年2月19日

研究

OpenAI 的 GPT-5.3-Codex 在新的安全基準測試中以 72% 成功率利用加密貨幣智能合約

OpenAI 最新的 AI 模型顯示出令人擔憂的能力，能夠掏空加密貨幣錢包，在 72% 的測試中成功利用了易受攻擊的智能合約。



2026年2月19日

網路安全

美國財政部啟動公私合作倡議，強化金融領域的人工智慧資安

財政部透過與AIEOG的合作，發布六項資源，以強化整個金融部門的AI安全與風險管理。



2026年2月19日

法規

Microsoft Copilot錯誤使機密電子郵件在數週內暴露給AI

Microsoft確認一個嚴重錯誤自一月起允許Copilot AI摘要機密電子郵件，繞過了Microsoft 365的資料防洩漏政策。



2026年2月19日

資料隱私

Gartner 確認 2026 年六大關鍵資安趨勢：具代理能力的 AI 與後量子威脅

Gartner 警告 57% 的員工在工作中使用個人化的生成式 AI，隨著自主 AI 代理與後量子密碼學威脅重塑資安格局。



2026年2月15日

網路安全

Google 揭露中國 APT31 利用 Gemini 人工智慧策劃針對美國組織的網路攻擊

獲國家支持的中國駭客組織 APT31 利用了 Google 的 Gemini 人工智慧，自動化漏洞分析並策劃針對美國目標的網路攻擊，標誌著以人工智慧驅動的網路戰顯著升級。



2026年2月14日

中國

加拿大研究人員部署以人工智慧驅動的 CIPHER 工具以對抗線上錯誤資訊

里賈納大學的研究人員為 CIPHER 錯誤資訊偵測工具加入了人工智慧功能，以對抗針對加拿大人的虛假敘事。該系統分析俄羅斯的宣傳活動，並正在擴展以解碼中文的錯誤資訊。



2026年2月14日

網路安全

攻擊者在嘗試複製模型時對 Google Gemini 提示超過 100,000 次

Google 報告稱，出於商業動機的主體對 Gemini 進行了蒸餾攻擊，使用超過 100,000 次提示以提取 AI 模型的能力與智慧財產權。



2026年2月13日

Gemini

國家級駭客利用 Google Gemini 人工智慧進行網路攻擊

來自中國、北韓和伊朗的 APT 組織利用 Google Gemini 進行偵察、惡意程式編寫與釣魚活動，Google GTIG 揭露。



2026年2月12日

網路安全

深偽詐騙擴展至工業規模：新研究揭示AI生成詐騙驚人上升

開創性研究揭露深偽詐騙以工業規模擴散，突顯AI生成合成媒體所帶來的緊迫資安威脅。



2026年2月6日

網路安全

ThumbnailCreator.com

利用人工智慧快速輕鬆創建驚艷且專業的YouTube縮圖工具。

AI縮圖製作器

Anthropic 的 Claude Code 原始碼在 GitHub 上外洩，數千個儲存庫被下架

LiteLLM 在遭受惡意軟體攻擊與偽造認證指控後與合規新創 Delve 決裂

RSAC 2026：五家廠商推出 AI 代理人身份框架，但留下三個關鍵安全缺口

'Claudy Day' 攻擊鏈：三個 Claude AI 弱點讓透過 Google 廣告進行無聲資料竊取成為可能

AI代理利用已有數十年的提示注入技術，在不到兩小時內入侵麥肯錫的內部AI平台

OpenAI 收購 AI 安全新創公司 Promptfoo 以強化代理人安全

Anthropic 指控中國 AI 實驗室透過蒸餾攻擊挖掘 Claude

Microsoft Copilot 在八個月內兩度忽略敏感性標籤，暴露包括 NHS 紀錄在內的企業資料

Anthropic 推出 Claude Code Security，自主偵測軟體漏洞

資安專家警告：Moltbook AI 代理網絡可能導致大規模資安外洩

Video Watermark Remover

佛羅里達大學研究人員開發AI越獄方法以強化安全性

OpenAI 的 GPT-5.3-Codex 在新的安全基準測試中以 72% 成功率利用加密貨幣智能合約

美國財政部啟動公私合作倡議，強化金融領域的人工智慧資安

Microsoft Copilot錯誤使機密電子郵件在數週內暴露給AI

Gartner 確認 2026 年六大關鍵資安趨勢：具代理能力的 AI 與後量子威脅

Google 揭露中國 APT31 利用 Gemini 人工智慧策劃針對美國組織的網路攻擊

加拿大研究人員部署以人工智慧驅動的 CIPHER 工具以對抗線上錯誤資訊

攻擊者在嘗試複製模型時對 Google Gemini 提示超過 100,000 次

國家級駭客利用 Google Gemini 人工智慧進行網路攻擊

深偽詐騙擴展至工業規模：新研究揭示AI生成詐騙驚人上升

ThumbnailCreator.com

人工智慧安全

人工智慧安全 的最新新聞與分析

人工智慧安全的最新新聞與分析