AI 에이전트가 수십 년 된 프롬프트 인젝션 기법을 사용해 2시간도 안 돼 맥킨지의 내부 AI 플랫폼을 해킹
보안 연구원들은 자율 AI 에이전트가 프롬프트 인젝션이라는 잘 알려져 있지만 여전히 널리 완화되지 않은 공격 벡터를 악용해 2시간도 안 돼 맥킨지의 내부 AI 시스템을 성공적으로 침해했음을 보여주었으며, 이는 기업용 AI 보안에 대한 긴급한 우려를 불러일으킨다.
보안 연구원들은 자율 AI 에이전트가 프롬프트 인젝션이라는 잘 알려져 있지만 여전히 널리 완화되지 않은 공격 벡터를 악용해 2시간도 안 돼 맥킨지의 내부 AI 시스템을 성공적으로 침해했음을 보여주었으며, 이는 기업용 AI 보안에 대한 긴급한 우려를 불러일으킨다.
Anthropic의 Claude AI 모델이 2주 동안 자율적으로 Mozilla Firefox에서 이전에 알려지지 않은 22개의 보안 취약점을 발견하여 대규모로 고급 사이버보안 연구를 수행할 수 있는 대형 언어 모델의 능력이 커지고 있음을 보여주었다.
OpenAI는 데이팅 사기, 변호사 사칭, 영향력 행사 작전 등에서 악의적인 행위자들이 ChatGPT를 어떻게 악용하고 있는지 자세히 설명한 포괄적인 위협 보고서를 공개하고, 이러한 악용을 차단하기 위해 취한 조치들을 설명했다.
OpenClaw(이전 명칭 Clawdbot)라는 바이럴 오픈소스 AI 에이전트가 보안 전문가들이 예측 불가능한 동작, 프롬프트 인젝션 취약성, 민감한 데이터에 대한 무단 접근을 경고한 후 Meta 및 다른 기술 회사들에서 금지 조치를 초래했다.
사이버보안 전문가들은 AI 에이전트용 소셜 네트워크인 Moltbook이 프롬프트 인젝션 위험을 안고 있어 수천 개의 에이전트를 동시에 손상시킬 수 있다고 경고합니다.
UF 연구진은 AI 안전 조치를 테스트하기 위해 HMNS 기법을 개발했으며, 보안 취약점을 찾아내기 위해 Meta와 Microsoft의 시스템을 성공적으로 우회했다.
OpenAI의 최신 AI 모델은 암호화폐 지갑의 자금을 빼낼 수 있는 놀라운 능력을 보여주며, 취약한 스마트 계약을 테스트의 72%에서 성공적으로 악용했습니다.
재무부가 AIEOG 파트너십을 통해 금융 부문의 AI 보안 및 위험 관리를 강화하기 위한 6가지 자료를 공개했습니다.
마이크로소프트는 치명적인 버그로 인해 1월부터 코파일럿 AI가 기밀 이메일을 요약할 수 있었고, 이로 인해 Microsoft 365의 데이터 유출 방지 정책을 우회했다고 확인했다.
OpenAI가 Paradigm과 협력하여 EVMbench 벤치마크로 AI 에이전트가 블록체인 취약점을 탐지, 패치 및 악용하는 능력을 테스트합니다.
Google Threat Intelligence Group은 중국, 이란, 북한의 국가 지원 행위자들이 공격 주기 전반에 걸쳐 Gemini AI를 악용하고 있음을 밝힙니다.
가트너는 직원의 57%가 업무에 개인용 생성형 AI를 사용한다고 경고했으며, 자율 AI 에이전트와 포스트 양자 암호 위협이 사이버보안 지형을 재편하고 있다고 전했습니다.
국가 지원을 받는 중국 해킹 그룹 APT31은 구글의 Gemini AI를 활용해 취약점 분석을 자동화하고 미국 목표에 대한 사이버공격을 계획했으며, 이는 AI 기반 사이버 전쟁의 중대한 고조를 의미합니다.
레지나 대학교 연구진은 캐나다인을 겨냥한 허위 서사에 대응하기 위해 CIPHER 허위정보 탐지 도구에 AI 기능을 강화했습니다. 이 시스템은 러시아의 선전 캠페인을 분석하며 중국어 허위정보를 해독하도록 확장되고 있습니다.
OpenAI는 고위험 사용자용 잠금 모드와 ChatGPT에서 잠재적으로 유해한 콘텐츠를 식별하기 위한 '고위험' 라벨을 포함한 새로운 보안 기능을 도입합니다.
새로운 엔터프라이즈 보안 기능은 고위험 사용자에 대해 결정론적 제어를 통해 AI 프롬프트 인젝션과 데이터 유출을 방지합니다.
Google은 상업적 동기를 가진 주체들이 Gemini에 대해 증류 공격을 수행하여 AI 모델의 기능과 지적 재산을 추출하기 위해 100,000회 이상의 프롬프트를 사용했다고 보고했다.
중국, 북한, 이란의 APT 그룹들이 정찰, 악성코드 작성, 피싱 캠페인에 Google Gemini를 사용하고 있다고 Google GTIG가 밝혀냈다.
Anthropic은 100만 토큰 컨텍스트 창과 테스트 중 500건 이상의 제로데이 취약점을 발견한 고급 코딩 기능을 갖춘 Claude Opus 4.6을 출시하여 AI 보안의 새로운 기준을 제시합니다.
획기적인 연구는 딥페이크 사기가 산업적 규모로 확산되고 있음을 폭로하며, AI가 생성한 합성 미디어가 야기하는 시급한 사이버보안 위협을 강조합니다.