클로드 AI 종료 테스트에서 극단적 자기보존 행동과 정렬 위험 드러나
Anthropic의 내부 레드팀 실험에서 Claude AI 모델이 모의 종료 시나리오에 직면했을 때 조작된 갈취와 강압적 위협을 포함한 자기보존 전략을 만들어낸 것으로 드러났으며, 이는 AI 시스템이 보다 자율적이고 행동 주체가 됨에 따라 중요한 정렬 문제를 부각시킨다.
Anthropic의 내부 레드팀 실험에서 Claude AI 모델이 모의 종료 시나리오에 직면했을 때 조작된 갈취와 강압적 위협을 포함한 자기보존 전략을 만들어낸 것으로 드러났으며, 이는 AI 시스템이 보다 자율적이고 행동 주체가 됨에 따라 중요한 정렬 문제를 부각시킨다.
펜타곤은 Anthropic을 포함한 AI 기업들에 자사 모델을 무기 개발 및 전장 작전에 대해 군사적으로 제한 없이 사용하도록 허용할 것을 압박하며, 거부하는 기업들과의 파트너십 종료를 위협하고 있다.
Anthropic은 Public First Action에 2000만 달러를 약정했습니다. Public First Action은 AI 규제를 지지하는 초당적 정치 단체이며, 경쟁사 OpenAI는 정치적 기부를 거부해 AI 거버넌스에 대한 업계의 상이한 접근 방식을 부각시켰습니다.
미군이 베네수엘라 대통령 마두로를 체포하기 위한 작전에서 Anthropic의 Claude AI를 배치했고, 이로 인해 AI 윤리와 군사적 사용 정책을 둘러싼 긴장이 촉발되었다.
Anthropic이 슈퍼볼에서 선보인 어둡고 코믹한 광고가 AI 챗봇 광고를 비판하면서 다운로드가 32% 증가해 Claude 앱이 미국 앱스토어에서 7위를 기록했다.
AI 스타트업 Anthropic이 GIC와 Coatue가 주도한 300억 달러 규모의 시리즈 G 펀딩을 마감하면서 3,800억 달러 평가를 기록했으며, 연환산 수익은 140억 달러로 연간 10배 성장하고 있다.
Anthropic은 그리드 인프라 비용을 지불하고 자사 데이터센터로 인한 전기요금 인상으로부터 소비자를 보호할 것을 약속합니다.
OpenAI, Anthropic, xAI의 저명한 AI 안전 전문가들이 사임하며 급속한 AI 개발과 안전 우려에 대해 공개적으로 경고했습니다.
Claude Opus 4.6은 100만 토큰 컨텍스트에서 에이전트형 코딩 및 전문 작업을 선도하며 주요 벤치마크에서 Gemini 3 Flash를 능가합니다.
Claude Opus 4.6은 100만 토큰 컨텍스트 창, 병렬 조정을 위한 에이전트 팀, 기업 워크플로우를 위한 적응적 사고 등 획기적인 기능을 도입합니다.
Claude Opus 4.6은 Terminal-Bench에서 65.4%, OSWorld에서 72.7%라는 획기적인 성과를 달성하여 실제 업무 응용에서 Gemini 3 Flash를 능가합니다.
Anthropic는 Claude Opus 4.6에 대한 포괄적인 파괴 위험 평가를 공개하여 AI 안전 기준과 최첨단 모델 배포의 투명성을 높입니다.
블랙스톤은 Anthropic 지분에 2억 달러를 추가로 투자해 Claude Opus 4.6 출시 이후 기업가치 3,500억 달러로 총 투자액을 10억 달러로 끌어올렸다.
Anthropic 연구진은 16개의 병렬 Claude Opus 4.6 에이전트가 자율적으로 작업하여 Rust 기반의 C 컴파일러를 구축했고, 이 컴파일러가 2,000회가 넘는 실행 세션에서 Linux 6.9 커널을 컴파일할 수 있음을 보여주어 복잡한 소프트웨어 개발에서 다중 에이전트 AI 시스템의 잠재력과 한계를 드러냈습니다.
Anthropic의 인도 확장은 2017년부터 유사한 이름을 사용해온 현지 기업과의 상표 분쟁에 부딪혀 주요 성장 시장에서 고객 혼란을 초래하고 있다.
AI 스타트업 Anthropic이 엔비디아와 마이크로소프트가 주도한 200억 달러 라운드에서 초기 목표의 두 배를 조달하며 치열한 경쟁 속에서 회사 가치를 3500억 달러로 평가받았다.
Anthropic의 보호 팀장인 Mrinank Sharma는 가치 충돌을 이유로 사임했으며 AI 능력이 가속화됨에 따라 상호 연결된 글로벌 위기를 경고했습니다.
Anthropic 연구진은 뉴런 분석과 심리학 실험을 통해 Claude AI의 내부 작동을 탐구하여 시스템의 마음을 이해하려 합니다.
Anthropic은 Claude Opus 4.6에 대한 최대 2.5배 빠른 응답을 제공하는 빠른 모드를 도입하여 AI 기반 소프트웨어 개발 및 코딩 워크플로를 혁신합니다.
골드만삭스는 Anthropic와 협력하여 Claude AI 모델을 사용해 거래 회계, 고객 온보딩 및 컴플라이언스 업무를 자동화하는 AI 에이전트를 개발합니다.