오픈소스 LLM GLM-5.1, 8시간 자율 작업 능력 탑재… Claude Opus 4를 능가
Z.AI가 장기적 에이전트 작업을 위해 설계된 7,540억 개 파라미터의 오픈소스 모델 GLM-5.1을 공개했다. 이 모델은 최대 8시간 동안 자율적으로 작동하며, 벤치마크에서 Claude Opus 4를 능가했다.
Z.AI가 장기적 에이전트 작업을 위해 설계된 7,540억 개 파라미터의 오픈소스 모델 GLM-5.1을 공개했다. 이 모델은 최대 8시간 동안 자율적으로 작동하며, 벤치마크에서 Claude Opus 4를 능가했다.
Anthropic의 연간 매출 환산액은 2026년에 300억 달러를 넘어 90억 달러에서 증가했으며, 이는 Claude AI 모델에 대한 급증하는 수요에 힘입은 것이다.
메타는 Alexandr Wang이 이끄는 새로운 AI 모델의 오픈소스 버전을 결국 공개할 것이라고 밝히면서도, 초기에는 일부 구성 요소를 독점적으로 유지할 계획이라고 말했습니다.
Arcee AI는 기업이 다운로드하고 맞춤 설정할 수 있는 Apache 2.0 라이선스의 강력한 새로운 오픈 웨이트 추론 모델 Trinity-Large-Thinking을 출시했습니다.
MIT 연구진은 서로 다른 개발자의 LLM들로 구성된 앙상블에 걸쳐 모델의 출력을 비교하는 총 불확실성 지표를 도입했다. 이 지표는 기존의 자기일관성(self-consistency) 방법보다 과도하게 자신감 있는 예측과 환각을 더 정확하게 감지한다.
Anthropic는 Claude의 일일 활성 사용자가 2026년 1월 이후 140% 이상 급증함에 따라 비혼잡 시간대에 Claude AI 가입자의 사용 한도를 2배로 늘린다고 발표했다. 이는 중요한 용량 확장이다.
Anthropic가 Claude Sonnet 4.6을 출시했습니다. 이 모델은 100만 토큰 컨텍스트 윈도우를 갖추고 코드 작성, 컴퓨터 활용, 에이전트 분야에서 최첨단 AI 성능을 더 낮은 비용으로 제공합니다. Opus 4.6 공개로부터 단 12일 만에 나왔습니다.
Claude Opus 4.6은 100만 토큰 컨텍스트 창, 병렬 조정을 위한 에이전트 팀, 기업 워크플로우를 위한 적응적 사고 등 획기적인 기능을 도입합니다.
마운트시나이 연구에 따르면 AI LLM은 의료 허위정보를 32~46%의 확률로 사실로 받아들이며, 특히 이를 전문가 조언으로 제시할 때 그 비율이 높았습니다.
AI 선구자 얀 르쿤은 메타를 떠나면서 AI 산업이 대형 언어 모델(LLM)에 과도하게 집중하고 있어 잘못된 방향으로 가고 있다고 경고했다. 그는 예측적 세계 모델로의 전환을 촉구한다.