Moonshot AI의 Kimi K2.5, 미·중 AI 개발 격차를 사상 가장 좁은 수준으로 줄여

Moonshot AI의 Kimi K2.5가 AI 지형을 재정의하고 미·중 격차를 좁히다

베이징에 본사를 둔 Moonshot AI는 최신 파운데이션 모델(파운데이션 모델, foundation model)인 Kimi K2.5를 공식 발표했으며, 업계 분석가들은 이번 개발이 미국과 중국 간 인공지능(인공 지능 (artificial intelligence)) 기술 격차를 역사상 가장 좁은 수준으로 줄였다고 평가하고 있다. 이번 주 공개된 Kimi K2.5는 오픈 소스이자 네이티브 멀티모달(멀티모달, multimodal) 모델로, OpenAI의 GPT 시리즈나 Google의 Gemini와 같은 주요 독점 시스템과 견줄 만한 성능을 제공한다고 주장하면서도 추론 비용은 훨씬 적게 든다고 한다.

이번 공개는 특히 중국의 첨단 컴퓨팅 하드웨어 접근을 제한하기 위한 미국의 엄격한 수출 통제 조치가 시행되는 가운데 이루어진 것으로, 최첨단 성능을 단순한 막대한 컴퓨팅 파워에만 의존하지 않고 최적화된 아키텍처로 달성했다는 점에서 반도체 제재의 효용성과 오픈 소스 인공 지능의 미래에 관한 논쟁을 다시 불러일으켰다. 인공 지능 (artificial intelligence).

네이티브 멀티모달(multimodal) 아키텍처와 'Agent Swarm' 기능

Kimi K2.5는 텍스트, 이미지, 비디오를 동시에 처리하고 추론할 수 있는 정교한 네이티브 멀티모달(multimodal) 아키텍처를 도입했다. 이전 세대가 서로 다른 모달리티를 위해 별도의 모듈에 의존하던 것과 달리, Kimi K2.5는 이러한 기능을 단일 시스템으로 통합하여 시각적 이해와 텍스트 생성 간의 원활한 전환을 가능하게 한다.

그러나 K2.5 공개의 가장 두드러진 특징은 '에이전트 스웜(Agent Swarm)' 기술이다. 이 기능은 모델이 복잡하고 다단계인 문제를 해결하기 위해 최대 100개의 서브 에이전트를 병렬로 조율할 수 있게 해준다.

Kimi K2.5의 주요 기술 역량:

Feature	Description	Impact
Agent Swarm	Orchestrates 100+ sub-agents in parallel	복잡한 작업의 실행 시간을 최대 4.5배까지 단축
Native Multimodal	Unified processing of text, image, and video	비디오 입력에서의 고충실도 시각적 추론 및 코딩을 가능케 함
Context Window	Supports up to 262,000 tokens	긴 문서와 방대한 코드베이스 처리가 가능
Thinking Mode	Enhanced reasoning capabilities for logic puzzles	수학 및 복잡한 논리 벤치마크 성능 향상

Moonshot AI의 기술 보고서에 따르면, 이 병렬 실행 능력은 개발자 워크플로에 있어 게임 체인저다. 웹 검색, 코드 작성, 디버깅을 동시에 수행해야 하는 광범위한 도구 사용 시나리오에서, 에이전트 스웜은 최대 1,500개의 도구 호출을 조정된 방식으로 실행할 수 있다. 이러한 '하이브 마인드' 접근법은 초기 에이전트 모델에서 일반적이던 선형적 순차 처리와 극명히 대비되며 최종 사용자 대기 시간을 크게 줄인다.

벤치마크 성능: 실리콘밸리 최고들과 경쟁하다

제3자 및 내부 평가에서 Kimi K2.5는 업계 최고 폐쇄형 모델들과 어깨를 나란히 하는 성능 지표를 보여주었다. 이 모델은 특히 코딩과 에이전트 기반 작업에서 강점을 보였는데, 이는 이전까지 미국 기반 연구소들이 주도하던 영역이었다.

AI의 추론 한계를 시험하도록 설계된 벤치마크인 Humanity’s Last Exam (HLE)에서, Kimi K2.5는 미국 선도 폐쇄형 모델들과 몇 퍼센트 포인트 이내의 점수를 기록했다고 전해진다. 또한 SWE-Bench Verified 코딩 평가에서 모델은 76.8%의 점수를 획득해 소프트웨어 엔지니어링 작업에서 최상위 도구로서의 위치를 공고히 했다.

모델은 시각적 작업에서도 뛰어나다. 비디오 콘텐츠의 이해와 추론 능력을 테스트하는 VideoMMMU 벤치마크에서 Kimi K2.5는 86.6%의 점수를 기록해 여러 기존 경쟁자를 능가했다. 이러한 결과는 Moonshot AI가 Mixture-of-Experts (MoE) 아키텍처를 최적화해 학습 데이터의 효용을 극대화했으며, 상대적으로 작은 하드웨어 클러스터에서 흔히 나타나는 수익 체감 문제를 효과적으로 회피했음을 시사한다.

비용 효율성의 역설

Kimi K2.5 발표의 가장 파괴적인 측면 중 하나는 그 가격 구조다. Moonshot AI는 희소 MoE(sparse MoE) 아키텍처의 효율성을 활용해 서구 경쟁사들보다 공격적으로 가격을 책정했다.

비교 가격 구조 (백만 토큰당):

Model Tier	Input Cost	Output Cost	Cost Differential
Kimi K2.5	$0.60	$2.50	기준
Leading US Proprietary Model	~$2.50	~$10.00	약 4배 비쌈
Previous Gen Open Source	$1.00	$3.00	약 1.5배 비쌈

주: 가격은 현재 환율 및 보고된 API 비용을 기반으로 한 대략적인 수치다.

동급의 미국 모델 비용의 대략 1/4 수준으로 플래그십급 지능을 제공함으로써, Moonshot AI는 Kimi K2.5를 단순한 연구 성과물에 그치지 않고 엔터프라이즈 배포를 위한 상업적으로 실현 가능한 대안으로 포지셔닝하고 있다. 이 가격 전략은 운영 비용이 더 높은 서구의 구독 기반 AI 기업들의 비즈니스 모델에 큰 압력을 가한다.

반도체 수출 통제의 효력에 대한 도전

Kimi K2.5의 공개는 더 넓은 지정학적 함의를 지닌다. 특히 반도체 수출 통제를 통해 중국의 AI 발전을 저지하려는 미국의 노력과 관련된다. 최신 NVIDIA 하드웨어에 대해 완전히 차단된 상황에서도, Google과 Meta 출신의 연구자였던 Yang Zhilin이 설립한 Moonshot AI는 최첨단급 모델을 훈련하는 데 성공했다.

업계 전문가들은 이 성과를 '소프트웨어 최적화' 논증의 증거로 지목한다. NVIDIA H800이나 국내 대체재와 같은 제약된 연산 자원으로 작업해야 하는 중국 연구소들은 알고리즘 효율화와 Mixture-of-Experts (MoE) 같은 아키텍처 혁신에 크게 투자해 왔으며, 이를 통해 더 적은 FLOPs(floating-point operations)로 더 많은 지능을 뽑아낼 수 있었다.

브루킹스 연구소(Brookings Institution)의 펠로우인 Kyle Chan은 이번 공개가 하드웨어 제한만으로 영구적 전략적 우위를 유지할 수 있는지에 대한 타당한 의문을 제기한다고 언급했다. 알고리즘적 돌파구가 하드웨어 부족을 보상할 수 있다면, 미국이 벌이려 했던 '격차'는 오히려 좁혀질 수 있다.

오픈 소스 전략 및 생태계 확장

Moonshot AI는 Kimi K2.5의 가중치(weights)를 공개하며 다른 중국 기술 대기업들과 유사한 오픈 소스 전략을 채택했다. 이 움직임은 개발자들이 모델을 내려받아 자체 인프라에서 실행할 수 있게 함으로써 데이터 프라이버시와 커스터마이제이션을 보장하고 모델의 글로벌 채택을 가속화한다.

이 생태계를 지원하기 위해 회사는 또한 워크플로에 직접 통합되도록 설계된 개발자 도구인 Kimi Code를 출시했다. 고성능 코딩 모델을 전용 도구와 번들로 제공함으로써, Moonshot은 GitHub Copilot이나 Cursor와 유사하게 개발자 커뮤니티를 적극적으로 공략하고 있으며, 이는 장기적인 플랫폼 우위 확보에 있어 핵심적인 인구층이다.

AI 업계가 Kimi K2.5의 역량을 소화해 가면서 2026년의 서사는 변화하고 있다. 무적의 미국 주도권이라는 가정은 점차 효율성과 아키텍처적 혁신이 원시적인 연산 능력만큼 중요해진 치열한 다극 경쟁의 현실로 대체되고 있다.