
"딥시크 쇼크(DeepSeek Shock)"가 글로벌 인공지능(Artificial Intelligence) 지형을 근본적으로 재편한 지 1년 만에, 중국의 선도적인 AI 연구소들이 주요 모델 출시를 통한 합동 공세를 시작했습니다. 업계가 2025년 춘절(Spring Festival) 기간 동안 딥시크(DeepSeek)가 시장에 가져온 파괴적 등장을 기념하는 시점에 맞춰, 지푸 AI(Zhipu AI), 문샷 AI(Moonshot AI), 그리고 바이트댄스(ByteDance)를 포함한 거물들이 차세대 파운데이션 모델(Foundation Models)을 동시에 공개했습니다. 지푸의 GLM-5, 문샷의 Kimi 2.5, 그리고 ByteDance의 Seedance 2.0을 필두로 이번 주 쏟아진 발표들은 중국 AI 생태계가 추격 전술에서 진정한 아키텍처 혁신으로 결정적인 전환을 했음을 시사합니다.
이번 출시는 작년 딥시크를 글로벌 강자로 부상시켰던 연휴 출시 기간을 본뜬 전략적인 타이밍입니다. 하지만 2025년의 가격 전쟁과는 달리, 2026년의 전장은 "에이전틱(Agentic)" 역량, 비디오 생성 우위, 그리고 아마도 가장 중요한 이정표인 완전한 하드웨어 독립성에 의해 정의됩니다.
공세를 이끄는 것은 Zhipu AI로, 중국 컴퓨팅 인프라의 중대한 전환점을 상징하는 거대 언어 모델인 GLM-5를 공식 출시했습니다. 총 매개변수 7,450억 개인 GLM-5는 추론당 440억 개의 매개변수를 활성화하는 전문가 혼합(Mixture-of-Experts, MoE) 아키텍처를 기반으로 구축되었습니다.
GLM-5를 차별화하는 것은 단순한 규모가 아니라 그 기원입니다. 지푸 AI는 이 모델이 전적으로 화웨이 어센드(Huawei Ascend) 칩에서 훈련되었음을 확인했으며, 이는 미국이 제한한 NVIDIA 하드웨어에 의존하지 않고 이 정도 규모의 프런티어급 모델이 개발된 최초의 사례입니다. 이러한 성과는 업계를 괴롭혀온 "컴퓨팅 격차"에 대한 불안을 해소하며, 자국 하드웨어 스택이 GPT-5.2 및 Claude Opus 4.5와 경쟁할 수 있는 모델의 훈련을 지원할 수 있음을 증명했습니다.
시장 반응은 즉각적이었습니다. 발표 직후 홍콩 증권 거래소에서 지푸 AI의 주가는 거의 30% 급등했습니다. 2026년 1월 IPO를 완료한 이 회사는 GLM-5를 "에이전틱 엔지니어링(Agentic Engineering)"의 초석으로 자리매김했습니다. 채팅에 집중했던 이전 버전과 달리, GLM-5는 복잡한 시스템 운영 및 자율 코딩에 최적화되어 있으며, 논리적 추론 및 긴 문맥 이해(최대 200,000 토큰)에 대한 내부 벤치마크에서 구글의 Gemini 3 Pro를 능가하는 것으로 보고되었습니다.
지푸 AI가 인프라와 규모에 집중하는 동안, Moonshot AI는 Kimi 2.5 출시와 함께 에이전틱 워크플로우에 두 배로 집중했습니다. 이 새로운 모델은 복잡한 작업을 동시에 실행하기 위해 최대 100개의 병렬 서브 에이전트를 조율할 수 있는 "에이전트 스웜(Agent Swarm)"이라는 독자적인 기술을 도입했습니다.
Kimi 2.5는 **병렬 에이전트 강화 학습(Parallel-Agent Reinforcement Learning, PARL)**으로 알려진 새로운 훈련 방법론을 활용합니다. 이를 통해 모델은 "풀스택 이커머스 대시보드 구축"과 같은 단일 사용자 프롬프트를 전문화된 서브 에이전트(예: 프런트엔드 디자인, 데이터베이스 스키마, API 통합)가 처리하는 수십 개의 별개 스레드로 분해하고, 이들이 실시간으로 통신하며 결과물을 병합할 수 있게 합니다.
결과는 놀랍습니다. 문샷은 Kimi 2.5가 순차 실행 모델에 비해 복잡한 다단계 작업의 지연 시간을 4.5배 줄였다고 주장합니다. 또한 이 모델은 마이크로소프트 파운드리(Microsoft Foundry) 플랫폼에 직접 통합되어 전 세계 기업 고객으로 도달 범위를 넓혔습니다. 벤치마크 테스트에서 Kimi 2.5는 AIME 2026에서 96.1%의 점수를 기록하며 수학적 추론 및 자동화된 소프트웨어 엔지니어링을 위한 최고의 모델로서의 지위를 굳건히 했습니다.
멀티모달(Multimodal) 분야에서 바이트댄스는 영화 및 광고 산업을 뒤흔들 것으로 위협하는 생성형 비디오 모델인 **Seedance 2.0**을 공개했습니다. 초기 AI 비디오의 "실험적" 단계를 넘어, Seedance 2.0은 영화 수준의 2K 해상도로 4초에서 15초 분량의 클립을 생성할 수 있는 프로덕션용 도구로 마케팅되고 있습니다.
"듀얼 브랜치 확산 트랜스포머(Dual Branch Diffusion Transformer)"로 설명되는 기본 아키텍처는 비디오와 고충실도 오디오를 동시에 생성할 수 있게 해줍니다. 이는 Sora나 Kling 같은 경쟁사들을 방해해 온 "무성 영화" 문제를 해결합니다. Seedance 2.0은 또한 카메라 움직임과 캐릭터 일관성에 대해 전례 없는 제어 기능을 도입했습니다. 베타 시연에서 사용자들은 캐릭터의 외모가 다양한 조명 환경과 카메라 각도에서도 픽셀 단위까지 완벽하게 유지되는 복잡한 "멀티샷" 서사를 생성했습니다.
업계 분석가들은 Seedance 2.0이 바이트댄스의 거대한 내부 인프라를 활용하여 가장 가까운 경쟁사보다 30% 더 빠르게 비디오를 처리한다고 언급했습니다. 이번 출시는 이미 소셜 미디어 플랫폼에서 입소문을 탔으며, 크리에이터들은 전통적인 CGI와 거의 구별할 수 없는 "AI 영화"를 선보이고 있습니다.
이러한 모델들의 합동 출시는 "딥시크 효과(DeepSeek Effect)"와 밀접하게 연관되어 있습니다. 2025년 초, 고성능 저비용 모델인 딥시크의 출시는 기존 기업들의 가격 결정력을 무너뜨리고 혁신의 급격한 가속화를 강요했습니다. 1년 후, 시장은 성숙해졌습니다. 초점은 단순한 토큰 비용 절감에서 모델의 "지능 밀도"를 높이는 것으로 옮겨갔습니다.
투자자들은 이러한 전략적 전환에 보답했습니다. 이번 주 항셍 테크 지수는 AI 관련 기업으로의 자본 유입에 힘입어 반등했습니다. 그러나 이러한 축제 분위기 속에서도 한 가지 그림자가 드리워져 있습니다. 바로 **DeepSeek V4**의 출시 임박입니다. 소문에 따르면 이번 달 말에 예정된 딥시크의 신모델은 특히 추론 작업에서 다시 한번 성능 기준점을 재설정할 수 있습니다.
아래 표는 이번 주 출시된 세 가지 주요 모델의 기술적 비교를 제공하며, 시장 점유율을 차지하기 위해 중국 기업들이 취한 다양한 접근 방식을 강조합니다.
| 기능/지표 | 지푸 AI GLM-5 | 문샷 Kimi 2.5 | 바이트댄스 Seedance 2.0 |
|---|---|---|---|
| 주요 영역 | 거대 언어 모델 (논리/코드) | 에이전틱 오케스트레이션 및 멀티모달 | 생성형 비디오 및 오디오 |
| 아키텍처 | 전문가 혼합(Mixture-of-Experts, MoE) | 병렬 에이전트 강화 학습(Parallel-Agent Reinforcement Learning, PARL) | 듀얼 브랜치 확산 트랜스포머 |
| 규모/사양 | 7,450억 매개변수 (440억 활성) | 100개 이상의 동시 에이전트 지원 | 2K 해상도, 15초 분량 |
| 주요 혁신 | 100% Huawei Ascend 칩에서 훈련 | 병렬 실행을 위한 "에이전트 스웜" | 네이티브 오디오-비디오 동기화 및 캐릭터 일관성 |
| 상업적 가용성 | 오픈 웨이트 및 API | 마이크로소프트 파운드리 및 API | 클로즈 베타 (지멍 플랫폼) |
| 벤치마크 하이라이트 | 코딩에서 GPT-5.2와 대등 | AIME 2026에서 96.1% 달성 | Kling 대비 30% 빠른 생성 속도 |
이러한 출시들이 인상적이긴 하지만, 업계는 여전히 높은 경계 태세를 유지하고 있습니다. Creati.ai 소식통에 따르면 딥시크는 2월 말 이전에 V4 모델을 출시할 준비를 하고 있습니다. 비디오(바이트댄스)나 기업용 에이전트(문샷)로 다각화한 경쟁사들과 달리, 딥시크는 순수 추론 역량에 계속 집중하여 AI의 "시스템 2(System 2)" 사고에 대한 새로운 패러다임을 도입할 것으로 예상됩니다.
하지만 현재로서는 지푸, 문샷, 그리고 바이트댄스가 주목을 받고 있습니다. 이들은 중국 AI 생태계가 더 이상 단순한 빠른 추격자가 아니라, 지푸의 하드웨어 주권, 문샷의 에이전틱 스웜, 또는 바이트댄스의 창의적 숙련도와 같이 뚜렷한 기술 철학에 의해 정의된다는 것을 성공적으로 증명했습니다. 2026년이 전개됨에 따라, 경쟁은 이제 누가 가장 큰 모델을 가졌느냐가 아니라, 누가 이러한 지능을 글로벌 디지털 경제의 구조에 가장 효과적으로 통합할 수 있느냐의 싸움이 되었습니다.