
오늘 암스테르담에서 열린 Cisco Live EMEA에서, 시스코는 **실리콘 원 G300(Silicon One G300)**을 공개하며 인공지능 인프라 진화의 중요한 이정표를 세웠습니다. 기가와트급 AI 클러스터의 요구 사항을 충족하도록 특별히 설계된 이 새로운 스위치 실리콘은 전력 효율성과 작업 완료 속도의 중요한 병목 현상을 해결하는 동시에, 업계가 이더넷 기반 AI 패브릭으로 전환하는 속도를 높일 것으로 기대됩니다.
AI 워크로드가 정적인 학습 모델에서 동적이고 에이전트 중심적인 워크플로우로 전환됨에 따라, 기본 인프라는 전례 없는 압박에 직면해 있습니다. Creati.ai는 G300을 단순한 하드웨어 업그레이드가 아니라, 차세대 AI 에이전트의 예측 불가능한 트래픽 패턴과 동기식 고대역폭 GPU 통신의 충돌을 처리하도록 설계된 아키텍처인 "지능형 집합 네트워킹(Intelligent Collective Networking)"을 향한 전략적 전환점이라고 평가합니다.
오늘 발표의 핵심은 실리콘 원 G300의 가공할 용량입니다. 단일 장치에서 **초당 102.4 테라비트(Tbps)**의 이더넷 스위칭(Ethernet switching) 용량을 제공하는 이 칩은 Broadcom 및 NVIDIA와 같은 경쟁사의 최첨단 제품과 직접 경쟁할 수 있는 위치에 있습니다.
결정적으로, G300은 시스코 자체 제작 200 Gbps SerDes 기술을 기반으로 하는 1.6T 이더넷 포트를 지원합니다. 이러한 통합을 통해 최대 512개 포트를 지원하는 고밀도(high-radix) 확장이 가능해져 네트워크 설계자가 "더 평평한(flatter)" 네트워크를 구축할 수 있게 해줍니다. GPU 간의 홉(hop) 수를 줄임으로써 운영자는 하이퍼스케일러와 네오 클라우드의 총소유비용(TCO)을 결정하는 두 가지 지표인 지연 시간과 전력 소비를 크게 낮출 수 있습니다.
시스코의 사장 겸 최고 제품 책임자인 지투 파텔(Jeetu Patel)은 기조연설에서 이러한 기술의 통합을 강조했습니다: "AI 혁신은 그 어느 때보다 빠르게 진행되고 있습니다... 오늘 발표는 통합 플랫폼으로서의 시스코의 역량을 강조하며, 실리콘과 시스템에서의 혁신이 어떻게 결합하여 데이터 센터에서 작업 공간에 이르기까지 고객을 위한 가치를 창출하는지 보여줍니다."
가공할 속도도 네트워크 혼잡으로 인해 무용지물이 되는 경우가 많습니다. 전통적인 AI 클러스터에서 수천 개의 GPU가 동시에 통신을 시도할 때, 패킷 손실과 지터(jitter)는 학습 작업을 중단시켜 값비싼 컴퓨팅 사이클을 낭비할 수 있습니다. 시스코는 **지능형 집합 네트워킹(Intelligent Collective Networking)**이라 명명된 일련의 기능을 통해 이를 해결하고자 합니다.
G300 아키텍처는 다이(die)에 직접 거대한 252MB 완전 공유 패킷 버퍼를 통합했습니다. 메모리를 분할하는 전통적인 설계와 달리, G300은 모든 포트의 패킷이 사용 가능한 모든 공간을 활용할 수 있도록 합니다. 시스코의 내부 시뮬레이션에 따르면, 이는 업계의 다른 대안과 비교했을 때 버스트 흡수 능력이 2.5배 증가하는 결과로 이어집니다.
"꼬리 지연 시간(tail latency, 가장 느린 패킷)"이 전체 클러스터의 속도를 결정하는 AI 모델 학습에서, 이러한 버퍼링 기능은 혁신적입니다. 시스코는 이 아키텍처가 최적화되지 않은 트래픽 패턴과 비교하여 네트워크 활용도(처리량)를 33% 향상시키고, AI 연구자들에게 가장 중요한 **작업 완료 시간(Job Completion Time) (JCT)**을 28% 개선한다고 보고했습니다.
G300의 돋보이는 기술적 특징 중 하나는 부하 분산(Load balancing)에 대한 접근 방식입니다. 전통적인 소프트웨어 기반 네트워크 튜닝은 AI 워크로드의 전형적인 마이크로초 단위 버스트에 대응하기에는 너무 느린 경우가 많습니다.
G300은 하드웨어에서 경로 기반 부하 분산을 구현하여 소프트웨어 방식보다 100,000배 빠르게 혼잡 이벤트나 네트워크 오류에 반응할 수 있습니다. 이를 통해 수동 개입 없이 사용 가능한 모든 경로에 트래픽을 지능적으로 분산시킵니다. 수만 개의 GPU가 있는 클러스터를 관리하는 운영자에게 이러한 자동화는 InfiniBand 및 초기 이더넷 AI 배포에서 악명 높은 문제점이었던 네트워크 패브릭의 지속적이고 수동적인 "튜닝" 필요성을 제거해 줍니다.
다음 표는 AI 네트워킹을 위한 표준 업계 벤치마크와 비교한 새로운 G300 실리콘의 핵심 기술 사양 및 성능 지표를 보여줍니다.
표 1: 시스코 실리콘 원 G300(Cisco Silicon One G300) 기술 하이라이트
| 기능 | 사양 | AI 워크로드에 미치는 영향 |
|---|---|---|
| 스위칭 용량 | 102.4 Tbps | 기가와트급 클러스터를 위한 대규모 확장 가능 |
| 포트 지원 | 1.6T 이더넷 | 케이블링 복잡성 감소 및 랙당 밀도 증가 |
| 패킷 버퍼 | 252MB (완전 공유) | 학습 중 패킷 손실 방지를 위한 마이크로 버스트 흡수 |
| 부하 분산 | 하드웨어 기반 (경로 인식) | 혼잡 이벤트에 대해 소프트웨어보다 100,000배 빠르게 반응 |
| 처리량 이득 | +33% 활용도 | 고가의 GPU 가동 시간 및 ROI 극대화 |
| 작업 완료 | 28% 더 빠름 (비최적화 대비) | 파운데이션 모델 학습의 출시 기간 단축 |
| 아키텍처 | 프로그래밍 가능한 P4 | 배포 후에도 새로운 프로토콜(예: UEC) 추가 가능 |
시스코의 전략은 실리콘 그 이상으로 확장됩니다. 이 회사는 AI 에이전트가 도구 및 다른 에이전트와 자율적으로 상호 작용하는 시스템인 "에이전트형 AI(Agentic AI)"의 복잡성을 관리하기 위해 설계된 운영 도구 세트인 **AgenticOps**를 도입했습니다.
이러한 새로운 기능은 Nexus One 관리 콘솔에 통합되어 네트워크 상태에 대한 통합된 뷰를 제공합니다. G300 칩의 텔레메트리(프로그래밍 가능한 세션 수준 진단 제공)와 고수준 소프트웨어 관측성을 결합함으로써, IT 팀은 성능 저하의 근본 원인이 케이블 고장인지 아니면 라우팅 테이블 설정 오류인지 등을 더 넓은 클러스터에 영향을 미치기 전에 정확히 찾아낼 수 있습니다.
또한 시스코는 G300이 새로운 Cisco 8000 및 Nexus 9100 시스템에 탑재될 것이라고 발표했습니다. 이러한 고정형 및 모듈형 시스템은 기존 데이터 센터 인프라를 그대로 대체할 수 있도록 설계되어 시스코의 "현장 업그레이드(upgrade in place)" 철학을 뒷받침합니다. 이는 하드웨어 교체 없이 소프트웨어 업데이트를 통해 새로운 프로토콜(예: 부상하는 UEC(Ultra Ethernet Consortium) 표준)을 구현할 수 있게 해주는 칩의 적응형 패킷 처리(Adaptive Packet Processing) 기능 덕분에 가능합니다.
더 빠른 네트워크가 잠재적 위협의 확산도 가속화한다는 점을 인식하여, 시스코는 AI 방어(AI Defense) 솔루션의 업데이트를 공개했습니다. 여기에는 에이전트 중심 워크플로우를 위한 "의도 인식 검사(intent-aware inspection)"가 포함됩니다. AI 에이전트가 자율적으로 리소스를 요청하고 도구를 실행하기 시작함에 따라, 네트워크는 이러한 행동이 정당한지 확인해야 합니다. 업데이트된 SASE(Secure Access Service Edge) 제품은 이제 에이전트 트래픽의 "이유"와 "방법"을 평가하여, 이전의 순수 고성능 컴퓨팅 환경에서는 부족했던 자율 시스템에 대한 거버넌스 계층을 제공할 수 있습니다.
G300의 시사점은 광범위한 반도체 및 데이터 센터 시장에 있어 매우 중요합니다. 시스코는 지능형 버퍼링과 부하 분산을 통해 이더넷이 InfiniBand와 같은 특화된 인터커넥트의 성능과 대등하거나 그 이상일 수 있음을 증명함으로써, AI 네트워킹을 위한 개방형 표준으로의 업계 이동을 입증하고 있습니다.
시스코는 실리콘 원 G300 SDK가 현재 사용 가능하며, 해당 칩을 사용하는 첫 번째 하드웨어 시스템은 2026년 하반기에 출시될 예정이라고 확인했습니다.
현재 2027년 인프라를 계획 중인 기업과 하이퍼스케일러에게 28%의 학습 시간 단축 약속은 수억 달러의 잠재적 비용 절감을 의미합니다. AI 경쟁이 심화됨에 따라 네트워크의 효율성은 GPU의 속도만큼이나 중요해지고 있으며, 시스코는 G300을 통해 그 미래에 대한 강력한 소유권을 주장하고 있습니다.