AI News

Google, Gemini AI 탑재 Auto Browse로 웹을 재정의하다

Google은 Chrome용으로 많은 기대를 모은 기능 Auto Browse를 출시하며 공식적으로 '에이전트형 웹(agentic web)' 시대를 열었다. 2026년 1월 28일 발표된 이 업데이트는 고급 Gemini AI 모델—특히 새로운 Gemini 3 버전—을 세계에서 가장 인기 있는 브라우저에 직접 통합한다. 이로써 Chrome은 처음으로 단순한 인터넷 창을 넘어 사용자를 대신해 복잡하고 다단계 작업을 자율적으로 수행할 수 있는 능동적인 참여자가 되었다.

이 전략적 출시 대상은 Google의 프리미엄 계층 사용자, 특히 미국에서 AI Pro 및 Ultra 요금제에 가입한 사용자들이다. 에이전트형 기능을 브라우저 인프라에 통합함으로써 Google은 OpenAI 및 Perplexity 같은 경쟁업체를 따라잡는 것뿐만 아니라 Chrome의 방대한 설치 기반과 웹 생태계와의 깊은 통합을 활용해 오히려 앞서 나가고 있다.

수동적 브라우징에서 활동적 에이전트로의 전환

이 업데이트의 핵심은 "검색"에서 "실행"으로의 전환이다. 전통적인 브라우징은 사용자가 웹사이트를 수동으로 탐색하고, 정보를 필터링하고, 데이터를 입력하도록 요구한다. **Auto Browse**는 이러한 패러다임을 뒤집는다. 사용자는 이제 "시카고에서 $300 미만의 부티크 호텔을 찾아 다음 주말의 이용 가능 여부를 확인해 달라" 또는 "이 DIY 포토 부스를 재현하는 데 필요한 용품을 구매해 달라"와 같은 다단계 작업을 Chrome에 위임할 수 있다.

작업이 새로운 영구적인 Gemini 사이드 패널을 통해 시작되면, **Gemini AI**가 이를 인계받는다. 새 탭은 고유한 "sparkle" 아이콘과 보이는 커서 흔적(cursor ghost)으로 구분되어 사용자가 AI가 실시간으로 탐색하고, 클릭하고, 스크롤하고, 입력하는 모습을 지켜볼 수 있게 한다. 결정적으로 이 과정은 백그라운드에서 진행될 수 있어 에이전트가 작업을 완료하는 동안 사용자는 다른 탭에서 계속 작업할 수 있다.

기술적 기반은 Gemini 3의 멀티모달 기능과 문서 객체 모델(Document Object Model, DOM)에 대한 정교한 이해에 의존한다. 이를 통해 브라우저는 인간처럼 웹페이지를 "보고" 상호작용할 수 있어, "Add to Cart" 버튼을 식별하고 복잡한 양식을 작성하며 여러 페이지를 넘나들어 정보를 통합할 수 있다.

안전 장치와 인간 개입(human-in-the-loop) 제어

**AI 에이전트(AI Agents)**와 관련된 주요 우려는 특히 금전 거래나 통신에 대해 의도치 않은 행동이 발생할 가능성이다. Google은 엄격한 "human-in-the-loop" 프로토콜로 이를 해결했다. Auto Browse는 결제 페이지로 이동하고 배송 정보를 입력하며 할인 코드를 적용할 수 있지만, 명시적인 사용자 확인 없이는 최종 "Buy" 또는 "Post" 명령을 실행할 수 없다.

또한 이 시스템은 투명성을 염두에 두고 설계되었다. 새로운 사이드 패널은 에이전트의 작업을 단계별 로그로 제공한다(예: "Etsy로 이동(Navigating to Etsy)", "항목 선택(Selecting Item)", "주소 입력(Filling Address)"). 사용자는 언제든지 "작업 인수(Take over task)" 버튼을 클릭해 개입할 수 있으며, 즉시 AI를 일시 중지시키고 수동 제어로 전환할 수 있다. 이러한 자율성과 감독의 균형은 사용자를 대신해 작동하는 **브라우저 기술(Browser Technology)**에 대한 신뢰를 구축하는 데 중요하다.

기능 분석: 표준 Chrome 경험 vs Chrome Auto Browse

전통적인 Chrome 경험과 이 새로운 에이전트형 워크플로우 간의 차이는 상당하다. 다음 표는 이 업데이트로 도입된 주요 운영적 변화를 정리한다.

Feature Standard Chrome Experience Chrome with Gemini Auto Browse
작업 실행 사용자가 사이트를 수동으로 방문하고, 링크를 클릭하며, 데이터를 입력한다. AI 에이전트가 자율적으로 탐색하고, 스크롤하며, 데이터를 입력한다.
멀티태스킹 사용자의 집중이 필요하며 활성 탭이 보여야 한다. 백그라운드 탭에서 실행되며 사용자는 다른 곳에 집중할 수 있다.
복잡한 워크플로 사용자가 여러 탭/창에 걸친 컨텍스트를 관리한다. Gemini가 탭 간 컨텍스트를 유지해 다단계 목표를 완료한다.
상거래 사용자가 수동으로 코드를 검색하고, 가격을 비교한다. 에이전트가 코드를 적용하고, 장바구니를 비교하며, 결제를 미리 입력한다.
보안 모델 Safe Browsing API를 통한 피싱 보호. Gemini Nano를 통한 디바이스 내 사기 탐지 + 인간 확인.

내부 구조: Gemini 3와 Nano Banana

이 업데이트는 단순한 탐색에만 관한 것이 아니라 Chrome의 AI 스택을 전면적으로 개편한 것이다. 경량의 온디바이스 상호작용을 구동하는 것은 Gemini Nano로, 이제 로컬에서 실행되어 데이터를 클라우드로 전송하지 않고도 실시간으로 사기 및 악성 팝업을 탐지한다.

또한 이 업데이트는 내부 코드명 "Nano Banana"인 브라우저 내 이미지 편집 도구를 도입한다. 이를 통해 사용자는 웹에서 찾은 이미지를(예: "이 제품 사진의 배경을 제거") 저장하거나 공유하기 전에 브라우저 탭 내에서 직접 수정할 수 있어 소비와 제작 사이의 마찰을 줄여준다.

Google은 또한 Shopify 및 Target과 같은 주요 소매업체와의 협력을 통해 개발된 "범용 상거래 프로토콜(Universal Commerce Protocol, UCP)"에 대한 지원을 구현했다. UCP는 Auto Browse 에이전트가 쇼핑 카트 및 제품 카탈로그와 더 신뢰성 있게 상호작용할 수 있게 하여, 에이전트가 존재하지 않는 버튼을 클릭하려고 시도하는 '환각(hallucination)' 빈도를 줄인다.

시장 영향 및 제공 범위

Auto Browse 기능은 현재 미국에서 Google의 AI Pro 및 Ultra 가입자에게만 독점적으로 제공된다. 이러한 계층적 출시 방식은 Google이 당분간 에이전트형 브라우징을 표준 유틸리티가 아닌 프리미엄 생산성 도구로 취급하고 있음을 시사한다.

이 조치는 Google을 떠오르는 "AI 네이티브(AI native)" 브라우저들과 직접적으로 대립하게 만든다. 스타트업들이 유사한 기능을 실험해 왔지만, Chrome의 지배력은 고유한 이점을 제공한다. 사용자를 브라우저를 바꾸도록 설득할 필요 없이 기존 경험을 업그레이드하도록 하면 되기 때문이다. 웹 퍼블리셔와 SEO 전문가에게 에이전트형 브라우징의 출현은 AI 에이전트의 사이트 탐색 능력을 최적화하는 것이 인간의 주의를 끌기 위한 최적화만큼 중요해질 수 있는 불안정한 미래를 예고한다.

Gemini AI가 계속 진화함에 따라 이러한 기능들은 미국을 넘어 확장되고 잠재적으로 무료 등급 사용자까지 내려올 것으로 예상할 수 있다. 이로써 인터넷은 우리가 검색하는 도서관에서 우리를 위해 작동하는 서비스로 근본적으로 바뀔 것이다.

추천