AI News

OpenAI, GPT-5.2 통합으로 연구 역량 강화

OpenAI가 ChatGPT 내 딥 리서치(Deep Research) 기능의 대대적인 업그레이드를 공식적으로 출시했으며, 이제 고도로 발전된 GPT-5.2 모델로 시스템을 구동합니다. 이 전략적 강화는 인공지능이 복잡한 정보 검색 및 합성을 처리하는 방식에서의 중추적인 변화를 나타내며, 단순한 쿼리 응답을 넘어 완전히 자율적인 에이전틱(Agentic) 연구 워크플로우로 나아갑니다. 이번 업데이트는 오랫동안 기다려온 일련의 기능들을 도입했으며, 특히 특정 웹사이트에 대한 타겟 검색 수행, 서드파티 애플리케이션과의 통합, 실시간 연구 진행 상황 추적 기능이 눈에 띕니다.

데이터 합성을 위해 AI에 의존하는 전문가와 학자들에게 이번 업데이트는 이전 버전에서 발견된 몇 가지 중요한 문제점들을 해결해 줍니다. 기본 아키텍처를 o3 및 o4 mini 모델에서 더 강력한 GPT-5.2로 이전함으로써, OpenAI는 연구 에이전트의 추론 능력과 문맥 이해도를 향상시키는 것을 목표로 합니다. 이러한 행보는 ChatGPT를 챗봇에서 인간의 개입을 최소화하면서 다단계 과업을 수행할 수 있는 포괄적인 문제 해결 플랫폼으로 진화시키려는 OpenAI의 지속적인 의지를 보여줍니다.

웹사이트 특정 검색(website-specific search) 기능의 도입은 정보의 출처가 정보 자체만큼이나 중요한 법률 연구, 의료 분석, 기술 실사 등 전문 분야에 특히 혁신적입니다. 이제 사용자는 AI의 초점을 신뢰할 수 있는 도메인으로 유도할 수 있어, 개방형 웹 스크래핑과 흔히 연관되는 노이즈를 크게 줄일 수 있습니다.

GPT-5.2로 구동되는 딥 리서치

이번 업그레이드의 핵심은 OpenAI의 생성 능력의 최신 프런티어를 대표하는 모델인 GPT-5.2의 통합에 있습니다. 이전에 2025년에 출시된 딥 리서치는 o3 및 o4 mini 모델에 의존했습니다. 해당 모델들은 효율적이었지만, 매우 복잡하고 다층적인 연구 과업에 필요한 미묘한 추론이 가끔 부족했습니다. GPT-5.2로의 전환은 단순한 성능 향상이 아닙니다. 이는 시스템의 "에이전틱" 동작을 강화하기 위해 설계된 근본적인 아키텍처 업그레이드입니다.

GPT-5.2는 연구 과정에 우수한 문맥 유지 및 논리적 연역 능력을 제공합니다. 사용자가 딥 리서치(Deep Research) 세션을 시작하면 모델은 단순히 정답을 찾는 데 그치지 않고 연구 전략을 수립합니다. 사용자의 프롬프트를 하위 쿼리로 분해하고, 필요한 정보 공백을 식별하며, 데이터를 수집하기 위해 다단계 계획을 실행합니다. 새 모델의 향상된 추론 엔진을 통해 출처의 신뢰성을 더 잘 평가하고 상충되는 정보를 일관된 내러티브로 합성할 수 있습니다.

이러한 전환은 딥 리서치의 "깊이(depth)" 문제도 해결합니다. 이전 모델들이 표면적인 요약에서 멈췄을 수 있는 부분에서 GPT-5.2는 문의 과정을 더욱 엄격하게 추구하도록 설계되어, 인용을 추적하고 데이터 포인트를 교차 참조하여 종합적인 보고서를 작성합니다. 이러한 능력은 ChatGPT를 단순한 대화 파트너가 아니라, 수 시간의 수동 조사를 수 분의 처리 시간으로 압축할 수 있는 지치지 않는 연구 조수로서 자리매김하게 합니다.

세밀한 제어: 웹사이트 특정 검색

파워 유저 커뮤니티에서 가장 많이 요청된 기능 중 하나인 **타겟 웹사이트 검색(Targeted Website Search)**이 마침내 도입되었습니다. 과거에 AI 웹 브라우징은 종종 "블랙박스" 프로세스였습니다. 사용자는 정보를 요청할 수 있었지만 AI가 어디를 검색하는지에 대해서는 거의 제어할 수 없었으며, 이는 저품질 SEO 팜이나 무관한 블로그로 인해 결과가 희석되는 결과를 초래했습니다.

이번 새로운 업데이트를 통해 OpenAI는 주도권을 다시 사용자에게 넘겨주었습니다. 이제 연구자는 ChatGPT에 특정 도메인이나 URL로 검색을 제한하도록 지시할 수 있습니다. 이러한 수준의 세밀한 제어는 다양한 전문적인 사용 사례에서 게임 체인저가 됩니다:

  • 학술 연구: 검색을 .edu 도메인이나 arXiv 또는 JSTOR(접근 가능한 경우)와 같은 특정 저장소 사이트로 제한합니다.
  • 시장 분석: 제3자 애그리게이터의 왜곡 없이 원시 데이터를 수집하기 위해 경쟁사 웹사이트나 특정 금융 뉴스 포털에 집중합니다.
  • 기술 문서: 구식 포럼 조언을 피하고 특정 소프트웨어 버전에 대한 공식 문서 내에서만 검색하도록 AI를 유도합니다.

이 기능은 딥 리서치를 일반적인 도구에서 정밀 기기로 변모시킵니다. 검색 공간을 제한함으로써 사용자는 결과물의 관련성과 신뢰성을 획기적으로 높일 수 있습니다. 이는 광활한 인터넷과 큐레이팅된 내부 지식 베이스 사이의 간극을 효과적으로 메워줍니다.

향상된 워크플로우 및 상호작용성

모델 업그레이드와 검색 제어 외에도, OpenAI는 동적이고 전문적인 워크플로우를 지원하기 위해 딥 리서치의 사용자 경험(UX)을 크게 개선했습니다. 이전 AI 검색 도구의 정적인 "기다리고 지켜보기" 방식은 투명하고 상호작용적인 프로세스로 대체되었습니다.

실시간 진행 상황 추적

사용자는 이제 연구 과정이 전개되는 모습을 볼 수 있습니다. 인터페이스는 AI의 "사고 과정"을 실시간으로 표시하여 어떤 쿼리를 실행 중인지, 어떤 사이트를 방문 중인지, 어떤 데이터를 추출 중인지 보여줍니다. 이러한 투명성은 시스템 결과물에 대한 신뢰를 구축하는 데 매우 중요합니다. 사용자가 AI가 무관한 정보의 늪에 빠지는 것을 발견하면 즉시 개입할 수 있습니다.

중단 및 조종

새로운 시스템은 "인간 참여형(human-in-the-loop)" 상호작용을 지원합니다. 사용자는 더 이상 수동적인 관찰자가 아닙니다. 연구 진행을 중단하고 명확한 질문을 던지거나, 원래의 프롬프트를 수정하거나, AI가 놓쳤을 수 있는 새로운 출처를 수동으로 주입할 수 있습니다. 이러한 협업 방식은 코스 수정이 자연스러운 워크플로우의 일부인 인간 주니어 분석가와 함께 일하는 모습을 모방합니다.

전체 화면 보고서

복잡한 결과물을 위해 좁은 채팅 버블을 사용하던 시대는 지났습니다. 업데이트된 딥 리서치는 전체 화면의 서식 있는 보고서를 생성할 수 있습니다. 이 보고서들은 가독성과 직접적인 활용도를 위해 설계되었으며, 채팅 로그보다는 전문적인 보고서(brief)와 유사합니다. 여기에는 인용구, 데이터 표, 쉽게 내보내거나 공유할 수 있는 구조화된 요약이 포함되는 경우가 많습니다.

딥 리서치 역량 비교

다음 표는 이전 버전의 딥 리서치와 새로운 GPT-5.2 기반 버전의 주요 차이점을 요약한 것입니다:

기능 이전 딥 리서치 (2025) 새로운 딥 리서치 (GPT-5.2)
기반 모델 o3 / o4 mini GPT-5.2
검색 범위 일반적인 공개 웹 타겟 / 웹사이트 특정
사용자 제어 수동적 (입력 후 대기) 상호작용적 (중단 및 조종)
출력 형식 표준 채팅 응답 전체 화면 구조화된 보고서
앱 통합 제한적 / 없음 연결된 앱(Connected Apps) 지원
투명성 블랙박스 프로세싱 실시간 진행 상황 추적

AI 에이전트의 부상

OpenAI는 이번 업데이트를 "AI 에이전트(AI agents)" 배포를 향한 중요한 진전으로 명시적으로 규정하고 있습니다. 단일 프롬프트에 단일 답변으로 응답하는 표준 챗봇과 달리, 에이전트는 복잡한 목표를 달성하기 위해 인식하고, 추론하고, 행동하고, 반복하는 능력으로 정의됩니다.

GPT-5.2에서 실행되는 딥 리서치는 이러한 에이전틱 철학을 구현합니다. 이는 사용자의 초기 쿼리를 기반으로 다단계 웹 검색(multi-stage web searches)을 독립적으로 시작합니다. 질문에 답하기에 충분한 정보가 언제 확보되었는지, 그리고 언제 더 깊이 파고들어야 하는지를 스스로 결정합니다. 이러한 자율성이 "AI가 탑재된 검색 엔진"과 진정한 "AI 연구원"을 구분 짓는 요소입니다.

외부 앱을 연결하는 기능은 이러한 에이전틱 잠재력을 더욱 증폭시킵니다. 모든 호환 앱에 대한 구체적인 세부 사항은 계속 발전하고 있지만, 이 아키텍처는 딥 리서치가 웹을 읽는 것뿐만 아니라 내부 기업 데이터, 프로젝트 관리 도구 및 문서 저장소와도 연동될 수 있는 미래를 암시합니다. 이는 AI가 공용 웹 데이터와 독점적인 내부 지식을 합성할 수 있는 통합 연구 환경을 조성합니다.

한계 및 현실 점검

인상적인 역량의 비약에도 불구하고 기술의 한계에 대해 현실적인 관점을 유지하는 것이 중요합니다. OpenAI는 웹 검색이 환각(hallucination) 발생률을 크게 줄여주기는 하지만, 이를 완전히 제거하지는 못한다는 사실을 투명하게 밝혀왔습니다.

오류의 위험은 생성된 텍스트의 길이와 복잡성에 비례하여 증가합니다. GPT-5.2라 할지라도 복잡한 연구를 오해하거나, 유사한 이름의 두 출처를 혼동하거나, 결함이 있는 데이터를 기반으로 설득력 있는 주장을 제시할 수 있습니다. 실시간 웹 검색의 접지(grounding)를 통해 대폭 완화되기는 했지만, LLM의 "확률적 앵무새(stochastic parrot)" 본능은 기술의 근본적인 특성으로 남아 있습니다.

따라서 사용자는 중요한 정보를 계속해서 검증해야 합니다. 새로운 기능들은 특정 사이트 검색을 허용하고 연구 경로를 보여줌으로써 이러한 검증 과정을 돕지만, 인간의 판단을 대신할 수는 없습니다. 딥 리서치는 강력한 가속기이지만, 정확성에 대한 최종 책임은 여전히 인간 사용자에게 있습니다.

결론

OpenAI의 딥 리서치를 GPT-5.2로 업그레이드한 것은 단순히 버전 숫자가 올라간 것 이상의 의미를 가집니다. 이는 정보 발견을 위해 사용자가 AI와 상호작용하는 방식을 재구조화한 것입니다. GPT-5.2의 가공되지 않은 추론 능력과 웹사이트 특정 검색 및 실시간 추적과 같은 정밀한 제어 기능을 결합함으로써, OpenAI는 더 높은 수준의 정확성과 투명성을 요구하는 지식 노동자들에게 직접적으로 어필하는 도구를 만들어냈습니다.

Anthropic과 같은 경쟁사들이 Claude Opus 4.6으로 경계를 넓히는 등 AI 에이전트(AI agent) 환경의 경쟁이 치열해짐에 따라, 심층적이고 자율적인 연구 역량을 채팅 인터페이스에 직접 통합하려는 OpenAI의 집중은 현대 디지털 워크플로우에서 중심적인 유틸리티로서의 위치를 공고히 합니다. Creati.ai 독자들에게 이번 업데이트는 적절한 수준의 감독과 검증이 수반된다면 활용할 수 있는 강력하고 새로운 역량을 의미합니다.

추천