AI News

MIT CSAIL, EnCompass로 에이전트 신뢰성 재정의

자율 시스템 분야의 획기적인 도약으로, MIT 컴퓨터 과학 및 인공지능 연구소(CSAIL) 연구진은 Asari AI 및 Caltech과 협력하여 생성형 AI의 가장 지속적인 과제 중 하나인 에이전트의 자체 오류 수정 능력 부족을 해결하기 위해 설계된 새로운 프레임워크인 EnCompass를 공개했습니다.

오늘 발표된 이 프레임워크는 개발자가 대규모 언어 모델(LLM) 에이전트를 구축하는 방식에 패러다임 변화를 가져오며, 복잡한 맞춤형 코드 인프라 없이도 시스템이 추론 경로를 "역추적(backtrack)"하고 최적화할 수 있게 합니다. 초기 벤치마크에 따르면 EnCompass는 복잡한 작업에서 정확도를 15-40% 향상시키는 동시에 필요한 코드베이스를 82% 줄여, 강력한 AI 애플리케이션 구축에 대한 진입 장벽을 크게 낮출 수 있음을 보여줍니다.

AI 에이전트의 "브레인 포그(Brain Fog)" 문제

AI 에이전트가 단순한 챗봇에서 코딩 어시스턴트나 데이터 분석가와 같이 다단계 워크플로우를 실행할 수 있는 자율 시스템으로 진화함에 따라 심각한 신뢰성 병목 현상에 직면하고 있습니다. 표준 에이전트는 일반적으로 작업을 선형적으로 처리합니다. 만약 에이전트가 10단계 과정 중 3단계에서 사소한 실수를 하면 그 오류는 복합적으로 작용하여 종종 마지막 단계에서 완전히 실패하게 됩니다. 연구자들이 "AI 브레인 포그"라고 설명하는 이 현상은 에이전트가 초기 실수로부터 회복하기 위해 고군분투하는 과정에서 문맥을 잃거나 환각(hallucination)을 일으키는 결과를 초래합니다.

전통적으로 이를 해결하려면 개발자가 모든 잠재적 실패 지점에 대해 복잡한 루프와 오류 처리 로직을 하드코딩해야 했습니다. 이러한 "배관(plumbing)" 코드는 종종 에이전트의 실제 로직을 가려 시스템을 취약하게 만들고 유지관리를 어렵게 합니다. 현재의 LLM은 일반적으로 추론 과정에 대한 선천적인 "실행 취소(undo)" 버튼이 부족하여, 오류를 감지하더라도 잘못된 경로를 고수할 수밖에 없습니다.

알고리즘을 위한 "시간 여행" 구현

EnCompass는 에이전트의 워크플로우 로직탐색 전략을 근본적으로 분리함으로써 이 문제를 해결합니다. 선형 실행 모델 대신 EnCompass는 에이전트의 프로그램을 탐색 공간(search space)으로 취급할 수 있게 합니다.

파이썬 데코레이터(@encompass.compile)를 사용하여 개발자는 표준 함수를 탐색 가능한 가능성의 트리로 변환할 수 있습니다. 이를 통해 AI는 다음과 같은 작업을 수행할 수 있습니다:

  • 역추적(Backtrack): 현재 경로가 좋지 않은 결과를 낼 때 이전 상태로 돌아갑니다.
  • 실행 분기(Fork Execution): 최적의 결과를 찾기 위해 여러 추론 전략을 병렬로 탐색합니다.
  • 최적화(Optimize): 핵심 애플리케이션 로직을 다시 작성하지 않고도 에이전트의 워크플로우에 고급 탐색 알고리즘(빔 서치 또는 best-of-N 등)을 적용합니다.

이 기능은 AI 에이전트에게 일종의 "시간 여행"을 가능하게 하여, 마치 인간이 막다른 길에 다다랐음을 깨달았을 때 전략을 다시 생각하는 것처럼 결정을 재검토하고 더 나은 경로를 선택할 수 있게 합니다.

기술적 분석: PAN 모델

내부적으로 EnCompass는 **Probabilistic Angelic Nondeterminism (PAN)**으로 알려진 프로그래밍 모델을 구현합니다. 이를 통해 프레임워크는 에이전트가 수행하려는 작업(목표)과 LLM 출력의 불확실성을 탐색하는 방법(탐색)을 분리할 수 있습니다. 이러한 상호작용을 표준화함으로써 EnCompass는 별도의 오류 수정 코드에 대한 필요성을 없애고 복잡한 상태 관리를 자동으로 처리합니다.

성능 및 효율성의 획기적 발전

이 프레임워크가 개발자 생산성과 에이전트 성능에 미치는 영향은 상당합니다. 에이전트 행동의 "탐색" 구성 요소를 자동화함으로써 EnCompass는 개발자가 오로지 작업 지침에만 집중할 수 있게 합니다.

다음 비교표는 연구 팀의 사례 연구에서 관찰된 효율성 향상을 강조합니다:

비교: 표준 개발 vs. EnCompass 프레임워크

기능 표준 에이전트 개발 EnCompass 프레임워크
오류 처리 수동적이고 경직된 try/except 루프 자동 역추적 및 경로 탐색
코드 양 많음 (과도한 상용구 오버헤드) 적음 (구조적 코드 82% 감소)
정확도 작업 길이가 길어질수록 저하됨 추론 시간 스케일링을 통해 15-40% 향상
유연성 전략 변경이 어려움 파라미터 하나를 변경하여 전략 전환
실행 모델 선형 (Single Shot) 트리 기반 (다중 경로 탐색)

복잡한 추론 작업을 포함한 실제 테스트에서 EnCompass로 구축된 에이전트는 지속적으로 표준 에이전트보다 우수한 성능을 보였습니다. 다양한 실행 경로를 탐색할 수 있는 능력은 기본 LLM이 완벽하지 않더라도 시스템이 잘못된 추론 체인을 필터링하여 여전히 정답에 도달할 수 있음을 의미했습니다.

AI 산업에 미치는 영향

AI 산업에서 EnCompass는 에이전트 워크플로우의 성숙을 의미합니다. AI가 더 나은 결과를 내기 위해 "더 오래 생각"할 수 있다는 개념인 "추론 시간 스케일링(Inference-time scaling)"은 OpenAI 및 Google DeepMind와 같은 연구소의 주요 초점이었습니다. 그러나 EnCompass는 이 기능을 대중화하여 모든 파이썬 개발자가 자신의 애플리케이션에 정교한 추론 탐색을 추가하는 데 사용할 수 있는 범용 도구를 제공합니다.

이러한 변화는 다음과 같은 심오한 영향을 미칩니다:

  • 신뢰성: 에이전트는 이제 정밀도가 중요한 복잡한 소프트웨어 엔지니어링이나 법률 분석과 같은 더 길고 순차적인 작업에서 신뢰를 얻을 수 있습니다.
  • 개발자 접근성: 코드 복잡성을 80% 이상 줄인다는 것은 소규모 팀도 탐색 알고리즘에 대한 깊은 전문 지식 없이도 "더 스마트한" 에이전트를 구축할 수 있음을 의미합니다.
  • 모듈성: 탐색 전략이 로직과 분리되어 있기 때문에 개발자는 프롬프트 로직을 건드리지 않고도 에이전트의 "사고 과정"(예: 그리디 탐색에서 몬테카를로 트리 탐색으로 전환)을 업그레이드할 수 있습니다.

향후 전망

MIT CSAIL과 Asari AI가 이 프레임워크를 더 넓은 커뮤니티에 공개함에 따라, 시장에 "자가 수정" 에이전트의 물결이 일 것으로 예상됩니다. 현재의 LLM은 인상적이지만, 다단계 작업에서의 취약성으로 인해 유용성이 제한되어 왔습니다. EnCompass는 단순히 추측하는 것이 아니라, 작업이 제대로 완료될 때까지 생각하고, 역추적하고, 검증하는 차세대 자율 소프트웨어 에이전트를 구축하는 데 필요한 구조적 무결성을 제공합니다.

추천
ThumbnailCreator.com
AI 기반 도구로 빠르고 쉽게 멋지고 전문적인 YouTube 썸네일을 제작하세요.
VoxDeck
시각 혁명을 선도하는 AI 프레젠테이션 제작기
BGRemover
SharkFoto BGRemover를 사용하여 온라인에서 이미지 배경을 쉽게 제거하세요.
Flowith
Flowith는 무료 🍌Nano Banana Pro 및 기타 효과적인 모델을 제공하는 캔버스 기반 에이전트 워크스페이스입니다...
Qoder
Qoder는 소프트웨어 프로젝트의 계획, 코딩 및 테스트를 자동화하는 AI 기반 코딩 어시스턴트입니다.
Refly.ai
Refly.AI는 비기술 창작자가 자연어와 시각적 캔버스를 사용해 워크플로를 자동화할 수 있도록 지원합니다.
Elser AI
텍스트와 이미지를 애니메 스타일 아트, 캐릭터, 음성 및 단편 영화로 변환하는 올인원 웹 스튜디오입니다.
Skywork.ai
Skywork AI는 AI를 사용하여 생산성을 향상시키기 위한 혁신적인 도구입니다.
FineVoice
텍스트를 감정으로 바꾸세요 — 몇 초 만에 표현력 있는 AI 보이스를 복제하고 디자인하며 생성하세요.
FixArt AI
FixArt AI는 가입 없이 이미지 및 동영상 생성을 위한 무료·무제한 AI 도구를 제공합니다.
SharkFoto
SharkFoto는 영상, 이미지, 음악을 효율적으로 제작 및 편집할 수 있는 올인원 AI 기반 플랫폼입니다.
Funy AI
상상을 영상으로! 이미지나 텍스트로 AI 비키니, 키스 영상을 만드세요. AI 옷 체인저 기능도 체험해보세요. 가입 없이 무료!
Pippit
Pippit의 강력한 AI 도구로 콘텐츠 제작을 향상시키세요!
Yollo AI
AI 파트너와 대화하고 창작하세요. 이미지 투 비디오(Img2Vid), AI 이미지 생성 기능.
KiloClaw
호스티드 OpenClaw 에이전트: 원클릭 배포, 500개 이상의 모델, 보안 인프라 및 팀과 개발자를 위한 자동화된 에이전트 관리.
AI Clothes Changer by SharkFoto
SharkFoto의 AI Clothes Changer는 사실적인 핏, 질감 및 조명으로 의상을 즉시 가상으로 착용해볼 수 있게 해줍니다.
SuperMaker AI Video Generator
SuperMaker와 함께 멋진 동영상, 음악 및 이미지를 손쉽게 만들 수 있습니다.
AnimeShorts
최첨단 AI 기술로 놀라운 애니메이션 짧은 영상을 쉽게 만드세요.
Wan 2.7
전문가 수준의 AI 비디오 모델로 정밀한 모션 제어와 다중 뷰 일관성을 제공합니다.
BeatMV
노래를 영화 같은 뮤직비디오로 바꾸고 AI로 음악을 만드는 웹 기반 AI 플랫폼입니다.
WhatsApp AI Sales
WABot은 실시간 스크립트, 번역 및 의도 감지를 제공하는 WhatsApp AI 영업 코파일럿입니다.
kinovi - Seedance 2.0 - Real Man AI Video
사실적인 사람 결과물을 제공하는 무료 AI 영상 생성기, 워터마크 없음, 전체 상업적 사용 권한 포함.
UNI-1 AI
UNI-1은 시각적 추론과 고충실도 이미지 합성을 결합한 통합 이미지 생성 모델입니다.
Kirkify
Kirkify AI는 밈 제작자를 위해 시그니처 네온 글리치 미학을 적용한 얼굴 교체 바이럴 밈을 즉시 생성합니다.
Text to Music
텍스트나 가사를 AI가 생성한 보컬, 악기 및 멀티트랙 내보내기와 함께 전체 스튜디오 품질의 곡으로 변환하세요.
Iara Chat
Iara Chat: AI 기반의 생산성과 커뮤니케이션 도우미.
Video Sora 2
Sora 2 AI는 텍스트나 이미지를 몇 분 안에 짧고 물리학적으로 정확한 소셜 및 전자상거래용 비디오로 변환합니다.
Lyria3 AI
텍스트 프롬프트, 가사, 스타일로부터 고품질의 완전 제작된 곡을 즉시 생성하는 AI 음악 생성기.
Tome AI PPT
AI 기반 프레젠테이션 제작기: 몇 분 만에 전문적인 슬라이드 데크를 생성, 미화 및 내보냅니다.
Paper Banana
AI 기반 도구로 학술 텍스트를 즉시 게시용 방법도와 정밀한 통계 플롯으로 변환합니다.
Free AI Video Maker & Generator
무료 AI 비디오 메이커 & 생성기 – 무제한, 가입 필요 없음
Atoms
AI 기반 플랫폼으로 다중 에이전트 자동화를 사용해 코드 없이 몇 분 만에 풀스택 앱과 웹사이트를 구축합니다.
AI Pet Video Generator
AI 기반 템플릿과 즉시 HD 내보내기를 사용하여 사진으로부터 소셜 플랫폼용 바이럴하고 공유 가능한 반려동물 영상을 만듭니다.
Ampere.SH
무료 관리형 OpenClaw 호스팅. $500 Claude 크레딧으로 60초 내에 AI 에이전트를 배포하세요.
HookTide
사용자의 목소리를 학습해 콘텐츠를 만들고 참여를 유도하며 성과를 분석하는 AI 기반 LinkedIn 성장 플랫폼입니다.
Palix AI
크리에이터를 위한 올인원 AI 플랫폼으로, 통합 크레딧으로 이미지, 동영상 및 음악을 생성합니다.
Hitem3D
Hitem3D는 단일 이미지를 AI로 고해상도 제작-ready 3D 모델로 변환합니다.
Seedance 20 Video
Seedance 2는 일관된 캐릭터, 멀티샷 스토리텔링 및 2K 네이티브 오디오를 제공하는 멀티모달 AI 비디오 생성기입니다.
GenPPT.AI
AI 기반 PPT 제작 도구로, 몇 분 안에 발표자 노트와 차트가 포함된 전문적인 PowerPoint 프레젠테이션을 생성, 미화 및 내보낼 수 있습니다.
Create WhatsApp Link
분석, 브랜드 링크, 라우팅 및 다중 에이전트 채팅 기능을 갖춘 무료 WhatsApp 링크 및 QR 생성기.
Veemo - AI Video Generator
Veemo AI는 텍스트나 이미지로부터 고품질의 비디오와 이미지를 빠르게 생성하는 올인원 플랫폼입니다.
Gobii
Gobii는 팀이 24/7 자율 디지털 워커를 생성하여 웹 조사 및 일상 업무를 자동화할 수 있게 합니다.
ainanobanana2
Nano Banana 2는 정밀한 텍스트 렌더링과 피사체 일관성을 유지하면서 4–6초 내에 프로 품질의 4K 이미지를 생성합니다.
AI FIRST
자연어를 통해 연구, 브라우저 작업, 웹 스크래핑 및 파일 관리를 자동화하는 대화형 AI 어시스턴트입니다.
AirMusic
AirMusic.ai는 텍스트 프롬프트로부터 스타일·무드 커스터마이즈와 스템(stems) 내보내기를 지원하는 고품질 AI 음악 트랙을 생성합니다.
GLM Image
GLM Image는 자기회귀(autoregressive) 모델과 확산(diffusion) 모델을 결합한 하이브리드 방식을 통해 뛰어난 텍스트 렌더링을 갖춘 고충실도 AI 이미지를 생성합니다.
WhatsApp Warmup Tool
AI 기반 WhatsApp 워밍업 도구는 계정 차단을 방지하면서 대량 메시지 전송을 자동화합니다.
Manga Translator AI
AI Manga Translator는 만화 이미지를 온라인에서 즉시 여러 언어로 번역합니다.
TextToHuman
AI 텍스트를 즉시 자연스럽고 인간다운 글로 재작성하는 무료 AI 휴머니라이저. 가입 필요 없음.
Remy - Newsletter Summarizer
Remy는 이메일을 이해하기 쉬운 인사이트로 요약하여 뉴스레터 관리를 자동화합니다.
FalcoCut
FalcoCut: 웹 기반 AI 플랫폼으로 영상 번역, 아바타 영상, 음성 클로닝, 페이스스왑 및 숏비디오 생성 기능을 제공합니다.
Telegram Group Bot
TGDesk는 리드 확보, 참여 증대 및 커뮤니티 성장을 돕는 올인원 Telegram 그룹 봇입니다.
SOLM8
전화해서 대화하는 AI 여자친구. 기억을 가진 실제 음성 대화. 그녀와 함께하는 모든 순간이 특별하게 느껴집니다.
LTX-2 AI
오픈소스 LTX-2는 텍스트 또는 이미지 프롬프트로부터 네이티브 오디오 동기화가 적용된 4K 영상을 빠르게 생성하며, 프로덕션 준비가 되어 있습니다.
Seedance 2 AI
이미지, 영상, 오디오, 텍스트를 결합해 영화 같은 짧은 클립을 생성하는 멀티모달 AI 비디오 생성기입니다.
Vertech Academy
Vertech는 학생과 교사가 효과적으로 배우고 가르칠 수 있도록 설계된 AI 프롬프트를 제공합니다.

MIT, AI 에이전트 최적화를 위한 EnCompass 프레임워크 공개

MIT CSAIL이 EnCompass 프레임워크를 소개합니다. 이 프레임워크는 AI 에이전트가 LLM 출력물을 되돌아가 최적화할 수 있게 하며, 코드량은 82% 줄이면서 정확도를 15~40% 향상시킵니다.