Attack Agent는 대형 언어 모델을 활용하여 체계적으로 NLP 애플리케이션의 보안 취약점을 탐색합니다. 에이전트 기반 워크플로우를 사용하여 특정 API에 맞는 적대적 입력을 자동으로 제작, 실행하며 응답을 분석하여 이상 또는 의도하지 않은 행동을 식별합니다. 사용자 정의 공격 모듈을 지정하거나 퍼징 깊이를 제어하고 동적 제약 조건을 구성할 수 있습니다. 이 도구는 배치 처리, 발견된 문제 자동 보고, CI/CD 파이프라인과의 통합을 지원하여 지속적인 보안 검증이 가능하며, 확장 가능한 플러그인과 종합적인 분석 기능으로 보안 연구원과 개발자가 AI 시스템의 견고성과 준수성을 향상시킬 수 있게 합니다.