Rapid7의 취약점 점수를 자동화한 Amazon SageMaker 기반 AI 파이프라인 구축 사례

Rapid7, Amazon SageMaker AI를 활용해 보안 취약성 점수를 자동화한 방법

보안 위협이 점점 고도화됨에 따라 기업들은 클라우드, 온프레미스, 엣지 디바이스 등 다양한 인프라를 통합적으로 운영하며 보안 위협에 즉각적으로 대응해야 합니다. 이러한 환경에서 취약점 관리(Vulnerability Management)는 기업의 위험을 최소화하는 핵심 요소입니다. 그러나 수많은 자산을 가진 기업에서는 수동으로 취약점을 평가하고 우선순위를 정하는 일이 매우 비효율적일 수 있습니다. 이를 해결하기 위해 Rapid7은 Amazon SageMaker AI를 기반으로 취약점 점수 예측에 머신러닝 자동화를 도입했습니다.

SageMaker 기반의 end-to-end 자동화 아키텍처

Rapid7은 CVSS(Common Vulnerability Scoring System) v3.1 기반 취약점 점수를 자동 계산하는 머신러닝 파이프라인을 구축하였습니다. 이 자동화는 데이터 다운로드, 전처리, 모델 학습, 평가, 배포를 포괄하는 전체 과정을 포함합니다. 이 과정은 SageMaker AI와 GitHub, Jenkins 같은 DevOps 도구와 결합된 CI/CD 구조로 운영됩니다.

SageMaker 기반 Rapid7 ML 파이프라인 아키텍처 다이어그램

Rapid7의 파이프라인은 Python 기반으로 각 단계를 모듈화하여 Docker 컨테이너에서 실행되고, SageMaker Pipelines SDK로 오케스트레이션됩니다. CVSS는 8개의 독립된 메트릭을 기반으로 하므로, Rapid7은 각 메트릭별로 별도의 모델을 병렬로 학습하도록 구성했습니다.

8개의 모델이 병렬로 작동하는 파이프라인 설계 개요

데이터 적재 및 전처리 과정 자동화

일반적으로 CVSS 데이터를 포함한 공개 취약점 정보는 지속적으로 업데이트됩니다. Rapid7은 학습 시점마다 최신 데이터를 다운로드하도록 구성하였고, 이 데이터를 Amazon S3에 저장하여 파이프라인의 전 과정에서 활용했습니다. 전처리 과정은 데이터를 구조화하는 동시에 학습, 검증, 테스트 세트(8:1:1)로 분할하며 다음 단계와 연결됩니다.

모델 학습, 평가, 배포 자동화

각 CVSS 메트릭을 위한 모델은 SageMaker PyTorch 프레임워크를 활용하여 학습합니다. 학습이 완료되면, 평가 단계에서는 모델 정확도를 측정하고, 기준을 만족한 경우에만 SageMaker Model Registry에 등록됩니다. 이 같은 조건 기반 흐름 제어는 ConditionStep을 이용하여 자동화되었습니다.

정확도 기준에 따른 모델 등록 조건을 포함한 파이프라인 정의

모델 레지스트리와 추론 배포

모든 학습된 모델은 SageMaker Model Registry에서 버전 관리되며 최신 성능 지표를 바탕으로 평가 후 승인 상태로 등록됩니다. 이후 적합한 모델은 SageMaker Endpoint에 배포되어 새로운 취약점 데이터에 대한 실시간 CVSS 점수 예측이 가능해집니다. 뿐만 아니라 SageMaker의 Inference Components 기능을 활용해 최대 8개의 모델을 하나의 인스턴스에서 동시 운영함으로써 컴퓨팅 리소스 비용을 50%까지 절감했습니다.

운영 및 모니터링 자동화

배포된 모델은 Amazon CloudWatch와 Grafana 대시보드를 통해 지연 시간, 예측 오류율, 호출 횟수 등 주요 지표를 시각화하여 관리됩니다. 이를 통해 Rapid7은 시스템 신뢰성, 예측 정확도를 높이고 지속적인 모델 품질 관리도 실현했습니다.

자동화 도입의 이점

Rapid7은 이 과정을 통해 다음과 같은 실질적 효과를 얻었습니다:

운영 간섭 없이 매달 반복되는 모델 재학습/재배포 과정의 자동화로 월 2~3일의 엔지니어링 자원 절감
20개 이상의 수작업 제거
동시 추론을 위한 단일 인프라 사용으로 50% 클라우드 비용 절감
최신 공개 취약점(CVE)에 즉시 CVSS 점수를 할당하여 보안 대응 속도 극대화

결론

AI 및 ML 기술의 활용은 단지 모델 성능 향상에 그치는 것이 아니라, 기업의 보안 운영 전체를 자동화하고 최적화하는 방향으로 확장되고 있습니다. Rapid7 사례는 AWS SageMaker를 활용한 머신러닝 파이프라인 자동화 및 모델 추론 배포 가이드로서 선도적인 사례라 볼 수 있습니다. 특히, 반복 작업을 자동화하고 정확도를 기준으로 모델 배포를 조건화함으로써 효율성과 신뢰성을 크게 확보했습니다.

보안 분석, 위험점수 예측, 자동화된 AI 모델 배포 전략을 고민하는 기업이라면 이번 사례를 기반으로 자사의 ML DevOps 환경을 비교 분석하고 도입 활용 방안에 대해 검토해보시기 바랍니다.

https://aws.amazon.com/blogs/machine-learning/how-rapid7-automates-vulnerability-risk-scores-with-ml-pipelines-using-amazon-sagemaker-ai/

AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!

(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기

Rapid7의 취약점 점수를 자동화한 Amazon SageMaker 기반 AI 파이프라인 구축 사례

카테고리