메뉴 닫기

SageMaker Unified Studio를 활용한 자동화된 AIOps 실전 구축 가이드

자동화된 AIOps 구현을 위한 SageMaker Unified Studio 활용 가이드: 실전 구축 편

AI/ML 기술이 비즈니스 전반에 확산됨에 따라, 이를 안정적으로 운영하고 관리하는 체계적 접근인 AIOps(AI for IT Operations)의 중요성이 점점 커지고 있습니다. AWS에서는 Amazon SageMaker Unified Studio를 기반으로 한 AIOps 아키텍처를 제공하며, 이번 글에서는 이 구조를 실제로 어떻게 구현하는지에 대해 다룹니다.

이전 포스트에서는 아키텍처 전반, 멀티 어카운트 구성, 프로젝트 프로파일과 저장소 전략 등 환경 설정에 대해 소개했으며, 이번에는 그 환경을 기반으로 한 세부 구축 및 자동화된 워크플로우 구현 방법을 설명합니다. 본 포스트는 특별히 관리자와 데이터 과학자, ML 엔지니어 등 주요 역할별 활용 전략과 설정에 중점을 두어 설명하며, 자동화, 보안, 거버넌스, 배포 가이드 등의 키워드를 중심으로 구성됩니다.

SageMaker Unified Studio 기반의 AIOps 아키텍처 개요

SageMaker Unified Studio 기반의 구축 환경은 사용자 관점에서 사용자 개인화 환경을 제공하면서도, 백엔드에서는 완전 자동화된 프로젝트 생성과 실험 관리, 모델 배포가 수행되도록 구성됩니다. 이 구조는 아래와 같은 3개의 핵심 역할을 전제로 한 멀티레이어 구조로 설계되어 있습니다.

SageMaker AIOps 전체 아키텍처 다이어그램

프로젝트 초기화: 자동화된 엔드 투 엔드 구성

관리자는 SageMaker Unified Studio의 도메인을 설정하고 IAM 정책 구성, GitHub 연동, 프로젝트 템플릿과 관련 인프라를 사전에 구성합니다. 이후 데이터 과학자가 프로젝트를 생성하면 EventBridge가 이벤트를 감지하여 Lambda를 호출, 자동으로 model-build와 model-deploy 저장소를 생성하고 초기 코드를 배포합니다.

프로젝트 초기화 자동화 플로우 다이어그램

ML 모델 개발 및 배포 자동화: CI/CD 통합

모델 개발은 JupyterLab 기반 notebook 환경에서 이루어지며, 파이프라인은 SageMaker Pipelines를 통해 구성됩니다. 모델이 성공적으로 학습되고 SageMaker Model Registry에 등록되면, 승인을 통해 배포 파이프라인이 활성화됩니다. 이 과정을 GitHub Actions 기반의 CI/CD 시스템이 관리합니다.

모델 배포 자동화 흐름을 보여주는 다이어그램

각 저장소엔 IaC 기반의 코드가 포함돼 있어 엔드포인트 설정, 인프라 배포, 오토스케일링, 롤백 등의 자동화가 가능합니다. 모든 변경은 Git을 기반으로 버전 관리되며 보안 감사 기록도 제공합니다.

주요 역할별 기능 수행

  1. 관리자
  • 도메인 설정, IAM 정책 구성 등 인프라 기반 자동화
  • 프로젝트 템플릿 및 CI/CD 표준화
  • 프로젝트 환경에 대한 통합 거버넌스 수행

관리자 시스템 구성 흐름도

  1. 데이터 과학자
  • 템플릿 기반으로 프로젝트 즉시 시작
  • notebook을 통해 모델 개발 및 실험
  • SageMaker Model Registry에 결과 등록
  1. ML 엔지니어
  • 파이프라인 분석 및 유지관리
  • SageMaker Endpoint 관리, 성능 모니터링

CI/CD 파이프라인 구성 예시

  1. 모델 빌드 파이프라인
    GitHub Actions 기반으로 코드 커밋 또는 PR 발생 시 파이프라인 실행. ML pipeline 정의 확인, 전처리, 학습, 평가 및 모델 레지스트리 등록까지 수행

모델 빌드 파이프라인 실행 순서 설명 이미지

  1. 모델 배포 파이프라인
    모델 승인을 통해 EventBridge 이벤트가 발생하면 Lambda를 통해 배포 시작. IaC 방식의 정의에 따라 SageMaker Endpoint를 자동 구성 및 업데이트 수행

모델 배포 파이프라인 구성 체계

데이터 통합 및 관리

SageMaker Catalog와 AWS Glue 통합을 통해 구조적 데이터를 파이프라인 내에서 사용할 수 있으며, 등록된 데이터셋에 대한 권한 제어 및 사전 승인 기반 접근을 지원합니다.

SageMaker Catalog 기반 데이터 전처리 흐름도

보안 및 거버넌스 내재화

모든 프로젝트, 사용자, 리포지토리 및 인프라는 IAM 기반 Role 기반 접근 제어(RBAC)로 구성되며, Git 기반 버전 제어, CI/CD 내 보안 자동 확인 등의 요소가 내재화되어 있어 보안 기준을 자동 준수하는 구조가 확보됩니다.

프로젝트 구성 검증

Unified Studio 내 ML Pipelines, Model Registry, Endpoint 탭에서 각 요소 상태를 점검하여 자동화 구성이 이상없이 작동하고 있음을 검증할 수 있습니다.

자동화된 저장소 및 파이프라인 생성 확인 화면

결론

이번 포스트에서는 SageMaker Unified Studio 기반의 AIOps 환경을 실제로 어떻게 '자동화'하고 '배포'할 수 있는지를 전 과정을 통해 다뤘습니다. 멀티 계정, 여러 프로젝트에 확장 가능하며 보안과 거버넌스를 내재시킨 구조는 엔터프라이즈 수준의 AI 운영 체계를 가능하게 합니다.

특히 템플릿 기반의 프로젝트 설정, CI/CD 자동화, 데이터 통합 기능은 기업이 AI 프로젝트를 아이디어에서 배포까지 일관되게 실행할 수 있도록 도와줍니다. AWS에서 제공하는 구축 코드 및 가이드를 통해 자체 AIOps 체계를 보다 빠르고 안정적으로 정착시켜 보시기 바랍니다.

https://aws.amazon.com/blogs/machine-learning/automate-aiops-with-sagemaker-unified-studio-projects-part-2-technical-implementation/

AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!

(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기


AI, Cloud 도입 상담 배너