메뉴 닫기

Amazon SageMaker로 구현하는 AI 운영 자동화 아키텍처 전략

AI 운영 자동화의 핵심, Amazon SageMaker Unified Studio 아키텍처 가이드

들어가며

인공지능(AI) 기술의 확산에 따라 기업들은 데이터와 분석, ML 모델을 통합하고 효율적인 운영을 위한 체계적인 플랫폼이 필요하게 되었습니다. Amazon SageMaker Unified Studio는 그러한 요구를 지원하는 강력한 플랫폼으로, AIOps(AI 운영 자동화) 구현에 최적화된 구조를 제공합니다. 본 글에서는 SageMaker Unified Studio를 기반으로 한 AI 운영 자동화 아키텍처를 소개하고, 다중 계정 환경에서의 활용과 자동화, 멀티테넌시 구현 전략을 함께 살펴보겠습니다.

본론

SageMaker Unified Studio 개요 및 주요 구성

SageMaker Unified Studio는 데이터, 분석, AI/ML 전체 수명주기를 하나의 관리 환경 내에 통합하는 AWS 서비스입니다. 이를 통해 조직은 프로젝트 기반으로 협업하며, CI/CD 도입, 거버넌스 통제, 멀티테넌시 보안 등을 유연하게 적용할 수 있습니다.

SageMaker AIOps 멀티 계정 아키텍처 다이어그램

여기서 핵심 전략은 다중 AWS 계정 구조 도입을 통해 보안을 강화하고 지속적인 AI 운영 자동화를 실현하는 것입니다.

다중 계정 구조 및 사용자 역할

AIOps 자동화에서는 사용자 역할에 따른 분리를 명확히 해야 하며, 다음과 같은 계정 구조가 권장됩니다:

  • 공유 서비스 계정: 프로젝트 템플릿, 중앙 모델 레지스트리, CI/CD 도구 등 공통 리소스 호스팅
  • LOB(업무부서) 개발 계정: 데이터 과학자들이 초기 개발 및 단위 테스트 수행
  • LOB 테스트 계정: 통합 테스트 및 배포 검증 수행
  • LOB 운영 계정: 운영 환경에서의 A/B 테스트 및 최종 배포
  • 거버넌스 계정: 사용자, 프로젝트, Git 연결, 카탈로그 관리를 위한 도메인 구성 유지

각 사용자 역할은 아래와 같습니다:

  • 데이터 과학자: 모델 개발 및 실험
  • AI 엔지니어: 파이프라인 구성 및 배포 자동화 구현
  • 관리자: 리소스 관리 및 환경 설정
  • 거버넌스 책임자: 준수 및 위험 관리, 승인 워크플로우 검토

자동화 워크플로우와 활용 방법

AIOps 자동화의 핵심은 프로젝트 생성에서 운영 배포까지 이어지는 전체 단계의 자동화입니다. 워크플로우는 다음과 같이 구성됩니다:

  1. 프로젝트 생성 → EventBridge 이벤트 → Git 리포지토리 자동 생성
  2. Lambda 함수로 CI/CD 템플릿 초기화
  3. Step Functions 통해 코드 자동 삽입
  4. 데이터 자산 구독 및 승인 → 프로젝트 카탈로그에 추가
  5. Git 코드 변경 감지 후 빌드 파이프라인 실행
  6. 모델 등록 및 중앙 관리
  7. 테스트 환경과 운영 환경으로의 승인, 배포, 평가

이를 통해 SageMaker Unified Studio의 구조화된 배포가 가능합니다. 이러한 자동화는 모델 등록 승인, CI/CD 활용, 통합 테스트, 최종 A/B 테스트까지 전체 ML 파이프라인을 포함합니다.

멀티테넌시 설계 전략

멀티테넌시는 단일 환경에서 여러 사용자/조직들 간 자원을 안전하게 분리하기 위한 구조적 접근입니다.

첫 번째 전략은 "하나의 프로젝트로 다계정 환경 대응" 방식입니다. 개발 환경에서 데이터 파이프라인을 구축하고, 이를 테스트 및 운영 계정으로 승격 후 실행합니다.

멀티 계정 단일 프로젝트 멀티테넌시 구성도

두 번째 전략은 "각 SDLC 단계마다 프로젝트를 분리"하는 방식으로, 각각 개발(dev), 테스트(test), 운영(prod) 프로젝트를 구성합니다.

멀티 계정 멀티 프로젝트 멀티테넌시 구성도

이러한 구조는 사용자의 운영 환경 승인 절차, 테스트 효율, 문제 해결 시 로그 접근성까지 고려한 이상적인 자동화 모델로 설계되어 있습니다.

CI/CD 구성 및 코드 저장소 활용법

SageMaker Unified Studio는 GitHub, GitLab 등의 외부 저장소와 연동되는 Git 연결 기능을 제공합니다. 프로젝트 생성 시 Git 연결을 통해 자동으로 리포지토리를 설정하고, 실무에 바로 적용 가능한 시드(seed) 코드 템플릿도 포함할 수 있습니다.

코드 리포지토리는 다음과 같이 구성하는 것이 일반적입니다:

  • 하나의 저장소에 build, deploy 폴더 구성
  • 혹은 빌드와 배포 각각 분리된 저장소 구성

후자는 배포 승인 흐름에 더 유리한 변경 관리 패턴을 제공합니다. 이 내용은 2부 시리즈에서 구체 예제를 통해 다룰 예정입니다.

결론

이번 1부에서는 SageMaker Unified Studio를 활용한 자동화된 AIOps 아키텍처의 주요 구성과 멀티 계정 환경을 통한 활용 전략을 설명했습니다. CI/CD 자동화, 프로젝트 기반 거버넌스, 멀티테넌시 고려 등 모범 사례를 통합하여 보안성, 확장성, 표준화를 동시에 확보할 수 있는 최적화된 구조입니다.

조직 내 다양한 사용자(플랫폼 관리자, 데이터 과학자, AI 엔지니어, 거버넌스 책임자)가 각자의 전문성과 역할을 잃지 않으면서 협업을 강화할 수 있는 환경이 마련됩니다. 이를 통해 AI 혁신은 안정성과 신뢰성을 기반으로 가속화될 수 있습니다.

다음 2부에서는 실습 기반 가이드를 통해 실제 자동화 구성 요소들을 어떻게 구축하고 연동하는지를 알아보겠습니다.

[1] https://aws.amazon.com/blogs/machine-learning/automate-aiops-with-amazon-sagemaker-unified-studio-projects-part-1-solution-architecture/

AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!

(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기


AI, Cloud 도입 상담 배너