워너브라더스 디스커버리, AWS Graviton 기반 Amazon SageMaker 활용으로 ML 비용 60% 절감 사례
스트리밍 콘텐츠의 경쟁이 치열해지면서 사용자 맞춤형 콘텐츠 추천 시스템은 경쟁력을 좌우하는 핵심 요소가 되었습니다. 이에 따라 대규모 사용자 기반을 보유한 Warner Bros. Discovery(WBD)는 AWS Graviton 기반 Amazon SageMaker를 도입해 머신러닝(ML) 인퍼런스 환경을 개선하고 운영 효율성을 극대화했습니다. 본 포스팅에서는 이들의 시스템 아키텍처, 자동화 테스트 방식, 도입 효과 등을 중심으로 효과적인 AI 활용 및 인프라 전환 가이드를 공유합니다.
도입 배경과 도전 과제
WBD는 HBO, Discovery+, CNN 등의 글로벌 브랜드를 통해 전 세계 1억 2천만 명 이상의 사용자를 보유한 미디어 기업입니다. WBD의 추천 알고리즘은 100개국 이상에 걸친 지역별 사용자의 취향 분석 데이터를 바탕으로 작동하며, 200,000시간이 넘는 콘텐츠를 보다 정교하게 매칭시켜야 하는 과제를 안고 있었습니다. 특히 실시간 스트리밍 중 수요 급증 시에도 100ms 이하의 응답속도를 유지해야 하므로, 대규모 자동 확장 및 인퍼런스 최적화가 요구되었습니다.
비용과 시스템 성능을 모두 충족시키는 자동화 기반 추천 시스템의 배포는 상당한 도전 과제였으며, 이를 해결하기 위한 클라우드 인프라 비교를 통해 AWS Graviton의 도입이 결정됐습니다.
솔루션: AWS Graviton 기반 ML 인퍼런스
WBD는 XGBoost, TensorFlow 기반 모델들을 AWS Graviton 기반 SageMaker 인스턴스로 전환하기 위해 다음의 두 단계 절차로 접근했습니다
-
테스트 환경 구성 및 자동화 벤치마킹:
초기 샌드박스에서 스레드 및 워커 수를 조절해 최적의 처리량 확인
기존 x86 대비 우수한 처리속도 및 높은 인스턴스 활용도 입증 -
프로덕션 환경에서 그림자 테스트 활용:
Amazon SageMaker Shadow Testing 기능으로 기존 프로덕션 환경과 병렬 테스트
모델 지연 시간 및 비용 절감을 데이터 기반으로 분석
이를 통해 워크로드 전환 전 각 구성 요소에 대한 퍼포먼스 비교가 가능했고 Amazon SageMaker Inference Recommender를 활용한 배포 자동화는 A/B 테스트를 빠르게 확산하고 배포 최적화 속도를 높이는 데 기여했습니다.
아키텍처 구성
WBD는 이미 Amazon S3, DynamoDB, SageMaker 등의 완전관리형 AWS 서비스를 통해 대규모 스트리밍 사용자에게 개인화된 콘텐츠를 배포하고 있었습니다. 이번에는 AWS Graviton 인스턴스로 전환함으로써 인퍼런스 성능과 비용 간 균형을 확보할 수 있었습니다.

효과: 비용 절감부터 성능 향상까지
도입 후 WBD는 기존 x86 기반 대비 다음과 같은 주요 효과를 확인했습니다.
-
평균 60% 비용 절감
특히 카탈로그 랭킹 모델에서는 최대 88%까지 비용이 절감되었습니다 -
평균 및 P99 지연 시간 7~60% 개선
XGBoost의 경우 최대 60%, 기타 모델은 21%의 지연 시간 감소를 경험 -
인스턴스 수 감소 및 스케일링 최적화
높은 CPU 부하에서도 안정적인 확장성과 자동 확장 정책 재정렬 가능 -
사용자 경험 향상
보다 유연하고 반응성 높은 추천 시스템을 실현함으로써 사용자 만족도 증가 -
빠른 배포 최적화
그림자 테스트 + 자동화된 인퍼런스 분석 도구 도입으로 전체 전환 기간 4주 이내 달성

결론
Warner Bros. Discovery의 사례는 대규모 서비스를 운영하는 기업들이 어떻게 머신러닝 인프라를 최적화하고, 비용 대비 성능이라는 핵심 지표들을 어떻게 개선해 나가는지를 보여주는 좋은 예시입니다. AWS Graviton 및 SageMaker 기반의 접근은 추천 시스템에 필요한 적시성, 자동화 및 배포 가이드 제공 측면에서도 큰 이점을 주었습니다.
특히 비용 절감, 지연 시간 최소화, 대규모 트래픽 대응력 확보와 같은 효과를 통해 WBD는 향후 전체 추천 시스템을 Graviton 기반 인스턴스로 이전하는 것을 목표로 하고 있습니다. 클라우드 ML 활용이 단순 시스템 전환이 아니라, 비즈니스 혁신과 운영 최적화를 동반한다는 것을 입증하는 사례로 주목할 만합니다.
AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!
(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기
