메뉴 닫기

AWS Deep Learning AMI와 SOCI 활용 가이드

AWS Deep Learning AMI와 컨테이너 관리를 위한 SOCI 활용 가이드

소개
인공지능(AI) 및 머신러닝(ML) 워크로드를 클라우드 환경에서 대규모로 배포하는 기업들은 컨테이너의 빠른 시작 시간과 효율적인 이미지 관리를 중시하고 있습니다. 이에 AWS는 Seekable OCI(SOCI) 기술을 통해 Deep Learning AMI(DLAMI)와 컨테이너에서 컨테이너 시작 시간을 단축하고자 합니다.

SOCI의 활용과 배포 가이드
SOCI는 선택적 파일 다운로드를 통해 컨테이너 이미지를 효율적으로 관리하는 기술로, SOCI 인덱스를 활용하여 필요한 파일만 로드하는 'lazy loading' 방식과 더 빠른 속도를 위해 복수의 파일을 병렬로 다운로드하는 'parallel pull' 방식을 지원합니다. SOCI를 이용하면 대규모 이미지를 한꺼번에 다운로드하지 않고도 컨테이너를 빠르게 시작할 수 있어 비용 절감과 운영 효율성을 높일 수 있습니다.

SOCI와 기존 컨테이너 풀링 방식 비교

  • Docker 풀링은 순차적으로 이미지를 다운로드하며, 시간이 많이 소요됩니다.
  • SOCI 병렬 풀링: 부분적으로 이미지 다운로드를 분할 처리하여 속도를 개선하지만, 컴퓨팅 자원 소모가 증가합니다.
  • SOCI lazy loading: 필요한 데이터만 다운로드하여 거의 즉시 컨테이너 시작이 가능하지만, 매 요청마다 파일을 가져와야 하는 단점이 있습니다.

사례 및 성능 비교
SOCI 스냅샷터를 이용해 lazy loading과 parallel pull의 실제 사례를 통해 성능 개선을 확인할 수 있습니다. lazy loading 모드에서는 21초 만에 컨테이너를 시작할 수 있었으며, parallel pull 모드 활용 시 이미지 다운로드 시간이 절반 이상 단축되었습니다.

SOCI 기술을 활용한 컨테이너 풀링 메커니즘 비교
SOCI 스냅샷터와 DLAMI, 딥러닝 컨테이너 통합 아키텍처

결론
SOCI는 클라우드 환경에서 특히 대규모 AI/ML 워크로드를 다루는 조직에게 엄청난 장점을 제공합니다. SOCI 스냅샷터의 lazy loading 모드와 parallel pull 모드를 통해, 기업들은 이미지 풀링 성능을 2배 이상 개선할 수 있으며, 컨테이너 시작 시간을 20배 이상 단축할 수 있습니다. 따라서, 사용자의 필요에 따라 적절한 모드를 선택하여 활용하는 것이 중요합니다.

[1] https://aws.amazon.com/blogs/machine-learning/reducing-container-cold-start-times-using-soci-index-on-dlami-and-dlc/

AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!

(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기


AI, Cloud 도입 상담 배너