소개
최근 몇 년 동안 인공지능은 다양한 산업 분야에서 혁신을 이끌어내고 있습니다. 그 중에서도 AWS Inferentia2는 효율적인 비용으로 비전-언어 모델을 배포할 수 있는 플랫폼을 제공하고 있습니다. 특히 Tomofun과 같은 기업은 AWS Inferentia2를 통해 실시간 반려동물 행동 감지 모델을 효과적으로 운영하고 있습니다.
본론
Tomofun은 Furbo Pet Camera의 개발사로서, AI 기술을 접목하여 반려동물의 행동을 실시간으로 감지하고, 소유자에게 경고를 보냅니다. 초기에는 GPU 기반의 Amazon EC2 인스턴스에서 이러한 작업을 처리했으나, 비용 문제가 발목을 잡았습니다. 이러한 비용 문제를 해결하고자 Tomofun은 AWS Inferentia2가 탑재된 EC2 Inf2 인스턴스를 활용하게 되었습니다. AWS Inferentia는 Amazon에서 AI 작업을 위해 특별히 설계된 칩으로, 비용 효율성과 처리 성능을 동시에 얻을 수 있습니다.
아래는 Tomofun의 시스템 아키텍처를 간략하게 보여주는 다이어그램입니다.
이 시스템은 고객의 반려동물 카메라로부터 영상 스트림을 받아와 AWS Inferentia2 기반으로 동작하는 모델에 전달하여 실시간으로 행동을 감지합니다. ELB와 EC2 오토스케일링 그룹을 통해 요청을 효율적으로 분산시키면서도, 실시간 트래픽 변화에 대응할 수 있는 유연성을 갖추고 있습니다. 이러한 접근법은 GPU 대비 83%에 달하는 비용 절감을 이끌어냈습니다.
결론
AWS Inferentia2를 통한 BLIP 모델의 배포는 Tomofun에게 있어 비용 효율적인 실시간 인퍼런스를 가능하게 하였습니다. Tomofun은 실시간 애플리케이션을 가능하게 하는 AWS Inferentia2의 이점을 활용하여 더 많은 작업을 마이그레이션할 계획이며, 이는 미래에 대형 언어 모델과의 통합으로 이어질 것입니다. 이처럼 AWS Inferentia2를 이용한 자동화와 최적화는 기업들에게 많은 이점을 제공할 수 있으며, 이를 통해 차별화된 경쟁력을 확보할 수 있습니다.
AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!
(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기
