스완이 Amazon Bedrock을 활용해 IoT 기기에 생성형 AI를 대규모로 배포한 방법
스마트 홈 보안 시스템은 이제 단순한 움직임을 감지하는 수준을 넘어, 물건을 배달하는 사람과 침입자를 구분해 내는 고도화된 지능을 요구받고 있습니다. 이를 해결하기 위해 스완 커뮤니케이션(Swann Communications)은 Amazon Bedrock을 핵심으로 하는 생성형 AI 기반 알림 시스템을 개발하여 전 세계 1,174만 대 이상의 IoT 기기에서 동작하는 고도화된 보안 솔루션을 완성했습니다. 본 포스트에서는 스완의 사례를 중심으로, 생성형 AI의 대규모 IoT 디바이스 적용 방법과 아키텍처, 비용 최적화 전략, 실제 배포 가이드를 소개합니다.
기존 시스템의 한계와 새로운 요구사항
스완의 기존 알림 시스템은 단순한 움직임 감지 기반으로, 차량, 반려동물, 나뭇가지 흔들림 등으로 인해 하루 평균 20건 이상의 알림이 발생하며 사용자들을 금세 피로하게 만들었습니다. 이로 인해 많은 사용자는 초기 몇 개월 내 알림 기능을 완전히 비활성화시켜 버렸고, 중요한 보안 이벤트도 놓치게 되는 상황이 발생했습니다.
이 문제를 해결하기 위해 스완은 AWS와의 협업을 통해 알림 체계를 완전히 재설계했습니다. 핵심은 ‘의미 있는 알림만 제공’하는 지능형 시스템이었습니다.
Amazon Bedrock을 선택한 이유와 기술적 활용
스완은 Amazon Bedrock을 통해 다양한 AI 모델(Nova Lite, Nova Pro, Claude Haiku, Claude Sonnet)을 유연하게 선택하고 조합하여, 속도 중심의 대량 분석부터 정밀한 추론까지 다양한 상황에 최적화된 인공지능을 적용할 수 있게 됐습니다.

이 같은 지능형 알림 시스템 구현을 위해, 다음과 같은 AWS 서비스들이 활용되었습니다:
- AWS IoT Core: 수백만 개의 스마트 카메라와 초인종의 연결 허브 역할
- Amazon S3: 대용량 영상 데이터를 안정적으로 저장
- AWS Lambda: 서버 관리 없이 코드를 실행하여 이벤트에 빠르게 반응
- Amazon SQS: 트래픽 폭증 시 안정적인 알림 흐름 유지
- AWS EC2 (G3, G4): GPU 가속 기반 영상 프레임 처리
- Amazon Bedrock: 상황별 AI 모델 호출 및 통합 관리
- Amazon Cognito: 사용자 인증 및 보안 처리
알림이 사용자 맞춤형으로 도달하기까지, 영상 데이터는 AWS 기반의 스트리밍 파이프라인과 지능형 처리 과정을 거쳐, 모바일 앱 사용자에게 실시간으로 전송되고, 알림은 사용자의 설정에 따라 필터링됩니다.
동적 모델 전략을 통한 비용 및 성능 최적화
스완이 구축한 알림 시스템의 핵심은 ‘모델 계층화 전략’입니다. 비용 효율성과 정확성을 고려해 다음과 같이 생성형 모델을 분산 활용했습니다:
- Nova Lite (87%): 반려동물, 배달 인식 등 저비용 고속 필터링 용도
- Nova Pro (8%): 침입자 감지 등 정밀 분석이 필요한 경우
- Claude Haiku (2%): 실시간 알림("Notify me when")에 초저지연 대응
- Claude Sonnet (3%): 복잡한 동작 해석, 다수 인물 구분 등 고차원 분석
이 방식으로 전체 알림 정확도를 95%까지 끌어올리면서도, 원래 비용 210만 달러에서 단 6천 달러로 99.7% 절감하는 데 성공했습니다.
프롬프트 엔지니어링 및 자동화 가이드
스완은 AI 비용과 정확도를 모두 높이기 위해 다음과 같은 자동화 전략을 도입했습니다:
- 사전 필터링: AWS EC2 기반 전처리 모델로 65% 이상 잘못된 감지 제거
- 프롬프트 최적화: 최대한 간결한 구조(Key-value 형태)로 구성하여 토큰 수 88% 감소(150 → 18)
- 지능형 로직 도입: 모션 특성, 프레임 중복 제거 등으로 API 호출 횟수 88% 감소(17,000 → 2,000 RPM)
또한 프롬프트 버전 관리를 통해 다양한 상황에서 정확도, 비용, 지연시간을 A/B 테스트로 비교하고, 최선의 조합을 선별해 최적의 환경을 유지하고 있습니다.

결과 및 기대 효과
스완은 Amazon Bedrock 기반 생성형 AI 시스템을 도입한 후 다음과 같은 긍정적인 성과를 얻었습니다:
- 불필요한 알림 수 25% 감소
- 알림의 적합도 향상: +89%
- 고객 만족도: +3% 증가
- 전체 장치 수 1,174만 대에 대해 95번째 백분위(latency p95) 기준 300ms 이하 성능 유지
이는 생성형 AI가 소비자용 IoT 시스템에도 충분히 실용적이며 비용 효율적인 솔루션임을 입증하는 사례입니다.
향후 적용을 고려하는 기업에게
생성형 AI를 대규모로 도입하고자 하는 기업이라면 다음을 우선 고려해야 합니다:
- 명확한 문제 정의 및 KPI 설정
- 소수 디바이스 기반 파일럿 검증
- 비용 최적화를 위한 모델 계층화 및 프롬프트 설계
- Amazon CloudWatch 등으로 성능 모니터링 및 지표 기반 개선
- Amazon Bedrock 기반 인프라 자동화로 빠른 개발 및 확장 가능 환경 조성
Amazon Bedrock은 다양한 AI 모델을 손쉽게 호출하고 인프라 복잡성을 제거해주며, 기업이 모델 선택보다는 비즈니스 효과에 집중할 수 있도록 도와줍니다.
AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!
(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기
