웹 앱의 새로운 활용 방식, Amazon Nova Sonic을 통한 음성 기반 자동화
웹 애플리케이션의 사용 방식이 변화하고 있습니다. 마우스와 키보드를 넘어서, 사용자는 이제 앱과 자연스럽게 대화를 나누기 원합니다. 그렇다면 이 변화를 어떻게 대응하면 좋을까요? 바로 Amazon Bedrock 기반의 Amazon Nova Sonic을 활용하는 것입니다. Nova Sonic은 지연시간이 짧고 양방향 실시간 음성 대화를 지원하는 AWS의 최신 음성 기반 모델로, 기존의 UI 체계를 넘어서 협업 중심의 자동화 인터페이스를 실현합니다.
Amazon Nova Sonic을 활용한 자동화 사례
Amazon Nova Sonic은 Smart Todo App이라는 데모 애플리케이션에서 처음으로 구현되었으며, 아래와 같은 음성 명령을 실시간으로 이해하고 수행합니다.
예:
- “모든 작업을 완료로 표시해줘.”
- “Q3 예산 계획을 단계별로 나눠줘.”
- “APAC 리드를 찾아서 맞춤형 아웃리치 초안을 만들어줘.”
- “최근 24시간에 등록된 P1 티켓을 우선순위 지정하고 담당자에게 할당해줘.”
이처럼 단순한 명령을 넘어 다단계 워크플로우 구성, API 호출, 사용자 콘텍스트 유지 등 복잡한 작업들까지 자동화된 음성 상호작용으로 처리할 수 있습니다.

Amazon Nova Sonic의 API 작동 방식
Nova Sonic은 InvokeModelWithBidirectionalStream API를 사용하여 세션이 시작된 이후, 마이크 입력과 모델 응답이 동시에 진행되는 양방향 스트리밍 구조를 가집니다.
대화 진행 순서는 다음과 같습니다:
- 세션 시작: 세션 설정 전송 (temperature, topP 등)
- 콘텐츠 시작: 오디오/텍스트/툴 입력 여부 전송
- 오디오 스트리밍: base64 인코딩된 오디오 전송
- 모델 응답: 음성 인식, 도구 사용, 텍스트 응답, 음성 출력 등 비동기 수신
- 세션 종료: contentEnd, promptEnd, sessionEnd 전송으로 명시적 종료
이를 통해 사용자는 대화 도중 끼어들기(barge-in), 멀티턴 대화, 실시간 반응형 음성 인터페이스 구성 등 다양한 구성 방식을 구현할 수 있습니다.

스마트 음성 앱을 위한 AWS 서비스 아키텍처 비교 및 활용 가이드
이 솔루션은 서버리스 React 기반 프론트엔드와 컨테이너 백엔드를 사용하는 구조입니다. 주요 사용 서비스는 다음과 같습니다:
- Amazon Bedrock: 음성 상호작용 AI 모델 제공
- AWS Fargate + ECS: WebSocket 및 REST API 실행
- Amazon CloudFront: 전역 CDN 배포 및 지연 최소화
- Application Load Balancer(ALB): /api REST API 트래픽과 /novasonic WebSocket 트래픽 분리 처리
- Amazon VPC 및 NAT Gateway: 보안 및 외부 연결 제공
- Amazon Cognito: 인증 및 JWT 발급
- Amazon DynamoDB: To-do 리스트 및 노트 저장
각 구성 요소가 음성 중심의 높은 실시간 요구사항을 만족하도록 설계되어 있으며, 용량 확장이 용이하고 보안이 강화된 구조입니다.

디플로이먼트 자동화 가이드
Amazon Nova Sonic을 직접 체험해보고 싶다면 GitHub에 공개되어 있는 Smart Todo App 샘플 프로젝트를 활용할 수 있습니다. 아래와 같은 사전 준비가 필요합니다:
- Node.js 20.x 이상 및 npm
- Docker Engine 설치
- AWS CLI와 관리자 권한 계정
- Bedrock에서 Nova Sonic 사용 권한 활성화
배포는 다음 명령으로 간단히 자동화됩니다:
npm run deploy:first-time
해당 스크립트는 의존성 설치, 도커 이미지 빌드, CDK 기반 인프라 배포, 환경 변수 설정, 프론트엔드 재빌드를 자동으로 처리합니다.


정리 및 다음 단계
Amazon Nova Sonic은 단순한 자동화를 넘어서, 음성을 주요 인터페이스로 사용하는 차세대 UX 환경을 구축할 수 있는 기반이 되는 기술입니다. 앱과 대화하듯 자연스러운 협업을 가능하게 하며, 비즈니스 자동화는 물론 접근성 향상과 사용자 만족도 향상까지 도모할 수 있습니다.
직접 구현해보고 싶다면 GitHub에서 샘플 코드를 다운로드하거나 AWS의 워크샵을 활용해 실습해 보시길 추천드립니다. 음성 기반 자동화의 새로운 시대가 이미 시작되었습니다.
https://aws.amazon.com/blogs/machine-learning/make-your-web-apps-hands-free-with-amazon-nova-sonic/
AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!
(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기
