서버리스 AI 게이트웨이 구축 가이드: AWS AppSync Events 활용
오늘날 생성형 AI 모델의 활용이 증가하면서 그에 따른 인프라 아키텍처의 유연성과 확장성 요구도 함께 커지고 있습니다. 본 글에서는 AWS AppSync Events를 중심으로 하는 서버리스(Serverless) AI 게이트웨이 아키텍처 구축 방법과 서비스 구성, 활용 방안에 대해 소개합니다. 실제 배포 가능한 샘플 코드도 포함되어 있어, 실무에 즉시 적용 가능한 AI 게이트웨이 설계와 배포 가이드를 확인할 수 있습니다.
AI 게이트웨이란?
AI 게이트웨이는 LLM(Large Language Model)을 사용하는 애플리케이션의 핵심 요구사항인 보안성, 확장성, 가시성을 확보하기 위한 미들웨어 아키텍처입니다. 사용자 경험 최적화, 개발자 확장성, 운영 가시성, 보안 규정 준수 및 비용 제어와 같은 다양한 조직 내 이해당사자의 요구를 통합적으로 만족하는 구조를 지향합니다.
서버리스 기반 AI 게이트웨이 구성요소
AppSync Events를 중심으로 구성된 이 아키텍처는 다음과 같은 기능을 제공합니다.
- 사용자 인증 및 API 접근 제어 (Amazon Cognito)
- 저지연 메시지 송수신 (WebSocket + AppSync Events)
- 퍼블릭 모델 및 프라이빗 모델 지원 (Amazon Bedrock)
- 요청당 메시지 단위의 Log, 메트릭 기록 (Amazon CloudWatch)
- 실시간 토큰 사용량 추적 및 제한 (Amazon DynamoDB)
- 대화 내용 분석을 위한 로그 분석 플랫폼 (Amazon Firehose, Athena)
- 요청 캐싱 및 Prepared Response 활용 (DynamoDB 캐시 테이블)
다음 이미지는 전체 솔루션 아키텍처 개요입니다.

핵심 구성요소 및 활용 사례
- 인증 및 API 접근
사용자는 Amazon Cognito를 통해 인증되며, 각 사용자는 고유한 ID(sub)를 부여받습니다. 이 값을 기반으로 AppSync 채널명이 지정되어 개인화된 채널을 생성합니다. Lambda 함수는 채널명을 검증하여 권한 체크를 수행합니다.
- 처리 흐름
- 사용자는 메시지를 AppSync Inbound 채널로 전송
- ChatHandler Lambda가 요청을 수신하고 Bedrock ConverseStream API에 전달
- 모델 응답을 Outbound 채널로 전달하면서 WebSocket을 통해 스트리밍 응답 제공
- 사용자 권한 및 접근 제어
각 사용자의 채널은 개인화된 sub 값을 포함하고 있어, 인증된 사용자만이 자신의 채널에 접근할 수 있도록 Lambda 함수에서 철저한 검사 로직이 포함되어 있습니다.
- 토큰 사용량 측정 및 제한
Amazon Bedrock의 응답에서 제공하는 토큰 메타데이터를 활용해 다음과 같이 구성합니다:
- 10분 단위, 월 단위의 사용량을 Amazon DynamoDB에 기록
- TTL 기능을 이용해 오래된 데이터 삭제 자동화
- 사용량 초과 시 요청 거부 및 응답 무시 처리

- 실시간 로깅 및 감사
Lambda 및 Event API의 각 처리 흐름은 CloudWatch Logs에 기록됩니다. 구조화된 로그 메시지는 추후 CloudWatch Logs Insights 및 Athena로 분석이 가능하여 운영 가시성과 이해도를 높입니다.

- 애널리틱스 및 데이터 분석
CloudWatch Logs에서 전달된 구조화 로그는 Data Firehose를 통해 S3로 저장되며, AWS Glue 및 Amazon Athena로 SQL 기반 분석이 가능해집니다. 이를 통해 모델별 토큰 사용량, 사용자당 대화 건수, 응답 시간 분석 등의 사용자 정의 분석이 가능합니다.

- 실시간 모니터링
CloudWatch Metrics를 통해 모델별 토큰 사용량, LLM 응답 시간 등의 KPI를 지표화하고, 대시보드를 구성하거나 알람을 고도화할 수 있습니다.

- 캐싱 기능 활용
자주 반복되는 질문에 대해 응답을 캐싱하여 DynamoDB에 저장해두고, 동일한 해시 키가 들어오면 자동으로 응답을 반환하는 방식으로 비용과 처리시간을 최적화할 수 있습니다. 단, 프라이버시가 중요한 요청은 캐싱에서 제외됩니다.

AI 게이트웨이 UI 예시
다음은 샘플 애플리케이션의 UI입니다. 대화창, 토큰 사용량 표시, 모델 선택 드롭다운 등을 제공합니다.


AI 게이트웨이의 도입 효과
- 비용 제어 자동화: 토큰 과금 체계에 따른 실시간 제한
- 사용자 맞춤 대응: 사용자별 전용 채널 매핑을 통해 비공개 통신 보장
- 분석 기반 제품 개선: 로그 기반 사용 분석 및 성과 가시화
- 유연한 모델 확장성: Bedrock 기반 다양한 모델 통합 가능
- 자동화 배포 지원: AWS CDK로 손쉬운 배포 및 제거
결론
AI 환경 변화 속도는 매우 빠르며, 이에 대응하는 인프라 역시 민첩해야 합니다. AppSync Events 기반의 서버리스 AI 게이트웨이 아키텍처는 보안, 실시간성, 확장성, 감시 체계를 유기적으로 연결할 수 있는 실증적인 접근 방법이며, 이는 다양한 기업 환경에 쉽게 적용 가능합니다.
샘플 AI 게이트웨이의 소스코드 및 구축 가이드는 GitHub 링크를 통해 확인할 수 있으며, 거버넌스 제어, 모델 선택기 커스터마이징 등의 확대 적용도 가능합니다.
AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!
(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기
