Quora Poe, Amazon Bedrock와 손잡고 빠르게 여러 생성형 AI 모델 배포하는 법
최근 AI 시스템의 복잡도와 다양성이 증가하면서, 다수의 모델을 통합하고 배포하는 일은 개발자 및 기술 책임자들에게 큰 도전 과제가 되었습니다. 특히 각 모델의 API 사양과 인증 방식이 상이하여 모든 것을 하나의 플랫폼에 통합하는 것은 상당한 엔지니어링 리소스를 요구합니다.
이를 해결하기 위해 AWS Generative AI Innovation Center와 Quora는 Amazon Bedrock 기반의 다양한 생성형 AI 모델을 Poe 플랫폼에 통합할 수 있는 통합 래퍼 API(Unified Wrapper API) 아키텍처를 공동 개발하였습니다. 이 글에서는 이 아키텍처가 어떤 식으로 구성되었으며, 어떻게 활용하고 자동 배포를 가능하게 했는지 안내합니다.
Amazon Bedrock과 Poe의 구조 이해하기
Poe.com은 Quora가 개발한 AI 통합 플랫폼입니다. 사용자는 다양한 AI 챗봇들과 대화하거나 콘텐츠 생성, 이미지 생성 등 멀티모달 처리를 통해 원하는 기능을 사용할 수 있습니다. 반면, Amazon Bedrock은 주요 AI 모델(Anthropic, Meta, Mistral 등)을 제공하는 완전 관리형 AI 서비스입니다.
그러나 Poe가 사용하는 ServerSentEvents 기반의 이벤트 스트리밍 방식과 Bedrock의 RESTful API 간에는 기술적 차이가 있기 때문에 단순한 API 호출만으로는 양방향 통신과 실시간 처리에 한계가 있습니다. 이를 해결하기 위해 Wrapper API가 필수적입니다.
통합 Wrapper API 아키텍처 구성
통합 API는 Poe가 다양한 Amazon Bedrock 모델과 원활하게 통신할 수 있도록 돕는 중간 계층 역할을 하며, 다음과 같은 주요 컴포넌트로 구성됩니다.
- Poe 레이어: 사용자 요청을 받아 FastAPI로 받아들이고 파라미터를 정규화함
- Bot Factory: 요청된 모델 타입에 적합한 챗봇 핸들러를 동적으로 생성하는 팩토리 패턴
- Service Manager: 토큰 처리, 스트리밍, 에러 처리 등 전반적인 로직 동기화 수행
- AWS 서비스 레이어: REST API 요청을 Amazon Bedrock에 전달하고, 결과를 포맷 변환하여 Poe에 전달
- Amazon Bedrock 레이어: 다양한 모델과 Converse API 및 전용 API를 지원
자동 배포와 템플릿 구성 방식
Wrapper API는 '한 번 개발하면 여러 모델에 배포(Build Once, Deploy Many)'가 가능하도록 구성되었습니다. 특히 각 모델을 설정 파일 기반으로 정의하는 BotConfig 클래스를 통해 새로운 모델을 단 몇 분 안에 추가할 수 있습니다.
이 접근 방식의 주요 장점은 다음과 같습니다:
- 모델당 코드 변경량 95% 감소
- 단일 템플릿 사용으로 일관된 배포 환경 유지
- 설정 파일 기반의 빠른 실험 및 파라미터 조정 가능
- Amazon Bedrock의 Converse API를 통한 멀티모달 통신 지원
런타임 중 프로토콜 변환 및 에러 처리
이 시스템에서 중요한 기능 중 하나는 다양한 모델의 출력 구조를 Poe가 이해할 수 있는 형식으로 실시간 변환하는 '프로토콜 변환 계층'입니다. 이는 WebSocket/HTTP chunk 등 다양한 포맷을 ServerSentEvents로 변환합니다.
또한, 에러 발생 시 일관된 형식으로 메시지를 사용자에게 전달하여 사용자 경험을 크게 향상시키며 디버깅 또한 용이하게 합니다.
비교 분석 및 자동화 효과
기존 방식과 Wrapper API 방식 비교:
항목 | 개선 전 | 개선 후 |
---|---|---|
모델 배포 시간 | 2–3일 | 15분 |
코드 변경량 | 500줄 이상 | 20~30줄 |
테스트 시간 | 8–12시간 | 30~60분 |
배포 단계 수 | 10–15단계 | 3–5단계 |
성능 개선을 위한 비동기 처리, 연결 풀링(aiohttp + aiobotocore), 그리고 AWS Secrets Manager와의 연동으로 보안도 함께 강화하였습니다.
보안 및 인증
- JWT 인증과 AWS SigV4 서명을 통한 API 접근 제어
- AWS Secrets Manager를 통한 자격 증명 안전 저장
- 안전한 세션 정리 및 요청 추적 기능으로 서비스 운영 보장
결론
Quora Poe와 AWS의 협업을 통해 구축된 이 Wrapper API는 AI 모델 통합을 가속화하고 개발자의 역량을 코드 개발에서 제품 기능 개선으로 이동시키는 데 큰 역할을 했습니다. 단순한 REST API 연동을 넘어 구성 기반, 멀티모달 대비, 자동화 중심 설계 구조는 AI 모델 운영의 새로운 기준이 될 수 있습니다.
특히 다양한 생성형 AI 모델들을 간편하게 활용하고 빠르게 배포하고자 하는 기업과 개발 팀이라면, 이 아키텍처 접근 방식은 매우 효과적인 방법론이 될 것입니다.
AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!
(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기