데이터 활용을 혁신한 Parcel Perform의 Generative AI 기반 Text-to-SQL 도입 사례
데이터의 정확성과 즉시성은 고객 서비스와 비즈니스 운영의 결정적 요소입니다. 그러나 많은 기업에서 비즈니스 팀과 데이터 팀 간의 커뮤니케이션 과정에서 시간과 효율이 낭비되고 있다는 것이 현실입니다. 이 문제를 해결하기 위해 Parcel Perform는 Generative AI 기술, 특히 Text-to-SQL 기능을 활용하여 데이터를 더 효율적으로 활용하고, 비즈니스 팀이 즉각적인 결정을 내릴 수 있도록 셀프 서비스형 분석 시스템을 구현했습니다. 본 포스팅에서는 해당 사례를 통해 AI 활용법, 구축 방법 및 아키텍처, 그리고 실제 효과를 자세히 소개합니다.
Parcel Perform의 데이터 활용 아키텍처
Parcel Perform는 글로벌 이커머스 사업자를 위한 AI 기반 배송 경험 플랫폼입니다. 이 회사는 AWS의 다양한 서비스와 최신 AI 기술을 활용하여 수억 건에 이르는 배송 이벤트 데이터를 처리하고 있으며, 분석 성능과 확장성을 고려한 데이터 아키텍처를 구축하였습니다.
데이터 처리 흐름은 다음과 같습니다:
- 데이터 수집: 수집된 배송 이벤트 데이터는 Amazon RDS에 저장되고, 이를 CDC 기반으로 Debezium 커넥터를 사용해 Amazon MSK(Kafka 기반 스트리밍 서비스)로 전송됩니다.
- 실시간 데이터 처리: 데이터는 Apache Flink 기반의 Amazon EKS상에서 처리되며, Apache Iceberg 포맷으로 Amazon S3에 저장됩니다.
- 메타데이터 관리: AWS Glue Data Catalog를 통해 S3에 저장된 데이터 스키마를 관리합니다.
- 분석: Amazon Athena를 통해 SQL 기반의 쿼리가 수행되어 필요한 데이터를 제공합니다.
이러한 아키텍처 기반 위에, 비즈니스 팀이 손쉽게 데이터를 조회할 수 있도록 생성형 AI 기반의 Text-to-SQL 어시스턴트를 도입하였습니다.
AI 에이전트 기반 Self-service 데이터 질의 환경
Parcel Perform의 비즈니스팀은 이제 단순 자연어 질문만으로도 데이터를 바로 조회할 수 있습니다. 예를 들어, “지난주 특정 지역에서 배송 지연이 증가했나요?” 같은 질문을 AI 어시스턴트에 입력하면, 시스템은 자동으로 SQL 쿼리를 생성하여 Amazon Athena를 통해 데이터를 조회하고 결과를 제공합니다.
이 기능은 LangGraph 흐름 제어 도구와 Amazon Bedrock을 활용하여 구현되었으며, 전체 아키텍처는 다음과 같습니다:
엔드 유저의 질의는 다음과 같은 자동화된 절차로 처리됩니다:
- 질문 입력 시 LangGraph 실행 시퀀스가 시작됩니다.
- 동시에 Athena에서 데이터 스키마를 불러오고, Amazon Bedrock Knowledge Base로부터 질의와 관련된 비즈니스 맥락 정보를 검색합니다.
- Claude 모델(Amazon Bedrock 기반 LLM)을 활용해 쿼리를 생성합니다.
- SQL을 Athena를 통해 실행한 후, 결과 데이터를 LLM이 해석하여 자연어 답변을 생성합니다.
- 최종 답변이 어시스턴트 UI를 통해 사용자에게 전달됩니다.
Text-to-SQL 자동화가 가져온 실제 효과
이전에는 비즈니스 팀이 요청을 작성하고, 데이터 팀이 이를 수작업으로 쿼리 작성 후 결과를 제공하는 데 수 일이 소요되었습니다. 시차 문제로 인해 이러한 커뮤니케이션은 종종 2~3일 이상 걸리기 일쑤였습니다. 그러나 새롭게 도입한 AI 기반 시스템 덕분에 데이터 조회 시간은 평균 2.3일에서 10분 이내로 줄어들었으며, 매월 약 3,850시간의 인력 대기 시간을 절감하였습니다.
또한, 데이터 팀은 반복적인 쿼리 처리 업무에서 벗어나 전략적 분석 업무에 더 집중할 수 있게 되었으며, 반복 요청으로 인한 업무량이 약 25%에서 10%로 감소하였습니다. 이는 약 160시간의 인력 자원을 추가 확보한 것과 동일한 효과를 가져왔습니다.
Text-to-SQL 시스템 구축 시 마주친 주요 도전과 해법
- 모호한 상호명 문제: “ABC”라는 검색어가 다양한 계정 이름과 매칭되어 SQL 오류가 발생하는 경우, AI가 Athena를 추가적으로 조회 후 후보군을 판단하게 하였습니다.
- 과도한 쿼리 비용 문제: LIMIT 절을 자동 삽입함으로써 분석 비용을 통제하였으며, 향후 EXPLAIN 쿼리를 통해 무거운 질의 탐지 기능도 도입할 예정입니다.
- 비용 모니터링 이슈: Amazon Bedrock의 Inference Profile과 태깅 기능을 통해 프로젝트별 사용량 추적이 가능하도록 설정하였습니다.
결론 및 시사점
Parcel Perform의 사례는 생성형 AI를 활용해 데이터 활용 자동화, 분석 민첩성 확보, 고객 경험 개선을 동시에 달성한 대표적인 예입니다. 다양한 AWS 서비스와 텍스트 기반 질의 자동화 기술을 통합함으로써, 운영 효율성과 고객 대응 속도를 대폭 향상시켰습니다.
이와 같은 자동화 솔루션은 SaaS 기반 기업, 물류 기업, 비즈니스 인텔리전스 팀 등에게 매우 중요한 참고 모델이 될 수 있으며, 생성형 AI 기반 자동화 워크플로우를 도입하려는 기업에게 실질적인 이정표가 될 것입니다.
기술 도입 이전에는 개념 검증(POC)부터 시작하여 소규모 테스트, 성능 확인, 프롬프트 엔지니어링, 비용 분리 추적 등을 통해 점진적으로 배포를 확장하는 것이 효과적입니다.
AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!
(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기