아마존 Q 비즈니스에서 CDE와 Amazon Bedrock을 활용한 이미지 기반 데이터 분석 자동화
기업의 문서 관리 및 검색 시스템은 주로 텍스트 중심의 정보에 의존해 왔습니다. 하지만 조직이 보유한 많은 정보들은 차트, 도표, 구조도 등의 시각적 형태로 존재하며, 이들은 기존 시스템에 통합되기 어렵거나 자동화에 활용되지 못하는 경우가 많습니다. 본 포스팅에서는 Amazon Q Business의 Custom Document Enrichment(CDE) 기능을 사용해 Amazon S3에 저장된 이미지 파일에서 LLM을 기반으로 한 컨텍스트 추출 방식을 소개하고, 실제 사례와 함께 그 활용 방법을 단계별로 설명합니다.
Amazon Q Business CDE 기능의 이해
Amazon Q Business는 조직 내에 분산된 데이터베이스 및 비구조화 문서를 통합하여 자연어 질의에 기반한 정보 검색을 가능하게 해주는 AI 기반 플랫폼입니다. 기존에는 문서 내 포함된 이미지에만 대응이 가능했지만, 이번에 소개되는 Custom Document Enrichment(CDE) 기능을 통해 별도의 이미지 파일(JPG, PNG 등)에 대해서도 자동으로 시각적 정보를 추출하고 해당 내용을 검색 가능한 인덱스로 흡수시킬 수 있게 되었습니다.
이 과정에서 사용되는 주요 서비스는 다음과 같습니다:
- Amazon Q Business: 기업용 문서 검색 및 질의 대응 플랫폼
- AWS Lambda: 문서 처리 및 자동화 로직 실행
- Amazon Bedrock: 멀티모달 LLM 기반의 이미지 컨텍스트 분석
- Amazon S3: 이미지 파일 저장소
이미지 기반 시각 자료의 분석 사례
예를 들어, 교육 컨설팅 회사에서 전국적으로 수집한 차트 및 인구 통계 정보를 Amazon S3에 저장하고 있다고 가정해봅니다. 이들 차트는 도시별 연령대 분포와 같은 데이터를 시각화하고 있지만, 이미지 포맷이라는 한계로 인해 검색이 불가능했습니다. Amazon Q Business의 CDE와 Amazon Bedrock을 연동하면, 이런 이미지도 자동 분석되어 "13-15세 인구가 가장 많은 도시는 어디인가?" 혹은 "City 1과 City 4의 학생 분포를 비교해줘"와 같은 자연어 질의에 응답이 가능해집니다.
이러한 구현은 다음과 같은 흐름으로 구성됩니다:
- 문서 수집 시 이미지 파일 탐지
- AWS Lambda를 통해 Amazon Bedrock의 Claude LLM 호출
- 시각 자료 분석 및 텍스트로 변환
- 콘텐츠를 Amazon Q Business 지식베이스에 추가
솔루션 아키텍처 개요
아래 이미지는 전체 시스템 구성도를 보여줍니다. S3와 연결된 CDE가 자동으로 이미지를 탐지하고, 사전에 정의된 Lambda 함수가 작동하여 이미지들을 Amazon Bedrock으로 전달합니다. Bedrock은 차트의 주요 요소를 텍스트 및 데이터 포맷으로 변환하고, 그 결과를 다시 S3에 저장한 후 Q Business가 이를 인덱싱합니다.
배포 및 활용 가이드
시스템을 실제로 활용하기 위해서는 다음 절차를 따라야 합니다. 이 과정은 누구나 따라할 수 있도록 표준화되어 있으며, 다양한 시나리오에 맞춰 커스터마이즈가 가능합니다.
- Amazon Q Business 애플리케이션 생성 및 S3 연동
- 데이터 소스에 대한 CDE 설정 및 Lambda 트리거 구성
- 이미지 파일 감지 시 Amazon Bedrock API 호출
- 시각자료 내용 분석 및 텍스트로 변환 후 저장
이 때 Python으로 작성된 Lambda 함수는 이미지 유형을 분류하고 세부 항목을 추출하여 그래프 데이터를 CSV로 재구성할 수 있는 능력까지 포함합니다. 또한 최대 데이터 토큰, 재시도 횟수, 파일 형식 조건 등 세부 설정을 통해 실제 프로덕션 환경에서도 안정적으로 작동할 수 있게 설계되어 있습니다.
질의 예시와 결과
아래는 실제 분석된 이미지에 대한 자연어 질의 결과입니다. 별도의 수작업 없이 이미지에서 추출된 데이터가 기반이 되며, 숫자 레이블이 없는 차트에서도 정확한 응답이 가능합니다.
이처럼 Amazon Q Business는 단순한 이미지 검색을 넘어, 사람처럼 데이터를 이해하고 응답하는 총체적 분석 자동화를 제공합니다.
최적 구현을 위한 활용 팁
- 파일 포맷 조건 설정을 통해 대상 이미지 파일만 처리
- Lambda 실행 시간과 시간초과 설정은 데이터 크기 기준으로 조정
- Amazon CloudWatch를 이용한 모니터링 및 오류 추적
- 인덱싱된 문서에 태그나 메타데이터 활용하여 추후 관리 편리화
결론
이번 솔루션은 단순히 이미지 콘텐츠를 수집하는 데서 나아가, 시각자료로부터 정형화된 인사이트를 자동 추출하여 검색 가능한 지식 자산으로 재가공하는 자동화 활용 사례입니다. Amazon Q Business, CDE, Amazon Bedrock을 통합함으로써 조직은 기존에 단절되어 있던 이미지 데이터를 새로운 방식으로 연결하고, 정보 탐색 및 활용성을 혁신적으로 향상시킬 수 있습니다.
이제 더 이상 수작업 없이 시각자료 기반 데이터도 통합 분석이 가능합니다. 본 아키텍처를 통해 다양한 산업군의 차트, 도표, 매뉴얼 이미지 등도 유용한 검색 자산으로 전환할 수 있습니다.
AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!
(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기