메뉴 닫기

인공지능 문서 자동화 가이드 Amazon Bedrock을 활용한 IDP 구축과 사례 분석

인공지능 기반 문서 자동화: Amazon Bedrock Data Automation을 활용한 지능형 문서 처리(IDP) 가이드

기업의 다양한 비즈니스 환경에서는 계약서, 재무 보고서, 고객 이메일 등 비정형 문서에서 정형 정보를 추출해야 하는 상황이 반복적으로 발생합니다. 이러한 문서 처리 Automation은 기존의 NER(Named Entity Recognition) 기술로 어느 정도 해결할 수 있었지만, 정해진 엔티티만 추출하거나 숫자/요약처럼 복잡한 데이터를 처리하는 데 한계가 있었습니다. 이 한계를 극복하기 위해 AWS는 Amazon Bedrock 기반의 Data Automation 서비스를 정식 출시하였고, 이를 통해 지능형 문서 처리(IDP)를 손쉽게 구현할 수 있게 되었습니다. 본 포스트에서는 대규모 문서 처리에 최적화된 AWS 기반 IDP 워크플로우의 활용 방법, 배포 가이드, 사례 비교 및 자동화 방안을 상세히 소개합니다.

Amazon Bedrock Data Automation이란?

Amazon Bedrock Data Automation은 Amazon Bedrock의 주요 컴포넌트 중 하나로, 텍스트, 이미지, 오디오, 동영상 등 다양한 모달의 비정형 데이터를 처리하기 위한 완전 관리형 생성형 AI 서비스입니다. 사전 구성된 API를 통해 별도의 프롬프트 엔지니어링이나 모델 튜닝 없이 정보 추출이 가능하며, IDP 영역에서 뛰어난 활용성과 정확도를 보여줍니다.

서비스는 다음과 같은 주요 특징을 가지고 있습니다:

  • 비정형 멀티모달 데이터에서 유용한 정보 추출
  • 프론트엔드(UI)와 연동 가능
  • AWS Step Functions, Lambda, Amazon S3 등과 조합한 자동화 가능한 아키텍처 제공
  • Amazon Textract, Bedrock LLM 등과 연동 가능
  • IaC(Infrastructure as Code) 기반의 손쉬운 배포 지원

아키텍처 구성

사용자는 Web UI에서 문서를 업로드하고 추출하고자 하는 필드를 정의한 후 IDP 파이프라인을 실행합니다. 설정된 옵션에 따라 Amazon Bedrock Data Automation, Amazon Textract, 또는 Bedrock FM이 Lambda를 통해 호출되며, 상대 결과는 Amazon S3에 저장되고, 사용자 UI에 결과가 표시됩니다.

Amazon Bedrock 지능형 문서 처리 아키텍처 다이어그램 설명

사용 사례 및 비교

사례 1: 재무제표 정보 분석
PDF 형식의 다중 페이지 재무 문서를 업로드하고, 2018년 및 2019년의 유동자산 금액, 영업이익 등 주요 지표를 추출합니다. 해당 지표들은 사전 정의된 JSON 스키마 또는 수동 입력 필드를 통해 설정할 수 있으며, 완료 후 UI를 통해 표 형태의 결과를 확인합니다.

Amazon Bedrock 재무 문서 IDP 결과 예시 화면

간단한 수치 추출뿐만 아니라 LLM을 선택하여 수식이 포함된 재무 비율 계산, 예: 유동비율, 운전자본, 수익 증가율 등을 추론하는 고급 활용도 가능합니다.

사례 2: 고객 클레임 이메일 자동 분석
다수의 고객 불만 이메일(txt 형식)에서 고객 이름, 배송 ID, 언어, 감성 분석 결과, 배송 지연 일자 및 권장 응답 문구 등을 추출합니다. 해당 기능은 이메일 형태 데이터 일괄 업로드 후 몇 가지 속성 설명만 첨부하여 손쉽게 자동화 파이프라인을 구동할 수 있어 효율적인 고객 VOC 관리에 유용합니다.

Amazon Bedrock 이메일 문서 처리 결과 화면

배포 가이드

Amazon SageMaker 또는 로컬 환경을 통해 이 솔루션을 배포할 수 있으며, IaC 기반 CDK 스택으로 관리됩니다. SageMaker 환경에서 노트북 인스턴스를 생성하고 GitHub 레포를 클론하여 shell 스크립트를 실행하면 자동으로 모든 리소스 생성 및 연결이 완료됩니다.

기본 배포 절차:

  1. SageMaker 인스턴스 생성 및 IAM 역할 권한 설정
  2. GitHub 레포 클론 및 종속 패키지 설치
  3. config.yml 환경 설정
  4. CDK 배포명령으로 자동화 실행

활용비용 분석

100개의 20페이지 재무 문서 및 100개의 1페이지 고객 이메일을 예로 들어 IDP 방식을 비교한 결과는 다음과 같습니다.

방식 재무 문서 (100개) 이메일 (100개)
Bedrock Data Automation $20.11 $1.11
Bedrock FM (LLM 직접 호출) $1.90 $0.20
Textract + FM 조합 $31.36 $1.67

Bedrock FM은 비용 측면에서 유리하지만 보안 및 추론 품질 관리를 위해 추가적인 운영 관리가 필요하며, Bedrock Data Automation은 비용 대비 높은 품질의 결과와 완전 자동화의 이점을 제공합니다.

정리 및 결론

문서 자동 처리(IDP)는 기업 내 정보 추출과 분석의 효율성을 획기적으로 개선하는 핵심 기술로 자리매김하고 있습니다. Amazon Bedrock Data Automation 기반의 본 솔루션은 멀티모달 문서에 대한 고도화된 처리, 완전 자동화 배포, 간단한 UI 연동 등 다양한 강점을 제공하며, Amazon SageMaker 및 CDK 기반으로 손쉽게 배포 및 유지 관리할 수 있습니다. 특히 생성형 AI 기반 정보 추출 덕분에 비정형 문서 내에서 유동자산, 수익률 계산, 감정 요약 등 복잡한 분석도 빠르게 수행할 수 있으며, 이는 다양한 산업의 자동화 시나리오에 매우 유용합니다.

[1] https://aws.amazon.com/blogs/machine-learning/intelligent-document-processing-at-scale-with-generative-ai-and-amazon-bedrock-data-automation/

AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!

(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기


AI, Cloud 도입 상담 배너