메뉴 닫기

Amazon Nova 기반 문서 필드 로컬라이제이션으로 기업 문서 자동화 혁신

기업 문서 처리 효율을 혁신하는 방법 – Amazon Nova와 문서 필드 로컬라이제이션 자동화

매일 수천 건의 계약서, 세금계산서, 발주서 등 중요한 정보를 담은 문서가 기업에서 처리됩니다. 이런 문서들로부터 특정 필드를 정밀하게 추출하는 것은 결코 간단한 일이 아닙니다. 기존에는 OCR을 활용해 텍스트를 인식하거나, YOLO·RetinaNet·DETR 등 최신 컴퓨터 비전 모델들을 동원해 위치 로컬라이제이션까지 시도했지만, 이는 전문 기술과 방대한 학습 데이터, 유지관리 부담이라는 주된 한계를 가졌습니다.

최근 Amazon Bedrock의 Amazon Nova와 같은 멀티모달 기반 대형 언어 모델(LLM)을 기반으로 문서 내 필드 로컬라이제이션을 효과적으로 수행할 수 있는 방법이 소개되었습니다. 본 글에서는 이러한 기술을 활용한 문서 필드 자동화 기법, 구현 가이드, 비교 분석 및 배포 자동화 전략을 다룹니다.

문서 정보 로컬라이제이션의 진화 – 어떻게 동작할까?

문서 정보 로컬라이제이션(Document Information Localization)은 단순한 텍스트 추출을 넘어 ‘정보의 위치’를 식별하는 기술입니다. OCR은 텍스트가 ‘어디에 있는지’는 모르고 ‘무슨 내용’인지만 제공합니다. 반면, 로컬라이제이션은 구매 금액, 납기 일자, 고객명 등 필드가 문서 어디에 배치되어 있는지를 정확히 인식합니다.

기존 방식은 룰 기반 접근과 컴퓨터 비전 모델의 조합이 많았으나, 다양한 문서 포맷에서 유연성을 확보하기 어렵고 확장성 측면에서도 제약이 많았습니다. Amazon Bedrock 기반의 멀티모달 LLM을 사용하면, 별도의 학습 없이 자연어 인터페이스와 시각적 이해 능력을 활용해 다양한 문서 유형에 적용 가능한 고도화된 추론이 가능합니다.

Amazon Nova 기반 로컬라이제이션 솔루션 설계 및 활용 시나리오

Amazon Bedrock의 Foundation Model(FM) 중 하나인 Amazon Nova Pro를 활용한 문서 필드 로컬라이제이션 시스템 구조는 다음과 같습니다:

  • 입력: 문서 이미지 (JPEG 등)와 텍스트 기반 프롬프트
  • 처리: Nova Pro 모델에 입력 이미지 및 프롬프트 전달
  • 결과: 필드 좌표를 JSON 형식으로 출력 (픽셀 단위 또는 정규화된 좌표)

여기서 두 가지 프롬프트 전략이 사용됩니다:

  1. 이미지 크기 기반 전략: 실제 문서의 너비/높이 정보를 기반으로 절대 좌표 제공
  2. 정규화 좌표 전략: 0~1000 범위로 정규화된 좌표 사용, 다양한 문서 크기에도 유연함

필드 스키마(field schema)는 구성 파일을 통해 관리되므로 코드 수정 없이 손쉽게 확장 가능합니다. 이 점은 배포 자동화 및 운영 측면에서 유리합니다.

샘플 문서 레이아웃 - 인보이스 예시

벤치마킹 – FATURA 데이터셋 기반 성능 비교

이 솔루션은 10,000건, 50종 템플릿으로 구성된 FATURA 공개 인보이스 데이터셋을 기반으로 테스트되었습니다. 이 데이터셋에는 24개의 필드가 문서 이미지와 함께 JSON 형식으로 주석 처리되어 있어, 필드별 정밀도 평가에 최적화되어 있습니다.

벤치마킹 전략으로는 아래 3가지 프롬프트 방식이 테스트되었습니다:

  • 이미지 크기 기반 좌표 방식
  • 정규화된 (0–1000 범위) 좌표 방식
  • 그리드라인 추가 방식 (성능 향상 목적)

그 결과, Amazon Nova Pro는 정규화 좌표 전략에서 성능이 가장 안정적이었으며, 전체 평균 mAP(Mean Average Precision)는 0.8305로 나타났습니다.

필드별 정확도 분석 결과 그래프

각 필드별로 보면 날짜, 총액, 주소 등 명확하게 구조화된 텍스트 필드에서 높은 정확도를 보였으며, 다양한 서식의 통화 형식이나 소수점 표현에서도 안정적인 추출 성능을 입증했습니다.

실제 사용 결과 예시는 다음과 같습니다:

{
"template": "template1",
"metrics": {
"mean_ap": 0.842,
"field_scores": {
"DATE": [0.94, 1.0, 1.0],
"TOTAL": [0.72, 1.0, 1.0],
"SELLER_ADDRESS": [0.96, 1.0, 1.0]
}
}
}

Amazon Nova Pro 필드 로컬라이징 예시 결과 이미지

정리하며 – 문서 정보 추출 자동화의 새로운 기준

Amazon Bedrock 위에 구축한 Amazon Nova Pro 기반 문서 필드 로컬라이제이션 시스템은 기존의 복잡한 컴퓨터 비전 아키텍처를 대체하며 높은 정확성과 유연함을 확보하였습니다. 특히 코드 수정 없이 설정 파일 변경만으로 필드 구성 변경이 가능해 운영 효율성이 극대화됩니다. Amazon Nova를 활용하면 문서 유형 변화에 유연하고, 학습 없이도 높은 정확도를 보장해 업무 프로세스 전반에서 자동화를 가속화할 수 있습니다.

이제 Amazon Nova와 함께 활용 가능한 문서 인식 자동화 전략을 통해 기업 문서 처리 환경을 혁신해보세요.

https://aws.amazon.com/blogs/machine-learning/benchmarking-document-information-localization-with-amazon-nova/

AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!

(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기


AI, Cloud 도입 상담 배너