메뉴 닫기

Amazon Nova 모델을 활용한 이메일 데이터 추출 정확도 향상 방법

이메일 데이터 추출에서 정확성을 향상시키는 Amazon Nova 모델 활용

이메일 데이터를 처리하는 업무에서 정확하고 효율적인 데이터 추출이 중요합니다. 이번 글에서는 Amazon Nova 모델을 AWS의 SageMaker AI와 결합하여 이메일 데이터의 추출 정확도를 높이는 방법을 알아보겠습니다. 이 방법은 주로 전자상거래 기업들을 대상으로 적용할 수 있으며, 자동화를 통해 비용 절감과 성능 향상을 기대할 수 있습니다.

이메일 데이터 추출 문제 해결을 위한 Amazon Nova 모델의 활용

Parcel Perform은 전 세계 전자상거래 비즈니스를 위한 AI 기반 배송 경험 플랫폼으로, 다양한 이메일 형식의 구조화된 정보를 추출하는 데 어려움을 겪었습니다. 이를 해결하기 위해 Amazon SageMaker AI를 통해 Amazon Nova 모델을 미세 조정(fine-tuning)하여, 데이터 패턴 인식 능력을 향상시키고 비용을 절감했습니다.

Amazon SageMaker와 Nova 모델 아키텍처

솔루션 개요 및 사례

Amazon SageMaker AI를 통한 맞춤형 모델 미세 조정은 전자상거래 이메일에서 맞춤형 개체 추출을 가능하게 합니다. 이번 협력에서는 PEFT를 통해 제한된 훈련 데이터로도 효율적이며 정확한 모델 커스터마이징을 이뤄냈습니다. 이러한 접근 방식은 94.77%의 추출 정확도를 달성하며, 비용을 절감할 수 있었습니다. 또한, 모형의 추론 지연 시간을 30% 이상 줄였습니다.

활용 방법 및 결과 평가

SageMaker AI를 활용해 다양한 이메일 형식에 적용할 수 있는 훈련 데이터를 준비, S3에 업로드하고, SageMaker Studio에서 데이터 준비 단계를 수행했습니다. 이렇게 준비된 데이터로 SageMaker AI API를 통해 Nova 모델을 미세 조정하고, 데이터 추출 정확성을 크게 향상시켰습니다.

이 과정에서 Nova Micro 모델은 최대 94.77%의 정확도를 기록하였으며, 표준 모델 대비 성능이 크게 향상되었습니다. 또한, 소규모 훈련 데이터셋만으로도 충분한 정확성 향상을 이루어낼 수 있음을 보여주었습니다. 최종적으로 Parcel Perform은 이러한 결과를 바탕으로 생산성을 높이면서 비용도 절반으로 줄이는 성과를 달성할 수 있었습니다.

결론

Amazon Nova 모델을 AWS SageMaker AI를 통해 최적화함으로써 얻은 주요 결과는, 모델이 데이터 내 유사 항목을 제대로 구별하고 허구의 정보를 생성하지 않으며, 매우 적은 훈련 데이터로도 높은 성과를 낼 수 있다는 점입니다. 또한, PEFT를 사용하여 Amazon Bedrock에 맞춤형 모델을 배포하는 것도 가능합니다. 이로써 우리는 고객이 비용 효율성과 성능 모두를 향상시킬 수 있도록 돕고 있습니다.

[1] https://aws.amazon.com/blogs/machine-learning/fine-tune-amazon-nova-models-for-accurate-email-data-extraction/

AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!

(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기


AI, Cloud 도입 상담 배너