메뉴 닫기

게임 크리에이티브 검색을 혁신하는 Amazon Nova 멀티모달 임베딩 활용법

게임 업계에서 광고 크리에이티브 자산의 양이 폭발적으로 증가하면서, 원하는 영상을 적시에 찾는 것이 점점 더 어려워지고 있습니다. 특히 수십에서 수백만 개에 달하는 이미지 및 영상 자산을 빠르게 검색하고 재활용하는 능력은 마케팅 성과에 직결되기에, 보다 정교한 검색 시스템의 필요성이 대두되고 있습니다. 이번 블로그에서는 이러한 문제를 해결하기 위한 AWS의 Amazon Nova Multimodal Embeddings를 중심으로, 실제 활용 사례 및 배포 가이드를 소개합니다. 특히 검색의 효율성과 자동화, 멀티모달 콘텐츠 활용에 초점을 맞춰 분석해 보겠습니다.

Amazon Nova Multimodal Embeddings는 텍스트, 이미지, 영상, 오디오 등 다양한 입력 형태를 하나의 벡터 공간에서 표현할 수 있는 혁신적인 모델입니다. 입력 방식의 유연성과 실제 콘텐츠 의미를 이해하고 검색할 수 있는 능력 덕분에, 레거시 방식 대비 훨씬 정밀하고 직관적인 검색 경험을 제공합니다.

기존 시스템은 크리에이티브에 키워드를 태깅하고, 디렉토리 방식으로 관리했습니다. 하지만 이 방식은 수작업이 많고, 상황마다 다르게 표현되는 키워드를 모두 대응하기 어렵기 때문에 검색 정확도가 제한적이었습니다. Nova 멀티모달 임베딩은 이러한 한계를 뛰어넘는 의미 기반 검색(semantic search)을 실현합니다. 예를 들어 “캐릭터가 손으로 카드를 누르는 장면” 같은 자연어로 검색하면 시스템은 해당 장면의 구체적 동작, 배경, 객체 요소 등을 이해해 정확한 영상 클립을 반환합니다.

AWS Nova 기반 멀티모달 검색 아키텍처 구성도

실제 배포 사례에서는 170개의 게임 크리에이티브 자산(130개 영상, 40개 이미지)을 이용한 벤치마크에서 96.7%의 검색 성공률과 상위 2개 결과 내 검색 성공률 73.3%를 기록하였습니다. 특히 텍스트 기반으로 영상 콘텐츠를 검색할 때 기존 키워드 방식이나 LLM 기반 태깅 방식 대비 월등한 정확도와 속도를 보이며, 크로스-모달 검색 정확도에서도 우수한 성과를 보였습니다.

AWS에서는 이 기술을 Amazon Bedrock, OpenSearch Service, Lambda, API Gateway 등과 긴밀하게 통합하여 손쉽게 배포 가능한 서버리스 아키텍처로 제공합니다. 전체 프로세스는 크게 콘텐츠 업로드와 검색 워크플로우로 나뉘며, 비동기 처리 방식을 채택하여 사용자 요청을 안정적이고 확장 가능하게 처리합니다.

Nova 모델 자체는 입력 콘텐츠의 의미를 이해하고, 비슷한 내용을 자동으로 분리해 정밀한 검색을 가능하게 합니다. 영상의 경우 1~30초 사이의 세그먼트로 잘라 각각 벡터화를 수행하며, 이를 기반으로 A/B 테스트용 영상 소재를 쉽게 탐색하는 것이 가능합니다.

실제로 다음과 같이 API 형태로 임베딩 요청을 처리합니다:

  • Amazon S3로 업로드된 미디어 파일을 수신
  • 비동기로 Nova Multimodal Embeddings을 호출하여 영상/오디오/텍스트 임베딩 벡터 생성
  • 생성된 벡터는 OpenSearch에 저장되어 향후 의미 기반 검색의 인덱스로 활용

또한 검색 인터페이스는 업로드 기반 검색 및 자연어 텍스트 쿼리 모두를 지원하며, 사용자는 손쉽게 크로스모달 콘텐츠를 탐색할 수 있습니다. 예를 들어 “빨간 스포츠카”를 입력하면 유사 이미지, 영상 클립, 리소스를 고정된 스코어 기반으로 반환해 줍니다.

기술적으로는 OpenSearch Service의 k-NN 검색 기능을 사용해 벡터 유사도를 측정하고, 각 임베딩 옵션에 따라 정확도와 비용을 조정할 수 있습니다:

  • 3072 차원: 최고 정확도 (예: 영어 89.3점, 중국어 78.2점)
  • 1024 차원: 균형 잡힌 성능 (추천)
  • 384/256 차원: 대규모 검색을 위한 비용 최적화

이 외에도 다국어 쿼리 처리 성능도 높아, 글로벌 게임 마케팅, 크로스 리전 영상 검색 등에도 효과적입니다. 특히 언어 간 성능 격차가 11% 이내로 우수하게 유지되며, 자산 검색의 자동화 및 정확도 향상 측면에서 큰 가치가 있습니다.

만약 직접 Amazon Nova 멀티모달 시스템을 활용하고자 한다면 아래 스크립트로 빠른 배포가 가능합니다.

  • AWS CLI, CDK, Python 환경 준비
  • 데모 리포지토리 클론
  • ./deploy_model.sh nova-segmented 명령어 실행

이후 웹 인터페이스를 통해 업로드, 검색, 결과 모니터링이 가능합니다. 리소스를 종료하려면 ./destroy_model.sh 명령어로 모든 AWS 리소스를 자동으로 정리할 수 있습니다.

결론적으로 Amazon Nova Multimodal Embeddings은 게임 업계뿐 아니라 모든 미디어, 광고, 영상 활용 산업에서 의미기반 자산 검색의 판도를 바꿀 수 있는 기술입니다. 쉬운 배포, 높은 정확도, 다양한 입력 지원, 자동화된 워크플로우는 AI 기반 콘텐츠 검색의 미래를 여는 데 필수적인 요소가 될 것입니다.

https://aws.amazon.com/blogs/machine-learning/scale-creative-asset-discovery-with-amazon-nova-multimodal-embeddings-unified-vector-search/

AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!

(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기


AI, Cloud 도입 상담 배너