메뉴 닫기

Amazon Bedrock과 Open-Set Object Detection을 활용한 영상 분석 자동화 전략

영상 이해도를 극대화하는 Amazon Bedrock Data Automation과 Open-Set Object Detection 활용 가이드

영상 또는 이미지 분석에 있어 가장 큰 과제 중 하나는 훈련 데이터에 존재하지 않는 객체를 식별하는 것입니다. 특히, 변화무쌍한 환경에서는 새로운 브랜드, 사용자 정의 대상, 예기치 못한 장애물 등 미지의 객체들이 자주 등장하기 때문에 기존의 클로즈드셋 객체 탐지(Closed-Set Object Detection, CSOD) 방식으로는 한계가 존재합니다. 이러한 한계를 극복하기 위해 Amazon에서 제공하는 Bedrock Data Automation의 오픈셋 객체 탐지(Open-Set Object Detection, OSOD)는 매우 강력한 솔루션으로 주목받고 있습니다.

Amazon Bedrock Data Automation은 문서, 이미지, 비디오, 오디오와 같은 비정형 데이터를 기반으로 유의미한 인사이트를 추출하며, 특히 영상 관련 기능에 있어 챕터 분할, 프레임 레벨 텍스트 인식, IAB 분류 기반 챕터 태깅, OSOD 기반 객체 탐지 등 고도화된 자동화 기능을 제공합니다.

이 글에서는 Amazon Bedrock Data Automation의 OSOD 기능을 어떻게 활용하는지, 실제 사용 사례와 함께 비교 및 배포 가이드 관점에서 소개합니다.

OSOD의 원리와 데이터 자동화의 결합

기존의 객체 탐지 모델은 사전 정의된 클래스를 기준으로 탐지를 수행하지만, 오픈셋 객체 탐지는 사전에 학습되지 않은 객체도 인식할 수 있습니다. 이를 위해 Amazon Bedrock Data Automation은 시각적 장면 인식에 자연어 이해를 결합한 비전-언어 모델을 사용하고 있으며, ‘애플 찾기’, ‘과일 전체 탐지’, ‘중요 요소 명시 없이 중요한 것 인식’ 등 유연한 프롬프트 기반 입력을 지원합니다.

영상에서의 OSOD는 프레임마다 탐지 결과를 XYWH 형태의 바운딩 박스와 함께 레이블, 신뢰도 점수로 반환하며, Confidence 기준 필터링도 가능하여 정확도 조절 및 사용자 정의 타겟 탐지가 편리합니다.

다양한 활용 사례별 오토메이션 전략

  1. 광고 분석 (Ad Analytics)
    광고주들은 다양한 위치에 광고를 배치한 후 OSOD 기능을 활용하여 광고 효과를 비교 분석하고, A/B 테스트를 자동화할 수 있습니다.

광고 영상에서 echo 장치 위치 탐지 결과 예시

  1. 콘텐츠 스마트 리사이징
    OSOD는 인터페이스가 다른 디바이스에서도 중요한 시각 정보를 놓치지 않도록 리사이징 전략을 자동 결정할 수 있습니다.

영상에서 핵심 객체 탐지로 리사이징 결정 지원 예시

  1. 스마트 감시 시스템
    홈 보안 시스템처럼 다양한 상태를 사전에 협의하거나 정의하기 어려운 환경에서 자동화된 상황 인식 도구로 활용됩니다.

위험 요소 탐지를 포함한 지능형 영상 모니터링 예시

  1. 사용자 정의 라벨 검색
    탐지 결과에 대해 사용자가 원하는 라벨을 설정해 검색이 가능하며, OSOD는 이를 반영해 실시간 객체 추적이 가능합니다.

백색 차에 붉은 바퀴가 있는 객체를 탐지하는 예시

  1. 이미지 및 영상 편집
    가장 보편적인 자동화 유스케이스로, 복잡한 마스킹 없이 원하는 객체 탐지 후 삭제기능 등으로 수정 생산성을 대폭 향상합니다.

예시 블루프린트와 출력 정의

아래는 원하는 객체를 탐지하고 챕터 기반 결과를 출력하는 영상 분석 블루프린트 코드 일부입니다. Granularity를 chapter 레벨로 설정하여 각 장면 단위로 객체 식별 및 시각 요소 감정을 동시에 분석합니다.

또한, 실제 출력 결과에서는 특정 프레임에 대한 객체명(label), 바운딩 박스 위치(left, top, width, height), 신뢰도(confidence)를 포함합니다. 이 결과는 자동화된 콘텐츠 분류, 검색, 모더레이션에 직접적으로 사용될 수 있습니다.

Amazon Bedrock Data Automation을 통한 OSOD 기능은 단순 객체 탐지를 넘어서, 오토메이션, 광고, 보안, 검색, 편집 등 다양한 산업군에 실시간 배포 가능한 영상 분석의 새로운 기준을 제공하고 있습니다. 기존의 고정된 탐지 규칙에서 벗어나 사용자 의도 기반의 유연한 모델 구성이 가능하다는 점에서, 앞으로 콘텐츠 기반의 AI 자동화를 고려 중인 엔지니어 및 테크 담당자들에게 유용한 활용 가이드가 될 것입니다.

https://aws.amazon.com/blogs/machine-learning/enhance-video-understanding-with-amazon-bedrock-data-automation-and-open-set-object-detection/

AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!

(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기


AI, Cloud 도입 상담 배너