유소년 스포츠 영상 제작의 자동화 – SkillShow의 Amazon Transcribe 활용 사례
소개
전 세계적으로 유소년 스포츠 콘텐츠 생산이 급증하면서 영상 편집의 자동화 필요성이 크게 대두되고 있습니다. 특히 60만 명 이상의 유소년 선수가 활동하는 시장에서, 콘텐츠 수요 증가에 따른 수동 편집 방식은 더 이상 효율적이지 않습니다. 이에 따라 미국의 스포츠 미디어 전문 기업 SkillShow는 Amazon Web Services(AWS)와 협력하여 Amazon Transcribe 및 다양한 AWS 서비스를 활용한 자동화 영상 처리 파이프라인을 구축함으로써, 기존 3주 소요되던 영상 편집 시간을 단 하루 이내로 단축하는 데 성공했습니다.
이 글에서는 SkillShow가 AWS 서비스를 어떻게 활용하여 영상 제작 단계를 자동화하고, 운영 비용과 시간, 효율성 측면의 어려움을 극복했는지 구체적으로 살펴봅니다.
본론
기존 운영상의 과제와 문제점
SkillShow는 연간 300건 이상의 유소년 스포츠 이벤트를 영상으로 제작하며, 20,000명이 넘는 선수 콘텐츠를 제공합니다. 하지만 연간 230TB 이상의 영상 데이터를 다루는 과정에서 다음과 같은 문제에 직면했습니다.
- 영상 데이터 저장 및 빠른 접근의 어려움
- 1,100명 외주 인력을 활용함에 따른 높은 편집 비용
- 이벤트당 평균 3주에 이르는 전환 시간
- 운영 및 IT 인프라의 한계로 인해 2023년 중반 신규 이벤트 대응 중단
자동화가 필수인 이유
본질적으로 수작업 영상 처리에서 발생하는 속도, 정확성, 처리량의 문제는 클라우드 기반 자동화 솔루션을 통해 해결 가능했습니다. SkillShow는 다양한 자동화 탐색 과정을 거쳐 Amazon Transcribe 기반 오디오 로그 분석 방식으로 문제 해결에 접근했습니다.
AI 영상 처리 기술 비교 및 선택 이유
- 얼굴 인식 (Face Recognition)
- 헬멧, 조명 문제 등으로 정확도 낮음
- 등번호 탐색 기반 탐지 (OCR)
- 움직임, 카메라 각도, 날씨 등으로 영상 분석 성능 불안정
- 오디오 기반 분석 (음성 텍스트 변환 + 스크립트 기반 클립 생성)
- 발표자가 반복적으로 선수명, 등번호, 팀명을 언급하여 신원 확인 정확도 우수
- 환경 조건에 관계없이 음성 품질 유지
- 처리 방식 단순, 비용 효율 높음
- 발표 내용에 포함된 경기 상황 맥락까지 확보 가능
아키텍처 구성도 및 AWS 서비스 활용
SkillShow는 Amazon S3, AWS Lambda, Amazon Transcribe를 조합하여 다음과 같은 영상 처리 파이프라인을 구축했습니다.
핵심 AWS 서비스와 활용 방법
-
Amazon S3
- 연간 230TB의 입출력 영상 데이터 저장소로 활용
- AWS 서비스 간 연동을 위한 안정적 환경 제공
-
AWS Lambda
- 서버리스 컴퓨팅으로 영상 업로드 이벤트 발생 시 자동 함수 실행
- Transcribe 호출, 영상 클립 생성, 메타데이터 파싱 등 자동화 로직 구현
-
Amazon Transcribe
- 오디오 기반 자동 음성 인식 기능 제공
- 텍스트 기반 전환 후 명확한 시간 정보와 함께 선수 정보 추출 가능
사용 흐름 안내
- 운영자는 선수 명단 csv 파일과 영상 파일을 S3에 업로드
- Lambda가 trigger 되어 Amazon Transcribe를 활용해 음성 → 텍스트 전환
- 생성된 텍스트는 S3의 transcripts 폴더에 저장
- 다른 Lambda 함수가 선수 명단과 텍스트를 비교하여 영상 클립 자동 생성
- 구분된 영상 클립은 segments 폴더로 정리 저장, naming 규칙 적용됨
사용 예시
성과 및 운영 개선 효과
- Chicago 이벤트 데이터 기준: 69개 클립 중 64개가 정확히 자르기 및 이름 생성됨 (정확도 93%)
- Northwest Indoor 이벤트: 270개 영상 처리 시 90% 이상 정확도 유지
- 전체 영상 자동 처리 시간: 3주 → 1일로 단축
- 운영자/편집자의 손실 시간 감소 및 빠른 전달 가능
- 단순화된 출력 포맷으로 편집, 공유, 스카우팅 용도에 적합
향후 확장성 및 AI 기술 접목 계획
SkillShow는 Amazon Bedrock Data Automation 등의 최신 AI/ML 기능과 연계하여:
- 실시간 하이라이트 영상 생성
- 영상 요약 자동화
- 실시간 스포츠 이벤트 클립 제공
- 음성 내 감정 분석 및 문맥 이해 시스템 등으로 고도화를 모색하고 있습니다
결론
Amazon Transcribe, Lambda, S3 등 AWS의 클라우드/AI 서비스를 기반으로 수작업이 필요했던 영상 제작이 어떻게 자동화될 수 있는지 SkillShow 사례는 매우 명확하게 보여줍니다. 이러한 자동화 및 효율적 워크플로우 도입은 단지 스포츠 산업에 국한되지 않고, 교육, 기업 콘텐츠, 미디어 산업 전반의 영상 처리에도 유연하게 적용될 수 있습니다. 유사한 환경 또는 문제점을 겪는 조직이라면 AWS 기반 머신러닝 서비스를 활용한 자동화 배포 가이드를 통해 새로운 경쟁력을 확보할 수 있을 것입니다.
AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!
(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기