자율주행 고도화를 위한 인공지능 배치 시스템 최적화 – Mobileye의 REM™ 사례 분석
최근 자율주행 기술은 다양한 인공지능(AI) 모델과 정밀지도(HD Map) 기반 서비스를 통해 점차 고도화되고 있습니다. 이 가운데 대표적인 자율주행 기술 선도 기업 Mobileye는 고속도로 및 도심 운행 정보를 실시간으로 수집하고, 이를 기반으로 업데이트되는 REM(Road Experience Management)™ 시스템을 운영하고 있습니다.
해당 시스템의 핵심은 ‘도로 변화 감지(Change Detection)’이며, 이 기능이 더욱 정교하게 작동하도록 AWS Graviton, Triton Inference Server, Amazon EC2 Spot 인스턴스 등을 효율적으로 활용하고 있는 점이 주목됩니다. 이 글에서는 Mobileye의 REM™ 시스템 내 AI 모델 CDNet을 기반으로 효율적인 AI 추론(deployment guides)을 어떻게 구현했는지 살펴봅니다.
고성능 도로 변화 감지 시스템의 필요성
자율주행 차량이 특정 경로를 주행하기 위해서는 기존에 구축된 정밀지도가 반드시 일치해야 합니다. 하지만 도로 공사, 차선 변경, 신호등 설치 등으로 인해 지도와 실제 경로 간의 불일치가 발생하게 됩니다. 이런 변화는 사람 운전자가 보면 간단히 적응할 수 있지만, 자율주행 시스템에는 치명적인 혼란을 안길 수 있기에 고도화된 자동 도로 감지 기능이 필수입니다.
Mobileye는 이를 위해 차량으로부터 수집한 데이터와 기존 지도 정보를 AI 모델 CDNet에 입력하여, 매우 높은 빈도로 자동 지도 수정 작업을 수행할 수 있는 Change Detection 시스템을 구축했습니다.

GPU보다 CPU 기반 AI 추론이 효과적인 이유
초기에는 CDNet 인공지능 모델을 GPU 인스턴스에서 실행하는 방식을 고려했지만, 분석 결과 CPU 기반 Spot Instance에서 전반적인 비용 및 처리량 측면의 효율이 뛰어났습니다.
GPU의 높은 가격과 낮은 스팟 가용성이 현실적인 제약이 되었고, 전체 파이프라인에서 CDNet 추론 외 추가 알고리즘 처리 과정들이 대부분 CPU에 더 적합했습니다. 이외에도 GPU 자원 활용률이 낮은 점도 문제가 되었습니다.

Triton Inference Server 도입을 통한 인프라 경량화
CDNet 모델의 메모리 및 초기 구동 비용을 줄이기 위해, Triton Inference Server를 도입하면서 AI 모델 추론을 중앙화하였습니다. 각 인스턴스마다 단일 CDNet 인스턴스를 컨테이너화하여 관리한 결과, 메모리 사용량은 8.5GB → 2.5GB로 감소하고, 처리 시간은 평균 4분 → 2분으로 줄어드는 성과를 거두었습니다.
이는 배포 자동화 및 병렬성과 관련된 튜닝 작업에 효과적이었으며, 배치형 추론 자동화 시스템 구성에서 중요한 전환점이 되었습니다.

추가 최적화로 Triton 이미지 슬림화 및 Graviton 도입
기본 Triton Docker 이미지는 다양한 백엔드와 GPU 지원 기능까지 포함되어 약 15GB 수준으로 크기가 방대했지만, CDNet에 필요한 백엔드만 남기고 CPU 전용으로 AI 추론 서버를 컴파일한 결과 2.7GB 수준으로 경량화할 수 있었습니다. 이는 일부 자동 확장 환경에서 배포 속도와 자원 활용률을 높이는 데 효과적이었습니다.
또한 최신 AWS Graviton 기반 EC2 인스턴스를 도입함으로써 가격 대비 처리 성능이 향상되었으며, Spot Instance 가용성 또한 증가했습니다. 특히 Graviton은 bfloat16, NEON, SVE 등의 ML 최적화 기능을 갖추고 있어 기존 x86 기반보다 더욱 가볍고 다이나믹한 AI 딥러닝 추론에 적합했습니다.

결과 요약 및 향후 효과
이번 Mobileye의 REM™ 시스템 최적화 사례는 다음과 같은 결과를 입증합니다.
- 성능 향상: Graviton 및 Triton 기반 구성으로 Change Detection 처리량 2배 이상 증가
- 비용 효율성: Spot Instance 기반 확장으로 전체 배포 비용 큰 폭 감소
- 유연한 배포 운영: 경량화된 컨테이너 이미지와 AI 추론 서버 자동 확장을 통한 지속 가능한 구성
- 유저 경험 향상: 실시간 지도 업데이트 속도 향상으로 더 정교한 자율주행 운행 가능케 함
결론적으로, AI 자동화 및 최적화는 개별 처리 속도보다는 전체 처리량과 효율성, 비용 대비 산출량을 개선하는 방향으로 설계 및 운영되어야 합니다. 앞으로의 AI 모델 운영에서 AWS Graviton 및 Triton Inference Server와 같은 유연한 도구 활용은 더욱 큰 차이를 만들 것으로 기대됩니다.
AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!
(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기
