메뉴 닫기

Amazon Bedrock과 Datadog LLM Observability를 통한 에이전틱 AI 모니터링 통합 방법

지능형 AI 에이전트 모니터링, Amazon Bedrock과 Datadog LLM Observability의 통합 방법

최근 생성형 AI 기술의 급속한 발전과 함께, 단순한 질문 응답형 챗봇에서 벗어난 에이전틱(Agentic) AI 시스템의 시대가 열리고 있습니다. 이들 시스템은 다수의 에이전트가 협력하여 문제를 해결하고, 외부 툴과의 연동, 지식 기반 탐색, 맥락 유지 등 복잡한 논리 구조를 수행합니다. 이러한 고도화된 생태계를 안정적으로 운영하기 위해서는 ‘관찰 가능성(Observability)’이 무엇보다 중요합니다.

이 글에서는 Amazon Bedrock 기반의 에이전틱 AI 시스템을 효과적으로 모니터링하고, 문제 해결 및 성능 최적화를 가능하게 하는 Datadog의 LLM Observability 통합 기능에 대해 소개합니다.

Amazon Bedrock과 Datadog의 통합이 중요한 이유

Amazon Bedrock은 복잡한 요청을 다단계로 분할해 여러 에이전트를 통해 처리하도록 설계할 수 있는 유연한 프레임워크를 제공합니다. 이러한 에이전트를 구성하고 실행 로직을 자동화하되, 문제가 발생했을 때 상세한 분석이 어려운 문제점이 있었습니다.

Datadog LLM Observability는 이러한 문제를 해결하기 위해 설계된 솔루션입니다. 모델 호출, 툴 사용, 지식 기반 접근 내역까지 세세하게 트레이싱하고, 각 단계별 오류 및 지연 시간을 파악할 수 있어 ‘어떻게 실행되었는가’, ‘무엇이 원인인가’를 정확히 알 수 있습니다.

AI 고객지원 챗봇에 대한 LLM 관찰 대시보드 예시

핵심 기능 및 활용 사례

  1. 성능 최적화 및 비용 제어
    Bedrock 기반 에이전트는 수많은 호출과 연산을 거치며 실행됩니다. Datadog은 다음과 같은 성능 지표를 수집하여 성능을 모니터링하고 비용까지 제어할 수 있습니다.
  • 지연 시간 추적: 각 단계 및 전체 실행 시간 분석
  • 오류율 분석: 에이전트 단위의 실패율 확인 및 디버깅
  • 토큰 사용량: LLM 호출 시 소모된 토큰 수량을 실시간으로 수집
  • 툴 호출 내역: Lambda, 웹 API, 지식 기반 쿼리 호출 로그 분석
  1. 복잡한 에이전트 워크플로우 추적
    에이전트는 툴 호출, 지식 접근, 모델 실행을 연속적으로 수행합니다. Datadog은 이러한 다단계 흐름을 텔레메트리로 수집하여 시각화합니다.
  • 전체 콘텍스트 추적: 실행 경로에 따른 시각적 흐름 파악 가능
  • 오류 지점 파악: 실패한 세부 단계와 그 맥락까지 파악하여 신속한 대응 가능

여행 추천 봇 실행 추적 상세 내역

  1. 출력 평가 및 품질 관리 자동화
    에이전트가 언뜻 성공적으로 실행된 것처럼 보여도, 실제로는 잘못된 정보를 제공하거나 비정상적 출력을 내놓을 수 있습니다. 이를 방지하기 위해 Datadog은 다음과 같은 기능을 제공합니다.
  • 기본 제공 평가 기능: 프롬프트 인젝션, 결과 편향, 불쾌한 내용 포함 여부 등 자동 감지
  • 사용자 정의 평가: 도메인 기준에 맞춘 출력 정합성 또는 정책 준수 여부 시각화
  • 가드레일 모니터링: 실행 중 특정 조건에 맞춰 필터링이 작동했는지 분석

배포 방법과 자동화 구현

Python 애플리케이션을 기반으로 Amazon Bedrock을 활용하는 경우, Datadog의 ddtrace 라이브러리를 통해 손쉽게 통합할 수 있습니다.

  1. 필수 조건
  • Bedrock 접근이 가능한 AWS 계정
  • Bedrock을 사용하는 Python 기반 애플리케이션
  • Datadog 계정 및 API 키
  1. 기본 설치 코드 예시
from ddtrace.llmobs import LLMObs
LLMObs.enable()
  1. 고도화 필요시 환경변수 또는 런타임 변수 전달 방식으로 커스터마이징 가능

활용 가이드, 비교 자료, 설정 자동화에 관한 자세한 안내는 Datadog LLM Observability SDK 문서를 참고하면 됩니다.

결론

Datadog은 AWS 공식 특화 파트너이자, 100개 이상의 AWS 서비스 통합 경험을 바탕으로 신뢰성 높고 자동화 가능한 모니터링 도구를 제공합니다. 특히 생성형 AI 분야에서 Amazon Bedrock과의 통합을 통해 에이전틱 AI 애플리케이션의 가시성과 신뢰성을 동시에 확보할 수 있습니다. 생성형 AI 서비스 도입을 고려하는 기업이라면, 운영 최적화를 위하여 필수적으로 검토해야 할 솔루션입니다.

[1] https://aws.amazon.com/blogs/machine-learning/monitor-agents-built-on-amazon-bedrock-with-datadog-llm-observability/

AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!

(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기


AI, Cloud 도입 상담 배너