AI 에이전트에서 중요한 요소, '기억(Memory)' – Amazon Bedrock AgentCore Memory로 해결하는 방법
AI 어시스턴트가 5분 전에 들은 내용을 잊어버린다면 과연 쓸모가 있을까요? 인간은 과거 대화, 선호, 맥락을 바탕으로 관계를 쌓아 나갑니다. 그러나 현재 대부분의 대규모 언어 모델(LLM)은 상태가 없는(stateless) 구조로, 세션 종료 이후에는 이전 맥락을 기억하지 못하는 단점이 있습니다. 이로 인해 일관성 있는 대화를 유지하거나 사용자 선호를 반영하는 데 한계가 있으며, 많은 개발자들이 이러한 문제를 해결하기 위해 복잡한 커스텀 메모리 인프라를 직접 구성해왔습니다.
이러한 배경에서 AWS는 Amazon Bedrock AgentCore Memory를 발표하여 AI 에이전트에게 문맥을 인식하고 기억할 수 있는 '기억 장치'를 제공하며, 높은 수준의 맞춤형 사용자 경험을 구현할 수 있도록 지원합니다.
AgentCore Memory의 주요 활용 영역
Amazon Bedrock AgentCore Memory는 AI 어시스턴트가 지속적이고 자연스럽게 사용자와 상호작용할 수 있도록 지원하는 완전 관리형 메모리 서비스입니다. 다음과 같은 다섯 가지 설계 원칙에 기반해 개발되었습니다.
- 추상화된 저장소: 개발자는 복잡한 메모리 인프라를 따로 구성하지 않아도 됩니다.
- 보안과 안정성: 메모리에 저장되는 모든 정보는 전송 중 및 저장 중 암호화됩니다.
- 연속성: 대화 세션 내 이벤트를 시간순으로 저장하여 이야기 흐름을 유지합니다.
- 계층 구조 메모리: 네임스페이스를 이용해 구조적이고 세밀하게 접근 제어가 가능합니다.
- 고성능 확장성: 대용량의 메모리 데이터를 지연 없이 처리하고 검색할 수 있습니다.
결과적으로, 사용자가 똑같은 정보를 반복해서 제공하지 않아도 되고, 과거 정보를 기반으로 더 나은 서비스 제공이 가능해집니다.
구성 요소별 기능 및 구현 비교
AgentCore Memory는 다음과 같은 구성 요소로 나뉩니다.
-
Memory Resource
기억 저장소의 기본 단위로서, 저장 기간, 보안 설정, 전략에 대한 정보를 담은 논리적 컨테이너입니다. 예를 들어 고객 지원 에이전트를 위한 리소스를 생성할 수 있으며, AWS KMS를 통해 데이터 암호화도 설정 가능합니다. -
단기 메모리 (Short-Term Memory)
해당 세션 내의 대화를 구조화된 이벤트 형태로 기록합니다. 각 이벤트는 actorId(사용자 ID), sessionId(대화 세션 ID), memoryId(메모리 리소스 ID)로 개별 분리되어 저장됩니다. 이 기록된 이벤트 중 일부는 장기 메모리를 위한 데이터로 활용됩니다. -
장기 메모리 (Long-Term Memory)
단기 메모리를 바탕으로 추출된 통찰, 선호, 요약 등의 정보가 구성됩니다. 여기에는 3가지 핵심 전략이 사용됩니다.
- Semantic Strategy: 대화에서 파악된 사실 지식
- Summary Strategy: 세션별 요약
- User Preferences Strategy: 사용자의 선호 사항 및 스타일
이를 통해 AI 에이전트는 "이 사용자는 파이썬을 선호합니다"와 같은 메타 정보를 기억하여 향후 대화에 반영할 수 있습니다.
- 네임스페이스(Namespace)
파일 시스템과 유사한 계층적 구조를 제공하며 사용자, 조직, 세션별 메모리 분리를 지원합니다. 예를 들어,
/retail-agent/customer-123/preferences는 특정 고객의 선호 데이터를 나타냅니다. 네임스페이스를 통해 고속 검색과 보안 구성이 가능해집니다.
고급 기능: 대화 흐름을 관리하는 브랜칭 & 체크포인트
AgentCore Memory는 다음과 같은 고급 기능도 제공합니다.
- 브랜칭 (Branching): 하나의 세션 흐름에서 다양한 대화 경로를 분기하여 실험적 접근 또는 메시지 수정 시 활용할 수 있습니다.
- 체크포인트 (Checkpointing): 특정 시점의 컨텍스트를 저장해 다중 세션 또는 긴 흐름의 작업을 중단 없이 이어갈 수 있습니다.
예를 들어 금융 상담 어시스턴트는 고객이 중간에 대화를 멈췄더라도 다음 세션에 동일한 지점에서 대화를 이어갈 수 있게 됩니다.
메모리 최적화를 위한 구현 가이드라인
AI 시스템의 효율적인 운영을 위해 다음과 같은 자동화 및 설계 전략을 추천합니다.
-
구조화된 메모리 설계
단기/장기 메모리를 목적에 따라 분리하고, TTL(유지 기간)을 적절히 설정해야 합니다. 예: 세션 히스토리는 30일, 선호 정보는 1년. -
전략적 메모리 전략 구성
기본 전략 외에도, 특정 도메인에 특화된 커스텀 전략을 구성해 더욱 정밀한 장기 기억을 구현할 수 있습니다. -
메모리 검색 자동화
필요 시마다 최근 이벤트나 요약을 검색하고, 세션 맥락을 자동 주입(Context Hydration)하여 자연스러운 대화를 유도합니다. -
보안 및 프라이버시 설계
PII 제거, IAM 기반 민감 정보 접근 제어, KMS 기반 암호화 설정을 반드시 병행해야 하며, 보안 사고를 방지하기 위한 Memory Poisioning 대응도 필요합니다. -
가시성 확보 및 모니터링
메모리 구축 이후에는 실시간 이벤트 로깅, 전략 성능 모니터링, 주기적 리뷰를 통해 지속적으로 운영을 개선해야 합니다.
결론 및 AI 메모리 구축 시 고려사항
AgentCore Memory는 복잡한 시스템 구성을 자동화함으로써 AI 도입·배포의 문턱을 낮추고, 맞춤형 사용자 경험을 실현하려는 기업에게 큰 장점이 될 수 있습니다. 특히 고객 지원, 금융 상담, 기술 어시스턴트 등 장기 컨텍스트가 필수적인 도메인에서는 도입 효과가 극대화됩니다.
기억은 사람과 시스템 간 상호작용을 인간다워지게 합니다. 이제 AI도 기억을 갖게 하여, 더 똑똑하고 의미 있는 인터페이스를 만들 수 있습니다.
AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!
(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기