법률 문서 리뷰의 패러다임을 바꾸는 Lexbe와 Amazon Bedrock 기반 자동화 전략
서론
법률 분야에서의 문서 리뷰 작업은 대량의 데이터를 분석하고 정리하는 필수적 절차입니다. 하지만 수십만 건 이상의 문서를 대상으로 중요한 정보를 식별하는 일은 막대한 시간과 인력을 요구하며 오류 가능성도 높습니다. 이를 해결하기 위해 Lexbe는 Amazon Bedrock을 중심으로 AWS의 다양한 서비스를 통합하여 고도의 자동화와 정밀 분석이 가능한 문서 리뷰 솔루션을 구현하였습니다. 본 글에서는 Lexbe가 어떻게 Amazon Bedrock을 활용하여 법률 문서 분석에 혁신을 일으켰는지, 어떤 기술 스택을 도입했는지, 그리고 그 결과가 어떤 성과로 이어졌는지를 상세히 소개합니다.
본론
- 법률 산업의 데이터 도전 과제
법률 분쟁이나 소송 과정에서 수십만에서 수백만 페이지에 이르는 자료들 중 핵심 정보를 식별하는 것은 로펌과 기업들의 주요 과제입니다. 전통적인 키워드 검색 방식은 파일 양이 많아질수록 결과 해석이 난해해지며, 중요한 문서가 누락되는 위험이 존재합니다.
Lexbe는 이에 대한 해결책으로 AI 기반 Q&A 어시스턴트인 Lexbe Pilot을 개발하고 Amazon Bedrock Knowledge Bases를 중심으로 한 RAG(Retrieval-Augmented Generation) 워크플로우를 도입했습니다. 이를 통해 사용자는 문서를 하나하나 탐색할 필요 없이 자연어 질문 한 줄로 사건의 전모를 빠르게 파악할 수 있게 되었습니다.
- Amazon Bedrock 기반 아키텍처 구성
Lexbe의 문서 리뷰 자동화 플랫폼은 Amazon Bedrock과 AWS Fargate, Amazon OpenSearch 등 다양한 서비스로 구성되어 있으며, 안정적인 확장성과 사용성 중심의 구조를 가집니다.
주요 구성 요소는 다음과 같습니다.
- Amazon S3에 저장된 원본 문서를 Apache Tika를 활용해 텍스트로 변환
- Bedrock Knowledge Bases용 벡터로 임베딩하여 검색 최적화
- Titan Embeddings 모델과 Cohere를 실험적으로 적용하면서 다양한 토큰 사이즈(512, 1024)를 테스트
- Amazon OpenSearch를 활용해 텍스트/벡터 기반 검색 결합
- Fargate로 컨테이너 기반 대규모 처리 자동화
- Amazon CloudFront를 통한 안정적인 프론트엔드 요청 처리
이같은 구조는 단순한 키워드 검색이 아닌 의미 기반 검색과 실시간 질의응답 시스템으로 진화하여, 문서 속 '스모킹 건(smoking gun)'의 역할을 하는 결정적 정보를 신속하게 파악할 수 있도록 만듭니다.
- 배포 가이드 및 튜닝 사례
Lexbe는 베타 단계 이후 수차례의 반복 학습과 파라미터 최적화를 통해 성능을 대폭 개선하였습니다. Recall Rate(검색한 정답 문서의 비율)을 척도로 삼아 엔진을 지속 조정했으며 아래처럼 다섯 단계의 개선 단계를 거쳤습니다:
- 1차 (2024년 1월): 초기 Recall Rate 5%
- 2차 (4월): Bedrock Knowledge Bases 기능 확장 → Recall 36%
- 3차 (6월): 토큰 사이즈 최적화 등 → Recall 60%
- 4차 (8월): Titan v2 Text로 임베딩 → Recall 66%
- 5차 (12월): Reranker 기술 도입 → Recall 90% 도달
이러한 반복 실험과 배포 가이드를 기반으로 Lexbe는 대규모 데이터 속에서도 중요한 증거를 높은 신뢰도로 찾아낼 수 있게 되었으며, 실제 업무에 배포 가능한 수준으로 안착하는 데 성공했습니다.
- 실제 활용 사례
Lexbe Pilot은 단순한 질문응답을 넘어 판례 분석과 사실 조사 보고서 생성까지 가능하게 만들어졌습니다.
- 인더스트리얼 사고 사건에 대해 전체 사실 보고서를 자동 생성. 문서별 하이퍼링크, 섹션 구분 등 완성도 높은 출력을 제공
- 이름이 명시되지 않은 가족 구성원을 메타데이터와 텍스트 결합 분석을 통해 추론
- 다국어 문서에서도 의미 기반 문맥 일치 정보를 정확히 연결
이러한 자동화된 인사이트 생성은 기존 도구로는 불가능했던 업무 효율성과 정확도를 제공하며, 법률 문서 자동화의 새로운 기준을 확립하였습니다.
- 비교 및 활용의 장점
Lexbe의 전략은 단지 기술적 도입에 머무르지 않고, 실제 비용절감·보안·확장성이라는 클라우드 자동화의 모든 이점을 확보했습니다.
- AWS ECS의 Linux Spot 인스턴스로 비용 최적화
- AWS IAM 권한 제어 및 암호화를 통한 보안 강화
- 완전히 서버리스로 운영되므로 인프라 부담 없음
즉, 기존 레거시 시스템과 비교할 때 유지보수 비용은 낮추면서도 지속 확장이 가능한 구조를 갖추었습니다.
결론
Lexbe 사례는 법률 분야에서 어떻게 AI/ML 기반 자동화 전략이 수동적이고 복잡한 워크플로우를 변화시킬 수 있는지를 잘 보여줍니다. Amazon Bedrock 및 관련 AWS 서비스를 활용하면, 문서 중심의 작업은 단순 반복 업무가 아닌 전략적 판단 중심의 고부가가치 업무로 변화할 수 있습니다. 이러한 자동화 기술은 법률 산업뿐만 아니라 의료, 제조, 금융 등 다양한 분야에서 확산 가능성이 높으며, AWS의 탄탄한 기술력과 함께 새로운 혁신을 만들어낼 기반이 됩니다.
지금이 바로 클라우드 기반 AI 활용의 첫 발을 내딛을 시점입니다. 조직의 요구에 맞는 AI 인프라를 AWS와 함께 설계하고, 단계적 배포 전략을 수립하여 디지털 전환을 시작해 보십시오.
AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!
(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기