인공지능으로 석유 가스 드릴링 데이터를 처리하는 Amazon Bedrock 기반 RAG 구현 사례

인공지능으로 석유 및 가스 산업의 드릴링 데이터를 처리하는 방법 – Amazon Bedrock 기반 고급 RAG 구현 사례

기업들은 오늘날 방대한 양의 멀티모달 데이터를 빠르고 정확하게 처리해야 할 필요성이 점점 커지고 있습니다. 특히 전문적인 기술 용어와 다양한 형식의 데이터가 복합적으로 얽혀 있는 문서를 다루는 경우, 전통적인 방식의 문서 처리 접근법은 한계를 드러냅니다. 이로 인해 비효율적인 데이터 추출, 놓치는 인사이트, 생산성 감소 같은 문제가 발생하고 있으며, 이는 특히 석유 및 가스 산업에서 두드러지게 나타나고 있습니다.

이번 블로그에서는 Infosys와 AWS가 협업해 Amazon Bedrock 기반으로 구축한 고급 생성형 AI(RAG) 솔루션 사례를 통해, 복잡한 드릴링 보고서를 어떻게 처리하고 인사이트를 추출해 비즈니스 성과를 이끌어내는지 소개합니다. 특히 이 시스템은 자동화된 멀티모달 문서 이해, 기술 문맥 보존, 다양한 검색 최적화 전략을 통해 각종 활용 시나리오에 강력한 대응력을 보여줍니다.

솔루션 개요: Amazon Bedrock 기반 고급 하이브리드 RAG 아키텍처

Infosys는 Amazon Bedrock Nova Pro, Amazon Titan Embeddings, OpenSearch Serverless, Cohere Embed English 모델 등 AWS의 다양한 구성 요소를 활용해 석유/가스 분야 특화 문서를 처리하는 솔루션을 개발했습니다.

Amazon Bedrock 기반 석유 가스 RAG 아키텍처 다이어그램

이 시스템은 PDF 분석과 이미지 처리를 위한 PyMuPDF, OpenCV와 같은 라이브러리로 데이터를 전처리하며, 고성능 임베딩 생성을 위해 Amazon Titan 및 Cohere 모델을 활용합니다. 검색 정확도를 높이기 위해 BGE Reranker를 통해 의미 유사도 기반 재정렬까지 수행됩니다. 또한 Amazon Q Developer를 프론트엔드 및 백엔드 개발에 활용해 확장성과 자동화를 가속화합니다. 구축 가이드를 기반으로 다양한 구성 패턴이 구현될 수 있어, 도메인 확장성과 비용 효율이 동시에 확보됩니다.

멀티모달 데이터와 구조 정보 유지 전략

드릴링 보고서는 도표, 석유층 구분 이미지, 엔지니어링 수치 데이터가 함께 포함된 복합 문서입니다. 본 솔루션은 이러한 데이터를 단순 텍스트 처리뿐 아니라 시각 정보까지 통합해 분석합니다. 특히 초기 이미지 분석에 이어 도메인 특화 프롬프트, 반복 추론을 통해 시각 정보를 상세한 설명으로 변환하는 방식이 도입되었습니다.

석유/가스 드릴링 보고서 예시 이미지

이후, 텍스트 내용은 문서 구조를 보존하면서 1,500 토큰 기준으로 중첩된 고정 청크 형태로 처리되며, 이미지 설명은 청크 없이 전체 문맥을 고려해 벡터 인덱싱됩니다. 고도화된 검색 자동화를 위해 세분화된 방향 설정이 도입되었고, 사용 질문에 더욱 적절한 응답을 추출할 수 있는 기반이 마련되었습니다.

하이브리드 청크링과 멀티 벡터 검색 기법의 도입

전통적인 고정 청크링이 문맥 분리 문제를 야기한 데 비해, Parent-Child 구조는 문서 내 의미적 상/하위 관계를 더 효과적으로 유지합니다. 특정 파트(예: 케이싱 정보, 시추 깊이)는 child 청크로, 전반적인 문맥은 parent 청크로 나누어 구성되었습니다. 이 구조는 검색의 콘텍스트 유지와 정밀도를 모두 높였습니다.

또한 다중 벡터 검색 전략을 접목해, 텍스트, 도표, 수치데이터 각각을 별도의 임베딩 공간에 저장하고 hybrid 방식의 연산으로 실시간 검색을 수행합니다. 예를 들어 “Permian Basin 지역에서 최근 시추된 가스 출현 보고서”라는 쿼리는 다음과 같이 처리됩니다.

“가스 출현”의 의미를 잡기 위한 의미 유사 검색
“Permian Basin” 문구의 정확 일치 검색
시기 조건에 맞는 필터 적용
관련 용어 확장(예: hydrocarbon indicators) 자동 삽입

고도화된 생성형 응답 전략과 반영 추론

정확한 기술 응답이 가장 중요한 석유 산업에서, 반영형 프롬프트 기법을 통해 모델의 응답을 자체적으로 검토하고, 산업 표준과 일치하도록 보정하는 메커니즘이 적용됩니다. 응답 결과는 신뢰 점수와 문서 출처를 포함해 제공되며, 사용자는 더욱 신뢰성 높은 자동화 응답을 얻게 됩니다.

구현된 고급 전략 요소는 다음과 같습니다:

Hypothetical Embeddings – 문서 내용을 기반으로 가상질문 생성 후 임베딩, 복잡한 시나리오 검색 향상
Recursive Retrieval – 다단계 정보 연결을 통한 종합 인사이트 도출
Semantic Routing – 쿼리에 맞는 최적의 정보기반 자동 선택
Query Transformation – 복합 질문의 단계별 자동 해체 및 재구성

실제 활용 효과 및 비즈니스 성과

이 솔루션은 현장 기술자 및 지질학자들에게 정확하고 빠른 정보를 제공하며 업무 효율성을 눈에 띄게 향상시켰습니다.

평균 쿼리 응답 시간: 2초 미만
정보 검색 정확도: 92% (전문가 기준 측정)
사용 만족도: 4.7/5
문서처리 비용 40~50% 절감
기술 정보 조회 시간 60% 단축

결론

Amazon Bedrock 기반 RAG 시스템을 활용한 이번 석유·가스 사례는 특정 산업 도메인에 최적화된 생성형 AI 활용 전략을 입증한 대표적 사례입니다. 특히 하이브리드 청크링, 의미 기반 자동 검색, 반영형 응답 기법, 고급 쿼리 자동화 전략 등을 통해 다양한 데이터 유형 처리 및 의사결정 효율화를 이뤄낸 점이 인상 깊습니다.

향후 실시간 센서 연계, 지질 데이터 시각화, 예측분석 통합 등을 통해 더 나아간 지능형 응용이 가능할 것으로 기대되며, 이는 에너지 산업 전반의 디지털 전환을 가속화할 것입니다.

https://aws.amazon.com/blogs/machine-learning/how-infosys-built-a-generative-ai-solution-to-process-oil-and-gas-drilling-data-with-amazon-bedrock/

AI, Cloud 관련한 문의는 아래 연락처로 연락주세요!

(주)에이클라우드
이메일 : acloud@a-cloud.co.kr
회사 번호 : 02-538-3988
회사 홈페이지 : https://www.a-cloud.co.kr/
문의하기

인공지능으로 석유 가스 드릴링 데이터를 처리하는 Amazon Bedrock 기반 RAG 구현 사례

카테고리