AI 솔루션의 새로운 바람: AWS와 NVIDIA의 협력 확대 AI 기술의 진보는 비즈니스에 새로운 기회를 주고 있습니다. 특히 AI를 실험 단계를 넘어 실질적인 비즈니스 성과를 창출하는…
인공지능 시대의 효율적인 추론 인프라: AWS에서의 Disaggregated Inference 도입 인공지능이 발전하고 대규모 언어 모델(LLM)의 사용이 증가하면서 효과적인 추론 인프라의 중요성이 커지고 있습니다. 특히, 대규모 AI…
에이전틱 AI: 조직 속 성과 창출을 위한 실천 가이드 에이전틱 AI는 최신 AI 기술 중 하나로, 기업 환경에서 큰 가치를 창출하기 위해서는 기술 그 이상을…
아마존 세이지메이커를 활용한 오프라인 피처 스토어 구축 데이터 과학 작업에서 머신러닝(ML) 피처를 관리 및 구축하는 것은 복잡한 이슈입니다. 여러 팀이 분산된 데이터셋과 변환을 따로 관리할…
워크휴먼과 아마존 퀵사이트의 혁신적 접목 사례 워크휴먼은 전 세계 700만 사용자를 대상으로 매번 개별 보고 요청을 처리하면서 기존 보고 도구의 한계를 절감하게 되었습니다. 이러한 상황에서…
P-EAGLE: vLLM의 병렬 추론 가속화를 위한 혁신적 접근 최근 AI 분야에서는 추론 속도를 높이기 위해 다양한 기법들이 사용되고 있습니다. 그중에서도 P-EAGLE는 기존의 EAGLE 방식보다 더…
신뢰할 수 있는 AI 에이전트 배포를 위한 Amazon Bedrock AgentCore의 Policy 활용 가이드 인공지능(AI) 에이전트를 규제가 엄격한 산업에 안전하게 배포하는 것은 중요한 과제가 되고 있습니다.…
아마존 베드락에서 새로운 클라우드와치 지표 활용으로 추론 작업의 운영 가시성 향상 기계 학습 분야에서 놀라운 성과를 보이고 있는 아마존 베드락에서, 인퍼런스 워크로드의 운영 가시성을 대폭…
NVIDIA 네모트론 음성 ASR의 Amazon EC2를 통한 도메인 적응 및 세부 조정 가이드 AI 기술이 점점 발전하면서 음성 자동 인식(ASR) 시스템은 다양한 산업에서 매우 중요한…
멀티모달 비디오 검색 시스템 구축: 대규모 AI 데이터 레이크 활용 비디오 데이터를 효율적으로 처리하고 검색하는 시스템이 필요할 때, 아마존 웹 서비스(AWS)의 다양한 도구를 활용하여 구축할…