기업용 애플리케이션에서 RAG(검색 향상 생성)에 대한 새로운 체계적 검토가 여기에 있습니다. 기업들이 RAG를 제대로 활용하기까지는 아직 갈 길이 멉니다. RAG 시스템이 대량 생산에 적합하다고 단정 짓지 마십시오. 연구실에서의 프로토타입과 기업에서의 실제 배포 사이의 격차는 대부분의 사람들이 상상하는 것보다 큽니다. 이 체계적 문헌 검토에서는 2015년부터 2025년까지의 출판물을 포함하여 기업 지식 관리 및 문서 자동화 분야의 RAG + LLM 시스템에 대한 77개의 고품질 연구를 분석합니다. 연구 결과에 따르면 중앙 집중화된 기술 스택이 밝혀졌습니다. - 구현의 63.6%가 GPT 모델을 사용합니다. - 80.5%는 FAISS나 Elasticsearch와 같은 표준 검색 프레임워크를 사용합니다. - 66.2%는 확장을 위해 클라우드 인프라를 사용하는 것을 선호합니다. 그러나 "실험실과 시장" 간의 격차는 여전히 상당합니다. 검색 및 분류 작업에서는 k-겹 교차 검증(93.5%)과 같은 엄격한 검증 방법을 사용하는 경우가 많지만, 생성 평가는 계산적 한계로 인해 주로 정적 홀드아웃 데이터 세트에 의존합니다. 연구의 13%만이 실제 기업 환경에 RAG 프로토타입을 적용했습니다. 현재 5가지 주요 반복 과제가 있습니다. - 환각 조절(연구의 48.1%) - 데이터 개인정보 보호 및 보안(37.7%) - 지연 시간과 확장성(31.2%) - 도메인 적응(23.4%). - 비즈니스에 미치는 영향을 측정하기 어렵습니다(15.6%). 기술적 지표는 잘 다루어졌으며, 정밀도, 재현율, 정확도는 연구의 80.5%에 나타났고, ROUGE와 BLEU는 44.2%에 나타났습니다. 그러나 연구의 19.5%만이 인간-기계 협업 평가를 포함했으며, 최종 사용자 결과를 측정하는 실제 사례 연구는 여전히 부족합니다. 도메인별 데이터에 대한 미세 조정은 일반적으로 제로샷 방법에 비해 실제 이득을 10~20% 향상시킵니다. 하이브리드 검색(밀집 벡터와 지식 그래프를 결합)은 연구의 23.1%에 등장했으며 일반적으로 해석 가능성과 정확도가 향상되었습니다. 이 연구는 학문적 프로토타입과 생산 시스템 간의 격차를 메우기 위한 데이터 기반 로드맵을 제공합니다. 이 기술은 통제된 환경에서는 작동하지만, 개인 정보를 보호하는 검색, 100밀리초 미만의 지연 시간, 비즈니스 중심 평가 프레임워크는 기업 배포에 있어 여전히 해결해야 할 과제로 남아 있습니다. 🔖 신고 링크:
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
