문서 AI: 지능형 문서 처리(IDP)의 차세대 진화 @llama_index는 "문서 AI"를 공식적으로 제안했으며, 이것이 기존 IDP의 완전한 진화형이라고 믿고 있습니다. 즉, "단단한 템플릿 + 규칙"에서 생각하고, 스스로 수정하고, 자율적인 결정을 내릴 수 있는 진정한 지능형 에이전트 시스템으로 업그레이드하는 것입니다. 기존 IDP의 핵심적인 문제점은 고정된 템플릿에 지나치게 의존한다는 것입니다. 공급업체가 송장 형식을 변경하면 사실상 쓸모가 없게 됩니다. 일반 텍스트만 추출할 수 있으며 표, 차트, 손으로 쓴 텍스트, 이미지에는 거의 효과가 없습니다. • 통과율(완전 자동화 처리 비율)은 일반적으로 60-70%에 불과하며 나머지 30-40%는 수동 개입이 필요합니다. • 새로운 문서 유형이 나올 때마다 모델을 재교육하거나 규칙을 추가하는 데 몇 주에서 몇 달이 걸리므로 유지 관리 비용이 엄청나게 높아집니다. 기존 IDP/RPA와 비교했을 때 Document AI의 핵심 장점은 거의 모든 핵심 지표에서 질적으로 크게 향상되었다는 점입니다. • 완전 자동화된 패스스루율: 기존 60-70% → 문서 AI 90% 이상(인간 개입율 30-40%에서 10% 미만으로 감소) • 템플릿 요구 사항: 기존에 필수적이고 자주 유지 관리됨 → Document AI는 샘플 수를 전혀 사용하지 않고 완전히 새로운 형식을 처리합니다. • 다중 모드 이해: 기존에는 사실상 존재하지 않음 → Document AI는 복잡한 표, 차트, 사진, 필기 메모 등을 기본적으로 지원합니다. • 오류 처리: 기존에는 오류 발생 시 작동이 중단되고 수동 개입이 필요함 → Document AI는 불확실성을 자동으로 진단하고, 여러 번 재시도하고, 자체 수정하고, 심지어 사전에 설명을 요청하기도 함 • 새로운 문서 유형 출시 시간: 기존에는 몇 주 또는 몇 달이 소요됨 → Document AI는 일반적으로 몇 분에서 몇 시간 내에 완료합니다. • 전반적인 정확도: 기존에는 80-85%(템플릿 매칭 시) → Document AI는 지속적으로 95% 이상을 달성합니다. 가장 일반적인 미지급금 송장 시나리오를 예로 들어 보겠습니다. 과거에는 매달 수천 건의 송장 중 30%를 수동 검토해야 했습니다. Document AI를 도입한 후에는 보통 10% 미만만 사람이 검토하여 상당한 시간과 비용을 절약할 수 있습니다. AI의 두 가지 주요 기술 기둥을 문서화하세요 1. 에이전트 OCR 이 시스템은 시각 언어 모델(VLM)을 사용하여 전체 페이지 레이아웃, 테이블 논리, 차트 의미를 동적으로 이해합니다. 또한 추출 과정에서 스스로 점수를 매기고, 확실하지 않으면 자동으로 재시도합니다. 2. 에이전트 워크플로 하드코딩된 규칙을 LLM 기반 다중 에이전트 협업으로 바꾸면 컨텍스트를 기억하고, 외부 도구(데이터베이스 쿼리, 세금 계산, 일관성 확인)를 호출하고, 충돌이 발견되면 데이터를 추론하고 완성할 수도 있습니다. LlamaIndex는 레이아웃이 적용된 Markdown을 직접 출력하는 엔터프라이즈급 PDF 파서인 LlamaParse라는 즉시 사용 가능한 툴체인을 제공합니다. • LlamaExtract: 데이터 구조를 정의하기만 하면 상담원이 자동으로 양식을 작성합니다. • Workflows + LlamaAgents: 송장, 계약서, 10-K 재무제표, 양식 등을 위한 기본 템플릿이 포함된 기성 멀티 에이전트 워크플로 프레임워크입니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
