X (Twitter)

Oppo AI Agent 팀의 새로운 논문 "O-Mem"은 장기적 상호작용에서 AI 에이전트의 메모리에 초점을 맞춥니다. O-Mem은 인간의 기억 메커니즘을 시뮬레이션하여 AI 에이전트를 "적응형 비서"와 더욱 유사하게 만들도록 설계된 혁신적인 메모리 프레임워크입니다. 단순히 과거 기록을 축적하는 것이 아니라, 사용자 프로필을 동적으로 구축하고, 장기적인 상호작용을 지원하고, 관련 정보를 효율적으로 검색할 수 있습니다. 본 논문의 핵심 주장은 기존 AI 에이전트 메모리 시스템에는 한계가 있다는 것입니다. 의미적으로는 무관하지만 중요한 사용자 정보를 간과하고 검색 노이즈를 유발하는 경향이 있습니다. O-Mem은 "선제적 사용자 프로파일링"을 통해 이러한 문제를 해결합니다. 즉, 각 상호작용을 사용자 모델을 업데이트할 기회로 간주하여 더욱 정확하고 경제적인 메모리 관리를 달성합니다. 핵심 방법론: O-Mem 프레임워크 O-Mem은 인간 기억의 구조에서 영감을 얻었으며, 전방위적인 기억 시스템을 형성하는 세 가지 보완적인 모듈로 구성되어 있습니다. • 페르소나 메모리: 선호도, 습관, 배경 등 사용자에 대한 장기적인 속성과 정보를 저장합니다(예: "사용자는 커피를 좋아하지만 카페인에 민감합니다"). LLM을 사용하여 상호작용에서 속성을 추출하고 "추가/무시/업데이트" 결정을 통해 동적으로 관리합니다. 속성은 LLM 강화 최근접 이웃 클러스터링을 통해 처리되어 단순성을 보장합니다. • 작업 메모리: 대화의 연속성을 유지하기 위해 주제별로 대화 기록을 매핑합니다. 예를 들어, 현재 쿼리에서 특정 주제와 관련된 과거 스니펫을 검색합니다. • 일화 기억: 과거 사건을 키워드나 단서(예: "생일")와 연결하여 연상 기억을 지원합니다. 역문서 빈도 점수를 사용하여 가장 고유한 단서를 선택하고, 흔한 단어의 간섭을 피합니다. 메모리 구축 및 검색 프로세스는 매우 효율적입니다. 새로운 상호작용에 대해 LLM은 주제, 속성, 이벤트를 추출하고 사전 매핑을 업데이트합니다. 검색 과정에서 세 가지 모듈이 병렬로 작동합니다. 작업 기억은 주제 관련 콘텐츠를 가져오고, 플롯 기억은 검색을 위한 단서를 선택하며, 문자 기억은 속성과 매칭합니다. 최종 검색 결과는 병합되어 LLM에 입력되어 응답을 생성합니다. 이러한 설계는 전체 히스토리 스캐닝을 방지하여 노이즈와 계산 오버헤드를 줄입니다. 실험 결과 및 평가: 팀은 세 가지 벤치마크에서 O-Mem을 테스트하여 성능과 효율성 측면에서의 장점을 입증했습니다. • LoCoMo 벤치마크(긴 대화 일관성): O-Mem은 LangMem(48.72%)보다 3% 향상된 51.67%의 F1 점수를 달성했으며, 특히 시간적 및 다중 홉 추론 작업에서 탁월한 성과를 보였습니다. • PERSONAMEM 벤치마크(사용자-LLM 개인화 대화): 정확도 62.99%, A-Mem(59.42%)보다 3.5% 향상, 선호도 추적 및 일반화 기능에서 선두를 달리고 있습니다. • 개인화된 심층 연구 벤치마크(실제 사용자 질의): 사용자 정렬은 44.49%로 Mem0(36.43%)보다 8% 더 높습니다. 효율성 측면에서 O-Mem은 기준치보다 훨씬 우수한 성능을 보입니다. 토큰 소비량은 94%(LangMem 80K 대비 1.5K), 지연 시간은 80%(LangMem 10.8초 대비 2.4초) 감소했으며, 메모리 사용량은 사용자당 3MB(LangMem 30MB 대비)에 불과합니다. 절제 실험 결과 각 모듈이 독립적으로 가치를 창출하는 것으로 나타났습니다. 예를 들어, 개인 메모리 모듈은 검색 시간을 77% 단축하는 동시에 성능을 향상시킬 수 있습니다. 파레토 성능-효율 최적성은 원본 히스토리(RAG)를 직접 검색하는 것과 유사하지만, 비용은 더 낮습니다. 논문에 대한 온라인 토론:

meng shao(@shao__meng)의 스레드

작성자 정보

스레드 내용