X (Twitter)

Gemini Deep Research의 새로운 버전은 여러 연구 과제 벤치마크에서 최고의 성능을 달성했습니다. 인류의 마지막 시험(HLE 통합 지식 및 추론)에서 46.4%라는 최고 점수를 달성했습니다. 이 제품은 DeepSearchQA(다단계 웹 검색)에서 66.1%라는 매우 뛰어난 성능을 보여주었습니다. 또한 BrowseComp(검색 및 비교 작업)에서도 59.2%라는 매우 뛰어난 성능을 보여주었습니다. 이 모든 것들은 최첨단 기술의 성과입니다.

구글은 대규모 언어 모델이 "일회성 텍스트 생성 도구"에서 "지속적으로 작업을 수행할 수 있는 지능형 시스템"으로 진화하고 있다고 믿습니다. xiaohu.ai/c/xiaohu-ai/go…목적을 위해 설계된 인프라입니다. https://t.co/JKbP7fgQnh

구글은 대규모 언어 모델이 "일회성 텍스트 생성 도구"에서 "지속적으로 작업을 수행할 수 있는 지능형 시스템"으로 진화하고 있다고 믿습니다.

Interactions API는 이러한 목적을 위해 설계된 인프라입니다

小互(@imxiaohu)의 스레드

작성자 정보

스레드 내용