X (Twitter)

PaddleOCR에 이어 Wenxin도 한 단계 더 발전할 예정인가? LMArena가 방금 순위를 업데이트했는데, 바이두의 Wenxin Big Model 5.0 미리보기가 목록에 올랐습니다! 전 세계 2위를 차지했습니다! 테스트 데이터는 창의적 글쓰기와 긴 맥락 테스트에서 매우 높은 점수를 보여주며, 이는 회상 성과가 매우 우수할 것임을 의미합니다. 제 스크린샷을 자세히 보세요. 창의적 글쓰기, 지침 준수, 긴 질의 모두 GPT-5보다 높은 평가를 받았습니다! 이번에 바이두 원신(Wenxin) 모델의 실제 성능이 궁금합니다. 나중에 테스트 결과를 보여드리겠습니다. 또한, 재현율에도 주목해 보시기를 강력히 추천합니다. 이 점수로 판단하건대, 재현율은 좋을 것으로 예상되며, 이는 보고서 작성, 문서 해석, 데이터 정리와 같은 텍스트 작업에 큰 도움이 될 것입니다. 사실 이미 사용 가능합니다. LMArena에서 테스트 포털을 제공하고 있습니다. 하지만 검색해 보니 공식 출시는 13일 바이두 월드에서 예정되어 있는 것 같습니다. 이 모델에 대한 기술 보고서는 아직 공개되지 않았습니다. 공식 발표를 기다려야 할 것 같습니다. #마음에서 우러나온 말#ERNIE #Baidu #대규모 언어 모델#LLM

LMArena에 대한 자세한 리뷰 데이터

karminski-牙医(@karminski3)의 스레드

작성자 정보

스레드 내용