X (Twitter)

繼PaddleOCR後, 文心要硬起來了? LMArena 剛更新了榜單, 百度的文心大模型5.0-preview 上榜了! 而且是全球第二! 從測試數據上看創意寫作和長上下文測試分數非常高, 這意味著召回性能會很好. 注意看我的截圖, 創意寫作, 指令遵循, 長Query這三個, 甚至比GPT-5要高! 好奇這次百度的文心大模型的實際效果, 稍後我會為大家帶來測試, 另外強烈建議關注下召回能力, 從這個得分來看召回會不錯, 這會讓文本任務例如寫報告, 解讀文檔, 整理資料等都會很好另外現在其實已經可以用了, LMArena 上面給了測試入口. 不過我刷了一圈看樣子是要在13號的百度世界正式發布. 目前還沒放出這個模型的技術報告, 等一波發布. #文心一言 #ERNIE #百度 #大語言模型 #LLM

LMArena 上的詳細評測數據

来自 karminski-牙医（@karminski3）的推文线程

作者信息

线程正文