V3.2 版本似乎也印證了這一點,雖然方式略遜一籌,但本質上卻很相似。 LLM 普遍給它 9 分(滿分 10 分),而人工測試的結果則為 10 分。 Gemini 的測試結果只有 4 分。 Gemini 的 API 版本為我帶來了一些瑕疵。
我們需要服用陶鯨藥丸。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 2 則推文 · 2025年12月3日 凌晨12:13
V3.2 版本似乎也印證了這一點,雖然方式略遜一籌,但本質上卻很相似。 LLM 普遍給它 9 分(滿分 10 分),而人工測試的結果則為 10 分。 Gemini 的測試結果只有 4 分。 Gemini 的 API 版本為我帶來了一些瑕疵。
我們需要服用陶鯨藥丸。