為了初步了解模型的性能,我不會用任何特定的「能力」來測試它。我只是重複使用一個大約 6 萬字的、未經訓練但我很熟悉且理解透徹的上下文,然後進行反覆測試。我觀察自己能學到多少東西,以及模型究竟是如何失效或完全崩潰的。 你需要自己的語境。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年12月12日 凌晨12:32
為了初步了解模型的性能,我不會用任何特定的「能力」來測試它。我只是重複使用一個大約 6 萬字的、未經訓練但我很熟悉且理解透徹的上下文,然後進行反覆測試。我觀察自己能學到多少東西,以及模型究竟是如何失效或完全崩潰的。 你需要自己的語境。