所以,我昨天在 Opus 4.5 和 Codex 5.2 上嘗試了這些提示。 以下是我的結論(附收據): 1. 我昨天給的指令定義不清。我當時很不耐煩,也很懶,對模型態度很差,基本上是希望 Opus 能讀懂我的心思。我沒有任何證據表明模型的性能有所下降。 2. 在耐心清理提示訊息後,兩個模型都成功完成了這項(難度極高的)任務。它們順利通過了初步測試,耗時相同(約30分鐘/約15萬個令牌),而且後續提出的問題幾乎完全一致。 (!) 3. GPT 5.2 在最關鍵的地方產生了更優秀的程式碼。 Opus 4.5 在計算布魯因指數時出現了錯誤,這是一個嚴重的邏輯錯誤,後來不得不進行修復。它也毫無必要地重複了一個龐大的函數。 GPT 5.2 正確地解決了這些問題,並且更加謹慎地處理了 Opus 4.5 難以處理的邊緣情況。 我會在評論中分享日誌,其中包括: - 初始提示 - 完整聊天記錄 最終結果 研究我如何建構這個提示的或許會有幫助,因為這確實是一項艱鉅的任務,而人工智慧最終成功地完成了它。我必須非常精確地處理一些細節,這些細節昨天讓 Opus 感到困惑,現在我會把這些內容加入文件中。教訓是:人工智慧是一個很棒的工具,但它們仍然受限於*你*。如果你的指令不夠好,它們一定會失敗。 最後,我必須坦白:如果我手動編寫程式碼,只需要幾個小時,而不是兩天。這次人工智慧完全是賠本買賣。 還有:你們都太在意我的話了,我覺得我的貼文給大家帶來了不必要的麻煩。請不要這樣。
聊天記錄和結果: https://t.co/VvtOkovKTY