X (Twitter)

所以，我昨天在 Opus 4.5 和 Codex 5.2 上嘗試了這些提示。以下是我的結論（附收據）： 1. 我昨天給的指令定義不清。我當時很不耐煩，也很懶，對模型態度很差，基本上是希望 Opus 能讀懂我的心思。我沒有任何證據表明模型的性能有所下降。 2. 在耐心清理提示訊息後，兩個模型都成功完成了這項（難度極高的）任務。它們順利通過了初步測試，耗時相同（約30分鐘/約15萬個令牌），而且後續提出的問題幾乎完全一致。 (!) 3. GPT 5.2 在最關鍵的地方產生了更優秀的程式碼。 Opus 4.5 在計算布魯因指數時出現了錯誤，這是一個嚴重的邏輯錯誤，後來不得不進行修復。它也毫無必要地重複了一個龐大的函數。 GPT 5.2 正確地解決了這些問題，並且更加謹慎地處理了 Opus 4.5 難以處理的邊緣情況。我會在評論中分享日誌，其中包括： - 初始提示 - 完整聊天記錄最終結果研究我如何建構這個提示的或許會有幫助，因為這確實是一項艱鉅的任務，而人工智慧最終成功地完成了它。我必須非常精確地處理一些細節，這些細節昨天讓 Opus 感到困惑，現在我會把這些內容加入文件中。教訓是：人工智慧是一個很棒的工具，但它們仍然受限於*你*。如果你的指令不夠好，它們一定會失敗。最後，我必須坦白：如果我手動編寫程式碼，只需要幾個小時，而不是兩天。這次人工智慧完全是賠本買賣。還有：你們都太在意我的話了，我覺得我的貼文給大家帶來了不必要的麻煩。請不要這樣。

聊天記錄和結果： https://t.co/VvtOkovKTY

來自 Taelin（@VictorTaelin）的推文串

作者資訊

推文串內容