X (Twitter)

33/100 平庸的提示詞不僅導致平庸，甚至會導致錯誤大模型本質是「Next Token Prediction」（下一個token預測）這個機製本身，確實揭示了一個殘酷的真相：大模型本質上是一個機率補全機器。 “平庸的提示詞不僅導致平庸，甚至會導致錯誤” 1. 為什麼平庸的提示詞= 平庸的結果？ ——原理：機率分佈的“平均數陷阱” 大模型是在海量資料（整個網路）上訓練的。在這個巨大的樣本空間：平庸的內容（口水話、普通論壇回覆、淺顯的解釋）佔了80% 以上。深刻、專業、極具洞察力的內容（頂尖論文、專家程式碼、深度分析）只佔極少數。當你輸入一個平庸的、模糊的提示詞（例如：「寫個貪吃蛇代碼」），模型會基於「Next Token Prediction」去尋找在訓練資料中出現機率最大的接龍方式。結果：它會給你一個「最常見」的答案。也就是網路上隨處可見的、平平無奇的、甚至可能包含常見錯誤的普通代碼。它在模仿“大眾水平”。結論：如果不施加外力，模型總是傾向於「迴歸平均值」。平庸的提示詞，就是讓模型在「大眾區」衝浪。 2. 為什麼「專家」寫的提示詞比較好？ ——原理：限定機率空間的搜尋範圍這裡的“專家”，指的不僅僅是人，而是提示詞中包含的“資訊密度”和“專業術語”。當你在提示詞中使用了專家的行話（Jargon）、思考框架或特定的程式碼範式時，你實際上是在做一件事：剪枝（Pruning）。範例A（平庸）：“幫我優化這段程式碼。” 模型預測路徑：包含了所有新手、中手、高手的「最佳化」建議，取平均值。範例 B（專家）：“請基於SOLID 原則重構此程式碼，消除副作用，並使用函數式程式設計範式提升可讀性。” 模型預測路徑： SOLID、副作用、函數式程式設計這些Token 出現後，模型預測下一個Token 時，會自動屏蔽掉那些「低水準論壇」的資料權重。它被迫進入了「由高級工程師編寫的高品質程式碼庫」這個狹窄但高品質的機率空間。結論：高品質的提示詞，本質上是在鎖定高品質的訓練資料區域。你必須表現得像個專家，模型才會用專家的口吻回應你。 3. "Next Token Predict" 給我們的三個核心建議基於這個機制，我們可以推導出三個具體的行動指南： A. 上下文即命運(Context is Destiny) 模型無法憑空產生高品質內容，它只能「續寫」高品質內容。建議：如果你希望結果是嚴謹的，你的Prompt 就不能有語病和錯字(至少錯字不會引起歧義)。如果你希望程式碼是優雅的，你提供的Few-shot（少樣本範例）必須是優雅的。你輸入的每一個Token，都在為下一個Token 投票。 B. 明確的約束> 開放的自由因為預測是機率性的，開放式問題會導致模型發散到機率最高的「廢話」。建議：不要問“你覺得怎麼做比較好？”，而要說“請列出3 個方案，並按'實施難度'和'預期收益'構建對比表格”。你需要為預測路徑修建「護欄」。 C. 提示詞需要「預熱」 (Priming) 預測需要依據。如果前文是一片空白，預測就是隨機的。建議：提問前，先給模型設定Persona（人設）和Context（背景）。 Bad: “解釋量子力學。” Good: “你是一位獲得諾貝爾獎的物理學教授，正在給大一新生講課。請用通俗易懂的類比，解釋量子力學。” -> 這實際上是讓模型去預測“如果費曼教授在講課，他下一句會說什麼”。總結 Prompt Engineering 的本質，就是透過精心設計的輸入序列，以此來操縱模型的機率分佈，使其輸出落在我們期望的高品質區間內。平庸的提示詞= 觸發大概率的、平庸的訓練資料迴響。專業的提示詞= 強行激活模型深層記憶中那1% 的精華數據。這也是為什麼現在很多高階的Prompt 技巧（如CoT 思維鏈、Few-Shot）都在試圖模擬人類專家的思考過程——以此來誘導模型產生類似專家的預測軌跡。所以, 提示詞工程本身其實不完全是「溝通」而是「結陣法」, 大家需要的也不是「關注提示詞本身」,而是適當的去學習「某個領域」溝通方案, 這樣才能更好的激活大模型的最佳輸出稍微懂一些程式設計的人, 簡短的提示詞就能起到很好的效果, 稍微懂文案的人, 用差一些的模型都能獲得T0 模型的效果, 大模型也需要指明方向. ------ 開知識星球了，加入星球你會獲得 1. 一次1對1 高強度手摸手指導/諮詢。之前接過產品負責人/未使用ai 的pro coder / 小白用戶的諮詢，聊過都覺得蠻好，甚至後來還加了鐘，僅限前一百名 2. 社群獨家乾貨，更有系統，更深入 3. 專屬會員群，互幫互助，暢聊AI，無限進步 4. 每週答疑，本人解答

最近在規劃新的內容, 月底漲價到498

來自海拉鲁编程客（@hylarucoder）的推文串

作者資訊

推文串內容