X (Twitter)

33/100 平凡なプロンプトは平凡さにつながるだけでなく、エラーにつながる可能性もあります。ビッグモデルの本質は「次のトークン予測」メカニズムそのものであり、これは残酷な真実を明らかにしています。つまり、ビッグモデルは本質的に確率補完マシンなのです。「平凡なプロンプトは平凡さにつながるだけでなく、エラーにつながる可能性もあります。」 1. 平凡なプロンプトでは平凡な結果になるのはなぜですか? —原理: 確率分布の「平均の罠」大規模モデルは膨大なデータ（インターネット全体）を用いて学習されます。この膨大なサンプル空間において、以下のことが起こります。平凡なコンテンツ（普段のおしゃべり、通常のフォーラムの返信、表面的な説明）が 80% 以上を占めました。奥深く、専門的で、非常に洞察力に富んだコンテンツ（一流の論文、専門家のコード、詳細な分析）は、ほんの一部にすぎません。ありふれた漠然としたプロンプト（「Snake ゲームのコードを書きなさい」など）を入力すると、モデルはトレーニングデータの「次のトークンの予測」に基づいて、ゲームをプレイする最も可能性の高い方法を検索します。結果：「最も一般的な」答えが返されます。つまり、オンライン上のどこにでも見られる、目立たない、よくあるエラーさえ含まれている可能性のある、ごく普通のコードです。これは「一般的なレベル」を模倣していることになります。結論：外部からの介入がなければ、モデルは常に平均値に回帰する傾向があります。中途半端な手がかり語は、モデルが「共通基盤」をサーフィンすることを意味します。 2. 「専門家」が書いたプロンプトの方が優れているのはなぜですか? —原則：確率空間の探索範囲を限定する。ここで言う「専門家」とは、人だけでなく、プロンプト語に含まれる「情報密度」や「専門用語」も指します。プロンプトで専門用語、思考プロセス、または特定のコーディングパラダイムを使用する場合、実際に行っているのは 1 つのこと、つまりプルーニングです。例 A (平凡):「このコードの最適化を手伝ってください。」モデル予測パス: 初心者、中級者、上級者全員からの「最適化」の提案が含まれ、平均値が取られます。例 B (エキスパート):「このコードを SOLID 原則に基づいてリファクタリングし、副作用を排除し、関数型プログラミングパラダイムを使用して読みやすさを向上させてください。」モデル予測パス：SOLID、副作用、関数型プログラミングといったトークンが出現すると、モデルは次のトークンを予測する際に「低レベルフォーラム」からのデータ重みを自動的に除外します。そして、モデルは「上級エンジニアによって書かれた高品質なコードベース」という、狭くも高品質な確率空間へと押し込まれます。結論：高品質なキューワードは、本質的に高品質なトレーニングデータ領域にロックインします。モデルが専門家のような口調で応答するには、専門家のように行動する必要があります。 3. 「Next Token Predict」からの3つの主要な提案このメカニズムに基づいて、次の 3 つの具体的な行動ガイドラインを導き出すことができます。 A. 文脈が運命を決めるモデルは、高品質なコンテンツをゼロから作成することはできません。高品質なコンテンツを「継続」することしかできません。推奨事項：結果を厳密にしたい場合は、プロンプトに文法エラーやタイプミスがないようにしてください（少なくともタイプミスは曖昧であってはなりません）。コードをエレガントにしたい場合は、Few-shot（Few-shotの例）もエレガントにする必要があります。入力するすべてのトークンは、次のトークンへの投票となります。 B. 明示的な制約 > 開かれた自由予測は確率的であるため、自由形式の質問によって、モデルが最も可能性の高い「ナンセンス」に分岐する可能性があります。推奨事項: 「最善のアプローチは何だと思いますか？」と尋ねる代わりに、「3つの選択肢を挙げ、『実装の難易度』と『期待されるメリット』に基づいて比較表を作成してください」と尋ねます。予測されるパスには「ガードレール」を構築する必要があります。 C. キューワードは「準備」される必要があります。予測は証拠に基づく必要があります。先行情報が空白の場合、予測はランダムです。推奨事項: 質問する前に、まずモデルのペルソナとコンテキストを定義します。悪い例：「量子力学を説明しなさい」良い例：「あなたはノーベル賞受賞の物理学教授で、新入生に講義をしています。簡単な例えを使って量子力学を説明してください。」→これは基本的に、モデルに「ファインマン教授が講義をしていたとしたら次に何を言うか」を予測するよう求めていることになります。要約プロンプトエンジニアリングの本質は、慎重に設計された入力シーケンスを通じてモデルの確率分布を操作し、その出力が望ましい高品質の範囲内に収まるようにすることです。平凡なキューワード = 平凡なトレーニングデータ応答をトリガーする確率が高い。プロフェッショナルプロンプト = モデルのディープメモリ内の重要なデータの 1% を強制的にアクティブ化します。このため、多くの高度なプロンプト技術 (CoT マインドチェーンや Few-Shot など) では、モデルが専門家の予測軌道と同様の予測軌道を生成するように誘導するために、人間の専門家の思考プロセスをシミュレートしようとしています。したがって、キューワードエンジニアリングは「コミュニケーション」そのものに焦点を当てるのではなく、「配列形成」に焦点を当てることが重要です。必要なのは、「キューワードそのもの」に焦点を当てるのではなく、「特定の領域」におけるコミュニケーション戦略を適切に学習することです。これにより、大規模モデルの最適な出力をより効果的に活用できるようになります。プログラミングの基礎知識を持つ人にとって、簡潔なプロンプトは非常に効果的です。一方、コピーライティングの基礎知識を持つ人にとっては、それほど洗練されていないモデルでもトップレベルのモデルと同等の結果を得ることができます。大きなモデルにも方向が必要です。 ------ 知識共有コミュニティが開設されました。コミュニティに参加すると… 1. マンツーマンの集中的なハンズオン指導／コンサルテーション。これまでプロダクトマネージャー、AI未経験のプロプログラマー、初心者ユーザーなどを対象にコンサルテーションを行ってきましたが、良い経験をされた方は皆、大変満足されており、中にはセッションを延長される方もいらっしゃいます。先着100名様限定です。 2. より体系的かつ詳細な、コミュニティ限定コンテンツ。 3. 限定メンバーグループ: 互いに助け合い、AI についてチャットし、無制限に進歩します。 4. 毎週の Q&A セッションで私が回答します。

現在、新たなコンテンツを企画しており、今月末までに価格は 498 に値上がりする予定です。

海拉鲁编程客（@hylarucoder）のスレッド

作者情報

スレッド内容