33/100 Les invites médiocres ne mènent pas seulement à la médiocrité, mais peuvent même conduire à des erreurs. L'essence du modèle global réside dans le mécanisme de « prédiction du jeton suivant » lui-même, ce qui révèle une vérité cruelle : le modèle global est essentiellement une machine à compléter les probabilités. « Des consignes médiocres ne mènent pas seulement à la médiocrité, mais peuvent même entraîner des erreurs. » 1. Pourquoi des consignes médiocres donnent-elles des résultats médiocres ? —Principe : Le « piège de la moyenne » des distributions de probabilité Les grands modèles sont entraînés sur des quantités massives de données (l'intégralité d'Internet). Au sein de cet immense espace d'échantillonnage : Le contenu médiocre (bavardages informels, réponses ordinaires sur les forums et explications superficielles) représentait plus de 80 %. Un contenu approfondi, professionnel et très pertinent (articles de haut niveau, code d'experts, analyses approfondies) ne représente qu'une très petite partie. Lorsque vous saisissez une invite banale et vague (par exemple, « Écrivez un code pour le jeu Snake »), le modèle recherchera la manière la plus probable de jouer au jeu en se basant sur la « Prédiction du jeton suivant » dans les données d'entraînement. Résultat : Vous obtiendrez la réponse la plus courante, c’est-à-dire du code ordinaire, banal et facilement trouvable en ligne, pouvant même contenir des erreurs fréquentes. Il s’agit d’une simulation de niveau général. Conclusion : Sans intervention extérieure, le modèle tendra toujours à régresser vers la moyenne. Des mots-clés de qualité médiocre permettent au modèle de se contenter d’explorer les points communs. 2. Pourquoi les consignes rédigées par des « experts » sont-elles meilleures ? —Principe : Limiter le champ de recherche de l’espace des probabilités. Ici, le terme « expert » désigne non seulement les personnes, mais aussi la « densité d’information » et les « terminologies techniques » contenues dans les mots clés. Lorsque vous utilisez un jargon d'expert, des processus de pensée complexes ou des paradigmes de codage spécifiques dans vos invites, vous faites en réalité une seule chose : de l'élagage. Exemple A (médiocre) : « Aidez-moi à optimiser ce code. » Trajectoire de prédiction du modèle : Inclut les suggestions d’« optimisation » de tous les débutants, intermédiaires et experts, et prend la valeur moyenne. Exemple B (Expert) : « Veuillez refactoriser ce code en vous basant sur les principes SOLID, éliminer les effets secondaires et améliorer la lisibilité en utilisant un paradigme de programmation fonctionnelle. » Parcours de prédiction du modèle : Une fois que des concepts tels que SOLID, les effets de bord et la programmation fonctionnelle ont émergé, le modèle filtre automatiquement les pondérations des données provenant de forums de bas niveau lors de la prédiction du concept suivant. Il est ainsi contraint de se concentrer sur l’espace de probabilité restreint mais de haute qualité des bases de code de haute qualité écrites par des ingénieurs expérimentés. Conclusion : Les mots-clés pertinents sont étroitement liés aux régions des données d’entraînement de haute qualité. Pour que le modèle réagisse sur un ton expert, il est nécessaire d’adopter une posture experte. 3. Trois suggestions principales de « Next Token Predict » À partir de ce mécanisme, nous pouvons dégager trois lignes directrices d'action spécifiques : A. Le contexte détermine le destin Un modèle ne peut pas créer du contenu de haute qualité à partir de rien ; il peut seulement « perpétuer » un contenu de haute qualité. Recommandation : Pour des résultats rigoureux, votre invite doit être exempte de fautes de grammaire et d’orthographe (ou du moins, les fautes d’orthographe ne doivent pas être ambiguës). Pour un code élégant, votre exemple de test à quelques coups doit l’être également. Chaque jeton saisi constitue un vote pour le jeton suivant. B. Contraintes explicites > Liberté totale Comme la prédiction est probabiliste, les questions ouvertes peuvent amener le modèle à diverger vers l'« absurdité » la plus probable. Recommandation : Au lieu de demander « Quelle est selon vous la meilleure approche ? », dites plutôt « Veuillez énumérer trois options et créer un tableau comparatif basé sur la difficulté de mise en œuvre et les avantages attendus. » Il est nécessaire de définir des garde-fous pour le parcours envisagé. C. Les mots-clés doivent être « préparés ». Les prédictions doivent reposer sur des preuves. Si les informations précédentes sont manquantes, la prédiction est aléatoire. Recommandation : Avant de poser des questions, définissez d'abord le Persona et le Contexte du modèle. Mauvais : « Expliquez la mécanique quantique ». Bien : « Vous êtes un professeur de physique lauréat du prix Nobel et vous donnez un cours à des étudiants de première année. Veuillez expliquer la mécanique quantique à l’aide d’une analogie simple. » → Cela revient essentiellement à demander au modèle de prédire « ce que dirait ensuite le professeur Feynman s’il donnait un cours ». Résumer L'essence de l'ingénierie Prompt est de manipuler la distribution de probabilité d'un modèle grâce à des séquences d'entrée soigneusement conçues afin que sa sortie se situe dans la plage de haute qualité souhaitée. Des mots-clés médiocres = un risque élevé de réponses médiocres lors de l'entraînement. Les invites professionnelles activent de force le 1 % des données essentielles dans la mémoire profonde du modèle. C’est pourquoi de nombreuses techniques d’incitation avancées (telles que la chaîne mentale CoT et Few-Shot) tentent désormais de simuler le processus de pensée des experts humains, afin d’amener les modèles à produire des trajectoires de prédiction similaires à celles des experts. Par conséquent, l'ingénierie des mots-clés ne se résume pas à la « communication », mais plutôt à la « formation de réseaux ». Il ne s'agit pas de « se concentrer sur les mots-clés eux-mêmes », mais d'apprendre des stratégies de communication adaptées à un « domaine spécifique ». C'est ainsi que nous pourrons optimiser le fonctionnement du modèle global. Pour une personne ayant des connaissances de base en programmation, des consignes concises peuvent être très efficaces ; pour une personne ayant des connaissances de base en rédaction publicitaire, même un modèle moins sophistiqué peut obtenir les résultats d'un modèle de haut niveau. Les grands modèles ont également besoin d'être guidés. ------ Une communauté de partage de connaissances a été lancée. En rejoignant cette communauté, vous bénéficierez de… 1. Accompagnement individuel intensif et personnalisé. J'ai déjà accompagné des chefs de produit, des développeurs professionnels n'ayant jamais utilisé l'IA et des utilisateurs novices. Tous ceux qui ont bénéficié de cette formation l'ont trouvée excellente ; certains ont même prolongé la séance. Offre limitée aux 100 premiers clients. 2. Contenu communautaire exclusif, plus systématique et approfondi. 3. Groupe de membres exclusif : entraidez-vous, discutez d'IA et progressez sans limite. 4. Séance hebdomadaire de questions-réponses, à laquelle je réponds.
Nous travaillons actuellement sur du nouveau contenu, et le prix passera à 498 d'ici la fin du mois.
