X (Twitter)

33/100 Las indicaciones mediocres no sólo conducen a la mediocridad, sino que pueden incluso llevar a errores. La esencia del gran modelo es el propio mecanismo de "Predicción del próximo token", que de hecho revela una cruel verdad: el gran modelo es esencialmente una máquina de finalización de probabilidades. "Las indicaciones mediocres no sólo conducen a la mediocridad, sino que pueden incluso llevar a errores". 1. ¿Por qué indicaciones mediocres equivalen a resultados mediocres? —Principio: La «trampa de la media» de las distribuciones de probabilidad Los modelos grandes se entrenan con cantidades masivas de datos (todo internet). Dentro de este enorme espacio muestral: El contenido mediocre (charlas informales, respuestas normales en foros y explicaciones superficiales) representó más del 80%. El contenido profundo, profesional y muy revelador (artículos de primer nivel, código experto, análisis en profundidad) constituye solo una parte muy pequeña. Cuando ingresa una instrucción vaga y mundana (por ejemplo, "Escriba el código del juego Snake"), el modelo buscará la forma más probable de jugar el juego basándose en la "Predicción del siguiente token" en los datos de entrenamiento. Resultado: Te dará la respuesta más común. Es decir, código común y corriente que se puede encontrar en internet, sin complicaciones, e incluso puede contener errores comunes. Imita el nivel general. Conclusión: Sin intervención externa, el modelo siempre tenderá a regresar a la media. Las palabras clave mediocres implican dejar que el modelo navegue por el terreno común. 2. ¿Por qué son mejores los mensajes escritos por "expertos"? —Principio: Limitar el alcance de búsqueda del espacio de probabilidad. Aquí, "experto" se refiere no solo a las personas, sino también a la "densidad de información" y los "términos técnicos" contenidos en las palabras clave. Cuando utilizas jerga especializada, procesos de pensamiento o paradigmas de codificación específicos en tus indicaciones, en realidad estás haciendo una sola cosa: podar. Ejemplo A (mediocre): "Ayúdame a optimizar este código". Ruta de predicción del modelo: incluye sugerencias de "optimización" de todos los principiantes, intermedios y expertos, y toma el valor promedio. Ejemplo B (Experto): "Refactorice este código basándose en los principios SOLID, elimine los efectos secundarios y mejore la legibilidad utilizando un paradigma de programación funcional". Ruta de predicción del modelo: Tras la aparición de tokens como SOLID, efectos secundarios y programación funcional, el modelo filtra automáticamente las ponderaciones de datos de "foros de bajo nivel" al predecir el siguiente token. Se ve obligado a entrar en el estrecho, pero de alta calidad, espacio de probabilidad de "bases de código de alta calidad escritas por ingenieros senior". Conclusión: Las palabras clave de alta calidad se centran esencialmente en regiones de datos de entrenamiento de alta calidad. Debes actuar como un experto para que el modelo responda con un tono experto. 3. Tres sugerencias clave de "Next Token Predict" A partir de este mecanismo podemos derivar tres pautas de actuación específicas: A. El contexto es el destino Un modelo no puede crear contenido de alta calidad de la nada; solo puede "continuar" contenido de alta calidad. Recomendación: Si desea que sus resultados sean rigurosos, su Prompt debe estar libre de errores gramaticales y tipográficos (o al menos, estos no deben ser ambiguos). Si desea que su código sea elegante, su Few-shot (ejemplo de Few-shot) debe serlo. Cada token que introduzca representa un voto para el siguiente token. B. Restricciones explícitas > Libertad abierta Debido a que la predicción es probabilística, las preguntas abiertas pueden provocar que el modelo se desvíe hacia el "sinsentido" más probable. Recomendación: En lugar de preguntar "¿Cuál cree que es el mejor enfoque?", diga: "Por favor, enumere tres opciones y cree una tabla comparativa basada en la 'dificultad de implementación' y los 'beneficios esperados'". Es necesario establecer "barreras de seguridad" para la ruta prevista. C. Las palabras clave necesitan ser "preparadas". Las predicciones deben basarse en evidencia. Si la información anterior está en blanco, la predicción es aleatoria. Recomendación: Antes de hacer preguntas, primero defina la Persona y el Contexto para el modelo. Malo: “Explica la mecánica cuántica”. Bien: "Eres un profesor de física ganador del Premio Nobel que da una clase a estudiantes de primer año. Por favor, explica la mecánica cuántica con una analogía sencilla". -> Esto básicamente le pide al modelo que prediga "qué diría el profesor Feynman si estuviera dando una clase". Resumir La esencia de Prompt Engineering es manipular la distribución de probabilidad de un modelo a través de secuencias de entrada cuidadosamente diseñadas para que su salida se encuentre dentro del rango de alta calidad deseado. Palabras clave mediocres = desencadenan una alta probabilidad de respuestas de datos de entrenamiento mediocres. Indicaciones profesionales = activan forzosamente el 1% de los datos esenciales en la memoria profunda del modelo. Es por esto que muchas técnicas avanzadas de estimulación (como CoT Mind Chain y Few-Shot) ahora intentan simular el proceso de pensamiento de expertos humanos, con el fin de inducir a los modelos a producir trayectorias de predicción similares a las de los expertos. Por lo tanto, la ingeniería de palabras clave no se centra únicamente en la comunicación, sino en la formación de matrices. Lo que necesitamos no es centrarnos en las palabras clave en sí, sino aprender adecuadamente las estrategias de comunicación para un dominio específico. Así es como podemos optimizar el resultado del modelo general. Para alguien con conocimientos básicos de programación, las indicaciones concisas pueden ser muy efectivas; para alguien con conocimientos básicos de redacción publicitaria, incluso un modelo menos sofisticado puede lograr los resultados de un modelo de primer nivel. Los modelos grandes también necesitan dirección. ------ Se ha lanzado una comunidad para compartir conocimientos. Unirse a ella te permitirá... 1. Asesoría y consulta práctica, intensiva e individualizada. Anteriormente, he brindado consultas a gerentes de producto, programadores profesionales sin experiencia en IA y usuarios principiantes, y todos los que tuvieron una buena experiencia la consideraron excelente; algunos incluso ampliaron la sesión. Limitado a los primeros 100 clientes. 2. Contenido comunitario exclusivo, más sistemático y profundo. 3. Grupo de miembros exclusivo: ayúdense entre sí, charlen sobre IA y logren un progreso ilimitado. 4. Sesión semanal de preguntas y respuestas, respondidas por mí.

Actualmente estamos planeando nuevo contenido y el precio aumentará a 498 a finales de mes.

Hilo de 海拉鲁编程客 (@hylarucoder)

Información del autor

Contenido del hilo