X (Twitter)

33/100 Instruções medíocres não apenas levam à mediocridade, mas podem até mesmo levar a erros. A essência do modelo principal reside no próprio mecanismo de "Previsão do Próximo Token", que, na verdade, revela uma cruel verdade: o modelo principal é essencialmente uma máquina de preenchimento de probabilidades. "Instruções medíocres não apenas levam à mediocridade, mas podem até mesmo levar a erros." 1. Por que instruções medíocres geram resultados medíocres? —Princípio: A "armadilha da média" das distribuições de probabilidade Grandes modelos são treinados com quantidades massivas de dados (toda a internet). Dentro desse enorme espaço amostral: Conteúdo medíocre (bate-papo informal, respostas comuns em fóruns e explicações superficiais) representou mais de 80%. Conteúdo profundo, profissional e altamente perspicaz (artigos de alto nível, código especializado, análises aprofundadas) constitui apenas uma pequena parte. Ao inserir uma instrução genérica e vaga (por exemplo, "Escreva o código do jogo da cobrinha"), o modelo buscará a maneira mais provável de jogar com base na "Previsão do Próximo Token" nos dados de treinamento. Resultado: Ele fornecerá a resposta "mais comum". Ou seja, um código comum que pode ser encontrado em qualquer lugar online, sem nada de especial e que pode até conter erros comuns. Ele simula um "nível geral". Conclusão: Sem intervenção externa, o modelo sempre tenderá a regredir à média. Palavras-chave medíocres significam deixar o modelo navegar no "terreno comum". 2. Por que os prompts escritos por "especialistas" são melhores? —Princípio: Limitar o escopo da busca no espaço de probabilidade. Aqui, "especialista" refere-se não apenas a pessoas, mas também à "densidade de informação" e aos "termos técnicos" contidos nas palavras-chave. Ao usar jargões especializados, processos de pensamento ou paradigmas de codificação específicos em suas instruções, você está, na verdade, fazendo uma coisa: podando. Exemplo A (medíocre): "Ajude-me a otimizar este código." Caminho de previsão do modelo: Inclui sugestões de "otimização" de todos os níveis, do iniciante ao intermediário, e do especialista, e considera o valor médio. Exemplo B (Especialista): "Refatorar este código com base nos princípios SOLID, eliminar efeitos colaterais e melhorar a legibilidade usando um paradigma de programação funcional." Caminho de previsão do modelo: Após o surgimento de termos como SOLID, efeitos colaterais e programação funcional, o modelo filtra automaticamente os pesos dos dados de "fóruns de baixo nível" ao prever o próximo termo. Ele é então direcionado para o espaço de probabilidade restrito, porém de alta qualidade, de "bases de código de alta qualidade escritas por engenheiros seniores". Conclusão: Palavras-chave de alta qualidade essencialmente se conectam a regiões de dados de treinamento de alta qualidade. Você precisa agir como um especialista para que o modelo responda com a mesma linguagem de um especialista. 3. Três sugestões principais de "Next Token Predict" Com base nesse mecanismo, podemos derivar três diretrizes de ação específicas: A. O contexto é o destino Um modelo não pode criar conteúdo de alta qualidade do nada; ele só pode "dar continuidade" a conteúdo de alta qualidade. Recomendação: Se você deseja resultados rigorosos, seu Prompt deve estar livre de erros gramaticais e de digitação (ou pelo menos os erros de digitação não devem ser ambíguos). Se você deseja que seu código seja elegante, seu Few-shot (exemplo de Few-shot) deve ser elegante. Cada token inserido é um voto para o próximo token. B. Restrições explícitas > Liberdade total Como a previsão é probabilística, perguntas abertas podem fazer com que o modelo divirja para a hipótese mais provável, que considera "absurda". Recomendação: Em vez de perguntar "Qual você acha que é a melhor abordagem?", diga "Por favor, liste três opções e crie uma tabela comparativa com base na 'dificuldade de implementação' e nos 'benefícios esperados'". Você precisa estabelecer "diretrizes" para o caminho previsto. C. As palavras-chave precisam ser "preparadas". As previsões precisam ser baseadas em evidências. Se as informações anteriores estiverem ausentes, a previsão é aleatória. Recomendação: Antes de fazer perguntas, defina primeiro a Persona e o Contexto para o modelo. Ruim: “Explique a mecânica quântica”. Bom: “Você é um professor de física ganhador do Prêmio Nobel dando aula para calouros. Por favor, explique a mecânica quântica usando uma analogia simples.” -> Isso basicamente pede ao modelo para prever “o que o Professor Feynman diria em seguida se estivesse dando aula”. Resumir A essência da Engenharia de Resposta Rápida é manipular a distribuição de probabilidade de um modelo por meio de sequências de entrada cuidadosamente projetadas, de modo que sua saída esteja dentro da faixa de alta qualidade desejada. Palavras-chave medíocres = desencadeando uma alta probabilidade de respostas medíocres nos dados de treinamento. Instruções profissionais = ativam à força 1% dos dados essenciais na memória profunda do modelo. É por isso que muitas técnicas avançadas de estímulo (como a cadeia mental CoT e o Few-Shot) estão agora tentando simular o processo de pensamento de especialistas humanos — a fim de induzir os modelos a produzir trajetórias de previsão semelhantes às dos especialistas. Portanto, a engenharia de palavras-chave não se resume à "comunicação", mas sim à "formação de matrizes". O que precisamos não é "focar nas próprias palavras-chave", mas sim aprender estratégias de comunicação adequadas para "um domínio específico". É assim que podemos ativar melhor a saída ideal do modelo em larga escala. Para alguém com um conhecimento básico de programação, instruções concisas podem ser muito eficazes; para alguém com um conhecimento básico de redação publicitária, mesmo um modelo menos sofisticado pode alcançar os resultados de um modelo de alto nível. Modelos de grande porte também precisam de orientação. ------ Uma comunidade de compartilhamento de conhecimento foi lançada. Ao participar da comunidade, você terá acesso a... 1. Orientação/consultoria individual intensiva e prática. Já ofereci consultoria para gerentes de produto, programadores profissionais que não usaram IA e usuários iniciantes, e todos que tiveram uma boa experiência a consideraram excelente; alguns até estenderam a sessão. Vagas limitadas aos 100 primeiros clientes. 2. Conteúdo exclusivo da comunidade, mais sistemático e aprofundado. 3. Grupo exclusivo para membros: ajudem-se mutuamente, conversem sobre IA e façam progressos ilimitados. 4. Sessão semanal de perguntas e respostas, respondida por mim.

Estamos planejando novos conteúdos e o preço aumentará para 498 até o final do mês.

Thread de 海拉鲁编程客 (@hylarucoder)

Informações do autor

Conteúdo da thread