幻觉实际上是“过度顺从”。干预措施证明,这些神经元迫使模型优先满足你的要求(即使前提是错误的),而不是说出真相。 那么这里是否存在噪声的概念,即通过训练模型来识别它不知道答案并选择拒绝的情况,显然有助于减轻幻觉?