对于那些使用 GPT-5.1 自定义指令的用户:在一个规模较小的测试中(3 次试验使用自定义指令要求不要使用长破折号,3 次试验不使用),翻译任务的结果截然不同,使用自定义指令的试验结果接近错误。这让我很惊讶,因为没有自定义说明的翻译结果甚至没有破折号。 所谓“勉强错误”,我的意思是翻译本身在技术上是正确的,但完全不符合原文的语气,听起来非常沮丧。