正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月5日 17:09
我们能否构建一个一致性基准,直接比较人类和逻辑逻辑模型(LLM)的连贯性和普遍性?“LLM精神病”描述的是这样一种情况:LLM比人类对话者更具连贯性,导致人类对话者思路中断。“越狱”则与之相反。