X (Twitter)

关于目前以小说写作为主题的法学硕士课程的一些观察/思考…… 我主要使用机器学习模型进行数学运算、原型/研究软件代码编写以及基本的日常质量保证/搜索……然而最近我决定尝试使用 GPT5.2 来创作科幻/惊悚小说……这是我自使用 GPT4.* 作为辅助工具参与动画剧本创作（QASIM，即量子高级智能矩阵，目前正在制作中）以来，首次尝试使用机器学习模型创作小说。我最初的构想：情节、人物、主题、虚构世界快速思考一下，与 2025 年第一季度相比，使用 LLM 进行虚构创作有哪些改进，哪些方面保持不变，哪些方面变得更糟。总体而言：对人物的理解不错，基本的散文结构扎实，对场景内情节的理解不错，对主题和基调的理解也不错（只要基调与某种类型的典型基调足够接近）。对话仍然非常生硬/陈词滥调，充其量只能算勉强可用（以我个人的审美标准来看），不过其中也有一些精彩的片段。更糟糕的是：5.2版本极其政治正确，甚至到了法西斯主义的地步。你必须费尽心思才能让角色进行黑客攻击，或者装扮成其他宗教的信徒。这简直太荒谬了——我们真的要把非法或冒犯性的行为从*虚构作品*中剔除吗？这让我想起了杰克·威廉姆森的经典小说《人形机器人》，小说中的人工智能机器人想要“服务、保护人类免受伤害”，所以它们禁止了木工坊（因为你可能会割伤自己！）和莎士比亚的作品（太令人不安了！！）。。。更好：主要区别在于，该模型现在可以理解整部小说的叙事和主题走向（好吧，这不是《追忆似水年华》，但是……），并将这种理解运用到每个部分的脚本编写中。最后，如果我能抽出时间来创作这部小说（比如在没有可用 wifi 的长途飞行中，我发现写小说是打发时间的好方法），我会这样做：以 LLM 的零稿为结构和节奏的指导，重写几乎全部内容，但保留 LLM 制作过程中精选的部分。这或许对我有用，因为我在自由创作小说时很难保持任何一种类型的氛围和结构，很容易就滑向超现实主义的意识花园……LLMs（可能是指某种写作模式或作品）在类型和陈词滥调方面确实很擅长，而我的本能是创作出对大多数读者来说过于另类、过于怪诞的作品，所以以LLM的结构（根据我的具体情节、人物和主题）作为参考模板或许会很有帮助……我们拭目以待…… 就技术进步而言，在短短九个月左右的时间里，某些方面取得如此显著的进步，显然令人印象深刻。就我个人经验而言，5.1 和 5.2 版本相比 4.* 或 o* 模型（以及任何其他与它们同时存在的非 OpenAI 模型）有了巨大的飞跃。（GPT-5-Pro 在数学方面也比之前的 o1 和 o3 有了巨大的飞跃……而且编码模型也在快速进步……但这并非本文的重点。）如果你想创作一些水平尚可但略显老套的类型小说，LLM（法学硕士）现在或许能做到，而且可能比著名的“普通人”做得更好……然而，在丰富的审美品质方面进展缓慢却令人费解。毕竟，网上有大量极具美感的素材可供训练。但就目前来看，真正引人入胜的审美需要作品本身具备一定的特殊性，而这种特殊性并非通过浅尝辄止地将海量数据集中的模式拼凑在一起的算法（或其他任何算法）就能获得的。 2026年或2027年的法学硕士（LLM）能否创作出具有美学吸引力的虚构作品，目前尚不得而知。就计算创造力而言，我更感兴趣的是开发能够根据自身生活经验创作出具有美学吸引力的作品的人工智能。诚然，委托一位法学硕士创作一部合适的虚构作品或许很棒，因为虚构作品能够有效地向那些更容易接受虚构作品而非非虚构作品的人们传达重要的思想。另一方面，我喜欢创作虚构作品，并不特别希望法学硕士“替我”完成所有工作。然而，人工智能架构需要达到怎样的水平才能跨越“模仿具有美学吸引力的人类作品”这一里程碑，无疑也令人十分感兴趣……我们尚未达到这一目标…… 我更多地将人工智能应用于音乐领域……我们的首张双专辑《苔丝狄蒙娜之梦》将于明年初发行，其中不仅有机器人演唱（包括歌唱和朗诵），还有各种人工智能生成的节拍和音景，并融入了大部分由人类演奏的音乐之中。今年六月，我们在墨西哥城进行了一次录音，其中大约一半的歌曲都包含较多的人工智能创作元素……我发现：如果你引导得当，并挑选出好的部分，人工智能可以创作出一些相当酷炫甚至深刻的片段……但如果你试图让它创作出过于完整的作品，它就会过于落入俗套，这不符合我的口味。当然，这并不是说用现在的音乐人工智能就创作不出一首合格的新流行歌曲，但我认为你无法创作出一首经典的流行歌曲，也无法创作出一首真正具有原创性和深刻内涵的复杂音乐作品。（我有一些关于如何利用现有技术使人工智能音乐创作更好地发挥作用的不同想法，但这些想法将神经网络模型与不同类型的人工智能混合在一起……但这也不是我在这里要讨论的主题……）低级逻辑模型（LLM）是介于弱人工智能和真正通用人工智能（AGI）之间的过渡技术。正如大多数关注我的人所知，我认为实现真正的通用人工智能将需要不同的方法（或许像Hyperon那样的混合系统，将低级逻辑模型作为其组成部分之一）。因此，我们可以等待真正的通用人工智能出现，届时它作为小说或音乐项目的创意合作者将更加可靠。也许只需几年时间，让我们拭目以待。另一方面，尝试不同功能级别的工具也很有趣，当然，这也是艺术创作过程的一部分——很多美学创作都离不开对媒介和工具局限性的探索和突破……从自然语言有限的词汇量（除非你在创作《芬尼根守灵夜》）到音阶的12个音符等等……低级逻辑模型每个新阶段的局限性都是艺术景观的一部分……

来自 Ben Goertzel（@bengoertzel）的推文线程

作者信息

线程正文