フィクション執筆ユースケースにおける現在の LLM に関するいくつかの観察/考察... 私は主に、数学、プロトタイプ/研究ソフトウェア コード、基本的な日常的な QA/検索に LLM を使用しています...ただし、最近、GPT5.2 を使用して SF/スリラー小説を書こうと決めました。これは、アニメの脚本を共同で作成する際にサポート ツールとして GPT4.* を使用して以来、LLM フィクションに挑戦する初めての試みです (QASIM、Quantum ASI Matrix、現在開発中)。 私が始めたもの:プロット、登場人物、テーマ、架空の世界 フィクション分野での LLM の使用に関して、現在と 2025 年第 1 四半期で何が改善されたか、何が同じで何が悪化したかについて簡単に考察します。 ほぼ同程度です。登場人物の理解は良好で、基本的な散文構成はしっかりしており、場面内の筋書きの理解も良好で、テーマとトーンの理解も良好です(ただし、トーンが特定のジャンルの典型的なトーンに近い限り)。会話は依然としてひどくぎこちなく、陳腐で、せいぜい半分しか使えません(私自身の感覚では)。ただし、素晴らしい断片もいくつかあります。 さらにひどいのは、5.2は極めてファシスト的なまでに政治的に問題があり、キャラクターにハッキングをさせたり、異宗教の人物に扮装させたりするために、わざわざ演出を加えなければならないことです。これは常軌を逸しています。私たちは本当に、違法行為や不快な行為を*フィクション*から排除したいのでしょうか?ジャック・ウィリアムソンの古典『ヒューマノイド』を思い出します。AIロボットが「人々に奉仕し、人々を守り、危害から守る」ために、木工作業(怪我をする恐れがあります!)とシェイクスピア(感情的に非常に不快です!)を禁止するのです。 より良い点: 主な違いは、モデルが小説全体の物語とテーマの流れを理解できるようになり (これは「失われた心」ではありませんが)、この理解を各パートのスクリプトに反映できるようになったことです。 結局、この小説を書く時間が見つかったら (たとえば、Wi-Fi が使えない長時間のフライト中にフィクションを書くのは時間を有効に活用するよい方法だと思うので ;)、私は次のようにします。LLM のゼロ ドラフトを構造とリズムのガイドとして採用し、LLM の作品から選択した部分を維持しつつ、ほぼすべてを書き直します。 これは実際に私にとって役立つかもしれません。なぜなら、フィクションを自由に書いているときは、どんなジャンルの雰囲気や構造にもとどまるのに苦労し、すぐにシュールレアリストの意識の分岐する道の庭園に陥ってしまうからです... LLM はジャンル性と決まり文句に非常に優れており、私の本能はほとんどの読者にとって過度に創造的で奇妙であることなので、LLM の構造 (特定のプロット、キャラクター、テーマに合わせてレイアウトされている) を大まかなテンプレートとして使用すると、かなり役立つかもしれません... どうなるか見てみましょう... 技術の進歩という点では、約9ヶ月という期間でこれだけの進歩を遂げたことは、確かにいくつかの点で印象的で劇的です。このユースケースにおいて、私見ではありますが、5.1と5.2は4.*やo*モデル(あるいはそれらと同時期に存在していたOpenAi以外のモデル)を大きく上回っています。(GPT5-Proも、数学に関しては従来のo1とo3を大きく上回っています。コーディングモデルも急速に進化していますが、ここではそれは触れません。) 有能だが陳腐なジャンル小説を量産したいなら、法学修士(LLM)は今や、かの有名な「平均的な人間」と同等か、もしかしたらそれ以上にできるだろう。しかし、豊かな美的品質に関する進歩が見られないのは興味深い。結局のところ、オンライン上には訓練に使える、非常に深く美しい素材がたくさんあるのだ。しかし今のところ、本物で人を惹きつける美的感覚には、創作される作品に一定の特異性が必要であるように思われる。それは、膨大なデータセットからパターンを浅く組み合わせるアルゴリズム(あるいは他のいかなるアルゴリズム)からは得られない。 2026年か2027年の法学修士課程の学生が、美的に魅力的なフィクション作品を生み出せるかどうかはまだ分かりません。計算科学的な創造性という点では、AIが自身の経験から美的に魅力的な作品を生み出せるようになることの方が、私にとっては魅力的だと感じています。確かに、法学修士課程の著者に適切なフィクション作品を依頼するのは面白いかもしれません。フィクションは、ノンフィクションよりもフィクションに感情的に受容されやすい人々に重要なアイデアを伝える強力な手段となり得るからです。一方で、私はフィクションを書くのが好きで、法学修士課程の学生にすべてを「私のために」やってほしいとは思っていません。しかし、AIアーキテクチャが「美的に魅力的な人間の製品を模倣する」というマイルストーンを達成するには、どのようなことが必要になるのかを見るのも確かに興味深いでしょう。…まだそこまでには至っていませんが…。 音楽分野ではAIとの協働を積極的に行っています。来年初めにリリース予定のダブルアルバム「Desdemona's Dream」では、ロボットによるボーカル(歌とスポークンワード)だけでなく、AIが生成した様々なビートやサウンドスケープを、主に人間によるジャムセッションの音楽に取り入れています。今年6月にはメキシコシティでレコーディングセッションを行い、曲の約半数にAI作曲の要素がより多く含まれました。そこでも気づいたのは、AIは、適切な指示を与えて良い部分を選べば、美的にクールで、あるいは深遠なセグメントやパートを生み出すことができるということです。しかし、作品全体を作り上げすぎると、陳腐な表現に陥ってしまい、私の好みには合いません。現在の音楽AIを使って、実現可能な新しいポップソングを作ることができないわけではありませんが、*クラシック*ポップソングや、より複雑なジャンルで真に独創的な意味を持つ楽曲を作ることは難しいと思います。 (現在の技術を使用して AI による音楽作曲をうまく機能させる方法についてはいくつか異なるアイデアがありますが、これらはニューラル モデルとさまざまな種類の AI を組み合わせたものであり、ここでの私の話題でもありません...) LLMは、狭義のAIと真のAGIの間の過渡期にある技術です。私のフォロワーのほとんどがご存知の通り、それは異なる方法(おそらくLLMを一つのコンポーネントとして活用するHyperonのようなハイブリッドシステム)で実現されるだろうと私は考えています。ですから、フィクションや音楽プロジェクトにおけるクリエイティブな共同作業者として、はるかに安心して使える真のAGIが登場するまで待つしかないでしょう。もしかしたら数年かかるかもしれません。その一方で、様々な機能を持つツールを試してみるのも楽しいですし、もちろん芸術的なプロセスの一部でもあります。美的創造の多くは、常に媒体やツールの限界を回避し、押し広げることにかかっています。自然言語の限られた語彙(『フィネガンズ・ウェイク』を書いている場合は別ですが)から音階の12音まで…LLMの各段階における限界は、まさに風景の一部なのです。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。