マイクロソフトの独占禁止法訴訟はドットコムバブル崩壊のいくつかの発火点の一つであった。 OpenAI/Microsoft/Googleに対する画期的な著作権訴訟は、次の訴訟の震撼となるだろう ここには膨大なリスクが伴います。これらの企業のいずれかが著作権で保護された作品でモデルのトレーニングを行うことができなくなると、LLM、VLM、ビデオ モデル、画像モデルなどをトレーニングする業界全体で、トレーニング データの経済性が完全に崩壊するという前例が作られることになります。 次世代のAIは、組み換え検索エンジンではなく、分布から真に推論し、新しい情報を作成できる世代が必要になるだろう。 確かに、トレーニングデータは常に必要となるが、より小さなデータ基盤上で計算を活用し、入力に対して大きなリターンを得られる必要がある。 1 冊の小説の権利を取得すれば、AI が 10 冊書けるようにする必要があります。1 冊の小説を書くためだけに 100 万冊の小説の権利を購入する必要はありません (また、それは流通していない新しい小説ではなく、100 万冊の小説からの単語の組み換えになります)。 ロイヤリティフリーデータを用いた事前学習は今後も重要な役割を果たすと思われますが、モデル形成における大規模な事前学習のパラダイムを確実に変化させるでしょう。アルゴリズムにさらに重点を置く必要があるでしょう。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。