王冠はOpenAIに3度敗北した。 私たちの最初のライティングツールであるChatGPTがリリースされました。 Excel ファイルをチャートに変換するのは今回で 2 回目です。GPT-4 が登場しました。 エージェント ワークフローに取り組むのは今回で 3 回目であり、OpenAI プラグインがオンラインになりました。 彼はいつも、まるで空の誰かが彼の進捗バーを監視しているかのように、非常に正確にペダルを踏んでいました。 これにより、彼はあることに気づきました。それは、盲目的にアプリケーションを開発するのは無駄だということです。 ベースモデルの機能がどこにあるのかわかりません。それは流砂の上に家を建てるようなもので、いつでも水没する可能性があります。 そこで彼は、自分のビジネスを始める前に、まずは Moonshot AI でモデル製品マネージャーになり、モデルで実際に何ができるのかを把握しようと決意しました。 1年後、彼は仕事を辞めてONE2Xを設立し、AIビデオジェネレーターMedeoを開発しました。 彼は Dark Side of the Moon を退職して自分のビジネスを始めた最初の従業員であり、彼のおかげて会社の退職プロセスが確立されました。 圧縮は知性:五道口での啓示 王観が大型模型を信じるようになったのは、五道口での食事がきっかけだった。 ロンレンジュのレストランで、ムーンズ・ダークサイドの創設者ティム・ヤンは、紙に数式を書きながら、3時間かけて彼に「圧縮は知性である」と説明した。 王観は率直にこう語った。「私はそれらの公式を全く理解していなかったが、深く感銘を受けた。」 その後、彼はOpenAIの科学者ジャック・レイのビデオを研究し、徐々に完全な認知マップを組み立てていった。 この概念は非常に抽象的ですが、王観氏はそれを非常に鮮明に説明しました。 圧縮は単にファイルを小さくするだけではなく、データの接続を強制的に確立することです。 AI に、中国語を英語に翻訳することと、中国語で要約することという 2 つのことを教えていると想像してください。 論理的に言えば、AIは「英語で要約する」というタスクを学習していませんでした。しかし、圧縮によってこれらの個別の知識ポイントがまとめられたため、AIはそれを自動的に学習しました。 これは継続性です。 これまでの AI は、Excel スプレッドシートのように、互いに関連のないセルを持つ構造化データを処理していました。 現在の大規模モデルは、川のように本質的に連続的な言語やビデオなどの非構造化データを処理します。 圧縮により川の流れがスムーズになり、AI は「類推学習」できるようになります。 データの 3 つの段階: スタートアップにとってのチャンスはどこにあるのか? 王冠は、知性の第一原則はデータである、という核となる信念を持っています。 彼はAI業界における競争を3つの段階に分けています。 フェーズ1: パブリックドメインデータ 誰もがインターネットからデータを取得し、コンピューティング能力とデータクリーニングの効率性を競い合っていました。しかし、その段階は終わり、状況は整い、基盤モデルを駆使する企業が勝利を収めました。 フェーズ2: ドメインデータ 競争の焦点は、ヘルスケアや金融といった業界における過去の蓄積データなど、他社が保有していない個人データの保有にあります。これは大企業や伝統的な巨大企業に利益をもたらします。 フェーズ3:内生データ これはスタートアップにとってのチャンスです。 内生的データとは何でしょうか?それは、これまで世界に存在しなかったデータのことです。 ChatGPT 以前は、対話を通じて問題を解決する方法に関する膨大な自然言語データは存在しませんでした。 ONE2X のビデオ生成では、ビデオ制作プロセスを記述する言語 (DSL) を作成しますが、この言語自体が新しいデータです。 内生的データを生成する新しい製品形態を設計し、それをモデルに再トレーニングすることによってのみ、スタートアップはベースモデルの「自然な拡張」によって押しつぶされることを回避する障壁を構築することができます。 発電システム:完全な閉ループ 王冠は「衣装」という言葉の軽蔑的な使用を嫌う。 殻は厚くても薄くても、システム2が競争力の核となると彼は語った。 誰もが同じ基本モデル(システム1)を使用しています。製品の成功または失敗は、モデルの外側に構築する「シェル」、つまりコンテキストに依存します。 ONE2X のアーキテクチャは 3 つのレイヤーで構成されています。 低レベル: DSL (ドメイン固有言語) 複雑なビデオ制作プロセスは、有限の「アトミック機能」へと抽象化できます。囲碁のようにルールが閉じられているため、計算可能です。 中間層: コンテキスト このレイヤーの中心的なタスクは、「エントロピー」を削減することです。 エントロピーとは何でしょうか?それは不確実性です。 ユーザーが「高品質のビデオを作ってください」と言った場合、その発言のエントロピーは非常に高く、AI はそれをどのように実行すればよいかわかりません。 システム 2 はこのステートメントを正確な指示に変換する必要があります。 同時に、AI エージェントがランダムにツールを呼び出さないようにし、その出力が制御可能であることを保証するために、AI エージェントの動作境界を制限する必要もあります。 トップレベル: 環境 これは単なるソフトウェアインターフェースではなく、人と AI が連携して動作する「環境」です。 ユーザーがここで行うすべてのアクションと変更は、システムのために高品質なデータを生成します。この環境は本質的にデータアノテーションプラットフォームです。 王冠氏は例を挙げました。シェフが料理をする際、油の温度や炒める回数といった暗黙の知識は、記録されていなければAIに学習させることができません。Environmentの目的は、こうした「温度」パラメータをすべて明示的にすることです。 物理世界 vs. アイデアの世界:ビデオの二つの戦場 王観はビデオトラックを独自に分類しています。 現実世界のビデオはカメラで撮影され、TikTokやKuaishouなどのショートビデオプラットフォームに対応しています。 ワン・グアン氏は、この店を「ナイトクラブ、スーパーマーケット、ライフスタイルプラザ」に例え、エンターテイメント、ゴシップ、セールなどがすでに豊富にあると説明した。 アイデアの世界における動画はAIによって生成され、知識、芸術、そして精神的信念に対応しています。王冠氏はそれらを「図書館、オペラハウス、大聖堂」に例えています。 この種のコンテンツは、制作コストが高いため、常に不足しています (Nike の高級広告や記事のビデオ化など)。 ONE2X が目指すのは、この「アイデアの世界」を征服することです。 彼はさらに大きなビジョンを持っています。それは、ビデオを「創造」から「表現」へと変えることです。 古代において、書道は筆、墨、紙、硯を必要とする創作活動の一形態であり、習得するのは非常に困難な技術でした。 WeChatメッセージの送信は、現在、表現方法の一つであり、参入障壁は非常に低い。動画制作は、ラブレターを書くのと同じように、依然としてクリエイティブな作業とみなされている。将来的には、話すのと同じくらい自然な表現方法になるはずだ。 素晴らしい製品は、様式が創造から表現へと変化したときにのみ生まれます。 生成システムが推奨システムに取って代わる 王観は大胆な予測をした。仲介業者は消滅するだろう、と。 インターネットプラットフォームは本質的に「配信プラットフォーム」であり、トラフィックの配分をコントロールし、クリエイターを搾取しています。TikTokやTaobaoはその好例です。 在庫やフローの割り当てがなく、需要と生産を直結した生産販売一体型のシステムです。 AI はユーザーが望む情報を直接生成するため、膨大な量のコンテンツを検索する必要がなくなります。 これは、推奨アルゴリズムの「仲介者」が不要になることを意味します。 続いて通貨が変化しました。 コンテンツが無制限に供給される時代では、「注目」(トラフィック)はもはや不足していません。不足しているのは「信頼」です。 将来、ユーザーはトラフィックではなく、クリエイターのセンスとレシピに料金を支払うようになるでしょう。Substackと同じように、私もあなたを人として信頼しているからこそ登録しているんです。 未来のクリエイター:二極化 王冠氏は、クリエイターコミュニティは2つのカテゴリーに分かれると考えています。 ピラミッドの頂点にいるアーティスト/専門家 これらの人々は AI に置き換えられることはありません。逆に、彼らの影響力は増幅されるでしょう。 このシステムは彼らの能力を増幅し、彼らの高度な知性を何千倍にも複製します。 彼らが行うすべての操作と修正は、システムに高品質の「内生的データ」を提供します。 それらは、生成システムが継続的に進化することを可能にする中核的な原動力です。 幅広い「生産者と販売者」 一般大衆にとって創作はもはや商業目的ではなく、生産と販売の一体化に戻っています。 引退した幹部が自宅で書道を練習するのと同じように、創作のプロセス自体が消費の一形態なのです。 ユーザー生成コンテンツは、自身の精神的なニーズを満たすために作成されます。その価値は作成された瞬間に実現され、外部トラフィックによる収益化は必要ありません。 王冠氏はこれを「労働は消費である」と呼んでいる。 AI時代のプロダクトマネージャー:もはやプロトタイプを描くだけではない 王冠氏自身は、専門分野はプロダクトマネージャーであり、AI 時代におけるこの役割の価値を深く理解しています。 PM の中心的なタスクは、もはやプロトタイプを描くことではなく、インテリジェンスの境界を設計することです。 具体的には、次の 3 つのレベルに分けられます。 設計システム1: モデルの機能境界を定義する モデルは製品であり、モデル自体を設計する価値があります。PMは、ビジネスノウハウをデータに変換し、「良い」結果とは何かを定義し、評価基準を確立する必要があります。 建築システム2:設計の文脈と環境 PM の中核となる能力はコンテキスト エンジニアリングにあります。 エージェント フレームワーク、ワークフロー、および知識ベースを設計することにより、モデルに高品質の入力が提供されます。 戦略的コア:「内生的データ」のクローズドループの設計 PM は、運用中にこれまで世の中に存在しなかったデータを生成する、まったく新しい製品形態を設計する必要があります。 この製品は本質的には「ラベリング プラットフォーム」です。 王冠氏は首相は「美学」と「基準」の設定者としての役割も果たす必要があると述べた。 すべてのデータが優れたデータであるとは限りません。PMは、高品質な出力を構成する要素を定義するための高度なセンスを持っている必要があります。 組織は環境:従業員はインテリジェントエージェント ONE2Xは非常に特別な会社です。 全員がリモートで働いており、管理職や KPI はなく、出勤状況の追跡さえありません。 王冠氏は同社を、伝統的な企業ではなく「製品スタジオ」と定義しています。 彼の組織哲学はシンプルです。会社を「環境」、従業員を「インテリジェントエージェント」とみなすのです。 この概念は強化学習から生まれました。 強化学習では、エージェントを制御するのではなく、エージェントが自律的に動作する環境を作成します。 王冠氏は、経営の核心はKPI評価ではなく、「報酬機能」との整合にあると述べた。 従業員は皆、テクノロジーに対する情熱や会社の倒産を防ぎたいという願望など、それぞれの目標を持って入社します。 組織の知恵は、個人の目標ベクトルを会社の進歩の方向に最大限に投影する方法を見つけることにあります。 リモートワークに伴う孤独と信頼の問題に対処するため、ONE2X は「Warm and Trustworthy Initiative」を設立しました。 社内には「友人の輪」があり、全員が Lark でトピック グループを作成して、ゴシップを共有したり、短いエッセイを書いたりしています。 こうした仕事以外の交流を通じて、オフラインで得られるのと同様の温かさと対人信頼感を築くことができます。 王冠氏は、オフィスベースのシステムは産業革命の産物であり、精神労働は物理的な生産ラインに縛られる必要がなく、リモートワークと「温かく信頼できる計画」を組み合わせることで、製品スタジオモデルにより適していると述べた。 狭義のAGI:自動化された金儲けのループ 王冠氏は、AGI(汎用人工知能)を非常に実際的に定義しています。 彼は全知や全能性、あるいは自己認識について語っていません。狭義のAGIについて語っているのです。 狭義の AGI とは何でしょうか? 特定のビジネス分野(株式取引など)では、AI は独自に収益を上げ、その収益を使ってコンピューティング能力とデータを購入し、さらに収益を上げるために自らを最適化できます。 人がこのループから完全に抜け出すと、その領域において狭義の AGI が実現されます。 これは突然の「特異点」ではなく、少しずつ徐々に起こるものです。 たとえば、この現象はコーディングや言語処理の分野で注目を集めているようです。 ノキアの戦略:データを蓄積し、iPhone の登場を待つ。 王冠氏は正確な例えを述べた。現在は AI の「ノキア時代」である。 現在見られる AI アプリケーションは、Nokia 携帯電話の電卓やスネーク ゲームによく似ています。 この段階では複雑なモバイル インターネット アプリを開発するのは不適切です。 戦略は何ですか? 「iPhone の瞬間」が到来する前に (つまり、エンドツーエンドのマルチモーダル モデルが成熟し、非常に低コストになり、非常に高速な推論が可能になる前に)、モデルに最も近い生産性ツールの作成に重点を置く必要があります。 これにより、モデルの変更を検出し、データを蓄積(システム 2/コンテキスト)して、将来的に真に優れたアプリを準備できるようになります。 王冠はまた、一般代理人と垂直代理人の関係を説明するために、「千の河が月を映し、一万里の空が雲ひとつない」という詩を引用した。 垂直エージェント(Qianjiangyue など)は、それぞれの分野で独自の知恵とデータを持っており、アプリケーション企業にチャンスを提供します。 ユニバーサルエージェント(万里天)はすべてをカバーしようとしますが、移行段階ではすべての領域で優れた成果を達成することはできません。 最終的に、両者は収束します。つまり、一般化により垂直統合が深まり、垂直統合の境界が拡大し、効果とコストの究極の競争に直面することになります。 花々の間を舞う蝶々:老子の世界との関わりの哲学 王観は自身の哲学について語る際、道教に深く影響を受けていると語った。 しかし、彼は興味深い区別をしていた。荘子の「石が羽を広げる」という表現は好きではなかったが、老子の「花の間を蝶が飛び交う」という表現を好んだのだ。 翼を広げたロックのイメージは、自由、隔離、そして高く舞い上がることを象徴しています。 蝶は花の間を飛ぶとき、決して一直線に飛ぶことはなく、むしろ障害物を楽々と飛び越えます。 王冠氏は、起業家はニヒリズム的な超然とした態度を追求するのではなく、蝶のように積極的に世界と関わり、環境の変化に適応して特定の問題を解決するべきだと述べた。 彼はまた、あまり知られていないが「恐ろしい」事実も語った。それは、一つの世代はたった25年から30年しか続かないということだ。 30 代の男性として、彼は自分が作っている製品が実際には「来世」(つまり自分より 25 ~ 30 歳若い人々)の人々に役立つものであることに気づきました。 時間に対するこの視点により、彼は目先の不安を乗り越え、より長期的な視点から製品の進化を見ることができました。 ノーススターインジケーター:システムの知能レベル ONE2X の North Star メトリックは、DAU (Daily Active Users) ではなく、システムのインテリジェンス レベルです。 王冠氏は、3 人のエキスパート ユーザーが 100 万ドルの収益を生み出すことは、10 万人の一般ユーザーが同じ額の収益を生み出すことよりも優れていると述べました。 なぜ? なぜなら、熟練したユーザー(美的感覚と能力が高い)がシステムに高品質のデータを提供できるため、システムの「インテリジェンス」が向上するからです。 知恵はどうすれば定量化できるのでしょうか? どれだけのコンテンツが生成されるかではなく、「より少ないトークンで同じ効果を達成する」ことが重要なのです。 数学の問題を解くのと同じように、答えを一目で見ることができる人は、何度も計算しなければならない人よりも賢いです。消費されるトークンが少ないほど、システムはより賢くなります。 これはインターネット時代の測定基準とは全く異なります。 予想外の検証 製品の商業的価値を検証するために、王冠氏自身が「モルモット」となった。 彼はMedeoの初期バージョンを使って動画を作成し、WeChat動画チャンネルに投稿しました。驚くべきことに、積極的な管理が行われていなかったこのチャンネルは、200万回以上の再生回数を記録しました。 彼をさらに驚かせたのは、ある日、彼のアカウントにお金(数百元)が入金されたという通知がシステムから届くまで、その動画アカウントに収益分配システムがあることを知らなかったことだ。 これにより、彼は、現在の未完成のツールであっても、一般の人々がコンテンツから利益を得ることができると確信しました。 さらにクレイジーな話がある。 BilibiliとWeChatビデオチャンネルのトップAIコンテンツクリエイターは、友人のGoogleアカウントをすべて借りてクレジットを補充し、製品を使用できるようにした。 彼らは利用可能なポイント パッケージをすべて購入し、限度額までチャージしましたが、それでも十分ではないと感じたため、Crown チームに直接連絡して支援を求めました。 これにより、Wang Guan 氏のチームは、トップ クリエイターたちが効率的な制作ツールを驚くほど渇望していることに気づきました。 合意に反する20の視点 王冠の考えを要約すると、彼の最も核心的な反コンセンサスの視点 20 個は次のようになります。 知性の根底にある論理 1. インテリジェンスの第一原則はデータです。データは境界を決定し、計算能力は速度を決定し、アルゴリズムは出現を決定します。 2. 圧縮は知性であり、その核心は「継続性」にあります。 3. 「構造に適合する」から「世界に適合する」へ 4. 狭義では、AGI は「お金を稼ぐ - 進化する」という自動化された閉ループです。 業界競争について 5. 産業発展の3段階:公有地→ドメイン→内生地。 6. 堀は「内生的データ」にあります。 7. 現在、私たちは AI の「ノキア時代」にいます。 8. 「シェル」こそがコア競争力であり、コンテキストこそが全てである。 9. 汎用および垂直統合の究極の結果: 千の川は千の月を反映する。 製品方法論 10. 生成システムが推奨システムに取って代わります。 11. 3層製品アーキテクチャ理論:DSL → コンテキスト → 環境 12. コンテキスト エンジニアリングの核となるのは「エントロピー削減」です。 13. ノーススターインジケーター:システムインテリジェンス 14. 環境をラベルとして コンテンツエコシステムについて 15. ビデオは AI 時代の「出発点」であり、終点ではありません。 16. 物質世界と観念の世界 17. 「創造」から「表現」へ 18. 貨幣の変容:「注目」から「信頼」へ 組織と哲学について 19. 組織は環境であり、従業員はインテリジェントエージェントです。 20. 花の間を飛び回る蝶のように、積極的に世界と関わっていきます。 終わり 王観の好きな食べ物は白米です。 矢継ぎ早に続く質疑応答の中で、彼は旅行が好きではなく、食の好みに関して世界的な視点を持っていないと語った。 白米は最も用途の広い食べ物であり、どんな料理にもよく合います。 これは、最も基本的で互換性のある基盤を作るという彼の製品開発哲学の寓話でもあるのかもしれません。 ノキアの AI 時代には、ほとんどの人がトラフィックと収益化を追い求めていましたが、王冠氏はより困難な道を選びました。それは、ビデオ ライブラリを構築し、内生的データを蓄積し、iPhone の登場を待つという道です。 彼は、一世代には人生は一度しかないと言った。 それなら、この生涯を使って何か違うことをしてみましょう。 --- このビデオは Prompt を使用して生成され、ポッドキャストの Zhang Xiaojun (Jun) とのビジネス インタビューに基づいています。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。