以下是我使用 Opus 4.5 約 2 週後的感受。 先說一些整體想法,再說一些實際操作。 --- 大局觀 --- 特務解鎖 凡是使用過 Opus 4.5 的人都會清楚看到,人工智慧的發展速度並沒有放緩。 我很驚訝竟然沒有更多人把這件事當成重大事件來看。我懷疑,在感恩節前夕發布,再加上本週NeurIPS大會的召開,導致相關討論推遲了兩週。但無論從程式碼或智慧體的角度來看,這都是目前最好的模型,而且優勢非常明顯。 有人將其比喻為另一個「3.5首十四行詩」時刻,我同意這種說法。但這究竟意味著什麼呢? 每隔幾代,我們就會迎來一次重大的模型革新——它開啟了一種全新的工作方式。 GPT-4 革新了聊天,Sonnet 3.5 革新了代碼,而現在 Opus 4.5 則革新了智能代理。由於 Opus 4.5,智慧代理現在可以在越來越長的時間跨度內可靠地工作,並代表您完成實際任務。 Opus 4.5 就像一輛 Waymo 自動駕駛汽車。你告訴它“帶我從 A 到 B 地”,它就會帶你過去。幾次這樣的體驗之後,你的大腦會意識到「哦,好吧,我們現在生活在這樣的世界」。然後你就徹底上癮了。 從那一刻起,你的工作方式將會徹底改變。 經紀人之年 2025 年被譽為“智能代理之年”,而 Opus 4.5 + Claude Agent SDK 的組合正是實現這一說法的最佳例證。 Claude Agent SDK 是目前人工智慧領域最公開的秘密。智能體的框架(或稱「外設」)幾乎與模型本身同等重要。如果框架不好,模型也就沒什麼用了。有了這款 SDK,您就能獲得開箱即用的世界級智能體框架,現在您可以將其與 Opus 4.5 結合使用,構建真正能在現實世界中運行的智能體。 這讓我想起了艾倫·凱的名言:「真正認真對待軟體的人應該自己製造硬體。」這句話用在智能體上就是:「真正認真對待模型的人應該自己打造安全裝備。」Anthropic 顯然深諳此道,而且效果顯著。這些工具的結合堪稱完美。 我自認為已經“擺脫了束縛”,而 Claude Agent SDK + Opus 4.5 的結合,正是我擺脫束縛的另一個重要舉措。現在,這個組合中蘊藏著大量潛在的經濟價值,而開發者的職責就是將其釋放出來。 如果你之前看空經紀人,現在是時候轉而看好他們了。 “這一切都是真的” 「你知道最瘋狂的是什麼嗎?這一切都是真的。」這是伊利亞在接受Dwarkesh採訪時談到人工智慧現狀的開場白,我深有同感。我簡直不敢相信Opus 4.5是真的。 在 Opus 4.5 工作期間,有好幾次我都忍不住靠在椅子上,大笑出聲,感嘆我們生活在一個如此精彩的世界,經紀人如此優秀。 納特·弗里德曼在他的網站上提出了一個很好的問題:“你的多巴胺從哪裡來?” 我越來越多地從克勞德那裡得到我的東西。 長人類學 我昨天看到一篇帖子,有人說Opus 4.5是他職業生涯中最重要的事情。未來會有更多人有同樣的感受。 過去三年,Anthropic 的營收每年都成長了 10 倍。 2023 年從 100 萬美元成長到 1 億美元,2024 年從 1 億美元成長到 10 億美元,2025 年從 10 億美元成長到 100 億美元。在 Dario 最近接受 DealBook 採訪時,他表示不確定這種 10 倍成長的模式在 2026 年是否還能維持。 雖然他的說法可能沒錯,但我預期Anthropic明年年底的營收會遠超預期。如果他們在2027年初的估值超過OpenAI,我也不會感到驚訝。 Opus 4.5 的模型太好了,Claude Agent SDK 的框架也太好了,他們對企業的關注顯然是正確的。 Claude Opus 4.5 是一部佳作。 而人類組織將繼續獲勝。
--- 審查與建議 --- 現在來說點更實際的內容。以下是我喜歡 Opus 4.5 的幾個方面,以及我發現的一些實用之處。 如果你想聽聽更多人的看法,我發現這篇文章對 Opus 4.5 做了很好的總結。它匯總了許多關於這款機型的精彩軼事。你會發現它被公認為絕對的精品。 一般的 - 對待 Opus 4.5 的最佳思維模式是將其視為一位同事。一位值得信賴、能夠出色完成任務的真正夥伴。要比你想像中更信任它。這樣做能夠訓練你的思維適應未來的工作模式,無論短期或長期,都將受益匪淺。 相信模型。給它更複雜的任務。讓它運行更長時間。少干預。如果你不偶爾調整一下它的運作狀態,那就表示你對它不夠信任。 ——就這麼隨口說說。如果你還沒開始用語音輸入,那你簡直還活在石器時代。 Opus 4.5 能輕鬆將 5 分鐘的語音靈感轉化為已完成的任務,就像優秀的隊友該做的那樣。 - Opus 4.5 比 Sonnet 4.5 更有效。 Opus 4.5 的影像輸入功能得到了顯著提升。不妨親自體驗一下。特別是截圖轉程式碼功能,現在更是達到了一個全新的水平。 - 將 Opus 4.5 與你的 Obsidian Vault 搭配使用。我有一個相關的 YouTube 視頻,連結在這裡。影片內容有點過時了,我正在製作一個新的,但你應該可以明白我的意思。 - 嘗試使用 Opus 4.5 和計算機。它目前還未達到正式發布的水平,但即便把它當作一個玩具來看,也足以激發你的靈感。我預計 2026 年將是電腦應用蓬勃發展的一年,現在就開始著手準備是值得的。這顯然是經紀人發展的下一個重要階段。 如果您想嘗試一些新奇的東西,不妨試試代理叢集。一個有用的起點是建立一個 https://t.co/swldq08QC9 文件,供代理團隊進行溝通和協作。如果您想更深入地了解集群,那麼您會發現 Claude Agent SDK 中的鉤子功能至關重要。
克勞德·科德 Claude Code + Opus 4.5 是世界上最好的 AI 編碼工具。一定要用!我是在終端機裡用的,不過如果你喜歡圖形介面,也可以用 Claude Code Desktop。我始終相信 Anthropic 有能力推出最好的編碼模型和最優秀的智能體框架。就 AI 編碼工具而言,Claude Code 堪稱完美。 Claude Code 搭配 Opus 4.5 帶來的飛躍簡直令人難以置信,簡直就像魔法一樣。 新的計劃模式簡直太棒了。這再次證明了突破限制有多重要。許多生產力都蘊藏在巧妙的產品設計之中。他們這次做得非常好。如果你沒有用它來處理複雜任務,那就太可惜了。它能顯著提升性能。 - 無需再擔心壓縮後的性能下降。過去,由於上下文視窗的限制,壓縮後效能確實會顯著下降。現在不會了。雖然效能仍然會略有下降,但 Anthropic 在底層最佳化方面做得非常出色,Opus 4.5 也能夠更好地推斷壓縮過程中遺失的資訊。 Opus 4.5 的設計能力不錯。雖然還達不到世界級水平,但我們現在已經克服了 AI 設計初期的瓶頸。借助前端設計技能和截圖轉程式碼等工具,你可以用它做出相當不錯的設計。 AI 介面現在已經“足夠好”,而且還在不斷改進。 「N個最佳方案」的工作方式正變得越來越實用。在現實世界中,你絕對不會要求5個開發人員開發同一個功能,然後從中選出最佳方案。但有了人工智慧,簡直易如反掌。 Opus 4.5 在推測性分支方面表現出色,它會解釋不同方案之間的權衡,然後與你一起選擇最佳方案。它完美地展現了未來工作模式。 嘗試用偽代碼編寫程式碼。大多數人只是在輸入框中輸入指令然後點擊發送,當然,我通常也是這麼做的。但有時在實際程式碼庫中編寫偽程式碼會非常有幫助。 Opus 4.5 非常擅長理解你的偽代碼意圖並進行建構。當然,你不會想一直使用這種方法,但對於某些特定任務來說,這確實是一種非常有趣的工作方式。 克勞德代理 SDK 如同前面所提到的,這仍然是目前人工智慧領域最公開的秘密。 Claude Agent SDK 是世界上最好的智能體框架,而將其與 Opus 4.5 結合使用則是構建智能體的最佳方式。它真的非常強大。 深入學習。 Claude Agent SDK 的功能非常豐富。你了解得越多,就能用它做更多的事情。這聽起來老生常談,但卻是真理。我看過太多人只是淺嚐輒止,還沒真正接觸到它的精髓就止步不前了。 Agent 的使用仍然需要一定的技巧,所以要花時間學習你所掌握的功能,並磨練這些技能。 使用 Claude Agent SDK 建立一個代理程式。而且要建構一些實用的東西。一個有趣的週末專案是:想想你在電腦上經常做的三件事,然後建立一個代理來幫助你自動化這些操作。一旦你實現了這三件事的自動化,你就會想要自動化更多的事情。代理自動化確實會讓人上癮——而且非常有用。 對於初學者來說,將代理部署到雲端可能有點棘手,因為那些深受程式設計師歡迎的典型無伺服器解決方案並不支援沙盒化的、長時間運行的代理程式。雖然有很多替代方案,但我個人很喜歡 E2B 的使用者體驗。克服最初的學習曲線是值得的。學會將代理部署到雲端後,你就可以實現諸如讓大量代理在你睡覺時為你工作之類的功能。投入時間學習吧,絕對物超所值。
完整版本及連結請點擊此處:https://t.co/cQkomckaywrigley.com/posts/opus-4.5。 接下來兩週已經排滿了一批。 感受一下通用人工智慧(AGI)。