關注AI Agent 的力薦MMC 的這篇剛發布的《State of Agentic AI: Founder's edition》,不僅數據紮實,分析了問題,還提供了可行的解決方案。 今年2025 年是公認的AI Agent 元年,「Agentic AI」 非常火,新產品也層出不窮:Deep Research、Coding Agent、Browser use、Computer use … 當然Agent 爭議也不小,一部分人認為沒啥用,一部分人則覺得Agent 無所不能,也無可厚非,大家都是主觀感受,每個人使用場景都不一樣,比如我自己就很喜歡Coding Agent,真的能解決問題。但這種爭議如果用數據說話就會有說服力的多,比如說這玩意兒,在真實的企業裡,真的用起來了嗎? MMC 則是深入訪談了30 多家正在做AI Agent 的新創公司創辦人和40 多位企業裡的實際用戶,寫了這篇報告:《Agentic AI 現況:創辦人版》。 【1】真正限制AI Agent 的,可能不是AI 不夠聰明 大部分都以為目前Agent 最大的困難會是「AI 不夠聰明」、「幻覺太嚴重」或「太難和當前系統整合」。 這些確實是問題,但出乎意料的是,在創辦人眼中,它們排不進前三名。 根據調查,部署AI Agent 時的三大問題分別是: 1. 工作流程整合和人機互動(佔60%) 2. 員工抵觸與非技術因素(佔50%) 3. 資料隱私與安全(佔50%) 也就是說最大的障礙,是「人」和「流程」的問題。 1. 「這玩意兒我該怎麼用?」(工作流程整合) 這是佔60% 的最大難題。 一個AI Agent 再牛,如果它是一個需要單獨打開的APP,需要員工在現有的工作軟體(例如釘釘、飛書、Salesforce)之外,再打開一個新視窗去指揮它,那它的使用率注定高不了。 成功的集成,是把AI 嵌入到員工已有的工作流程裡。例如,當銷售在CRM 裡更新一個客戶狀態時,AI Agent 自動跳出來說:“我幫你把剛才的會議紀要總結好了。” 這已經不只是個技術問題了,更需要企業改變觀念,企業得先想清楚:「要整合這樣的AI Agent,我原有的工作流程需要怎麼改?」這往往比買一套AI Agent 難得多。 2. 「它會不會搶我飯碗?」(員工抗拒) 這是50% 的創辦人提到的信任危機。 我們得承認一個現實:在企業裡,人類和AI 的合作,目前大多不太愉快。 - 一種是「過度依賴」:員工把活兒全丟給AI,自己不檢查,結果AI 出了錯,比如給客戶報了個錯誤的價格,釀成大禍。 - 一種是「過度懷疑」:員工根本不信AI,AI 做的每一步,他都要自己再查一次。這不但沒提高效率,反而增加了工作量。 更深層的,就是被AI 取代的恐懼。這導致員工在用的時候束手束腳,或乾脆陽奉陰違,不願配合。 3. 「我的資料餵給AI,安全嗎?」(資料隱私) 這也是50% 的創辦人提到的核心關切。 這個問題在金融、醫療等產業尤其嚴重。企業會擔心:“我把內部的財務報表、客戶病歷交給這個AI Agent 分析,這些數據會不會被拿去訓練別的模型?會不會洩露?” 這種擔憂,有些是真實存在的,例如需要符合GDPR、ISO 27001 等合規認證,有些純粹是感覺上的。但無論哪種,都會讓企業在部署時畏手畏腳。 【2】做得好的AI Agent:高準確率和高自主性 既然有這麼多困難,那現在做的好的那些AI Agent,實際表現怎麼樣? 這個報告給我很大收穫的一點是它從兩個維度來量化現在的AI Agent:準確率(Accuracy)和自主性(Autonomy): - 準確率:AI 幹的活兒,多大比例是對的、被人類接受的。 - 自主性:AI 幹活兒時,多大程度不需要人來插手。 理想狀態當然是高準確+高自主。但現實是,超過90% 的Agent新創公司聲稱自己的方案達到了70% 以上的準確率。 所以MMC 把Agent 劃分了三個分類(低準確率+低自主性的Agent就不配存在): 1. 中準確、高自主: 適用於低風險、高重複、易於驗證的工作場景。例如自動給海量的行銷郵件打標籤。就算AI 標錯了30%,但它幫你自動處理了1000 封,你只需要人工糾錯那些明顯不對的,整體效率還是遠超純人工。 2. 高準確、低自主: 適用於高風險、高價值領域,如醫療場景。例如AI 幫你起草臨床試驗的研究報告。它必須保證90% 以上的準確率,但人類專家必須在每一步進行嚴格審核(低自主權)。它扮演的是“超級助手”,而不是“決策者”。 3. 高準確率+ 高自主性: 這可以說是最理想的“甜點區”,是大家努力的方向。它適用於那些AI 部署相對成熟或規則邊界清晰的領域。例如客戶服務、網路安全或金融合規。在這些場景下,AI Agent 已經足夠可靠,達到80%-90% 的準確率和自主性,可以被授予高自主權去端到端地處理任務。報告提到,這裡的秘訣通常是將機率性的大語言模型與更具確定性的AI 方法結合,以提高準確性,從而進一步提高自主性。 【3】企業開始為Agent 付費了 聊AI Agent 落地,繞不開收費的問題,畢竟靠燒錢是無法持久的。 好消息是企業開始真掏錢付費了 報告發現,62% 的AI Agent 新創公司,已經拿到了企業的「業務線預算(Line of Business budget)」。 這是個超級正面的訊號。可能很多人不知道大公司內部的預算分兩種:一種叫「創新預算」(Innovation budget),就是小金庫或實驗經費,數額不大,用完了算,大家圖個新鮮。 而“業務線預算”,是各部門(如銷售部、行銷部、財務部)用來保證自己核心業務運作的支出。 當AI Agent 開始動用「業務線預算」時,表示它已經從可有可無的玩具變成了能幫我工作的生產力工具。 壞消息是現在還沒摸索最佳的收費模式 雖然知道這玩意兒值錢,但到底該怎麼定價?報告顯示,大家都在摸索,主流的兩種方式是: 1. 混合定價(23%):例如「基礎服務費+ 超出部分按用量付費」。 2. 按任務次(23%):AI 幫你做成一件事(例如發出一張發票),收一次錢。 而大家最期待的按照效果付費(Outcome-based),目前只有3% 的公司在用。 為什麼?因為太難了。 例如,一個“銷售AI 助理”,它幫銷售贏了個大單。這個功勞,到底80% 算銷售的,還是20% 算AI 的?怎麼衡量?如果AI 沒功勞,企業是不是就可以不付錢?這根本算不清。 所以,目前最現實的還是按苦勞付費,而不是按功勞付費。 【4】最重要的部分:成功的AI Agent 落地策略 既然AI Agent 落地這麼難,那麼那些成功的Agent 公司又是怎麼說服企業客戶的呢? MMC 的訪談總結了一套非常實用的落地經驗: 秘籍一:「Think Small」(從小處著手) 報告總結了一個非常務實的落地策略:Think Small (從小處著手)。 忘掉那些「徹底顛覆產業」、「全自動替換人類」的宏大敘事。成功的AI 智能體,往往從一個非常小、非常具體的切口進入: - 起點: 選一個低風險、中等效益的任務。 - 關鍵: 選一個員工最討厭幹的活兒。例如,銷售團隊最煩的手動輸入客戶數據,或是財務團隊最煩的核對發票。 - 定位: 永遠不要說你是「替代品」 (Replacement),要說你是「副駕駛」 (Copilot)。 你的目標不是讓老闆開除員工,而是把員工從那些重複、無聊、沒人想幹的破事兒裡解放出來。 當員工發現,這個AI 真的幫我省了每週5 小時填表的時間,信任的種子才算種下了。 秘技二:「保母式」服務(Hand-holding) 現在的AI Agent 還遠遠沒到即插即用的程度。企業買的不僅是軟體,更是一整套陪跑服務。 成功的新創公司都在用「前線部署工程師(FDE)」模式。這群人既是程式設計師,也是諮詢顧問,他們會直接「扎」到客戶的辦公室裡,手把手幫客戶整理流程、清理資料、調整AI。 同時,人機互動介面要做到「3E」: 1. Education(教育):AI 要能主動教導用戶「我能幹啥,你該怎麼用我」。 2. Entertainment(趣味):交互得有趣。 3. Expectation Management(預期管理):AI 必須坦誠地告訴用戶“我幹不了啥”,別吹牛。 秘籍三:定位決定生死(Positioning) 最後,你怎麼「說」你是誰,可能比你「是」誰更重要。 - 是“副駕駛”,不是“替代者”: * 一定要把姿態放低。你的產品是「Copilot」(副駕駛、領航員),是來「Augment」(增強)員工能力的,不是來「Replace」(替換)他們的。就算你的技術真的能替換掉80% 的人,也千萬別這麼說。 - 看人下菜碟: * 在醫療這種保守行業,你最好少提“AI”,多談“自動化”、“效率提升”。 * 在金融這種激進的行業,你就得猛吹“Agentic AI”,顯得你很前衛。 - ROI 要具體: * 對於成熟流程,就說「節省了XX 小時」或「降低了XX% 成本」。 * 對於AI 創造的新能力(例如「千人千面」的網頁),就把它和你已有的工具掛鉤,例如:「能讓你的Google廣告轉換率提升20%」。 【最後】 港真,年初的時候我還是AI Agent 的懷疑論者,自從用了Claude Code 後,我開始“真香”,變成了AI Agent 的積極擁護者,也一直很關注這個領域的發展,這份報告質量還是很高的,尤其是給我最大感觸的點是: 決定AI Agent 落地成敗的,最重要的因素已經不是模型能力夠不夠強,而是它怎麼和企業內部的流程整合,怎麼取得員工的行人,怎麼證明它存在的價值。 另外從準確率和主動性這兩個維度來量化評估AI Agent,是挺科學的,現在很多的AI Agent,主動性高了準確率可能就不夠,準確率上去了主動性又不行,要做好Agent,最終還是要做到像一個情商高的真人那樣,在你還沒開口時,就幫你把事情搞定的需求,默默幫你把事情搞定。
建議完整閱讀原文hmmc.vc/research/state…翻譯:https://t.co/b4YslzEU2I

