紐約客:人工智慧的獲利困局與歷史教訓 作者:約翰·卡西迪 1987年,諾貝爾經濟學獎得主、麻省理工學院(MIT)的羅伯特·索洛(Robert Solow)在《泰晤士書評》的一篇文章中評論道:「電腦時代隨處可見,唯獨在生產率的統計數據中不見踪影。」 儘管當時計算能力飛速提升,個人電腦時代隨處可見,唯獨在生產率的統計數據中不見踪影。」 儘管當時計算能力飛速提升,個人電腦也日益衡量,但政府數據顯示了總工資和生活水平的關鍵工人的關鍵水平。這就是後來著名的「生產力悖論」(productivity paradox)。這個悖論持續到了90年代甚至更久,引發了大量的莫衷一是學術研究。有些經濟學家將其歸咎於新技術管理不善;有些人則認為,與蒸汽機和電力等早期發明相比,計算機在經濟上的重要性相形見絀;還有人則怪罪於數據統計有誤,認為修正後悖論便會消失。 索洛的文章發表近40年後,自從OpenAI發布ChatGPT聊天機器人近三年來,我們可能正面臨一個新的經濟悖論,而這次的主角是生成式人工智慧(generative artificial intelligence)。根據史丹佛大學、克萊姆森大學和世界銀行的經濟學家最近進行的一項調查,在今年6月和7月,有近一半的勞工(確切地說是45.6%)都在使用AI工具。然而,麻省理工學院(MIT)媒體實驗室一個團隊的新研究卻報告了一個驚人的結果:“儘管企業在生成式AI上投入了300到400億美元,本報告發現95%的組織回報為零。” 研究的作者們審查了三百多個公開的AI專案和公告,並訪問了五十多名公司高階主管。他們對「成功的AI投資」的定義是:已經超越了試點階段(pilot phase)並被實際部署,並且在六個月後產生了可衡量的財務回報或顯著的生產力提升。他們寫道:“只有5%成功整合的AI試點項目正在創造數百萬美元的價值,而絕大多數項目仍停滯不前,對P&L(即'損益表',profit-and-loss)沒有任何可衡量的影響。” 調查訪談引發了一系列回應,其中一些充滿了懷疑。 「領英(LinkedIn)上炒得天花亂墜,好像一切都變了,但我們的實際營運中,根本性的東西一點沒變,」一家中型製造公司的首席營運官告訴研究人員。 “我們處理合約是快了點,但僅此而已。” 另一位受訪者評論道:“我們今年看了幾十個演示。可能一兩個是真有用。剩下的要么是'套殼'(wrappers,指僅僅包裝了現有技術,沒有實質創新),要么就是'科學項目'(指離實際商業應用還很遠的技術探索)。” 公平地說,該報告也指出,確實有一些公司進行了成功的AI投資。例如,報告強調了針對後台營運(back-office operations)的客製化工具所創造的效率,並指出:「這些早期結果表明,有學習能力的系統,如果針對特定流程,確實可以帶來真正的價值,甚至無需進行重大的組織結構調整。」調查還提到一些公司報告稱「透過自動化外聯和智慧跟進系統,提高了客戶保留率和銷售率可能對行銷系統轉化率可能對行銷系統,提高了客戶保留率和銷售率可能對行銷系統。 但是,「許多公司正艱難地獲取實質回報」這一觀點,與跨國顧問公司Akkodis的另一項最新調查不謀而合。該公司聯繫了兩千多名企業主管後發現,對本公司AI實施策略「非常有信心」的CEO比例,已從2024年的82%驟降至今年的49%。企業技術長的信心也有所下降,儘管降幅沒那麼大。 Akkodis的調查稱,這些變化“可能反映了先前在數位化或AI項目上令人失望的結果、實施中的延遲或失敗,以及對可擴展性(scalability)的擔憂。” 上週,媒體對麻省理工學院媒體實驗室研究的報道,恰逢英偉達(Nvidia)、Meta和Palantir 等高估值的AI相關股票下跌。當然,相關性不等於因果關係,OpenAI執行長薩姆·奧爾特曼(Sam Altman)最近的言論可能在這次拋售中扮演了更重要的角色(鑑於近期的價格漲幅,拋售在所難免)。根據CNBC報道,奧爾特曼在一次與記者的晚宴上表示,目前的估值「高得離譜」(insane),並在15秒內三次使用了「泡沫」(bubble)一詞。 儘管如此,麻省理工學院的這項研究還是吸引了大量關注。在最初一輪新聞報導之後,有消息稱,與許多科技公司有聯繫的媒體實驗室正在悄悄限制對該報告的訪問。我留給該組織公關辦公室和兩位報告作者的信息都石沉大海。 儘管這份報告比一些新聞報導所描述的要微妙,但它無疑對2022年11月OpenAI發布ChatGPT以來支撐科技繁榮的宏大經濟敘事提出了質疑。這個敘事的簡版是:生成式AI的廣泛傳播對工人(尤其是知識工作者)不利,但對公司及其股東卻極為有利,因為它將帶來生產力的巨大飛躍,並因此帶來豐厚利潤。 為什麼這一幕似乎還沒發生?一個可能的原因讓人想起了上世紀八、九十年代的一種觀點,即管理失誤限制了電腦帶來的生產力效益。媒體實驗室的研究發現,一些最成功的AI投資是由新創公司做出的,它們在工作流程的狹窄領域中使用了高度客製化的工具。而在「生成式AI鴻溝」(GenAI Divide)的另一邊,那些不太成功的新創公司「要不是在建立通用工具,就是試圖在內部開發能力」。報告更籠統地指出,成功與失敗的分野“似乎不是由模型質量或監管驅動的,而是由(實施)方法決定的。” 可以想像,生成式AI的新穎性和複雜性可能讓一些公司望而卻步。諮詢公司高德納(Gartner)最近的一項研究發現,只有不到一半的CEO相信他們的資訊長「精通AI」。但對於媒體實驗室報告中凸顯的失望記錄,還有另一種可能的解釋:對於許多成熟企業而言,生成式AI(至少在目前的形式下)根本沒有被吹噓的那麼神。 「它在腦力激盪和撰寫初稿方面非常出色,但它記不住客戶的偏好,也不會從以前的編輯中學習,」媒體實驗室調查的一位受訪者說。 「它會重複同樣的錯誤,每次會話都需要輸入大量上下文(context)。對於高風險的工作,我需要一個能夠積累知識並不斷改進的系統。” 當然,有很多人覺得AI很有用,也有學術證據支持這一點:2023年,麻省理工學院的兩位經濟學家發現,在一項隨機試驗中,接觸ChatGPT的參與者能更快地完成“專業寫作任務”,寫作品質也有所提高。同年,其他研究團隊也發現,使用Github的Copilot(一款AI程式設計助理)的程式設計師,以及使用了專有AI工具的客戶支援代理,都獲得了生產力提升。媒體實驗室的研究人員發現,許多員工正在工作中使用他們的個人工具,如GPT或Claude;報告將這種現象稱為「影子AI經濟」(shadow AI economy),並評論說「它帶來的投資回報率(ROI)」往往優於雇主發起專案。但問題依然存在,而且這肯定是公司主管們會更頻繁提出的問題:為什麼沒有更多的公司看到這些效益體現在最終的(公司)利潤中? 部分問題可能在於,生成式AI雖然引人注目,但在經濟的許多領域中應用有限。休閒和酒店業、零售業、建築業、房地產業和護理行業(照顧兒童、老人或體弱者)——這些行業總共僱用了大約五千萬美國人,但它們看起來並不像是AI轉型的直接候選者。 另一個需要注意的重點是,AI在整個經濟中的普及很可能是一個漫長的過程。在矽谷,人們喜歡「快速行動,打破常規」(move fast and break things)。但經濟史告訴我們,即使是最具變革性的技術,即經濟學家所稱的「通用技術」(general-purpose technologies),也必須等到配套的基礎設施、技能和產品發展起來後,才能最大限度地發揮其效用。而這可能是個漫長的過程。蘇格蘭發明家詹姆斯·瓦特(James Watt)在1769年發明了他的圓筒蒸汽機。三十年後,英國大多數棉紡廠仍在使用水車提供動力,部分原因是運輸用於蒸汽機的煤炭很困難。直到19世紀初蒸汽火車發展起來,情況才有所改變。電力的普及也很緩慢,並沒有立即帶來全經濟範圍的生產力成長。正如索洛所指出的,電腦的發展也遵循了同樣的模式。 (從1996年到2003年,美國整體經濟的生產力成長終於提速,許多經濟學家將其歸因於資訊科技的延遲效應。但隨後,成長率又回落了。) 經濟學家認為,在某些情況下,新技術甚至可能降低生產力成長,因為它們具有顛覆性,難以融入現有的工作方式。直到後期,生產率的提高才會顯現出來——這種模式被稱為「J曲線」(J curve,指一項新技術在應用初期,由於投入成本高、需要時間適應和流程再造,生產率先會下降,形成J的底部;隨後,隨著技術成熟和完善,生產率會迅速攀升配套,形成J的上升部分)。今年早些時候,來自不同機構的四位經濟學家發表了一篇論文,認為美國製造業現在可能正處於AI「J曲線」的下降部分。在與人口普查局合作收集了企業層面的AI採用數據後,經濟學家表示,他們發現的證據顯示「短期績效損失先於長期收益」。該研究的作者之一、多倫多大學教授克里斯蒂娜·麥克埃爾赫蘭(Kristina McElheran)在麻省理工學院斯隆管理學院發表的一篇相關文章中寫道:“AI不是即插即用(plug and play)的。它需要係統性的變革,而這個過程會帶來摩擦,尤其是對老牌企業而言。” 如果從表面上看,這個論點對企業來說終究是樂觀的──儘管對那些技能可以被AI複製的工人來說未必如此。 (正如一些入門級程式設計師已經發現的那樣,後者完全有理由感到警惕。)在技術的J曲線上,一旦「摩擦」被克服,生產率就會起飛。但由於沿著曲線的旅程可能很漫長,因此很難預測誰會成為贏家和輸家。在網路商業化浪潮中,許多最終的贏家直到2000年網路泡沫破滅之後才出現。 (Google成立於1998年,但直到2004年才上市。Facebook直到2004年才創建,Airbnb直到2008年。)歷史不一定會重演。但那些仍在AI熱潮中乘風破浪的投資者,現在兌現一部分籌碼或許是明智之舉。 ♦
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
