我原以為最早推出這種搭載強大AI 助手的手機會是蘋果或Google,卻沒想到最先推出的AI 手機的是豆包,他們聯合中興推出了一款內置AI 手機助手的智能手機,有點類似Google 最新發布的AI 助手Gemini 深度融入手機的概念,做了OpenAI 最想做而還沒做的設備,現在 我其實一直希望有一部這樣的手機,能有個AI 助理幫我幹雜活,比如在多個App 之間幫我全網比價下單、自動回复那些例行的“收到/好的”消息,甚至搶票、填表這些日常瑣事,都能為我省下時間和精力。 豆包助手手機目前在美國還買不到,國內也賣貨了。在X 上看有不少網友像小互、dontbesilent 都已經用上了,只能表示下羨慕。 不過最讓我驚訝的還是去年還不太成熟的GUI Agent 技術,現在已經可以實現如此高的準確率和實用性。從官方演示和一些網友的分享中,豆包AI 手機助手真的展示了「看懂」手機螢幕並像人一樣模擬點擊操作的能力,例如比價、訂票這些複雜的操作。 跨應用自動完成複雜任務的突破,一方面要歸功於新一代具備強推理能力的大模型出現,另一方面也離不開豆包自主大模型在Agent 能力上的飛躍提升。根據官方介紹,豆包模型在視覺理解、推理以及圖像創作等方面的表現已達國際一流水平;正是因為模型具備了精準的圖形界面識別能力,它才能在多項權威評測中拿到業界最佳成績,像人類一樣理解界面上的“按鈕”和“輸入框”等含義,而不只是識別一堆代碼。 與用戶的火熱反應相比,各大應用廠商的反應卻截然不同。微信是最早對限制豆包AI 手機助手應用,許多用戶在該手機上使用豆包助手操作微信時,微信都會異常退出甚至無法登入。支付寶等金融類App 也開始出現類似情況,有測試用戶回饋在豆包手機上登入支付寶會被判定環境異常,觸發安全風控。 這種抵制其實完全可以理解:畢竟AI 幫你操作手機後,你就無需親自看那些App 的開屏廣告和推薦訊息流了。以前用戶每天預設開啟的那幾個常用App,今後可能一個都不用手動開啟。也許只有抖音、B 站這種純娛樂型應用(短期內AI 還替代不了用戶「看影片」的需求)不會受到影響。 不過,這一切或許只是一個時代的開端。從科技發展的歷史來看,「便利性」通常最終會戰勝「阻力」,只是過程會伴隨著巨大的利益重新分配。使用者總是傾向於更懶、更聚合的操作方式。就像當初我們是實體店購物,到後來使用淘寶網上購物,未來必然會發展到大部分事情都直接讓AI 助理來搞定。 當使用者習慣了動嘴不動手,使用者就會更依賴那些對AI 助理支援好的應用,未來這會倒逼App 廠商做出改變。 去年很多人都說2025 年會是Agent 元年,當時我還是持懷疑態度的,但今年先是Claude Code 開啟了Coding Agent 的時代,現在豆包AI 手機看起來也開啟了GUI Agent 的時代,讓我現在對Agent 的未來還是很樂觀的。 不知道你有沒有用上豆包AI 手機?如果用過感覺如何?你對「AI 手機」又有怎麼樣的期待?
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。