X (Twitter)

我原以為最早推出這種搭載強大AI 助手的手機會是蘋果或Google，卻沒想到最先推出的AI 手機的是豆包，他們聯合中興推出了一款內置AI 手機助手的智能手機，有點類似Google 最新發布的AI 助手Gemini 深度融入手機的概念，做了OpenAI 最想做而還沒做的設備，現在我其實一直希望有一部這樣的手機，能有個AI 助理幫我幹雜活，比如在多個App 之間幫我全網比價下單、自動回复那些例行的“收到/好的”消息，甚至搶票、填表這些日常瑣事，都能為我省下時間和精力。豆包助手手機目前在美國還買不到，國內也賣貨了。在X 上看有不少網友像小互、dontbesilent 都已經用上了，只能表示下羨慕。不過最讓我驚訝的還是去年還不太成熟的GUI Agent 技術，現在已經可以實現如此高的準確率和實用性。從官方演示和一些網友的分享中，豆包AI 手機助手真的展示了「看懂」手機螢幕並像人一樣模擬點擊操作的能力，例如比價、訂票這些複雜的操作。跨應用自動完成複雜任務的突破，一方面要歸功於新一代具備強推理能力的大模型出現，另一方面也離不開豆包自主大模型在Agent 能力上的飛躍提升。根據官方介紹，豆包模型在視覺理解、推理以及圖像創作等方面的表現已達國際一流水平；正是因為模型具備了精準的圖形界面識別能力，它才能在多項權威評測中拿到業界最佳成績，像人類一樣理解界面上的“按鈕”和“輸入框”等含義，而不只是識別一堆代碼。與用戶的火熱反應相比，各大應用廠商的反應卻截然不同。微信是最早對限制豆包AI 手機助手應用，許多用戶在該手機上使用豆包助手操作微信時，微信都會異常退出甚至無法登入。支付寶等金融類App 也開始出現類似情況，有測試用戶回饋在豆包手機上登入支付寶會被判定環境異常，觸發安全風控。這種抵制其實完全可以理解：畢竟AI 幫你操作手機後，你就無需親自看那些App 的開屏廣告和推薦訊息流了。以前用戶每天預設開啟的那幾個常用App，今後可能一個都不用手動開啟。也許只有抖音、B 站這種純娛樂型應用（短期內AI 還替代不了用戶「看影片」的需求）不會受到影響。不過，這一切或許只是一個時代的開端。從科技發展的歷史來看，「便利性」通常最終會戰勝「阻力」，只是過程會伴隨著巨大的利益重新分配。使用者總是傾向於更懶、更聚合的操作方式。就像當初我們是實體店購物，到後來使用淘寶網上購物，未來必然會發展到大部分事情都直接讓AI 助理來搞定。當使用者習慣了動嘴不動手，使用者就會更依賴那些對AI 助理支援好的應用，未來這會倒逼App 廠商做出改變。去年很多人都說2025 年會是Agent 元年，當時我還是持懷疑態度的，但今年先是Claude Code 開啟了Coding Agent 的時代，現在豆包AI 手機看起來也開啟了GUI Agent 的時代，讓我現在對Agent 的未來還是很樂觀的。不知道你有沒有用上豆包AI 手機？如果用過感覺如何？你對「AI 手機」又有怎麼樣的期待？

来自宝玉（@dotey）的推文线程

作者信息

线程正文