我在MIT看到的Agent 新範式 今天在麻省理工學院的EmTech大會上,看到了一個讓我重新思考整個AI agent領域的示範。 演示方是TinyFish,相當低調的公司。創始團隊裡有兩位華人,獲得了ICONIQ領投的近3.5億元人民幣融資,但在今天之前從未公開展示過他們的核心產品。 而他們正在做的事情,已經在為Google和DoorDash運行超過千萬級別的web agent操作... 不是實驗室demo,是真實的生產環境。 TinyFish產品能讓AI 能夠像人類一樣自動操作網頁、完成企業級任務... 它可以在沒有API 的情況下,讓AI 自動跨網站讀取、理解、操作網頁,執行業務流程、擷取資料、提交資訊、監控變更。 從抓數據、比價格、做填表、查庫存,到合規審查與動態定價,都能完成... 可以在幾千個網站間即時操作、執行任務。 也就是可以同時運行一千個ChatGPT Atlas ,然後不間斷的,同樣的答案運行一千萬次... 一個被所有人忽略的事實 TinyFish的CEO Sudheesh在演示中分享了一個震撼的洞見: 現在市面上所有的AI agent,都只能操作5%的網路。 不是因為開發者技術不行,而是因為所有人都在基於搜尋引擎來建構agent。 而搜尋這個範式,早就失效了。 搜尋是怎麼失效的? 讓我們來看一個最簡單的例子:Amazon。 Amazon的每個產品頁面都被Google完整索引,完全可以爬取。這是搜尋引擎最理想的場景。 但當你在Amazon搜尋"筆記型電腦"時會發生什麼事? 你會看到上萬個結果。贊助商品、虛假評論、AI生成的描述鋪天蓋地。你翻了幾頁就放棄了,最後隨便點一個"看起來還行"的,結帳走人。 這不是Amazon的問題。這是搜尋範式本身的問題:當資料量太大時,排名就失效了。 Google成功地索引了數百萬Amazon頁面,但這並沒有讓搜尋變得更有用。 Amazon自己建了搜尋引擎,也沒有解決問題。 網路變得太大了。即使是已經被索引的部分,排名也已經無法運作。 搜尋假設你想"找到"某樣東西。但如果你需要"檢查所有"東西呢?比較所有供應商?驗證每一個選項? ** 這時候,整個範式就崩潰了。 那剩下的95%呢? 更糟的是,剛才說的還只是那5%被索引的網路。 剩下95%的網路藏在哪裡? - 需要登入的供應商門戶 - 有身份驗證的醫療系統 - 只能透過表單提交存取的政府資料庫 - 需要多步驟導航的競爭情報 搜尋引擎根本接觸不到這些。不是技術問題,是架構問題。你無法爬取需要互動才能存取的內容。 所以我們面臨兩個問題: 1. 被索引的5%網路因為太大而失效 2. 95%的重要數據根本沒被索引 兩個問題的根源都一樣:搜尋這個範式假設人類會手動評估結果。當你需要全面的情報而不是排名選項時,它就失效了。 為什麼現有方案都解決不了 你可能會想:RAG呢?更好的embedding呢? Browser agents 呢? 它們都解決不了 因為它們都繼承了搜尋的核心限制:假設你想"找到"某樣東西,而不是"檢查所有"東西。 當一個採購團隊需要檢查200個供應商入口網站的競爭定價時,排名幫不了你。 當製藥公司需要在數千個研究站點匹配臨床試驗的患者資格時,檢索幫不了你。 這不是"這項工作很繁瑣我們想自動化"的問題。這是"這種分析在我們需要的規模上根本不可能完成"的問題。 從可讀Web到可執行Web Sudheesh解釋了他們的解決方案: 不是更好的搜索,而是操作性基礎設施。 TinyFish建構的系統可以: - 登入認證系統 - 導航多步驟工作流程 - 提取結構化數據 - 同時運行數十萬個並行會話 這就是從"可讀Web"到"可執行Web"的轉變。 瀏覽器代理程式(例如OpenAI的Atlas)幫助個人更快地導航網站:一次一個會話,一個瀏覽器。 TinyFish 的Mino: 👉 就像一個“AI工廠”,讓公司自己創建、部署和管理這些“網頁機器人(Web Agents)”。 Mino可在基礎設施規模上運行數十萬個並行會話,在需要人類團隊數週時間完成的複雜工作流程中保持準確性。 這不是自行車和摩托車的區別。這是自行車和貨運網絡的區別。 規模化的證明 這不是理論 TinyFish已經在為ClassPass、Google、DoorDash等公司每月運行3000萬次操作。 ClassPass的例子很典型:他們需要聚合數萬個健身工作室的課程。大部分工作室沒有API,只有手動更新的預約網站。課程安排每天變化,價格因時間、地點和等級而異。 傳統方法全數失敗: - 人工輸入:無法規模化,資料永遠過時 - 爬蟲:網站一改版就崩潰 - API對接:長尾永遠不會開發集成 使用TinyFish後,他們的場館覆蓋率增加了3-4倍,成本降低了50%。 更具體的實際落地案例: 🏨 Google Hotels 日本許多飯店使用老舊系統,無法連接Google 聚合平台 TinyFish 的代理商能自動取得這些飯店的庫存與價格; 無需IT 改造,讓Google Hotels 實現即時更新。 實現99% 的即時覆蓋率更新頻率提升20 倍運行量超過每月1,000 萬+ 操作 🛵 DoorDash 為每個城市部署AI 代理,自動抓取競爭網站選單、價格、促銷 每小時更新、自動去重與異常檢測; 與DoorDash 內部資料系統自動對接。 每月收集數百萬個定價變數; 用於動態調整價格、最佳化市場響應; 自動化95% 市場數據採集; 提高預測模型精度30%; 大幅降低人工研究成本(原來每月人工工時1200+ 小時)。 這意味著什麼 搜尋在過去25年裡運行得很好,因為網路足夠小,人類可以手動評估排名結果。 現在網路太大了。即使是被索引的部分也變得無法管理。而95%的網路從來沒被索引過。 接下來的範式不是更好的搜尋或更聰明的排名。而是能夠在整個網路上導航、推理和提取的操作性基礎設施:公開的和私密的,被索引的和未被索引的。 Agent功能的發展速度遠超預期。短短36個月,我們就從"AI起草郵件"發展到了"AI運行完整工作流程"。 TinyFish可能在企業規模的實際落地上已經領先了。 他們正在向開發者開放這個基礎設施。如果你正在建造需要大規模可靠性的agent產品,這可能是一個值得關注的早期訊號。
TinyFish讓企業能夠以AI 取代網頁上的重複勞動,實現從資訊自動化到營運自動化... TinyFish @Tiny_Fish 已獲得ICONIQ 4700萬美金A 輪融資 網址:https://t.co/kneIlDWvjf
