谷歌正在搞一款街景導航的AI工具:StreetReaderAI,由Gemini驅動,把街景變成了會說話的無障礙導航 回答問題準確率達了86% 現在是無障礙導航,未來有可能是AI導遊,可以讓它幫你做實地勘查,比如說“幫我從地鐵站走到圖書館,看看路上有沒有障礙物,告訴我圖書館的大門長什麼樣” 它有幾個能力一個是實時AI場景描述,Gemini結合用戶在虛擬街景中的位置、朝向等地理信息,實時播報道路、路口、地標 第二個是AI Chat多輪對話,它會記住用戶走過的每一步,你可以問“剛才的公車站有座椅嗎”,可以提問關於當前或之前景象,以及週邊地理環境的任何問題 這個由Gemini Live提供支持,可以即時互動、函數調用,並臨時保留單一會話中所有互動的記憶,支援100萬token上下文,約4000多張街景圖片 操控方式,左右箭頭轉身、上下箭頭前進/後退,也可以語音,每一步都報方向與距離 在其對11位盲人測試中,AI Chat使用頻率是AI即時場景描述的6倍,在816個問答裡有86.3%是正確的 #AI導航#AI盲人導航#AI導遊
部落格: