X (Twitter)

谷歌正在搞一款街景導航的AI工具：StreetReaderAI，由Gemini驅動，把街景變成了會說話的無障礙導航回答問題準確率達了86% 現在是無障礙導航，未來有可能是AI導遊，可以讓它幫你做實地勘查，比如說“幫我從地鐵站走到圖書館，看看路上有沒有障礙物，告訴我圖書館的大門長什麼樣” 它有幾個能力一個是實時AI場景描述，Gemini結合用戶在虛擬街景中的位置、朝向等地理信息，實時播報道路、路口、地標第二個是AI Chat多輪對話，它會記住用戶走過的每一步，你可以問“剛才的公車站有座椅嗎”，可以提問關於當前或之前景象，以及週邊地理環境的任何問題這個由Gemini Live提供支持，可以即時互動、函數調用，並臨時保留單一會話中所有互動的記憶，支援100萬token上下文，約4000多張街景圖片操控方式，左右箭頭轉身、上下箭頭前進/後退，也可以語音，每一步都報方向與距離在其對11位盲人測試中，AI Chat使用頻率是AI即時場景描述的6倍，在816個問答裡有86.3%是正確的 #AI導航 #AI盲人導航 #AI導遊

部落格:

來自 AIGCLINK（@aigclink）的推文串

作者資訊

推文串內容