Google は、ストリートビュー ナビゲーション用の AI ツール StreetReaderAI を開発しています。これは Gemini を搭載しており、ストリートビューを会話型のアクセス可能なナビゲーション システムに変えます。 質問への回答の正確率は86%に達しました。 現在、アクセシブルなナビゲーション システムが存在しますが、将来的には、「地下鉄の駅から図書館まで歩いて、途中の障害物がないか確認し、図書館の入り口はどんな感じか教えてください」といった現地調査を支援できる AI 搭載のツアー ガイドが登場する可能性があります。 Geminiには複数の機能があり、その一つがリアルタイムAIシーン描写です。Geminiは、ユーザーの位置、向き、その他の地理情報を仮想ストリートビューに統合し、道路、交差点、ランドマークのリアルタイムレポートを配信します。 2つ目の機能はAIチャットです。これは、ユーザーの行動をすべて記憶するマルチターン対話ツールです。「さっき行ったバス停に空席はありましたか?」といった質問や、現在または以前の景色、周囲の地理など、様々な質問をすることができます。 Gemini Live を搭載したこの機能は、リアルタイムのインタラクション、関数呼び出し、そして単一セッション内でのすべてのインタラクションの一時保存を可能にします。100万トークンのコンテキストと約4,000枚のストリートビュー画像をサポートします。 左右の矢印キーで方向転換、上下の矢印キーで前進・後進の操作が可能です。音声コマンドも利用可能で、各ステップの方向と距離に関する情報を提供します。 11 人の視覚障害者を対象としたテストでは、AI チャットは AI リアルタイムシーン説明よりも 6 倍頻繁に使用され、816 の質問と回答の 86.3% で正解しました。 #AIナビゲーション #視覚障害者向けAIナビゲーション #AIツアーガイド
ブログ: