情境工程2.0:重新定義人工智慧的「記憶」與認知 在人工智慧快速發展的領域,「理解」情境的能力不僅是一項功能,更是建構能夠真正與人類互動的系統的基石。谷歌人工智慧研究院(GAIR) 近期發布的一項研究架構對此進行了深入探討,提出了「情境工程2.0」這個系統性方法,旨在幫助人工智慧掌握情境資訊。情境工程的核心在於熵減過程:將人類意圖(對話、選擇、需求)中雜亂無章、非結構化的訊號轉化為結構化的、機器可理解的資料。研究人員認為,這是人工智慧發展真正認知能力的關鍵基礎。 讓我們來分析一下關鍵見解: 1. 二十年演進:從基礎情境到自適應情境 情境工程領域經歷了四個截然不同的發展階段,反映了人工智慧如何從僵化的基於規則的系統發展到更靈活、更像人類的理解: 階段1(21 世紀初):專注於「靜態情境」-硬編碼預先定義的規則(例如,「如果使用者說X,則回覆Y」)。 階段2(2010 年代):轉向「動態情境」-整合即時資料(例如,位置、時間或最近的互動)來客製化回應。 階段3(2020-2022 年):介紹「多輪情境」-追蹤更長、多步驟的對話(例如,追蹤使用者在10 則以上訊息中的想法)。 - 第四階段(2023年至今):進入「自適應情境」階段——使人工智慧能夠推斷用戶未明確表達的需求,預測用戶意圖,並在各種開放式任務中保持一致性(例如,個人助理同時處理日程安排、研究和日常聊天)。 這個發展過程反映了人工智慧從「被動式」到「主動式」的飛躍,情境資訊不再只是被存儲,而是被主動解讀。 2. 熵減框架:為何重要 從理論上講,情境工程根植於「熵減」的概念,該概念源自於熱力學,指的是秩序從混沌中湧現。在人工智慧領域,這意味著將人類行為中的「噪音」(歧義、矛盾、不完整的資訊)提煉成可操作的「訊號」(例如,使用者偏好、隱藏目標)。例如,如果用戶說“我需要找一份禮物”,人工智慧必須透過推斷來降低熵:什麼樣的禮物?為誰服務?預算?之前的提示? 如果沒有這些訊息,人工智慧可能會預設給出通用建議,從而無法切中要點。 該框架提供了一個統一的視角來評估上下文系統:它們過濾無關數據、優先考慮關鍵資訊以及保持一致性的效果如何?例如,Claude 3 的「滑動視窗」上下文和Gemini 的「檢索增強生成」(RAG)都使用了熵減技術,但它們分別優化了不同的權衡——速度與深度。 3. 現任參與者:誰在情境工程方面做得最好? 該研究重點介紹了情境工程的實際應用案例: Claude:擅長「長上下文保留」-它可以處理超過20 萬個詞元,使其成為處理複雜的多頁文件或長篇對話的理想選擇,且不會失去連貫性。 Gemini:使用「檢索增強生成」(RAG)技術,引入外部資料(例如即時新聞、使用者歷史記錄)來建立回應,透過整合最新情境資訊來降低熵值。 Manus(Google的AI助理):展示了「具身上下文」的概念——它將上下文與實際操作聯繫起來,例如記住用戶偏好的左手工具或特定的廚房檯面佈局。 這些系統仍處於早期階段,但它們展示了情境工程如何超越文本,與視覺、語音和物理交相互結合。 4. 未來設計指南:下一步是什麼?為了推進情境工程2.0,研究人員概述了三個關鍵的設計優先事項: 情境抽象:超越原始數據,走向「抽象情境」-人工智慧應學會在細粒度細節(例如,「使用者提到下午3 點」與「使用者下午2 點有個會議」)和更高層次的模式(例如,「使用者對時間很敏感」)之間進行程式碼切換。 情境隱私:隨著情境變得更加詳細(例如,健康資料、個人歷史記錄),確保其安全儲存和使用,同時不損害使用者信任。 情境可遷移性:建立能夠跨任務(例如,旅行助理能夠記住過去的旅行記錄,從而為新的目的地調整推薦)和跨模式(例如,在不丟失情境的情況下從文字聊天切換到語音通話)「攜帶」情境的系統。 這對您(和您的業務)為何至關重要 無論您是在建立聊天機器人、個人助理還是大型語言模型,上下文工程都決定了您的人工智慧的「人性化」程度。它區分了「閱讀」文本的系統和「理解」意圖的系統。隨著人工智慧從“執行任務”轉向“與用戶協作”,掌握上下文熵減將是打造人性化工具的關鍵。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。