X (Twitter)

情境工程2.0：重新定義人工智慧的「記憶」與認知在人工智慧快速發展的領域，「理解」情境的能力不僅是一項功能，更是建構能夠真正與人類互動的系統的基石。谷歌人工智慧研究院(GAIR) 近期發布的一項研究架構對此進行了深入探討，提出了「情境工程2.0」這個系統性方法，旨在幫助人工智慧掌握情境資訊。情境工程的核心在於熵減過程：將人類意圖（對話、選擇、需求）中雜亂無章、非結構化的訊號轉化為結構化的、機器可理解的資料。研究人員認為，這是人工智慧發展真正認知能力的關鍵基礎。讓我們來分析一下關鍵見解： 1. 二十年演進：從基礎情境到自適應情境情境工程領域經歷了四個截然不同的發展階段，反映了人工智慧如何從僵化的基於規則的系統發展到更靈活、更像人類的理解：階段1（21 世紀初）：專注於「靜態情境」－硬編碼預先定義的規則（例如，「如果使用者說X，則回覆Y」）。階段2（2010 年代）：轉向「動態情境」－整合即時資料（例如，位置、時間或最近的互動）來客製化回應。階段3（2020-2022 年）：介紹「多輪情境」－追蹤更長、多步驟的對話（例如，追蹤使用者在10 則以上訊息中的想法）。 - 第四階段（2023年至今）：進入「自適應情境」階段——使人工智慧能夠推斷用戶未明確表達的需求，預測用戶意圖，並在各種開放式任務中保持一致性（例如，個人助理同時處理日程安排、研究和日常聊天）。這個發展過程反映了人工智慧從「被動式」到「主動式」的飛躍，情境資訊不再只是被存儲，而是被主動解讀。 2. 熵減框架：為何重要從理論上講，情境工程根植於「熵減」的概念，該概念源自於熱力學，指的是秩序從混沌中湧現。在人工智慧領域，這意味著將人類行為中的「噪音」（歧義、矛盾、不完整的資訊）提煉成可操作的「訊號」（例如，使用者偏好、隱藏目標）。例如，如果用戶說“我需要找一份禮物”，人工智慧必須透過推斷來降低熵：什麼樣的禮物？為誰服務？預算？之前的提示？如果沒有這些訊息，人工智慧可能會預設給出通用建議，從而無法切中要點。該框架提供了一個統一的視角來評估上下文系統：它們過濾無關數據、優先考慮關鍵資訊以及保持一致性的效果如何？例如，Claude 3 的「滑動視窗」上下文和Gemini 的「檢索增強生成」（RAG）都使用了熵減技術，但它們分別優化了不同的權衡——速度與深度。 3. 現任參與者：誰在情境工程方面做得最好？該研究重點介紹了情境工程的實際應用案例： Claude：擅長「長上下文保留」－它可以處理超過20 萬個詞元，使其成為處理複雜的多頁文件或長篇對話的理想選擇，且不會失去連貫性。 Gemini：使用「檢索增強生成」（RAG）技術，引入外部資料（例如即時新聞、使用者歷史記錄）來建立回應，透過整合最新情境資訊來降低熵值。 Manus（Google的AI助理）：展示了「具身上下文」的概念——它將上下文與實際操作聯繫起來，例如記住用戶偏好的左手工具或特定的廚房檯面佈局。這些系統仍處於早期階段，但它們展示了情境工程如何超越文本，與視覺、語音和物理交相互結合。 4. 未來設計指南：下一步是什麼？為了推進情境工程2.0，研究人員概述了三個關鍵的設計優先事項：情境抽象：超越原始數據，走向「抽象情境」－人工智慧應學會在細粒度細節（例如，「使用者提到下午3 點」與「使用者下午2 點有個會議」）和更高層次的模式（例如，「使用者對時間很敏感」）之間進行程式碼切換。情境隱私：隨著情境變得更加詳細（例如，健康資料、個人歷史記錄），確保其安全儲存和使用，同時不損害使用者信任。情境可遷移性：建立能夠跨任務（例如，旅行助理能夠記住過去的旅行記錄，從而為新的目的地調整推薦）和跨模式（例如，在不丟失情境的情況下從文字聊天切換到語音通話）「攜帶」情境的系統。這對您（和您的業務）為何至關重要無論您是在建立聊天機器人、個人助理還是大型語言模型，上下文工程都決定了您的人工智慧的「人性化」程度。它區分了「閱讀」文本的系統和「理解」意圖的系統。隨著人工智慧從“執行任務”轉向“與用戶協作”，掌握上下文熵減將是打造人性化工具的關鍵。

來自 Y11-杨继芸-靠谱找工作、找面试题、改简历、模拟面试（@seclink）的推文串

作者資訊

推文串內容