X (Twitter)

在人工智慧技術持續突破的當下，xAI公司於近期推出了Grok 4.1模型，這項進展不僅反映了技術的迭代速度，更讓我們看到AI在實用化道路上的紮實探索。作為馬斯克旗下的AI新創企業，xAI此次發布的Grok 4.1在核心性能上實現了顯著提升。透過優化訓練系統和演算法邏輯，該模型將AI常見的「幻覺現象」——也就是產生虛假或無意義訊息的情況——減少了約三分之二。具體數據顯示，其幻覺率從Grok 4 Fast的12.09%降至4.22%，在事實準確度測驗中也取得了更優成績。這種進步讓AI在回答問題時更加可靠，減少了資訊錯誤的困擾，這對於實際應用場景至關重要。值得關注的是，Grok 4.1在多維度能力上都展現出競爭力。在LMArena的Text Arena排行榜中，其思考模式以1483的Elo得分位居第一，快速模式也以1465分位居第二，領先其他非xAI模型31分。更難得的是，在情緒智商測驗和創意寫作評估中，該模型同樣表現出色，情緒智商測驗得分1586創紀錄，創意寫作得分1722分，較之前提升了600分。這些成績表明，xAI不僅關注AI的“智力”，也在努力提升其“情緒智商”與“創造力”，讓AI更貼近人類的情感需求和表達習慣。此次發布延續了xAI「技術普惠」的理念，Grok 4.1向全球用戶免費開放，高級會員可享有更高使用限額。這種開放姿態有助於科技的快速普及和回饋收集，讓更多人能體驗AI進步帶來的便利。背後支撐這項技術突破的，是位於田納西州孟菲斯的Colossus超級電腦建構的強大算力系統，其超過200,000個GPU的規模，為模型訓練提供了堅實的硬體基礎。目前AI領域競爭正日趨激烈，Google、OpenAI等巨擘紛紛推出新模型。在這樣的背景下，xAI的持續創新值得肯定。科技的進步從來不是單一企業的競賽，而是整個產業推動社會進步的動力。 Grok 4.1的發布，不僅是xAI自身的里程碑，也為整個AI產業提供了有益的參考——真正有價值的技術，既要追求效能突破，也要注重實際應用和使用者體驗。對於一般使用者而言，這些技術進展意味著未來我們可能會遇到更聰明、更可靠的AI助理；對於產業而言，這提醒我們在技術發展中既要保持創新銳氣，也要堅守責任與倫理，讓AI始終服務於人類福祉。隨著技術的不斷迭代，我們有理由期待AI在更多領域發揮更大作用，為生活和工作帶來更多驚喜。

來自 Y11-杨继芸-靠谱找工作、找面试题、改简历、模拟面试（@seclink）的推文串

作者資訊

推文串內容