谷歌最新開源了多模態長上下文編碼器-解碼器模型:T5Gemma 2,原生支援140+種語言,最小270M-270M 基於Gemma 3,在代碼、推理、事實性、多語言、多模態、長文本等任務上優於同尺寸Gemma 3以及初代T5Gemma T5Gemma 2自備視覺編碼器,可看圖問答、圖文混合推理 借助Gemma 3的局部+全域注意力機制,一次能吃128k token,能處理長文檔/長對話 編碼器-解碼器模型更擅長處理序列到序列的任務,可以用來建構翻譯工具、智慧客服、看圖問答系統等等 #T5Gemma2 #googleGemma
模型:huggingface.co/collections/go… 部落格blog.google/technology/dev…i
