구글은 최근 140개 이상의 언어를 기본적으로 지원하고 최소 크기가 270MB인 멀티모달 장문 컨텍스트 인코더-디코더 모델인 T5Gemma 2를 오픈소스로 공개했습니다. Gemma 3를 기반으로 제작된 이 제품은 코딩, 추론, 사실 분석, 다국어 처리, 멀티모달 처리 및 장문 텍스트 처리와 같은 작업에서 동일 크기의 Gemma 3 및 1세대 T5 Gemma보다 우수한 성능을 보여줍니다. T5Gemma 2에는 이미지 기반 질의응답 및 이미지-텍스트 혼합 추론을 지원하는 내장형 비주얼 인코더가 포함되어 있습니다. Gemma 3의 로컬 및 글로벌 어텐션 메커니즘을 활용하여 한 번에 128,000개의 토큰을 처리할 수 있으므로 긴 문서와 긴 대화를 처리할 수 있습니다. 인코더-디코더 모델은 순차적 처리 작업에 더 적합하며 번역 도구, 지능형 고객 서비스 시스템, 이미지 기반 질의응답 시스템 등을 구축하는 데 사용할 수 있습니다. #T5젬마2 #구글젬마
모델:huggingface.co/collections/go…u 블blog.google/technology/dev…iXci
