La empresa china Moonshot AI acaba de lanzar el primer modelo de Atención Lineal. Con tan solo 3 mil millones de parámetros activos, supera a los modelos de atención completa con una decodificación 6 veces más rápida y un 75 % menos de uso de memoria en un contexto de 1 millón de tokens 🤯 100% de código abierto.
Encontrará más herramientas y proyetheunwindai.com.co/BvTc8nQQW5: Obtén acceso a más de 100 tutoriales sobre agentes de IA, RAG, LLM y MCP con código abierto, ¡todo gratis!
