A Moonshot AI da China acaba de lançar o primeiro modelo de Atenção Linear da história. Com apenas 3 bilhões de parâmetros ativos, ele supera os modelos de atenção completa com decodificação 6 vezes mais rápida e 75% menos uso de memória em um contexto de 1 milhão de tokens 🤯 100% de código aberto.
Mais ferramentas e projetos de IA ctheunwindai.comco/BvTc8nQQW5: Tenha acesso a mais de 100 tutoriais sobre AI Agent, RAG, LLM e MCP com código aberto - tudo GRATUITAMENTE.
