Nuevo video publicado: contexto de 256K + ¡precio súper bajo! Explicación de la tecnología Xiaomi MiMo-V2-Flash + prueba práctica. Característica principal de MiMo V2 Flash: Atención híbrida (SWA + GA 5:1) Diseñado específicamente para documentos largos, agentes e inferencia de múltiples pasos, está optimizado para lograr velocidad y eficiencia extremas. DeepSeek V3.2 ya es bastante barato, pero MiMo-V2-Flash puede tener un precio aún más bajo. En mi breve experiencia: Las capacidades de codificación y respuesta a preguntas basadas puramente en conocimiento son inferiores a los modelos de última generación de código abierto (SOTA) de mayor escala. Sin embargo, en escenarios que involucran contextos largos, tareas livianas y llamadas de herramientas, considerando factores como precio y velocidad, la relación costo-beneficio general es muy competitiva. Vídeo completo 🧵
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
