X (Twitter)

Estoy deseando que lleguen las micro-LLM ultrarrápidas con limitaciones de CPU que podamos consultar como funciones en línea. > Application::prompt("¿Alguno de estos suena francés?", ["John", "Pierre"], ["json_format" => `{"french": boolean", "name": string}`]; ... 2 ms después {"francés": verdadero, "nombre": "Pierre"}

Le doy dos años como máximo. Entonces esto estará en todos los sistemas operativos y todos los marcos de codificación lo tendrán como una capacidad integrada.

Actualmente, el campo es sumamente interesante. Tenemos: - Shuggingface.co/HuggingFaceTB/…BEJ6lp9 - Análisis de la CPU de github.com/AliOsm/deepsee…9XMySH1uN8 - la pequeai.meta.com/blog/llama-3-2…o/F2QBp3oX5r - Microsoft Phuggingface.co/microsoft/Phi-…/2EHpDbPKw6 ¡Todos están trabajando para cuantificar más!

Hilo de Arvid Kahl (@arvidkahl)

Información del autor

Contenido del hilo