[Recomendación de código abierto] Firecrawl: Convierte páginas web o sitios web completos a Markdown limpio, JSON estructurado u otros formatos compatibles con LLM. Diseñado específicamente para aplicaciones de IA, por el equipo de @firecrawl. Características principales: Scrape: raspado de una sola página, admite Markdown, HTML, capturas de pantalla y extracción estructurada. Rastreo: rastrea automáticamente todas las subpáginas de un sitio web y devuelve datos limpios. • Extraer: utilice palabras clave o esquemas para extraer datos estructurados. Otras características incluyen: mapeo de sitios web, búsqueda de páginas web, procesamiento por lotes, monitoreo de cambios y análisis de documentos/PDF. • Admite Python/JS SDK e integra marcos como LangChain y LlamaIndex. • Código abierto (AGPL-3.0), autohospedable; se recomienda obtener la clave API utilizando el servicio de nube oficial. Última actualización de la versión 2.7.0 (publicada el 5 de diciembre de 2025) Una versión de mantenimiento centrada en mejoras de estabilidad, rendimiento y funcionalidad empresarial. Aspectos destacados: Nuevas características: Extracción de marca mejorada (logotipo/color más preciso), sistema de rastreo NOQ experimental, parámetro de almacenamiento en caché minAge, ID UUIDv7, compatibilidad con búsqueda empresarial ZDR. • Optimizaciones: capturas de pantalla más rápidas, mejor redirección/mapeo de URL, retorno de resultados parciales, metadatos más completos y mejoras en el SDK. • Autohospedado: admite simultaneidad personalizada y configuración de PostgreSQL. • Se corrigieron varios errores, incluida la paginación por lotes, el procesamiento de PDF y las condiciones de límite incorrectas. Dirección de código abierto
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
![[Recomendación de código abierto] Firecrawl: Convierte páginas web o sitios web completos a Markdown limpio, JSON estruc](https://pbs.twimg.com/media/G8iOtYabIAA_fBG.jpg)