[Recommandation Open Source] Firecrawl : Convertissez des pages web ou des sites web entiers en Markdown propre et compatible avec LLM, en JSON structuré ou dans d’autres formats. Conçu spécifiquement pour les applications d’IA, par l’équipe @firecrawl. Caractéristiques principales : Extraction : Extraction de données de pages uniques, prise en charge du Markdown, du HTML, des captures d’écran et de l’extraction structurée. Exploration : Explore automatiquement toutes les sous-pages d'un site web et renvoie des données propres. • Extraction : Utilisez des mots clés ou un schéma pour extraire des données structurées. Parmi les autres fonctionnalités, citons : la cartographie de sites web, la recherche de pages web, le traitement par lots, la surveillance des modifications et l'analyse de documents PDF. • Prend en charge le SDK Python/JS et intègre des frameworks tels que LangChain et LlamaIndex. • Logiciel libre (AGPL-3.0), auto-hébergeable ; il est recommandé d'obtenir la clé API via le service cloud officiel. v2.7.0 Dernière mise à jour (publiée le 5 décembre 2025) Mise à jour de maintenance axée sur l'amélioration de la stabilité, des performances et des fonctionnalités pour entreprises. Principaux points forts : Nouvelles fonctionnalités : Extraction de marque améliorée (logo/couleur plus précis), système d’exploration NOQ expérimental, paramètre de mise en cache minAge, identifiant UUIDv7, prise en charge de la recherche d’entreprise ZDR. • Optimisations : Captures d'écran plus rapides, meilleure redirection/mappage d'URL, retour de résultats partiels, métadonnées plus riches et améliorations du SDK. • Auto-hébergé : Prend en charge la concurrence personnalisée et la configuration PostgreSQL. • Correction de plusieurs bugs, notamment la pagination par lots, le traitement des PDF et des conditions limites incorrectes. Adresse open source
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
![[Recommandation Open Source] Firecrawl : Convertissez des pages web ou des sites web entiers en Markdown propre et compa](https://pbs.twimg.com/media/G8iOtYabIAA_fBG.jpg)