[Recomendação de código aberto] Firecrawl: Converta páginas da web ou sites inteiros para Markdown limpo e compatível com LLM, JSON estruturado ou outros formatos. Projetado especificamente para aplicações de IA, pela equipe do @firecrawl. Principais funcionalidades: Extração de dados: Extração de dados de página única, compatível com Markdown, HTML, capturas de tela e extração estruturada. Rastreamento: Rastreia automaticamente todas as subpáginas de um site e retorna dados limpos. • Extrair: Utilize palavras-chave ou esquemas para extrair dados estruturados. Outras funcionalidades incluem: mapeamento de websites, pesquisa em páginas web, processamento em lote, monitoramento de alterações e análise de PDFs/documentos. • Suporta o SDK Python/JS e integra frameworks como LangChain e LlamaIndex. • Código aberto (AGPL-3.0), auto-hospedável; recomenda-se obter a chave da API usando o serviço de nuvem oficial. v2.7.0 Última atualização (Lançada em 5 de dezembro de 2025) Uma versão de manutenção focada em melhorias de estabilidade, desempenho e funcionalidades corporativas. Principais destaques: Novos recursos: Extração de marca aprimorada (logotipo/cor mais precisos), sistema experimental de rastreamento NOQ, parâmetro de cache minAge, ID UUIDv7, suporte à pesquisa corporativa ZDR. • Otimizações: Capturas de tela mais rápidas, melhor redirecionamento/mapeamento de URL, retorno parcial de resultados, metadados mais completos e melhorias no SDK. • Autohospedado: Suporta simultaneidade personalizada e configuração do PostgreSQL. • Corrigimos diversos erros, incluindo paginação em lote, processamento de PDF e condições de contorno incorretas. Endereço de código aberto
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
![[Recomendação de código aberto] Firecrawl: Converta páginas da web ou sites inteiros para Markdown limpo e compatível co](https://pbs.twimg.com/media/G8iOtYabIAA_fBG.jpg)