[オープンソース推奨] Firecrawl: ウェブページまたはウェブサイト全体を、LLM対応のクリーンなMarkdown、構造化JSON、その他の形式に変換します。@firecrawl チームによる、AIアプリケーション向けに特別に設計されたツールです。 主な機能: スクレイピング: 単一ページのスクレイピング、Markdown、HTML、スクリーンショット、構造化抽出をサポートします。 クロール: ウェブサイトのすべてのサブページを自動的にクロールし、クリーンなデータを返します。 • 抽出: プロンプトワードまたはスキーマを使用して構造化されたデータを抽出します。 その他の機能には、Web サイト マッピング、Web ページ検索、バッチ処理、変更監視、PDF/ドキュメント解析などがあります。 • Python/JS SDK をサポートし、LangChain や LlamaIndex などのフレームワークを統合します。 • オープンソース (AGPL-3.0)、自己ホスト可能。公式クラウド サービスを使用して API キーを取得することをお勧めします。 v2.7.0 最新アップデート(2025年12月5日リリース) 安定性、パフォーマンス、エンタープライズ機能の改善に重点を置いたメンテナンスリリースです。主なハイライト: 新機能: ブランド抽出の改善 (より正確なロゴ/色)、実験的な NOQ クロール システム、minAge キャッシュ パラメーター、UUIDv7 ID、ZDR エンタープライズ検索のサポート。 • 最適化: スクリーンショットの高速化、リダイレクト/URL マッピングの改善、部分的な結果の返送、メタデータの充実、SDK の改善。 • セルフホスト: カスタム同時実行性と PostgreSQL 構成をサポートします。 • バッチページネーション、PDF 処理、不正な境界条件など、いくつかのバグを修正しました。 オープンソースアドレス
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
![[オープンソース推奨] Firecrawl: ウェブページまたはウェブサイト全体を、LLM対応のクリーンなMarkdown、構造化JSON、その他の形式に変換します。@firecrawl チームによる、AIアプリケーション向けに特別に設計さ](https://pbs.twimg.com/media/G8iOtYabIAA_fBG.jpg)