在做網站開發或資料分析時,常會發現資料裡混雜著大量爬蟲存取記錄,導致真實使用者資料嚴重干擾,分析起來確實挺麻煩。 可以看一下,Crawler Detect 這個開源PHP 函式庫,它能精準辨識出訪客是真實使用者還是爬蟲機器人。 透過分析訪客的User Agent 和HTTP Header 訊息,能夠識別上千種不同的爬蟲和機器人,幫我們輕鬆過濾掉非人類訪問,獲得更準確的用戶資料。 GitHub:https://t.co/GnzfgPHRtu 主要功能: - 自動偵測目前訪客是否為爬蟲或機器人; - 支持識別上千種常見的爬蟲和蜘蛛程式; - 可傳入自訂User Agent 字串進行偵測; - 能輸出符合的特定爬蟲名稱; - 提供Laravel、Symfony、YII2 等框架的整合套件; - 支援Python、Go、Ruby、.NET 等多種程式語言版本。 對於PHP 項目,透過Composer 一行指令安裝即可使用,適合需要準確統計網站存取資料的開發者和營運人員。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
