把一億篇論文進行聚類會是什麼樣子? InferenceNet 與LAION、Wynd Labs 聯合發布了Project OSSAS 項目,他們用開源模型處理了1億篇科學論文,做了個視覺化工具,將相關的論文聚類到一起,讓全世界的科學知識變得可訪問、可搜尋、可視化。成本只要10萬美元。 他們使用了自己客製化的模型: 1. Aella-Qwen3-14B:基於阿里的Qwen3 14B 微調,推理能力強 2. Aella-Nemotron-12B:基於NVIDIA 的Nemotron 12B,混合Mamba-Transformer 架構,吞吐量炸裂 最終這個視覺化工具可以點擊任何論文查看結構化摘要和發現論文之間的關係和模式,方便在大家查找論文的時候快速檢索。 這裡有必要介紹下InferenceNet, 這個網站可以網路調用全球閒置GPU, 類似現代版的SETI@Home,但專門跑LLM 任務, 可以讓科研人員能用上原本根本負擔不起的算力. 項目地址:
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。