可爱又笨的 10B 1.8AB DeepSeek 也 https:huggingface.co/ai-sage/GigaCh…们可以在此基础上有所改进,只要他们能弄到/租到更多计算资源,并完善后续训练。RN 仅仅对数据科学进行微调会更好,而且他们甚至还投资了数据科学模型的可解释性。关键在于他们的意愿。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月20日 23:17
可爱又笨的 10B 1.8AB DeepSeek 也 https:huggingface.co/ai-sage/GigaCh…们可以在此基础上有所改进,只要他们能弄到/租到更多计算资源,并完善后续训练。RN 仅仅对数据科学进行微调会更好,而且他们甚至还投资了数据科学模型的可解释性。关键在于他们的意愿。