興味深いトリックが満載です。「高密度なQwen2.5-7B言語モデルコアから進化しました」。 有効化されたエキスパート: 2 共有エキスパート + 0~3 ルーティングエキスパート、最小: 1.5B; 最大: 18B! アクティブ 非常に複雑な建築
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
1 件のツイート · 2025/11/18 11:18
興味深いトリックが満載です。「高密度なQwen2.5-7B言語モデルコアから進化しました」。 有効化されたエキスパート: 2 共有エキスパート + 0~3 ルーティングエキスパート、最小: 1.5B; 最大: 18B! アクティブ 非常に複雑な建築