為什麼所有線性RNN變體都比不上…你知道的,原始的循環單元?我正在測試MinGRU,但找不到它在相同參數數量下是否應該與GRU學習效果相當的資訊。目前看來,它的性能似乎比我的LSTM單元略弱。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年11月5日 凌晨2:03
為什麼所有線性RNN變體都比不上…你知道的,原始的循環單元?我正在測試MinGRU,但找不到它在相同參數數量下是否應該與GRU學習效果相當的資訊。目前看來,它的性能似乎比我的LSTM單元略弱。