正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月5日 02:03
为什么所有线性RNN变体都比不上……你知道的,原始的循环单元?我正在测试MinGRU,但找不到它在相同参数数量下是否应该与GRU学习效果相当的信息。目前看来,它的性能似乎比我的LSTM单元略弱。