«GHC introduit un mécanisme flexible qui, grâce à des calculs légers, compresse les états cachés Over-Width à la largeur du réseau principal avant de les transmettre aux modules d'attention ou de propagation directe, puis étend les sorties du module à nouveau jusqu'à l'Over-Width.» culot fou
C'est relativement bon marché

