Sparsefinder - SPNLP

Predicting Attention Sparsity

in Transformers

May 27, 2022

Marcos Treviso

António Góis

Patrick Fernandes

Erick Fonseca

André F. T. Martins

DEEPSPIN

Predicting Attention Sparsity in Transformers May 27, 2022 Marcos Treviso António Góis Patrick Fernandes Erick Fonseca André F. T. Martins DEEPSPIN