Найти тему
264 подписчика

Gzip побил нейросеть 🥹


В задачах классификации, где нужно просто объекты одного класса по коробочкам разложить, gzip компрессор победил все существующие методы.

Да, тот самый зип архиватор.

Интуиция состояла в том, что близкие по теме тексты будут сжиматься примерно одинаково. Интуиция подтвердилась.

Почитать бумагу: https://aclanthology.org/2023.findings-acl.426

Внимание, алгоритм:

Около минуты