264 подписчика
Gzip побил нейросеть 🥹
В задачах классификации, где нужно просто объекты одного класса по коробочкам разложить, gzip компрессор победил все существующие методы.
Да, тот самый зип архиватор.
Интуиция состояла в том, что близкие по теме тексты будут сжиматься примерно одинаково. Интуиция подтвердилась.
Почитать бумагу: https://aclanthology.org/2023.findings-acl.426
Внимание, алгоритм:
Около минуты
13 июля 2023