NL-Augmenter - это совместная работа, предназначенная для добавления преобразований наборов данных, работающих с естественным языком. Преобразования дополняют наборы текстовых данных различными способами, включая: рандомизацию имен и чисел, изменение стиля / синтаксиса, перефразирование, перефразирование на основе KB ... и любое творческое расширение, которое вы вносите. Мы приглашаем представить преобразования в этот фреймворк посредством запроса на вытягивание GitHub до 31 августа 2021 года. Все отправители принятых преобразований (и фильтров) будут включены в качестве соавторов в документ, анонсирующий этот фреймворк.
Github: https://github.com/GEM-benchmark/NL-Augmenter
Paper: https://arxiv.org/abs/2112.02721v1
Dataset: https://paperswithcode.com/dataset/sst