Это официальный код статьи ACL 2022 «Автоматическое решение кроссвордов». Этот репозиторий содержит код для обучения и запуска нашей системы решения кроссвордов . Мы также выпускаем предварительно обученные модели, предварительно вычисленные FAISS и набор данных подсказок-ответов на кроссворды.
Установка
- Клонируйте репо с помощью git clone https://github.com/albertkx/crossword.git
- Установите все подмодули с помощью git submodule update --init --recursive
- Создайте новую виртуальную среду с помощью Python 3.8.
- Запустите setup.sh. Это устанавливает все зависимости и загружает контрольные точки.
Структура папок
- Весь для обучения находится в train_scripts/
- Данные для обучения QA Model должны быть размещены в data/.
- Все чекпоинты модели расположены в checkpoints/.
- Все компоненты решателя находятся в файле Solver/.
Запуск Солвера
Самый простой способ начать работу — запустить наши предварительно обученные контрольные точки. Наш решатель создан для работы либо с головоломкой в формате .json, либо с файлами .puz из New York Times.
Файлы .puz должны сначала быть преобразованы их в файлы .json, а затем нужнл запустить функцию решения, указанную выше.
Github: https://github.com/albertkx/berkeley-crossword-solver
Статья: https://arxiv.org/abs/2205.09665v1
Dataset: https://www.xwordinfo.com/JSON/
#pythonprogramming #programmer #developer #dataanalytics #software #datascientist #javascript #iot #coder #ml