sfd
Структура данных DAWG
Статья подготовлена для студентов курса «Алгоритмы для разработчиков» в образовательном проекте OTUS. Существует огромное количество задач, связанных с обработкой текстов: машинный перевод, фильтрация спама, data mining, спеллчекеры, научные задачи такие, как работа с последовательностями ДНК, и многие другие. Почти все эти задачи объединяет то, что тексты состоят из отдельных слов, а для эффективного хранения данных требуются специфические структуры данных. Почему? Что это за структуры данных, за счёт каких особенностей текстовых данных они эффективны? Давайте разбираться на примере DAWG...