Многие компании используют анализ данных для быстрого принятия эффективных решений и объяснения некоторых процессов. Для работы с огромными массивами данных применяют Data Mining и Machine Learning, поэтому многие считают эти два понятия синонимичными. Однако на самом деле каждая технология отвечает за разные этапы обработки данных и имеет свою специфику. В этой статье мы подробнее рассмотрим оба понятия и определим в чем их разница. Что такое Data Mining Data Mining — это способ анализа неструктурированной...
#python #nlp #textmining #nltk Нормализация текста – это приведение каждого слова текста к его словарной форме: в именительном падеже, единственном числе (если есть) или в инфинитив для глаголов. Окончательное качество нормализации текста зависит от каждого этапа обработки и определяется как морфологическими словарями, так и статистическими моделями. Это приводит к хорошим результатам при нормализации скорости к качеству. В этой статье мы рассмотрим начальные шаги по нормализации текста и покажем вам примеры...