191 читали · 4 года назад
Overfitting в Машинном обучении простыми словами
Переобучение – это случай, когда значение Функции потери (Loss Function) действитеьно малó, но Модель (Model) Машинного обучения (ML) ненадежна. Это связано с тем, что модель «слишком много учится» на обучающем наборе данных. Когда мы входим в сферу ML, появляются двусмысленные термины: Переобучение, Недообучение (Underfitting) и Дилемма смещения-дисперсии (Bias-Variance Trade-off). Эти концепции лежат в основе Машинного обучения в целом. Почему нам вообще должно быть до этого дело? Возможно, модели машинного обучения преследуют одну единственную цель: хорошо обобщать...
662 читали · 3 года назад
🖋 Создаем автокорректор текста на Python (аналог т9). Работаем с пакетом nltk.
Библиотека NLTK, или NLTK, — пакет библиотек и программ для символьной и статистической обработки естественного языка. Эта статья поможет вам создать простую программу автокоррекции тектса на python. Этот проект заключается в создании двух разных рекомендательных систем правописания, которые смогут принимать входные данные пользователя и рекомендовать правильно написанное слово. Звучит круто! Natural Language Toolkit nltk расшифровывается как Natural Language Toolkit, и всю информацию о возможностях данной библиотеки можно сделать, можно найти здесь...