Найти в Дзене
DenoiseLAB

Соображения по работе с текстами. Не так все просто как казалось

💪Опять залетел таск на слова на этот раз больше с упором на токенизацию, пришлось в спешном порядке посмотреть что такое texthero (https://texthero.org/docs/getting-started), я мало работал с текстами в основном изображение, ну ничего продолжаем тестить.

🔥Пришлось почитать всю историю с NLTK (https://www.nltk.org/data.html). Училась эта история долго на векторах, да и скор показала на великий, но главное что она заработала и хорошо. Можно это было конечно на руберте все пересобрать, но задача оот заказчика была именно такая, так что, уж как есть. В любом случае отличный опыт. Как оказалось GridSearchCV не дает слишком высокого поднятия относительно бустов.

💥Поддержите нас - подписывайтесь на канал !

🔥Если вы хотите нас поддержать вы можете сделать небольшой вклад на нашей страничке boosty: https://boosty.to/denoise_lab

Мы в Телеграмм: https://t.me/DenoiseLAB

Мы на Profi.ru: https://profi.ru/profile/MironovVO8/

Мы на Repetitor.ru: https://v3.repetitors.info/repetitor/p/MironovVO8/

Мы на YandexDzen: https://dzen.ru/vishmat?lang=ru

Мы на YouDO: https://youdo.com/u9455664

Мы на HabrFreelance: https://freelance.habr.com/freelancers/MLab

Наш второй канал по математике: https://dzen.ru/vishmat