💪Опять залетел таск на слова на этот раз больше с упором на токенизацию, пришлось в спешном порядке посмотреть что такое texthero (https://texthero.org/docs/getting-started), я мало работал с текстами в основном изображение, ну ничего продолжаем тестить.
🔥Пришлось почитать всю историю с NLTK (https://www.nltk.org/data.html). Училась эта история долго на векторах, да и скор показала на великий, но главное что она заработала и хорошо. Можно это было конечно на руберте все пересобрать, но задача оот заказчика была именно такая, так что, уж как есть. В любом случае отличный опыт. Как оказалось GridSearchCV не дает слишком высокого поднятия относительно бустов.
💥Поддержите нас - подписывайтесь на канал !
🔥Если вы хотите нас поддержать вы можете сделать небольшой вклад на нашей страничке boosty: https://boosty.to/denoise_lab
Мы в Телеграмм: https://t.me/DenoiseLAB
Мы на Profi.ru: https://profi.ru/profile/MironovVO8/
Мы на Repetitor.ru: https://v3.repetitors.info/repetitor/p/MironovVO8/
Мы на YandexDzen: https://dzen.ru/vishmat?lang=ru
Мы на YouDO: https://youdo.com/u9455664
Мы на HabrFreelance: https://freelance.habr.com/freelancers/MLab
Наш второй канал по математике: https://dzen.ru/vishmat