💪Опять залетел таск на слова на этот раз больше с упором на токенизацию, пришлось в спешном порядке посмотреть что такое texthero (https://texthero.org/docs/getting-started), я мало работал с текстами в основном изображение, ну ничего продолжаем тестить. 🔥Пришлось почитать всю историю с NLTK (https://www.nltk.org/data.html). Училась эта история долго на векторах, да и скор показала на великий, но главное что она заработала и хорошо. Можно это было конечно на руберте все пересобрать, но задача оот заказчика была именно такая, так что, уж как есть. В любом случае отличный опыт. Как оказалось GridSearchCV не дает слишком высокого поднятия относительно бустов. 💥Поддержите нас - подписывайтесь на канал ! 🔥Если вы хотите нас поддержать вы можете сделать небольшой вклад на нашей страничке boosty: https://boosty.to/denoise_lab Мы в Телеграмм: https://t.me/DenoiseLAB Мы на Profi.ru: https://profi.ru/profile/MironovVO8/ Мы на Repetitor.ru: https://v3.repetitors.info/repetitor/p/MironovVO8/ М
Соображения по работе с текстами. Не так все просто как казалось
26 января 202326 янв 2023
~1 мин