1733 читали · 5 лет назад
Введение в NLTK для NLP с Python
NLTK (natural language Toolkit) - это стандартный API для NLP (обработки естественного языка) с Python. Это действительно мощный инструмент для предварительной обработки текстовых данных для дальнейшего анализа, например, с моделями машинного обучения...
NLP: как научить компьютер понимать текст
Всем привет! Я — практикующий исследователь данных, и на этом канале делюсь тем, что реально работает в IT. Никакой сухой теории, только личный опыт, рабочие инструменты и грабли, на которые я уже наступил за вас. Рад, что вы здесь! Обработка естественного языка (NLP, Natural Language Processing) — это когда ты учишь компьютер понимать текст, как человек: анализировать обращения, распознавать документы, чатиться с ботами. Он не обязателен для аналитика данных, это скорее крутой хард-скилл, особенно если метишь в дата-сайнс...
Как запустить локально LLM?
Как только я решил свои мысли записывать на какой-то внешний носитель, так я сразу начал осознавать проблему поиска в этих записях. Для дальнейшей работы нам необходимо дать несколько определений: Некоторые особенности семантического поиска: Эмбеддинги (embeddings) — это численные представления текста или слов в виде векторов, которые отражают их семантическое значение. В контексте семантического поиска, эмбеддинги используются для преобразования текста запроса и документов в числовой формат, который можно анализировать на наличие схожести по смыслу...