1 год назад
Пошаговое руководство по NLP: конструирование признаков текстовых данных
Источник: Nuances of Programming Курс SkillFactory Python для анализа данных. Вы научитесь за минуты обрабатывать большие файлы и создавать отчеты, автоматизируете сбор данных из интернета, освоите парсинг и работу с API. “Хорошие функции не рождаются, их разрабатывают” (технический директор Kaggle и специалист по анализу данных Бен Хамнер). Конструирование признаков (feature engineering)  —  процесс выбора и создания наиболее релевантных и полезных признаков для ввода в модель машинного обучения...
Feature в Машинном обучении простыми словами
Признак (переменная, фича, атрибут, столбец, функция, фактор) – это объективная характеристика, характерная черта или свойство, которое может быть определено или измерено. Представьте, что Вы имеете дело с таблицей, состоящей из столбцов, рядов и ячеек: это данные о классификация еще не родившихся детей со здоровым и больным сердцем на основании данных УЗИ. Столбец C – индикатор наличия болезни, где ноль означает, что плод здоров. Статистика С точки зрения Статистики (Statistics) , мы рассматриваем...