Найти в Дзене

Polarity в Машинном обучении простыми словами

Фото: Kurt Cotoaga / Unsplash
Фото: Kurt Cotoaga / Unsplash

Полярность – характеристика текстового Признака (Feature) Датасета (Dataset), описывающая эмоциональную окраску (отрицательная или положительная). К примеру, мы располагаем датасетом комментариев YouTube и хотим оценить, понравилось ли в целом пользователям видео или нет. Для этого каждому комментарию присваивается оценка в диапазоне [-1, 1], где '-1' соответствует отрицательной окраске текста, и в конечном итоге рассчитывается среднее значение полярности – некая итоговая оценка зрителей.

Полярность: textblob

Посмотрим, как работает автоматическая разметка текста в textblob. Для начала импортируем необходимые библиотеки:

!pip install textblob

import pandas as pd

from textblob import TextBlob

Теперь мы можем оценивать эмоциональную окраску любого комментария с помощью sentiment.polarity:

print(TextBlob('It\'s more accurate to call it the M+ (1000) be..').sentiment.polarity)

print(TextBlob('Power is the disease. Care is the cure. Keep..').sentiment.polarity)

Первый комментарий система оценила как в целом положительный, второй – как нейтральный:

>>>

0.45000000000000007

0.0

Ноутбук, не требующий дополнительной настройки на момент написания статьи, можно скачать здесь.

Автор оригинальной статьи: Breyanne Broughton