Текст/составление текста/словарная работа
Настоящий Сибирский словарь
Как пришла идея составить словарь? Часто в разговорах мы замечаем, что один и тот же предмет, действие или явление в разных регионах России называют по-разному. Многие удивляются привычным нам словам, а мы, наоборот, не можем понять, о чем говорят люди из других регионов. Так родилась идея составить сибирский «словарь» с русского — на русский. Как проходила работа, кто этим занимался, как собирались слова?
Все началось с того, что мы собрали слова, о которых мы знали — колба, виктория, мультифора, темнушка, кислица, башлык, побирушка, маечка...
Bag of Words в Машинном обучении простыми словами
Мешок слов (BoW) – это способ представления текстовых данных при моделировании в Машинном обучении (ML). Модель набора слов проста для понимания и реализации и зарекомендовала себя с большим успехом в таких задачах, как Языковое моделирование (Language Modeling) и Классификация документов (Document Classification). Проблема с текстом Проблема с моделированием текста заключается в том, что он беспорядочный, а большинство Алгоритмов (Algorithm) машинного обучения предпочитают входные и выходные данные фиксированной длины...