6 месяцев назад
Когда косинусное сходство играет злую шутку: почему не стоит слепо доверять «магической» метрике
Многие дата-саентисты (data scientists) привыкли рассматривать косинусное сходство (cosine similarity) как универсальную «волшебную палочку» для сравнения векторных представлений. Мол, берём два вектора, вычисляем косинус угла между ними и получаем простое число от –1 до 1. И будто бы чем ближе к 1, тем сильнее сходство. Но, как в античном мифе о царе Мидасе, который превратил всё вокруг в золото (даже то, что не стоило превращать), слепое применение косинусного сходства порой ведёт к неожиданно плачевным результатам...
06:44
1,0×
00:00/06:44
481,2 тыс смотрели · 4 года назад
629 читали · 5 лет назад
Создаем чат-бот в Python с помощью nltk
Источник: Nuances of Programming Чат-бот — это искусственный интеллект, который может имитировать разговор с пользователем на естественном языке через мессенджеры, веб-сайты, мобильные приложения, телефон и т.д. Чат-боты можно использовать в различных отраслях и для разных задач. Мы напишем простой чат-бот, используя библиотеку nltk (набор инструментов обработки естественного языка, Natural Language Toolkit). Это ведущая платформа создания программ на Python для работы с данными на “человеческом” языке...