Найти в Дзене
Продолжение темы о пользе Википедии и WordNet в изучении семантических сходств
Методы на базе WordNet Одной из самых важных и популярных баз знаний является WordNet. Моя статья иллюстрирует некоторые из наиболее известных методов, основанных на WordNet, которые позволяют нам вычислить сходство между словами: 1) Измерение длины пути: Этот алгоритм основан на предположении, что чем короче путь между двумя словами, тем ближе они находятся между ними. 2) Leacock-Chodorow Measure: Этот метод является продолжением метода PathLength, который масштабирует длину пути по глубине иерархии, определяемой как длина самого длинного пути от узла листа до корня иерархии...
690 читали · 6 лет назад
WordNet и Wikipedia. Как они помогают в разборе языка?
Приветствую на моем канале! В этой статье я расскажу Вам о методах определения семантики в словах. Имеют ли слова какие-либо общие значения? Сходство слов Общепризнано, что существует по крайней мере два вида методов определения того, имеют ли два слова какое-либо общее значение. Первое представляет собой основанные на знаниях методы словосочетания, основанные на структурированных ресурсах, таких как: Базы знаний очень полезны, поскольку они представляют собой хорошо структурированный и релевантный источник информации о словах и значениях...
711 читали · 6 лет назад
Вычислительные модели для семантического текстового сходства (STS, Semantic Textual Similarity)
Устное общение с машинами является одной из главных целей с момента рождения вычислительной техники. В 1968 году Артур Кларк освободил половину воображения на планете благодаря своему роману "2001: Космическая одиссея", который Стэнли Кубрик с большим успехом снял на большом экране. Вычислительная техника едва сделала первые шаги (первый микропроцессор еще не был разработан), но идея искусственного интеллекта, подобного HAL 9000, уже соблазнила поколение, которое даже не коснулось персонального компьютера...
701 читали · 6 лет назад