690 читали · 5 лет назад
Продолжение темы о пользе Википедии и WordNet в изучении семантических сходств
Методы на базе WordNet Одной из самых важных и популярных баз знаний является WordNet. Моя статья иллюстрирует некоторые из наиболее известных методов, основанных на WordNet, которые позволяют нам вычислить сходство между словами: 1) Измерение длины пути: Этот алгоритм основан на предположении, что чем короче путь между двумя словами, тем ближе они находятся между ними. 2) Leacock-Chodorow Measure: Этот метод является продолжением метода PathLength, который масштабирует длину пути по глубине иерархии, определяемой как длина самого длинного пути от узла листа до корня иерархии...
148 читали · 1 год назад
Американская лингвистическая школа
У истоков этой школы находятся Э. Сепир и Л. Блумфилд. Л. Блумфилд изучал индейские языки и в процессе своей работы пришел к выводу о необходимости создания новых методов анализа языков, в том числе и тех, которые являются бесписьменными, не имеют ни грамматик, ни словарей. При исследовании данных языков, когда лингвисту практически ничего о них не известно, ему остается опираться только на формальный критерий сочетаемости единиц, то есть на то место, которое единицы занимают в ряду других. Этот критерий получил название дистрибуция...