Найти в Дзене

Как ученые докапываются до смысла? Формальная семантика, тезаурус, структурализм.

Оглавление

Формальная семантика и семантические особенности.

Формальная семантика - это как "ученый-детектив", который разбирает предложения по частям и пытается выяснить их истинное значение и квантификацировать. Что? что? Не переживай, сейчас объясню.

лат. quantum — сколько
"Квантификация (осколькивание, прикольное слово я придумал?)" значит "перевести с языка качеств на язык чисел". Представьте, что вы пытаетесь объяснить другу, насколько крут ваш новый телефон.
"Он просто потрясающий! У него камера супер, звук просто бомба, и работает шустро!"
Это качественное описание. А теперь попробуйте "Он набрал 9 баллов из 10 за камеру, 8 за звук и 10 за скорость работы!"

Она использует математическую логику и умозаключений, чтобы перевести слова в формулы, с которыми можно оперировать и делать выводы.

Все политики врут, и все лгуны мошенничают с налогами ->
если кто-то платит налоги, он не является политиком.

Градуируемые характеристики, как "насколько Х" или "насколько У", - это уже более "гибкий" подход.

от лат. gradatio «повышение, возрастание»
"Градуированный" - это действительно "пошаговый", "ступенчатый". Как будто мы поднимаемся по лестнице, каждый шаг - это новая степень, ступень (gradus).
А "градус" - это мера степени, как на термометре. 🤔
И все это от слова *ghredh- "идти" - интересно, да? Русское слово "грядущий" тоже того же корня 🚶‍♂️

Он позволяет нам классифицировать вещи по степени признака. Именно так мы и описываем мир: "Этот лев более свирепый, чем тот тигр", или "А слон гораздо крупнее (У), чем эта кошка, но не такой свирепый (Х)".

На более системном уровне слова могут быть описаны посредством бинарных связей "атомных" семантических черт.

Происходит от лат. binarius «двоичный», далее из bini «по два; парой», далее из bis «дважды; вдвойне», далее из стар. dvis; из праиндоевр. *duwo «два».
"Бинарный" (двоичный) - действительно от слова bini "по два; парой". Как будто мы что-то делаем два раза, или у нас есть две части.
И в семантике "бинарные связи" действительно похожи на это: "да" или "нет", "плюс" или "минус".
Это как бы два варианта, между которыми мы выбираем.

Например, "собака" - это "живой (+)". А "камень" - "неживой (-)".

Таким образом, мы можем создать "профиль" для каждого слова. Например, "собака" может быть описана как:

* Живая (+)

* Домашняя (+)

* Лающая (с голосом) (+)

А "рыба" - как:

* Живая (+)

* Дикая (-)

* Молчащая (-)

Семантика структуралистов

Структурализм - это как бы "карта дорог" языка.

Происходит от лат. structura «строение», "постройка", что-то созданное из частей. И структурализм - это именно про то, как язык "построен" из частей: слов, фраз, предложений.
А "struere" - это "накладывать, класть друг на друга", как кирпичи в стене. И действительно, смысл предложений как бы "строится" из смысла слов.
И все это от *stere "распространять", "простирать"! Как будто язык - это не просто набор слов, а "ткань", которая распространяется и охватывает весь мир и все наши мысли. 🌌

Он не изучает отдельные слова, а смотрит на язык как на систему взаимосвязей. И каждое слово занимает свое место в этой системе.

Принцип композициональности - это основа структурализма.

от лат. compositio = "cum" (с) + "ponere" ("класть", "ставить") = «сочинение; составление; связывание; примирение».
"Композициональность" - это действительно "складывание" смысла. Мы кладем слова друг на друга, как кирпичи, и "строим" смысл.

В общем, принцип композициональности - это очень важный принцип языка. Он говорит, что смысл предложения создается из смысла его частей. Мы берем кирпичики смысла и строим из них здание.

Попробуйте уяснить разницу между английскими фразами "paint a red house" и "paint a house red". Это отличный пример того, как синтаксис влияет на смысл. В первом случае (покрась красный дом), а во втором (дом уже красный - он станет красным после покраски. Получается что red - часть именного сочетания (red house), а в "paint a house red" - независимый член предложения (paint - house - red).

Сходным образом в романских языках ведет себя прилагательное. Например, в португальском очень важнен порядок слов. "Um cargo pesado" - это "тяжелый груз", а "um pesado cargo" - это "тяжкая обязанность".

Структурализм - это очень важный подход к языку. Он позволяет нам понять, как язык работает на глубинном уровне, как слова взаимодействуют друг с другом и создают смысл.

Семантическая классификация

Представь, что ты заходишь в огромный книжный магазин. Как найти нужную книгу? Правильно! Сначала нужно понять, к какому жанру она относится.

Одной из таких классификаций является тезаурус, другой - цифровой тематический указатель (каталог) в библиотеке.

Тезаурус - это как такая огромная картотека, где слова объединены по смыслу.

от греч. θησαυρός «сокровище»

Например, слово "кошка" будет находиться в разделе "животные", а "автомобиль" - в разделе "транспорт".

Цифровой тематический указатель помогает найти нужные книги на нужную тему.

WordNet и онтологии - это как такие супер-современные тезаурусы, с кучей дополнительных функций.

"Онтос" ὄν (ὄντος) - это по-гречески "сущее", т.е. всё, что есть в мире.
"Логос" - это слово, речь, разум, учение. От этого корня берет начало латинское *leg- «собирать, подбирать, говорить, тщательно выбирая слова», отсюда же интеллект (inter- «между» + legere «собирать, читать»).
Вместе эти два слова означают "учение о сущем", т.е. о том, что есть в мире, как оно устроено и как мы можем о нём говорить. "Онтология знаний" - это учение о том, как мы знаем о мире, как мы получаем знания и как мы их систематизируем.
Короче, онтология - это как карта мира, на которой показано всё, что существует, и как всё это связано друг с другом.
P.S. А то, что слово "логос" происходит от "собирать слова, тщательно выбирая" - это очень важно, потому что онтология - это не просто перечисление всего существующего, но и попытка дать им определения, классифицировать их и построить между ними смысловые связи.

Он создавался на основе трех гипотез (предположений):

* Гипотеза отделимости: Лексика языка - это как отдельный конструктор, который можно разобрать и изучить по частям. Мы можем изучать слова как кирпичики, не обращая внимания на то, как они складываются в предложения.

* Гипотеза "образца": В языке есть определенные правила, по которым строятся слова. Существительные обычно имеют окончание "-а" или "-е". Глаголы имеют окончания "-ет", "-ешь" и т.д.

* Гипотеза о покрытии: Чтобы создать по-настоящему умный компьютерный словарь, нужно включить в него максимально много слов. Чем больше слов в словаре, тем больше текстов он может обработать.

WordNet и онтологии не только группируют слова по смыслу, но и показывают, как слова связаны между собой:

Добавьте описание
Добавьте описание

Язык - это как дикий кот, который гуляет сам по себе! Он не всегда подчиняется правилам и логике, особенно когда дело касается межъязыковых сравнений.

Вот почему ты не можешь просто взять биологическую классификацию и переложить ее на язык:

Дельфин - это млекопитающее, но в языке его часто сравнивают с рыбой. Это потому, что дельфин живет в воде, плавает и имеет обтекаемую форму тела.

Картошка в английском - это овощ, а в немецком и датском Kartoffeln/kartofler - нет.