Большинство научных работ в области компьютерного детектирования юмора черпают вдохновение в теории несоответствий. Несоответствие является незаменимой граней между юмористическими и неюмористическими событиями, но оно крайне недостаточно для пролития света на то, что на самом деле сделало конкретное происшествие забавным.
Классические теории, такие как семантическая теория юмора на основе сценария и общая словесная теория юмора, стараются достичь этого успеха в достаточной степени. В данной работе ученые придерживаются более целостного подхода к классификации юмора, основанного на этих классических теориях, с некоторыми улучшениями и изменениями. Благодаря экспериментам, основанным на линейном подходе и выполненным на больших массивах данных шуток, можно продемонстрировать адаптивность и компонентность модели, а также множество методов классификации, которые могут быть использованы для решения сложной проблемы разграничения различных категорий и подкатегорий шуток.
Юмор - это склонность отдельных познавательных переживаний провоцировать смех и развлекать, это неотъемлемый элемент любого устного общения. Системы естественного языка должны быть в состоянии справляться с юмором, так как это улучшит удобство пользования и взаимодействие человека и компьютера. Юмор изучался в течение ряда лет в компьютерной лингвистике как с точки зрения генерации юмора, так и детектирования, но такой работы по созданию классификации юмора не проводилось. Обнаружение юмора рассматривается как проблема классификации.
Классификация юмора - это очень сложная задача, потому что даже теоретически среди теоретиков нет единого мнения о том, что такое юмор? Даже если бы существовала конкретная теория о том, что такое юмор, чувство юмора варьируется от человека к человеку, и поэтому давать его в разных категориях еще сложнее. Консенсус в отношении категоризации юмора еще предстоит достичь. Для достижения этого сложного классификационного подвига мы пытаемся ответить на самый главный вопрос: Почему мы смеемся над шуткой? Какие факторы нас мотивируют. Это самое новое, чего пока пытаемся достичь только мы. Прежде всего, возможные виды юмора могут быть практически бесконечными.
Некоторые исследователи сводят юмор только к одному или нескольким типам, например, несоответствию. Поскольку существует бесконечное множество возможных типов, то по-прежнему отсутствует какая-либо общепринятая классификация юмора, поэтому его можно классифицировать в соответствии с различными целями. Эти классификации часто могут пересекаться. Например, шутка: Чистый стол - признак загроможденного ящика стола, который можно назвать саркастической шуткой, а также игрой слов/пистолетом (антонимы).
Формируется проблема определения различных типов юмора как традиционную задачу классификации, снабжая классификатор положительными и отрицательными наборами данных. Набор данных состоит из одной линейки шуток различного типа, собранных с различных сайтов шуток, множества субредитов и множества ручек щебетания.
Юмористические исследования представляют интерес не только для лингвистики и литературы, но и для неврологии и эволюционной психологии. Юмористические исследования проводились для понимания психологического и физиологического воздействия, как положительного, так и отрицательного, на человека или группы людей. Исследования юмора выявили множество различных теорий юмора и различных видов юмора, включая их функции и влияние на личность, взаимоотношения и общество.
Исторически юмор был синонимом смеха, но основные эмпирические данные указывают на то, что смех и юмор не всегда ассоциируются один на один. В то же время хорошо известно, что, даже если юмор не имеет прямой связи со смехом, он, безусловно, вызывает определенные эмоции в качестве реакции на то, что считается юмористическим. На протяжении веков существовало множество теорий юмора, которые пытались объяснить, что такое юмор, какие социальные функции он выполняет, и что можно считать юмором. Хотя среди трех основных конкурирующих теорий юмора теория несоответствия более широко распространена по сравнению с рельефными1 и превосходящими2 теориями, она необходима, но недостаточна для определения объема того, что составляет юмор.
Предлагаемые рамки
Оппозиция сценариев как единственная производная основа, лежащая в основе юмористического события, оказывается пагубной в способности SSTH и GVTH адаптироваться к различного рода несоответствиям. Кроме того, из-за неспособности GVTH учитывать эмоции на любом уровне, неопределенность в отношении Логического Механизма с его действительно расплывчатой идентичностью и порядка использования ресурсов знаний побуждает нас отклоняться от SSTH и GVTH как основы для нашей вычислительной системы. Скорее, для того, чтобы устранить эти недостатки, мы сохранили структуру нашей теории в гораздо большей степени ориентированной на последствия.
Подход, основанный исключительно на существующих типах юмора, будет подвержен изменениям и модификациям с добавлением каждого нового типа юмора и добавит ограничения модели либо слишком жесткости, что может привести к переоснащению при проведении вычислительного анализа, либо привести к неустойчивости модели, поскольку она не может поддерживать новые типы после все новых и новых изменений. Предпочтительно, чтобы мы действовали с осторожностью, принимая во внимание масштабы этой проблемы, опираясь на успехи предыдущих теорий, таких как SSTH и GVTH, с более целостным подходом.
С самого начала Аттардо и Раскин имели свои особенности, направленные на распознавание отличительных параметров сходства между шутками. Аналогичным образом распознаются три основные отличительные особенности, которые отражаются во всех типах шуток, а именно
- Mode (Modus Operandi): Каждая шутка, вербальная, текстовая или графическая, имеет свойство донести ее до соответствующей аудитории. Такой способ подачи анекдота может быть (но не всегда) определен исполнителем юмористического акта. Режим может зависеть от осознанного выбора или спонтанной кульминации диалога. Различные ситуации могут потребовать различных способов исполнения, что приведет к различным последствиям после того, как будет разрешен юмор, стоящий за шуткой.
Две уникальные подкатегории, которые могут быть рассмотрены здесь и которые в противном случае могли бы вызвать проблемы в SSTH и GVTH, в связи с их структурой логического механизма - AntiHumour и Nonequitur. Обе эти формы являются нетрадиционными формами юмора и бросают серьезный вызов подобным теориям. NonSequitur трудно приспособиться даже для GVTH из-за его опоры на логические механизмы.
- Каждая шутка посредством использования языка и предмета передает чувство или эмоции вместе с ним. Это может само по себе подстегнуть новую нить для шутки, а также послужить убедительным ощущением того, что мы ладим с юмористическим эффектом.
- Большинство анекдотов содержат центральный элемент, который можно рассматривать как опора шутки. Этот элемент является ключевой концепцией, на которой строится шутка. Одна шутка может, без таких ограничений по определению, иметь несколько тем в одно и то же время.
Проверяя вышеупомянутые категории, можно четко заметить, что в отличие от GVTH, придание этим показателям иерархической структуры является неприемлемым. Это работает в нашу пользу, поскольку мы избавляемся от установления проблемных зависимостей, таких как онтологическое превосходство для каждой категории. Вместо этого предлагается более плоский подход, при котором шутка может быть выведена из различных комбинаций из каждой категории и относится к нескольким подкатегориям одновременно.
Будущая работа
Учитывая ограничения сферы охвата работы, а также исследования, ученые попытались ассимилировать как можно больше подкатегорий, чтобы включить их в качестве части нашей вычислительной структуры, но в то же время также делается амбициозное, но скромное предположение, что все еще возможно добавить еще несколько подкатегорий. Поскольку модель достаточно универсальна, чтобы легко справляться с добавлением таких подкатегорий, единственное препятствие будет заключаться в практической осуществимости усилий и доступности вычислительных инструментов для их интеграции.
С добавлением все большего количества разнообразных данных модель также может стать более надежной и точной. В будущем рамки также могут быть расширены, чтобы проводить различие между юмористическими и неюмористическими событиями, что позволит использовать полный набор инструментов для различных типов данных, таких как сценарии фильмов или телепередач, для выявления проявлений различных видов юмора и, следовательно, для создания более целостной классификации этих средств информации.