Классификация – логический прием, позволяющий:
- структурировать данные, акцентировав внимание на тех или иных свойствах совокупности объектов;
- упростить процесс анализа, оперируя ограниченным числом выделенных ключевых позиций.
Классификация может быть естественной (объективно существующей) и искусственной (формируемой субъектом принятия решений).
К естественным классификациям относятся царства живых организмов (растений, животных, грибов); классификация растений и животных на виды, подвиды, семейства; классификация химические элементы по различным свойствам в зависимости от заряда их атомного ядра и т.д. Такие классификации существуют вне зависимости от нашего сознания. Просто мы о них знаем или не знаем.
К искусственным классификациям относятся: деление населения на классы «бедных» и «небедных», возрастные классификации, отнесение стран мира к государствам-лидерам и развивающимся государствам, деление учащихся на «отличников», «хорошистов», «успевающих» и «неуспевающих» и т.д. Эта классификация зависит от субъективного мнения исследователя, лица, принимающего решения.
В некоторых случаях просматриваются признаки обоих типов классификации. Например, классификация регионов страны на дотационные регионы и на доноров. Если исходить из позиции «доноры – это регионы, способные вести самостоятельную социально-экономическую политику и поставлять в Центр ресурсы для обеспечения федеральных нужд и поддержки других регионов», то здесь присутствуют все признаки естественной классификации. Однако, если исходить из положения «доноры – регионы, которые платят, а дотационные регионы – которые получают субсидии от Центра», то мы скатываемся к искусственной классификации. Некоторые регионы будут сознательно занижать свои возможности, перераспределяя ресурсы внутри региона (иногда криминально), и получая дотации от Центра (незаслуженно).
Вопросы классификации в математике исследуются в различных теориях: теория систем, теория распознавания образов (иначе, классов), теория игр и др. Рассмотрению сущности этих направлений исследований мы посвятим отдельные странички, а сегодня хотелось поговорить о некоторых парадоксах классификации, подогревающих данные исследования.
1. Феномен Уилла Роджерса оперирует математическим понятием среднего значения, определённым как среднее арифметическое или медиана (неважно). Он фиксирует парадоксальный результат: например, возможно переместить статью из Википедии в Викицитатник так, чтобы средняя длина статьи увеличилась на обоих сайтах! Феномен Уилла Роджерса – кажущийся парадокс, заключающийся в том, что перемещение (численного) элемента из одного множества (класса) в другое может увеличить среднее значение обоих множеств.
Название парадокса основывается на цитате, приписываемой американскому комику Уиллу Роджерсу: «Когда Оки покинули Оклахому и переехали в Калифорнию, то повысили средний интеллект обоих штатов». Как это может быть? Рассмотрим на примерах.
Пример 1. Пусть население некоторого «государства», состоящего из 10 человек имеет соответственно богатства (доход) распределенные между его членами следующим образом: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. Если черта бедности правителем проведена на уровне 3,5 единиц богатства, то для бедных граждан (первые три, для которых доход менее 3,5) средний уровень дохода будет равен 2 ед., а для «небедных» соответственно 7. Перенесем черту бедности в точку 4,5 (то есть переместим гражданина с доходом 4 ед. из класса «небедных» в класс «бедных»). Получим среднее для бедных равное 2,5 (средний уровень бедных значительно, на 25%, поднялся), среднее для остальных жителей также увеличилось до 7,5.
Если брать в качестве среднего значения среднегеометрическое. В случае первой классификации соответственно имеем: 1,817 и 6,698, а во втором случае: 2,21 и 7,299. Эффект сохраняется.
Для увеличения средних значений в классах, перемещаемый элемент не обязательно должен быть минимальным во втором множестве (и стать максимальным в первом).
Пример 2. Пусть имеем два множества:
A = {1, 3, 5, 7, 9, 11, 13} и B = {6, 8, 10, 12, 14, 16, 18}.
Перемещении числа 10 из B в A поднимает среднее арифметическое элементов множества A с 7 до 7,375, а множества B с 12 до 12,333. Эффект имеет место, хотя он теперь и не столь выразителен.
Увеличение происходит при выполнении трех условий:
1. Среднее значение множества, в которое перемещают, меньше чем у того, из которого перемещают.
2. Перемещаемый элемент меньше среднего значения элементов своего множества. Таким образом, его удаление увеличит это значение.
3. Перемещаемый элемент больше среднего значения множества, в которое его перемещают. Отсюда следует, что его добавление повысит это значение.
Парадокс является кажущимся, потому что многие люди удивлены тем, что такое может происходить. Знакомство с этими примерами должно сделать явление очевидным.
Как использовать рассмотренные эффекты на практике. Вот два шутливых (или нет – серьезных) предложения новому «правителю» некоторого государства:
- При вступлении в должность принять новое положение о бедности, переместив планку бедности вверх (при этом получить бонусы от населения – ведь за людей старается), а в конце отсчетного срока посчитать доходы граждан по новой схеме и сравнить их с начальными. Успех будет обеспечен.
- Перестроить административное деление «владений», переместив некоторые территории более сильного района в слабый район. Эффект тот же.
Вот еще перечень важных задач классификации:
- Классификация регионов по некоторым показателям развития (доход на душу населения, безработица, образовательный уровень, возрастной ценз и др.).
- Классификация вузов страны, хозяйствующих субъектов на типы: эффективные, конкурентоспособные, неэффективные.
- Классификация сотрудников предприятий и учреждений и т.д.
- Возрастные классификации населения: молодые – немолодые (важно для призыва в армию, получения образования), работающие – пенсионеры (больная тема российской действительности) и т.д.
2. Парадокс кучи. Рассматриваются два множества элементов: являющихся «кучей» и не являющихся таковой. Очевидно, что если из множества элементов (зерен, песчинок и т.д.), составляющих кучу убрать один элемент, то куча не исчезнет. Но, если этот процесс продолжать достаточно длительное время, то, в конце концов, куча исчезнет!
Парадокс основан на применении хорошо зарекомендовавшего себя метода математической индукции. Вот его формулировка:
Утверждение P(n) (где n - натуральное число) справедливо при ∀n∈N (читается: при любом n, принадлежащем множеству натуральных чисел N), если:
- Утверждение P(n) справедливо при n=1.
- Для ∀k∈N из справедливости P(k) следует справедливость P(k+1).
Доказательство с помощью метода математической индукции проводится в два этапа:
1. Проверяется истинность утверждения при n=1 или любом другом подходящем значении n (например, n=3 при исследовании свойств многоугольников).
2. Считая, что справедливо утверждение P(k) при n=k, проверяется истинность утверждения P(k+1) при n=k+1.
С помощью этого метода легко доказываются многие математические утверждения. Например:
- Доказать, что 4 в степени (2n−1) +1 кратно 5 для всех n≥1.
- Доказать неравенство: 2!⋅4!⋅...⋅(2n)!>[(n+1)!] в степени n, при всех n>2.
- Доказать, что любое натуральное число, отличное от 1, можно представить в виде произведения простых множителей.
Логика применения метода математической индукции в нашем рассматриваемом случае очевидна.
Мы рассмотрели парадокс «кучи» в форме шутки, но за ним стоят более важные народно-хозяйственные, правовые и нравственные вопросы человеческого бытия. Все они связаны с неопределенностями, аналогичными понятию «куча». Например: Когда появляется личность? В какой момент уже есть человек в утробе матери (проблема абортов)? Когда уже нет человека, если в результате болезни или аварии часть органов не функционирует (проблема изъятия органов)?
Очевидно, что решение парадокса «кучи» важная задача, требующая своего исследования и решения в разнообразных практических случаях. Многие вопросы этой проблемы проясняются в теории нечетких множеств. См. странички далее.
3. Парадокс ранжирования.Предположим, что для уточнения свойств некоторого множества, мы будем увеличивать число учитываемых классов. Например, знания учащегося можно оценить по двух бальной шкале: «зачет» и «незачет» (у студентов по некоторым предметам), то есть, вводится всего два оценочных класса. Но можно ввести и более многозначную шкалу оценок. Так, например, в ЕГЭ используется сто балльная система по каждому предмету.
Джордж Ципф в 1949 году впервые показал распределение доходов людей по их размерам: самый богатый человек имеет вдвое больше денег, чем следующий богач, и так далее. Это утверждение оказалось справедливым для ряда стран (Англия, Франция, Дания, Голландия, Финляндия, Германия, США) в период с 1926 по 1936 год [2].
Этот закон также работает в отношении распределения городской системы: город с самым большим населением в любой стране в два раза больше, чем следующий по размеру город, и так далее [1]. Если расположить все города некоторой страны в списке в порядке убывания численности населения, то каждому городу можно приписать некоторый ранг, то есть номер, который он получает в данном списке. При этом численность населения и ранг подчиняются простой закономерности, выражаемой формулой:
Pn= А/n, (1)
где Рn – население города n-го ранга; А – население главного города страны (1-го ранга). Эмпирические исследования подтверждают данное утверждение.
Лингвист по образованию Д. Ципф обратил также внимание на слова, которые люди используют в речи. При оценке слов Д. Ципф отметил следующую закономерность:
fr = c. (2)
В (2) f –частота встречаемости слова в тексте, r – его ранг, c – некоторая константа. Сходность соотношений (1) и (2) очевидна (f = c/r). Слова первого ранга в два раза популярнее, чем слова второго и в три раза популярнее, чем слова третьего ранга. Использование закона Ципфа помогает в оптимизации текстов под поисковых роботов.
Легко проверить, что распределения типа (1) не имеют среднего значения: ∑ Pn = ∞ при n → ∞. То есть, для этих явлений не применим аппарат исследования, основанный на положениях теории вероятностей и математической статистики
Закон Ципфа открывает вход в замечательный мир ценозов – сложного явления, характеризующего целостность и стадию развития сложных природных образований: биологических, социально-экономических, экологических, технико-технологических. Этому явлению мы посвятим другие страницы нашего канала.
Литература:
1. Занадворов В.С., Занадворова А.В. Экономика города: вводный курс. ISBN 5-94628-099-6. Академкнига (2003).