Найти тему

Идентификация Шпилькина Гауссом. Рецензия «математики выборов».

«Послушай, Зин, не трогай Гаусса…»

Из неопубликованного.

«За что же Карла Фридрих Гаусса?

Ведь он ни в чем не виноват…»

Из опубликованного

Оглавление.

Введение

1. Идентификация Гаусса.

1.1. Представление результатов.

1.2. Критерий корректности выборов.

1.3. Обоснование критерия корректности.

2. Идентификация Шпилькина.

2.1. Терминология. Case with Красная шапочка.

2.2. Модели выборов: модель А и модель Б. Критерий автора не работает (пример).

2.3. Решение общей задачи выбора критерия корректности – не мы первые.

Выводы.

Приложение 1

Приложение 2

Литература.

Введение.

Результаты выборов в РФ (а теперь и на Украине) широко обсуждаются политизированной российской публикой.

Вопрос вопросов таких обсуждений: были ли нарушения избирательного законодательства? Были ли вбросы, «карусели», переписывание протоколов голосования в участковых, территориальных и центральной избирательных комиссиях (далее – УИК, ТИК,ЦИК) и тому подобное?

95% этих обсуждений и суждений имеют степень компетенции - «я так думаю, что …».

5% суждений и выводов основываются на you_tube роликах, заявлениях членов УИК, ТИК, ЦИК и наблюдателей о нарушениях/ отсутствии нарушений с минимальными последствиями для всех фигурантов роликов и заявлений.

В этом мелкотравчатом ряду/ лесу особняком можно сказать, могучим дубом и баобабом стоят исследования, о которых известно не только широкой обеспокоенной общественности, не только главам ЦИК и Администрации президента РФ, но и, страшно подумать, самому В.В.Путину! См.Приложение 1,2.

О сути и выводах исследований, а также об их авторе, Новая газета писала в 2016 году::

«Вбросы и «карусели» на выборах можно доказать математически — впервые об этом рассказал физик Сергей Шпилькин в 2011 году. Тогда далекие от математики граждане впервые узнали о «кривой Гаусса» — графике, который показывает нормальное распределение вероятностей, в данном случае — распределение явки по избирательным участкам» [1].

Широкая известность плюс заявленная научность исследований Сергея Шпилькина (далее – автор) – это тот случай, когда имеет смысл разобраться в методах, терминологии и выводах автора.

Нижеприведенный текст является рецензией трудов автора, посвященных математической обработке результатов выборов (так называемой «математики выборов») различного уровня в РФ и на Украине.

1. Идентификация Гаусса.

Есть резоны познакомиться с главными персонажами / фигурантами / действующими лицами выборных и после выборных actions (естественно, в рамках заявленной рецензентом темы).

Рис. 1а. Карл Фридрих Гаусс, выдающийся немецкий математик, «король математиков» (1777-1855). Обосновал т.н. закон Гаусса, современное название – нормальное распределение (К.Пирсона). Изображение на монете ФРГ к 200-летию со дня рождения К.Гаусса.
Рис. 1а. Карл Фридрих Гаусс, выдающийся немецкий математик, «король математиков» (1777-1855). Обосновал т.н. закон Гаусса, современное название – нормальное распределение (К.Пирсона). Изображение на монете ФРГ к 200-летию со дня рождения К.Гаусса.
Рис. 2b. Нормальное распределение плотности вероятности случайной величины. Изображение графика нормального распределения на монете ГДР к 200-летию со дня рождения К.Гаусса.
Рис. 2b. Нормальное распределение плотности вероятности случайной величины. Изображение графика нормального распределения на монете ГДР к 200-летию со дня рождения К.Гаусса.
Рис. 3с. Сергей Шпилькин, физик. Автор электоральных исследований, анализируемых рецензентом.  Лауреат премии «ПолитПросвет».
Рис. 3с. Сергей Шпилькин, физик. Автор электоральных исследований, анализируемых рецензентом. Лауреат премии «ПолитПросвет».
Рис. 4d. Андрей Бундин, который никогда не игнорирует «математические законы – закон Гаусса». О А.Бундине - см. в Приложении 2. Для него, в первую очередь,  и таких же, как он, написана данная  рецензия.
Рис. 4d. Андрей Бундин, который никогда не игнорирует «математические законы – закон Гаусса». О А.Бундине - см. в Приложении 2. Для него, в первую очередь, и таких же, как он, написана данная рецензия.

1. 1. Представление результатов.

Автор представляет результаты электоральных исследований в виде графиков «голоса – явка». См. ниже рис. 1-3.

Построение графиков происходит следующим образом. Ось абсцисс делится в пределах от 0 до 100% (или в долях от единицы; единица соответствует 100%; далее только «проценты») на равные отрезки, начальные и конечные точки которых, соответственно, i и (i + 1),%, где i = 0 … 99, %. Каждому такому отрезку присваивается номер k, k = i / j +1, j = 1,%, k = 1 … 100. Каждому kтому номеру по оси ординат сопоставляется значение Fk – суммарное количество голосов, поданных избирателями за того или иного кандидата на всех избирательных участках с зафиксированной явкой в пределах от i до (i + 1),%, где i = 0 … 99, %

Графики «голоса – явка» рецензент также будет называть «кривыми Гаусса», подобно в [1]. Смысл этого пояснения будет понятен из ниже.

Для дальнейшего анализа из множества подобных выбраны три графика «голоса – явка» , относящихся к выборам:

– президента Украины в 2019 году [2]. См. рис. 1;

– президента РФ в 2018 году [2]. См. рис. 2;

– президента РФ в 2012 году [3]. См. рис. 3.

Рис. 1. График «голоса – явка». Выборы президента Украины 2019 года
Рис. 1. График «голоса – явка». Выборы президента Украины 2019 года
Рис. 2. График «голоса – явка». Выборы президента РФ 2018 года
Рис. 2. График «голоса – явка». Выборы президента РФ 2018 года
Рис. 3. График «голоса – явка». Выборы президента РФ 2012 года
Рис. 3. График «голоса – явка». Выборы президента РФ 2012 года

1.2. Критерий корректности выборов.

Под корректностью выборов понимаем соответствие выборов избирательному законодательству.

Отметим, что автор не использует термин «критерий корректности выборов», но формулирует суть самого критерия.

А именно:

а\. Если график «голоса – явка» представляет собою «кривую Гаусса» – выборы корректны. «В Украине — вполне нормальное распределение по Гауссу» [2]. См. рис. 1.

б\ . Выборы некорректны, если график «голоса – явка» не представляет собой «нормальное распределение по Гауссу», имеет так называемые «хвосты», обозначенные в овалах на рис. 2,3.

«Если вдруг на каких-то участках начнется вброс (избирательных бюллетеней – рецензент), соответственно, появится аномально много участков с большой явкой. Соответственно, у этого симметричного распределения отрастет хвост в сторону больших явок» [3].

«Хвост с зубцами означает две вещи: во-первых, что на высоких явках почему-то один из кандидатов получает значительно больше голосов, чем другие, а остальные остаются при своем, то есть там пропорции между кандидатами остаются постоянными, только один наращивает свою долю» [3].

1.3. Обоснование критерия корректности.

Обоснование следующее:

«Лобков (интервьюер телеканала Дождь – рецензент) : Давайте рассмотрим вашу презентацию и объясним, что такое распределение Гаусса. <…>

Шпилькин : <…> когда на какую-то величину влияет много разных факторов <…> Разных случайных независимых друг от друга факторов: характер населения конкретного дома, набор домов в конкретном участке, погода, лужи, работа ЖЭК и так далее. Когда все эти факторы суммируются в разных направлениях, то величина, которая от таких факторов зависит, как правило, оказывается распределена – то, что называется по распределению Гаусса» [3].

Из сказанного выше следует, что идентифицирующими признаками «Гаусса» (то есть «нормального распределения по Гауссу»), а значит, и корректности выборов, являются :

а\. Наличие суммируемых разнонаправленных факторов: «набор домов, погода, лужи, работа ЖЭК и так далее (?? – рецензент)».

б\. Отсутствие хотя бы одного превалирующего фактора, который приводит «распределение Гаусса» к искажениям на графиках «голоса – явка» в виде появления «хвостов с зубцами» на значениях явки 75 – 100%. При наличии превалирующего фактора - (в этом случае, автор прямо говорит о «вбросах», вследствие которых «появится аномально много участков с большой явкой», у графика «отрастет хвост в сторону больших явок») - критерий, по мнению автора, указывает на некорректность выборов.

Таким образом, автор делает выводы о корректности / некорректности выборов на основе визуального анализа графиков «голоса – явка» на соответствие их «распределению Гаусса».

2. Идентификация Шпилькина.

Рецензентом достаточно подробно рассмотрены метод, его обоснование, терминология и выводы автора.

2.1. Терминология. Case with Красная шапочка.

И все бы хорошо, одно плохо : приводимые автором «кривые Гаусса» не имеют никакого отношения к математической статистике как научной дисциплине, в общем, ни к нормальному распределению (закону Гаусса), в частности.

Формула/ выражение (1)
Формула/ выражение (1)

Выражение (1) есть нормальное распределение плотности вероятности случайной величины Х, которое полностью определяет эту случайную величину. μ, σ – const; х – значения случайной величины Х [4].

В математике никакая другая функция, кроме (1), и соответствующий ей (функции) график, не называется нормальным распределением / распределением Гаусса / гауссовой функцией ошибок / распределением Гаусса – Лапласа / законом Гаусса и так далее.

Важно, что, помимо прочих свойств, нормального распределения, как и любая другая плотность вероятности, имеет размерность обратную размерности случайной величины.

То есть, если x измеряется в [процентах], то размерность f (x) есть [1 / процент], чего нет и в помине на графиках рис. 1-3.

Очевидно, что как приведенная на рис. 1, так и подобные, но не приведенные здесь графики, на которых, по мнению автора, представлены функции нормального распределения, никакого отношения к нормальному распределению не имеют.

По сути, графики автора есть ломанные линии или полилинии как в AutoCADе.

Мало того, и это главное, графики вообще не описывают никакую случайную величину. Явку? Количество голосов? Нет, значения этих величин не известны до оглашения и полностью известны после оглашения результатов выборов. И где здесь «случайность»?

Вдумчивый читатель задает вопросы:

«Зачем автору давать объектам собственного изготовления (объект В) давно устоявшееся название давно известного объекта А, если объект А ≠ объекту В?

Такой терминологический трансвестизм приводит к тяжелым, а иногда и непоправимым последствиям – в памяти народной остался эпос «Красная шапочка» [5], по ходу которого Волк прикидывался / назывался то Бабушкой, то Красной шапочкой, а в результате съел и ту и другую!

Здесь имеем свежий пример: Андрюха Бундин (см. рис. 1d и Приложение 2 ) повелся на «кривую Гаусса» и был «съеден» на наших глазах… и дровосеков с топорами на плечах, увы, пока не видно.»

Ответы на эти вопросы могут быть разными, но все они (ответы) будут для автора плохими в любом смысле этого слова.

Мнение рецензента однозначно : автор недопустимо использует термины статистической математики, подменяя названия, а значит, и содержание / смысл исследуемых величин.

2.2. Модели выборов: модель А и модель Б. Критерий автора не работает (пример).

Любые претензии, типа, «автор не сделал то-то и то-то» находятся за гранью научного обсуждения.

Это с одной, стороны.

С другой стороны, всегда предпочтительнее иметь (а при большом объеме данных по иному просто невозможно) математическое приближение первичных экспериментальных данных в виде формул.

С третьей стороны, рецензенту никто не запрещал сделать то, что не сделал автор.

Поэтому данные рис. 1 (полилиния «Порошенко») были аппроксимированы квазинормальной (экспоненциальной) функцией F1. Ее же, условно, назовем моделью выборов А:

F1(μ, σ, const, x) = σ * const * f (x), где f (x) – нормальное распределение, ф-ла(1), (2)

Аппроксимирующая функция и алгоритм аппроксимации представлены следующими выражениями:

F1*(μ*, σ*, const*, x), (3)

если при значениях μ*, σ*, const* имеет место

D = min abs { Fk F1(μ, σ, const, x=k) } (4)

где Fk, значение, соответствующее k-ой абсциссе (см.раздел 1.1). abs – оператор взятия модуля числа. Минимизация происходила по параметрам μ, σ, const в заданных пределах, а суммирование – по всем k = 35 … 100.

Результаты расчетов приведены на рис. 4 (см.ниже). Погрешность аппроксимации составила 15,4% относительно суммарного значения голосов, поданных за Порошенко.

Тоже самое проделано с данными, представленными на рис. 2 (полилиния «Путин»). Здесь аппроксимирующей функцией взята сумма двух элементарных функций: экспоненциальная и логарифмическая – модель выборов Б:

F2 (μ, σ, const, x=k, a, b, N) = F1(μ, σ, const, x=k) + Y(х=k ,a, b, N ), (5)

где Y = 0 , если ( k <= b ) и Y = a * Ln ( k b ) / Ln ( N b ), если ( k > b ); a и b - параметры.

Минимизация происходила по параметрам μ, σ, const, a, b в соответствие с алгоритмом (4), где вместо функции F1 использовалась функция F2. Результаты аппроксимации приведены на рис. 5,6.

Рис. 4. Аппроксимация данных рис. 1 (красная линия – Порошенко) квазинормальной функцией F1*- синяя линия.  Модель выборов А. Погрешность  D = 15,4%.
Рис. 4. Аппроксимация данных рис. 1 (красная линия – Порошенко) квазинормальной функцией F1*- синяя линия. Модель выборов А. Погрешность D = 15,4%.
Рис. 5. Аппроксимация данных рис. 2 (зеленая линия – Путин) суммой квазинормальной и логарифмической функций.  Модель выборов Б. Погрешность – 8,6%.
Рис. 5. Аппроксимация данных рис. 2 (зеленая линия – Путин) суммой квазинормальной и логарифмической функций. Модель выборов Б. Погрешность – 8,6%.
Рис.6 Аппроксимирующие функции модели выборов Б: квазинормальная (экспоненциальная) и логарифмическая.
Рис.6 Аппроксимирующие функции модели выборов Б: квазинормальная (экспоненциальная) и логарифмическая.

Аналогичные расчеты были проведены рецензентом для кандидатов в президенты РФ, которые названы автором «остальные» (см. рис. 2) и которые получили в сумме 4,82 % голосов избирателей.

Рис. 7. Аппроксимация данных рис. 2 (желтая линия – «остальные») суммой квазинормальной и логарифмической функций.  Модель выборов Б. Погрешность – 15,2%.
Рис. 7. Аппроксимация данных рис. 2 (желтая линия – «остальные») суммой квазинормальной и логарифмической функций. Модель выборов Б. Погрешность – 15,2%.
Рис.8. Аппроксимирующие функции модели выборов Б: квазинормальная (экспоненциальная) и логарифмическая.
Рис.8. Аппроксимирующие функции модели выборов Б: квазинормальная (экспоненциальная) и логарифмическая.

Сравнивая результаты, приведенные на рис. 5 и 7, рецензент сделал вывод : и на том, и на другом рисунке имеется «аномально много участков с большой явкой». А значит, по мнению автора, с необходимостью должны быть «вбросы».

Приведенный пример показывает, что критерий корректности автора не «работает» (см. раздел 1.3.), так как невозможно представить, кто в трезвом уме и твердой памяти стал бы фальсифицировать президентские выборы (ст. 142.1 УК РФ) в пользу явных аутсайдеров. См. рис. 7,8 – «остальные».

Впрочем, для автора остается шанс объяснить, почему, в одном случае (рис. 5), «аномально много участков с большой явкой», а в другом (рис. 7) – нормально «много участков с большой явкой»? Пожелаем автору успехов.

Второй вывод очевиден: эмпирические данные аппроксимируются элементарными функциями с удовлетворительной погрешность. Именно поэтому никаких псевдо - «кривых Гаусса» для интерпретации данных не требуется. Тем более недопустимо использовать термины статистической математики не по их назначению.

2.3. Решение общей задачи выбора критерия корректности – не мы первые.

Рецензент не ставил себе задачу определить причины отличия модели выборов А от модели Б. Вполне возможно, что отличия, согласно автору, кроются в нарушении избирательного законодательства. Но также возможно, что модель Б является следствием мобилизации электората того или иного кандидата – так называемого мобилизационного эффекта.

Вместе с тем, задача определения / получения / конструирования общего критерия корректности выборов остается актуальной. Она может быть решена подобно тому, как это делается в прикладных разделах естественно-научных дисциплин. А именно:

а\. Определяются страны, легитимность выборов в которых не вызывает сомнений как у обеспокоенной, так и у не_обеспокоенной общественности. Особый интерес в таких странах представляют выборы с мобилизационным эффектом электората.

б\. Запрашиваются первичные данные у избиркомов этих стран. Проводится анализ, подобный анализу, проведенному автором или рецензентом, или тем и другим.

в\ Результаты этих исследований : графики, формулы, численные значения параметров формул, считаются эталонами / реперами / образцами.

г\. После этого выборы в той или иной стране, в тех или иных регионах могут, в случае необходимости, сравниваться по результатам с эталонными с последующими выводами о соответствии проведенных выборов избирательному законодательству.

Выводы.

а\. Автор недопустимо использует термины статистической математики, а именно: «распределение Гаусса», «нормальное распределение по Гауссу» и так далее, так как исследуемые автором величины не являются случайными.

б\. Приводимые автором «кривые Гаусса» не имеют никакого отношения к математической статистике как научной дисциплине, в общем, ни к нормальному распределению (закону Гаусса), в частности.

в\. Рецензенту не известно никаких убедительных аргументов автора в пользу обоснования критерия корректности выборов.

г\. Рецензент показал непригодность критерия автора для случая априори корректного голосования за кандидатов, получивших на выборах президента РФ 2018 года менее 5 % голосов избирателей.

д\. Основываясь на этом, рецензент предположил существование как минимум двух моделей выборов: экспоненциальная модель А и экспоненциально – логарифмическая модель Б.

е\. Рецензент предложил свой алгоритм решения общей задачи обоснования критерия корректности выборов, соответствующий отработанной технике решения подобных задач в прикладной физике.

30.05.2019.

Приложение 1

А.Венедиктов. Мне рассказывали, что Путин спросил Кириенко после последних выборов: что там за кривая Гаусса? А Кириенко сказал: я не верю ни в какую кривую Гаусса, но в Москве она была идеальной.

https://echo.msk.ru/blog/pressa_echo/2218498-echo/

Приложение 2.

А.Венедиктов― У меня много вопросов. Вопрос от Андрея Бундина: «Почему Элла Памфилова игнорирует математические законы – закон Гаусса?» Почему вы боретесь с математикой?

Э.Памфилова― Нет, ну что вы!..

А.Венедиктов― Нет. Последнее ваше интервью я тоже прочитал с резким изумлением.

Э.Памфилова― Какое?

А.Венедиктов― Про Гаусса. О том, что исследования…

Э.Памфилова― Где такое? Я не давала никому интервью по этому поводу.

А.Венедиктов― Тогда скажите свое мнение.

Э.Памфилова― Скажу. Во-первых, со Шпилькиным мы встречались. Вот он был, и мы обсуждали эту тему. Я вообще люблю науку. . . .

. . . Есть другой момент. Это как вспомогательная мера для того, чтобы анализировать ситуацию. Она опытная: или подтверждается или не подтверждается. Но формально, когда просто приходят и говорят: «А почему вы вследствие кривой Гаусса не отменяете выборы?.. Говорили, как же так – здесь очевидные нарушения. Они, может быть, очевидные, которые показывает кривая Гаусса… https://echo.msk.ru/programs/beseda/2163964-echo/

ЛИТЕРАТУРА :

1. Новая газета, 20.09.2016. novayagazeta.ru/articles/2016/09/20/69897-realno-edinuyu-rossiyu-podderzhali-15-izbirateley

2. Эхо Москвы. echo.msk.ru/blog/spilkinspilkin/2399705-echo/

3. Телеканал Дождь. tvrain.ru/teleshow/coffee_break/sergej_shpilkin_takih_chistyh_vyborov_ne_bylo_s_nachala_2000_h_godov_chtoby_dokazat_falsifikatsii_nuzhen_ruchnoj_pereschet_bjulletenej-351876/

4. Ван дер Варден Б.Л. Математическая статистика / Ред. Смирнов Н.В. – М.,ИЛ,1960. - 434с.

5. Народный эпос в пересказе Шарля Перро Красная шапочка. https://www.kostyor.ru/tales/tale10.html