На сайте размещены статьи по русской истории, публицистика, философия, статьи по психологии, а также по грамматике русского и древнерусского языков, в частности – Слова о полку Игореве.

Дм. Добров

Выборы и математика

Дм. Добров • 4 октября 2016 г.
Выбор

После выборов у нас обычно оживляются страстные любители «математики», которые неопровержимо доказывают при помощи этой самой «математики», что выборы были сфальсифицированы. Но доказательств этих публика в подавляющем большинстве своем не понимает просто в принципе, даже приблизительно. Поскольку же люди в большинстве своем привыкли свято верить в науку, как в Бога, то «математические» доказательства фальсификации выборов принимаются многими совершенно некритично — если помните, например, под лозунгом Болотной площади «Верим Гауссу!»— Да, занятный ход, а знаете ли вы, представители «креативного класса», кто такой был этот Гаусс и что он натворил? Да откуда, помилуй бог? Знать Гаусса не знаем, ведать про него не ведаем, но веруем Гауссу свято — кредо нашего времени. И именно в связи со священной этой верой, которой позавидовал бы любой богомолец, стоит сказать пару слов о любителях «математики» и их коварных методиках, погружающих публику в бредовое состояние. Увы, публика верует не Гауссу, а тем личностям от «математики», которые и представляют им Гаусса со своих слов.

Поставленная задача может быть объяснена на образовательном уровне средней школы, но для этого придется сказать пару слов о том, чего в школе не изучают. Ну, надо же знать, согласитесь, кто такой Гаусс и что он натворил?

Задолго до Гаусса, еще в начале восемнадцатого века, было подмечено в т.н. законе больших чисел, что большое число случайностей одного класса на практике образует закономерность, распределяясь вокруг теоретического среднего значения случайной этой величины. Рядовой случай этого распределения случайностей и составляет распределение Гаусса, или нормальное распределение, как его чаще называют. Например, если при игре в орлянку мы бросим монету 500 раз, то количество выпавших орлов будет приблизительно равно количеству решек: значения каждой величины, выпавшего орла или выпавшей решки, распределятся около 250, половины количества подбрасываний. Это и есть, повторим, распределение Гаусса. Обычно, впрочем, данное распределение вводят как алгебраическую зависимость гораздо большего числа значений, график которой представляет собой нечто вроде колокола или волны с пиком на среднем значении. Например, рост учеников какой-либо школы согласно сформулированному выше закону больших чисел и нормальному его воплощению должен распределиться приблизительно одинаково вокруг его среднего значения, т.е. очень низких и очень высоких школьников будет гораздо меньше, чем школьников среднего в данном случае роста. Принципиальный характер этой зависимости показан ниже.

Распределение Гаусса

На практике распределение Гаусса с теоретической точностью не выполняется, наверно, вообще никогда, т.е. в приведенном примере с орлянкой выпадение 250-ти орлов и такого же числа решек весьма маловероятно, столь маловероятно, что вероятность эту на практике можно считать нулевой. Чтобы оценить вероятность в данном случае, нужно проделать достаточное число серий по 500 бросков, пока не выпадет ровно по 250 орлов и решек, после чего и будет известно, на сколько серий придется данное событие — например, 1/10000. Это и будет в данном случае приблизительной вероятностью выпадения по 250 орлов и решек в сериях из 500 бросков. Для вычисления же все более и более уточненной вероятности нам придется все увеличивать и увеличивать количество серий — в идеале до бесконечности. Равно и в пределе бесконечного количества бросков монеты мы, вероятно, получим на практике теоретически точное распределение Гаусса, по 250 из 500. Таким образом, точное выполнение распределения Гаусса — это предельный случай закона больших чисел, в смысле — идеалистический, даже маргинальный (понятно должно быть, что совершенно неоспоримо — абсолютно — к большим числам принадлежат только бесконечные величины). Вопрос лишь в том, разумеется, при каком отклонении от среднего значения распределение Гаусса уже будет идеалистическим, а при каком — практическим?

Увы, допустимое отклонение от среднего значения при нормальном распределении случайностей должно быть установлено для каждой случайной величины отдельно, причем исключительно на практике. К сожалению, теория здесь бессильна: мы знаем только то, что отклонение не может быть слишком большим — это событие уже невероятное, как, собственно, и нулевое отклонение. Если же у вас возник вдруг вопрос, что такое слишком большое отклонение, то в пику можно задать вопрос, а что такое большие числа? Ответ прост: большие числа начинаются там, где случайности обретают закономерность, где выполняется закон больших чисел. А установить это можно только опытным путем для каждой случайной величины в отдельности.

Нужно добавить, что распределение случайностей отличается от привычной для всех школьной функции, т.е. ею не является. Например, на деле ни рост школьников из приведенного выше примера никак не зависит от их количества, ни наоборот. Вдумаемся, мы анализируем отнюдь не функцию роста школьников, а лишь определенные множества их в отношении друг к другу. Здесь действует не привычная для нас логика вывода, а логика выбора подмножеств из множества, для чего прекрасный логический аппарат создал Г. Кантор в знаменитой теории множеств.

Изложенные общие и основополагающие сведения уже должны навести внимательного читателя на мысль, что даже в общем случае анализ случайных подмножеств посредством лишь нормального распределения — это дело не только примитивное, на уровне школьника-троечника, но и путаное, неопределенное, весьма зависимое от обстановки опыта, даже не вполне обоснованное теоретически, ибо в математике отсутствует исчерпывающее определение случайности (исчерпывающее определение вероятности тоже отсутствует).

Чтобы понять, как на деле работает распределение Гаусса и где оно применимо, нужно понять в первую очередь, что такое случайность. Что ж, определим нашу ключевую величину: случайность — это нефункциональное действие или событие, т.е. действие или событие, не являющееся значением функции, логическим следствием. Вспомним, что функциональную логику — логику вывода — мы оставили за бортом: она здесь просто неприменима.

Для понимания сказанного рассмотрим пример. Согласно закону больших чисел, представленному выше, число людей, пришедших в воскресенье на выборы, в теоретическом представлении должно нормально распределиться в подмножествах вокруг середины воскресного дня — с пиком на 14 часах, если избирательные участки работают с 8 до 20 часов. Это теоретически, повторим, но практическая картина, вероятно, будет стремиться к теоретической во многих случаях. Совпасть же, напомним, обе картины смогут только при бесконечном количестве избирателей и, соответственно, бесконечном количестве их подмножеств, распределенных по дню, по часам прихода на выборы. Но представим себе, например, что с утра в воскресенье по телевидению начали демонстрацию продолжения какого-нибудь весьма популярного сериала на несколько часов. Нетрудно догадаться, что благодаря этому в идеальном случае пик пришедших на выборы сместится на несколько же часов от середины дня к его концу, а на деле появятся два пика, т.е. правая часть волнообразной кривой Гаусса будет задрана вверх, намечая или уже образуя вторую волну… Будет ли это необходимо означать, что на выборах произошел «вброс» бюллетеней, если выражаться языком «математиков»? Будет ли это необходимо означать, что нужно идти на улицы с плакатами «Верим Гауссу!» и проклинать «фальсификаторов»? Нет, это будет означать, что случайность в данном случае просто отсутствовала (поведение людей, смотревших сериал, было мотивированным, функциональным), почему распределение Гаусса в данном случае и не могло выполниться просто в принципе, хотя в принципе применение его в подобных случаях допустимо — при анализе, напомним, только случайных событий, нефункциональных.

Теперь, поняв на принципиальном уровне, что такое случайность и нормальное ее распределение, обратимся к измышлениям «математиков». Вот, например, отрывок из титанического труда С.С. Сулакшина о фальсификации выборов, который просто потрясает махровым невежеством автора, заявляющего себя доктором физико-математических наук:

Можно ли, кроме общих соображений, оценить динамику качества национальной избирательной системы, используя ряд последовательных выборов, и главное – восстановить истинное волеизъявление населения в условиях, когда результаты голосования фальсифицированы? Можно.

[…]

1. По закону больших чисел распределение голосов за того или иного претендента носит вид гауссовой кривой, этакого симметричного колокольчика. В распределении голосов существует только один пик. Если пики разделены, дихотомичны или более того, то следовательно существует значимое социальное явление, которое не может быть неизвестным. Оно вполне подвержено экспертному анализу.


С.С. Сулакшин. Избирательная система и успешность государства (тайное всегда становится явным). М.: Научный эксперт, 2013.

Начнем с известного уже. Во-первых, выше показано буквально на пальцах, что пиков кривой Гаусса принципиально может быть сколько угодно, если не все события случайны. Из показанного выше также ясно, что данное положение не является единственно возможным следствием фальсификации итога выборов, т.е. отсюда невозможно однозначно вывести именно фальсификацию. Это первое заблуждение «математиков», отнюдь не самое главное.

Во-вторых, зададим себе вопрос, который, вероятно, просто не пришел в голову С.С. Сулакшину за его чрезвычайной простотой и даже «ненаучностью»: можно ли голосование на выборах за того или иного соискателя считать случайным событием, немотивированным поступком избирателей? Отчего бы и нет, правда? Ладно, допустим, но в таком случае хотелось бы спросить у С.С. Сулакшина, какое отношение имеет немотивированное голосование на выборах к «успешности государства», как озаглавлен его титанический труд? Нет ли здесь противоречия? Что Сулакшин вообще имеет в виду? Пролистав несколько страниц, мы узнаём, что Сулакшин имеет в виду, из опубликованного им графика:

Распределение Сулакшина

Обратим внимание, на графике в согласии с приведенным выше утверждением Сулакшина показана зависимость количества проголосовавших от доли их на участке, т.е. доля избирателей, проголосовавших за ту или иную партию, в представлении Сулакшина является переменной величиной. Вопрос даже не в том, где Сулакшин взял эти дикие данные,— вопрос в том, почему он решил, что доля избирателей, проголосовавших за ту или иную партию, должна быть переменной величиной, пусть даже по Гауссу? Знаете, даже ребенок бы догадался интуитивно, школьник, что если доля проголосовавших за ту или иную партию каким-то образом зависит от посещаемости, причем все равно — по Гауссу зависит, по Сулакшину или по безвестному шизофренику Тюте, не попавшему на плановое лечение ввиду отсутствия средств у государства, то это ненормальное положение вещей… Подробнее об этом будет чуть ниже.

Поскольку приведенный график не имеет вообще никакого смысла и, следовательно, не может соответствовать действительности даже при фальсификации результатов выборов (процесс не случайный, Гаусс тут ни при чем), то приходится предположить, что в титанический труд вкралась досадная ошибка, т.е. Сулакшин даже приблизительно не понимает, о чем пишет. Увы поклонникам «математики», Сулакшин просто перепутал «количество человек» с количеством участков, а долю проголосовавших — с долей пришедших на выборы. Да-да, если на приведенном графике по вертикальной оси вместо количества человек отложить количество участков, а по горизонтальной оси — явку в процентах, то принципиально мы получим нормальное распределение избирательных участков по явке или наоборот, распределение явки по участкам, все равно, ибо функции здесь нет — нет вывода, только выбор. Повторим, это важно, здесь нет никакой функции, а потому и проецировать чистую эту абстракцию на действительность не следует. Не нужно пытаться вообразить здесь зависимость, вывод в интуитивном представлении,— нужно просто вдуматься в смысл выбора подмножеств в подобных случаях. Вспомним сказанное выше о распределении Гаусса. Посещаемость участков мы можем счесть случайной величиной, если нет мотивированных действий избирателей, не случайных, пример которых приведен выше. Поэтому в идеальном случае явка в 50% будет на наибольшем количестве участков, на пике графика, а явки, близкие к нулю и к 100%, будут на мизерном количестве участков, на самом спаде графика по обе стороны от пика. Теоретически это будет распределение Гаусса, даже и множество подмножеств Кантора, но при чем же здесь приведенная выше ахинея Сулакшина?

Следует добавить, что рассматривать явку на выборы как случайное событие все-таки не вполне корректно. Хотя особой предвыборной агитации у нас не ведется и никогда не велось (в этом выборном году наши СМИ почему-то более интересовались американскими выборами, чем собственными), все-таки присутствует агитация на участие в выборах, причем поддаются ей почему-то по преимуществу сторонники партии власти: абсолютное число принявших участие в выборах в этом году заметно уменьшилось, но доля голосов, отданных за партию власти, заметно возросла. Это, конечно, явный показатель отсутствия случайности, нормального распределения, но утверждать на данном основании фальсификацию… А впрочем, кто и утверждает фальсификацию на данном основании? Кажется, «математики» до этого еще не додумались — всё, стало быть, впереди.

Чтобы осознать просто фантастическую глупость «математиков», а в отдельных случаях — и психические их заболевания, следует ответить на вопрос, какие же именно статистические показатели свидетельствовали бы о честности или бесчестности выборов? Ответ очень прост: о честности выборов той или иной партии свидетельствовала бы линейная зависимость числа голосов, отданных за эту партию, от явки избирателей — линейная, а не гауссова, как почему-то решил Сулакшин. Ну, и наоборот, конечно: нелинейная зависимость количества голосов от явки свидетельствовала бы о бесчестности выборов. Получить такого рода данные может любая партия, способная послать своих наблюдателей на все избирательные участки. Нетрудно, согласитесь, даже самостоятельно учесть избирателей, пришедших на выборы, а количество отданных за соискателей голосов является официальными публичными данными. Здесь нет вообще никакой проблемы — вообще никакой, разве что арифметическая. Вопрос только в том, почему же указанная зависимость при честных выборах должна быть линейна?

Как уже сказано выше, интуитивно каждому будет понятно, что если доля голосов, отданных за ту или иную партию, растет вместе с явкой, то это ненормальное положение вещей. И правда, если участки достаточно велики по числу избирателей и формируются случайным образом — в том смысле, что не из сторонников той или иной партии целенаправленно, то и распределение по ним сторонников разных партий должно быть случайным. На каждом участке это будет выборочное распределение, нерепрезентативная выборка, как говорят социологи, но в пределе теоретическом значения этого подмножества естественным образом будут стремиться к средним значениям множества, т.е. выборка не будет сильно зависеть от случайного ее характера, если количество избирателей на каждом участке будет достаточно велико (чем больше оно, ясное дело, тем лучше, в идеале до бесконечности). И тем более выборка будет представительной, что количество участков у нас велико: любая небольшая ошибка в отдельном случае или даже фальсификация будет сглаживаться до среднего значения на большом количестве участков.

Впрочем, главное здесь для понимания то, что на все участки отбор избирателей будет единообразен в своей случайности в указанном выше смысле, что и даст закономерность согласно закону больших чисел. Если же все распределения голосующих по участкам будут одинаковы, единообразны в своей случайности, то они должны будут дать приблизительно одинаковые количественные показатели по всем участкам — с учетом допустимых практических отклонений в указанном выше смысле. Если на каждом участке будет приблизительно одинаковая доля голосов за каждого соискателя, то общая зависимость голосов от явки естественным образом будет линейна, т.е. график ее при постоянной производной (доле голосов) будет представлять собой в идеале прямую линию.

Надо добавить, наверно, что это знакомая нам с бытовой точки зрения банальность — стремление значений выборочного распределения к значениям множества, из которого была произведена выборка. Если бы это было не так, то все наши социологические опросы, не имея под собой ни малейшей научной базы, были бы лженаучны и давали бы заведомо ложные результаты. Принципиально социологический опрос представляет собой данные по одному избирательному участку — случайному и репрезентативному, причем последнее не обязательно теоретически: это лишь снижает необходимое число опрашиваемых.

Но вернемся к нашим распределениям и отметим очень важную вещь, ключевую: если распределение явки по участкам есть величина случайная, во всяком случае — может рассматриваться как таковая при определенном стечении обстоятельств, то распределение голосов по соискателям (явке) есть уже величина по преимуществу не случайная, в идеале функциональная, которая уже не может рассматриваться как случайность. Задумаемся, это ведь чистое безумие — предполагать, что народ в большинстве своем голосует на выборах за тех или иных соискателей на основании случайности, т.е. вообще вне какого-либо мотива, от фонаря, что называется. Любопытно, Сулакшин хоть иногда задумывается критически над тем, что пишет? А ведь его ахинею многие читали… Ну, и какие же они сделали выводы из прочитанного?

После всего сказанного можно уже без комментариев привести два графика из давнишней статьи волшебника Чурова. Первый — это распределение участков по явке (явки по участкам) на президентских выборах 2008 г., а второй — распределение голосов по явке на тех же выборах. Кто понял сказанное выше, сможет уже самостоятельно прокомментировать эти графики, с учетом даже того, что первый график просто ужасен с точки зрения секты свидетелей Гаусса, да и второй с их точки зрения тоже ясно свидетельствует о фальсификации…

Выборы 2008 г. Распределение участков по явке

Выборы 2008 г. Распределение голосов по явке

У «математиков» особое подозрение вызывает рост синего графика на нижней картинке, который отражает вероятность победы на выборах Д. Медведева, или производную в функциональной логике, поскольку говорить здесь о вероятностях не вполне корректно. Чтобы отмести подозрения, вы можете указать пальцем любую точку на графике и высчитать в ней отношение y/x — вероятность, или производную (разумеется, эта величина будет постоянной на протяжении всего графика, как и сказано выше). Сумма же вероятностей победы всех четырех кандидатов должна дать единицу, как учили. Это и есть в данном случае проверка на истинность.

Впрочем, бдительный конспиролог мог бы прокомментировать эти графики в том духе, что их фальсифицировал знаток психологии, нарочно ведь, подлец, сделал их не идеальными и загадочными, противными убеждениям секты свидетелей Гаусса. Что ж, принципиально это возможно. Выше показано отнюдь не то, что выборных фальсификаций нет и быть не может, а только то, что существующая для вскрытия предполагаемых этих фальсификаций теория создана на уровне детского сада, если не сумасшедшего дома, и не выдерживает даже самой поверхностной критики. Не надо верить Гауссу: математика предполагает не веру, а доказательство, вывод.

PS

Конечно, у неискушенного человека может возникнуть вопрос: положим, действительная теория фальсифицируемости выборов в принципе возможна — почему бы и нет?— но как же тогда отличить ложь от правды во всех этих выборных делах? Что ж, для простоты можно считать любую теорию по данному предмету ложной, а основания для этого упомянуты выше: при анализе выборной обстановки мы отступаем от привычной функциональной логики, ибо сталкиваемся с гипотетическими множествами, которые, впрочем, все-таки имеют некоторое отношение к действительности, т.е. требуют функционального анализа. Пример выше — второй график, на котором изображены гипотетические множества, недействительные в связи их, но все-таки отражающие действительность. Своеобразный парадокс здесь в том, что представленные на графике множества не являются классической функцией, но все-таки образуют функциональную закономерность в силу пресловутого закона (область определения классической функции не может быть случайной, на то она и область определения, а не область неопределенности, случайности). Отличие второго графика от первого, напомним, в том, что в данном случае мы сталкиваемся с мотивированным действием, разумным в идеале. А чисто научная проблема здесь в том, что теоретического аппарата для решения подобных задач просто не существует. Вопрос в том, верите ли вы, что Сулакшин или, положим, глубинно образованный шизофреник Тютя способен создать этот теоретический аппарат?

Проиллюстрируем возникающие сложности на простейшем примере — теореме Кантора, при помощи которой можно произвести первичное формальное деление множеств на гипотетические и действительные, что, впрочем, не решает проблемы, как и любое тривиальное решение. Суть теоремы сводится к тому, что количество гипотетических подмножеств множества больше количества его элементов, но если это положение применить к действительному множеству, то получится полная чушь, хотя, заметьте, и «обоснованная научно». Представьте себе, что на столе перед вами лежат три монетки по рублю. Если буквально применить здесь теорему Кантора, то выйдет, что три эти монетки можно будет разложить по кучкам, действительным подмножествам, число которых будет заведомо более трех… Прекрасный метод заработка, а главное — «научно обоснованный», не так ли? Ну, а как пойдешь против, если «наука доказала»?

Примером сложностей в подходе к анализу сих функциональных множеств также является рассмотренная выше титаническая мысль Сулакшина, который попросту перепутал набор множеств с функцией (он инженер, а не физик и не математик, т.е. человек, для которого математика укладывается по преимуществу в математический анализ, учение о функции). И если подобные штуки позволяет себе доктор физико-математических наук, то чего ждать от обывателя или даже типичного нынешнего «кандидата наук», а то и «доктора»? Помнится, по поводу приведенного выше распределения голосов по явке читал я заключение одного «кандидата наук» о том, что доля голосов, отданных за Медведева, растет с увеличением явки… Да, жалкое это зрелище — «кандидат физико-математических наук», который не имеет ни малейшего понятия о функции и производной. А впрочем, Сулакшин разве лучше смотрится?

Приведенное первичное теоретическое решение на основании теоремы Кантора не снимает проблемы, ибо на втором графике мы видим гипотетические множества (там выполнится теорема Кантора, подмножества можно комбинировать, например построить распределение голосов, отданных сразу за двух кандидатов), но гипотетические эти множества образуют функциональную закономерность, причем действительную в отличие от закономерности первого графика, пусть хотя бы отчасти. Корень проблемы заключается не только в осознании того факта, что существует логика вывода и логика выбора — совершенно разные вещи, принципиально, но и того, что данные методы имеют некоторую область пересечения, как воочию видим на примерах. Скажем, на графике выше вероятность равна производной, т.е. характеристика подмножества равна характеристике функции, причем равен и математический их смысл. Иначе говоря, мы противоречиво пришли к тому, что вероятность уже и не имеет отношения к случайности, это просто передаточное число множества, дифференциал его (производная), что представляет собой сущую банальность в теоретическом представлении, очевидность. Парадокс это, извольте убедиться, даже и формальное определение вероятности, которое, напомним, в математике отсутствует…

Всего-то и требуется в данном случае от теоретика, что определить область пересечения логики выбора и логики вывода ясно, четко и понятно для каждого, даже школьника, откуда и могут последовать уже обоснованные теоретически методы анализа любых выборочных множеств — гипотетических, псевдогипотетических, псевдодействительных… Увы, это вам не распределение Гаусса примеривать к данным блистательного Чурова, словно дети в песочнице: у Машеньки «пирожки» получаются хорошие, похожие, а у Петеньки — пока нет. Это отличная задачка для теоретика вроде Кантора, но я не верю, что ее способен решить практик Сулакшин или даже глубинно образованный шизофреник Тютя. Известный теоретик А.И. Мальцев, основоположник даже своей алгебраической школы, попытался сделать нечто подобное в работе «Общая теория алгебраических систем» (логика упорядоченных множеств),— но и это лишь малый шажок вперед… Чего стоит по сравнению даже с этим шажком детская возня с распределением Гаусса, совпадает или нет? Глупости это, не слушайте. Вот и весь сказ.

Зову живых