?

Log in

No account? Create an account

ИЦ "АФТЕРШОК"

АНАЛИЗ

Previous Entry Share Next Entry
Гауссиана - фальсификация для доказательства фальсификации
feasvet wrote in aftershock_2
Оригинал взят у 8cinq в Гауссиана - фальсификация для доказательства фальсификации

Предыстория


В период пост-выборного срача, в интернете появились несколько видов "математического доказательства" фальсификации выборов. Например вот такой график, так называемой "гауссианы".



Впервые столкнувшись с гауссианой при анализе выборов, я впал в ступор. Я не математических наук доктор, а матанализ для меня давно законченный предмет из далекого университетского времени. Но я всегда считал, что с математикой и логикой у меня лады - мне часто приходится иметь дело с функциями по работе, приходится думать над логикой работы больших систем в веб проектах - тренировка есть. Но тут я почувствовал себя дураком - я читаю комментарии "математического доказательства", которые изобилуют уверенностью в своей правоте. Даже те, кто умом, на вид, не отличается - и те похоже все поняли. А я сижу и вижу только лишь гистограмму, которая сообщает нам бессмысленную статистику. При чем здесь гауссиана? Как вообще можно применять гауссиану в качестве социологического исследования?

Я постучался в скайп к своему знакомому, ядреному технарю, который уж точно должен был мне вправить мозги. Тем более никакой симпатии к власти он не испытывает. Он тоже напрягся, подумал, мы почитали тексты эсквайра и блогов - но смысл всего этого действа опять ускользнул от нас. Стало ясно, что дело мутное и нужно в это серьезно вникать, чтобы написать опровержение. На написание статьи ушло 2 дня. Задача представлялась сложной. Сложно объяснять бессмысленность.

Благодарю 4izh за помощь в составлении материала. Его комментарии в тексте будут отмечены вот таким цветом.


Что такое гауссиана и что она здесь делает?


Начнем с того, что гауссиана - это функция, которая предназначена для изучения отклонений в технических измерениях. К гистограмме выборов это не относится, ведь никакой функцией мы не пользуемся. Если и есть смысл применять к ней какой-то научный термин, то это Нормальное Распределение - такое распределение случайных данных, гистограмма которых напоминает колокол по своей форме.

Область применения гауссианы. Например, мы изобрели супер нанотехлологичный измеритель радиации. Оценить качество нашего изобретения можно при помощи несложных тестов: мы берем кусок урана с заведомо известным (точным) уровнем радиации и начинаем его мерить нашим прибором. Для точных показателей мы заинтересованы в большом количестве замеров (репрезентативной выборке). Замеры не будут постоянно давать одинаковый результат, а мы будем получать некий разброс. Выстроив гистограмму, мы должны получить нормальное распределение полученных величин - тот самый "колокол", где значение горизонтальной координаты пика является истинным значением уровня радиации, а из характера формы мы можем получить полезные статистические величины, как, например, погрешность измерения. Именно этот показатель и будет отвечать за качество нашего изобретения.

Но и с Нормальным Распределением существует проблема. При желании можно даже детский рисунок радуги сравнить с Нормальным Распределением по внешнему виду, но кроме как для создания "ореола научности" это не будет иметь смысла. Строго говоря, ни один анализ выборов в сети, ни одной партии, ни одной страны - не соответствует нормальному распределению. Или у вас ровный "колокол" или ваше распределение не попадает под этот термин.


Что там у других стран с гауссианой?


Чтобы доказать бессмысленность данного сравнения, мы взяли на себя работу по построению нормального распределения для выборов в Польше - страны, которую часто используют как пример хорошей избирательной системы. (Для пытливых: таблица с данными, внутри файла ссылка на первоисточник).



Действительно что-то отдаленно похожее на нормальное распределение, почти так же, как у наших партий, которые получили меньше голосов, чем ЕР. Но это партия Польши с 8% голосов, она проиграла. А как дела обстоят с ведущими партиями?



Хм, не очень колокольно. Может быть победившая партия нам покажет лучше результат?



Как видно, никаким "колоколом" здесь не пахнет. По сему, вопрос с гауссианой считаем нужным закрыть. Если кто-то сует вам в нос данное "математическое доказательство", то можете смело раскручиваться на месте как юла, раскинув руки, громко хохоча.


График Голоса/Явка


Осталось разобраться еще с одним графиком, который можно встретить в сети. Это отношение Голоса/Явка. Выглядит он так:



С одной стороны этот график как бы намекает нам, что на некоторых участках явка невероятно высока, 90-100%, что намного реже встречается в других странах. Это нам может говорить о том, что на этих участках вбросили бюллетени.

Или нам это может говорить о том например, что это военные части, куда всех загоняют голосовать без исключения. Например, в Польше, которую мы берем за образец, такое тоже бывает - явка 100%. А представьте сколько у нас в России военных частей? Сотни их. Можно ознакомится с мнением непосредственного участника таких голосований.

Есть здесь и другой фактор - маленькие бедные области. Например Атяшевский район Мордовии, где за ЕР отдано 99% голосов. Это три десятка деревень в далеком отшибе от цивилизации. Какие вообще могут быть политические предпочтения в таких местах, как вы себе представляете? Там попросту не знают политической жизни. - Многопартийная система? - Ага, что-то слышал.

Сколько еще таких мест? Уйма - будет мало сказать. Приехали на вездеходе в деревушку, завезли полезной утвари от правящей партии и сказали - приходите обязательно, да голосуйте за нас. Людям то что? Проголосовали и забыли. В этом нет ничего хорошего, но и криминального тоже. Вот так в некоторых местах жизнь течет, среда обитания слишком бедная и жестокая, чтобы жить лучше. Тут уже скорей вопросы к демократическому устройству нашей страны, которое предполагает то, что далеко не везде возможно.

Говорят еще о том, что направляющая Голоса/Явка у ЕР отличается от других партий - она поднимается вверх. Но это говорит скорей о закономерности, чем о вмешательстве - иначе небыло бы ровной линии, а были бы скачки. Почему такая закономерность? Предыдущий абзац может быть на то подсказкой, а может быть и что-то другое.

Мы не можем говорить о какой-то единой причине повышенной явки, но даже в этом случае можно легко найти объяснение данному феномену. При высоком проценте явки среди голосовавших значительно повышается процент "случайных обывателей", людей далеких от политики и, разумеется, совершенно ничего не слыхавших о новых мейнстримовых тенденциях в интернете критиковать правительство. В рамках современной политической и информационной системы России повышенные показатели ЕР при высокой явке (если таковые наблюдаются) являются скорее нормой, чем отклонением от нее.

Так или иначе, здесь остается большое пространство для интерпретаций, с нами можно спорить, мы можем спорить в ответ - уже поэтому математическим доказательством этот график не является.


Кто это вообще придумал?


График Голоса/Явка относительно новое изобретение. Надо отметить, что, так называемый, независимый эксперт журнала Эсквайр, который придумал этот вид исследования - Сергей Шпилькин - физик. Не кандидат наук, и даже не работник своей профессии, а просто физик по образованию, работающий переводчиком - вот такой независимый исследователь социальных процессов. Уровень авторитетности мнения как бы намекает :)

Но это не самое интересное. Самое интересное с пресловутой гауссианой. Потому что впервые, в качестве исследования выборов, мы смогли ее отыскать только в январе 2005 года на Украине, во время проведения оранжевой революции. Резервная ссылка.

Хочешь не хочешь, а проведешь параллели.




Добавлено:
Исследование Польши было обновлено. В нем участвовали все 25983 УИК страны, а не территориальные ИК, как это было сделано изначально. Это исключает критику по репрезентативности исследования. Тренд графиков остался тем же - даже график ЕР больше похож на Нормальное Распределение, чем график Польши. Обновленные данные можно увидеть в оригинальном посте автора: http://8cinq.livejournal.com/32693.html


  • 1
По Польше у вас данные по территориальным комиссиям, а не по УИКам. Количество людей на разных территориях отличается в десятки раз, в отличие от УИКов. Пересчитайте по УИКам, тогда будет о чем говорить.

Графики обновлены, можете посмотреть их здесь: http://8cinq.livejournal.com/32693.html
Общий тренд не изменился, хотя перепадов безусловно стало меньше.

"Говорят еще о том, что направляющая Голоса/Явка у ЕР отличается от других партий - она поднимается вверх. Но это говорит скорей о закономерности, чем о вмешательстве - иначе небыло бы ровной линии, а были бы скачки. "
Какие еще скачки? В модели "у ЕР реальный рейтинг где-то 20-25%, а все что больше - достигается вбросом бюллетеней" никаких скачков как раз не будет.


Аргументируйте свое заявление, используя понятную человеческую логику, тогда мы это обсудим.

(Deleted comment)
В сад!!!
Не материал, а пурга.

Куда нам до переводчика Шпилькина :)

Выводы правельные. Подходход не очень

Смотрите на мир проще. Первое. Распределение Гауса можно рассматривать только в статичных условиях. А именно оно применяется в радиолокации (что в принципе идентично орлу и решке). Сигнал или есть или его нет. Мы производим измерения при одних и тех же условиях. Количество измерений (выборка) должна быть репрезинтотивной (как можно большое количество измерений в одних и тех же условиях). Нас интересуют только математическое ожидание (Средняя величена), и дисперсия (среднее отклонение в заданнх пределах от матожидания). Если условия поменялись (выпали осадки, высокая влажность, сухой воздух, снег), то наши измерения приходится повторять заново в томже количестве и уже на основании этих данных производить качественный анализ о работ способности системы в зависимости от внешних условий. Все. Некто Сергей Шпилькин изначально вводит нас в заблуждение приравнивая все изберательные участки. Но это невозможно, иначе у нас бы не существовали такие панятия как "Красный регион". Плюс к этому есть такие параметры как димографическое распределение, плотность населения (город село), наличее или отсутствие производства, роль руководителя региона. То есть на лицо явное нарушение основных требовний к измерениям с физической и математической точки зрения. Ну и на последок. Почему Вы не задались вопросом: А с какого перепуга вообще сравнивать теорию выбадения числа 1:2 с 1:7? Ведь партий на выборах было 7, а не две.

Re: Выводы правельные. Подходход не очень


СУПЕР материл, ВСЕМ ЧИТАТЬ !!!!!!!

:) tokomak Expand
Народ, что вы гоните пургу? Не важно кто как голосовал, важно как это все посчитали! Я не верю ни тем ни другим, по многим причинам, но одна общая - и те и другие просто пиздаболы.

все-таки политической целесообразности?
Оранжоиды усиленно сливают ЕдРо, тут подойдет и навальный, и гаусс, и миллиарды путина, и его же педофилия. Вопрос не в том, кому верить, а в том, кто кого переиграет в этой информационной войне. Если дядя Вова сумеет воспользоваться инерцией удара оранжоидов (как это делается в дзюдо), он обернет себе на пользу слив ЕдРа и обновит поддержку со стороны народа. Если нет - нас ждет ливийский (грузинский, сербский, украинский, сирийский - нужное подчеркнуть, ненужное зачеркнуть) сценарий.
Вам лично, что больше нравится?

Дико извиняюсь..

Дико извиняюсь..но объясните кратко смысл графика - %голосов от количества УИК. Это как?

Re: Дико извиняюсь..

Очень просто. По оси Х откладываем процент голосов полученных партией с шагом 0.5%. По оси Y - количество УИК-ов, на где именно такой процент был получен. График характеризует как-бы территориальный разброс предпочтений избирателей, не уточняя при этом регион для того или иного результата. Исходя из простейшей теории вероятностей, можно было бы ожидать, что полученная кривая будет похожа на колокол. Учитывая более сложные явления, в основном неравномерность предпочтений по территориям страны, колокол будет больше или меньше искажен. Фальсификации же могут исказить его очень сильно. Что мы скорее всего и наблюдаем. Доказательством в суде такие картинки не являются (не знаю, к сожалению или к счастью). Но пищи для не самых приятных размышлений дают более чем достаточно.

Внимание. Графики были обновлены с выборкой по большему количеству УИК, чтобы ни у кого не возникало вопросов по репрезентативности. Обновленные данные в оригинальном посте: http://8cinq.livejournal.com/32693.html

Тут даже не в гауссиане дело, а в том, что поведение распределений очень отличается у ЕР и других партий. Кстати гауссиан на рисунке нет вообще. На гауссиану похожи пики для партий (кроме ЕР), но у всех у них есть резкие подъемы в нуле. А Яблоко в нуле просто зашкаливает. Что говорит о том, что скорее всего на многих участках голоса целенаправленно отбирались. Еще раз, дело даже не в гауссиане, а в резком отличии поведения кривой для ЕР от других партий. Именно это и надо объяснять. Ну и конечно остаются пики на "круглых числах". Это по-моему уже вообще не объяснить ничем кроме натягивания спущенного начальством процента.

Ну ведь сказано выше: ни у одной партии, что в Польше, что в Британии, нет "похожих на гауссиану" распределений. И вообще "похожих"! Не свидетельствует это ни о чем!
Мать вашу, я обрабатываю результаты экспериментов статистическими методами минимум раз в месяц! Ну поверьте мне, что нормальное "распределение" это редкий случай даже в физике - реально, если оно наблюдается - это "случайная" погрешность измерения прибора (в противовес "систематической" и только). Рассчитать СКО и поскорее забыть!
Например, измерение размеров частиц порошка после синтеза может иметь ЛЮБОЙ вид, с любым количеством пиков и хвостами любой длины. Что же теперь, выкинуть его и не делать из него керамику?
Фактически распределение результатов зависит от "природы" явления. И у социологии тут нет конкуренции! Ну почему все результаты опросов "экспертов", "общественного мнения" и "экзетпулы" должны соответствовать какой-то там "гауссиане"?
Отличие кривой для ЕдРа может заключаться и в "вбросах", а может и в том, что к ней у избирателей особое отношение - как к партии власти. Где-то жить стало лучше (например, Чечня) и все дружно идут на участок голосовать за ЕдРо, где-то хуже - народ сидит дома или голосует за оппозицию. Что дальше?
Пики - артефакт статобработки или подделка - видел их много раз. Ну и сами подумайте, если на участок пришло, например, 1678 чел. из 3789 зарегистрированных, за ЕдРо проголосовало 622 а члены УИК вбросили 500 (вот где может быть круглое число!) бюллетеней, откуда здесь возьмется "красивая" цифра явки 55,00%?
Еще раз оговорюсь - вбросы и другие нарушения на выборах видимо были. Вопрос в масштабах. И вообще - больше наблюдателей честных и разных, затем с доказательствами в суд! И только так!

(Deleted comment)

Re: Пошли пиндосы в жопу...

+100500 :)

(Deleted comment)
Ну, начнем комментировать бредятину с самого начала. Есть комментарии по сути, а есть комментарии к автору сего опуса (их я буду помечать "*"). Кстати, на всякий случай для тех, кто не учился на физмате: "гауссовское распределение" и "нормальное распределение" - это синонимы.

1*) Я не математических наук доктор, а матанализ для меня давно законченный предмет из далекого университетского времени.
Те, кто хорошо учился в универе на технических специальностях хорошо знают, что матанализ - это совсем про другое. Матанализ часто используется в математической статистике и теории вероятностей - это правда (например, когда надо посчитать функцию распределения через плотность распределения). Важно, что для текущей задачи матанализ не используется вообще.

2) Начнем с того, что гауссиана - это функция, которая предназначена для изучения отклонений в технических измерениях.
Да, действительно, гауссово распределение широко применяется в физике. Также широко, как и в других науках, в том числе неестественных, в том числе в социологии. Его применение можно найти практически в любых отраслях человеческих знаний. Для сомневающихся - попробуйте погуглить "применение гауссовского распределения в yyy", где yyy - любая наука, от физики до психологии и философии. Сказать, что "гауссиана предназначена для изучения отклонений в технических измерениях" - это как сказать "таблица умножения предназначена исключительно для подсчета цены товара при оптовой закупке". Бредятина.

3) Или у вас ровный "колокол" или ваше распределение не попадает под этот термин.
Автор не понимает что такое матстатистика и для чего она нужна. Ни одно случайное событие в мире не будет совпадать 100% с гауссовской кривой. Ни одно!!! Это также, как если вы подбросите монетку 100000 раз, то вероятность того, что соотношение орел/решка будет ровно 1:1 - ничтожно мала. Это не мешает говорить, что вероятность выпадение орла = вероятность выпадение решки = 1/2.
Для чего же нужна гауссовская кривая? Дело происходит так. Очень много случайных событий в окружающем мире имеют вид нормального распределения. Эмпирические данные, полученные опытным путем, практически невозможно записать в виде формулы (функции), которая позволяла бы их анализировать. В то время свойства случайных величин, имеющих нормальное распределение, очень хорошо изучены. Поэтому строится модель, которая приближает заданное случайное событие к нормальному распределению. Получается некая абстракция, которая, будучи записана в виде формулы гауссовского распределения, легко анализируется.
Строить абстрактные модели (которые не учитывают несущественные детали и поэтому все же имеют погрешность, но ничтожную малую) - это очень полезно. Например, расстояние между 2 городами - это абстракция, в которой города рассматриваются как материальные точки, не имеющие размера)

4) Строго говоря, ни один анализ выборов в сети, ни одной партии, ни одной страны - не соответствует нормальному распределению
В теории вероятностей есть замечательная "центральная предельная теорема", которая гласит: "сумма достаточно большого количества слабо зависимых случайных величин, имеющих примерно одинаковые распределения, имеет распределение, близкое к нормальному." Именно благодаря этой теореме, гауссовское распределение имеет огромные масштабы применения во многих науках. Конечно, существует определенная погрешность, но в целом, сумма очень большого количества слабо зависимых величин, имеющих примерно одинаковые распределения будет иметь вид гауссовского распределения.

5) взяли на себя работу по построению нормального распределения для выборов в Польше - страны, которую часто используют как пример хорошей избирательной системы
На написание статьи ушло 2 дня. Задача представлялась сложной
Что то мне подсказывает, что 2 дня было потрачено именно на то, чтобы найти наконец страну с более-менее хорошей репутацией относительно выборов, у которой бы все эти графики не имели вид гауссовской кривой. Как мы видим - такую страну найти не удалось, ибо показывать графики с максимальным делением на шкале oY от 20 до 50 - это очень смешно. Проводить выборку на 200-500 УИКах, и приводить это как доказательство несостоятельности центральной предельной теоремы - адский пиздец. Тут даже комментировать смешно.
Вы лучше нарисуйте подобные графики для выборов в Швеции, в Норвегии, в Германии и т.д. И чтобы выборка была не по 200 УИКам, а по всем 10000-80000 УИКам. И мы посмотрим будет ли это все иметь вид гауссовской кривой. =)

6)Или нам это может говорить о том например, что это военные части, куда всех загоняют голосовать без исключения. Например, в Польше, которую мы берем за образец, такое тоже бывает - явка 100%. А представьте сколько у нас в России военных частей? Сотни их.
Да, согласен, такие УИКи есть. Этим можно объяснить 100% явку на некоторых участках и так называемый "скачок" на некоторых графиках при явке от 95% .
Только, во-первых, таких участков не так много.
Во-вторых, беглый осмотр данных на сайте ЦИК показывает, что большинство УИКов с явкой от 95% никакого отношения к военным не имеют.
В-третьих, я могу ошибаться, но по-моему большинство военных голосует на обычных УИКах вместе с гражданскими.
И в-четвертых (и этот аргумент самый сильный), это не объясняет голосование на таких участках исключительно за ЕдРо.

7) Есть здесь и другой фактор - маленькие бедные области. Например Атяшевский район Мордовии, где за ЕР отдано 99% голосов... Приехали на вездеходе в деревушку, завезли полезной утвари от правящей партии и сказали - приходите обязательно, да голосуйте за нас... В этом нет ничего хорошего, но и криминального тоже
Наверно, автор плохо знает УК РФ, раз говорит, что подкуп избирателей - это "ничего криминального". Вообще-то это очень даже криминально, и при нормальной судебной системе даже с нашим законодательством за это светит реальный срок.
И я даже могу согласиться, что такие УИКи в малонаселенных районах, где все добровольно голосуют за ЕдРО, есть (хотя это ну ОЧЕНЬ притянуто за уши). Но, возникают следующие вопросы:
- как это объясняет, что процент проголосовавших за ЕдРо возрастает с явкой?
- как объяснить "пики" на "красивых цифрах" 50%, 55%,... проголосовавших за ЕдРо? Такого в принципе быть не может, хоть головой об стенку расшибитесь в поисках объяснения.
- как объяснить, что даже в Чечне (не говоря уже о других регионах), которая сплошь и рядом состоит из аулов, а не городов, на выборах 1996 ничего подобного не наблюдалось? Никакого подобного треша в графиках..

8) Говорят еще о том, что направляющая Голоса/Явка у ЕР отличается от других партий - она поднимается вверх. Но это говорит скорей о закономерности, чем о вмешательстве - иначе небыло бы ровной линии, а были бы скачки.
Скачки хорошо видны на первом графике. Автор предусмотрительно забывает о них. А отсутствие резких скачков на графике голос/явка - это прекрасный аргумент в пользу того, что настоящая явка имеет вид гауссовской кривой, а чем больше липовая явка - тем больше вбросов за ЕдРо.

  • 1