Wednesday, September 21, 2016

Выборы, выборы...

Не люблю писать про политику, но тут как-то обстоятельства обязывают. Наблюдаю много визга на тему фальсификаций недавних выборов, например, тут и тут. Не хочется вступаться за эти выборы. Но видимо, придётся.

Не хочу претендовать на какие-то лавры в математике или статистике, это не моя тема. Но собирать данные из Интернета я умею, и делиться ими в открытом доступе - тоже. Так что если что не так, смотрите исходники, правьте баги и пишите мне. Итак, начнём.

Для начала — вот данные о выборах с сайта Центризбиркома. Не очень доступно, но желающий там всё найдёт. Я выполнил всю нудную работу за Вас и вытащил эти данные в JSON. Что-то не так? Смотрите исходники, правьте баги, пишите мне. Я всё поправлю.

В руках у нас данные, что дальше? Давайте нарисуем те кривые, которые нарисовал слон.ру, "математически доказав", что выборы фальсифицированы. На горизонтальной оси — процент, набранный каждой из партий. На вертикальной — сумма голосов с участков с указанным процентом. Что мы наблюдаем? Не совсем получилось воспроизвести те кривые, что у слон.ру. Они немного похожи — ЕР лидирует с явным отрывом от остальных трёх партий. Только максимума ЕР достигает лишь на отметке 15%, а не выше. Дальше — строго по убывающей, никакой второй горки, как у слон.ру, не наблюдается. Кривая ЕР заметно отличается от кривых других партий — у распределения заметно длиннее правый хвост. При этом стоит заметить, что ни одна из кривых не похожа на естественное распределение (гауссиану). Я до сих пор не могу понять, почему слон.ру утверждает, что распределение должно быть естественным. Не мешало бы это объяснить, вместо того, чтобы констатировать это явление как научный факт и явный показатель фальсификаций.

Ладно, с первым набором кривых у меня не получилось. Может быть, это я накосячил. Помните исходники? Смотрите, правьте баги, я всё исправлю.

Теперь давайте второй набор кривых. Ось икс — явка на избирательном участке. Ось игрик — количество голосов с участка с данной явкой. Рисуем кривые — похоже, но не совсем. Безусловно, ЕР лидирует (а как же иначе). Первый горб где-то на 37% явки — тут всё совпадает. Второй горб тоже есть, но он не настолько значителен. Только у слон.ру это даже не горб, а горка, без убывающей. Не знаю, чем объяснить эти разногласия. Предполагаю, что слон.ру брал исходные данные у Центризбиркома, как и я — а где же ещё? Данные и метод их выкачивания я публикую в открытом виде, если я что-то прописал не так, то знающие люди увидят и поправят. То же самое и с рисованием кривых. У слона.ру не видно ни того, ни другого.

Не мешало бы выложить исходные данные, с которых рисовались кривые. И исходники тоже.  Делать какие-то выводы о выборах вне моей компетенции. Но давайте делиться исходными данными, так всем будет лучше.