Ero sivun ”Venäjän vaalit 2011” versioiden välillä

Opasnet Suomista
Siirry navigaatioon Siirry hakuun
p (Lisäanalyysia varten lisätty parsattua informaatiota)
pEi muokkausyhteenvetoa
 
(38 välissä olevaa versiota 3 käyttäjän tekeminä ei näytetä)
Rivi 1: Rivi 1:
{{tutkimus}}
[[en:Russian legislative election, 2011]]
[[Luokka:Yhteiskunta]]
[[Luokka:Venäjä]]
[[Luokka:Vaalit]]
[[Luokka:Katsastettavaa koodia]]
{{tutkimus|moderator=Jouni}}


'''Venäjän vaalit 2011''' käsittelee duuman vaaleja 4.11.2011.
'''Venäjän vaalit 2011''' käsittelee duuman vaaleja 4.12.2011.


==Tulos==
{{tiivistelmä
| kysymys = Mitä päätelmiä voidaan tehdä Venäjän duuman vaalien tuloksista?
| vastaus = Hallitsevana piirteenä tuloksissa on vaalipiirien tasolla näkyvä vahva yhteys Yhtenäisen Venäjän kannatuksen ja äänestysaktiivisuuden välillä. Vaikka pientä korrelaatiota voi olla rehellisissäkin vaaleissa, näyttää näissä vaaleissa korrelaatio niin vahvalta, ettei sitä voi selittää muuten kuin sillä, että uurniin on lisätty ylimääräisiä äänestyslippuja Yhtenäisen Venäjän hyväksi {{disclink|Top}}. Vaikutus näyttää huomattavan suurelta ja on se on lisännyt Yhtenäisen Venäjän kannatusta vaalien lopputuloksessa mahdollisesti jopa 10 - 15 prosenttiyksikköä todelliseen tilanteeseen nähden. Tarkkaa arviota vaikutuksesta ei tällä hetkellä ole.
}}


{{tuloslinkki}}


==Perustelut==
== Kysymys ==


* [http://www.vologod.vybory.izbirkom.ru/region/region/vologod?action=show&root=352000016&tvd=2352000326463&vrn=100100028713299&region=35&global=true&sub_region=35&prver=0&pronetvd=null&vibid=2352000326463&type=233 An election commission]
* Mitä päätelmiä voi tehdä Venäjän duuman vaalien (4.12.2011) tuloksista?
* [[Venäjän vaalit 2011 data|Äänestysdata Opasnet Basessa]]
* Data löytyy täältä: http://peregrins.com/elect/results.csv.gz


<pre>
*''What conclusions can be drawn from the election of the Russian duma (4.12.2011)?''
The election results
Elections to the State Duma of the Federal Assembly of the Sixth Convocation
Date of vote: 12/04/2011
Name of the Election Commission Babayevskaya
Date and time of signing the protocol 5/12/2011 9:00:00


#Column Name Translation of topic
V5 nVoters Number of voters included in voters list
V6 nBallots The number of ballots received by the precinct election commission
V7 nBallotsEarly The number of ballots issued to voters who voted early
V8 nBallotsPolling The number of ballots issued to voters at the polling
V9 nBallotsOutside The number of ballots issued to voters outside the polling station
V10 nBallotsCanceled The number of canceled ballots
V11 nBallotsMobile The number of ballots in mobile ballot boxes
V12 nBallotsStationary The number of ballots in the stationary ballot boxes
V13 nBallotsInvalid Number of invalid ballots
V14 nBallotsValid Number of valid ballots
V15 nAbsBallots The number of absentee ballots received by the precinct election commission
V16 nAbsBallotsPolling The number of absentee ballots issued to voters at a polling station
V17 nAbsBallotsVoted The number of voters who voted with absentee ballots at a polling station
V18 nAbsBallotsUnused The number of the unused absentee ballots
V19 nAbsBallotsTerr The number of absentee ballots issued to voters of the territorial election commission
V20 nAbsBallotsLost Number of lost absentee ballots
V21 nBallotsLost The number of lost ballots
V22 nBallotsNotrec The number of ballots not recorded in obtaining
V23 nVotesJustRussia 1. Political party JUST RUSSIA
V24 nVotesLibDemocr 2. Political Party "Liberal Democratic Party of Russia"
V25 nVotesPatriots 3. Political Party "PATRIOTS OF RUSSIA"
V26 nVotesCommunist 4. Political party "Communist Party of the Russian Federation"
V27 nVotesUniDemocr 5. A political party "Russian United Democratic Party" Yabloko "
V28 nVotesUniRussia 6. All-Russian Political Party "UNITED RUSSIA"
V29 nVotesCaseRight 7. All-Russian Political Party "CASE RIGHT"
</pre>


Original text
== Tulos ==


<pre>
Hallitsevana piirteenä tuloksissa on vaalipiirien tasolla näkyvä vahva yhteys Yhtenäisen Venäjän kannatuksen ja äänestysaktiivisuuden välillä. Vaikka pientä korrelaatiota voi olla rehellisissäkin vaaleissa, näyttää näissä vaaleissa korrelaatio niin vahvalta, ettei sitä voi selittää muuten kuin sillä, että uurniin on lisätty ylimääräisiä äänestyslippuja Yhtenäisen Venäjän hyväksi. Vaikutus näyttää huomattavan suurelta ja on se on lisännyt Yhtenäisen Venäjän kannatusta vaalien lopputuloksessa mahdollisesti jopa 10 - 15 prosenttiyksikköä todelliseen tilanteeseen nähden. Tarkkaa arviota vaikutuksesta ei tällä hetkellä ole. Ks. käynnissä olevat keskustelut [[Keskustelu:Venäjän_vaalit_2011 | Keskustelusivulta]].
Версия для печати
Сводная таблица результатов выборов
Выборы депутатов Государственной Думы Федерального Собрания Российской Федерации шестого созыва
Дата голосования:  04.12.2011
Наименование Избирательной комиссии Бабаевская
Сводная таблица результатов выборов
Сумма
1 Число избирателей, внесенных в список избирателей 18947
2 Число избирательных бюллетеней, полученных участковой избирательной комиссией 17294
3 Число избирательных бюллетеней, выданных избирателям, проголосовавшим досрочно 0
4 Число избирательных бюллетеней, выданных избирателям в помещении для голосования 9001
5 Число избирательных бюллетеней, выданных избирателям вне помещения для голосования 1761
6 Число погашенных избирательных бюллетеней 6532
7 Число избирательных бюллетеней в переносных ящиках для голосования 1761
8 Число избирательных бюллетеней в стационарных ящиках для голосования 8995
9 Число недействительных избирательных бюллетеней 201
10 Число действительных избирательных бюллетеней 10555
11 Число открепительных удостоверений, полученных участковой избирательной комиссией 795
12 Число открепительных удостоверений, выданных избирателям на избирательном участке 549
13 Число избирателей, проголосовавших по открепительным удостоверениям на избирательном участке 346
14 Число погашенных неиспользованных открепительных удостоверений 246
15 Число открепительных удостоверений, выданных избирателям территориальной избирательной комиссией 94
16 Число утраченных открепительных удостоверений 0
17 Число утраченных избирательных бюллетеней 0
18 Число избирательных бюллетеней, не учтенных при получении 0
19 1. Политическая партия СПРАВЕДЛИВАЯ РОССИЯ
20 2. Политическая партия "Либерально-демократическая партия России"
21 3. Политическая партия "ПАТРИОТЫ РОССИИ"
22 4. Политическая партия "Коммунистическая партия Российской Федерации"
23 5. Политическая партия "Российская объединенная демократическая партия "ЯБЛОКО"
24 6. Всероссийская политическая партия "ЕДИНАЯ РОССИЯ"
25 7. Всероссийская политическая партия "ПРАВОЕ ДЕЛО"
</pre>


''The dominant feature in the election results is the strong correlation between the voting activity and the support of the United Russia party. It is difficult to explain the strength of this correlation using the same statistical arguments that seem to hold for the other parties, e.g. more or less Gaussian probability distribution of the support percentage. To explain the anomaly the possibility of a systematic fraud has been considered leading to a rough estimate of 10-15% of manufactured votes based on the distribution of the votes. The plausibility of these assumptions is debated more thoroughly in the [[Keskustelu:Venäjän_vaalit_2011 | Discussion page]].''


===Data handling===


Note! The code does not work online, because a data file is needed. This code was used to upload the result version act_id = 3437.
== Perustelut ==


<rcode>
* Tämä osio perustelee Tuloksen kertomalla mistä vaalidata on saatu, miten datatiedostoja luetaan, ja millaisia analyysejä  ja johtopäätöksiä datasta on tehty.
library(OpasnetBaseUtils)
 
data <- read.table("c:/temp/results.csv", sep=",", header = FALSE)
* ''This section gives justification for the Result (Sect. Tulos) by explaining where the election data has been obtained, how to read the data files and how to analyze and interpret the data.''
data <- data[, -c(2,3,4)]
 
colnames(data) <- c("Region", "nVoters", "nBallots", "nBallotsEarly", "nBallotsPolling", "nBallotsOutside",
 
"nBallotsCanceled", "nBallotsMobile", "nBallotsStationary", "nBallotsInvalid", "nBallotsValid",
=== Vaalidata (eri lähteitä) - Data sources ===
"nAbsBallots", "nAbsBallotsPolling", "nAbsBallotsVoted", "nAbsBallotsUnused", "nAbsBallotsTerr",
 
"nAbsBallotsLost", "nBallotsLost", "nBallotsNotrec", "nVotesJustRussia", "nVotesLibDemocr",
{{tuloslinkki}}-linkin takaa löytyy Opasnet-tietokantaan talletetut vaalitulokset. Tarkemmat tiedot tiedostoformaatin rakenteesta on annettu [[Tiedostoformaatti_-_Duuma_2011 | täällä]]. Alkuperäinen datatiedosto löytyy csv-muodossa osoitteesta http://peregrins.com/elect/results.csv.gz .
"nVotesPatriots", "nVotesCommunist", "nVotesUniDemocr", "nVotesUniRussia", "nVotesCaseRight")
{{tuloslinkki}}''-link allows the user to download the election data from the Opasnet database. More information on the format of the election data file can be found [[Tiedostoformaatti_-_Duuma_2011 | here]]. The original election data in csv-format can be obtained from http://peregrins.com/elect/results.csv.gz .''
nVotes <- data[, 20:26]
 
nVoters <- data[, 2]
 
nParty <- 7
=== Vaalidata-analyysejä internetissä - Internet sources on election data analysis ===
nComm <- nrow(data) # 95067
 
temp <- cbind(nVoters, nVotes)
* [http://antonnikolenko.blogspot.com/2011/12/russian-legislative-elections-2011.html Russian legislative elections 2011 - statistical evidence of vote fraud.] (10.12.2011)
temp$Comm <- 1:nrow(temp)
* [http://antonnikolenko.blogspot.com/2011/12/venajan-vaalit-kusetuksen-tilastollinen.html Blogi: Venäjän vaalit - kusetuksen tilastollinen todentaminen] (8.12.2011)
head(temp)
* [http://eugenyboger.livejournal.com/4514.html An early blog in Russian]
temp <- reshape(temp, idvar = "Comm", times = colnames(temp)[1:(ncol(temp)-1)], timevar = "Parameter",  
* [http://eugenyboger.livejournal.com/5057.html More analysis in the same blog]
varying = list(colnames(temp)[1:(ncol(temp)-1)]), v.names = "Result", direction = "long")
 
head(temp)
 
op_baseWrite("opasnet_base", temp, ident = "Op_fi2768", name = "Venäjän vaalit 2011", unit = "#", objtype_id = 1, who = "Jouni", acttype = 4)
=== Havaintoja jotka tukevat Tulosta - Observations which support the Result (Sect. Tulos) ===
 
* Äänestysdatan tilastollisissa analyyseissa (ks. alla) huomiota ovat kiinnittäneet erityisesti seuraavat havainnot
*# Suuri poikkeama Gaussisen jakauman muodosta joka erityisesti suurten äänestysprosenttien kohdalla ei lähesty nollaa vaan kasvaa 100% aktiivisuutta lähestyttäessä (ks. kuva kappaleessa Äänestysprosenttijakauma Suomessa ja Venäjällä)
*# Luonnolliselta vaikuttava lokaali maksimi n. 20-40% kohdalla Yhtenäisen Venäjän monissa aluekohtaisissa äänestystuloksissa (ks. kuvat kappaleessa Kannatusjakautumia Venäjän vaaleista)
*# Kannatusprosenttien piikittyminen ei-satunnaisessa prosenttilukujoukossa kannatusjakatuman hännässä (ks. kappale Tasakannatusfiltteröity data).
* Karkea arvio vaaleissa yleensä toteutuvasta (lähes) Gaussisesta jakatumasta poikkeavasta todennäköisyysmassasta johtaa n. 10-15% varovaiseen arvioon, jota on käytetty osiossa Tulos. Gaussisten jakautumien esiintymistä perustellaan yksityiskohtaisemmin [[Suurten lukujen laki vaalistatistiikalle | täällä]]
*
* ''Statistical analysis (see below) of the election data has drawn attention especially to the following observations''
*# ''Large deviations from the Gaussian distribution in the long tail part of the distribution which does not go to zero but grows when approaching 100% activity (see fig. in Sect. Overall voting activity in Finland and Russia)''
*# ''Seemingly natural local maximum at 20-40% support range for United Russia in several local election commission results (see figs. in Sect. Party support in Russian duma elections 2011)''
*# ''Non-zero concentration of election sites for extremely narrow bin sizes at nonrandom set of support percentages in the tail part of the distribution (see Sect. Binning data using extremely narrow bin sizes)''
* ''A rough estimate of the probability mass diviant from the (approximately) Gaussian distribution, which is usually to be expected in fair elections leads to the 10-15% estimate used in Sect. Result (Tulos). The emergence of Gaussian distributioons is justified in more detail [[Suurten lukujen laki vaalistatistiikalle | here]].''
 
 
=== Vertailua Suomen eduskuntavaaleihin 2011 - Comparison with Finnish parlamentary election 2011 ===
 
 
<br />'''1. Regressioanalyysiä - Regression analysis'''
 
* Tämä osio sisältää vaalidatasta tehtyjä regressioanalyysituloksia. Sinun ei tarvitse ajaa mallia uudestaan (se kestää muutamia minuutteja), koska tulokset löytyvät valmiiksi laskettuna tästä: [http://fi.opasnet.org/fi_wiki/index.php/Special:R-tools?id=2Z3bmKA4kkE4itV]
* ''This section contains regression analysis of the election data. You don't need to run the model (it will take a few minutes) because you can familiarize yourself with the pre-run results at [http://fi.opasnet.org/fi_wiki/index.php/Special:R-tools?id=2Z3bmKA4kkE4itV]''
 
 
'''2. Äänestysprosenttijakauma Suomessa ja Venäjällä - Overall voting activity in Finland and Russia'''
 
* Alla oleva kuva on tuotettu koodilla, jonka voit kopioida omaan R-kääntäjääsi klikkaamalla tekstilinkkiä 'Näytä koodi' alla. Ajopainike ei ole käytössä.
* ''The picture below has been produced using the code which can be copied to your own R environment by copy pasting it by clicking the text 'Näytä koodi' below. Run code button is redundant.''
 
<rcode graphics="1" label="Koodi ajettava omalla koneella">
 
library(OpasnetUtils)
library(ggplot2)
 
# Download data and reshape it for analyses.
 
data <- opbase.data("Op_fi2768")[, -c(1, 2, 6)]
 
out <- reshape(data, timevar = "Parameter", idvar = "Comm", times = "Result", varying = list(levels(data$Parameter)), direction = "wide")
head(out)
 
suomi <- opbase.data("Op_fi2792")[, -c(1,2)]
suomidata <- data.frame(maa = "Suomen eduskuntavaalit 2011", Äänestysprosentti = suomi$Result, paino = 1/sum(suomi$Result))
venäjä <- (out[, 11] + out[, 12])/out[, 3]*100
venäjädata <- data.frame(maa = "Venäjän duumanvaalit 2011", Äänestysprosentti = venäjä, paino = 1/sum(venäjä))
kuvadata <- rbind(suomidata, venäjädata)
ggplot(kuvadata, aes(x=Äänestysprosentti, weight = paino*1000, fill = maa)) +geom_density(alpha = 0.4)
 
# Calculate the voting activity and plot a graph.
 
out$Activity <- rowSums(out[, 3:9])/out$nVoters
ggplot(out, aes(x = Activity, weight = 1)) +geom_density()
 
# Calculate support fractions for different parties.
 
fractions <- out[, 3:9]/rowSums(out[, 3:9])
fractions$Activity <- out$Activity
fractions$nVoters <- out$nVoters
 
# Run linear regression models to find possible correlations between support and voting activity.
 
res <- list()
res[[1]] <- lm(nVotesCaseRight ~ Activity, data = fractions, weight = nVoters)
res[[2]] <- lm(nVotesCommunist ~ Activity, data = fractions, weight = nVoters)
res[[3]] <- lm(nVotesJustRussia ~ Activity, data = fractions, weight = nVoters)
res[[4]] <- lm(nVotesLibDemocr ~ Activity, data = fractions, weight = nVoters)
res[[5]] <- lm(nVotesPatriots ~ Activity, data = fractions, weight = nVoters)
res[[6]] <- lm(nVotesUniDemocr ~ Activity, data = fractions, weight = nVoters)
res[[7]] <- lm(nVotesUniRussia ~ Activity, data = fractions, weight = nVoters)
cat("Linear regression analysis for CaseRight. \n")
oprint(summary(res[[1]]))
cat("Linear regression analysis for Communist. \n")
oprint(summary(res[[2]]))
cat("Linear regression analysis for JustRussia. \n")
oprint(summary(res[[3]]))
cat("Linear regression analysis for LibDemocr. \n")
oprint(summary(res[[4]]))
cat("Linear regression analysis for Patriots. \n")
oprint(summary(res[[5]]))
cat("Linear regression analysis for UniDemocr. \n")
oprint(summary(res[[6]]))
cat("Linear regression analysis for UniRussia. \n")
oprint(summary(res[[7]]))
 
# Plot scatter plots about activity (x) and party support (y).
 
plot(fractions$Activity, fractions$nVotesCaseRight)
plot(fractions$Activity, fractions$nVotesCommunist)
plot(fractions$Activity, fractions$nVotesJustRussia)
plot(fractions$Activity, fractions$nVotesLibDemocr)
plot(fractions$Activity, fractions$nVotesPatriots)
plot(fractions$Activity, fractions$nVotesUniDemocr)
plot(fractions$Activity, fractions$nVotesUniRussia)
 
# Calculate party support for one percentage bins and count.
 
fractions$Activity <- round(fractions$Activity*100)
temp <- as.data.frame(as.table(tapply(fractions$nVotesCaseRight, fractions$Activity, mean)))
ggplot(temp, aes(x = Var1, weight = Freq)) +geom_bar()
temp <- as.data.frame(as.table(tapply(fractions$nVotesCommunist, fractions$Activity, mean)))
ggplot(temp, aes(x = Var1, weight = Freq)) +geom_bar()
temp <- as.data.frame(as.table(tapply(fractions$nVotesJustRussia, fractions$Activity, mean)))
ggplot(temp, aes(x = Var1, weight = Freq)) +geom_bar()
temp <- as.data.frame(as.table(tapply(fractions$nVotesLibDemocr, fractions$Activity, mean)))
ggplot(temp, aes(x = Var1, weight = Freq)) +geom_bar()
temp <- as.data.frame(as.table(tapply(fractions$nVotesPatriots, fractions$Activity, mean)))
ggplot(temp, aes(x = Var1, weight = Freq)) +geom_bar()
temp <- as.data.frame(as.table(tapply(fractions$nVotesUniDemocr, fractions$Activity, mean)))
ggplot(temp, aes(x = Var1, weight = Freq)) +geom_bar()
temp <- as.data.frame(as.table(tapply(fractions$nVotesUniRussia, fractions$Activity, mean)))
ggplot(temp, aes(x = Var1, weight = Freq)) +geom_bar()
 
</rcode>
 
[[kuva:Äänestysaktiivisuus duuma-eduskunta.png|thumb|center|500px]]
 
=== Kannatusjakautumia Venäjän vaaleista - Party support in Russian duma elections 2011 ===
 
* Tämä analyysi muuttuu vähitellen hienosyisemmäksi kuten etenet sivua alaspäin. Tässä yksinkertaisesti suodatetaan haluttu data ja kuvataan se. Tarkoitus on ladata data Opasnet-kantaan, jolloin voit ajaa analyysit yksinkertaisesti nappia painamalla. Vielä tämä ei toimi, vaan joudut kopioimaan koodin omalle koneellesi ja ajamaan sen R:llä siellä.
* ''The analysis programs get progressively more sophisticated as you scroll down the page. This is the simplest analysis model which basically allows you to filter the data and make some nice plots. You can compare the statistics of different parties in different regions of Russia. We will upload the data file into the Opasnet data base so that you can simply run the program by pressing the button below (does not work quite yet! In the meanwhile you can install R on your own computer and download the input data file from the bottom of the page manually.)''
 
 
<rcode label="Koodi ajettava omalla koneella">
 
# Read input file
#
election <- read.table(file="~/Duuma2011/results.csv", sep=",")
 
# Check how many regional units there are. First find min and max
#
min(election[,1]); max(election[,1])
# returns 1, 99
#
# Then check if there are numbers missing between min and max is missing:
#
av22 <- 1:99; for(i in 1:99) {av22[[i]] <- as.numeric(any(election[,1] == i))}; av22
#
# Missing regional codes are
#
missing <- which(av22 == 00)
# This gives missing = (41 59 75 80 81 82 84 85 88 93 94 95 96 97 98)
#
# Accepted regional codes are
#
av23 <- av22*(1:99); accepted <- av23[av23 !=0]
 
# Check how many commissions there are in a state (in the largest enumerated
# regional unit)
#
av <- c(rep(0,99)); for(i in 1:length(av)) {av[[i]] <- sum(as.numeric(election[,1] == i))}
#
# as a check, indeed sum(av) = dim(election)[1]
 
# Remove zeroes:
#
avr <- av[av !=0]
 
# Form vector bv that contains the end points of each interval (all
# commissions in a region).
#
# Max values of intervals
#
bF <- list(1:length(avr)); for(i in 1:length(avr)) {bF[[i]] <- avr[[i]]}; for(i in 2:length(avr)) {bF[[i]] <- bF[[i]] + bF[[i-1]]}
#
# Min values of intervals:
#
bB <- list(1:length(avr)); for(i in 2:length(avr)) {bB[[i]] <- bF[[i-1]] + 1}; bB[[1]] <- 1
#
# Form intervals:
#
intervals <- list(1:length(avr)); for(i in 1:length(avr)) {intervals[[i]] <- c(bB[[i]], bF[[i]])}; intervals <- unlist(intervals)
 
# List of names of the regions to be analyzed
#
regnames <- election[intervals,2]
 
# Rows 13 and 14 will be used for estimating the number of cast votes (valid
# and invalid cast ballots), row 5 gives the total number of voters.
 
# Voting activity (includes state-level averages associated with no polling
# station. Should not matter because it will contribute to the center
# of the distribution function)
#
# Mark locations with less voters than 50 (1193 polling stations)
#
mark <- which(election[,5] < 50)
#
normalization <- election[,5]
# normalization[mark] <- 1000000000
#
# Compute voting activity:
#
Activity <- 100*(election[,13] + election[,14])/normalization
 
# Bin the results
#
bin.info <- seq(0,100,0.5)
hist(Activity, breaks=bin.info)
 
# Determine results by party
#
ActivityJR <- 100*election[,23]/normalization
ActivityLD <- 100*election[,24]/normalization
ActivityPR <- 100*election[,25]/normalization
ActivityCR <- 100*election[,26]/normalization
ActivityYAB <- 100*election[,27]/normalization
ActivityUR <- 100*election[,28]/normalization
ActivityCAR <- 100*election[,29]/normalization
 
# Plotting results for 4 largest parties
#
par(mfrow=c(4,1))
hist(ActivityJR, breaks=bin.info)
hist(ActivityLD, breaks=bin.info)
hist(ActivityCR, breaks=bin.info)
hist(ActivityUR, breaks=bin.info)
 
# Results for individual areas
# The allowed region codes can be obtained from the variable 'accepted'
# calculated above. Their meaning can be obtained from the page
# 'Hallintoalueet_Duuma_2011' of Opasnet. For convinience, they are given
# below:
# 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
# 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 42 43 44 45 46 47
# 48 49 50 51 52 53 54 55 56 57 58 60 61 62 63 64 65 66 67 68 69 70 71
# 72 73 74 76 77 78 79 83 86 87 89 90 91 92 99
 
# Regional influences can be studied by substituting for N below a number
# from the list above:
#
# regNcol <- which(election[,1] == N); electionN <- election[regNcol,]
#
# Automating the calculation for different regions
 
ActivityJRregion <- list(1:length(accepted));
ActivityLDregion <- list(1:length(accepted));
ActivityPRregion <- list(1:length(accepted));
ActivityCRregion <- list(1:length(accepted));
ActivityYABregion <- list(1:length(accepted));
ActivityCARregion <- list(1:length(accepted));
for(i in 1:length(accepted)) {regNcol <- which(election[,1] == accepted[[i]]);
normalization <- election[regNcol,5];
ActivityJRregion[[i]] <- 100*election[regNcol,23]/normalization;
ActivityLDregion[[i]] <- 100*election[regNcol,24]/normalization;
ActivityPRregion[[i]] <- 100*election[regNcol,25]/normalization;
ActivityCRregion[[i]] <- 100*election[regNcol,26]/normalization;
ActivityYABregion[[i]] <- 100*election[regNcol,27]/normalization;
ActivityURregion[[i]] <- 100*election[regNcol,28]/normalization;
ActivityCARregion[[i]] <- 100*election[regNcol,29]/normalization}


</rcode>
</rcode>


===Hierarchial Bayesian model===


:''Model file: [[:file:RussianElections2011.ods]].
 
'''1. Neljän suurimman puolueen kannatusvertailu - Comparison of the support of four largest parties
 
* Neljän suurimman puolueen kannatusprosentit (x-akseli) eri äänestysalueilla ja äänestysalueiden määrä (y-akseli).
* ''Here is a picture of the 4 biggest parties in Russia. The x-axis shows the percentage of votes cast at the polling station and the y-axis shows the number of polling stations corresponding to the percentage.'' <br />
 
 
[[Image:comp_4_parties_all.png|center|400x240px]]
 
 
 
 
'''2. Kahden suurimman puolueen aluekohtainen kannatusvertailu - Comparison of the local support of two largest parties
 
* Kuvasarja, joissa tarkastellaan kannatusprosentteja kahden suurimman puolueen (Yhtenäinen Venäjä oikealla ja Kommunistinen puolue vasemmalla) osalta Venäjän eri alueilla. Tulokset (ylhäältä alas) pätevät seuraaville tasavalloille ja alueille: Adygea, Bashkortostan, Dagestan, Kabardino-Balkar, Karachai-Cherkess, Komi, Mordovia ja Pohjois-Ossetia. Nämä edustavat ensimmäistä viittätoista paritonta aluekoodinumeroa [[Hallintoalueet Duuma 2011 | listassa]].
* ''A series of pictures comparing the voting activity of the Unified Russia (pictures on the right) party with the second largest Communist Party (pictures on the left). The data has been calculated in the regions of (top down) The Republic of Adygea, Republic of Bashkortostan, The Republic of Dagestan, Kabardino-Balkar Republic, Karachai-Cherkess Republic, The Republic of Komi, The Republic of Mordovia and The Republic of North Ossetia. These represent the first odd-valued [[Hallintoalueet Duuma 2011 | region codes]] less than or equal to 15.''
 
 
 
[[Image:picCR_1.png|left|400x240px]] [[Image:picUR_1.png|center|400x240px]]
[[Image:picCR_3.png|left|400x240px]] [[Image:picUR_3.png|center|400x240px]]
[[Image:picCR_5.png|left|400x240px]] [[Image:picUR_5.png|center|400x240px]]
[[Image:picCR_7.png|left|400x240px]] [[Image:picUR_7.png|center|400x240px]]
[[Image:picCR_9.png|left|400x240px]] [[Image:picUR_9.png|center|400x240px]]
[[Image:picCR_11.png|left|400x240px]] [[Image:picUR_11.png|center|400x240px]]
[[Image:picCR_13.png|left|400x240px]] [[Image:picUR_13.png|center|400x240px]]
[[Image:picCR_15.png|left|400x240px]] [[Image:picUR_15.png|center|400x240px]]
 
 
 
 
 
 
 
'''3. Tasakannatusfiltteröity data - Binning data using extremely narrow bin sizes'''
 
* Tässä esitetään histogrammit kunkin puolueen kannatuksesta [%], jos jokin puolue sai promillen tarkkuudella jonkin seuraavista "tasakannatuksista" (0.5,0.6,0.666,0.7,0.75,0.8,0.95,1.00)*100%). Filtteröinti antaa varsin mielenkiintoisen 'kamman' Yhtenäiselle Venäjälle.
 
* ''The histograms showing the supporp ercentage of each party is shown for an extremely narrow bin size at nonrandom set of support percentages belonging to the set (0.5,0.6,0.666,0.7,0.75,0.8,0.95,1.00)*100%). The binning results in an interesting structure for the support of the United Russia party.''
 
 
 
 
 
=== Hierarkkinen Bayes-malli - Hierarchial Bayesian model ===
 
Malli<ref name = karcklinLe> [https://docs.google.com/viewer?a=v&q=cache:YZJk94dDcnEJ:www.cnbc.cmu.edu/cplab/papers/Karklin-Lewicki-NC05-preprint.pdf+solving+hierachical+bayes+model&hl=fi&gl=fi&pid=bl&srcid=ADGEESivSqLNfgWkW4pomK19gbaK2GqDi1fzPSMnoBjS4HFQazLjk--LYLZrYkz8NwVJKBjCdkgj9KQ1mbdraf6Gx1yEUUQhLAmk_UlZBsIdQnQE5Q1SD4MjiwsAsf3ToLpkUcootSg5&sig=AHIEtbSD4hMIAg6RtfJIKThLSABDl-unUw Y.Karklin and M.S. Lewicki: ''A hierarchical Bayesian model for learning nonlinear statistical regularities in non-stationary natural signals'' (Neural computation)] </ref> <ref name = intro2HBmodel> [https://docs.google.com/viewer?a=v&q=cache:YeiEb8VYKbUJ:home.uchicago.edu/~grynav/bayes/ABSLec10.ppt+Hierarchial+bayesia+model&hl=fi&gl=fi&pid=bl&srcid=ADGEESgaphm_MMoCm0NGR0-gaxtQP_m2sf97apIfzJIr6sww82KEobb33M6gX1ydSIom0AfOZ6kg1pUxUD-JYXf_d35Bo7ihaYlL-zFi69K7TfmLa5kFEuJvGP0ukFwbvrjj0TC5v4p7&sig=AHIEtbQepMgGh-vhbVfnXAv04DVvNPz7sQ ''Introduction to hierarchical models''] (WinBugs implementation) </ref> <ref name = HBmodAllenby> [https://docs.google.com/viewer?a=v&q=cache:EJ5WR46dOaEJ:www.terry.uga.edu/~rgrover/chapter_20.pdf+hierarchical+bayesian+modeling&hl=fi&gl=fi&pid=bl&srcid=ADGEESi09Jr_5nqtCoFsKGXFq82WLMlrrbd4KIY5GHW8ZtrGf2y3FqPELlMJcVRNCBM9tKmBebmzQnywg9g2Wp_fSZM4fdvn9PbUCtKtUC3i8918EN7bLlnbW-Fj6WIhNQmkUC2WiVrz&sig=AHIEtbTBSzYcO1DYibWfaFdqlSiTwBA5GQ G.M. Allenby and P.E. Rossi: ''Hierarchical Bayes model''] </ref> <ref name = empBayes> [http://en.wikipedia.org/wiki/Empirical_Bayes_method Wikipedia: ''Empirical Bayes method''] (Self-consistent determination of the prior distribution) </ref> <ref name = disinteg> [http://en.wikipedia.org/wiki/Disintegration_theorem Wikipedia: Disintegration theorem] </ref> <ref name = condprob> [http://en.wikipedia.org/wiki/Conditioning_%28probability%29 Wikipedia:Conditioning probabability density] </ref> perustuu seuraaviin oletuksiin:
* Jokaisella äänestysalueella jokin määrä ihmisiä tulee äänestämään (nHonest[i]). Tämä määrä riippuu erilaisista satunnaisista tekijöistä, jolloin suuressa joukossa voidaan sanoa, että kyseessä on binomijakauma, joka riippuu kahdesta asiasta: äänioikeutettujen määrästä (nVoters[i]) ja yksittäisen äänestäjän todennäköisyydestä tulla äänestämään (Activity[i]).
* Se, mikä on yksittäisen äänestäjän todennäköisyys tulla äänestämään jollakin äänestysalueella on myös riippuvainen suuresta joukosta satunnaisia tekijöitä, jotka vaihtelevat äänestysalueiden välillä. Niinpä voidaan sanoa, että tämä todennäköisyys on satunnaisesti jakautunut beetajakauman mukaisesti parametreilla ActA ja ActB. Mallissa oletetaan, että eri äänestysalueiden välillä ei ole sellaista systemaattista eroa, joka estäisi beetajakauman käytön. Huomaa, että valheelliset äänet selkeästi ovat tällainen systemaattinen ero, mutta se huomioidaan toisaalla mallissa ja tässä tarkastellaan ainoastaan rehellisiä ääniä.
* Jokaisella puolueella on jokin kansallinen kannatusprosentti (support[j]). Tämä kuitenkin vaihtelee äänestysalueesta toiseen mutta sillä tavalla satunnaisesti, että tätä satunnaisuutta voidaan kuvata äänestysaluekohtaisen dirichlet-jakauman avulla. Se montako ääntä kukin puolue kullakin äänestysalueella saa (nHonest2[i,j]), riippuu tästä puolue- ja äänestysaluekohtaisesta todennäköisyydestä ja toisaalta kokonaisäänimäärästä multinomijakauman mukaisesti.
* Jos vaalit ovat rehelliset, tämä malli pystyy arvioimaan puoluekohtaiset kannatusprosentit sekä koko maahan että jokaiselle äänestysalueelle. Koska alustavien tarkastelujen perusteella äänestysprosentit eivät noudata tilastollisia lakeja, on mitä todennäköisimmin joukossa väärennettyjä vaalilippuja. Näiden määrä (nFabr[i,j]) pystytään arvioimaan siten, että vaalipiiri- ja puoluekohtaisesti katsotaan äänimääriä ja arvioidaan, poikkeaako tulos siitä mitä sen pitäisi edellä kuvattujen tilastollisten lakien perusteella olla. Oletusarvo on, että vaalivilppi on hyvin epätodennäköistä (pFabr[i,j]), joten vaalipiirin tuloksen pitää poiketa huomattavan paljon siitä, mitä tilastollisesti voisi olla odotettavissa. Jos tällainen suuri poikkeama kuitenkin nähdään, oletetaan, että epäillyn puolueen liiat äänet johtuvat väärennetyistä vaalilipuista.


[[Tiedosto:Venäjän vaalit 2011 malli.png|thumb|500px|center|The model file: [[:file:RussianElections2011.ods]].]]
[[Tiedosto:Venäjän vaalit 2011 malli.png|thumb|500px|center|The model file: [[:file:RussianElections2011.ods]].]]
* Kuvassa esitettyjen mallin muuttujien selitykset saat kun klikkaat linkkiä alla olevaa linkkiä 'Näytä koodi'. Ajopainikkeella ei tässä yhteydessä ole merkitystä.
* ''Explanation of the symbols in the picture above is obtained by clicking the link 'Näytä koodi' below. Run code button is redundant.''
<rcode label="Koodi ei ole ajettava">


  Constants:
  Constants:
Rivi 137: Rivi 380:
  nFabr[i,j] = Number of fabricated votes for party j in electoral commission i.  
  nFabr[i,j] = Number of fabricated votes for party j in electoral commission i.  
     If Fabr[i,j] is 1, then nTotal[i,j] - nHonest[i,j], else 0.
     If Fabr[i,j] is 1, then nTotal[i,j] - nHonest[i,j], else 0.
</rcode>
   
   


<pre>
* Hierarkisen mallin R-koodiin voi tutustua klikkaamalla alla olevaa linkkiä 'Näytä koodi'.
model{
 
* You can familiarize yourself with the R code of the hierarchial Bayes model by clicking the link 'Näytä koodi' below.
 
 
<rcode name='RussianElection2011' label="Koodi ei toimi">
library(OpasnetBaseUtils)
library(rbugs)
library(coda)
 
cat("Download data. \n")
 
data <- op_baseGetData("opasnet_base", "Op_fi2768")[, -c(1, 2, 6)]
out <- reshape(data, timevar = "Parameter", idvar = "Comm", times = "Result", varying = list(levels(data$Parameter)), direction = "wide")
head(out)
out <- out[1:20, ]
nVotes <- out[, c("nVotesJustRussia", "nVotesLibDemocr", "nVotesPatriots", "nVotesCommunist",
"nVotesUniDemocr", "nVotesUniRussia", "nVotesCaseRight")]
 
election.data <- list(
nParty    = 7,
nComm    = nrow(out),
nVoters  = out$nVoters,
nVotes    = nVotes,
nVotedata = nVotes)
 
election.model <- "model{
for( i in 1 : nComm ) {
for( j in 1 : nParty ) {
Fabr[i , j] ~ dbern(pFabr[i , j])
nFabr[i , j] ~ dunif(0, nVotedata[i , j])
nHonest2[i , j] ~ dmulti(support[j], nHonest[i])
pFabr[i , j] ~ dbeta(0.05, 10)
nVotesl[i , j] <- nHonest2[i , j] + nFabr[i , j] * Fabr[i , j]
}
Activity[i] ~ dbeta(ActA, ActB)C(0,1)
}
for( j in 1 : nParty ) {
for( j in 1 : nParty ) {
for( i in 1 : nComm ) {
alpha[j] ~ dunif(0.001, 10000)
Fabr[j , i] ~ dbern(pFabr[j , i])
nVotes[j , i] ~ dbin(0.0, 1.0E-6)
pFabr[j , i] ~ dbeta(0.01, 10)
nFabr[j , i] <- Fabr[j , i] * (nVotes[j , i] - nHonest2[j , i])
}
}
}
for( i in 1 : nComm ) {
for( i in 1 : nComm ) {
Activity[i] ~ dbeta(ActA, ActB)C(0,1)
nHonest2[1:nParty, i] ~ dmulti(support[1:nParty], nHonest[i])
nHonest[i] ~ dbin(Activity[i], nVoters[i])
nHonest[i] ~ dbin(Activity[i], nVoters[i])
}
}
for( j in 1 : nParty ) {
for( j in 1 : nParty ) {
alpha[j] ~ dunif(0.001, 10000)
support[j] ~ ddirich(alpha[j])
support[j] ~ ddirich(alpha[j])
}
}
Rivi 161: Rivi 433:
ActB ~ dunif(1, 1000)
ActB ~ dunif(1, 1000)
}
}
</pre>
"
 
inits <- list(ActA = 1, ActB = 1, alpha = 1, support = 0.1)
parameters <- c("support", "alpha")
election.sim <- bugs.run(data = election.data, list(inits), parameters, election.model, n.chains = 1, n.iter = 1000)
 
## MCMC Analysis
election.mcmc <- as.mcmc(election.sim$chain1)
summary(election.mcmc)
effectiveSize(election.mcmc)
 
</rcode>
 


{{vastusta|#: |The compilation of the model produces this error message: "vector-valued relation nHonest2 must involve consecutive elements of variable." Who can help to sort this out?|--[[Käyttäjä:Jouni|Jouni Tuomisto]] 19. joulukuuta 2011 kello 15.30 (EET)}}
* Hierarkisen Bayes-mallin koodi ei vielä täysin toimi klikkaamalla yllä olevaa ajopainiketta, koska syötteenä tarvitaan dataa toisesta analyysistä.) Malli käyttää hyväkseen kirjastorutiinia [http://cran.r-project.org/web/packages/rbugs/rbugs.pdf rbugs].


* ''The R code of the Hierarchial Bayes model does not work fully yet by clicking the Run code button above because it uses example data from another analysis). The model uses the package [http://cran.r-project.org/web/packages/rbugs/rbugs.pdf rbugs].''
: {{vastusta|#: |The compilation of the model produces this error message: "vector-valued relation nHonest2 must involve consecutive elements of variable." Who can help to sort this out?|--[[Käyttäjä:Jouni|Jouni Tuomisto]] 19. joulukuuta 2011 kello 15.30 (EET)}}


== Katso myös==
== Katso myös==


* [[Hallintoalueet Duuma 2011]]
* [[Hallintoalueet Duuma 2011]]
* Mallitiedosto hierakiselle Bayes-mallille: [[:file:RussianElections2011.ods]] (Model file for the hiearchial Bayes model)
* [[Venäjän vaalit 2011 data]] (myöhempää käyttöä varten - for later use)
* [[:en:Russian legislative election, 2011]]
'''Venäjän presidentinvaalit 2012
*[http://translate.google.com/translate?hl=en&sl=auto&tl=en&u=http%3A%2F%2Fru.wikipedia.org%2Fwiki%2F%25D0%259F%25D1%2580%25D0%25B5%25D0%25B7%25D0%25B8%25D0%25B4%25D0%25B5%25D0%25BD%25D1%2582%25D1%2581%25D0%25BA%25D0%25B8%25D0%25B5_%25D0%25B2%25D1%258B%25D0%25B1%25D0%25BE%25D1%2580%25D1%258B_%25D0%25B2_%25D0%25A0%25D0%25BE%25D1%2581%25D1%2581%25D0%25B8%25D0%25B8_%282012%29]
*[ http://www.vybory.izbirkom.ru/region/region/izbirkom?action=show&amp;root=1&amp;tvd=100100031793509&amp;vrn=100100031793505&amp;region=0&amp;global=1&amp;sub_region=0&amp;prver=0&amp;pronetvd=null&amp;vibid=100100031793509&amp;type=226]
*[http://www.adygei.vybory.izbirkom.ru/region/izbirkom?action=show&root=14002001&tvd=4014002129094&vrn=4014002129089&prver=0&pronetvd=null&region=1&sub_region=0&type=426&vibid=4014002129094]
*[http://www.cikrf.ru/banners/prezident_2012/index.html]
*[wciom.ru/index.php?id=168]
*[http://www.vologod.vybory.izbirkom.ru/region/vologod?action=show&global=1&vrn=100100031793505&region=35&prver=0&pronetvd=null]
*[http://www.guardian.co.uk/news/datablog/interactive/2012/mar/05/russia-election-results-map?newsfeed=true]
*[https://docs.google.com/spreadsheet/ccc?key=0AsdY-3hzSftCdE1xSkF5RXNWNHFjekktOEF2ZnI1Ync#gid=0]
*[http://www.johnmyleswhite.com/notebook/2010/08/20/using-jags-in-r-with-the-rjags-package/ JAGS]
* [http://dl.dropbox.com/u/792906/R/Russia_elections_20111212b.R Script for scraping Russian elections data]
* [http://www.tietoviikko.fi/kaikki_uutiset/article738501.ece EU linjaa: data avoimeksi]
== Viitteet ==
<references/>





Nykyinen versio 22. elokuuta 2013 kello 10.03




Venäjän vaalit 2011 käsittelee duuman vaaleja 4.12.2011.

Pääviesti
Kysymys:

Mitä päätelmiä voidaan tehdä Venäjän duuman vaalien tuloksista?

Vastaus:

Hallitsevana piirteenä tuloksissa on vaalipiirien tasolla näkyvä vahva yhteys Yhtenäisen Venäjän kannatuksen ja äänestysaktiivisuuden välillä. Vaikka pientä korrelaatiota voi olla rehellisissäkin vaaleissa, näyttää näissä vaaleissa korrelaatio niin vahvalta, ettei sitä voi selittää muuten kuin sillä, että uurniin on lisätty ylimääräisiä äänestyslippuja Yhtenäisen Venäjän hyväksi D↷. Vaikutus näyttää huomattavan suurelta ja on se on lisännyt Yhtenäisen Venäjän kannatusta vaalien lopputuloksessa mahdollisesti jopa 10 - 15 prosenttiyksikköä todelliseen tilanteeseen nähden. Tarkkaa arviota vaikutuksesta ei tällä hetkellä ole.


Kysymys

  • Mitä päätelmiä voi tehdä Venäjän duuman vaalien (4.12.2011) tuloksista?
  • What conclusions can be drawn from the election of the Russian duma (4.12.2011)?


Tulos

Hallitsevana piirteenä tuloksissa on vaalipiirien tasolla näkyvä vahva yhteys Yhtenäisen Venäjän kannatuksen ja äänestysaktiivisuuden välillä. Vaikka pientä korrelaatiota voi olla rehellisissäkin vaaleissa, näyttää näissä vaaleissa korrelaatio niin vahvalta, ettei sitä voi selittää muuten kuin sillä, että uurniin on lisätty ylimääräisiä äänestyslippuja Yhtenäisen Venäjän hyväksi. Vaikutus näyttää huomattavan suurelta ja on se on lisännyt Yhtenäisen Venäjän kannatusta vaalien lopputuloksessa mahdollisesti jopa 10 - 15 prosenttiyksikköä todelliseen tilanteeseen nähden. Tarkkaa arviota vaikutuksesta ei tällä hetkellä ole. Ks. käynnissä olevat keskustelut Keskustelusivulta.

The dominant feature in the election results is the strong correlation between the voting activity and the support of the United Russia party. It is difficult to explain the strength of this correlation using the same statistical arguments that seem to hold for the other parties, e.g. more or less Gaussian probability distribution of the support percentage. To explain the anomaly the possibility of a systematic fraud has been considered leading to a rough estimate of 10-15% of manufactured votes based on the distribution of the votes. The plausibility of these assumptions is debated more thoroughly in the Discussion page.


Perustelut

  • Tämä osio perustelee Tuloksen kertomalla mistä vaalidata on saatu, miten datatiedostoja luetaan, ja millaisia analyysejä ja johtopäätöksiä datasta on tehty.
  • This section gives justification for the Result (Sect. Tulos) by explaining where the election data has been obtained, how to read the data files and how to analyze and interpret the data.


Vaalidata (eri lähteitä) - Data sources

{{#opasnet_base_link:Op_fi2768}} -linkin takaa löytyy Opasnet-tietokantaan talletetut vaalitulokset. Tarkemmat tiedot tiedostoformaatin rakenteesta on annettu täällä. Alkuperäinen datatiedosto löytyy csv-muodossa osoitteesta http://peregrins.com/elect/results.csv.gz . {{#opasnet_base_link:Op_fi2768}} -link allows the user to download the election data from the Opasnet database. More information on the format of the election data file can be found here. The original election data in csv-format can be obtained from http://peregrins.com/elect/results.csv.gz .


Vaalidata-analyysejä internetissä - Internet sources on election data analysis


Havaintoja jotka tukevat Tulosta - Observations which support the Result (Sect. Tulos)

  • Äänestysdatan tilastollisissa analyyseissa (ks. alla) huomiota ovat kiinnittäneet erityisesti seuraavat havainnot
    1. Suuri poikkeama Gaussisen jakauman muodosta joka erityisesti suurten äänestysprosenttien kohdalla ei lähesty nollaa vaan kasvaa 100% aktiivisuutta lähestyttäessä (ks. kuva kappaleessa Äänestysprosenttijakauma Suomessa ja Venäjällä)
    2. Luonnolliselta vaikuttava lokaali maksimi n. 20-40% kohdalla Yhtenäisen Venäjän monissa aluekohtaisissa äänestystuloksissa (ks. kuvat kappaleessa Kannatusjakautumia Venäjän vaaleista)
    3. Kannatusprosenttien piikittyminen ei-satunnaisessa prosenttilukujoukossa kannatusjakatuman hännässä (ks. kappale Tasakannatusfiltteröity data).
  • Karkea arvio vaaleissa yleensä toteutuvasta (lähes) Gaussisesta jakatumasta poikkeavasta todennäköisyysmassasta johtaa n. 10-15% varovaiseen arvioon, jota on käytetty osiossa Tulos. Gaussisten jakautumien esiintymistä perustellaan yksityiskohtaisemmin täällä
  • Statistical analysis (see below) of the election data has drawn attention especially to the following observations
    1. Large deviations from the Gaussian distribution in the long tail part of the distribution which does not go to zero but grows when approaching 100% activity (see fig. in Sect. Overall voting activity in Finland and Russia)
    2. Seemingly natural local maximum at 20-40% support range for United Russia in several local election commission results (see figs. in Sect. Party support in Russian duma elections 2011)
    3. Non-zero concentration of election sites for extremely narrow bin sizes at nonrandom set of support percentages in the tail part of the distribution (see Sect. Binning data using extremely narrow bin sizes)
  • A rough estimate of the probability mass diviant from the (approximately) Gaussian distribution, which is usually to be expected in fair elections leads to the 10-15% estimate used in Sect. Result (Tulos). The emergence of Gaussian distributioons is justified in more detail here.


Vertailua Suomen eduskuntavaaleihin 2011 - Comparison with Finnish parlamentary election 2011


1. Regressioanalyysiä - Regression analysis

  • Tämä osio sisältää vaalidatasta tehtyjä regressioanalyysituloksia. Sinun ei tarvitse ajaa mallia uudestaan (se kestää muutamia minuutteja), koska tulokset löytyvät valmiiksi laskettuna tästä: [1]
  • This section contains regression analysis of the election data. You don't need to run the model (it will take a few minutes) because you can familiarize yourself with the pre-run results at [2]


2. Äänestysprosenttijakauma Suomessa ja Venäjällä - Overall voting activity in Finland and Russia

  • Alla oleva kuva on tuotettu koodilla, jonka voit kopioida omaan R-kääntäjääsi klikkaamalla tekstilinkkiä 'Näytä koodi' alla. Ajopainike ei ole käytössä.
  • The picture below has been produced using the code which can be copied to your own R environment by copy pasting it by clicking the text 'Näytä koodi' below. Run code button is redundant.

+ Näytä koodi

Kannatusjakautumia Venäjän vaaleista - Party support in Russian duma elections 2011

  • Tämä analyysi muuttuu vähitellen hienosyisemmäksi kuten etenet sivua alaspäin. Tässä yksinkertaisesti suodatetaan haluttu data ja kuvataan se. Tarkoitus on ladata data Opasnet-kantaan, jolloin voit ajaa analyysit yksinkertaisesti nappia painamalla. Vielä tämä ei toimi, vaan joudut kopioimaan koodin omalle koneellesi ja ajamaan sen R:llä siellä.
  • The analysis programs get progressively more sophisticated as you scroll down the page. This is the simplest analysis model which basically allows you to filter the data and make some nice plots. You can compare the statistics of different parties in different regions of Russia. We will upload the data file into the Opasnet data base so that you can simply run the program by pressing the button below (does not work quite yet! In the meanwhile you can install R on your own computer and download the input data file from the bottom of the page manually.)


+ Näytä koodi


1. Neljän suurimman puolueen kannatusvertailu - Comparison of the support of four largest parties

  • Neljän suurimman puolueen kannatusprosentit (x-akseli) eri äänestysalueilla ja äänestysalueiden määrä (y-akseli).
  • Here is a picture of the 4 biggest parties in Russia. The x-axis shows the percentage of votes cast at the polling station and the y-axis shows the number of polling stations corresponding to the percentage.




2. Kahden suurimman puolueen aluekohtainen kannatusvertailu - Comparison of the local support of two largest parties

  • Kuvasarja, joissa tarkastellaan kannatusprosentteja kahden suurimman puolueen (Yhtenäinen Venäjä oikealla ja Kommunistinen puolue vasemmalla) osalta Venäjän eri alueilla. Tulokset (ylhäältä alas) pätevät seuraaville tasavalloille ja alueille: Adygea, Bashkortostan, Dagestan, Kabardino-Balkar, Karachai-Cherkess, Komi, Mordovia ja Pohjois-Ossetia. Nämä edustavat ensimmäistä viittätoista paritonta aluekoodinumeroa listassa.
  • A series of pictures comparing the voting activity of the Unified Russia (pictures on the right) party with the second largest Communist Party (pictures on the left). The data has been calculated in the regions of (top down) The Republic of Adygea, Republic of Bashkortostan, The Republic of Dagestan, Kabardino-Balkar Republic, Karachai-Cherkess Republic, The Republic of Komi, The Republic of Mordovia and The Republic of North Ossetia. These represent the first odd-valued region codes less than or equal to 15.





3. Tasakannatusfiltteröity data - Binning data using extremely narrow bin sizes

  • Tässä esitetään histogrammit kunkin puolueen kannatuksesta [%], jos jokin puolue sai promillen tarkkuudella jonkin seuraavista "tasakannatuksista" (0.5,0.6,0.666,0.7,0.75,0.8,0.95,1.00)*100%). Filtteröinti antaa varsin mielenkiintoisen 'kamman' Yhtenäiselle Venäjälle.
  • The histograms showing the supporp ercentage of each party is shown for an extremely narrow bin size at nonrandom set of support percentages belonging to the set (0.5,0.6,0.666,0.7,0.75,0.8,0.95,1.00)*100%). The binning results in an interesting structure for the support of the United Russia party.



Hierarkkinen Bayes-malli - Hierarchial Bayesian model

Malli[1] [2] [3] [4] [5] [6] perustuu seuraaviin oletuksiin:

  • Jokaisella äänestysalueella jokin määrä ihmisiä tulee äänestämään (nHonest[i]). Tämä määrä riippuu erilaisista satunnaisista tekijöistä, jolloin suuressa joukossa voidaan sanoa, että kyseessä on binomijakauma, joka riippuu kahdesta asiasta: äänioikeutettujen määrästä (nVoters[i]) ja yksittäisen äänestäjän todennäköisyydestä tulla äänestämään (Activity[i]).
  • Se, mikä on yksittäisen äänestäjän todennäköisyys tulla äänestämään jollakin äänestysalueella on myös riippuvainen suuresta joukosta satunnaisia tekijöitä, jotka vaihtelevat äänestysalueiden välillä. Niinpä voidaan sanoa, että tämä todennäköisyys on satunnaisesti jakautunut beetajakauman mukaisesti parametreilla ActA ja ActB. Mallissa oletetaan, että eri äänestysalueiden välillä ei ole sellaista systemaattista eroa, joka estäisi beetajakauman käytön. Huomaa, että valheelliset äänet selkeästi ovat tällainen systemaattinen ero, mutta se huomioidaan toisaalla mallissa ja tässä tarkastellaan ainoastaan rehellisiä ääniä.
  • Jokaisella puolueella on jokin kansallinen kannatusprosentti (support[j]). Tämä kuitenkin vaihtelee äänestysalueesta toiseen mutta sillä tavalla satunnaisesti, että tätä satunnaisuutta voidaan kuvata äänestysaluekohtaisen dirichlet-jakauman avulla. Se montako ääntä kukin puolue kullakin äänestysalueella saa (nHonest2[i,j]), riippuu tästä puolue- ja äänestysaluekohtaisesta todennäköisyydestä ja toisaalta kokonaisäänimäärästä multinomijakauman mukaisesti.
  • Jos vaalit ovat rehelliset, tämä malli pystyy arvioimaan puoluekohtaiset kannatusprosentit sekä koko maahan että jokaiselle äänestysalueelle. Koska alustavien tarkastelujen perusteella äänestysprosentit eivät noudata tilastollisia lakeja, on mitä todennäköisimmin joukossa väärennettyjä vaalilippuja. Näiden määrä (nFabr[i,j]) pystytään arvioimaan siten, että vaalipiiri- ja puoluekohtaisesti katsotaan äänimääriä ja arvioidaan, poikkeaako tulos siitä mitä sen pitäisi edellä kuvattujen tilastollisten lakien perusteella olla. Oletusarvo on, että vaalivilppi on hyvin epätodennäköistä (pFabr[i,j]), joten vaalipiirin tuloksen pitää poiketa huomattavan paljon siitä, mitä tilastollisesti voisi olla odotettavissa. Jos tällainen suuri poikkeama kuitenkin nähdään, oletetaan, että epäillyn puolueen liiat äänet johtuvat väärennetyistä vaalilipuista.
The model file: file:RussianElections2011.ods.
  • Kuvassa esitettyjen mallin muuttujien selitykset saat kun klikkaat linkkiä alla olevaa linkkiä 'Näytä koodi'. Ajopainikkeella ei tässä yhteydessä ole merkitystä.
  • Explanation of the symbols in the picture above is obtained by clicking the link 'Näytä koodi' below. Run code button is redundant.

+ Näytä koodi


  • Hierarkisen mallin R-koodiin voi tutustua klikkaamalla alla olevaa linkkiä 'Näytä koodi'.
  • You can familiarize yourself with the R code of the hierarchial Bayes model by clicking the link 'Näytä koodi' below.


+ Näytä koodi


  • Hierarkisen Bayes-mallin koodi ei vielä täysin toimi klikkaamalla yllä olevaa ajopainiketta, koska syötteenä tarvitaan dataa toisesta analyysistä.) Malli käyttää hyväkseen kirjastorutiinia rbugs.
  • The R code of the Hierarchial Bayes model does not work fully yet by clicking the Run code button above because it uses example data from another analysis). The model uses the package rbugs.
#: The compilation of the model produces this error message: "vector-valued relation nHonest2 must involve consecutive elements of variable." Who can help to sort this out? --Jouni Tuomisto 19. joulukuuta 2011 kello 15.30 (EET)

Katso myös

Venäjän presidentinvaalit 2012

Viitteet


Aiheeseen liittyviä tiedostoja

Vaalien tulokset äänestysalueittain.

<mfanonymousfilelist></mfanonymousfilelist>