Poll of polls

Emil Aas Stoltenberg predikerer valgresultatet

Publisert 19. juli 2013. Sist endret 20. juli 2013.

Master i statsvitenskap, Emil Aas Stoltenberg, leverte i år sin masteroppgave om prediksjon av valgresultater. Avhandlingens tittel er "Bayesian Forecasting of Election Results in Multiparty Systems".

Stoltenberg har på anmodning fra pollofpolls.no skrevet en artikkel om sin metode for utlegging på våre nettsider. Vi retter en hjertelig takk til Stoltenberg for at han vil dele sin kunnskap med våre lesere.

Stoltenbergs prediksjon av utfallet av stortingsvalget er inntatt til slutt i artikkelen: "96 prosent av valgsimuleringene gir flertall til de fire opposisjonspartiene H, V, Krf, og Frp. 38 prosent av simuleringene gir flertall til H, Frp og V. Kun 3.25 prosent ... gir flertall til H og Frp alene."

Valg er forutsigbare. Ordene tilhører den amerikanske statistikeren Andrew Gelman. (i) Erfaring viser at Gelman har rett. I Storbritannia, Frankrike og USA har statistikere, statsvitere og økonomer lenge konstruert statistiske modeller som har vært i stand til å predikere valgutfall. At Nate Silver er blitt navnet vi forbinder med vellykket valgprediksjon har nok mer å gjøre med Silvers alder, evne til å kommunisere og bruk av sosiale medier, enn med statistisk nyvinning.

Jeg var en av de mange som ble Silver-fan i løpet av den amerikanske valgkampen i 2012, og takket være min veileder professor Bjørn Høyland ble jeg oppfordret til å gjøre noe Silver-aktig i min masteroppgave. Da jeg leste om valgprediksjon i forbindelse med masteroppgaven oppdaget jeg to ting. Først, det har vært mange vellykkede forsøk på å predikere valgutfall i de tre nevnte landene. For det andre, og viktigere for mitt formål, nesten ingen slike forsøk er gjort i flerpartisystemer. Frankrike og USA er som kjent presidentsystemer, der valget står mellom to kandidater (med unntak av Frankrike i 2002), og Storbritannia er et topartisystem, der kampen som regel står mellom de konservative og Labour. (ii) I politiske systemer der mange partier kjemper om makten og koalisjonsregjeringer er normen snarere enn unntaket finnes det svært få bidrag som utvikler modeller valgprediksjon. Modellen jeg bruker for å gjøre prediksjoner for valgutfall i det norske flerpartisystemet henter inspirasjon og metoder fra tilsvarende modeller utviklet for Storbritannia, Frankrike og USA, men helt lik kan den ikke bli.

Fire typer modell. Metodene som brukes for å forutsi valgutfall kan grovt deles inn i fire typer modeller. Den første kategorien består av de modellene som benytter økonomiske variable for å forklare og predikere oppslutningen om forskjellige partier. Ideen bak disse modellene er svært enkel og intuitivt rimelig: Regjeringer straffes dersom økonomien går dårlig og belønnes dersom den går bra. Empiriske studier i USA, Frankrike og Storbritannia har gitt støtte til denne hypotesen. En utfordring i disse studiene har vært at effekten av gode økonomiske tider på oppslutningen til de styrende blir dempet av en annen velkjent effekt, regjeringsslitasje. Siden alle regjeringer uansett farge kan regne med å oppleve denne typen slitasje, vil man forvente en pendeleffekt der makten veksler mellom den ene og den andre siden. Den andre typen modeller er de modellene som forsøker å anslå (den negative) effekten av å ha makt, og mer ambisiøst, finne en funksjon som beskriver syklusen, eller svingningene, mellom de to blokkene. I et politisk system så gammelt som det britiske har dette vært spesielt vellykket og man har vært i stand til å konstruere modeller med stor prediksjonskraft basert på slike svingningsfunksjoner. (iii) En ganske annen måte å predikere valg på er ved bruk av prediksjonsmarkeder. Prediksjonsmarkeder er internettbaserte tippemarkeder der formålet (for forskeren) er å bruke informasjonen i markedsprisene til å predikere utfallet av fremtidige hendelser. I en doktorgrad fra 2012 viser Sveinung Arnesen at amerikanske prediksjonsmarkeder er mer presise og stabile over tid enn meningsmålinger, og gir en riktigere indikasjon på utfallet ved amerikanske presidentvalg lengre i forveien enn meningsmålinger. (iv) Arnesen har også eksperimentert med prediksjonsmarkeder før stortingsvalget i 2009, her er imidlertid resultatene ikke like klare som i det amerikanske tilfellet. Den siste typen modeller er de som bruker meningsmålinger som viktigste datakilde. Ofte er ikke formålet med denne typen modeller ren prediksjon, men snarere å følge oppslutningen om forskjellige partier/presidenten/kandidater over tid. Alle vil være enige om at ethvert parti til enhver tid har en eller annen oppslutning, hva denne oppslutningen er, er imidlertid en størrelse det er svært omfattende å observere. Enda mer vrient er det å si noe om effekten av en hendelse – for eksempel statsrådsbyttet i Helsedepartementet høsten 2012 - på oppslutningen om et parti. Størrelsen på utvalgene som vanligvis brukes i meningsmålinger er liten, ca 1000, og dermed er det nesten umulig å skille virkningen av slike fra ren tilfeldighet. For å ha en 95 prosent sjanse for å oppdage en ett prosentpoengs forandring i oppslutningen om et parti trengs et utvalg på ca 60 000 respondenter. Like under 20 000 kreves for tilsvarende sjanse for en to prosentpoengs forandring. (v) For å besvare spørsmål knyttet til effekten av hendelser er det utviklet metoder som ved hjelp av alle publiserte meningsmålinger følger oppslutningen om partier over tid. Eksempelvis benyttes slike metoder i en artikkel fra 2006 der tre statsvitere forsøker å identifisere den faktiske effekten av orkanen Katrina på støtten til daværende president Bush. (vi)

Modellen for norske valg som jeg bruker i min masteroppgave henter inspirasjon og metoder fra tre av de fire overnevnte modelltypene (jeg bruker ikke prediksjonsmarkeder). Kort fortalt kombinerer modellen min informasjon fra meningsmålinger med den estimerte effekten av økonomiske variable på oppslutningen om forskjellige partier. Meningsmålingene brukes for å si noe om hvor oppslutningen om partiene er i dag, mens effekten av de økonomiske forholdene er tenkt å virke litt på etterskudd og kan derfor brukes til å si noe om hvordan oppslutningen vil utvikle seg frem i tid. Sagt på en annen måte så består prediksjonen min av to gjett: Ett som utelukkende baserer seg på meningsmålinger, og ett som utelukkende baserer seg på effekten av økonomiske forhold. Alt analyseres ved hjelp av bayesiansk statistikk.

Bayesiansk statistikk er en svært appellerende måte å behandle data på når man driver med meningsmålinger, og ikke minst når man forsøker å predikere valgutfall. Bayesiansk statistikk er fundert på Bayes teorem, et algebraisk uttrykk som beskriver hvordan man skal oppdatere det man tror om verden i lys av data. ”Det man tror om verden” kan være hva som helst: Blir det sol i morgen? Har kjæresten min vært utro? Får SV elleve seter eller mer i neste stortingsperiode? Data er alt vi observerer: En mørk sky. En fremmed underbukse på soverommet. En god augustmåling fra Synovate for SV. Gitt data er vi altså interessert i hvordan vi skal forandre hva og hvor mye det vi tror om verden. På fagspråket kalles ”det vi tror om verden” før vi observerer data en prior, når denne oppdateres med data får man det som kalles en posterior. Hvis vi tenker etter er vi alle fulle av priors om norsk politikk (i alle fall vi som følger pollofpolls.no). For eksempel kan påstanden ”Høyres oppslutning øker ved at partiet legger seg mot sentrum” formuleres som en fullgod prior så lenge vi er i stand til å si noe om hvor mye og hvor usikre vi er på påstanden.

Årsaken til at jeg fant bayesiansk statistikk tiltrekkende i arbeidet med min masteroppgave (utover det at Silver bruker bayesiansk statistikk) er at den bayesianske tilnærmingen til statistikk tillater meg å ta med ”det jeg tror om norsk politikk” i regnestykkene. Slik blir den informasjonen jeg henter ut av en meningsmåling alltid en blanding av det jeg ”visste” fra før og den enkelte målingen. I tillegg hjelper Bayes meg i å estimere effekten av de økonomiske forhold på oppslutningen om hvert enkelt parti. Jeg er ganske sikker på at Ap’s slagord om ”Trygg økonomisk styring” tiltrekker velgerne dersom arbeidsledigheten truer (slik som i 2009), eller at høyere inntekt gjør at Høyres helsepolitikk har mer appell. Derfor, når jeg estimerer effekten av arbeidsledighet og kjøpekraft på oppslutningen om Ap og Høyre er de endelige estimatene en blanding av det jeg trodde fra før om disse effektene og data. Denne blandingen av min egen kunnskap og data skjer gjennom Bayes teorem.

Meningsmålinger og økonomi. Modellen jeg bruker for å lage prediksjoner for valgutfallet i september består av to deler. Den første delen følger partienes oppslutning over tid og er utelukkende basert på meningsmålinger. Dette skjer ved at jeg bruker Bayes teorem og det jeg ”vet om norsk politikk” hver gang en ny meningsmåling blir publisert. På denne måten tegner jeg en graf som jeg mener er partienes faktiske oppslutning på ethvert tidspunkt. Fordi det jeg tror om verden som regel ligger ganske nær det meningsmålingen viser, avviker ikke grafen jeg tegner så mye fra et vanlig gjennomsnitt, bortsett fra at min graf er noe glattere enn det man får ved å ta et gjennomsnitt av meningsmålingene. Dette er fordi jeg også spesifiserer hvor mye jeg tror oppslutningen om partiene kan variere fra dag til dag, og fordi jeg ikke tror oppslutningen hopper vilt opp og ned, slik meningsmålingen kan gi inntrykk av, får jeg en glattere kurve. Den meningsmålingsbaserte delen av modellen gir meg altså et anslag for hvordan oppslutningen om hvert enkelt parti har utviklet seg over tid, samt det jeg mener er det beste estimatet på hva oppslutningen er i dag.

Bill Clinton’s 1992 slogan ”It’s the economy, stupid” er blitt en floskel, men bærer likevel viktig innsikt: At økonomiske forhold beveger velgere er et etablert funn i flere land. I Storbritannia, Frankrike og USA er dette særlig sant. I Norge er det også forskning som viser at velgerne er følsomme for de økonomiske forholdene. I samme doktorgrad finner Arnesen at oppslutningen om norsk venstreside øker med arbeidsledigheten og synker med kjøpekraften. (vii) Som nevnt ovenfor er de økonomiske forholdene tenkt å virke litt på etterskudd, dette fordi valgkampen brukes som en opplysningskampanje på hvordan velgerne faktisk har hatt det, og ære og skyld fordeles. I USA har det vært vellykket å predikere valgutfall basert på økonomiske forhold alene. (viii) I min masteroppgave bruker jeg de ti stortingsvalgene fra 1973 til 2009 til å estimere effekten av økonomiske forhold på partienes oppslutning ved valg. De estimerte effektene en kombinasjon av hvordan jeg tror velgerne reagerer på skiftende økonomiske forhold og av data. Viktig i denne sammenheng er at fordi jeg har lite data (kun ti observasjoner) tillegges det jeg trodde fra før ganske mye vekt i forhold til data. Særlig utfordrende er det å finne ut hvordan effekten av regjeringsslitasje og effekten av økonomi kan virke utjevnende. Eksempelvis, vil økt arbeidsledighet øke oppslutningen om Ap når Ap er i regjering, eller skifter effekten av arbeidsledighet fortegn når Ap er i regjering? Med såpass lite data som jeg har til rådighet er slike spørsmål vanskelige å besvare.

Det endelige prediksjonen jeg presenterer er en kombinasjon av meningsmålinger og de estimerte virkningene av økonomien, der begge deler tillegges like mye vekt. Denne prediksjonen er sannsynlighetsfordelinger sentrert rundt den nasjonale andelen av stemmene jeg tror hvert parti vil oppnå ved valget. For å regne dette over til faktiske seter på Stortinget bruker jeg de nasjonale estimatene for å få estimater for den fylkesvise oppslutningen om hvert parti. Her benytter jeg hvert partis fylkesvise avvik fra dets nasjonale oppslutning ved valget i 2009. Til slutt anvender jeg Sainte-Laguës metode for å fordele mandatene mellom partiene. Denne prosedyren gjentas mange tusen ganger, dermed er usikkerheten jeg rapporterer er resultat av mange tusen litt forskjellige liksomvalg.

I dag, den 16. juli, er prediksjonen for stortingsvalget som følger: 96 prosent av valgsimuleringene gir flertall til de fire opposisjonspartiene H, V, Krf, og Frp. 38 prosent av simuleringene gir flertall til H, Frp og V. Kun 3.25 prosent av liksomvalgene gir flertall til H og Frp alene. Den predikerte setefordelingen med 2.5 og 97.5 prosent-persentiler i parentes er

Ap 53 (46,61), Sv 9 (1,12), Sp 9 (5,13), Krf 9 (7,13), V 6 (1,10), H 47 (40,53), Frp 30 (25,35) og andre 5 (0,10).

Emil Aas Stoltenberg

Fotnoter

(i) Gelman har en spennende hjemmeside http://andrewgelman.com/

(ii) Og ja, at det skulle bli ”hung parliament” etter det britiske valget i 2010 hadde forskere forutsett lenge i forveien. Se Lebo, M. L., og Norpoth, H. (2007). The PM and the Pendulum: Dynamic Forecasting of British Elections. British Journal of Political Science, 37:71-87

(iii) I tillegg til et par andre variabler. Lebo, M. L., og Norpoth, H. (2007).

(iv) Dette har sammenheng med at man i meningsmålinger spør ”Hvis det hadde vært valg i morgen…”, mens det i prediksjonsmarkeder er utfallet på valgdagen som teller. Sammenligningen er imidlertid relevant fordi meningsmålinger ofte blir brukt for å predikere det faktiske valgutfallet.

(v) Her antar jeg at partiet i utgangspunktet er ganske stort.

(vi) Beck, N., Jackman, S., og Rosentahl, H. (2006). Presidential Approval: the case of George W. Bush. http://jackman.stanford.edu/papers/

(vii) Arnesen, S. (2012). Leaping Into the Unknown. Comparing, testing and applying methods of prediction elections. PhD thesis, University of Bergen.

(viii) Bartels, L. M. og Zaller, J. (2001). Presidential Vote Models: A Recount. Political Science & Politics. p. 9-20

Del på Facebook